腾讯云2860元代金券领取及使用说明 - 第11页 - IDC信息交流 - 落伍者

gydtep 发表于 2021-12-28 08:44:00

开发阶段：重点需要关注代码的质量，例如静态代码扫描以及依赖检查会发现潜在的代码缺陷和安全风险，由此我们可以统计千行代码缺陷率或者严重缺陷比例，从而来衡量一个系统的代码质量是否符合要求

gydtep 发表于 2021-12-28 09:39:03

基于上述的讨论，我们可以大体总结出质量观测的几个痛点：

海量的异构数据：在系统开发、测试、验证、上线等各个阶段产生了大量的日志、时序、Trace 等数据，这些数据产生的位置、数据格式、以及存储的位置，都有可能是不一样的。如何从这些数据中快速精准地挖掘出潜在的质量问题比较困难。

gydtep 发表于 2021-12-28 12:08:19

学习成本高：每个软件都有自己的使用插件、插件系统，有些还会有自己的DSL语法，学习成本非常高，很难完全掌握使用。

gydtep 发表于 2021-12-28 13:56:09

监控规则泛化能力弱：不同的业务、甚至同一业务的不同版本，指标的规律性、阈值都有可能是不同的。因此我们需要为不同的业务、不同的版本去做监控规则的适配。

gydtep 发表于 2021-12-28 15:00:43

基于上述痛点，我们提出了智能巡检的方案。它具备以下几个优势：

智能前置：现在有很多系统是在告警触发后，进行智能的管理，但是这无法避免告警误报、漏报等问题。智能巡检可以将 AI 的能力前置到监控层，从而在源头上避免潜在的告警问题，挖掘出真正有效的数据价值。
监控自适应：可以基于历史数据自动学习和进化，进行动态的阈值判断，从而让告警更加精准。另外对数据的学习也是实时的，可以更加快速地发现异常问题。
动态反馈：除了自动学习之外，还可以通过用户的反馈，对告警进行确认或者误报标记，将 AI 能力与人的经验相结合，相辅相成，进一步完善模型，减少误报。
在一些数据波动比较大，指标没有固定阈值的场景下（例如用户访问量、外卖订单量等），智能巡检的优势可以得到很好的体现。例如下图，指标本身呈现出周期性的波动，假如一个新版本上线了之后，由于bug导致网络流量异常抖动。如果基于固定阈值来判断，此时处于指标值的上下界范围内，就很难发现问题；但是基于智能巡检，就可以很容易地判定这是一个异常点。

gydtep 发表于 2021-12-28 16:04:33

自动去重：每个告警会根据告警自身的关键特征计算出一个告警指纹，然后根据告警指纹自动去重。例如：某主机每一分钟触发CPU使用率过高告警，1小时触发60次，但对于告警管理系统来说

gydtep 发表于 2021-12-28 16:36:17

动态通知：可以根据告警属性动态分派通知。例如：测试环境的告警，通过短信通知到张三，并且只在工作时间通知；而生产环境的告警，通过电话通知到张三和李四，并且无论何时，都要进行通知。

gydtep 发表于 2021-12-28 17:22:03

关于对未来的展望：

目前质量观测，数据的统一采集和管理，分析、可视化、监控等能力已经都相对完善

gydtep 发表于 2021-12-28 18:48:11

如何在较短的时间内用云数据库的技术和理念来武装自己，提升自己。本课程通过实际的场景以及最佳实践出发，带给大家一些数据库问题的通用解决思路和方法，大家会发现数据库不再是一个黑盒，相反它看得见，摸得着，也能够轻松玩得转。

gydtep 发表于 2021-12-28 19:26:46

过去12年科技作为“放大器”支持商业增长
今年是阿里巴巴第13个双11，是新一轮双11的一个起点，回顾过去12年的双11，有三个数字：

页: 1 2 3 4 5 6 7 8 9 10 [11] 12 13 14 15 16 17 18 19 20

落伍者's Archiver