gydtep
发表于 2022-10-18 19:12:12
结合流计算上面流计算一致性的定义,我们希望在引擎发生故障 FailOver 时,存在一种恢复函数 R 使得
R(E(t), O(t)) = O'(t+1),且 O'(t+1) = O(t+1)
gydtep
发表于 2022-10-19 09:32:51
开发阶段:重点需要关注代码的质量,例如静态代码扫描以及依赖检查会发现潜在的代码缺陷和安全风险,由此我们可以统计千行代码缺陷率或者严重缺陷比例,从而来衡量一个系统的代码质量是否符合要求
gydtep
发表于 2022-10-19 13:47:02
这些数据产生的位置、数据格式、以及存储的位置,都有可能是不一样的。如何从这些数据中快速精准地挖掘出潜在的质量问题比较困难。
gydtep
发表于 2022-10-19 19:08:49
如下图所示,我们以标准 SQL 为基础,进行了部分 DSL 扩展和 SQL 函数扩展,并融合了 PromQL,从而让不同类型的数据查询和分析变得统一。
gydtep
发表于 2022-10-20 09:29:17
但是由于它们的存储和分析是一致的,因此我们可以构建出统一的报表来查看各个阶段的软件质量,以及统一进行监控的配置和告警的管理,
gydtep
发表于 2022-10-20 15:42:14
指标本身呈现出周期性的波动,假如一个新版本上线了之后,由于bug导致网络流量异常抖动。如果基于固定阈值来判断,此时处于指标值的上下界范围内,就很难发现问题;但是基于智能巡检,就可以很容易地判定这是一个异常点。
gydtep
发表于 2022-10-20 20:00:09
告警静默:满足特定条件的告警无需通知。例如:测试集群在凌晨有计划内变更,期间服务会有短暂不可用,触发预期内告警,该告警可以忽略。
gydtep
发表于 2022-10-21 13:09:48
每个渠道使用不同的通知内容进行发送。例如通过语音和钉钉来进行告警通知,既可以保证触达强度,又可以保证通知内容的丰富程度。
gydtep
发表于 2022-10-21 19:07:35
今年是阿里巴巴双11的第13年,站在新轮回的时间点上,程立回顾了过去12年整个行业、数字技术的演进历程,并对未来12年的技术前进方向做出了判断和预测
gydtep
发表于 2022-10-22 09:59:06
第二个数字,2009年的订单创建峰值是400笔/秒,去年将近60万笔/秒,这是1500倍的增长;
那么是什么样的技术去支撑了这样一个增长呢?就是第三个数字,我们服务器的规模,对比2009年,我们用了40倍的服务器增长,支撑了交易额的万倍增长。