腾讯云轻量应用服务器1核2G5M首年38元 - 第42页 - IDC信息交流 - 落伍者

gydtep 发表于 2022-10-12 18:50:18

让大家对流计算引擎的认识更为深入，为可能的流计算技术选型提供一些参考。文章主要分为三个部分：第一部分，会介绍流计算系统和一致性难题的本质；

gydtep 发表于 2022-10-13 11:04:59

正确认识流计算系统一致性的内在含义和其能力范畴，对我们构建正确且健壮的流计算任务至关重要。下面我会介绍几组概念，以便于大家更好地理解流计算系统的一致性。

gydtep 发表于 2022-10-14 15:46:13

进一步分析，每一次存储或者批量事务存储 O(t) 时，引擎到底做了什么？前面我们定义了 O(t) = Sink(t) + State(t) -> O(t) = Sink(t) + OperatorState(t) + SourceState(t) ，对于引擎来说

gydtep 发表于 2022-10-15 19:44:22

Kafka Streams 需要数据输入源和输出均为 Kafka 消息队列。

Kafka Streams 中的「结果」也以事务的方式批量持久化，但和 Flink 不同的是，这些结果是被写入不同的消息队列中：

gydtep 发表于 2022-10-17 14:22:31

即，任意的数据的处理都是「流（Stream）」和「表（Table）」间的互相转换，其中流用来表征运动中的数据，表用来表征静止的数据：

gydtep 发表于 2022-10-18 08:21:05

上述逻辑的推导过程是没问题的，但并不严谨，因为 Exactly-Once 作为一个形容词，后面所连接的动词或者宾语被故意抹去了，不同的表达含义也会大相径庭。

gydtep 发表于 2022-10-18 15:09:22

流计算中的确定性指的是，给定相同的一组数据，重复运行多次或者打乱数据进入引擎的顺序，计算完成后将会输出相同的结果，否则就是非确定性计算。

gydtep 发表于 2022-10-19 12:15:19

在整个质量观测的生命周期中，除了各种各样的数据，我们也会涉及到各种各样的系统，例如 GitLab、sonarqube、Allure、JMeter、Jenkins、Travis CI、Argo CD 等等。

gydtep 发表于 2022-10-19 16:36:07

数据统一接入和管理
基于上述几个痛点，我们的解决方案是将这些异构的数据进行统一的存储和管理，如下图所示：

gydtep 发表于 2022-10-20 13:27:54

下面是另一个指标，可能随着系统的进化，新版本发布之后，该指标的值会发生一个陡增。此时如果是固定阈值告警的话，会将陡增之后的所有数据都认为是异常点，导致告警频繁触发。此时需要人为介入去调整阈值。

页: 32 33 34 35 36 37 38 39 40 41 [42] 43 44 45 46 47 48 49 50 51

落伍者's Archiver