gydtep 发表于 2021-12-26 09:28:33
中国工程院院士倪光南曾预测,在CPU领域,未来将形成英特尔(x86)、Arm、RISC-V三分天下的格局。根据 Semico Research 的预测,到2025年,全球市场的RISC-V核心数将达到624亿,其中工业应用增幅最大,将占据167亿颗。gydtep 发表于 2021-12-26 10:04:34
电脑报报道称,超过 70% 的 RISC-V 主要成员来自中国,这些成员的努力将加强 中国的 IP 库和 IC 设计能力,重塑供应链,并扩张 RISC-V 的影响力。gydtep 发表于 2021-12-26 11:03:20
流计算的应用与实践在大数据领域越来越常见,其重要性不言而喻,常见的流计算引擎有 Google DataFlow、Apache Flink,Apache Kafka Streams,Apache Spark Streaming 等。gydtep 发表于 2021-12-26 11:15:08
。流计算系统中的数据一致性一般是用消息处理语义来定义的,如某引擎声称可以提供「恰好一次(Exactly-once Processing Semantics)流处理语义,表示(或暗示)引擎具备保证数据一致性的能力。gydtep 发表于 2021-12-26 11:46:45
在认识流计算系统一致性之前,我们需要精确定义流计算。流(Streaming)计算是一种在无边界数据(unbounded data)上进行低延迟计算的数据处理过程。gydtep 发表于 2021-12-26 12:30:36
在定义一中我们可以看到,流计算输入的数据是无边界的,所以系统中会存在消息抵达流计算系统延迟、顺序错乱、数量/规模未知等不确定因素,这也是流计算系统一致性复杂性远远大于批处理系统的原因:gydtep 发表于 2021-12-26 12:58:36
此外,同其他分布式应用一样,流计算系统经常也会受到各类意外因素的影响而发生故障,比如流量激增、网络抖动、云服务资源分配出现问题等,发生故障后重新执行计算,在存在不确定输入的前提下设计健壮的容错机制难度很大。gydtep 发表于 2021-12-26 13:54:03
正确认识流计算系统一致性的内在含义和其能力范畴,对我们构建正确且健壮的流计算任务至关重要。下面我会介绍几组概念,以便于大家更好地理解流计算系统的一致性。gydtep 发表于 2021-12-26 15:16:46
例子2,后接不同的名词:Exactly-once State Consistency 和 Exactly-once Process Consistency。前者是 Flink 在官网中对其一致性的叙述,后者是 Kafka Streaming 的一致性保证,前者的语义约束弱于后者。gydtep 发表于 2021-12-26 17:04:52
上面提到,流计算的输入数据是没有边界的,这符合我们传统上对流计算认知。在《System Streaming》一书中,作者提出了一个将流批统一考虑的流计算理论抽象,即,任意的数据的处理都是「流(Stream)」 和「表(Table)」间的互相转换,其中流用来表征运动中的数据,表用来表征静止的数据: