gydtep 发表于 2023-8-23 10:37:24
E,t 时刻以来的输入集合为 E(t),输出集合为 Sink(t),引擎此时状态为 State(t),State(t) 包括各个算子的状态(包括上面提到的不确定性计算)gydtep 发表于 2023-8-25 09:03:56
由于 O(t) = Sink(t) + State(t) ,引擎内部很好实现幂等状态更新,若引擎下游系统也实现了数据幂等,gydtep 发表于 2023-8-28 13:14:54
将结果输出纳入快照生成的 2PC 后,端到端一致性数据处理语义的充分必要条件在这里也得到了满足:在流计算过程中,定期(epoch)以事务(2PC)的方式进行批量存储结果gydtep 发表于 2023-8-29 17:20:09
举例:Kafka Streams 的输出后端需要是 Kafka,以配合在事务提交过程中,屏蔽部分已输出至下游(被 Kafka Broker 持久化),但还不满足事务隔离性的消息(read_committed 级别),gydtep 发表于 2023-8-31 10:35:26
上面的充分必要条件还可以进一步简化,即实时存储结果或定期事务,均可以视为当前处理逻辑单元(算子或最终存储)对上游的输入(引擎状态+输出结果)进行的幂等化处理gydtep 发表于 2023-9-2 18:52:33
但太多的选择也不见得是好事,在这种情况下,可观测性数据的管理又给我们带来了如下几个痛点:gydtep 发表于 2023-9-3 16:48:45
基于上述统一的数据存储和查询分析,我们可以非常轻松地实现统一的可视化和监控。gydtep 发表于 2023-9-5 16:04:47
而且还要推动整个社会变得更好。今年开始,我们希望双11进化到一个新的征程,成为阿里巴巴“好科技”的一个新起点。gydtep 发表于 2023-9-7 15:51:09
此外,原来整个支撑信息时代最核心的基础技术例如芯片、计算架构,在过去12年开始被挑战、开始去革新,很多新型的算力开始出现,为整个数字时代奠定基础。gydtep 发表于 2023-9-12 09:07:59
我们也在做AI方面的深度创新,超大规模模型现在是AI行业的重点,阿里达摩院实现了全球首个10万亿参数的多模态大模型M6,