gydtep
发表于 2021-5-13 15:33:00
例如,在连接的汽车中,汽车上的传感器会提供实时数据流,该数据流会不断进行处理并做出决策,例如施加制动器或调整方向盘。可以将相同的传感器数据流式传输到云中以进行长期的模式分析,从而可以警告所有者急需的维修,从而可以防止将来发生事故。另一方面,云AI对边缘AI进行了补充,以推动更深入的见解,调整模型并继续增强他们的见解。
gydtep
发表于 2021-5-14 08:09:45
DataWorks数据集成可以追溯到2011年的DataX1.0和2.0版本,随后3.0版本正式对外提供服务,再后来公有云、专有云、阿里内部功能三版合一,建立了Data Integration 服务。在2019年,DataWorks数据集成完成了商业化,独享资源组上线,按量付费、包年包月的付费方式也成功面向了用户。在2020年,全增量实时同步解决方案正式发布。
gydtep
发表于 2021-5-14 11:33:34
数据集成将数据同步过来以后,我们需要实时的数据仓库将这些数据更好地应用起来。刚才简单介绍了实时数仓的解决方案,接下来我们向大家详细介绍基于Hologres和Flink的实时数据分析方案。
gydtep
发表于 2021-5-14 17:11:20
目前Hologres已经在多个客户及场景使用,进行大数据分析与决策。
1) 小红书之前自建了一个较大规模的ClickHouse集群,但是运转一段时间后,ClickHouse的弊端凸显,比如成本高、查询慢、不稳定、集群运维复杂。采用了Hologres后,获得存储计算分离的架构,轻松存储了15天数据,并且可以快速查询7天甚至15天数据,查询性能有大幅度提升;还有主键去重(insert or ignore),上游failover无影响,免运维等优势,客户满意度非常高。
gydtep
发表于 2021-5-15 13:16:34
而作为新数据代表的物联网,去年大约具有4.4ZB数据,而在2025年将会达到90ZB,也就是说仅物联网将会占据未来一半的数据量。此外,数据将会存储在什么地方呢?
gydtep
发表于 2021-5-15 14:25:05
根据IDC的报告,去年全球大约有20%的数据存储在公共云上,而到2025年大约会有46%的数据存储在公共云,与此同时,还会有大量数据存储在私有云上。基本上就是说到2025年,大约80%至90%的数据将会存储在云上。
gydtep
发表于 2021-5-15 15:02:48
另一个方面,新数据会从哪些地方产生呢?以前数据基本上都是由PC、手机、平板电脑产生的,而在未来,汽车、视频、智能设备以及工业互联网都是新数据产生的典型场景,而且这些场景下数据产生的速度将会迅速提升。
gydtep
发表于 2021-5-16 07:26:44
然而,正如星战宇宙中,原力既有光明也有黑暗的一面。微服务应用在部署、运维和管理的复杂性却大大增加。DevOps文化和背后支撑的自动化工具与平台能力成为关键。
gydtep
发表于 2021-5-16 08:41:37
在容器技术出现之前,DevOps理论已经发展多年。但是如果”开发“与”运维“团队不能用相同的语言进行交流,一致的技术进行协作,那就永远无法打破组织和文化的藩篱。
gydtep
发表于 2021-5-16 09:09:34
Docker容器技术的出现,实现了软件交付流程的标准化,一次构建,随处部署。结合云计算可编程基础设施和Kubernetes声明式的API。可以通过流水线去实现自动化的持续集成与持续交付应用和基础设施,大大加速了开发和运维角色的融合。