gydtep 发表于 2019-6-20 10:25:19
全量数据会被存储在类似HDFS这样的存储介质上。gydtep 发表于 2019-6-20 11:23:39
正因为热数据这一特点,流计算可以满足业务对计算的低延时需求,江苏镇江广源IDC 发表于 2019-6-20 11:26:09
gydtep 发表于 2019-6-20 12:30:35
系统的最上游是分布式的爬虫引擎,根据抓取任务抓取订阅的网页原文内容。gydtep 发表于 2019-6-20 14:42:17
是把这一套系统应用在生产并不是一件容易的事情,主要有下面一些原因。江苏镇江广源IDC 发表于 2019-6-20 14:43:02
gydtep 发表于 2019-6-20 15:22:03
在可以满足Lambda对计算需求的假设,又能减少存储计算以及模块的个数呢。gydtep 发表于 2019-6-20 16:32:26
数据流实时写入一个分布式的数据库,借助于数据库查询能力,江苏镇江广源IDC 发表于 2019-6-20 16:32:54
gydtep 发表于 2019-6-20 17:47:49
现在回想起来仍然清晰的记得当时第一堂上机课时运行编写好的代码时的那种神秘、好奇、激动的心情,