gydtep 发表于 2019-6-19 14:33:40
爬虫需要采集各类门户,自媒体的网页内容。gydtep 发表于 2019-6-19 15:36:16
有的数据会提供给业务部门根据舆情结果进行决策。江苏镇江广源IDC 发表于 2019-6-19 15:38:16
gydtep 发表于 2019-6-19 18:07:34
根据新的情感打标库对存量数据做一次舆情计算。gydtep 发表于 2019-6-19 20:37:56
kafka队列会有两个订阅者,一个是全量数据即图片中上半部分,gydtep 发表于 2019-6-20 09:25:32
对于重大舆情,需要做实时的预警。江苏镇江广源IDC 发表于 2019-6-20 09:26:00
gydtep 发表于 2019-6-20 10:26:28
进行全量批计算的处理逻辑。gydtep 发表于 2019-6-20 11:24:25
分钟级别拿到计算结果,给业务方充足的时间进行舆情反馈。江苏镇江广源IDC 发表于 2019-6-20 11:25:34