gydtep
发表于 2022-4-7 18:17:21
流 -> 流:没有聚合操作的数据处理过程;
流 -> 表:存在聚合操作的数据处理过程;
表 -> 流:触发输出表数据变化的情况;
表 -> 表:不存在这样的数据处理逻辑。
gydtep
发表于 2022-4-9 17:44:59
譬如,需要有稳定且高吞吐的存储后端用于结果存储,Google 内部的 BigTable 发挥了其作用。流任务执行前后,引擎会对执行流做若干优化,如合并多个逻辑算子至单个算子(类似 Flink 中的 chain 化)、节点内先执行部分合并(count / sum)后再 shuffle等等,种种手段均是为了降低算子间 IO 的数据规模。
gydtep
发表于 2022-4-11 13:23:30
近年来,越来越多的研究人员开始关注知识图(KG)和预训练语言模型(PLM)的结合,以使PLM达到更好的性能。K-BERT将三元组注入到句子中,以生成统一的知识丰富的语言表示。ERNIE将知识模块中的实体表示集成到语义模块中,将令牌和
gydtep
发表于 2022-4-12 09:56:46
多模态知识图谱补全技术可以通过远程监督补全多模态知识图谱,完善现有的多模态知识图谱,多模态对话系统可用于电商推荐,商品问答领域。
2 多模态预训练
gydtep
发表于 2022-4-14 14:39:43
面向知识运营人员的低成本运营:过去主要依赖FAQ或者文档为主,现在融入了更多的知识结构,像知识图谱、TableQA,甚至图片知识;在这个过程中知识运营人员迎来非常大的挑战,
gydtep
发表于 2022-4-15 12:27:25
在容器技术出现之前,DevOps理论已经发展多年。但是如果”开发“与”运维“团队不能用相同的语言进行交流,一致的技术进行协作,那就永远无法打破组织和文化的藩篱。
gydtep
发表于 2022-4-18 15:48:13
自身,而非系统执行细节。声明式API是云原生重要的设计理念,这样的架构方式有助于将整体运维复杂性下沉,交给基础设施实现和持续优化。
gydtep
发表于 2022-4-20 12:31:45
下面举几个我们的查询/分析的应用示例,前面3个相对比较简单,可以用纯粹的关键词查询、PromQL,也可以结合SQL一起使用。最后一个展示了实际场景中进行融合分析的例子:
gydtep
发表于 2022-4-21 16:54:16
解决问题是制定问题的实施路径和解决方案,协同团队和上下游,推进问题的解决。架构要解决的问题一定不是一个局部问题,一定是一个全局问题。
gydtep
发表于 2022-4-22 10:45:49
。Docker容器技术的出现,实现了软件交付流程的标准化,一次构建,随处部署。结合云计算可编程基础设施和Kubernetes声明式的API。可以通过流水线去实现自动化的持续集成与持续交付应用和基础设施,大大加速了开发和运维角色的融合。