gydtep 发表于 2022-9-30 17:48:11
在分析场景经常需要访问某个列的大量记录,而列存按列拆分存储的方式会避免读取不需要的列。其次列存由于把相同属性的列连续保存,其压缩效率也远超行存,通常可以达到10倍以上。gydtep 发表于 2022-10-6 12:56:09
相似但不同的牌匾难以区分,如图8(c)。因此,我们进一步设计了局部特征分支,让模型更加关注牌匾的几何、纹理等局部信息,与全局特征共同做牌匾检索。gydtep 发表于 2022-10-8 17:17:57
张建锋表示,“经过3年努力,我们今天又发布玄铁RISC-V系列开源版。未来,我们将开源更多RISC-V处理器,也希望有更多的合作伙伴,gydtep 发表于 2022-10-10 15:01:31
十余年指令集技术积累:平头哥技术团队拥有十多年CPU和芯片研发经验,长期从事自研指令架构、CPU微体系结构与系统芯片产品的研发,多款CPU IP核得到大规模量产的验证。gydtep 发表于 2022-10-12 08:25:38
芯片是“集成电路”的俗称。要在芯片上执行软件程序,必须先将软件/程序语言翻译成硬件指令,这套标准规范即芯片架构/指令集(ISA,Instruction Set Architecture),X86、Arm、RISC-V都是指令集的代号。gydtep 发表于 2022-10-12 20:07:29
在认识流计算系统一致性之前,我们需要精确定义流计算。流(Streaming)计算是一种在无边界数据(unbounded data)上进行低延迟计算的数据处理过程。gydtep 发表于 2022-10-13 11:04:42
除了数据输入带来的挑战,流计算输出的数据会被实时消费,类似这样不同于批处理的应用场景,也给数据的一致性带来的诸多挑战,如出现 FO 后,是撤回之前发出的数据,还是是同下游进行协商实现一致性,都是需要考虑的。gydtep 发表于 2022-10-15 09:55:22
MillWheel 会对每一条记录赋予一个唯一 ID,同时基于此 ID 维护一份是否处理过当前记录的目录。对于每一条流入当前算子的记录,引擎查找此 ID 目录以确定此记录是否是已经处理过。gydtep 发表于 2022-10-17 14:22:15
上面提到,流计算的输入数据是没有边界的,这符合我们传统上对流计算认知。在《System Streaming》一书中,作者提出了一个将流批统一考虑的流计算理论抽象,gydtep 发表于 2022-10-18 19:12:01
令 O(t) = Sink(t) + State(t),即将计算对引擎状态的更新视为一种特殊的输出,则流计算过程可简化为:F(E(t), O(t)) = O(t+1)