gydtep
发表于 2022-1-27 08:15:16
SIMD向量化计算加速
AP型场景,SQL中经常会包含很多涉及到一个或者多个值/运算符/函数组成的计算过程,这都是属于表达式计算的范畴。表达式的求值是一个计算密集型的任务,因此表达式的计算效率是影响整体性能的一个关键的因素。
gydtep
发表于 2022-1-27 18:38:44
更新操作采用标记删除的方式来支持,对于更新操作,首先根据RowID计算出其原始位置并设置删除标记,然后在ActiveRowGroup中写入新的数据版本。
gydtep
发表于 2022-1-28 11:32:00
行列混合存储下的TP和AP资源隔离
PolarDB行列混合存储可以支持在一个实例中同时支持AP型查询和TP型查询。但很多业务有很高的OLTP型负载,而突发性的OLAP性负载可能干扰到TP型业务的响应时延。因此支持负载隔离在HTAP数据库中是一个必须支持的功能。借助PolarDB一写多读的架构,我们可以非常方便对AP型负载和TP型负载进行隔离。
gydtep
发表于 2022-1-29 10:04:22
这些Bad case就是我们设计的多模态检索模型的初衷,并且也在优化过程逐渐得以解决,如图(d)、(e)、(f)所示。我们提出的多模态检索模型通过对全局特征优化以及引入局部特征对齐,使得模型更多关注到牌匾上更有区分性的局部特征,如文字信息,
gydtep
发表于 2022-1-30 14:21:27
玄铁RISC-V系列处理器,经过多年的市场检验和日趋完善的软件及工具开发,具备软硬件一体的全栈能力。开源后,开发者可基于此实现开源EDA协同,创新硬件架构,丰富软件应用生态。
此外,平头哥将持续提供技术和服务支持,辅助生态实现RISC-V处理器的产品化落地。
gydtep
发表于 2022-1-31 08:09:34
在定义一中我们可以看到,流计算输入的数据是无边界的,所以系统中会存在消息抵达流计算系统延迟、顺序错乱、数量/规模未知等不确定因素,这也是流计算系统一致性复杂性远远大于批处理系统的原因:批处理系统中的输入是确定的,计算过程中可以通过计算的原子性来保证数据的一致性(如 Spark 中的 RDD 血缘)。
gydtep
发表于 2022-2-2 09:39:32
每年双11都有两个看点,一个是看消费者和商家的口碑,他们对双11是否满意;第二个是看阿里巴巴的技术。阿里巴巴每年的双11,都是商业和技术的共同进化。
gydtep
发表于 2022-2-3 10:51:05
而在这个过程中,云的技术如何保证先进性,双11是一个非常重要的技术攻坚场,我们把双11场景下锤炼出来的技术放到云上,服务更多的客户,同时阿里整个技术慢慢站在云的肩膀上,靠云支撑技术的发展。
gydtep
发表于 2022-2-7 09:48:46
二、执行链路构建:重点在于如何自动构建出克执行的系统调用链路。大致思路为:1)基于落盘数据获取线上执行全链路的所有鹰眼;2)根据鹰眼(trace)及系统调用关系构建执行链路;3)执行链路编排构建链路执行能力;
gydtep
发表于 2022-2-7 14:04:42
本文举例商品及仓的场景,对于商品根据商品id关联找到对应商品明细,再将商品明细中有意义的字段,比如:是否是危险品、是否是紧急配送商品、商品的标签、商品的状态等等查询出来关联主数据,对于仓关联查出仓的类型和仓的标签,如此可基于场景的主模型数据进行分支场景的多层级关联,将需要关注到的场景维度值尽可能多的纳入到数据模型中。