gydtep
发表于 2021-12-16 17:20:35
技术驱动,建设阿里巴巴绿色数字供应链
今年双11,数字供应链采用预测+决策的算法体系,实现数据驱动的预测决策一体化优化,降低货损,统一调度减少浪费;在运配场景,提升车辆装载率及运输效率;通过建设一盘货、全链路可售能力,帮助商家库存共享,更精准地进行补货备货,助力商家多端销售,降低滞销。
gydtep
发表于 2021-12-17 11:08:27
多语言技术创新促进跨境电商商家销售
创译技术融合改写和翻译能力,缓解低质量源语言商品信息的影响,显著提升了用户语言体验,目前已支持AliExpress、ICBU在十多个国家、数千万跨境商品信息的国际化;
gydtep
发表于 2021-12-17 17:02:05
据悉,阿里自研内存数据库Tair诞生于2010年,是一种支持高并发低延迟访问的云原生内存数据库,完全兼容Redis,已历经多年双11大促考验,提供核心在线访问加速能力,显著提升系统吞吐量。
gydtep
发表于 2021-12-20 17:10:58
商业公司的第一要务永远是营收、盈利,我们都知道盈利=营收-成本,IT部门的成本通常也会占据很大一个部分,尤其是互联网类型的公司。现在阿里全面云化后,包括阿里内部的团队也会在乎自己的IT支出,尽可能的压缩成本。
gydtep
发表于 2021-12-21 16:01:03
并行查询的加入使得PolarDB突破了单核执行性能的限制,利用多核CPU的并行处理能力,在PolarDB上部分SQL查询耗时成指数级下降。
gydtep
发表于 2021-12-22 11:12:32
在目前的迭代阶段,优化器按如下的流程操作:
执行SQL的Parse过程并生成LogicalPlan,然后调用MySQL原生优化器按照执行一定优化操作,如join order调整等。同时该阶段获得的逻辑执行计划会转给IMCI的执行计划编译模块,尝试生成一个列存的执行计划(此处可能会被白名单拦截并fallback回行存)。
gydtep
发表于 2021-12-23 14:29:15
全量及增量行转列
行转列操作在两种情况下会发生,第一种情况是使用DDL语句对部分列创建列索引(一般是业务对一个已有的表有新增分析型需求),此时需要扫描全表数据以创建列索引。另一种情况是在事务操作过程中对于涉及到的列实时行专列。
gydtep
发表于 2021-12-24 13:25:45
在针对全局特征进行优化以后,现有模型仍然在以下三个方面表现不够好:1)牌匾截断的情况,特征学习质量差,如图8(a);2)遮挡的牌匾,特征中引入一些无关的上下文信息,如图8(b);3)相似但不同的牌匾难以区分,如图8(c)。因此,我们进一步设计了局部特征分支,让模型更加关注牌匾的几何、纹理等局部信息,与全局特征共同做牌匾检索。
gydtep
发表于 2021-12-26 11:46:17
。文章主要分为三个部分:第一部分,会介绍流计算系统和一致性难题的本质;第二部分,会介绍一致性难题的通用解法以及各种方案间的取舍;第三部分,会介绍主流的流计算引擎是如何对通用解法进行泛化以实现一致性。
gydtep
发表于 2021-12-27 10:16:09
如果在提交这一批数据的提交过程中又发生了异常,譬如只有部分节点的结果输出了,其他节点发生了故障结果丢失,则可以通过回到上个批次提交的状态,重算此批次数据,重算过程中,由于仅存在确定性计算,所以无论是引擎内还是引擎外,是可以通过幂等来保证数据的的一致性的。