gydtep 发表于 2021-12-6 19:03:38
1、饿了么新零售导购算法,离线算法AUC提升0.2%绝对值;在线AB-Test实验,流量5%,5天:CTR平均提高0.296%,CVR平均提高5.214%,CTR+CVR平均提高:5.51%;gydtep 发表于 2021-12-7 10:10:27
左图来自低质量相机,并且是前向拍摄;右图来自高质量相机,并且是侧向拍摄;因为相机拍摄质量以及拍摄视角不同,这就导致POI牌匾的亮度、形状、清晰度等都存在非常大的差异。而如何在差异较大的异源数据中实现POI牌匾检索,是一个非常具有挑战性的问题。gydtep 发表于 2021-12-7 17:42:28
具体来说,对于样本多样性问题,我们使用了多趟资料的匹配结果来生成训练数据,因为在不同资料中同一牌匾存在多张来自不同视角的拍摄结果,这就保证了同一类别下牌匾的多样性,避免了自动生成的样本都为简单样本问题。gydtep 发表于 2021-12-8 08:34:18
这些Bad case就是我们设计的多模态检索模型的初衷,并且也在优化过程逐渐得以解决,如图(d)、(e)、(f)所示。我们提出的多模态检索模型通过对全局特征优化以及引入局部特征对齐,使得模型更多关注到牌匾上更有区分性的局部特征gydtep 发表于 2021-12-8 13:36:25
即便如此,我们的代码覆盖率在超过50%之后很难有比较大的提升,另外,代码的覆盖并不能全部代表业务场景的覆盖,一些线上漏测的问题仍然偶尔发生,因此,对于盒马来说,基于较全场景的测试是必须。gydtep 发表于 2021-12-9 08:38:54
、特征决策:针对聚合出来的潜在特征,进行基于代码、经验、默认值等多种维度的判断,最终进行特征的推荐,这部分因为业务属性比较重,我们在推荐出来的同时,最终**赖于专家经验进行字段的最终判断,目前推荐出来和最终采纳的比例约为50%,我们后续会升级算法和参考维度进一步提升采纳率。gydtep 发表于 2021-12-9 15:58:36
达摩院和杭州市拱墅区卫生健康局、浙江大学公共卫生学院联合打造了国内首个老年痴呆症AI筛查产品刚刚发布,最新的测试结果让我们非常有信心,机器筛查判断的可靠性基本能达到人工专业水平,还能把时间缩短到三分之一。gydtep 发表于 2021-12-10 07:42:57
达摩院和杭州市拱墅区卫生健康局、浙江大学公共卫生学院联合打造了国内首个老年痴呆症AI筛查产品刚刚发布,最新的测试结果让我们非常有信心,机器筛查判断的可靠性基本能达到人工专业水平,还能把时间缩短到三分之一。gydtep 发表于 2021-12-11 12:07:09
Undo Log是InnoDB十分重要的组成部分,它的作用横贯InnoDB中两个最主要的部分,并发控制(Concurrency Control)和故障恢复(Crash Recovery),InnoDB中Undo Log的实现亦日志亦数据。gydtep 发表于 2021-12-12 11:53:18
每个Undo Tablespace最多会包含128个Rollback Segment,Undo Tablespace文件中的第三个Page会固定作为这128个Rollback Segment的目录,也就是Rollback Segment Arrary Header,其中最多会有128个指针指向各个Rollback Segment Header所在的Page。