gydtep
发表于 2022-1-23 18:02:29
所以,他们自然就有能力表达出系统该做成什么样子。所以,要知道一个系统到底该做成什么样子,到底哪些是核心业务关注点,只能靠沉淀领域内的各种知识,别无他法。
gydtep
发表于 2022-1-24 12:43:50
DDD切入点3 - 领域模型设计
这部分内容,我想学习DDD的人都很熟悉了。DDD原著中提出了很多实用的建模工具:聚合、实体、值对象、工厂、仓储、领域服务、领域事件。我们可以使用这些工具,来设计每一个子域的领域模型。最终通过领域模型图将设计沉淀下来。
gydtep
发表于 2022-1-25 08:19:30
MySQL是一款主要面向OLTP型场景设计的开源数据库,开源社区的研发方向侧重于加强其事务处理的能力,如提升单核性能/多核扩展性/增强集群能力以提升可用性等。在处理大数据量下复杂查询所需要的能力方面,如优化器处理子查询的能力,高性能算子HashJoin, SQL并行执行等,社区一直将其放在比较低优先级上,因此MySQL的数据分析能力提升进展缓慢。
gydtep
发表于 2022-1-26 18:17:34
Plan转换的方法简单直接,只需要遍历这个执行计划树,将 mysql 优化后的 AST 转换成IMCI 以 relation operator 位节点的树状结构即可,是一个比较直接的翻译过程。不过在这个过程中,也会做一部分额外的事情,如进行类型的隐式转换,以兼容MySQL灵活的类型系统。
gydtep
发表于 2022-1-27 17:10:59
列存RowGroup中每新写入一行都会分配一个RowID用作定位,属于一行的所有列都可以用该RowID计算定位,同时系统维护PK到RowID的映射索引,以支持后续的删除和修改操作。
gydtep
发表于 2022-1-28 12:39:42
第三种方式,RW/RO支持OLTP型负载,在单独的Standby节点开启行列混合存储以支持AP型查询,由于standby是使用独立的共享存储集群,这种方案在第二种方案支持CPU和内存资源隔离的基础上,还可以实现IO资源的隔离。
gydtep
发表于 2022-1-29 10:03:40
图(a)、(b)、(c)展示的是优化前的Bad case(左图为query图像,右图为Rank1检索结果),从Bad case中我们不难发现,牌匾检索对细粒度特征提取要求非常高,因为这些case普遍特点是具备整体相似性,但是局部特征有区别。
gydtep
发表于 2022-1-30 17:18:06
、软件领域通过开源实现商业成功的有Redhat,为什么芯片领域、硬件领域没有这样的成功案例?
gydtep
发表于 2022-2-2 09:40:10
无论是从宏观的角度看人类社会,还是看一家公司、一家企业的发展,商业和技术持续相互推进、共同进化都是非常重要的驱动力。双11创造了一个试验场、一个关键节点,能够让商业和技术高强度地碰撞,并加快推动整个进程。
gydtep
发表于 2022-2-7 11:15:48
1)DB全量数据查询:通过odps查询方式获取全量多表关联数据,用以作为分析的数据源。
2)数据的聚合:对于查询的数据进行信息补齐后,字段打平,采用聚类的方式针对每一字段进行聚合,以出现有限数量的字段作为特征字段进行基线特征的沉淀,对于离散型的数据会选择合适的区间进行分段处理。