gydtep 发表于 2022-1-9 09:29:05

对于数据驱动,很多人做到一定程度之后,脑海中会形成一定的方法论和体系,进而形成驱动流程和组织机制。大家也听了很多方法论,包括增长黑客等,貌似自己已经很懂数据驱动了,但是实际操作起来可能连“什么是事件属性这种基础的概念都不了解”,这是很多业务线同学普遍的现状。

gydtep 发表于 2022-1-9 10:50:31

早些时候,大家对“数据驱动”的理解是“报表驱动”。2016年、2017年的时候,一家处于C轮、D轮的深圳公司,该公司有1000多份报表,每张有10个Sheet,每个表格有20多个指标,大家可以算下一共有多少个指标,他们内部的数据团队都不知道哪些指标有用、哪些没有用。为了督促大家去看这些报表,公司还监控了邮箱。

gydtep 发表于 2022-1-9 12:37:25

今天,很多C端产品要改版要升级,那么,在改版之前要搞清楚为什么要改?目标是什么?之后所有的工作都是以这两个问题的答案为导向。

gydtep 发表于 2022-1-10 08:53:20

目前,由于疫情的原因,很多人在家使用钉钉移动协同办公, 如果某个人的KPI出现异常或者波动就会自动同步到群里,分析师会到后台分析异常原因。另外,团队运营人员在后台可以直接用运营弹框来组织活动,并对相关人群做触达并观看效果……

gydtep 发表于 2022-1-10 16:11:19

Liskov substitution principle - 里氏替换原则

Interface segregation principle - 接口隔离原则

Dependency inversion principle - 依赖翻转原则

将以上五个原则的英文首字母拼在一起就是 SOLID 原则,这也是帮助我们构建高内聚,低耦合、具备柔性的应用架构。在分布式微服务应用架构中,API优先是契约优先(Contract First)的自然拓展。

gydtep 发表于 2022-1-10 20:56:32

2、与传统同步处理方式相比,异步事件处理存在与事件排序、幂等性、回调和异常处理相关的要求,整体设计难度更大一些。

gydtep 发表于 2022-1-11 10:39:12

Hash Clustered表和Range Clustered表并不适合Tunnel去写,因为数据在存储上需要做一个系统,而且会排序,而Tunnel集群规模没有计算机集群那么大,没有这个能力去做排序。

gydtep 发表于 2022-1-11 18:27:07

Insert overwrite指commit的时候支持使用某个upload session的数据直接overwrite掉一整个分区或者一张表,类似SQL的Insert和Overwrite的功能。
这个功能也有使用限制。

gydtep 发表于 2022-1-12 09:32:35

上图是Tunnel总体功能的表格。现在有两套API,分批量数据通道和流式数据通道。
批量数据通道目标的场景单并发的吞吐量很大,这种理想的场景是传量大的数据,一次一批,QPS和并发都不能特别高,但是单并发的吞吐量可以做得很大,这个在API上也有一些优化。

gydtep 发表于 2022-1-12 13:06:09

ODPS Endpoint是服务的一个入口,现在在公共云上应该有21个region,包括金融云和政务云,中国有7个,海外有14个。每个region的endpoint是不一样的,使用时需要找到自己购买的region服务,并正确填写endpoint进去。
页: 5 6 7 8 9 10 11 12 13 14 [15] 16 17 18 19 20 21 22 23 24
查看完整版本: 免费领取3000元阿里云代金券