gydtep 发表于 2020-10-12 09:42:59

按照第一步预估的每半年存储资源总量,结合每半年评估的计存比值,存储资源总量 *计存比 = 计算资源CU总量。

gydtep 发表于 2020-10-12 11:48:57

这样方便评估实际项目在规定时间段内运行完所有任务需要quota group资源组的最少计算资源CU数量。

gydtep 发表于 2020-10-12 15:00:21

同时,由于DataWorks/Dataphin调度任务还会产生很多延迟时间、任务获取CU资源也会耽误很多时间,这部分延迟时间会加大任务之间运行的时间间隔,真正用于运行任务的时间会小于N。

gydtep 发表于 2020-10-12 15:11:07

W/N的分母实际变大、分子实际变小,进而变相地要求增加计算资源,以便让任务获取更多资源进而运行地更加快速。

gydtep 发表于 2020-10-12 20:00:40

如何更加完美地划分quota group资源组,并且为每个资源组分配最合理的 min资源配额、max资源配额? 如何结合实际项目需求,

gydtep 发表于 2020-10-13 08:56:44

分别是:基础版,要适配;标配版,做缓存;高配版,深度定制。JindoFS同时涵盖这三个层次,实现数据湖加速场景全覆盖。

gydtep 发表于 2020-10-13 11:25:25

为了追求超大并发,不少对象存储产品提供的是最终一致性(S3),而不是文件系统常见的强一致性语义。

gydtep 发表于 2020-10-13 14:14:39

这个在数据湖时代之前不可想象,那个时候也许最多的就是MapReduce作业了。这些多样化的计算,对数据访问性能和吞吐的需求却不遑多让甚至是变本加厉。

gydtep 发表于 2020-10-13 15:36:38

我们在JindoFS上优化好OSS适配,把Jindo分布式缓存性能做到效能最大化,能满足绝大多数大规模分析和机器学习训练这些计算。

gydtep 发表于 2020-10-14 09:18:31

该数据集可用于物体检测的算法、商品重识别算法、主播意图识别、跨模态检索和多模态检索等多种算法的研究。
页: 91 92 93 94 95 96 97 98 99 100 [101] 102 103 104 105 106 107 108 109 110
查看完整版本: 免费领取阿里云代金券2020元啦!新老用户同享。