gydtep 发表于 2020-10-12 09:42:59
按照第一步预估的每半年存储资源总量,结合每半年评估的计存比值,存储资源总量 *计存比 = 计算资源CU总量。gydtep 发表于 2020-10-12 11:48:57
这样方便评估实际项目在规定时间段内运行完所有任务需要quota group资源组的最少计算资源CU数量。gydtep 发表于 2020-10-12 15:00:21
同时,由于DataWorks/Dataphin调度任务还会产生很多延迟时间、任务获取CU资源也会耽误很多时间,这部分延迟时间会加大任务之间运行的时间间隔,真正用于运行任务的时间会小于N。gydtep 发表于 2020-10-12 15:11:07
W/N的分母实际变大、分子实际变小,进而变相地要求增加计算资源,以便让任务获取更多资源进而运行地更加快速。gydtep 发表于 2020-10-12 20:00:40
如何更加完美地划分quota group资源组,并且为每个资源组分配最合理的 min资源配额、max资源配额? 如何结合实际项目需求,gydtep 发表于 2020-10-13 08:56:44
分别是:基础版,要适配;标配版,做缓存;高配版,深度定制。JindoFS同时涵盖这三个层次,实现数据湖加速场景全覆盖。gydtep 发表于 2020-10-13 11:25:25
为了追求超大并发,不少对象存储产品提供的是最终一致性(S3),而不是文件系统常见的强一致性语义。gydtep 发表于 2020-10-13 14:14:39
这个在数据湖时代之前不可想象,那个时候也许最多的就是MapReduce作业了。这些多样化的计算,对数据访问性能和吞吐的需求却不遑多让甚至是变本加厉。gydtep 发表于 2020-10-13 15:36:38
我们在JindoFS上优化好OSS适配,把Jindo分布式缓存性能做到效能最大化,能满足绝大多数大规模分析和机器学习训练这些计算。gydtep 发表于 2020-10-14 09:18:31
该数据集可用于物体检测的算法、商品重识别算法、主播意图识别、跨模态检索和多模态检索等多种算法的研究。