gydtep 发表于 2020-10-12 15:25:53
当然,正如前文所述,读者需要按照实际规划的若干个MaxCompute project进行计算。gydtep 发表于 2020-10-12 16:43:26
当然,一般情况下建议1个MaxCompute project 划分1个子quota group资源组。gydtep 发表于 2020-10-12 19:51:00
按照默认规则,MaxCompute资源组的资源抢占按照“fair scheduling”公平调度机制,先提交的任务优先获取CU资源。koozb 发表于 2020-10-12 22:18:48
希望楼主文章收录 ,我做网站seo外包的http://www.justinindustries.com/ 诚换友链找我,影视资讯http://rocketheduck.com/ 叮当游戏资讯http://shjuekang.com/ **资讯http://www.bhartimachinery.com/ 科技资讯http://jobsatpapermoon.com/gydtep 发表于 2020-10-13 08:07:40
第一,选择什么样的存储系统做数据湖(湖存储)?gydtep 发表于 2020-10-13 10:31:25
JindoFS一路走来积累了很多经验,我们对大目录的listing操作和du/count这种统计操作从内存使用和充分并发进行了深度优化,gydtep 发表于 2020-10-13 11:15:47
对目录进行rename操作则更为复杂,涉及到该目录下的所有文件的rename,而每一个都是上述的copy+delete;gydtep 发表于 2020-10-13 12:42:12
结合阿里云 OSS 的扩展和优化支持,在客户端尽可能重试或者回滚,能够很好地衔接数据湖各种计算,在pipeline 上下游之间保证正确处理。gydtep 发表于 2020-10-13 14:12:11
但是这种分离架构带来一个重要问题就是,存储带宽的供应在一些情况下可能会跟计算对存储带宽的需求不相适应。gydtep 发表于 2020-10-13 14:59:28
叠加我们在适配上的优化,跟业界某开源缓存方案相比,我们在多个计算场景上都具有显著的性能领先优势。