gydtep 发表于 2020-10-12 16:13:40

得到MaxCompute计算资源CU数量:202 CPU核数 *小时 / 5小时 = 40.2 cores核数,也就是至少需要41 CU。

gydtep 发表于 2020-10-12 19:04:15

这n个资源组必须设置两个重要参数:资源组的“预留CU最小配额”minD1、minD2……minDn,以及“预留CU最大配额” maxD1、maxD2……maxDn。

gydtep 发表于 2020-10-12 20:37:38

合理安排任务运行的先后顺序、以及任务运行调度的依赖关系?这是划分子quota group资源组需要考虑的重点因素。

gydtep 发表于 2020-10-13 08:37:45

在数据湖架构里,湖存储(HDFS,阿里云OSS)和湖计算(Spark,Presto)都比较清楚。那么什么是湖加速?大家不妨搜索一下…(基本没有直接的答案)。

gydtep 发表于 2020-10-13 10:05:25

对象存储提供海量低成本存储,相比文件系统(比如HDFS),阿里云OSS更被用户认为可无限扩展。

gydtep 发表于 2020-10-13 11:34:40

这带来的影响就是,举个栗子,程序明明往一个目录里面刚刚写好了10个文件,结果随后去list,可能只是部分文件可见。

gydtep 发表于 2020-10-13 13:14:53

对象存储产品是独立演化发展的,少不了会有自己的一些独门秘籍,这种特性要充分利用起来可能就得突破HCFS抽象接口的限制。

gydtep 发表于 2020-10-13 14:20:47

常驻的集群希望完成更多的计算;弹性伸缩的集群则希望尽快完成作业,把大量节点给释放掉节省成本;

gydtep 发表于 2020-10-13 15:12:50

基于磁盘缓存,受益于我们能够更好地balance多块磁盘负载和高效精细化的缓存块管理,我们用TPC-DS 1TB进行对比测试,

gydtep 发表于 2020-10-13 18:06:25

HDFS重度用户希望能够平迁上云,或者在存储方案选择上进行微调,原有基于HDFS的应用,运维和治理仍然能够继续使用。
页: 259 260 261 262 263 264 265 266 267 268 [269] 270 271 272 273 274 275 276 277 278
查看完整版本: 阿里云服务器1折起购,先领券再购买!