阿里云服务器1折起购，先领券再购买！ - 第269页 - IDC信息交流 - 落伍者

gydtep 发表于 2020-10-12 16:13:40

得到MaxCompute计算资源CU数量：202 CPU核数 *小时 / 5小时 = 40.2 cores核数，也就是至少需要41 CU。

gydtep 发表于 2020-10-12 19:04:15

这n个资源组必须设置两个重要参数：资源组的“预留CU最小配额”minD1、minD2……minDn，以及“预留CU最大配额” maxD1、maxD2……maxDn。

gydtep 发表于 2020-10-12 20:37:38

合理安排任务运行的先后顺序、以及任务运行调度的依赖关系？这是划分子quota group资源组需要考虑的重点因素。

gydtep 发表于 2020-10-13 08:37:45

在数据湖架构里，湖存储（HDFS，阿里云OSS）和湖计算（Spark，Presto）都比较清楚。那么什么是湖加速？大家不妨搜索一下…（基本没有直接的答案）。

gydtep 发表于 2020-10-13 10:05:25

对象存储提供海量低成本存储，相比文件系统（比如HDFS），阿里云OSS更被用户认为可无限扩展。

gydtep 发表于 2020-10-13 11:34:40

这带来的影响就是，举个栗子，程序明明往一个目录里面刚刚写好了10个文件，结果随后去list，可能只是部分文件可见。

gydtep 发表于 2020-10-13 13:14:53

对象存储产品是独立演化发展的，少不了会有自己的一些独门秘籍，这种特性要充分利用起来可能就得突破HCFS抽象接口的限制。

gydtep 发表于 2020-10-13 14:20:47

常驻的集群希望完成更多的计算；弹性伸缩的集群则希望尽快完成作业，把大量节点给释放掉节省成本；

gydtep 发表于 2020-10-13 15:12:50

基于磁盘缓存，受益于我们能够更好地balance多块磁盘负载和高效精细化的缓存块管理，我们用TPC-DS 1TB进行对比测试，

gydtep 发表于 2020-10-13 18:06:25

HDFS重度用户希望能够平迁上云，或者在存储方案选择上进行微调，原有基于HDFS的应用，运维和治理仍然能够继续使用。

页: 259 260 261 262 263 264 265 266 267 268 [269] 270 271 272 273 274 275 276 277 278

落伍者's Archiver