百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[国内信息] 免费领取阿里云代金券2020元啦!新老用户同享。 [复制链接]
查看:185207 | 回复:2373

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-14 15:52:40 | 显示全部楼层 来自 中国河北衡水
Shuffle agent的归集功能将reducer的input数据从碎片变为了连续数据文件,对HDD介质相当友好。由此,整个shuffle过程中对磁盘的读写均为连续访问。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-14 15:53:40 | 显示全部楼层 来自 中国河北衡水
从标准的TPCH等测试中可以看到不同场景下性能可取得百分之几十到几倍的提升,且大幅降低磁盘压力、提升CPU等资源利用率。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-14 17:33:33 | 显示全部楼层 来自 中国河北衡水
但在前述shuffle service流程中,由于shuffle agent输出的shuffle这个文件包含了来自所有mapper的shuffle数据,损坏文件的重新生成需要以重跑所有mapper为代价。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 07:56:30 | 显示全部楼层 来自 中国河北衡水
在后续数据发送到新的shuffle agent同时,Fuxi还会将丢失的部分数据从备份副本中load起来并同样发送给新的shuffle agent, 使得后续reducer所有的数据都可以读取自shuffle agent侧,极大地提升了容错情况下的作业性能。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 09:40:41 | 显示全部楼层 来自 中国河北衡水
而实际上多数场景计算逻辑生成shuffle数据的速度不足以填满shuffle带宽,运行中的计算节点等待数据的现象明显,性能提升付出了资源浪费的代价。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 10:58:16 | 显示全部楼层 来自 中国河北衡水
典型的互联网公司业务一般区分为离线业务与在线业务两种类型。在阿里巴巴,我们也同样有在线业务如淘宝、天猫、钉钉、Blink等,
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 14:00:06 | 显示全部楼层 来自 中国河北衡水
如何保障离线稳定
当资源发生冲突时,第一反应往往是保护在线,牺牲离线。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 15:05:50 | 显示全部楼层 来自 中国河北衡水
这里包括在线、离线两个大类的资源诉求,同时也包含了各自内部不同层次的优先级二次划分需求,十分复杂。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 16:18:52 | 显示全部楼层 来自 中国河北衡水
在集群、Job作业、机器、worker等不同层次和粒度实现了资源信息的画像,实现了秒级的数据采集精度。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
8397
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2020-7-15 18:27:13 | 显示全部楼层 来自 中国河北衡水
探索机器学习场景的DAG调度,改善训练作业的效率,提升GPU使用率。
免费领取2000元阿里云代金券 https://www.aliyun.com/minisite/goods?userCode=2a7uv47d
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-11-26 22:51 , Processed in 0.047278 second(s), 27 queries , Gzip On.

返回顶部