百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[国内信息] 58.82.202.x香港服务器低延迟MapperReducer之WordCount 笔记 [复制链接]
查看:155 | 回复:1

1367

主题

1441

帖子

1

积分

落伍者(一心一意)

Rank: 1

贡献
43
鲜花
0
注册时间
2017-3-30

落伍手机绑定落伍者落伍微信绑定

发表于 2019-10-16 10:00:40 | 显示全部楼层 |阅读模式 来自 中国广东东莞
58.82.202.x香港服务器低延迟MapperReducer之WordCount 笔记


需要咨询以下联系方式
联系人:銳輝(香港)科技 敏敏
扣扣:3007425289/2853898501
电话:18316411879


1.HDFS中有300MB a.txt和80MB b.txt
2.写一个PV或者UV程序

执行过程
1.client(客户端)请求yarn的resourcemanager申请提交任务
2.resourcemanager接受到请求返回给客户端        jobID和hdfs提交地址 (hdfs://hdp1:8020/tmp…/…/staing/jobid)
3.扫描输入路径的文件划分切片
3.1       
FileSplit0(对象) 0-128MB a.txt
FileSplit1(对象) 128-256MB a.txt
FileSplit2(对象) 256-300MB a.txt
FileSplit3(对象) 0-80MB
3.2
把上述对象add到list里将list序列化到文件里(job_id.split)

4.客户端上传刚刚生成的job.split和程序jar包到hadfs指定路径上
5.客户端通知resourcemanager上传完成
6.resourcemanager随机找个nodemanager启动MRAPPMaster
7.MRAPPMaster下载job.split输入切片信息文件
8.分析(反序列化)job.split文件,得出启动4个map,然后启动maptask
9.下载程序执行jar包
10.读取对应切片的信息(mapper1 读取File Split0 依次对应读取)一行一行读,调用LineRecordReader
net一次读一行
将行首偏移量设置为Key,将行的内容设置为Value
返回给map(YarnChild)调用自己写的mapper类里的map方法输出 a1 a 1 b 1 b 1
11.输出到环形数据缓冲区(内存)
将上述输出内容写的环形数据缓冲区(也是内存)里
环形缓冲区默认大小(100M)
12.写入满80M(80%)时调用partitioner将数据进行分区

环形数据缓冲区剩下20%继续读取9步的输出内容写入满20%时检查第12步分区排序进行完成没有
如果完成再继续覆盖60% 如果没有完成会阻塞
以此.分区>排序>溢出到磁盘 形成若干个文件
14.YarnChiId合并溢出文件 ,按照同区进行合并同时,在同区中进行排序生成分区索引文件

划分切片有4个 启动4个map
numReducerTask(分区3分)

15.启动reducerTask下载程序执行jar包
16.reducerTask0执行MRAPPMast的命令下载        14步文件0号区的数据()有3个分区 启动3个reducetask合并文件按key排序(SHUFFLE:混洗)
17.启动自己写的Reducer类型进行聚合
17.1 net一次 读一个key,value 把key,value赋值给reducer方法的key,v(一组k进入一次方法)每次net调用groupComparaTor(分组比较器):比较前后key是否一组不是一组进行切组进入下个reducer方法

18.context.write到hdfs里面
想了解更多欢迎加QQ探讨QQ:3007425289

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
高配置、高防御、高带宽!
高防服务器 无视CC 硬抗DDOS
客服企业qq:2853898501
回复

使用道具 举报

652

主题

1万

帖子

350

积分

落伍者(一心一意)

Rank: 1

贡献
404
鲜花
71
注册时间
2007-10-13

落伍手机绑定

发表于 2019-10-16 10:13:29 | 显示全部楼层 来自 中国河南郑州
镇江电信-100M高配低价-50G防御
【20M】L5630*2/32G/2T or 240G SSD=特价399元 季度299*3
【100M】L5630*2/32G/2T or 240G SSD=999元【特惠】
【1G】L5630*2/32G/2T or 240G SSD=5999元【特惠】

镇江电信:E5-2620*2 / 32G / 240G SSD
20M  - 599元   季付 499元*3
50M  - 899元   季付 799元*3
100M - 1199元
支持电信,联通,移动线路,G口带宽

河南移动BGP-20M免费升级30M(限时)
【30M】L5630*2/16G/1T-299元【特惠】
【100M】L5630*2/16G/1T-特价899元
【100M】E5-2450*2/32G/1T=999元【特惠】
【G口】L5630*2/16G/1T-5000元【特惠】

【扬州BGP高防】L5630*2/16G/1T/20M/100G防御-月付1599元

【大带宽服务器-20M/50M/100M/G口】-现机
【多IP服务器-5IP/34IP/66IP/258ip/4C/8C/16C】-现机
【高防服务器-cn2/联通/移动专线直连,真实防御】-现机

24小时技术售后支持,免费安装系统环境,重装系统
支持Windows 2003/ 2008/ 2012/ 2016版本  linux系统-centos  ubuntu等版本

咨询QQ82520484
5ip/34ip/258ip/混C段服务器,20M/100M带宽专线直连https://rc.qzone.qq.com/main[b
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-11-15 23:00 , Processed in 0.055287 second(s), 33 queries , Gzip On.

返回顶部