版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据计算平台《大数据导论》课程IntroductiontobigdataMapReduce平台(1)MapReduce由来MapReduce简释01021MapReduce由来A一种面向大规模数据处理的并行计算模型和方法。BGoogle设计初衷是解决其搜索引擎中大规模网页数据的并行化处理问题。CMapReduce的推出给大数据并行处理带来了巨大的革命性影响。2MapReduce简释提问:如果我们想知道相当厚的一摞牌中有多少张红桃,你会怎么操作?2MapReduce简释提问:如果我们想知道相当厚的一摞牌中有多少张红桃,你会怎么操作?直观做法做法:通过一张张检查这些牌,并且数出有多少张是红桃。缺点:速度太慢,特别是当牌的数量特别高的情况下,获取结果的时间会很长。MapReduce做法做法:把这摞牌分配给在座的所有玩家,然后让每个玩家数自己手中的牌中有几张是红桃,并把这个数目汇报给你,最后你把所有玩家告诉你的数字加起来,得到最后的结论。优势:大大加快得多答案的速度。2MapReduce简释MapReduce方法使用了拆分的思想,合并了两种经典函数:遍历集合中的元素来返回一个综合的结果。如果想找出表单里所有数字的总和,那么输出表单里一列数字的总和这个任务就属于化简(Reduce)。化简(Reduce)对集合中的每个元素进行同一个操作。如果想把表单里每个单元格乘以二,那么把这个函数单独地应用在每个单元格上的操作就属于映射(Map)。映射(Map)2MapReduce简释站在MapReduce角度,重新审视前面分散纸牌找出红桃总数的例子提问:如果我们想知道相当厚的一摞牌中有多少张红桃,你会怎么操作?还要注意的情况就是牌分配的是否均匀。玩家代表计算机,因为他们同时工作,所以他们是个集群。告诉每个人去数数,实际上就是对一项检查每张牌的任务进行了映射。通过把牌分给多个玩家并且让他们各自数数,就是在并行执行运算。MapReduce算法的机制要远比数牌复杂得多,但是主体思想是一致的,通过分散计算来分析大量数据。总结summaryMapReduce平台(1)MapReduce由来Ma
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 正常入职合同范例
- 安置房屋转让合同模板
- 商务宴请布置饭店合同范例
- 寄递业合同模板
- 园林道路清洁合同范例
- 民工集体劳务合同范例
- 旅游汽车租赁合同范例
- 水电合同范例
- 投标设计合同范例
- 楼房暖气改造合同范例
- GB/T 30893-2024雨生红球藻粉
- 四川省绵阳市2025届高三第一次诊断性考试数学试题含答案
- 2023年山东黄金集团招聘笔试真题
- 高空抛物安全宣传教育课件
- 2024湖北武汉市洪山科技投资限公司招聘11人高频难、易错点500题模拟试题附带答案详解
- 《西游记》与中国传统文化学习通超星期末考试答案章节答案2024年
- 上海2024年上海市经济信息中心(上海市公共信用信息服务中心)招聘笔试历年参考题库解题思路附带答案详解
- 人教版六年级数学上册第一单元分数乘法单元达标测试卷
- 登高车高空作业施工方案
- 2024年动画制作员(高级工)技能鉴定理论考试题库-上(单选题)
- 2024年注册安全工程师考试(初级)安全生产法律法规试卷与参考答案
评论
0/150
提交评论