版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据及云计算培训资料何为大?信息度量1Byte=8Bit1KB=1,024Bytes1MB=1,024KB=1,048,576Bytes1GB=1,024MB=1,048,576KB=1,073,741,824Bytes1TB=1,024GB=1,048,576MB=1,099,511,627,776Bytes1PB=1,024TB=1,048,576GB=1,125,899,906,842,624Bytes1EB=1,024PB=1,048,576TB=1,152,921,504,606,846,976Bytes1ZB=1,024EB=1,180,591,620,717,411,303,424Bytes1YB=1,024ZB=1,208,925,819,614,629,174,706,176Bytes23Google每天要处理超过24PB的数据Facebook每天更新的照片量超过1000万张YouTube每月接待多达8亿的访客,平均每一秒钟就会有一段长度在一小时以上的视频上传twitter上的信息量几乎每年翻一倍,截至2012年,每天都会发布超过4亿条微博4数据都从哪里来?5表面张力vs万有引力量变导致质变一个月吃一碗饭一天吃一碗饭一餐吃一碗饭一个小时吃一碗饭一分钟吃一碗饭一秒吃一碗饭6这么多数据要放哪里?怎样处理?7不要问我从哪里来的
“不知所云”通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。8服务特征9把计算能力像水和电一样提供给用户10什么是云计算11权威定义Wiki定义:云计算是一种通过Internet以服务的方式提供动态可伸缩的虚拟化的资源的计算模式。美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。12Googleの野望“浏览器=操作系统”13IaaS基础设施云(代表:亚马逊的S3)SaaS应用云(代表:salesforce的CRM)PaaS平台云(代表:GoogleAppEngine)私有云(数据中心–内部网)公共云(服务提供商–互连网)混合云(公共和私有)XX就是服务14亚马逊IaaS应用案例:纽约时报15Google云计算SaaS16软件终结者可提供随需应用的客户关系管理(On-demandCRM)允许客户与独立软件供应商定制并整合其产品,同时建立他们各自所需的应用软件SalesforceCRM价格分别有5美元,17美元,65美元,125美元和250美元的不同版本17云计算的演化182006年8月9日Google
CEO埃里克·施密特(EricSchmidt)在搜索引擎大会(SESSanJose2006)首次提出“云计算”(CloudComputing)的概念。191996年,互联网上只有一万多个网站,现在有一亿六千万个96年能上网的人基本上使用28.8或者33.6Kbps的猫,高速的56Kbps猫直到97年才出来640×480才是主流,800×600是高端90年代20199720132122231998年24GoogolGoogle100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000025Google的BIDPROBLEM海量数据快速处理26搜索排名
Google的PageRank技术PageRank并不计算直接链接的数量,而是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。杜绝人工干预或操纵27Google的海量数据怎样存储?28摩尔定律正在走向终结…单芯片容纳晶体管的增加,对制造工艺提出要求CPU制造18nm技术,电子泄漏问题CPU主频已达3GHz时代,难以继续提高散热问题(发热太大,且难以驱散)功耗太高29Google云计算应用MapReduce并行数据处理BigTable结构化数据表GFS分布式文件系统Chubby分布式锁30GFS设计原则:机器失效不能视为异常现象能应付对大型/超大型文件处理支持大量用户同时访问GFS组成GFS集群:一个的Master和多个ChunkServer(块服务器)组成,并可以多客户端Client访问GFS设计要点每个文件拆成若干个64M文件块Chunk组成每个Chunk都由Master根据其创建时间指定ChunkHandle(64)文件块被保存在ChunkServer本地磁盘中缺省情况下3处热备份Chunk块文件31GFS32P2P传输协议
多源文件传输协议MFTP
theMultisourceFileTransferProtocolBitTorrent专门为大容量文件的共享而设计,它采用了一种像传销一样的通讯方式。33P2P34MapReduceGoogleMapReduce架构设计师JeffreyDean只要执行的简单计算,而将并行化、容错、数据分布、负载均衡的等杂乱细节放在一个库里,使并行编程时不必关心它们35只需要编写两个函数://产生<key,value>映射关系Map:(in_key,in_value)//对相同的key进行归类处理Reduce:(key,[value1,value2…])36例子:单词统计37Map
(key,value){
for(each‘world’invalue)
collect(‘world’,1);……}Reduce(key,value[]){
intcount=0;
for(eachwinvalue) count++;
collect(key,count);……}第一步编码38第二步分割39第三步Map(映射)40第四步Fold(合并)41第五步Reduce(归纳)4243大数据、云计算有什么用?4445马云成功预测2008年经济危机“2008年初,阿里巴巴平台上整个买家询盘数急剧下滑,欧美对中国采购在下滑。海关是卖了货,出去以后再获得数据;而我们提前半年时间从询盘上推断出世界贸易发生变化了。”4647其他云平台…48云计算平台49商业化云计算平台公司技术特性核心技术企业服务开发语言微软整合其所用软件及数据服务大型应用软件开发技术Azure平台.NETGoogle储存及运算水平扩充能力平行分散技术MapReduce,BigTable,GFSGoogleAppEngine,应用代管服务Python,JavaIBM整合其所有软件及硬件服务网格技术,分布式存储,动态负载虚拟资源池提供,企业云计算整合方案Oracle软硬件弹性虚拟平台Oracle的数据存储技术,Sun开源技术EC2上的Oracle数据库,OracleVM,SunxVMAmazon弹性虚拟平台虚拟化技术XenEC2、S3,SimpleDB、SQSSaleforce弹性可定制商务软件应用平台整合技术F服务Java,APEXEMC信息存储系统及虚拟化技术Vmware的虚拟化技术,一流存储技术Atoms云存储系统,私有云解决方案阿里巴巴弹性可定制商务软件应用平台整合技术软件互联平台,云电子商务平台中国移动坚实的网络技术丰富的带宽资源底层集群部署技术,资源池虚拟技术,网络相关技术BigCloude-大云平台50开源计算平台平台名称描述AbiCloud(Abiquo公司)AbiCloud是一款用于公司的开源的云计算[1]平台,使公司能够以快速、简单和可扩展的方式创建和管理大型、复杂的IT基础设施(包括虚拟服务器、网络、应用、存储设备等)Hadoop(Apache基金会)该计划是完全模仿Google体系架构做的一个开源项目,主要包括Map/Reduce和HDFS文件系统Eucalyptus项目(加利福尼亚大学)创建了一个使企业能够使用它们内部IT资源(包括服务器、存储系统、网络设备)的开源界面,来建立能够和AmazonEC2兼容的云MongoDB(10gen)MongoDB是一个高性能、开源、无模式的文档型数据库,它在许多场景下可用于替代传统的关系型数据库或键/值存储方式Enomalism弹性计算平台它提供了一个功能类似于EC2的云计算框架。Enomalism基于Linux,同时支持Xen和KernelVirtualMachine(KVM)。与其他纯IaaS解决方案不同的是,Enomalism提供了一个基于TurboGearsWeb
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《周恩来行政管理思想》课程教学大纲
- 《公共事业管理概论》课程教学大纲
- 2024年代送小孩服务合同范本
- 2024年承揽彩钢工程合同范本
- 培训团队意识
- 严重骨盆骨折治疗策略
- 安徽省滁州市全椒县2024-2025学年度八年级上学期期中考试物理试卷(含答案)
- 小学三年级有趣的实验作文(20篇)
- 中学生广播员培训
- 2024建设工程施工转包合同范本
- 危险源因素识别清单(钢结构)
- 系列melsec通讯协议参考手册新
- 李宁导购员服务八步曲精华版
- 关于小学五年级硬笔书法写字课教案全册
- 垃圾清运转运车辆安全管理制度
- “西学中”考试试卷及答案
- 超滤反渗透操作说明书
- 原发性骨髓纤维化课件
- 送达地址确认书(样本)
- 六年级上册数学课件-6.1 百分数的认识丨苏教版 (共16张PPT)
- 四年级上册美术教案-第13课 多变的大自然 ︳冀美版
评论
0/150
提交评论