![谷歌与大数据时代课件_第1页](http://file4.renrendoc.com/view/9233c17b0e0618f1bc775b60fe21fae6/9233c17b0e0618f1bc775b60fe21fae61.gif)
![谷歌与大数据时代课件_第2页](http://file4.renrendoc.com/view/9233c17b0e0618f1bc775b60fe21fae6/9233c17b0e0618f1bc775b60fe21fae62.gif)
![谷歌与大数据时代课件_第3页](http://file4.renrendoc.com/view/9233c17b0e0618f1bc775b60fe21fae6/9233c17b0e0618f1bc775b60fe21fae63.gif)
![谷歌与大数据时代课件_第4页](http://file4.renrendoc.com/view/9233c17b0e0618f1bc775b60fe21fae6/9233c17b0e0618f1bc775b60fe21fae64.gif)
![谷歌与大数据时代课件_第5页](http://file4.renrendoc.com/view/9233c17b0e0618f1bc775b60fe21fae6/9233c17b0e0618f1bc775b60fe21fae65.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
谷歌与大数据时代谷歌与大数据谷歌搜索与流感预测无所不包的谷歌翻译系统谷歌的数字图书馆谷歌街景与GPS采集谷歌的拼写检查流感预测1.谷歌搜索与流感预测各国都要求医生在发现新型流感病例时告知疾病控制与预防中心。但由于人们可能患病多日实在受不了了才会去医院,同时这个信息传达回疾控中心也需要时间,因此,通告新流感病例时往往会有一两周的延迟。而且,疾控中心每周只进行一次数据汇总。然而,对于一种飞速传播的疾病,信息滞后两周的后果将是致命的。这种滞后导致公共卫生机构在疫情爆发的关键时期反而无所适从。1.谷歌搜索与流感预测谷歌公司把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。他们通过分析人们的搜索记录来判断这些人是否患上了流感。其他公司也曾试图确定这些相关的词条,但是他们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术。更关键的是,他们建立的系统并不依赖于这样的语义理解。他们设立的这个系统唯一关注的就是特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数学模型。他们的预测与官方数据的相关性高达97%,并且及时判断出流感是从哪里传播出来的,不会像疾控中心一样要在流感爆发一两周之后才可以做到。1.谷歌搜索与流感预测
所以,2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。更惊人的是,谷歌公司甚至不需要分发口腔试纸和联系医生——它是建立在大数据的基础之上的。1.谷歌搜索与流感预测这是大数据时代所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。有巨大价值的产品和服务,或深刻的洞见。基于这样的技术理念和数据储备,下一次流感来袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。2.无所不包的谷歌翻译系统2006年,谷歌公司也开始涉足机器翻译。这被当作实现“收集全世界的数据资源,并让人人都可享受这些资源”这个目标的一个步骤。谷歌翻译开始利用一个更大更繁杂的数据库,也就是全球的互联网,而不再只利用两种语言之间的文本翻译。2.无所不包的谷歌翻译系统尽管其输入源很混乱,但较其他翻译系统而言,谷歌的翻译质量相对而言还是最好的,而且可翻译的内容更多。到2012年年中,谷歌数据库涵盖了60多种语言,甚至能够接受14种语言的语音输入,并有很流利的对等翻译。2.无所不包的谷歌翻译系统2006年,谷歌发布的上万亿的语料库,就是来自于互联网的一些废弃内容。这就是“训练集”,可以正确地推算出英语词汇搭配在一起的可能性。如今谷歌语料库则是一个质的突破,它使用庞大的数据库使得自然语言处理这一方向取得了飞跃式的发展。自然语言处理能力是语音识别系统和计算机翻译的基础。互联网上最火的网址都表明,它们欣赏不精确而不会假装精确。3.谷歌的数字图书馆虽然这是一个现代的、数字化的亚历山大图书馆,比历史上任何一个图书馆都要强大,但谷歌依然希望它能做得更多。谷歌知道,这些信息只有被数据化,它的巨大潜在价值才会被释放出来。因此谷歌使用了能识别数字图像的光学字符识别软件来识别文本的字、词、句和段落,如此一来,书页的数字化图像就转化成了数据化文本。3.谷歌的数字图书馆如今,不仅人类可以使用这些文本信息,计算机也可以处理和分析这些文本数据了。通过检索和查询,我们可以对它进行无穷无尽的文本分析。数据化的实现让抄袭学术作品的行为越来越无处藏身,因此,很多欧洲政客的抄袭行为被曝光,最终不得不引咎辞职。4.谷歌街景与GPS采集如今,GPS已经只是众多定位系统中的一种了。这些新系统通过对电塔和无线路由器的信号强度进行三角测量来定位地理位置,从而弥补了GPS无法在室内和高楼之间进行定位的缺陷。谷歌的街景车边拍照边收集无线路由器信息正是如此。4.谷歌街景与GPS采集除了人以外,谷歌也可以跟踪事物的地理位置信息。随着汽车装上了无线传感器,地理位置信息的数据化深刻变革了保险的概念。这些数据提供了关于时间、地点和实际行驶路程的详细信息,使保险公司能更好地为车险定价。4.谷歌街景与GPS采集通过汽车定位每个人的地理方位也改变了一些固定资产投入的模式,比方说公路和其他基础设施可以让使用这些资源的司机和其他人分担一部分投入。5.谷歌的拼写检查在过去的20多年中,微软为其Word软件开发出了一个强大的拼写检查程序,通过与频繁更的字典正确拼写相比较来对用户键入的字符流进行判断。字典囊括所有已知词汇,系统将拼写相似但字典中没有的词汇判断为拼写错误,并对其进行纠正。由于需要不断编译和更新字,微软Word的拼写检查仅适用于最常用的语言,且每年需要花费数百万美元的创建和维护费用。微软的拼写检查5.谷歌的拼写检查谷歌拥有世界上最完整的拼写检查器,基本上涵盖了世界上的每一种语言。这个系统一直在不断地完善和增加新的词汇,这是人们每天使用搜索引擎的附加结果。5.谷歌的拼写检查微软只看到了拼写检查作为文字处理这一个目的的价值,而谷歌却理解了其更深层次的价值。不仅利用错别字开发了世界上最好、最新式的拼写检查器来提高搜索质量,而且将其应用于许多其他服务中。大数据先锋:谷歌作为典型的大数据公司,谷歌自然知道收集信息并进行数据化的价值,因为这些数据有非常多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年济南货运从业资格证考试题技巧及答案
- 二零二五年度房屋买卖合同解除及装修补偿协议
- 2025年度智能贷款产品居间服务合同
- 现代化实训室设备配置全解析
- 2025年度货车司机雇佣合同车辆管理与责任协议
- 科技引领下的农村教育培训资源整合
- 二零二五年度脐橙广告代言合同书复合品牌形象版
- 系统化实验室管理提升工作效率的新途径
- 二零二五年度电力工程施工安全管理合同
- 2025年度化妆品销售返利激励合同
- 输变电工程监督检查标准化清单-质监站检查
- 【超星学习通】马克思主义基本原理(南开大学)尔雅章节测试网课答案
- 2024年中国工业涂料行业发展现状、市场前景、投资方向分析报告(智研咨询发布)
- 化工企业重大事故隐患判定标准培训考试卷(后附答案)
- 工伤赔偿授权委托书范例
- 食堂餐具炊具供货服务方案
- 2024化工园区危险品运输车辆停车场建设规范
- 自然科学基础(小学教育专业)全套教学课件
- 华为客服制度
- 医美面部抗衰老注射项目培训课件
- 工程与伦理课程
评论
0/150
提交评论