数据与大数据教学课件-1_第1页
数据与大数据教学课件-1_第2页
数据与大数据教学课件-1_第3页
数据与大数据教学课件-1_第4页
数据与大数据教学课件-1_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

情境引入基于历史数据,利用数据建模定量分析不同球员特点,合理搭配,重新组队;打破传统思维,通过分析比赛数据,寻找“性价比”最高球员,运用数据取得成功;布拉德•皮特主演的《点球成金》是一部美国奥斯卡获奖影片,所讲述的是皮特扮演的棒球队总经理利用计算机数据分析,对球队进行了翻天覆地的改造,让一家不起眼的小球队能够取得巨大的成功。情境引入互联网、移动网络、物联网等每天都产生着大量数据,这些数据规模巨大、格式多样,已经很难用传统的方式进行处理。于是,大数据技术应运而生,通过分析、挖掘这些数据,发现其蕴藏的价值。情境引入引用资源中的附件3:智慧校园解决方案视频讨论交流话题:

天气预报越来越准确了,准确率可以达100%吗?从天气预报的发展、设备、技术、数据方面进行描述知识讲解什么是大数据?了解数据的采集和来源有哪些?数据的方式有哪些?是不是数据量大就是大数据?引用资源中的附件4:《3分钟让你认识什么是大数据》视频知识讲解什么是大数据?其实很简单,大数据其实就是海量资料巨量资料,这些巨量资料来源于世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。知识讲解大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。数量(volume):TB\PB\EB\ZB仅供开采162年仅供开采45年仅供开采60年不可再生资源VS数据过去3年数据总量比以往4万年还多2013年,10分钟的信息总量将达1.8ZB2010年全球数据总量1.2ZB,年增长50%数据不再是社会生产的“副产物”,而是可被二次乃至多次加工的原料,从中可以探索更大价值,它变成了生产资料。问题思考大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。1Byte1KB1MB1GB1TB1PB1EB1ZB1YB1PB相当于50%的全美学术研究图书馆藏书信息内容5EB相当于至今全世界人类所讲过的话语1ZB如同全世界海滩上的沙子数量总和1YB相当于7000位人类体内的微细胞总和一般情况下,大数据是以PB、EB、ZB为单位进行计量的问题1:现在为什么现在闯红灯等违规行为越来越少了?问题2:请你估算一下一天产生的数据量有多少?知识讲解大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。速度(Velocity):数据产生的速度快,数据处理的速度快知识讲解大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。多样(Variety):人工产生的,机器自动产生知识讲解大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。多样(Variety):人工产生的,机器自动产生行业/企业内数据互联网数据物联网数据大数据数据来源多企业内部多个应用系统的数据、互联网和物联网的兴起,带来了微博、社交网站、传感器等多种来源。数据类型多保存在关系数据库中的结构化数据只占少数,70~80%的数据是如图片、音频、视频、模型、连接信息、文档等非结构化和半结构化数据。关联性强数据之间频繁交互,比如游客在旅行途中上传的图片和日志,就与游客的位置、行程等信息有了很强的关联性。知识讲解大数据的特征:4V,数量(volume)、速度(Velocity)、多样(Variety)和价值(Value)。价值(Value):价值密度低,大量的视频记录下来,有许多冗余挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息;价值密度低,是大数据的一个典型特征;大数据不仅仅是技术,关键是产生价值可以从各个层面进行优化,更要考虑整体讨论交流女性,尤其当今女大学生是人力资源中不可缺少的组成部分.职场中女性面临着调和家庭与事业两方面矛盾的问题.就女大学生职业生涯规划的内容而言,主要集中在三方面:现代女性职业发展的困境;女大学生的职业定位与外界影响;如何促进女大学生职业生涯的发展问题。想要设计一个性别对女大学生职业生涯规划影响的调查研究,具体怎么做?知识讲解更好不是因果关系而是相关关系更多不是随机样本而是全部数据更杂不是精确性而是混杂性大数据的思维变革知识讲解大数据的思维变革人口大普查全数据模式随机采样样本模式大数据应用全数据模式是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记;主要特点是调查组织高度集中性,普查对象的全面完整性;人口大普查耗时耗费,一般来讲是十年一次,新中国成立以来共进行了6次人口大普查;人口大普查是一种典型的全数据模式;大数据时代小数据时代知识讲解大数据的思维变革人口大普查全数据模式随机采样样本模式大数据应用全数据模式人口大普查是一种耗时耗费的工程,一般是以十年为单位;各国每年需要进行几百次的小规模人口调查,采取随机采样分析的方式,这是一种样本模式;源于实用并且很好的创新!随机采样分析是小数据时代的产物;大数据时代小数据时代知识讲解大数据的思维变革人口大普查全数据模式随机采样样本模式大数据应用全数据模式我们已具备了大数据的各种技术能力,思维需要转换到大数据的全数据模式:样本=全部;大数据不用随机分析法这样的捷径,而采用所有数据的方法;这里的“大”是相对的——相扑比赛所有数据存储还不需要一个TB,但是是所有的数据!在大数据时代采用随机采样法,就像在汽车时代骑马一样,虽然特定情况下仍可采样随机采样法,但是慢慢地我们会放弃它;大数据时代小数据时代案例分析出行大数据绘制的“城市星云图”是这样的!案例分析出行大数据绘制的“城市星云图”是这样的!案例分析阿里钉钉大数据案例分析引用资源中的附件5:如何在大数据里掘金?视频讨论交流马云说数据重要、李彦宏说算法重要、马化腾说场景重要,大家说的矛盾吗?你是怎么理解的?大数据给社会带来了哪些影响?引用资源中的附件6:马化腾专

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论