认识大数据 课件 【知识精讲+备课精研】 粤教版(2019)高中信息技术必修1_第1页
认识大数据 课件 【知识精讲+备课精研】 粤教版(2019)高中信息技术必修1_第2页
认识大数据 课件 【知识精讲+备课精研】 粤教版(2019)高中信息技术必修1_第3页
认识大数据 课件 【知识精讲+备课精研】 粤教版(2019)高中信息技术必修1_第4页
认识大数据 课件 【知识精讲+备课精研】 粤教版(2019)高中信息技术必修1_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据处理和可视化表达5.1认识大数据大数据什么是大数据?

大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的信息集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据大数据都有哪些特征?角度特征互联网产生大数据大量(Volume)、多样(Variety)低价值密度(Value)、高速(Velocity)互联网思维样本渐趋于总体、精确让位于模糊、相关性重于因果大数据存储与计算存储在互联网不同的服务器与客户端分布式并行计算大数据讨论大数据对日常生活的影响?正面影响负面影响1.方便支付2.方便出行3.方便看病与诊病1.个人信息泄露2.信息伤害与诈骗大数据讨论如何避免大数据带来的负面影响?信息泄露方面信息伤害与诈骗方面1.避免使用不熟悉的网络上网2.不使用信用卡刷卡消费3.保管好手机等电子设备……1.要判断手机收到陌生信息的真伪2.接到关于钱财方面的电话,要多方查证……5.2数据的采集听说过“网络爬虫”嘛?学习“爬虫”有什么用呢?HTML标记语言

网络爬虫从一个或若干个初始网页URL(统一资源定位符)开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面抽取新的URL放入队列,直到满足系统的一定停止条件。网页1网页2网页3网页4URL1URL2URL3URL4网页5URL5网页6URL6Hash表数据采集采集方法采集工具应用范围(举例)系统日志采集法系统导出导出上网行为管理系统日志网络数据采集法1.爬虫程序2.系统导出3.接口程序爬取网站数据其他数据采集法系统接口生产和业务数据或学术研究数据(高保密性要求)数据采集http://DNS服务器WEB服务器域名:URL(统一资源定位器):域名:IP地址:74请求页面:74/index.htmlHTML标记文档网页:活动1:修改“百度一下”HTML标记语言HTML的英文全称是HyperTextMarkedLanguage,即超文本标记语言。

用HTML编写的超文本文档称为HTML文档,它能独立于各种操作系统平台(如UNIX,Windows等)。

使用HTML语言,将所需要表达的信息按某种规则写成HTML文件,通过专用的浏览器来识别,并将这些HTML文件“翻译”成可以识别的信息,即现在所见到的网页。HTML标记语言标签HTML称为超文本标记语言,是一种标识性的语言。它包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。

HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、动画、声音、表格、链接等。HTML标记语言标签<标记>内容</标记>标记和被标记的内容构建出HTML文档htmlheadmetatitlescriptlinkbodydivd

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论