版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
走进数据分析第一课时第5单元5.1学习目标★了解数据分析的几种常用方法。★体验对比分析和平均分析的—般分析过程。★了解大数据的含义,认识大数据分析在信息社会的重要作用。5.1走进数据分析随着我国经济的快速发展和城市化进程的加快,城市人口和机动车辆日益增多,城市交通拥堵现象日益严重。科学地发展和管理公共交通是解决问题的有效途径之一。如何合理安排公交车辆的发车频率,方便乘车人选择交通线路等,都可以通过数据分析来实现。本节我们将围绕“感受智能公交”项目展开学习。活动1
分析公交高峰期某同学每天7:00乘坐27路车去学校,17:00左右放学回家。他觉得每天往返途中,公交车上并不拥挤。而妈妈每天8:00乘坐49路车出发,18:00下班。她总是抱怨乘车者太多。请尝试进行数据分析。时间段时间段该路公交6:00-7:004513:00-14:00587:00-8:0012014:00-15:00568:00-9:0016015:00-16:00589:00-10:0014316:00-17:007010:00-11:005317:00-18:0012011:00-12:007218:00-19:0012112:00-13:005919:00-20:0065可能的原因1:该同学往返时段客流量较少,而妈妈往返时段客流量大。可能的原因2:该同学往返时段所乘公交与妈妈不同。时间段21路54路时间段21路54路6:00-7:00456113:00-14:00581007:00-8:0012017014:00-15:0056968:00-9:0016021115:00-16:0058989:00-10:0014314916:00-17:007010210:00-11:005312217:00-18:0012012511:00-12:00729918:00-19:0012112312:00-13:00596519:00-20:006557数据分析的方法数据分析主要用于现状分析、原因分析和预测分析。进行数据分析时,首先要根据分析的目标提出假设,然后选择恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。数据分析的方法有很多,如对比分析和平均分析。提出假设进行分析验证假设得出结论对比分析对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物的发展变化悄况和规律。横向对比是在类似的或同类的事物之间进行比较。纵向对比是将相同事物的不同时期进行比较。平均分析平均分析是指运用计算平均值的方法反映总体在一定时间、地点条件下某一数量特征的一般水平。平均分析和对比分析常结合使用,例如比较不同线路的平均客流量。数据可视化表达以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。图表是最常用的数据可视化表达方式之一。基本图表类型,如柱状图、饼图和折线图等,利用一般的表格加工软件即可绘制。如需创建表现形式更为丰富或者具有互动功能的图表,则必须借助专业性工具。活动2
完成分析报告数据分析报告是对整个数据分析过程的一个总结与呈现。请通过数据分析报告,将活动1中所做数据分析的起因、过程、结果及建议完整地呈现出来。数据分析报告数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。通过报告不仅把数据分析的起因、过程、结果及建议完整地展现出来,还可以为决策者提供科学、严谨的决策依据。在数据分析报告中,首先要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的思路、方法和模型;最后要重点呈现数据分析的过程、结论和建议。活动1
我在哪里假如来到一个陌生的地方,需要知道自己所处的具体位置,手机里的地图软件可以很方便地帮助你定位、计算并推荐去目的地的路线。打开地图软件,屏幕上的蓝色标记就是使用者所处的位置很多地图软件还提供了“全景”模式。选择“查看全景”可以展示实地拍摄的“全景”照片,如图所示。在照片上滑动手指,可以多角度查看场景。点击移动方向箭头,场景则根据位置改变。让我们估算一下全景模式下照片数据的“体量”。根据全景照片的拍摄规则,一个拍摄点需要多角度拍摄数张照片进行拼接。如果一个拍摄点需要拍摄8张照片,每张照片的大小约为4MB,1个拍摄点的照片数据量是多少?考虑到地图的连续性,如果相邻拍摄点间隔为16米,那么一条长1千米的街道需要多少张照片?数据量是多少?如果是一个城市呢?一个拍摄点需要拍摄8张照片每张照片的大小约为4MB8x4=32(MB)每16米有一个景点1000÷16≈62(个)62x32=1984(MB)想一想,一个城市有多少个街道?大数据大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据的“大”是一个相对概念,没有具体标准,如果一定要定一个标准,那么10TB~100TB通常称为大数据的门槛。实际应用中,很多企业级用户把多个数据集放在一起,已经形成了PB级的数据量。而且随着数据来源的多样化,数据的类型也更加复杂,如网络日志、音频、视频、图片和地理位置信息等。大数据的意义在于,我们有可能从如此庞杂的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。活动2
公交车距离我多远在地图软件中输入起点和终点,点击搜索按钮就可以获得所需的公交方案。但是在公交站台等车,久等不来总令人焦急。实时公交信息查询软件则可以实时反馈公交车辆的运行信息,提升乘客的出行效率,如图所示。大数据分析的应用面对海量的数据,为了搜索、处理、分析、归纳和总结其深层次的规律,大数据分析应运而生。大数据分析是指对规模巨大的数据进行分析。它的应用日益丰富,例如实时公交系统根据用户当前位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。用户和车辆的位置信息通常通过卫星定位系统、Wi-Fi热点和基站的位置确定。感受大数据分析在支持实时公交方面的应用。序号体验并思考的内容结果1查看该软件为用户提供了哪些实用功能。2如果有条件,乘公交车出行时使用该软件,并回答以下问题:CD它所提供的公交车运行信息是否及时、准确?@它是否可以提供多种出行方案?3定位公交车位置信息需要哪些技术?它们各有什么优缺点?大数据分析带来价值的同时,也在隐私保护、安全问题等方面带“来危机。因此,合理、健康地使用大数据,遵循数据道德”是我们的必备品质。巩固提升1.数据分析的过程不包括()A.首先要根据分析的目标提出假设B.然后选择恰当的分析方法进行分析C.验证假设是否正确D.根据分析直接得出相应的结论巩固提升2.要直观地展示某同学高二学年连续几次考试成绩的变化的情况﹐最合适的图表类型是(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆人文科技学院《设计应用文写作》2022-2023学年第一学期期末试卷
- PHP程序猿岗位职责
- 茶叶厂厂长奖惩方案
- 茶叶加工问题研究报告
- 2021一级造价工程师《土建工程》考点习题及答案
- 茶具国外发展状况研究报告
- 肠道准备护理研究报告
- 策划服务分包方案
- 白银聚脲地坪施工方案
- 白城管道铁皮保温施工方案
- GB/T 13522-2008骨质瓷器
- 方太销售及市场营销管理现状
- Module9 Unit 2 课件-外研版八年级英语上册
- 蔬菜栽培的季节与茬口安排-陇东学院教学提纲
- 三年级《稻草人》阅读测试试题附答案
- 《新闻学概论》第十章
- 超材料(metamaterials)教学讲解课件
- 矿山生态修复主要技术措施表
- 基于PLC的自动化生产线的毕业设计
- 妊娠合并心脏病诊治专家共识
- 初三第一次家长会课件
评论
0/150
提交评论