版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4.1数据分析概述数据分析内容概要数据分析的方法数据分析的工具数据导入与导出的方法(用Python)数据分析1.数据分析的必要性
从大量的数据中发掘有用的信息,揭示隐含其中的内在规律,指导科学的推断和决策,需要对纷繁复杂的数据进行分析。2.数据分析的概念数据分析是运用数据分析的工具和方法,根据研究的目的,对数据进行深层次挖掘和分析,找出内在的联系和变化,从而揭示事物的本质状态,预测事物的发展趋势。4.1.1数据分析的方法常见的数据分析方法从现状、原因和预测三大方面展开,数据分析目的不同,选用的分析方法也不一样。回归分析法时间序列决策树神经网络预测分析分组分析交叉分析杜邦分法结构分析聚类分析关联分析漏斗图分析矩阵关联分析原因分析对比分析法平均分析法综合评价分析法现状分析4.1.1数据分析的方法探究:以“中学生体质健康数据管理系统的数据分析”项目为例,请你利用上面的数据分析方法,从现状、原因和预测三个方面的数据分析。学生身体形态、身体机能、身体素质状况现状分析学校间,男、女生之间显著差异的原因原因分析预测学生个体和群体体质健康发展趋势预测分析4.1.2数据分析的工具数据分析软件的使用是必不可少的,数据分析的工具很多,根据分析数据层次结构的不同,常用的数据分析软件可分为四类。ACCESSMySQLSQLServerOracle数据存储层(数据库技术,理解SQL查询语言的基本结构和数据读取)CrystalReport水晶报表Tableau软件数据报表层(报表制作、报表分析及数据可视化)Excel软件SPSS软件SAS软件R语言Python语言数据分析层(统计分析和数据挖掘)VisioSmartDraw数据展现层(数据可视化)4.1.3数据导入与导出的必要性在进行数据分析前需要从数据库或者现有的数据文件中提取符合要求的数据。4.1.3数据导入的形式导入TXT文件:read_table(file,names=[列名1,列名2,…],sep=“”,…)导入CSV文件:read_csv(file,names=[列名1,列名2,…],sep=“”,…)参数说明:file为文件路径和文件名;names为列的名称,sep为分隔符,默认为空。TXT文件主要存储文本信息。一般用记事本打开和保存。CSV文件最早是使用在简单的数据库里,由于其格式简单,并具备很强的开放性,用来实现简单的数据存储。4.1.3数据导入的形式导入Excel文件:①read_excel(file,sheetname,header=0)
②ExcelFile(file).parse(sheetname)参数说明:file为文件路径和文件名;sheetname为表格的名称,如sheet1。Excel文件为Office里面的电子表格文件。探究活动1:数据的导入导入本地学习资源包“test4-1.xlsx”文件。4.1.3数据导入的形式导入MySQL库:read_sql(sql,con=数据库)参数说明:sql为需要执行的sql语句;con为连接数据库所需的engine,而engine需要在导入之前建立,包含数据库的用户名、密码、地址、端口号及数据库名称。MySQL库是一个关系型数据库管理系统。4.1.4数据导出的形式导出CSV文件:to_csv(file_path,sep=“,”,index=TRUE,header=TRUE)。导出Excel文件:to_excel(file_path,index=TRUE,header=TRUE)导出MySQL库:to_sql(tableName,con=数据库链接)参数说明:file_path为文件路径;sep为分隔符,默认为空;index,header默认为TRUE,导出索引和列名
。探究活动2:数据的导入与导出导入本地学习资源包“test4-1.xlsx”文件,尝试将“标准分”与“附加分”相加得到“总分”,生成Excel文件并保存。两种数据导入的对比除了语法外,没有什么特别的区别。从技术上讲,Excelfile是一个类,而read_excel是一个函数。使用ExcelFile.parse,你只需传递Excelfile对象。因此,excel工作表仅加载一次,就可以使用它来获取数据。而read_excel,传递路径不是Excelfile对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度二手住宅购买意向简单协议书6篇
- 二零二四年度房地产项目设计合同详细说明2篇
- 跌倒相关因素及护理进展
- 胃癌治疗现状和进展
- 2024年年度社团个人总结报告
- 护理职业安全防护
- 发绀的紧急护理
- 2024版专利申请与授权代理服务合同3篇
- 2024年度学生保险合同:特殊教育学校与保险公司的协议2篇
- 恶性腹水患者护理
- 1输变电工程施工质量验收统一表式(线路工程)-2024年版
- 2024年湖北省中考物理试卷(含解析)
- 大容量中高压直挂储能系统技术规范编制说明
- 建设工程施工保险协议书书
- 液压传动智慧树知到答案2024年武汉科技大学
- 猎聘-2024高校毕业生就业数据报告
- 6《观察与比较》教学设计-2024-2025学年科学一年级上册统编版
- 综合实践项目(一)制作细胞模型课件-2024-2025学年人教版七年级生物学上册
- 沪科版(2024)八年级全一册物理第一学期期末学业质量测试卷(含答案)
- 谁说职业教育没前途-中职开学第一课(奥运全红婵)-【中职专用】2024-2025学年中职主题班会课件
- 基础设施和公用事业特许经营管理办法修订及影响专题讲座课件
评论
0/150
提交评论