Python数据分析与可视化-课件_第1页
Python数据分析与可视化-课件_第2页
Python数据分析与可视化-课件_第3页
Python数据分析与可视化-课件_第4页
Python数据分析与可视化-课件_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析理论与Python实战第一章数据分析是什么目录海量数据背后蕴藏的知识数据分析与数据挖掘的关系机器学习与数据分析的关系数据分析的基本步骤Python和数据分析海量数据背后蕴藏的知识数据蕴含了大量知识规律可用于解释当前发生的事情预测未来的情况对象数据观察现象归纳总结规律海量数据背后蕴藏的知识数据分析的意义各行各业每天都在产生和收集大量数据2012年的微博日发量:4亿条Twitter的信息量每年翻番增长需要从海量数据中获得有价值的信息辅助决策了解客户偏好,设计受欢迎的产品制定合适价格,确保利润同时保证市场了解市场需求,调整生产计划数据分析与数据挖掘的关系统计分析的含义在已定假设、先验约束上,对数据进行整理、筛选和加工,并得到信息的过程数据挖掘的含义在数据分析得到信息的基础上进一步获得认知,转为有效的预测和决策数据分析=统计分析+数据挖掘统计分析:数据预处理阶段数据挖掘:知识发现阶段数据信息统计分析数据挖掘知识机器学习与数据分析的关系机器学习的含义利用经验来改善计算机系统自身的性能数据分析的含义识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,即从海量数据中找到有用的知识两者之间的关系“经验”在计算机系统中主要以数据形式存在,因此机器学习需要对数据进行分析数据分析过程主要利用机器学习界提供的技术来分析海量数据数据分析的基本步骤数据收集数据预处理数据分析与知识发现数据后处理数据分析的基本步骤数据收集大数据时代的数据收集过程,得到的数据特点是大量、冗余、体量大但是信息量少如何从这样的数据中提取出信息的过程是目前数据分析的重点和难点数据分析的基本步骤数据预处理将数据转化为信息主要步骤包括对数据进行初步的统计方面的分析,得到数据的基本档案从数据的一致性、完整性、准确性以及及时性四个方面进行数据质量分析根据发现的数据质量的问题对数据进行清洗,包括缺失值处理、噪声处理等对其进行特征抽取为后续的数据分析工作做准备数据分析的基本步骤数据分析与知识发现将预处理后的数据进行进一步的分析,完成信息到认知的过程方法分类有监督学习:分类分析、关联分析、回归分析无监督学习:聚类分析、异常检测数据后处理主要包括提供数据给决策支撑系统、进行数据可视化等方面Python和数据分析专用于实验性数据分析或者领域特定语言包括R语言MatlabSasSpssPython和数据分析Python语言相比上述语言的优势在于Python是面向生产的大部分数据分析过程需要首先进行实验性研究和原型构建,再移植到生产系统中Python适用于原型构建,且能够直接将分析程序运用到生产系统中上述语言无法直接用于生产,需要使用C/C++等语言对算法再次进行实现Python和数据分析Python语言相比上述语言的优势在于拥有强大的第三方库支持Python的强大功能依赖于第三方库实现常用数据分析库包括Numpy、Scipy、Pandas、Scikit-learn、Matplotlib等Python的胶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论