常见的数据分析工具_第1页
常见的数据分析工具_第2页
常见的数据分析工具_第3页
常见的数据分析工具_第4页
常见的数据分析工具_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常见的数据分析工具教师:亢华爱北京信息职业技术学院商务数据分析与应用专业教学资源库数据收集

Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力。我们课程用到的库包括NumPy、Pandas、Matplotlib、Seaborn.NLTK等,本节课程我们将针对相关库做一个简单的介绍,方便后面章节的学习。目录Seaborn库ContentsMatplotlib库Pandas库NumPy库NLTK库1PARTNumPy库NumPy库NumPy是Python开源的数值计算扩展工具,它提供了Python对多维数组的支持,能够支持高级的维度数组与矩阵运算。此外,针对数组运算也提供了大量的数学函数库。NumPy是大部分Python科学计算的基础。NumPy库具有以下功能:(4)矩阵运算。无需循环即可完成类似Matlah中的矢量运算。(5)线性代数、随机数生成以及傅里叶变换功能。(1)快速高效的多维数据对象ndarray。(2)高性能科学计算和数据分析的基础包。(3)多维数组(矩阵)具有矢量运算能力,快速且节省空间。NumPy库在调用NumPy库之前,先确保安装了NumPy库(该内容在1.6.3中有相关介绍)NumPy库安装了Numpy之后,可以用Numpy简单创建数组:importnumpyasnpa=[1,2,3]b=np.array(a)c=np.array([[0,1,2,10],[12,13,100,101],[102,110,112,113]],int)print(c)print(b)2PARTPandas库Pandas库Pandas是一个基于NumPy的数据分析包,它是为了解决数据分析任务而创建的。Pandas中纳入了大量库和标准的数据模型,提供了高效地操作大型数据集所需要的函数和方法,使用户能快速便捷地处理数据。Python与Pandas在各种学术和商业领域中都有应用,包括金融、神经科学、经济学、统计学、广告、网络分析等。Pandas库Pandas库的功能:(4)基于标签切片和花式索引获取数据集的子集。(5)可以删除或插入来自数据结构的列。(1)一个快速高效的DataFrame对象,具有默认和自定义的索引。(2)用于在数据结构和不同文件格式中读取和写入数据,如word、Excel及SQLite数据库。(3)智能数据对齐和缺失数据的集成处理。(6)按数据分组进行聚合和转换。(7)高性能的数据合并和连接。(8)时间序列功能。Pandas库安装了Pandas之后,可以用Pandas简单创建数组:importpandasaspdser_obj=pd.Series([1,2,3,4,5])ser_obj3PARTMatplotlib库Matplotlib库Matplotlib是一个用在Python中绘制数组的2D图形库,虽然它起源于模仿Matlab图形命令,但它独立于Matlab,可以通过Pythonic和面向对象的方式使用,是Python中最出色的绘图库。Matplotlib主要用纯Python语言进行编写,但它大量使用NumPy和其他扩展代码,即使对大型数组也能提供良好的性能。4PARTSeaborn库Seaborn库Seaborn是Python中基于Matplotlib的数据可视化工具,它提供了很多高层封装的函数,帮助数据分析人员快速绘制美观的数据图形,从而避免了许多额外的参数配置问题。5PARTNLTK库NLTK库NLTK被称为“使用Python进行教学和计算语言学工作的绝佳工具”,以及“用自然语言进行游戏的神奇图书馆”。NLTK是一个领先的平台,用于构建使用人类语言数据的Python程序,它为超过50个语料库和词汇资源(如WordNet)提供了易于使用的接口,还提供了一套文本处理库,用于分类、标记化、词干化、解析和语义推理、NLP库的包装器和一个活跃的讨论论坛。参考文献[1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论