《机器学习从入门到精通》课件-第3章数据分析的基础_第1页
《机器学习从入门到精通》课件-第3章数据分析的基础_第2页
《机器学习从入门到精通》课件-第3章数据分析的基础_第3页
《机器学习从入门到精通》课件-第3章数据分析的基础_第4页
《机器学习从入门到精通》课件-第3章数据分析的基础_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章

数据分析的基础3.1认识Numpy和Pandas3.2Numpy的基本使用3.3Pandas的基本使用3.1认识Numpy和PandasNumpy(NumericalPython)提供了python对多维数组对象的支持:ndarray,具有矢量运算能力,快速、节省空间。Numpy支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Pandas(PythonDataAnalysisLibrary)是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量的数据分析函数库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。除此以外,Pandas还提供了大量能使快速便捷地处理数据的函数和方法,使得Python成为强大而高效的数据分析环境的重要因素之一。3.2Numpy的基本使用3.2.1创建ndarray数组ndarray数组是一个N维数组对象(矩阵),它里面设置的所有元素必须是相同的类型。现在通过如下的代码,先来尝试的创建一个ndarray数组。importnumpyasnp

x=np.array([1,2,3,4])

print(x)print(type(x))3.2Numpy的基本使用如果设定的值为不相同类型,那么会统一按照其某一种类型进行统一。importnumpyasnpy=np.array([[1,2.,3],[4,5,6]])print(y)print(type(y))类型类型代码说明int8、uint8i1、u1有符号和无符号的8bit(1个字节)整型int16、uint16i2、u2有符号和无符号的16位(2个字节)整型int32、uint32i4、u4有符号和无符号的32位(4个字节)整型int64、uint64i8、u8有符号和无符号的64位(8个字节)整型float16f2半精度浮点数float32f4/f标准的单精度浮点数float64f8/d标准的双精度浮点数。float128f16/g扩展精度浮点数complex64、complex128、complex256c8、c16、c32分别用2个32位、64位或128位浮点数表示的复数bool?存储True和False值得布尔类型objectOPython对象类型string_S固定长度的字符串类型(每个字符1个字节)unicode_U固定长度的unicode类型(字节数由平台决定)3.2Numpy的基本使用3.2Numpy的基本使用3.2.2运用ndarray数组ndarray数组是一个多维的数组,多维数组中的维度称之为“轴”(axis),想要了解一个新的数据参数它是多少维度,可以通过ndim属性来进行访问。而shape属性是可以用来访问多少维度以及每一个维度所对应的它的长度。1、ndarray的算术运算2、ndarray的切片3.2Numpy的基本使用1、ndarray的算术运算ndarray数组使用非常的灵活,它不需要使用循环就可以对列表里的元素执行算术运算,语法和对标量元素的操作一样。3.2Numpy的基本使用2、ndarray的切片切片(slice)是指从数据的位置中找出符合对应位置的数据出来。在进行切片时,通常需要为数组的每个维度指定一个切片位置,每个维度之间用逗号分割,如果没有逗号,表示只在第一维上进行切片。3.3Pandas的基本使用3.3.1Series数据结构1、创建Series数据结构

在Pandas中的Series数据结构是一个像数组一样的一维对象,可以存储很多类型的数据。3.3Pandas的基本使用2、访问Series的元素

Series可以同时使用下标和标签两种方式进行访问。3.3Pandas的基本使用3.3.2DataFrame数据结构1、DataFrame数据结构的创建

Series对象的index数组存放有每一个元素的标签,而DataFrame对象则有所不同,它有两个索引数组,第一个数组与行相关,它与Series的索引数组极为相似。每个标签与标签所在行的所有元素相关联。而第二个数组包含一系列列标签,每个标签与一列数据相关联。3.3Pandas的基本使用2、DataFrame数据结构的创建

访问DataFrame,需要先使用列的名称,如图3-2所示通过名字、成绩和ID,得到该列对应的Series对象,然后使用下标或者标签访问Series中的元素。3.3Pandas的基本使用3、Data

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论