2023学年完整公开课版索引操作_第1页
2023学年完整公开课版索引操作_第2页
2023学年完整公开课版索引操作_第3页
2023学年完整公开课版索引操作_第4页
2023学年完整公开课版索引操作_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

索引操作教师:亢华爱北京信息职业技术学院商务数据分析与应用专业教学资源库目录ContentsDataFrame的索引操作Series的索引操作1PARTSeries的索引操作Series的索引操作Series有关索引的用法类似于NumPy数组的索引,只不过Series的索引值不只是整数。如果我们希望获取某个数据,既可以通过索引的位置来获取,也可以使用索引名称来获取。示例代码如下:(1)创建索引对象importpandasaspdser_obj=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])(2)使用索引位置获取数据ser_obj[2](3)使用索引名称获取数据ser_obj['c']Series的索引操作当然,Series也可以使用切片来获取数据。不过,如果使用的是位置索引进行切片,则切片结果和list切片类似,即包含起始位置但不包含结束位置;如果使用索引名称进行切片,则切片结果是包含结束位置的,示例代码如下。(1)使用位置索引进行切片ser_obj[2,4](2)使用索引名称进行切片ser_obj['c','e']Series的索引操作如果希望获取的是不连续的数据,则可以通过不连续索引来实现,具体示例代码如下。(1)通过不连续位置索引获取数据集:ser_obj[[0,2,4]](2)通过不连续索引名称获取数据集:ser_obj[['a','c','d']]Series的索引操作布尔型索引同样适用于Pandas,具体的用法跟数组的用法一样,将布尔型的数组索引作为布尔型索引同样适用于Pandas,具体的用法跟数组的用法一样,将布尔型的数组索引作为模板筛选数据,返回与模板中True位置对应的元素,具体代码如下。(1)创建布尔型Series对象ser_bool=ser_obj>2ser_bool(2)获取结果为True的数据ser_obj[ser_bool]2PARTDataFrame的索引操作DataFrame的索引操作

DataFrame结构既包含行索引,也包含列索引。其中,行索引是通过index属性进行获取的,列索引是通过columns属性进行获取的,索引的结构如图所示。通过图1可以看出,DataFrame中每列的数据都是一个Series对象。DataFrame的索引操作

我们可以使用列索引进行获取。例如,创建一个3行4列的DataFrame对象,并获取其中的1列数据,具体代码如下。(1)创建DataFrame对象,并为其指定列索:arr=np.arange(12).reshape(3,4)df_obj=pd.DataFrame(arr,columns=['a','b','c','d'])df_obj(2)获取b列的数据:df_obj['b']DataFrame的索引操作

如果要从DataFrame中获取多个不连续的Series对象,则同样可以使用不连续索引进行实现,具体示例代码如下。(1)获取不连续的Series对象:df_obj[['b','d']](2)使用切片获取第0~1行的数据:df_obj[:2](3)使用多个切片先通过行索引获取第0~2行的数据,再通过不连续列索引获取第b、d列的数据:df_obj[:3][['b','d']]DataFrame的索引操作

虽然DataFrame操作索引能够满足基本数据查看请求,但是仍然不够灵活。为此,Pandas库中提供了操作索引的方法来访问数据,具体包括:loc:基于标签索引(索引名称,如a、b等),用于按标签选取数据。当执行切片操作时,既包含起始索引,也包含结束索引。loc:基于位置索引(整数索引,从0到length-1),用于按位置选取数据。当执行切片操作时,只包含起始索引,不包含结束索引。

iloc方法主要使用整数来索引数据,而不能使用字符标签来索引数据。而loc方法恰恰相反,它只能使用字符标签来索引数据,而不能使用整数来索引数据。不过,当DataFrame对象的行索引或列索引使用的是整数时,则其就可以使用整数来索引。DataFrame的索引操作假设,现在有一个DataFrame对象,具体代码如下。arr=np.arange(16).reshape(4,4)dataframe_obj=pd・DataFrame(arr,columns=['a','b','c','d'])dataframe_objDataFrame的索引操作接下来,我们通过一段示例程序来演示如何使用上述方法来获取DataFrame中多列的数据,具体代码如下:(1)dataframe_obj.loc[:,[“c”,“a"]](2)dataframe_obj.iloc[:,[2,0]]他们两个输出结果一样DataFrame的索引操作还可以通过loc方法和iloc方法使用花式索引来访问数据,具体代码如下。dataframe_obj.loc[1:2,['b','c']]dataframe_obj.i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论