【python-NOJ-季总结】-【第八季:Pandas库】-表格Dataframe的建立和使用_第1页
【python-NOJ-季总结】-【第八季:Pandas库】-表格Dataframe的建立和使用_第2页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ython-NOJ-Pandas表格Dataframe的建和使本章内容写pandas库的表格dataframe的相关使。内容包括:表格的建(传参数和设置index),添加/列(append),表格的筛选,删除/列(drop),表格排序,数据透视(df.pivot),表格划分(groupby)等。1.建表格df=pd.DataFrame(data,columns,index)般创建形式如下:df=pd.DataFrame(data,columns=columns,index=index)三个参数,参数1data为建表格所需数据,维数组;参数2column为列名,维数组,当创建形式维字典创建时,不

2、需要列名参数,同时参数1是字典;参数3是索引,位数组,可有可,默认是0,1,2(1)建个空的框架:df=pd.DataFrame()Empty DataFrameColumns: Index: 此时没有传参数,建的是个空表格。(2)传个维列表:data=zhang,10,li,20,wang,15df=pd.DataFrame(data,columns=Name,Age)同时在后可以设置数据类型dtype=float,可以将表格中的数字数据动转换成浮点数。注意,此处定是维列表,或者字典。(3)字典创建:data= Name:zhang,li,wang,Age:10,20,30df=pd.Dat

3、aFrame(data)字典创建列名动带了字典键,键值为表格元素。(4)关于声明表头可以在创建表格时声明表头,当特定表头的元素不存在,填充为NaN。df1=pd.DataFrame(data,columns=a,b)df2=pd.DataFrame(data,columns=a,d)0 1 NaN1 3 NaN2.添加元素dfcolumn_name,df.loc,df.iloc,df.append分为添加和添加列。关于添加列,只需要dfcolumn_name=即可,默认添加到最后列;当想添加到指定的位置时,采df.insert()法;关于添加,有三种法。先df.iloc=,参数为数字,会被覆盖

4、;其次df.loc,参数为索引名Index,根据索引名添加;最后df.append(),将两个表格合成个。添加列:(1)添加到最后列df1score=80,98,67,90(2)具体插某列到位置:df.insert(iloc,column,value)三个参数,插位置,列名,插值列表:df1.insert(2,birth,1995-07-01,1998-09-04,1993-11-03,1994-04-17)(3)添加:df.ilocindexindex是整数,表添加到第,原数据会被覆盖,且不能超过len(dataframe);first 6 7second 3 4(4)df.loc法根据索引

5、添加,此时添加的数值使给定的索引。当添加的索引值已经存在时,更改;不存在时,添加到最后。般这种法,表格的索引都是定义的。data=a:1,b:2,a:3,b:4df1=pd.DataFrame(data,columns=a,b)df1.loc3=6,70 1 21 3 43 6 7(5):添加到最后这是需要创建两个表格,然后拼接成个。需要注意参数ignore_index,默认保留原索引,改为True时表重新排序索引。般插个新的项时,采简单法构建个新的表格,然后append到标表格去。data=1,2,3,4df1=pd.DataFrame(data,columns=a,b)data=5,6,7

6、,8df2=pd.DataFrame(data,columns=a,b)df=df1.append(df2,ignore_index=True)输出:a b0 1 21 3 42 5 63 7 83.不同dataframe的拼接法df1.merge(df2,on,how)df=df1.merge(df2, on=合并的列名 , how=outer)how表内连接(inner)或者外连接(outer):内连接表保留共有元素,外连接表保留所有元素,没有值的进NaN填充;同时,合并列名也可以选择多个。df1=pd.DataFrame(data1,columns=Name,Sex,Age)df2=pd

7、.DataFrame(data2,columns=Name,Weights,Heights)df_merge=df1.merge(df2,on=Name,how=outer)df_merge2=df1.merge(df2,on=Name,how=inner)311001471122561 qian female1总结博客见:4.更改dataframe中的值和df.ilocindex,column三种法,df.iloc,根据索引位置来查找,参数都为整数,表列,等价于df.iat;df.loc,参数为index名和column名,等价于df.at;5.dataframe按照某列排序df.sort_

8、values(by,inplace,ascending)格式为:df.sort_values(by=A,inplace=True, ascending=True),参数1表按哪个列进排序,会在原dataframe上进修改df.sort_values(by=A,inplace=True, ascending=True)1 0 92 4 81 6 30 7 50 8 56.取指定范围内的值末,列列末,df.iloc有loc法和iloc法。loc法通过index和column来取,不能通过数字,iloc法通过数字索引来去,不能使索引名。同时需要注意,iloc法按照数字来取时,不包含最后个元素。112male 7511147.08.删除指定9.使groupby对表格进划分(1)#df1=dfSales.groupby(dfGroup).sum()print(df1)df1=dfSales.groupby(dfMon).sum()print(df1)10.数据透视表格df.pivot(index=Mon,columns=Part,values=Num)681 3 5 7 911 13 15 17 19122 4 6 8 1012 14 16 18 2011.添加的平均值dfM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论