数据分析应用项目化教程(Python) 课件 任务6.3 数据重塑透视_第1页
数据分析应用项目化教程(Python) 课件 任务6.3 数据重塑透视_第2页
数据分析应用项目化教程(Python) 课件 任务6.3 数据重塑透视_第3页
数据分析应用项目化教程(Python) 课件 任务6.3 数据重塑透视_第4页
数据分析应用项目化教程(Python) 课件 任务6.3 数据重塑透视_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章使用pandas进行数据清洗和整理

任务6.3数据重塑数据重塑pivotpivot_tablestack、unstack数据重塑数据重塑:将列式数据变成二维交叉形式,便于分析,叫做数据重塑或数据透视。数据重塑理解:数据的重塑简单说就是对原数据进行变形。对数据的重塑不是仅改变形状那么简单,在变形过程中,数据的内在数据意义不能变化,但数据的提示逻辑则发生了重大的改变。pivotPivot:将原始DataFrame重塑,返回一个新的DataFrame。代码含义:唯一化处理foo列值最为index,以bar列中的值A、B和C来作为列名,展示DataFrame中baz列数据。pivot语法:df.pivot(index=None,columns=None,values=None),指定index、columns、values实现二维透视。index:指定一个或多个列的值作为新DataFrame的index,会自动唯一化处理,注意其最终值不可以重复,否则报错(可选,若不填则使用现有index)columns:指定一个或多个列的值作为新DataFrame的列values:指定一个或多列的值作为新DataFrame的值(可选,若不填则使用所有剩余列,并且结果将具有按层次结构索引的列)pivot_tablepivot_table:用pivot只能对数据进行变形整理,有时还需要做聚合分析。pivot_table功能比pivot/groupby函数更为完善,除了可以处理重复值,关键在于引入了多层索引。piovt_table制表完成之后返回的是DataFrame,非常方便下一步使用,比如基于pandas画图。类似Excel的高级数据透视功能。#字典传入多列的汇总#aggfun指定汇总的处理方式,默认是求均值#列表传入多种汇总方式table=pd.pivot_table(df,index=['A','C'],values=['D','E'],aggfunc={'D':np.mean,'E':[np.min,np.max,np.mean]})tablepivot_table画条形图barchart:分类汇总可以很好地展示数据,pivot_table函数也可以,因其返回的是一个多层索引的DataFrame。table.plot.bar(y=['D','E'],rot=45,figsize=(16,10),fontsize=(20))stack、unstackstack:将dataframe中的列旋转为行,默认将最内层(level=-1)列索引旋转变成最内层行索引。unstack:将dataframe中行旋转为列,默认将最内层(level=-1)的行索引旋转变成最内存列索引。stack和unstack默认旋转轴的级别为最低级别(即最内层,level=-1)stack、unstackDataFrame.stack(level=-1,dropna=True),将column变成index。level=-1代表多层索引的最内层,可以通过level指定哪一层(或列表表达的哪若干层)的列索引旋转成行索引。df2.stack()==df2.stack(0),这里df2的列索引只有一层,所以最内层就是level==0df2.stack()==df2.stack(-1)stack、unstackDataFrame.unstack(level=-1,fill_value=None),将index变成columnstacked.unstack()==stacked.unstack(2),stacked的行索引有3层,最内层level=2stacked.unstack()==stacked.unstack(-1)stack、unstack请注意,stack和unstack方法隐式地对涉及的索引进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论