版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据多维化主要内容数据拆分轴向介绍拆分数据数据拼接数据拼接数据联结数据透视表透视表介绍透视表创建轴向介绍DataFrame是一个二维结构,因此,具有两个操作维度DataFrame地维度定义如下图所示轴向介绍如何理解"沿着轴向行处理"?(如test.data.mean(axis=零))主要过程:沿指定轴向分解数据处理核心思想:设想用一把斧头,沿着轴向对数据集行切割axis=零axis=一轴向介绍如何理解:test_data.drop('B',axis=一)#正确代码test_data.drop('B',axis=零)#错误代码Axis=一:将数据集按一轴拆分为行重点:drop(‘B’,axis=一)删除每行地‘B’列数据将处理后地行数据再拼接为数据集拆分数据np.split():按轴向对数据集行拆分Axis=一:按列对数据集行拆分Axis=零:按行对数据集行拆分思考上述按轴向行拆分地工作原理(参考前一页PPT)其它数据集拆分方法:依据问题需求选择利用查询对数据集行拆分利用分组方法对数据集行拆分利用内置方法或自定义方法行拆分等等拼接数据将数据按照特定规则行拼接方法名默认连接方向默认连接方式默认对齐方式concat按行外连接(outerjoin)列标签或索引merge按列内链接(innterjoin)行索引join按列左连接(leftjoin)行索引concat()默认按行行拼接默认对齐方式--列标签,即对齐列标签相同地数据merge()默认按列行拼接默认对齐方式—行索引,即对齐行索引相同地数据联接类型内联结:双方有地数据外联结:左外联接:左表所有数据+右表对应数据右外联接:右表所有数据+左表对应数据全外联接:左表所有数据+右表所有数据数据透视表数据透视表(PivotTable):商业数据分析常用地表格形式特点:隐匿数据细节,展示数据变动规律优势:创建容易易于理解方便展示数据透视表--pivot_table()pivot_table()为Pandas提供地数据透视表工具,其主要地参数如下:data:行数据透视地DataFrame。index:指定对数据行分组地列(零轴)。columns:指定对数据行分组地列(一轴)。values:指定行统计计算地列。aggfunc:指定统计计算地类型。index与columns参数对比:两者均指定对数据行分组地列index参数地分组结果体现于零轴columns参数地结果体现在一轴。数据透视表--cross_table()用来快速统计数据地出现频率pivot_table()与cross_table()对比crosstab()可用于DataFrame,也可用于np.ndarray数据。pivot_table()只能用于DataFrame。crosstab()支持normalize参数,便于计算百分比,pivot_table()没有实现类似地功能。crosstab()默认计算频率,pivot_table()默认计算均值。crosstab()一次只能行一种统计计算,pivo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论