7.2 数据的分组与聚合_第1页
7.2 数据的分组与聚合_第2页
7.2 数据的分组与聚合_第3页
7.2 数据的分组与聚合_第4页
7.2 数据的分组与聚合_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7.2数据的分组与聚合学习内容7.2.1数据的分组7.2.2数据的聚合7.2数据的分组与聚合7.2.1数据的分组在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(组)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在pandas中,用groupby()方法完成数据分组操作。序号参数说明1by映射、函数、标签或标签列表;用于确定聚合的组。2axis默认为0,表示按行操作;设置为1,表示按列操作。3as_index布尔值,默认True,返回以组标签为行标签的对象,若为False则不以组标签为行标签。7.2数据的分组与聚合7.2.1数据的分组案例:已知公司员工的收入数据表(data/月薪.csv),要求统计不同公司的平均收入和不同公司“男”和“女”员工的平均收入。01importpandasaspd02df=pd.read_csv('data/月薪.csv',engine='python')03df.groupby(['公司'])['月薪'].mean()#按公司分组统计平均月薪04df.groupby(['公司','性别'],as_index=False)['月薪'].mean()#按公司和性别分组统计平均月薪as_index=False表示分组后返回的DataFrame对象不以组标签为行标签7.2数据的分组与聚合7.2.2数据的聚合聚合是分组之后的常见的操作。聚合可以用来求和、均值、最大值、最小值等。在pandas中,可以利用agg()方法来完成聚合,其返回值为DataFrame对象。表7.2.2agg()方法的常用参数说明序号参数说明1func函数,函数名称,函数列表,字典{‘行名/列名’:‘函数名’}2axis默认为0,设置为0表示按行操作;设置为1,表示按列操作。7.2数据的分组与聚合7.2.2数据的聚合表7.2.3agg()方法的常用聚合操作函数序号函数说明1count分组中非NaN值的数量2sum非NaN值的和3mean非NaN值的平均值4median非NaN值的中位数5std,var标准差和方差6min,max非NaN的最小值,最大值7prod非NaN值的乘积8first,last非NaN值的第一个,最后一个7.2数据的分组与聚合7.2.2数据的聚合案例:继续使用公司员工的收入数据表(data/月薪.csv),要求统计不同公司的“男”和“女”员工的数量,平均收入,以及收入最高值和最低值,并将统计结果保存到文件‘月薪2.xls’。05#按公司统计男和女员工的数量df2=df.groupby(['公司','性别'],as_index=False).agg('count')06df2.columns=['公司','性别','数量']#修改df2的列标签07df2

7.2数据的分组与聚合7.2.2数据的聚合08#按公司统计男和女员工的平均、最高和最低月薪df3=df.groupby(['公司','性别'],as_index=False).agg({'月薪':['mean','max','min']})09#修改df3的列标签df3.columns=['公司','性别','平均月薪','最高月薪','最低月薪']10df3

7.2数据的分组与聚合7.2.2数据的聚合11#合并df2和df3,没有指定on,则用两个对象的交集的列标签作为连接键值。cont=pd.merge(df2,df3,how='inner')12cont['平均月薪']=cont['平均月薪'].r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论