




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目5利用Pandas进行财务数据分析利用Pandas进行数据排序和排名分析任务5.1利用Pandas进行数据的统计与描述分析任务5.2利用Pandas进行数据的分组与分段分析任务5.3利用Pandas进行数据的交叉与透视分析任务5.4目录利用Pandas进行数据相关性分析任务5.5项目学习目标1知识目标2能力目标3素养目标掌握索引排序函数sort_index()、数值排序函数sort_values()以及数据排名函数rank()的使用;掌握常用统计分析函数的使用,如sum()、mean()、max()、min()等函数;掌握分组统计函数groupby()、agg()及分段函数cut()的使用;掌握交叉分析函数crosstab()及数据透视函数pivot_table()的使用;掌握相关系数计算函数corr()的使用。能根据分析需要对财务数据进行排序或排名;能根据分析需要对财务数据进行统计与描述;能根据分析需要对财务数据进行分组和分段;能根据分析需要对财务数据进行交叉和透视分析;能根据分析需要对财务数据进行相关性分析。具有做事认真、一丝不苟的学习态度;具有与团队成员精诚合作的精神,能正确面对成功或失败;具有一定的自学能力和实践创新意识。引入案例任务分析知识解析案例解析任务实训实训评价5.1.1数据排序5.1.2数据排名任务5.1利用Pandas进行数据排序和排名分析任务5.1利用Pandas进行数据排序和排名分析引入案例美创科技有限公司财务人员小王想利用企业费用支出表.xlsx(位置:E:\file\)中的数据,对今年每个月的招待费进行排序和排名,大概了解一下招待费每个月的使用情况,那么在Pandas中如何实现呢?任务分析要想实现对数据的排序和排名,就要用到Pandas模块中的索引排序函数sort_index()、数值排序函数sort_values()以及数据排名函数rank(),通过正确选择函数、设置函数参数,就能实现分析目标。任务5.1利用Pandas进行数据排序和排名分析知识解析在数据分析时,对数据进行排序和排名是常用的操作。通过数据的排序和排名,比较容易发现数据的特征和趋势,找到解决问题的线索。除此之外,排序和排名还有助于对数据检查纠错,为数据的分组或分段提供方便。5.1.1数据排序数据排序是指使数据按一定方式进行排列,通过数据排序可以更为方便地看出数据特征。DataFrame排序可以分为按索引排序和按数值排序。任务5.1利用Pandas进行数据排序和排名分析一、按索引排序按索引排序是指按照DataFrame索引的值升序或者降序重新排列数据,在Pandas中利用sort_index()函数可以实现按照索引对数据进行排序。sort_index()函数的语法格式如下:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort’,na_position='last',sort_remaining=True,ignore_index=False,key=None)参数说明axis接收0或1。表示用来指定排序的轴,0表示根据行索引排序,1表示根据列索引排序,默认为0。level用来指定索引级别,若设置则按照指定的级别排序,默认为None,即以索引的值进行排序。ascending接收布尔值或布尔值列表。用来指定是否升序排序,默认是True,即升序排序。inplace接收布尔值,默认为False。如果设置为True,则在原地(原来的数据)进行操作。na_position接收'first'或'last'。用来指定空值(NaN)应该排序的位置,默认为'last',即放在最后面。任务5.1利用Pandas进行数据排序和排名分析【做中学5.1.1】读入应交个税表.xlsx(位置:E:\file\),将工号设置为行索引,然后根据行索引升序排列。【做中学5.1.1】解析如下:导入Pandas模块和Excel表格数据。程序如下:importpandasaspd#引入Pandas模块#读取Excel表格数据df=pd.read_excel(r'E:\file\应交个税表.xlsx')df#查看dfSTEP01将工号列设置为行索引,并按照行索引升序排列。程序如下:df1=df.set_index('工号')#将工号列设置为行索引df1.sort_index(inplace=True)df1#查看df1STEP02任务5.1利用Pandas进行数据排序和排名分析二、按数值排序按数值排序是指可以按照DataFrame某一列(行)或几列(行)的值升序或者降序的方式重新排列数据,在Pandas中利用sort_values()函数实现对数值的排序。sort_values()函数的语法格式如下:DataFrame.sort_values(by,axis=0,ascending=Ture,inplace=Flase,kind='quicksort’,na_position='last',ignore_index=False,key=None)参数说明by接收字符串(行名或者列名),也可以是字符串的列表(多个行名或者多个列名),需要配合axis参数使用。如果axis=0或者"index",那么by="列名";如果axis=1或者"columns",那么by="行名"。axis若axis=0或'index',则按照指定列中数据大小排序;若axis=1或'columns',则按照指定行中数据大小排序,默认axis为0。ascending接收布尔值或布尔值列表。指定是否升序排序,默认是True,即升序排序。inplace接收布尔值,默认为False。如果设置为True,则在原地(原来的数据)进行操作。na_position接收'first'或'last'。表示指定空值(NaN)应该排序的位置,默认为'last',即放在最后面。【请注意】sort_values()函数必须指定by参数,即必须指定行或列。任务5.1利用Pandas进行数据排序和排名分析【做中学5.1.2】读入应交个税表.xlsx(位置:E:\file\),对表格中的数据按列进行排序。【做中学5.1.2】解析如下:导入Pandas模块和Excel表格,并根据应交个税列升序排列。程序如下:importpandasaspd#引入Pandas#读取Excel表格数据df=pd.read_excel(r'E:\file\应交个税表.xlsx')df.sort_values(by='应交个税')#根据应交个税列升序排列STEP01根据应交个税列和工号列两列排序,并且应交个税列、工号列都降序排列。程序如下:df.sort_values(by=['应交个税','工号'],
ascending=[False,False])STEP02任务5.1利用Pandas进行数据排序和排名分析rank()函数的语法格式如下:DataFrame.rank(axis=0,method='average',numeric_only=None,na_option='keep',ascending=True,pct=False)5.1.2数据排名参数说明axis接收0或'index',1或'columns'。表示沿着行或列计算排名,默认为0。method接收'average','min','max','first'或'dense',默认为'average'。表示如何对相同数值进行排名,不同的取值含义如下:①average:在相等分组中,为各个值分配平均排名;②min:使用整个分组的最小排名;③max:使用整个分组的最大排名;④first:按值在原始数据中的出现顺序分配排名;⑤dense:类似于'min’,但组之间的排名始终提高1,即并列的数据只占据一个名次。numeric_only接收布尔值,表示是否仅仅计算数字型的columns。na_option接收'keep','top'或'bottom',默认为'keep'。表示NaN值是否参与排名及如何排名,不同的取值含义如下:①keep:将NaN等级分配给NaN值;②top:如果升序,则将最小等级分配给NaN值;③bottom:如果升序,则将最高等级分配给NaN值。ascending接收布尔值,默认为True。表示某列(行)元素是否按升序排名。pct接收布尔值,默认为False。表示是否以百分比形式显示返回的排名。任务5.1利用Pandas进行数据排序和排名分析【做中学5.1.3】读入应交个税表.xlsx(位置:E:\file\),对表格中的应交个税列使用method参数的四种取值进行排名。【做中学5.1.3】程序如下:importpandasaspd#引入Pandas模块df=pd.read_excel(r'E:\file\应交个税表.xlsx')df['rank_avg']=df['应交个税'].rank(ascending=False)df['rank_min']=df['应交个税'].rank(method='min',ascending=False)df['rank_max']=df['应交个税'].rank(method='max',ascending=False)df['rank_fir']=df['应交个税'].rank(method='first',ascending=False)df['rank_den']=df['应交个税'].rank(method='dense',ascending=False)df#查看df内容任务5.1利用Pandas进行数据排序和排名分析读取企业费用支出表.xlsx(位置:E:\file\)获取数据。程序如下:importpandasaspd#导入Pandas模块#读入Excel表格数据df=pd.read_excel(r'E:\file\企业费用支出表.xlsx')df.head()#查看前5行数据STEP01案例解析任务5.1利用Pandas进行数据排序和排名分析使用sort_values()函数对招待费按降序排列。程序如下:df1=df.sort_values(by="招待费",ascending=False)df1.head()#查看df前5行STEP02案例解析任务5.1利用Pandas进行数据排序和排名分析使用rank()函数对招待费进行排名,并在原来df增加排名列。程序如下:df['排名']=df['招待费'].rank(method='dense',ascending=False)df#查看dfSTEP03任务5.1利用Pandas进行数据排序和排名分析任务实训请上机编写程序实现以下要求:读取企业费用支出表.xlsx(位置:E:\file\)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公寓租赁标准合同样本
- 某银行牡丹贷记卡动产质押合同范本
- Module 1 Unit 2 Changes in our lives Listen and say Listen and enjoy (教学设计)-2024-2025学年沪教牛津版(深圳用)英语六年级下册
- 沿街商铺购房合同范本
- 艺术家合作合同模板大全
- 企业融资成立合同:出资细节
- 房屋买卖合同真实案例解析
- 企业整体出售合同范本
- 10000以内数的读写(教学设计)-2023-2024学年二年级下册数学人教版
- 11《爸爸妈妈在我心中 爱父母在行动》(教学设计)-部编版道德与法治三年级上册
- 2025年四川司法警官职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 山东省德州市2024-2025学年高三上学期1月期末生物试题(有答案)
- 本人报废车辆委托书
- 双减政策与五项管理解读
- 2025年道德与法治小学六年级下册教学计划(含进度表)
- 过桥资金操作流程
- 货物学 课件1.2货物的特性
- 新时代中国特色社会主义理论与实践2024版研究生教材课件全集2章
- 2024年公路水运工程施工企业主要负责人和安全生产管理人员安全生产考核试题库(含答案)
- 2025年军队文职考试《公共科目》试题与参考答案
- 辅导员入职培训课件
评论
0/150
提交评论