大数据技术在财务中的应用 教案全套 张卫平 项目1-7 认知数据分析- 利用Pandas进行财务报表分析_第1页
大数据技术在财务中的应用 教案全套 张卫平 项目1-7 认知数据分析- 利用Pandas进行财务报表分析_第2页
大数据技术在财务中的应用 教案全套 张卫平 项目1-7 认知数据分析- 利用Pandas进行财务报表分析_第3页
大数据技术在财务中的应用 教案全套 张卫平 项目1-7 认知数据分析- 利用Pandas进行财务报表分析_第4页
大数据技术在财务中的应用 教案全套 张卫平 项目1-7 认知数据分析- 利用Pandas进行财务报表分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教案1教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称项目一认知数据分析教学目的1.了解数据分析的基本概念及流程;2.了解数据分析的常见应用场景;3.了解数据分析的常见方法;4.了解常用的数据分析工具及其优缺点。5.了解Python数据分析常用库。教学重点1.数据分析的基本概念及流程;2.Anaconda发行版的下载与安装;3.JupyterNotebook的使用教学难点1.数据分析的常见方法;2.Python数据分析常用库。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务1.1了解数据分析的应用场景与方法【引入案例】【任务分析】【知识准备】1.1.1数据分析概述一、数据分析的概念二、数据分析的流程三、大数据分析的应用场景1.1.2数据分析方法一、统计分析类统计分析类是指以基础的统计分析为主,包括基本统计量计算、对比分析法、分组分析法、结构分析法、交叉分析法、因素分析法等。二、高级分析法以建模理论为主,包括相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、时间序列分析法等。三、数据挖掘类数据挖掘类方法主要以机器学习、数据仓库等复合技术为主。【案例解析】【任务实训】任务1.2Python数据分析环境的搭建【引入案例】【任务分析】【知识准备】1.2.1常用数据分析工具一、利用Excel进行数据分析二、利用Stata进行数据分析三、利用Python进行数据分析1.2.2Anaconda发行版的下载与安装1.2.3JupyterNotebook的使用1.2.4Python数据分析常用库简介【案例解析】【任务实训】教案2教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称项目三利用Numpy进行数值计算教学目的1.了解ndarray数据类型及其属性;2.掌握ndarray常用创建函数的语法格式及参数含义;3.了解数组的基本运算,掌握数组常见的基本操作;4.掌握二进制文件、文本文件读写函数的语法格式及参数含义;5.掌握Numpy中常用统计分析函数的语法格式及参数含义。教学重点1.数组常见的基本操作;2.Numpy中常用统计分析函数。教学难点1.ndarray常用创建函数的语法格式及参数含义;2.Numpy中常用统计分析函数的语法格式及参数含义。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容3.1Numpy数组对象ndarry【引入案例】【任务分析】【知识准备】1.1.1ndarray概述一、ndarray介绍二、ndarray的数据类型三、ndarray数组属性1.1.2数组的创建一、利用array()函数创建数组二、利用专门函数创建数组三、随机数生成方法1.1.3数组的基本操作一、数组索引与切片二、数组的转置与变形1.1.4数组的运算一、相同形状数组的运算二、不同形状数组的运算三、通用函数(ufunc)【案例解析】【任务实训】3.2利用Numpy进行统计分析【引入案例】【任务分析】【知识准备】1.2.1读写文件一、二进制文件读写二、文本文件读写1.2.2常用的统计函数【案例解析】【任务实训】教案3教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.1掌握Pandas常用操作(1)教学目的1.掌握Series对象的创建和数据查询;2.掌握DataFrame对象的创建及属性查询;3.掌握DataFrame对象的基本操作。教学重点1.DataFrame对象的属性查询操作;2.DataFrame对象的索引操作;3.DataFrame对象的行列的增加和删除操作。教学难点1.DataFrame对象的创建2.reindex()、rename()函数参数的设定;3.insert()、drop()函数的使用。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.1掌握Pandas常用操作(1)【引入案例】【任务分析】【知识准备】4.1.1Pandas数据结构一、Series数据结构1.Series对象的创建2.Series对象的数据查询3.Series对象的修改、增加及删除二、DataFrame数据结构4.1.2DataFrame创建方法与属性一、DataFrame的创建方法二、DataFrame的属性4.1.3DataFrame的基本操作一、DataFrame的索引操作1.重排索引reindex()函数2.还原索引reset_index()函数3.重设索引set_index()函数4.重命名索引rename()函数5.轴向变换函数stack()函数和unstack()函数二、新增列数据1.利用直接赋值新增列2.利用公式计算新增列3.利用insert()函数插入新列三、删除列数据1.使用del删除列2.使用pop()函数删除列3.使用drop()函数删除列四、增加和删除行数据1.使用索引器loc方法增加行2.使用drop()函数删除行五、DataFrame的转置及数据类型转换教案4教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.1掌握Pandas常用操作(2)教学目的1.掌握DataFrame对象的简单运算;2.掌握常用读写外部文件函数的使用。教学重点1.DataFrame对象的简单运算;2.使用read_excel()函数读取外部Excel文件;3.使用read_csv()函数读取外部CSV文件。教学难点1.正确设定read_excel()函数参数;2.正确设定read_csv()函数参数。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会

授课主要内容任务4.1掌握Pandas常用操作(1)4.1.4DataFrame的简单运算一、DataFrame与Series之间的转化DataFrame单独取一列或一行就是一个Series,也可以将Series转化成单列的DataFrame。【做中学】编写程序将DataFrame中的一列转化成Series,然后再将该Series转化成DataFrame。二、DataFrame的简单运算Pandas的数据对象在进行算术运算时,如果有相同索引,按照相同索引配对进行算术运算,如果没有对应的索引,则引入缺失值NaN,这就是数据自动对齐的功能。Pandas数据结构之间可以使用运算符进行运算,如obj1-obj2、obj1+obj2、obj1*obj2、obj1/obj2,其中obj1和obj2是两个数据结构,可以是Series或是DataFrame。4.1.5Pandas读写外部文件一、读写Excel文件1.Excel文件的读取pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,**kwds)2.Excel文件的存储将DataFrame对象存储为Excel文件,可以使用to_excel()函数。其语法格式如下:DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep='inf',verbose=True,freeze_panes=None)二、CSV文件的读写1.CSV文件的读取在Pandas中利用read_csv()函数读取CSV文件,其语法格式如下:pandas.read_csv(filepath_or_buffer,sep=',',delimiter=None,header='infer',names=None,index_col=None,usecols=None,dtype=None,…)2.CSV文件的存储CSV文件的存储可以通过Pandas库中的to_csv()函数实现,其语法格式如下:DataFrame.to_csv(path_or_buf=None,sep=',',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,mode='w',encoding=None,…)【案例解析】【任务实训】教案5教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.2利用Pandas进行财务数据筛选(1)教学目的1.学会对DataFrame对象进行数据直接筛选;2.学会对DataFrame对象使用索引器筛选。教学重点1.直接筛选方式2.索引器筛选方式教学难点索引器筛选补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.2利用Pandas进行财务数据筛选(1)【引入案例】【任务分析】【知识准备】4.2.1直接筛选所谓直接筛选,是指DataFrame对象后面直接跟索引(原始索引或自定义索引)标签进行数据的选取,可以实现单行、单列和多行多列的筛选。【做中学4.2.1】读入fin_data.xlsx(位置:E:\file\)中的第一个表格,使用上表中列举的筛选方式进行数据选取。4.2.2索引器筛选所谓索引器筛选,是指采用loc、iloc索引器进行数据选取的方法。loc索引器优先使用自定义索引,如果数据中没有自定义索引,则使用原始索引,根据行索引和列索引进行选取,先行后列,也可以只选取行。教案6教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.2利用Pandas进行财务数据筛选(2)教学目的学会对DataFrame对象使用条件筛选数据教学重点1.根据列条件选择行;2.根据行索引选择行。教学难点条件筛选的使用补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.2利用Pandas进行财务数据筛选(2)4.2.3条件筛选在DataFrame中,除了可以利用索引选取数据外,还可以设置筛选条件选取数据,在条件中常用的符号主要是比较运算符和逻辑运算符。 条件筛选常用运算符种类符号及含义比较运算符<(小于)、<=(小于等于)、>(大于)、>=(大于等于)、!=(不等于)、==(等于)逻辑运算符&(与)、|(或)、~(取反)条件筛选方法语法格式及举例语法格式举例说明DataFrame[conditon]根据列条件选择行df[df[col]==value]表示选取某列满足一定条件的行。df[(df[col1]==value)&(df[col2]>value)]表示选取多列满足一定条件的行。根据行索引选择行df[df.index==’行索引’]表示选择单行。df[(df.index==’行索引’)|df.index==’行索引’)]表示选择两行,可使用“|”选择更多行DataFrame.loc[condition,cols]表示选取满足条件的行及指定列。【请注意】条件表达式可以使用操作符&、|、~,但是不能使用关键词and、or、not。【做中学】读入fin_data.xlsx(位置:E:\file\)中的第一个表格,并使用上表中列举的筛选方式进行数据选取。【案例解析】【任务实训】

教案7教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.3利用Pandas高阶函数进行数据处理教学目的1.学会利用map()函数进行数据处理。2.学会利用apply()函数进行数据处理;3.学会利用applymap()函数进行数据处理。教学重点1.map()函数的使用2.apply()函数的使用3.applymap()函数的使用教学难点map()、apply()函数的使用补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.3利用Pandas高阶函数进行数据处理【引入案例】【任务分析】【知识准备】4.3.1map()函数map()函数可以用于Series对象或DataFrame对象的一列,接收函数或字典对象作为参数,对指定序列逐一映射,返回经过函数或字典映射处理后的值。其语法格式如下:Series.map(functionordict,na_action=None)【做中学】读入fin_data.xlsx(位置:E:\file\)中的“利润表项目”工作表,据此计算出净利润率,然后进行以下操作:(1)根据净利率进行业绩评价,使用map()函数将净利率超过20%的月份标记为达标,否则不达标;(2)根据业绩评价结果确定是否发放奖金,业绩达标则发放,否则不发放。4.3.2apply()函数一、Series.apply()Series.apply()函数在Series值上调用函数,与Series.map()类似,区别在于apply()函数能够传入功能更复杂的函数。Series.apply()函数语法格式如下:Series.apply(func,convert_dtype=True,args=(),**kwargs)【做中学】以前面生成的df数据对象为基础,现需要调整营业收入金额,而具体调整的金额未知,请使用Series.apply()函数实现营业收入的调整。二、DataFrame.apply()对于DataFrame而言,apply()函数是一个非常重要的数据处理方法,它可以接收各式各样的函数(Lambda表达式、Python内置函数或自定义函数等)作为它的参数,处理方式很灵活。DataFrame.apply()函数语法格式如下:DataFrame.apply(func,axis=0,broadcast=None,raw=False,reduce=None,result_type=None,args=(),**kwds)1.axis=0时apply()函数的使用【做中学】读入fin_data.xlsx(位置:E:\file\)中的“利润表项目”工作表,使用apply()函数将营业收入、营业成本、净利润以“万元”为单位展示。2.axis=1时apply()函数的使用【做中学4.3.4】读入fin_data.xlsx(位置:E:\file\)中的“利润表项目”工作表,利用DataFrame.apply()函数计算每个月的毛利率。4.3.3applymap()函数applymap()函数用来对DataFrame中的每个元素执行指定方法(函数或lambda表达式)的操作。其语法格式如下:DataFrame.applymap(function)applymap()函数的用法比较简单,会对DataFrame中的每个元素执行指定方法进行操作,虽然使用频率没有apply()函数高,但在某些场下还是比较实用的。【做中学】读入fin_data.xlsx(位置:E:\file\)中的“利润表项目”工作表,将DataFrame中的营业收入、营业成本和净利润统一保留1位小数显示。【案例解析】【任务实训】

教案8教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.4利用Pandas进行财务数据合并(1)教学目的1.掌握merge()函数的使用场合;2.掌握merge()函数常用参数的使用;3.能灵活使用merge()函数进行数据的合并。教学重点1.how参数的使用;2.on参数的使用;3.left_on、right_on参数的使用。教学难点how参数四种取值代表的含义补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.4利用Pandas进行财务数据合并(1)【引入案例】【任务分析】【知识准备】4.4.1merge()函数的运用一、merge()函数的语法格式及参数说明merge()函数的语法格式如下:pandas.merge(left,right,how=’inner’,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(’_x’,’_y’),copy=True,indicator=False,validate=None)二、merge()函数常用参数1.how参数how参数表示数据合并的方式,其取值可以为inner、outer、left、right。2.on参数3.left_on参数和right_on参数

教案9教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.4利用Pandas进行财务数据合并(2)教学目的1.学会使用join()函数进行数据的合并;2.学会使用concat()函数进行数据的合并;3.学会使用append()函数进行数据的合并。教学重点使用concat()函数进行数据的合并教学难点使用concat()函数进行数据的合并补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.4利用Pandas进行财务数据合并(2)4.5.2join()函数的运用一、join()函数的语法格式及参数说明join()函数语法格式如下:DataFrame.join(other,on=None,how='left',lsuffix='',rsuffix='',sort=False)二、join()函数常用参数1.on参数默认值None2.on参数为列名或者包含列名的list或tuple4.5.3concat()函数的运用concat()函数用来沿特定轴连接两个或两个以上的DataFrame对象,既可实现纵向合并也可实现横向合并,行列索引均可重复。一、concat()函数的语法格式及参数说明concat()函数语法格式如下:pandas.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verify_integrity=False,copy=True)二、concat()函数常用参数在concat()函数的参数中,最常用的参数是objs、axis和join参数,objs参数比较简单,下面重点讲解axis参数、join参数联合使用对合并表格的影响。1.axis=1时实现横向堆叠2.axis=0时实现纵向堆叠4.5.4append()函数的运用append()函数用来向DataFrame对象中添加新的行(纵向合并),如果添加的列名不在DataFrame对象中,将会被当作新的列进行添加。append()函数适用场景:两个DataFrame纵向连接,是concat()函数(axis=0)的简略形式。append()函数的语法格式如下所示:DataFrame.append(other,ignore_index=False,verify_integrity=False,sort=False)【案例解析】【任务实训】教案10教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.5利用Pandas进行财务数据清洗(1)教学目的1.掌握检测和处理重复项函数的使用;2.掌握检测和处理缺失值函数的使用;教学重点1.drop_duplicates()函数的使用;2.dropna()函数的使用;3.fillna()函数的使用教学难点1.drop_duplicates()函数的使用;2.dropna()函数的使用。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.5利用Pandas进行财务数据清洗(1)【引入案例】【任务分析】【知识准备】4.5.1检测与处理重复值一、duplicated()函数检测重复数据去除重复数据之前,首先要了解数据中的重复情况,Pandas提供了duplicated()函数,用来检测数据的重复情况。duplicated()函数用于检测Series、DataFrame中是否存在重复数据,重复为True,不重复为False。该函数的语法格式如下:Series.duplicated(keep='first')DataFrame.duplicated(subset=None,keep='first')二、drop_duplicates()函数删除重复数据drop_duplicates()函数用于删除Series、DataFrame中重复行,并返回删除重复后的结果。该函数的语法格式如下:Series.drop_duplicates(keep='first',inplace=False)DataFrame.drop_duplicates(subset=None,keep='first',inplace=False,ignore_index=False)4.5.2检测与处理缺失值一、检测缺失值Pandas中查找数据中缺失值函数有两个:一个是isnull()函数,如果是空值就显示True;另一个是notnull()函数,该函数刚好相反,如果是空值就显示False。通过isnull()函数和sum()函数的结合,可以获得Series和DataFrame中缺失值的个数。二、删除缺失值在数据分析中,如果数据集的样本很大,并且在删除含有缺失值的记录后,不会影响分析结果的客观性和准确性时,一般是用dropna()函数直接将空值或缺失值的数据删除。dropna()函数的语法格式如下:dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)三、填充缺失值在数据分析中,如果数据集的样本比较少,或者由于删除含有缺失值的记录会影响到数据分析结果的客观性和准确性,就需要根据数据插补的方法来选择填充值,然后使用fillna()函数对空值或者缺失值进行填充。fillna()函数的语法格式如下:fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)教案11教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务4.5利用Pandas进行财务数据清洗(2)教学目的掌握其他异常处理函数的使用。教学重点1.删除特殊字符;2.数据的替换。教学难点replace()函数的使用补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务4.5利用Pandas进行财务数据清洗(2)4.5.3其他异常处理一、删除特殊字符当要删除字符串头尾指定的字符(默认为空格或换行符)或字符序列时,可以使用strip()函数。该函数语法格式如下:Series.str.strip([chars])其中,[chars]用来指定要删除的字符,可以同时指定多个,如果不手动指定,则默认会删除空格以及制表符、回车符、换行符等特殊字符。二、数据替换在处理数据时,经常会遇到批量替换的情况,如果一个一个地去修改则效率过低,也容易出错。Pandas提供了replace()函数和str.replace()函数来进行全部替换和部分替换。1.全部替换全部替换是指将DataFrame全部元素或DataFrame中某一列的全部元素进行替换,替换时可以使用replace()函数。replace()函数的一般语法格式为:DataFrame.replace(to_replace,value,inplace)其中,to_replace表示需要替换的值,value表示替换后的值。如果有多个值需要替换可使用字典,使用方法是:{to_replace1:value1,to_replace2:value2,…}。在DataFrame中,有时仅仅只针对某一列进行替换,其一般语法格式为:DataFrame[col]=DataFrame[col].replace(to_replace,value,inplace)2.部分替换有时不需要将元素全部替换,而仅仅需要将元素中的某个字符进行替换,此时就可以使用str.replace()函数,str.replace()函数的一般用法为:DataFrame[col].str.replace(to_replace,value)其中,to_replace表示需要替换的内容,value表示替换后的内容。str.replace()是字符串函数,只能针对Series使用,所以如果要在DataFrame中调用str函数,只能选取DataFrame中的一列才能使用。【做中学】读入dataClean.xlsx(位置:E:\file\)中的表格,首先删除重复项及全为缺失值列,然后删除其中的空格、逗号(,)及¥符号,最后用平均值填充缺失值。【案例解析】【任务实训】教案12教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务5.1利用Pandas进行数据排序和排名分析教学目的掌握索引排序函数sort_index()的使用;掌握数值排序函数sort_values()的使用;掌握数据排名函数rank()的使用。教学重点sort_index()函数的使用;sort_values()函数的使用。教学难点数值排序函数sort_values()的使用补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务5.1利用Pandas进行数据排序和排名分析【引入案例】【任务分析】【知识准备】5.1.1数据排序数据排序是指使数据按一定方式进行排列,通过数据排序可以更为方便地看出数据特征。DataFrame排序可以分为按索引排序和按数值排序。一、按索引排序按索引排序是指按照DataFrame索引的值升序或者降序重新排列数据,在Pandas中利用sort_index()函数可以实现按照索引对数据进行排序。sort_index()函数的语法格式如下:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort',na_position='last',sort_remaining=True,ignore_index=False,key=None)二、按数值排序按数值排序是指可以按照DataFrame某一列(行)或几列(行)的值升序或者降序的方式重新排列数据,在Pandas中利用sort_values()函数实现对数值的排序。sort_values()函数的语法格式如下:DataFrame.sort_values(by,axis=0,ascending=Ture,inplace=Flase,kind='quicksort',na_position='last',ignore_index=False,key=None)5.1.2数据排名在实际工作中经常需要对数据进行排名,如对客户的销售金额进行排名,查看重点客户名单。排名函数在很多数据分析软件中都有,如Excel中的rank()函数,而在Pandas中也有类似的rank()函数,该函数可以对DataFrame按照某列或行进行排名。rank()函数的语法格式如下:DataFrame.rank(axis=0,method='average',numeric_only=None,na_option='keep',ascending=True,pct=False)【案例解析】【任务实训】教案13教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务5.2利用Pandas进行数据的统计与描述分析教学目的掌握数值型字段的统计与描述;掌握分类型字段的统计与描述。教学重点直接利用统计指标函数进行统计;利用describe()函数进行描述分析;利用value_counts()函数进行统计分析。教学难点describe()函数的使用补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务5.2利用Pandas进行数据的统计与描述分析【引入案例】【任务分析】【知识准备】5.2.1数值型字段的统计与描述数值型字段是指该字段是用数值来描述的,如营业收入、营业成本、净利润等。数值型字段的描述性统计主要包括计算最小值、最大值、均值、中位数、四分位数、极差、方差、标准差等统计指标。一、直接利用统计指标进行计算Pandas提供了很多方法来计算数值型字段的各类指标,常用统计指标如下表所示。直接利用统计指标进行计算的语法格式如下:DataFrame[column].统计指标二、利用describe()函数进行计算Pandas模块提供了describe()函数用来一次性计算数值型字段的8个统计指标,如下表所示。5.2.2分类型字段的统计与描述分类型字段是指该字段具有分类作用,如省份名、城市名、商品类别等,分类型字段的统计与描述主要是频数统计。一、利用value_counts()函数进行统计分析Pandas提供了value_counts()函数用来统计分类型字段的频数。value_counts()函数的语法格式如下:Series.value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True)二、利用describe()函数进行统计分析Pandas中describe()函数除了可以对数值型字段进行统计描述,还可以对分类型字段进行统计描述。对于分类型字段,describe()函数可以统计分类数目、最多频数类别等结果。【案例解析】【任务实训】教案14教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时课型理实一体化章节名称任务5.3利用Pandas进行数据的分组与分段分析教学目的掌握分组函数groupby()的使用;学会灵活使用agg()函数实现自定义聚合;掌握分段函数cut()的使用。教学重点分组函数groupby()的使用;agg()函数的使用。教学难点不同聚合方式下agg()函数的参数设定补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务5.3利用Pandas进行数据的分组与分段分析【引入案例】【任务分析】【知识准备】5.3.1数据分组统计分析分组统计分析主要利用分组聚合操作来实现,所谓分组聚合就是将DataFrame对象根据一列或多列划分成若干组,然后对分组后的数据分别进行汇总计算,并将汇总计算后的结果进行合并。一、数据分组Pandas提供了一个灵活的groupby()函数,通过groupby()函数可以对DataFrame对象进行分组操作,进而再对每一组进行统计分析,如计算每组最大值、最小值、平均值、中位数等。通过groupby()函数执行分组操作,只会返回一个GroupBy对象,该对象实际上并没有进行任何的计算,其仅仅是中间数据。groupby()函数的语法格式如下:DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,observed=False,dropna=True)二、分组统计在DataFrame中,在按照列进行分组以后,还可以利用相关聚合函数对指定的列进行统计分析。1.单一聚合方式所谓单一合方式,是指对特定的列每次只能使用一种聚合函数。其一般语法格式如下:DataFrame.groupby(by=分组列)[统计列].聚合函数2.自定义聚合方式使用agg()函数,可以实现对多列进行一种聚合或多种聚合方式,主要有以下三种方式:(1)对指定列同时使用多个聚合函数。这时必须把由聚合函数名构成的字符串列表作为agg()函数的参数。(2)对特定的列使用特定的聚合函数。这时可以通过构造字典传入agg()函数实现,其中字典以列名为键,以聚合函数名的字符串或字符串列表为值。(3)使用自定义的聚合函数。这时传入聚合函数的参数是agg()函数前面数据源中的列,逐列进行计算。5.3.2数据分段统计分析在数据分析中,常常需要将连续数据离散化,这就是数据分段。数据分段就是指在连续数据取值范围内设置一些离散的分段点,而连续数据按照这些分段点进行分段。在Pandas中cut()函数可以实现将连续型数据转换为分段型数据。cut()函数的语法格式如下:pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False,duplicates='raise',ordered=True)【案例解析】【任务实训】教案15教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时课型理实一体化章节名称任务5.4利用Pandas进行数据的交叉与透视分析教学目的1.掌握交叉分析函数crosstab()的使用;2.掌握数据透视函数pivot_table()的使用。教学重点数据透视函数pivot_table()的使用教学难点数据透视函数pivot_table()的参数的设定补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务5.4利用Pandas进行数据的交叉与透视分析【引入案例】【任务分析】【知识准备】5.4.1频数交叉分析crosstab()函数的语法格式如下:pandas.crosstab(index,columns,values=None,rownames=None,colnames=None,aggfunc=None,margins=False,margins_name='All',dropna=True,normalize=False)5.4.2数据透视分析pivot_table()函数的语法格式如下:pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All',observed=False)或者:DataFrame.pivot_table(values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All',observed=False)【案例解析】【任务实训】教案16教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务5.5利用Pandas进行数据相关性分析教学目的学会利用散点图判断变量间的相关性;学会利用corr()函数计算相关系数。教学重点利用散点图判断变量间的相关性;corr()函数的使用。教学难点利用散点图判断变量间的相关性补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业完成课后复习、预习课后体会授课主要内容任务5.5利用Pandas进行数据相关性分析【引入案例】【任务分析】【知识准备】5.5.1相关分析的概念相关关系指事物或现象之间客观存在但又不具有确定性的依存关系,比如身高与体重的关系就是如此。一般来说,身高越高,体重越重,但二者之间的关系并非严格意义上的对应关系。比如身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。5.5.2相关分析的方法一、利用散点图进行相关分析1.强相关和弱相关相关关系从强弱程度上分为强相关和弱相关。若两个变量的关系较为密切就称为强相关,若两个变量的关系较为疏远,就称为弱相关。从散点图来看,如果呈现窄长且密集时,就是强相关;如果散点图呈现宽松且稀疏时,就是弱相关。2.正相关和负相关如果散点分布在一条直线附近,则称为线性相关。根据相关关系的方向划分,可分为正相关和负相关。正相关是指两个因素(或变量)之间的变化方向一致,都是呈增长或下降的趋势,即一个变量增加(或减少),另一个变量也相应地增加(或减少)。负相关指两个因素或变量之间变化方向相反,即一个变量的数值增大(或减小),另一个变量随之减小(或增大)。二、利用相关系数进行相关分析散点图可以帮助我们直观了解相关关系,但这只是初步的判断,是相关分析的开始。为了说明现象之间相关关系的密切程度,就要计算相关系数。相关系数是定量说明现象间相关关系密切程度的统计分析指标。最常见的相关系数是皮尔逊相关系数。Pearson(皮尔逊)相关系数用来描述在线性相关下两个数值型变量之间相关的方向和相关的程度。Pearson(皮尔逊)相关系数的计算公式如下:Pearson(皮尔逊)相关系数的性质如下:(1)相关系数的取值范围在-1和+1之间,即–1≤r≤1。(2)相关系数r为正,则表明两变量为正相关;若r为负,则表明两变量为负相关。(3)相关系数r的数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或–1,则表示两个现象完全直线性相关。如果r=0,则表示两个现象完全不相关(不是直线相关)。Padnas提供了corr()函数用来计算皮尔逊相关系数,其语法格式如下:DataFrame.corr()【案例解析】【任务实训】教案17教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务6.1利用Matplotlib进行数据可视化(1)教学目的1.掌握创建画布和子图的函数;2.掌握添加画布内容的函数;3.掌握图形的保存与显示函数;4.掌握线条常用的rc参数名称、解释与取值;5.掌握lines.linestyle参数取值及意义;6.掌握lines.maker参数取值及意义;教学重点1.创建画布和子图的函数2.添加画布内容的函数3.lines.linestyle参数取值及意义;4.lines.maker参数取值及意义。教学难点添加画布内容的函数;调节字体的rc参数。补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业课后体会授课主要内容任务6.1利用Matplotlib进行数据可视化(1)【引入案例】【任务分析】【知识准备】6.1.1Matplotlib简介6.1.2Matplotlib绘图流程一、创建画布和子图第一部分主要作用是构建出一张空白的画布,并可以选择是否将整个画布划分为多个部分,方便在同一幅图上绘制多个图形的情况。最简单的绘图可以省略第一部分,而后直接在默认的画布上进行图形绘制。二、添加画布内容第二部分是绘图的主体部分。其中添加标题,坐标轴名称,绘制图形等步骤是并列的,没有先后顺序,可以先绘制图形,也可以先添加各类标签。但是添加图例一定要在绘制图形之后。三、图形的保存与显示6.1.3设置动态rc参数一、线条常用的rc参数名称、解释与取值二、lines.linestyle参数取值及意义三、lines.maker参数取值及意义四、调节字体的rc参数教案18教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务6.1利用Matplotlib进行数据可视化(2)教学目的1.掌握散点图的绘制;2.掌握折线图的绘制;3.掌握饼形图的绘制;4.掌握柱状图的绘制;5.掌握组合图形的绘制。教学重点1.讲解散点图绘制scatter()函数参数;2.讲解折线图绘制plot()函数参数;3.饼形图绘制pie()函数参数;4.柱状图绘制bar()函数参数;教学难点散点图的绘制饼形图的绘制补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业课后体会授课主要内容任务6.1利用Matplotlib进行数据可视化(2)6.1.4利用Matplotlib绘制常见图形一、折线图的绘制plot()函数用来绘制折线图,其语法格式如下:plt.plot(*args,scalex=True,scaley=True,data=None,**kwargs)具体来说,有如下两种调用格式:(1)绘制单条线的语句格式:plt.plot([x],y,[fmt],data=None,**kwargs)(2)绘制多条线的语句格式:plt.plot([x],y,[fmt],[x2],y2,[fmt2],...,**kwargs)二、散点图的绘制scatter()函数用来绘制散点图,其语法格式如下:plt.scatter(x,y,s=None,c=None,marker=None,cmap=None,norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,verts=None,edgecolors=None,hold=None,data=None,**kwargs)三、柱状图的绘制bar()函数用于绘制柱状图,其语法格式如下:bar(x,height,width=0.8,bottom=None,*,align='center',data=None,**kwargs)四、饼形图的绘制pie()函数用于绘制饼形图,其语法格式如下:pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,shadow=False,labeldistance=1.1,startangle=0,radius=1,counterclock=True,wedgeprops=None,textprops=None,center=(0,0),frame=False,rotatelabels=False,*,normalize=True,data=None)五、绘制组合图形有些情况,需要将两个及以上图形绘制在一起,这就用到了表6-1-1中的pyplot模块中的subplot()函数和subplots()函数。【案例解析】【任务实训】教案19教师姓名徐大诏课程名称大数据技术在财务中的应用班级授课日期年月日第周日课时2课型理实一体化章节名称任务6.2利用Pyecharts进行数据可视化(1)教学目的掌握Pyecharts绘图流程;学会使用Pyechart配置项。教学重点Pyecharts绘图流程中常用语句;Pyecharts配置项的使用。教学难点Pyecharts配置项的设置补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业课后体会授课主要内容任务6.2利用Pyecharts进行数据可视化(1)【引入案例】【任务分析】【知识准备】6.2.1Pyecharts简介Matplotlib作为Python中著名的基础绘图库,它具有极其丰富的可视化功能,但仍存在诸多不足,例如图表无法与用户交互、API过于复杂等。为此,Python中引入了数据可视化神器——Pyecharts库,使用Pyecharts可以快速生成效果惊艳的Echarts图表。6.2.2Pyecharts绘图流程利用Pyecharts进行绘图的流程如下:①选择图表类型;②声明图形类并添加数据;③添加配置项;④显示及保存图表。一、选择图表类型从Pyecharts导入想要绘制的图形,其语法格式如下:frompyecharts.chartsimport图表类名具体举例如下:frompyecharts.chartsimportLine#导入折线图frompyecharts.chartsimportPie#导入饼图二、声明图形类并添加数据1.声明图形类2.添加数据像散点图、折线图等二维数据图形,它既有X轴,又有Y轴,所以不仅要为X轴添加数据,还要为Y轴添加数据,一般语法格式如下:add_xaxis(xaxis_data=x_data)#为X轴添加数据add_yaxis(series_name='',y_axis=y_data)#为Y轴添加数据三、添加配置项Pyechart提供了丰富的配置项,包括全局配置项和系列配置项,具体函数如下: set_global_opts():全局配置项,可配置标题、图例、坐标轴、工具箱等。 set_series_opts():系列配置项,可配置图元样式、文字样式、标题样式、点线样式等。options模块是Pyecharts最重要模块之一,里面封装了几乎所有全局配置项和系列配置项的相关对象。在使用配置项之前,必须先导入options模块,其语法格式如下:frompyechartsimportoptionsasopts四、保存及显示图表对于保存及显示图表,常用函数如下:render("a.html")#保存为本地html文件(a为名称),也可以传入路径render_notebook()#jupyternotebook环境下直接显示图表6.2.3Pyechart配置项的使用一、全局配置1.初始化配置项2.标题配置项3.图例配置项4.坐标轴配置项5.工具箱配置项二、系列配置系列配置项是一些针对图表特定元素属性的配置项,包括图元样式、文本样式、标签、线条样式、标记样式、填充样式等,其中每个配置项都对应一个类。教案20教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务6.2利用Pyecharts进行数据可视化(2)教学目的1.掌握散点图的绘制;2.掌握折线图的绘制;3.掌握柱状图的绘制;4.掌握饼形图的绘制。教学重点四种常见图形在绘制时参数的设置教学难点饼形图的绘制补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业课后体会授课主要内容任务6.2利用Pyecharts进行数据可视化(2)6.2.4利用Pyecharts绘制常见图形一、散点图的绘制Pyecharts中的Scatter类表示散点图,EffectScatter类表示带有涟漪特效的散点图,这两个类中均提供了一个add_yaxis()方法,使用add_yaxis()方法可以为散点图添加数据和配置项。add_yaxis()方法的语法格式如下:add_yaxis(self,series_name,yaxis,is_selected=True,xaxis_index=None,yaxis_index=None,color=None,symbol=None,symbol_size=10,label_opts=opts.LabelOpts(position="right"),markpoint_opts=None,markline_opts=None,tooltip_opts=None,itemstyle_opts=None)二、折线图的绘制Pyecharts的Line类表示折线图,该类中提供了一个add_yaxis()方法,使用add_yaxis()方法可以为折线添加数据和配置项。add_yaxis()方法的语法格式如下所示:add_yaxis(self,series_name,y_axis,is_selected=True,is_connect_nones=False,xaxis_index=None,yaxis_index=None,color=None,is_symbol_show=True,symbol=None,symbol_size=4,stack=None,is_smooth=False,is_step=False,is_hover_animation=True,markpoint_opts=None,markline_opts=None,tooltip_opts=None,label_opts=opts.Label0pts(),linestyle_opts=opts.LinestyleOpts(),areastyle_opts=opts.AreaStyleOpts(),itemstyle_opts=None)三、柱形图的绘制Pyecharts的Bar类表示柱状图,该类中提供了一个add_yaxis()方法,使用add_yaxis()方法可以为柱状图添加数据和配置项。add_yaxis()方法的语法格式如下所示:add_yaxis(series_name,y_axis,is_selected=True,xaxis_index=None,yaxis_index=None,is_legend_hover_link=True,color=None,is_show_background=False,background_style=None,stack=None,bar_width=None,bar_max_width=None,bar_min_width=None,bar_min_height=0,category_gap="20%",gap="30%",is_large=False,large_threshold=400,dimensions=None,series_layout_by="column",dataset_index=0,is_clip=True,z_level=0,z=2,label_opts=opts.LabelOpts(),markpoint_opts=None,markline_opts=None,tooltip_opts=None,itemstyle_opts=None,encode=None)四、饼形图的绘制Pyecharts中的Pie类表示饼形图,该类中提供了一个add()方法,使用add()方法可以为饼形图添加数据和配置项。add()方法的语法格式如下:add(series_name,data_pair,color=None,radius=None,center=None,rosetype=None,isclockwise=True,label_opts=opts.Label0pts(),tooltip_opts=None,itemstyle_opts=None)【案例解析】【任务实训】教案21教师姓名课程名称大数据技术在财务中的应用班级授课日期年月日第周课时2课型理实一体化章节名称任务7.1企业偿债能力与营运能力分析(1)教学目的1.学会利用Pandas计算企业偿债能力指标并进行可视化;2.能够利用Pandas进行数据的综合处理;3.能够根据偿债能力指标值进行分析。教学重点利用Pandas计算偿债能力指标教学难点根据偿债能力指标值进行分析补充、删节、更新教具计算机、极域电子教室、JupyterNotebook软件课外作业课后体会

授课主要内容任务7.1企业偿债能力与营运能力分析(1)【引入案例】【任务分析】【知识准备】7.1.1企业偿债能力分析一、短期偿债能力分析1.营运资金的含义与计算2.流动比率的含义与计算3.速动比率的含义与计算4.现金比率的含义与计算【做中学】讲练二、长期偿债能力分析1.资产负债率的含义与计算2.产权比率的含义与计算3.权益乘数的含义与计算4.利息保障倍数的含义与计算【做中学】讲练三、影响偿债能力的其他因素1.可动用的银行贷款指标或授信额度当企业存在可动用的银行贷款指标或授信额度时,这些数据不在财务报表内反映,但由于可以随时增加企业的支付能力,因此可以提高企业的偿债能力。2.资产质量在财务报表内反映的资产金额为资产的账面价值,但由于财务会计的局限性,资产的账面价值与实际价值可能存在差异,如资产可能被高估或低估,一些资产无法计入到财务报表等。此外,资产的变现能力也会影响偿债能力。如果企业存在很快变现的长期资产,会增加企业的短期偿债能力。3.或有事项和承诺事项如果企业存在债务担保或未决诉讼等或有事项,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论