财经大数据分析-以Python为工具 课件 ch08-分析一般公司债的票面利率影响因素-应用统计分析_第1页
财经大数据分析-以Python为工具 课件 ch08-分析一般公司债的票面利率影响因素-应用统计分析_第2页
财经大数据分析-以Python为工具 课件 ch08-分析一般公司债的票面利率影响因素-应用统计分析_第3页
财经大数据分析-以Python为工具 课件 ch08-分析一般公司债的票面利率影响因素-应用统计分析_第4页
财经大数据分析-以Python为工具 课件 ch08-分析一般公司债的票面利率影响因素-应用统计分析_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python与财经大数据分析基础第8章分析一般公司债的票面利率影响因素——应用统计分析王彦超教授博士生导师中央财经大学会计学院CONTENTS目录04回归分析05应用实践01描述性统计02随机变量及其概率分布03推断统计01描述性统计描述性统计是指综合运用计算指标、分类等方式来描述一组数据的特征,帮助读者了解数据。描述性统计的基本指标主要包括数据的位置以及数据的离散程度。8.1描述性统计(一)概述在获取数据之后,我们通常需要了解数据的位置分布特征,例如最小值、最大值、平均数、中位数、众数、分位数等指标。Python中可以使用Pandas模块完成数据位置指标的获取。8.1描述性统计(二)数据的位置分布函数函数说明DataFrame.min()/DataFrame.max()最小值/最大值DataFrame.mean()平均数DataFrame.median()中位数DataFrame.mode()众数DataFrame.quantile()分位数数据位置指标能帮助读者分析一组数据的平均水平或中间位置,但是要了解数据集中和分散程度,则需要用到极差、偏差、方差以及标准差,在Python中主要通过Pandas模块完成数据离散度指标的获取。8.1描述性统计(三)数据的离散程度函数函数说明DataFrame.max()-DataFrame.min()极差DataFrame.mad()平均绝对偏差DataFrame.var()方差DataFrame.std()标准差

Pandas库提供descibe()函数,可以直接得到描述性统计的主要指标,例如样本量、均值、方差、最值、分位数等统计特征。8.1描述性统计(三)describe函数02随机变量及其概率分布随机变量是随机试验各种结果的实值单值函数,随机事件的数量表现。随机变量分为离散型随机变量和连续型随机变量。一般而言,随机数并不是真正的“随机”,而是服从于某种概率分布,根据随机变量的分类,有离散型概率分布和连续型概率分布。财会金融领域经常使用的概率分布如下所示。8.2随机变量及其概率分布(一)概述

8.2随机变量及其概率分布(二)正态分布在Numpy库中使用normal()函数生成正态分布。8.2随机变量及其概率分布(二)正态分布假设X服从标准正态分布N(0,,1),Y服从自由度为n的卡方分布,那么变量Z服从自由度为n的t分布,记作Z~t(n)。随着自由度n逐渐增大,t分布将逐渐接近标准正态分布。8.2随机变量及其概率分布(三)t分布假设两个随机变量x1和x2相互独立,且分别服从自由度是n1和n2的卡方分布,则称统计量F服从自由度n1和n2的F分布,记作F~F(n1,n2)。8.2随机变量及其概率分布(四)F分布03推断统计推断统计是研究如何利用样本数据来推断总体特征的统计方法。推断统计包括两方面的内容:参数估计和假设检验。8.3推断统计(一)概述

8.3推断统计(二)参数估计假设检验是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的推断统计方法。

进行假设检验主要经历四个步骤。第一,提出原假设H0和备择假设H1。第二,构造检验的统计量及其分布。第三,确定显著性水平α,以及确定检验规则。第四,根据检验规则作出决策。8.3推断统计(三)假设检验

不拒绝H0拒绝H0H0为真1-α(正确)α(拒真错误)H1为假

(取伪错误)1-

(正确)t检验主要用于样本含量较小(例如样本量小于30),总体标准差σ未知的正态分布。常见的t检验主要有单样本t检验、配对样本t检验和独立样本t检验。8.3推断统计(二)假设检验04回归分析协方差表示的是两个变量总体误差的期望。如果两个变量的变化趋势一致,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,那么两个变量之间的协方差就是负值;如果两个变量是统计独立的,那么二者之间的协方差就是0。8.4

回归分析(一)协方差cov()函数相关系数是用以反映变量之间相关关系密切程度的统计指标。与协方差不同,相关系数排除了变量之间量纲的差异。常见的相关系数计算方法包括pearson相关系数、spearman相关系数等。8.4

回归分析(二)相关系数corr()函数8.4

回归分析(三)线性回归线性回归是找到多维空间中的一条直线(线性回归方程),使得其尽可能地去拟合变量之间的“隐式关系”。普通最小二乘法(OrdinaryLeastSquare,OLS),是线性回归模型中最基本的估计方法,原理就是使残差的平方和达到最小。statsmodel库是Python一个强大的统计分析库。我们使用statsmodels.api库的OLS()进行线性回归。需要特别注意的是,进行线性回归的变量不能有缺失值,否则会报错。8.4

回归分析(三)线性回归05应用实践“指数信息.xlsx”为2008年至2021年发行的一般公司债数据,票面利率为发行时票面利率,总资产报酬率、资产负债率、流动比率为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论