金融统计03假设检验与方差分析_第1页
金融统计03假设检验与方差分析_第2页
金融统计03假设检验与方差分析_第3页
金融统计03假设检验与方差分析_第4页
金融统计03假设检验与方差分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章假设检验与方差分析,第1节 假设检验 第2节 方差分析 第3节 方差分析应用:恩格尔系数 的城乡比较,第1节 假设检验,主要内容 假设检验的概念 假设检验的标准 假设检验的步骤,假设检验的概念及形式,假设检验 对总体的某个参数或分布形式作出某种假设,然后利用样本信息来判断假设是否成立 假设检验的形式 假设分为原假设(H0)和备择假设(H1)两种 原假设(Null hypothesis):初始假定为真的假设 备择假设(Alternative hypothesis):与原假设的内容相反,当原假设被拒绝时,被认为是真的假设 应用中,原假设一般是旧的、他人的观点或理论,备择假设一般是新的、自己的

2、观点或理论,而统计分析的目的往往就是以新的数据来拒绝原假设,支持自己的观点 所以,习惯上,能拒绝原假设的检验,称为显著的、有统计意义的(Significant),否则为不显著,原假设(H0)和备择假设(H1)例,某汽车使用改进型发动机后声称油耗不超过百公里6升,对此进行检验 检验假设的设定:设u为百公里平均油耗,则 单边检验(只检验小于或大于检验值中的一种情况) 工厂对收到的一批长度为2cm的零件抽检,检验长度是否合格? 检验假设的设定:设u为平均长度,则 双边检验(同时检验小于、大于检验值的两种情况,常用),假设检验的标准:显著水平,显著水平的定义 假设检验中的第一类错误(type I er

3、ror):拒绝正确的原假设(H0) 显著水平指犯第一类错误的最大概率,通常设定为5%或1% 显著水平的理解 形象的说,显著水平为1%是指,拒绝100次原假设,只有1次是拒绝错了(即只有1次原假设确实正确) 因为原假设往往是公认的观点、成熟的理论,甚至已经反复检验证明是正确的,所以为了加强拒绝的说服力,应设定一个严格的拒绝标准,即要将显著水平设的很小 显著水平越小,原假设值的允许变动范围就越大,备择假设成立的范围就越小,备择假设成立的概率就越小。如果能成立,则结论就很有说服力,不同显著水平的比较(单边检验),假设国家标准规定冰箱使用年限必须10年或以上 对某品牌抽样检验时,如果显著水平设为40%

4、,则样本均值9年或以下即可认定为不合格。显著水平设为5%,则样本均值4年或以下才可认定为不合格,相当于把原假设放宽到H04,更有说服力,原假设H0 =10 即假设某品牌合格,4,某品牌冰箱总体的特征,显著水平5%,概 率,显著水平40%,9,10,冰箱使用年限,图中4为5%的临界值 9为40%的临界值,显著水平的运用:t 统计量,t 统计量的定义 假定总体服从正态分布,则抽取的样本的平均值可用下列公式换算成t 分布的值(简称t值),该值可用来判断样本平均值相对于总体平均值的误差程度 t 统计量公式的理解 公式中总体均值0在假设检验时,等于原假设H0的值 上述t值公式就是将样本均值换算成一个标准

5、化的t值,这与将正态变量换算成标准正态变量一样,所以t分布的中心为0 显然,t值的绝对值越大,样本均值离原假设H0的值越远,样本越不支持原假设,显著水平的运用: t 检验,显著水平在t 检验中的运用过程如下: 假定原假设成立,比如 将样本统计量的值按前述公式换算成t值,其中0 等于原假设的,比如10 从t分布表查出某一显著水平(比如5%)的临界值t0.05 比较换算的t值与临界值t0.05 。如果|t值| t0.05 ,则拒绝原假设,反之,接受原假设,t检验示意图(双边检验,显著水平设为5%),将样本均值换算成标准化的t值,如果|t值|临界值,表明样本均值离原假设的总体均值很远,样本来自于这个

6、总体的可能性很小,于是原假设(H0)成立的概率也很小,所以拒绝H0,0,t临界值(约为-2),2.5%,t值,拒绝域,单边检验示意图,显著水平,概 率,拒绝域,t临界值(约为2),2.5%,95%,假设检验的实用标准:P值,根据样本值计算的显著水平又称为P值 比如:5%显著水平下的临界值为4,而实际的样本均值为3,小于临界值,则P值也小于5%(比如4%等) 统计软件作检验时,通常会根据样本值计算相应的P值,所以一般直接使用P值作为假设检验的标准,非常方便 判断原理如下 如果P值1%,则检验值在1%水平显著,拒绝H0 如果1%5%,则检验值不显著,接受H0,P值与t 统计量,主要区别 P值不依赖

7、于样本变量的分布形式,适用于任何假设检验,而t统计量依赖于样本变量的分布,适用范围有限 P值可直接与显著水平比较,判断简单,而t统计量需查表、换算,判断复杂 在应用统计的假设检验中,更多使用P值作为检验标准 主要联系 一般情况下, P值和t值有如下对应关系: P值5%时,|t值| 2 所以实用中(比如回归分析中),要获得有统计意义的结论(即在5%显著水平拒绝原假设(H0),可作下列任一种判断: 看P值时,应5% 看|t值|时,应 2,假设检验的步骤,(1)选择要检验的统计量(比如样本均值) (2)确定原假设( H0 )和备择假设( H1) (3)确定检验的显著水平(一般为5%) (4)查表确定

8、与显著水平相对应的t分布的临界值 (5)将要检验的统计量换算成标准化的t值 (6)根据要检验的统计量的|t值|大于还是小于临界值,决定是否拒绝原假设( H0 ) 如果使用统计软件,则只要(1)、(2)、(3)步,然后看输出的P值是否小于显著水平决定是否拒绝原假设,假设检验例,将旅客对机场的评价分为10级,7级以上为高服务质量。随机抽取12名旅客对某机场的评级,分别为7、8、10、8、6、9、6、7、7、8、9、8。检验该机场是否为高服务质量?,假设检验例(续),(1)确定检验样本均值 (2)确定原假设和备择假设 (3)确定显著水平为5% (4) 查表得t分布的临界值 (5)将样本均值换算成标准

9、化的t值 (6)要检验的统计量的|t值|临界值,所以拒绝原假设( H0 ): 结论是:7.75确实大于7,该机场是高服务质量,第2节 方差分析,主要点内容 方差分析的概念 组间平方和与组内平方和的概念 如何判断方差分析的结果,什么是方差分析?,方差分析(ANOVA)的定义 在相同方差假定下,检验多组正态样本的均值是否相等的一种统计分析方法 方差分析的基本概念 因子:实验中会改变状态的因素 因子的水平:因子的状态 方差分析的应用例 两种抗生素对某种疾病的疗效是否相同? 某软件的升级版是否比原版运行速度更快? 三个工厂生产的零件是否强度相同? (单因子:工厂;三个工厂该因子有三个水平),单因素方差

10、分析的统计模型,模型的假定: 因子A有r个水平,在第i水平下对要检验的指标作m次相互独立的观察,获得关于总体i的一个样本 假定总体i服从均值为 ,方差为 的正态分布 模型要检验的问题: 模型检验的结论: 检验结果为F分布的值及其P值。一般将显著水平设为0.05,则当P0.05时,拒绝H0,即r个水平不全相同;当P0.05时,接受H0,即r个水平全部相同。,单因素方差分析原理(1),假定: 因子A有r个水平,在第i水平下对要检验的指标作m次相互独立的观察,获得关于总体i的一个样本。则共有 个观察值 总离差平方和为,总离差的两个来源:组间平方和与组内平方和 组间平方和,即每个水平的均值与总均值的离

11、差的平方和 组内平方和,即每个水平内,各观察值之间的离差的平方和,视为随机取样的误差 总方差和两个来源的关系,单因素方差分析原理(2),如何判断各个水平下的均值是否相等? 对组间平方和SA与组内平方和Se分别作自由度调整 将调整后的组间平方和SA与组内平方和Se相除,该比值服从F分布 F值1,表示组间的差距组内的随机差距,各组数据可能有质的区别,均值相等的可能性较小 根据F分布值的P值大小即可判断均值是否相等:P值0.05,检验结果显著,拒绝H0,即不全相等; P值0.05为接受H0全相等,单因素方差分析原理(3),使用EViews软件作单因素方差分析例(1),某银行规定VIP客户的月均账户余

12、额要达到100万元,并以此作为比较各分行业绩的一项指标。现从三个分行(A1、A2、A3)中,分别随机抽取4个VIP客户账户,用单因素方差分析判断三个分行此项业绩指标是否相同。,例续1: EViews数据表,定义三个分行变量,分别输入4个账户余额,得数据表,例续2:三个分行账户余额的均值,求随机变量的均值等基本统计量: 菜单ViewDescriptive StatsCommon Sample,例续3:作方差分析选菜单ViewTest of Equality,例续4:检验结论,显然方差分析的F分布值的P值=0.00010.05,拒绝H0,即三个分行VIP账户余额不全相同。,使用EViews软件作单

13、因素方差分析的详细结果,Source of variation: 离差来源 Between: 组间平方和 Within: 组内平方和 Total: 总平方和,df: 自由度,方差分析例:工资(1),从美国劳工部的统计中,选出两个职业男、女周工资数据,分别分析两个职业的男女工资差异,方差分析例:工资(2),各变量的基本统计量表 两种职业的男平均工资均大于女平均工资 财务管理男平均工资高出较大,方差分析例:工资(3),财务管理职业男女工资差别 方差分析的检验假设 H0 :财务管理职业男女平均工资相等 H1 :财务管理职业男女平均工资不相等 方差分析的检验结果 F值22.84,p值0.001 F值2

14、2.84,男女组间差距是各自组内差距的20倍以上。p值0.001,远远小于5%的显著水平(即非常显著),故拒绝H0 ,男女平均工资不相等,或者说男女平均工资差异大于抽样误差,方差分析例:工资(4),计算机程序员职业男女工资差别 方差分析的检验假设 H0 :计算机程序员职业男女平均工资相等 H1 :计算机程序员职业男女平均工资不相等 方差分析的检验结果 F值0.99,p值0.35 F值0.99,男女组间差距比各自组内差距还小。 p值0.35,远远大于5%的显著水平(非常不显著),不能拒绝H0 ,所以男女平均工资相等,差距来自抽样误差,第3节 方差分析应用:恩格尔系数的城乡比较,主要内容 恩格尔系

15、数的概念 对我国近年城乡恩格尔系数的方差分析,有关居民消费结构的恩格尔系数,恩格尔系数(Engels Coefficient) 反映如下规律 收入越少,食品支出占总消费支出的比率越高,恩格尔系数越大 随着国民经济的增长,恩格尔系数呈下降趋势 国际标准 根据联合国粮农组织提出的标准,恩格尔系数在59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于 30%为最富裕。,我国近年恩格尔系数(表),联合国粮农组织的标准,我国城镇居民的系数在30-40%之间,为富裕水平;农村居民的系数在40-50%,为小康水平 近年农村居民的恩格尔系数下降较为明显,我国近年恩格尔系数(图),总体趋势是下降,但有波动。主要原因是农产品价格波动 农村居民恩格尔系数“悖论”: 农产品价格上升收入增加食品消费支出增加恩格尔系数不变,城乡恩格尔系数的方差分析(均值),分析假设: H0:城镇和农村恩格尔系数的均值相等 H1 :城镇和农村恩格尔系数的均值不相等 分析结论: F分布的值在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论