版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第四章统计推断:估计与假设检验 # 4.1统计推断的含义总体和样本总体是指我们所关注现象出现的可能结果的全体,样本是总体的一个子集(例如,杭州的人口;下沙开发区的人口)。宽泛地说,统计推断研究的是总体与来自总体的样本之间的关系。国内股票交易市场共有1500多支股票。假定某一天从中随机选取50支,并计算这50支股票价格与收入比的平均值一即P/E比值。(例如,一支股票的价格为50元,估计年收益为2.5美元,则P/E为20;也就是说,股票以20倍的年收益出售。)根据50支股票的平均P/E值,能否说这个P/E值就是总体的1000多股票的平均P/E值呢?X如果令X表示一支股票的P/E值,表示50支股票
2、的平均P/E值,能否得知总体的均值XE(X)呢?此处统计推断的实质就是从样本值均值()归纳出总体值E(X)的过程。4.2参数估计通常假定某一随机变量X服从某种概率密度,但并不道其分布的参数值。例如,X服从正态分布,想知道其两个参数,均值E(X)=UX,及方差v。Xx为了估计未知参数,一般的步骤是:假定有来自某一总体,样本容量为n的随机样本,根据样本估计总体的未知参数。因此,可将样本均值作为总体均值(或期望)的估计量,样本方差作为总体方差的估计量。这个过程称为估计问题,估计问题有两类:点估计(pointestimation)和区间估计(intervalestimation)。假定随机变量X(P/
3、E值)服从某一未知均值和方差的正态分布。但是,有来自该正态总体的随机样本(50个股票的P/E值),如何根据这些样本数据计算总体的均值uX(=E(X)和方差x2?频数6272S?9枣10511712513414315斗165181合计:样本育差-5-275予样本師进差=5.0456中ii数-众数-11?0表4-1点估计X据表4-1的数据50个P/E的样本均值为11.5,显然我们可以选择作为UX的估计值。X我们称这个单一数值为ux的点估计值。X(注意:点估计量是一个随机变量,因为其值随样本的不同而不同。)X某一特殊的估计值(比如11.5)的可信度有多大呢?虽然可能是总体均值的“最好的”估计值,但是
4、某个区间,比如10,更可能包括了总体均值。这正是区间估计的基本思想。区间估计),则(回区间估计的主要思想源于估计量的概率分布的概念。如果随机变量XN(ux忆第三章中心极限定理):XN(uX或,ZN(0,1即样本均值的抽样分布也服从正态分布。2Q-(XX)2如前所述,通常未知,可用其估计量S2i代替,则:xnt.Xtxs/服从自由度为(n1)的t分布。在P/E一例中,共有50个样本观察值,因此自由度为49。查附录中的t分布表可得:P(2.0096WtW2.0096)=0.95也即区间(一2.0096,2.0096)包括t值的概率为95%。2.0096和2.0096称为临界t值,表明了在临界值区间
5、内,位于t分布曲线下区域的比例。X/把t代到p(2.0096WtW2.0096)=0.95中,得到:XsP(2.0096WtXl3,称为单边备择假设。XHl:uXl3,也称为单边备择假设。XHl:uxH13,称为双边备择假设。X为了检验零假设(与备择假设),可以根据样本数据(比如,根据表4-1得到的样本平均P/E值11.5)以及统计理论建立判定规则来判断样本信息是否支持零假设。如何建立判定规则呢?有两个互补的方法:置信区间法显著性检验法4.4.1置信区间法2根据表4-1提供的数据计算出样本均值为11.5。可指样本均值服从均值为uX方差为的正态分布。但是由于真实的方差是未知的,所以用样本方差来代
6、替,在这种情况下,样本均值服从t分布,tX。根据t分布,得到ux的一个95%的置信区间:WuXW12.36(近似值)X置信区间提供了在某一置信系数下(比如95%)真实的口乂取值范围。因此,如果这个X区间不包括零假设中的值,比如=13,那么会拒绝零假设以95%的置信度拒绝该零假X设。从上面的讨论中,可以看到置信区间与假设检验密切相关。用假设检验的语言,不等式WuXW12.36X描述的置信区间称为接受区域,接受区域以外的称为拒绝区域。接受区域的上界和下界称为临界值(criticalvalues)。可以表述为:如果参数值在零假设下位于接受区域内,则不拒绝零假设。但如果落在接受区域以外(也即落在拒绝区
7、域内),则拒绝零假设。在这个例子中,拒绝零假设H0:uX=13,因为这个值落在临界区域,它比接受区域X的上界12.36大,也即这是一个小概率事件不到2.5%。简言之,如果参数值超过上临界值或低于下临界值,那么就拒绝零假设。4.4.2第一类错误和第二类错误在P/E例中,我们拒绝H0:uX=13,这是否意味着表41给出的样本不是来自于均值X为13的正态总体呢?或许事实的确如此。但是不等式(10.63WuXW12.36)的置信区间的置X信度仅为95%而并非100%。如果真的如此,那么拒绝H0:uX=13,就可能能犯错误。此时X犯了第一类错误一一即弃真错误。同样的原因,假定零假设H0:uX=12,在这
8、种情况下,根据不等式(10.63WuXW12.36),XX我们应该不拒绝这个零假设。但是表4-1这个样本很可能不是来自均值为12的正态总体。此时,会犯第二类错误,也即取伪错误。用另一个例子进一步阐明假设检验的置信区间法。例4.2某种包装椒盐花生的重量服从标准正态分布,但均值与标准差均是未知的,均值的度量单位为盎司。随机选取20包发现其样本均值和样本标准差分别为6.5盎司和2。检验零假设:真实均值为7.5盎司;备择假设:真实均值不是7.5盎司。给定99%的置信系数(或1%的置信水平,皆表示犯第一类错误的概率至多为1%)。令X代表坛子中花生的重量,因此XN(u,),两个参数均未知。由于真实X方差是
9、未知的,所以它服从自由度为19的t分布:tXt/、/2019从附录表可知,自由度为19时,P(2.681WtW2.681)=0.99可得:P(X2.681SuX2.681S)0.99x冋X将=6.5,S=2,代入上式,我们得到了UX的一个99%的置信区间。X5.22WuXW7.78(近似值)X由于区间包括了零假设值7.5,因此,我们不拒绝零假设:真实的uX=7.5。X“产了产在此区间567Mb)It4-S对叨眈的直信呂间可询珈的置皓国间(例4$|4_4)例4.3在例4.2中,若置信水平a为5%;即决定冒更大的风险犯第一类错误。那么情况如何呢?根据t分布表,当a=5%,自由度为19时,t的临界值
10、为-2.093和+2.093,因为P(2.093WuW2.093)=0.95X按照例4.3的步骤,能够求得:5.56WuXW7.44(近似值)X从中可以看出,这个区间不包括7.5,因此,拒绝零假设:ux=7.5。X两个例子的不同之处在于后者的置信区间比前者略窄一些,后者愿意冒较大的风险去犯第一类错误,即弃真错误。4.4.3显著性检验显著性检验方法的基本思想:由于tXx服从自由度为(n1)的t分布。可知X,S,n,惟一未知的是ux。但如x果设定冬为某一值,则可以求出惟一个t值,根据t分布很容易求得获此t值的概率。如果X与uX的差(绝对值)不大,则Itl也会很小。如果X=UX,贝比值为0,在此情况
11、下接XX受零假设。因此,随着t|值偏离0,将逐渐地趋向拒绝零假设,即根据t分布表,给定自由度,|t|值越大,则获此|t|值的概率就越小。但在能拒绝零假设之前,最大的|t|值是多少呢?取决于置信水平.(或者理解为取决于置信区间大小),即犯第一类错误的概率,以及自由度。在P/E例中,U=11.5,S=3.0456,n=50。Xt(11.513).4826令H0:uX=13,H1:uXM13,因此有XX3.0456/冋根据这个t值能否拒绝零假设?首先必须设定置信水平,假定=5%。由于备择假设是双边假设,可以将犯第一类错误的风险均分在t分布的两侧的两个拒绝区域,如果计算的t值位于任何一个拒绝区域,就能
12、够拒绝零假设。当自由度为49时,在5%的显著水平下,临界的t值为-2.0096和2.0096,获此t值小于或等于一2.0096的概率为2.5%,获此t值大于或等于2.0096的概率也为2.5%。本例中计算的t值约为一3.5,位于t分布的左侧拒绝区域,因此拒绝零假设。用显著性检验的语言,经常遇到下面两个术语:(1)检验(统计量)是统计显著的。(2)检验(统计量)是统计不显著的。当检验是统计显著的,一般是指能够拒绝零假设。当检验是统计不显著的,是指不能拒绝零假设。4.4.4显著水平的选择与p值假设检验的古典方法一般常用的值有1%、5%和10%,但是这些值并不是固定不变的。在实践中常用p值(即,概率值),也称为统计量的精确置信水平,可定义为拒绝零假设的最低置信水平。(反过来,即是拒绝零假设的最高置信系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度机械设备维修合同维修项目与质量保证3篇
- 上海市城市供电系统改造施工合同
- 主题公园演员录用合同样本
- 茶艺馆服务员劳动合同
- 钢结构户外自行车赛道施工合同
- 二零二四年度健身房设施购置与运营管理合同3篇
- 高中数学代数方程课程设计
- 高中历史类课程设计
- 2024年度物联网智能穿戴设备生产销售合同3篇
- 2024年时尚品牌生产合同
- 人才公寓建设实施计划书
- 苏教版小学数学六年级上册 解决问题的策略(2)(全国一等奖)
- 《自信主题班会》主题班会ppt课件完整版
- 2024传染病预防ppt课件完整版
- 病理性跳楼的心理咨询技巧与方法
- 2024年内蒙古能源集团有限公司招聘笔试参考题库含答案解析
- 精神疾病护理常规课件
- 2024年中煤平朔发展集团招聘笔试参考题库含答案解析
- 泌尿外科肾结石个案护理
- 经济学基础期末试卷及参考答案1
- 护士临床思维能力培养
评论
0/150
提交评论