统计推断：估计与假设检验

上传人：1*** IP属地：湖北上传时间：2021-10-18 格式：PPT 页数：59 大小：267.50KB 积分：30 举报 版权申诉

已阅读5页，还剩54页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、只有一条路不能选择，那就是放弃的路；只有一条路不能拒绝，那就是成长的路。l有三位计量经济学家在森林中猎鹿，他们发现50米远处有一只很大的猎物正站在那里。第一位计量经济学家举枪射击，击中了鹿身后两米远的一棵树。第二位计量经济学家也几乎同时开枪，击中了鹿身前两米远的一棵树。第三位计量经济学家高兴得跳起来，并喊道：“平均的看，我们击中它了！”l显然无偏性有一些缺陷，但在其他条件不变的情况下，平均而言正确通常总比平均而言错误要好一些。l如果这两位计量经济学家击中了离鹿的心脏2厘米远的位置，而不是几米远的地方，那么他们将会边吃鹿肉边庆祝他们的成功。l无偏性之外，还要考虑，估计量方差的大小。1、估计和假设

2、检验：统计推断的两个孪生分支2、参数估计3、点估计量的性质4、假设检验l我们知道，总体是指我们所关注现象出现的可能结果的全体，样本是总体的一个子集。统计推断研究的是总体与来自总体的样本之间的关系。l一般地说，统计推断是根据来自总体的样本对总体（概率密度函数）的种种统计特征作出判断。l统计推断的主要步骤（举例说明）：l首先，关注某一总体，如纽约股票交易市场的1758支（90年9月4日）股票，想要研究该总体某一方面的统计特征，比如说股票价格与收入比（P/E）的平均值。在总体中抽取随机样本，如50支股票，求样本中每一支股票的P/E值，然后再计算平均P/E值，即，就称为总体平均P/E的估计量

3、（也即E(X)的估计量，E(X)为总体的一个参数）。从而完成统计推断的第一步：参数估计。XXl其次，判断估计值的“优度”，主要因为估计值很可能不等于真实的参数值。l如果有两个或更多个随机样本，计算这些样本的均值，则得到的估计值很可能不相同。我们把不同样本估计值的差异称为抽样误差，从而引入一些判定估计量优劣的常用标准。l再次，进行假设检验。假设检验是统计推断的另一个重要方面。在假设检验中，可以对某参数的假定值进行先验判断或预期。如以往的经验或专家意见指出1758值股票总体的平均P/E值为12，若随机样本计算出的值为11，则根据假设检验的内容接受假设或者拒绝假设。l点估计：假定随机变量X(P/E)

4、服从某一未知均值和方差的正态分布。并且有来自该正态总体的一个随机样本（50个P/E值），见下表。l如何根据这些样本数据计算总体的均值和方差呢？先假设只关注总体均值x =E(X)。l根据表中数据，50个P/E的样本均值为11.4，显然我们可以选择11.4作为x的估计值，称这个单一数值为x的点估计值，称计算公式50150iiXX为x的点估计量。67891011121314151618P/E频数225657543461均值=11.5样本方差=9.2755样本标准差=3.0456中位数=众位数=11总计：50假设的样本（50值股票的P/E值）注意：点估计是一个随机变量，因为其值随样本的不同而不同，那么

5、，某一特殊的估计值的可信度有多大呢？为了更好地估计总体特征，引入区间估计。区间估计：区间估计的主要思想源于估计量抽样分布（概率分布）的概念。我们知道，如果随机变量XN(x,x)，则，nNXx,)1 ,0()(NnXZx或若x未知，可用其估计量S来替代，则有：nSXtx)(服从自由度为(n-1)的t分布。在上里中，由50个样本观察值，故自由度为49。查t分布表得到： P(-2.0096t2.0096)=0.95即区间-2.0096，2.0096包括t的概率为95%。将t变量公式带入，经整理得： 10.63 x 12.36，即为x的95%的置信区间。自由度为49的t分布2.5%95%2.5%02.

6、0096-2.009695. 0)0096. 2)(0096. 2(nSXPX由计算式 P(-2.0096t2.0096)=0.95可得出：95. 00096. 20096. 2nSXnSXPX整理得：在统计学中，上述公式称为未知的总体均值x的一个95%的置信区间。0.95称为置信系数。表示随机区间包括真实x的概率为0.95。区间下限区间上限需要特别强调一点：上式给出的区间是随机的区间，它依赖于样本值的变化而变化，尽管总体均值x是未知的，但它是固定值，而非随机量。由此，我们不能说x位于上述区间的概率为0.95，只能说该区间包括真实的x的概率为0.95。与点估计相比区间估计提供了在某一置信度下，

7、真实参数的取值范围。归纳区间估计概念假定随机变量X服从某一概率分布，若要对其参数（如x ）进行估计。选取容量为n的随机样本，X1，X2，Xn，并根据样本计算两个估计量L和U： P(L x U)=1- 01即从L到U的随机区间包括真实x的概率为(1- )。L称为区间下限，U称为区间上限。该区间称为x的置信区间。 (1- )称为置信系数，称为显著水平，或犯第一类错误的概率。l在P/E一例中，用样本均值作为x的点估计量，满足了以下性质：l 线性l 无偏性l 有效性l 最优线性无偏估计量l 一致性l线性估计量：若估计量是样本观察值的线性函数，则称该估计量是线性估计量。l上式看出，样本均值是样本观察值X

8、s的线性函数，即Xs仅以一次幂的形式出现。niniXXXnnXX121)(1l无偏估计量：如果重复使用某种方法，得到的估计量的均值（如E( )）与真实参数值x一致，该估计量就是无偏估计量。即XXXE)(如果二者不相等，则称该估计量是有偏的估计量。例1：若XiN(x ，)，假定从该正态总体中随机抽取容量为n的样本。则样本均值是真实x的无偏估计量。（参考样本均值的抽样分布或概率分布）。例2：若XiN(x ，)，假定从该正态总体中随机抽取容量为n的样本。Xmed表示样本中位数，可以证明E(Xmed)= x ，即样本中位数也是真实均值的无偏估计量。Xl有效估计量：若仅考虑唯一一个参数的估计量，则方差

9、最小的估计量是最好的或称为有效的估计量。l对比样本均值和样本中位数。l假定随机变量X的取值构成一随机样本，样本容量为n，并且每个XN(x ，)，令、Xmed分别表示样本均值和样本中位数。已知：l N(x ，/n)l若样本容量足够大，可以证明，l XmedN(x ，(/2)(/n)XX即对大样本而言，样本均值和样本中位数均服从均值为x 的正态分布，但样本中位数的方差是样本均值的方差的( /2)倍。根据有效性的性质，用样本均值估计x比用样本中位数Xmed更准确，即样本均值提供了一个比样本中位数更为准确的总体均值的估计值。Xl最优线性无偏估计量（BLUE）：如果一个估计量是线性的和无偏的，并且

10、在参数的所有线性无偏估计量中，这个估计量的方差最小，则称这个估计量是最优线性无偏估计量。l显然，该性质包括了线性、无偏性和有效性。l假定XN(x ，)，从该正态总体中抽取一容量为n的随机样本。现考虑x的两个估计量：nXXi1*nXXi第一个估计量是常用的样本均值，则 E( ) = x 。X可以证明，XnnXE1)(*显然第二个估计量X*是一个有偏估计量。两个估计量的差别在于前者的分母是n而后者的分母是n+1。但是，假定我们增大样本容量，则随着样本容量的增大，第二个估计量X*的均值也将近似等于真实的x ，在统计学中，我们称这样的估计量（如X*）为一致估计量。有时得不到无偏估计量，但却可以得到一个

11、一致估计量。xn=100n=80n=50n=25概率密度f(X*)随着样本容量的增大，总体均值估计量X*的变化示意图1、估计和假设检验：统计推断的两个孪生分支2、参数估计3、点估计量的性质4、假设检验l在股票的P/E一例中，上一节我们根据50个P/E值组成的随机样本，建立了x 的一个95%的置信区间。即在该区间内包括x 的概率为95%。l现在改变策略，不是建立一个置信区间，而是假设真实的x 取某一特定值，如x =13。然后去检验这个假设，检验结果是接受或拒绝该假设？下面以此为例说明。67891011121314151618P/E频数225657543461均值=11.5样本方差=9.27

12、55样本标准差=3.0456中位数=众位数=11总计：50假设的样本（50支股票的P/E值）用假设的语言，将x =13称为零假设（原假设），用符号H0表示。即，H0: x =13与零假设相对应的是备择假设，用符号H1表示，备择假设有以下几种形式：H1： x13 称为单边备择假设（右侧）； H1： x13 称为单边备择假设（左侧）；H1： x13 称为双边备择假设。为了检验零假设（和备择假设）,根据样本数据及统计理论建立判定规则来判断样本信息是否支持零假设。若支持，不拒绝零假设，反之拒绝零假设，接受备择假设。建立判定规则有两种方法：置信区间法、显著性检验法。l在上述例子中，我们知道样本均值服从均

13、值为x ，方差为/n的正态分布，由于真实的方差未知，以样本方差代替。在这种情况下，样本均值服从t分布，从而得到x 的一个95%的置信区间： 10.63 x 12.36 （近似值）l置信区间提供了在某一置信度下（如95%）真实的x 的取值范围。因此，如果这个区间不包括零假设中的值，如x =13，则拒绝零假设，即我们以95%的置信度拒绝零假设。反之，接受零假设。接受区域：上述不等式所描述的置信区间称为接受区域。零假设的临界区域（或拒绝区域）：接受区域以外的称为零假设的临界区域或拒绝区域。临界值：接受区域的上界和下界称为临界值。它们是接受或拒绝零假设的分界线。归纳：如果参数值在零假设下位于接受区域内

14、，则不拒绝零假设，若落在接受区域以外（即落在拒绝区域内），则拒绝零假设。10.6312.36P/E值P/E总体均值的95%的置信区间10.6312.36P/E值P/E总体均值的95%的置信区间132.5%95%2.5%4.2 第一类错误和第二类错误H0：x =13l第一类错误：l亦称弃真错误。在上述P/E例子中，我们以95%的置信度拒绝了零假设： x =13，那么是否就意味着上表中所给出的样本就不是来自均值为13的正态总体呢？或许事实的确如此。但是由于不等式给出的置信区间的置信度是95%，而非100%，我们抽取的这一个特定的样本可能正好不包含真实值。如果真是这样，则拒绝H0： x =13，就可

15、能犯错误，这种情况下，我们说犯了第一类错误（也称弃真错误），即原假设为真而我们拒绝了它。10.6312.36P/E值P/E总体均值的95%的置信区间122.5%95%2.5%H0：x =12l第二类错误：亦称取伪错误。在上述例子中，假定零假设H0: x =12，在这种情况下，根据上述置信区间，我们应该不拒绝零假设。但是上表中的数据很可能不是来自均值为12的正态总体，此时我们会犯第二类错误，也即取伪错误。l在研究中，我们想尽可能减小这两种错误。但是，对于任一给定的样本，我们不可能同时作到犯这两种错误的概率都很小。其解决方法为：先固定犯第一类错误的概率在一很低水平上，再考虑如何减小犯第二类错误的概

16、率。l统计学家（Neyman Pearson）提出的解决问题的方法是假定在实际中弃真错误比取伪错误更严重。总体情况结论H0为真H1为真接受H0正确结论取伪错误拒绝H0弃真错误正确结论拒绝H0的结论要么是正确的，要么犯了第一类错误我们可以控制犯第一类错误的概率，得出具有很高置信度的结论“拒绝H0是正确的”；统计学家通过“不拒绝H0 ”的表述来避免犯第二类错误犯第一类错误的概率通常用符号表示，称为显著性水平；犯第二类错误的概率通常用符号表示。则：第一类错误= =犯弃真错误的概率；第二类错误= =犯取伪错误的概率。不犯第二类错误的概率=(1- )，称为检验的功效。假设检验的标准做法是：给

17、定某一显著水平的，如=0.01（或0.05），然后使检验的功效最大，即使最小。由于求解过程比较复杂，在实际中，仅仅给出值，而没有过多考虑值。置信系数(1- )就是1减去“犯第一类错误的概率”，因此，95%的置信系数表示拒绝零假设犯第一类错误的概率至多为5%。以下用实例来进一步阐明假设检验的置信区间法。例：坛子里的花生的重量服从正态分布，但均值和方差是未知的。随机选取20个坛子，发现其样本均值和样本方差分别为6.5和4。检验零假设：真实均值为7.5；备则假设：真实均值不是7.5。给定显著水平1%。若显著水平为5%，又会如何？分析：令X代表坛子中花生的重量，因此， XN(x ，)，两个参数x 和均

18、是未知的。由于知道样本方差，故设计t变量，它服从自由度为19的t分布。1920)(tSXtX查t分布表得：当自由度为19时，P(-2.861t2.861)=0.99整理得出：将已知条件代入，得：5.22 x 7.78 （近似值）由于该区间包括了零假设值7.5，因此，我们不拒绝不拒绝零假设：真实的x =7.5。99. 0861. 2861. 2nSXnSXPX若置信水平为5%，也就意味着决定冒更大的风险犯第一类错误。分析如下：根据t分布表，当=5%，自由度为19时，t的临界值为-2.093和+2.093，即 P(-2.093t2.093)=0.95按照上述步骤，求得：5.56 x 7.44 （近

19、似值）由于该区间不包括7.5，因此，拒绝零假设：真实的x =7.5。后者和前者的不同之处在于后者的置信区间比前者略窄一些，反映了不同的显著水平下置信区间有所区别。5.227.78b) x的95%的置信区间7.50.5%99%0.5%H0：x =7.595%2.5%2.5%5.567.447.5a) x的99%的置信区间l显著性检验是一种两者择一的假设检验，但它却是完备的。现通过P/E一例加以说明。l根据以下公式可知：nSXtX)(服从自由度为(n-1)的t分布。在具体应用中，、S、n已知， x 未知。X 在零假设下设定x 为一给定值，从而求出t值。由于该式中的t值服从自由度为(n-1)的t分布

20、，根据t分布很容易求出获此t值的概率。如果与 x的差别不大（绝对值形式），则根据上式，t值为0，在这种情况下，我们接受零假设。随着t的绝对值的增大，逐渐趋于拒绝零假设。在能拒绝零假设之前，最大的t的绝对值是多少呢？它直接取决于置信水平（犯第一类错误的概率）和自由度。显著性检验方法的关键之处是检验统计量（t统计量）以及在假定x 为一给定值下该t统计量的概率分布。XX在P/E例子中， =11.5，S=3.0456，n=50。令H0： x =13，H1： x 13，则有：t =(11.5-13)/(3.0456/50)=-3.4826根据该t值能否拒绝零假设呢？在没有设定置信水平之前，无法回答这

21、个问题。现假定置信水平为5%，即 =5%。由于备择假设是双边假设，因此，可以将犯第一类错误的风险均分在t分布的两侧两个拒绝区域（计算的t值位于任何一个拒绝区域，都能够拒绝零假设）。X当自由度为49时，在5%的显著水平下，查表得临界的t值为-2.0096和2.0096 （见下图），获此t值小于或等于-2.0096的概率为2.5%，获得此t值大于或等于2.0096的概率也为2.5%。95% =2.5%=2.5%t =-3.5-2.00962.00960t检验的显著性：双边检验显然，t值位于t分布的左侧拒绝区域。因此，拒绝零假设。在显著性检验时，经常遇到的两个术语：检验（统计量）是显著的：当能够拒

22、绝零假设时，认为检验是显著的。检验（统计量）是统计不显著的：当不能拒绝零假设时，就说不是统计显著的。l当备择假设为单边假设时，则检验这个假设为单边假设。如在P/E以利中，H0: x =13，H1： x 0 x= 0 x0 x= 0 x0t检验小结最后一列给出了t临界值，第一个下标表示显著水平，d.t代表自由度。l1. 检验l在分布部分提到，如果S表示来自方差为的正态总体，容量为n的随机样本的样本方差，那么，2)1(22)1(nSn即样本方差与总体方差的比值与(n-1)的乘积服从自由度为(n-1)的分布。如果已知样本容量n及样本方差S，总体方差未知，则根据分布可对未知的总体方差建立一个(1-)的置信区间，其机制与t检验类似。在零假设H0下，给定一个具体的值，则可利用上述公式直接计算出的值，并根据分布表进行显著

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计推断：估计与假设检验

文档简介

温馨提示

最新文档

评论

统计推断：估计与假设检验

文档简介

温馨提示

最新文档

评论

相关文档