统计量及其抽样分布_第1页
统计量及其抽样分布_第2页
统计量及其抽样分布_第3页
统计量及其抽样分布_第4页
统计量及其抽样分布_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章统计量及其抽样分布作者:中国人民大学统计学院贾俊平PowerPoint统计学第6章统统计量量及其抽抽样分布布6.1统统计量6.2关关于分布布的几个个概念6.3由由正态分分布导出出的几个个重要分分布6.4样样本均值值的分布布与中心心极限定定理6.5样样本比例例的抽样样分布6.6两两个样本本平均值值之差的的分布6.7关关于样本本方差的的分布了解统计计量及其其分布的的几个概概念了解由正正态分布布导出的的几个重重要分布布理解样本本均值的的分布与与中心极极限定理理掌握单样样本比例例和样本本方差的的抽样分分布学习目标标6.1统计量6.1..1统计量的的概念6.1..2常用统计计量6.1..3次序统计计量6.1..4充分统计计量设X1,X2,…,Xn是从总体体X中抽取的的容量为为n的一个样样本,如如果由此此样本构构造一个个函数T(X1,X2,…,Xn),不依依赖于任任何未知知参数,,则称函函数T(X1,X2,…,Xn)是一个统统计量样本均值值、样本本比例、、样本方方差等都都是统计计量统计量是是样本的的一个函函数统计量是是统计推推断的基基础统计量(statistic)一组样本观观测值X1,X2,…,Xn由小到大大的排序序X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,称X(1),X(2),…,X(n)为次序统统计量中位数、、分位数数、四分分位数等等都是次次序统计计量次序统计计量6.2关于分布布的几个个概念6.2..1抽样分布布6.2..2渐进分布布6.2..3随机模拟拟获得的的近似分分布样本统计计量的概概率分布布,是一种理理论分布布在重复选选取容量量为n的样本时时,由该该统计量量的所有有可能取取值形成成的相对对频数分分布随机变量量是样本统计计量样本均值值,样本比例例,样本本方差等等结果来自自容量相同同的所有可能样本本提供了样样本统计计量长远远而稳定定的信息息,是进进行推断断的理论论基础,,也是抽抽样推断断科学性性的重要要依据抽样分布布(samplingdistribution)6.3由正态分分布导出出的几个个重要分分布6.3..12分布6.3..2t分布6.3..3F分布2分布χ2分布的使使用如果一个个变量的的诸数值值可视为为几个独独立变量量值的平平方和,,则该变变量服从从χ2分布方差就可可视为若若干随机机变量值值的平方方和样本中各各随机数数值与均均值之离离差的平平方和((即样本本方差的的n-1倍)与与总体方方差之比比,服从从自由度度为n--1的χ2分布由阿贝((Abbe)于1863年首先给给出,后后来由海海尔墨特特(Hermert)和卡·皮尔逊((K·Pearson)分别于1875年和1900年推导出出来设,,则令,,则则Y服从自由由度为1的2分布,即即当总体,,从中中抽取容容量为n的样本,,则2分布(2distribution)分布的变变量值始始终为正正分布的形形状取决决于其自自由度n的大小,,通常为为不对称称的正偏偏分布,,但随着着自由度度的增大大逐渐趋趋于对称称期望为::E(2)=n,方差为为:D(2)=2n(n为自由度度)可加性::若U和V为两个独独立的2分布随机机变量,,U~2(n1),V~2(n2),则U+V这一随机机变量服服从自由由度为n1+n2的2分布2分布(性质和特特点)c2分布(图示)不同容量样本的抽样分布c2n=1n=4n=10n=20t分布t分布高塞特(W.S.Gosset)于1908年在一篇篇以“Student”(学生)为笔名的的论文中中首次提提出t分布是类类似正态态分布的的一种对对称分布布,它通通常要比比正态分分布平坦坦和分散散一个特定定的分布布依赖于于称之为为自由度度的参数数。随着着自由度度的增大大,分布布也逐渐渐趋于正正态分布布t分布图示示xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zT分布的图图形T分布的使使用F分布F分布两个都服服从χ2分布的变变量之比比的分布布规律。。可以设想想为两个个方差之之比方差之比比会接近近1(因因为前面面已经假假设各变变量都服服从标准准正态分分布),,似乎存存在一个个“两端端少,中中间多””的特征征,但不不对称((除非其其中存在在一个无无限总体体,使样样本数量量为无穷穷大,则则样本方方差有无无穷多个个)由统计学学家费希希尔(R.A..Fisher)提出的,,以其姓姓氏的第第一个字字母来命命名设若U为服从自自由度为为n1的2分布,即即U~2(n1),V为服从自自由度为为n2的2分布,即即V~2(n2),且U和V相互独立立,则称称F为服从自自由度n1和n2的F分布,记记为F分布(Fdistribution)F分布两个都服服从χ2分布的变变量之比比的分布布规律。。可以设想想为两个个方差之之比方差之比比会接近近1(因因为前面面已经假假设各变变量都服服从标准准正态分分布),,似乎存存在一个个“两端端少,中中间多””的特征征,但不不对称((除非其其中存在在一个无无限总体体,使样样本数量量为无穷穷大,则则样本方方差有无无穷多个个)F分布(图示)不同自由由度的F分布F(1,10)(5,10)(10,10)F分布的图图形此处的n和m分别相当当于n1、n2F分布的使使用应用很广广泛,可可用来检检验两状状态总体体方差是是否相等等,检验验回归方方差是否否有代表表性,在在方差分分析和多多元统计计中都是是重要的的检验手手段。三种抽样样分布的的对比χ2分布可视视为关于于方差的的分布规规律。t分布中的的两个变变量,一一个服从从正态分分布,另另一个服服从χ2分布。可可视为均均值与方方差之比比的分布布规律。。F分布的的变量都都服从χχ2分布,可可以设想想为两个个方差之之比的分分布规律律。这些“分分布”都都说明变变量的规规律,某些具具有相同同特征的的变量具具有什么么样的共共同规律律。现实实中,按按图索骥骥,依样样画葫芦芦。三种抽样样分布综综述为什么要要使用统统计方法法?因为为要了解解事物的的数量特特征几乎惟一一的方法法是抽样样,随机机抽样抽样可以以有很多多结果,众结果的的随机性性规律是是正态分分布为什么要要导出三三大抽样样分布??因为要要了解的的数量特特征的性质不不同,比比如,可可能要了了解样本本方差的的规律若干个变变量都服服从正态态分布,每变量有有不同取取值,计算每组取值值中各值值的平方方,再加起来来,该总和服服从χ2分布每次抽样样的误差差与平均均误差之之比服从从t分布两个样本本的方差差之比服服从F分布什么是分分布?骰骰子点数数服从均均匀分布布,身高服从从正态分分布。分布就是是各种情情况发生生概率的的全体组组合。6.4样本均值值的分布布与中心心极限定定理抽样分布布抽样分布布从总体种种抽出容容量相同同的样本本,计算算统计量量的值,,然后按按统计量量的值所所编制的的频数分分布。抽样分布布的作用用:根据抽样样分布研研究统计计量的性性质对统计推推断方法法进行评评价抽样分布布:样本本统计量量所有可可能值的的概率分分布。样本统计计量总体未知知参数样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量样本统计计量分布的形形状及接接近总体体参数的的程度STAT知道这些些“分布布”有什什么用??从现象上上看,事事物非常常复杂,,但其中中某些内内容具有有某种意意义上的的相同性性质(比比如7条条鱼与7天之间间都有7这个数数量)从逻辑上上看,可可以在某某些限定定条件下下构造许许多模型型,即数数量关系系(此处处都用“等于”关系),,这些关关系的总总和都符符合逻辑辑,现实实中事物物如果符符合那些些限定条条件,则则其本角角度的其其他特征征(可视视为进一一步的发发展结果果)都会会服从逻逻辑模型型所表述述的变化化规律统计分布布类型就就是:在在某些限限定条件件下,考考察不同同类型的的个别数数量现象象在总体体上具有有什么样样的分布布特征,,熟知的的如正态态分布。。这些模模型的结结果告诉诉我们各各种情况况出现的的可能性性。抽样分布布分布的特特征值::均值和和标准差差样本主要要统计量量:平平均数数比比率率(成数数)方方差STAT《统计学》第四章抽抽样样估计在重复选选取容量量为n的样本时时,由样样本均值值的所有有可能取取值形成成的相对对频数分分布一种理论论概率分分布推断总体体均值的理论基基础样本均值值的抽样样分布样本均值值的抽样样分布与与中心心极限定定理=50

=10X总体分布n=4抽样分布xn=16当总体服服从正态态分布N(μ,σ2)时,来自自该总体体的所有有容量为为n的样本的的均值x也服从正正态分布布,x的数学期期望为μ,方差为为σ2/n。即x~N(μ,σ2/n)中心极限限定理(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布从均值为为,方差为为2的一个任任意总体体中抽取取容量为为n的样本,,当n充分大时时,样本本均值的的抽样分分布近似似服从均均值为μ、方差为为σ2/n的正态分分布一个任意分布的总体x学生AABCCDDEFFGG成绩30405060708090按随机原原则抽选选出4名名学生,,并计算算平均分分数。平均数的的抽样分分布二者均值值相等样本均值值的平均均数总体的平平均数平均数的的抽样分分布全部可能能样本平平均数的的均值等等于总体体均值,,即:从从非正态态总体中中抽取的的样本平平均数当n足够大时其分布布接近正正态分布布。从从正态态总体中中抽取的的样本平平均数不不论容量量大小其其分布均均为正态态分布。。样样本均值值的标准准差为总总体标准准差的。。STATAnexampleAdieisthrowninfinitelymanytimes.LetXrepresentthenumberofspotsshowingonanythrow..一个骰骰子被投投掷了无无数次,,用X表表示每一一次出现现的点数数.TheprobabilitydistributionofXisx123456p(x)1/61/61/61/61/61/6E(X))=1(1/6))+2(1//6)++3(1//6)++………==3..5V(X))=((1--3.5)2+(2-3.5))2+…………………..=2.92Supposewewanttoestimatemfromthemeanofasampleofsizen==2..Whatisthedistributionthatcanfollow样本平平均的分分布是什什么样??11..52.02.53..03.54.04..55.05.56.06/365/364/363/362/361/36E()=1.0(1/36)+1.5(2/36)+….=3.5V(X)=(1.0-3.5)2(1/36)+(1.5-3.5)2(2/36)...=1.46111666Noticethatissmallerthansx.Thelargerthesamplesizethesmaller.Therefore,tendstofallclosertom,asthesamplesizeincreases.Simulationofdicetossingn=2n=5n=10Mean=3.494Stand.Dev.==0..544Mean=3.486Stand.Dev.==1..215Mean=3.495Stand.Dev.==0..749Thevarianceofthesamplemeanissmallerthanthevarianceofthepopulation..样本平均均数方差差小于总总体方差差123Also,Expectedvalueofthepopulation==(1+2++3))/3==2Mean=1.5Mean=2.5Mean=2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expectedvalueofthesamplemean==((1.5+2++2..5)//3==2Comparethevariabilityofthepopulationtothevariabilityofthesamplemean.LetustakesamplesoftwoobservationsTheSamplingDistributionoftheSampleMean样本平均均数分布布4.2..1抽样推断断的理论论基础大数定律律大数定律律是阐明明大量随随机现象象平均结结果的稳稳定性的的一系列列定理的的总称。。其一般般意义是是:在随随机试验验过程中中,每次次试验的的结果不不同,但但大量重重复试验验后,所所出现结结果的平平均值总总是接近近某一确确定的值值。中心极限限定理第一,如如果总体体很大,,而且服服从正态态分布,,样本平平均数(或成数数)的分分布也同同样服从从正态分分布。第第二,如如果总体体很大,,但不服服从正态态分布,,只要样样本容量量足够大大(n≥30)),样本本平均数数(或成成数)的的分布趋趋近于正正态分布布。第三三,样本本平均数数(或成成数)的的平均数数,等于于总体平平均数((或成数数)。STAT《统计学》第四章抽抽样样估计学生AABCCDDEFFGG成绩30405060708090离差-30--20--10010203020=s中心极限限定理(centrallimittheorem)x的分布趋趋于正态态分布的的过程6.5样本比例例的抽样样分布总体(或或样本))中具有某某种属性性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论