统计量及其抽样分布2_第1页
统计量及其抽样分布2_第2页
统计量及其抽样分布2_第3页
统计量及其抽样分布2_第4页
统计量及其抽样分布2_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计量及其抽样分布当前1页,总共59页。第6章统计量及其抽样分布6.1统计量6.2关于分布的几个概念6.3由正态分布导出的几个重要分布

6.4样本均值的分布与中心极限定理6.5样本比例的抽样分布6.6两个样本平均值之差的分布6.7关于样本方差的分布

当前2页,总共59页。了解统计量及其分布的几个概念了解由正态分布导出的几个重要分布

理解样本均值的分布与中心极限定理掌握单样本比例和样本方差的抽样分布学习目标当前3页,总共59页。6.1

统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量

6.1.4充分统计量

当前4页,总共59页。设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础统计量

(statistic)当前5页,总共59页。一组样本观测值X1,X2,…,Xn由小到大的排序

X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,称X(1),X(2),…,X(n)为次序统计量中位数、分位数、四分位数等都是次序统计量次序统计量当前6页,总共59页。6.2

关于分布的几个概念6.2.1抽样分布6.2.2渐进分布6.2.3随机模拟获得的近似分布

当前7页,总共59页。样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布

(samplingdistribution)当前8页,总共59页。6.3由正态分布导出的几个重要分布6.3.12分布6.3.2t

分布6.3.3F

分布当前9页,总共59页。2分布当前10页,总共59页。χ2

分布的使用如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从χ2

分布方差就可视为若干随机变量值的平方和样本中各随机数值与均值之离差的平方和(即样本方差的n-1倍)与总体方差之比,服从自由度为n-1的χ2

分布当前11页,总共59页。由阿贝(Abbe)

于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)

分别于1875年和1900年推导出来设,则令,则Y服从自由度为1的2分布,即

当总体,从中抽取容量为n的样本,则2分布

(2

distribution)当前12页,总共59页。分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称期望为:E(2)=n,方差为:D(2)=2n(n为自由度)可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布2分布

(性质和特点)当前13页,总共59页。c2分布

(图示)不同容量样本的抽样分布c2n=1n=4n=10n=20当前14页,总共59页。t

分布当前15页,总共59页。t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布当前16页,总共59页。t分布图示xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z当前17页,总共59页。T

分布的图形当前18页,总共59页。T

分布的使用当前19页,总共59页。F

分布当前20页,总共59页。F分布两个都服从χ2

分布的变量之比的分布规律。可以设想为两个方差之比方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)当前21页,总共59页。由统计学家费希尔()

提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布

(F

distribution)当前22页,总共59页。F分布两个都服从χ2

分布的变量之比的分布规律。可以设想为两个方差之比方差之比会接近1(因为前面已经假设各变量都服从标准正态分布),似乎存在一个“两端少,中间多”的特征,但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)当前23页,总共59页。F分布

(图示)

不同自由度的F分布F(1,10)(5,10)(10,10)当前24页,总共59页。F分布的图形此处的n和m分别相当于n1、n2当前25页,总共59页。F分布的使用应用很广泛,可用来检验两状态总体方差是否相等,检验回归方差是否有代表性,在方差分析和多元统计中都是重要的检验手段。当前26页,总共59页。三种抽样分布的对比χ2分布可视为关于方差的分布规律。t分布中的两个变量,一个服从正态分布,另一个服从χ2分布。可视为均值与方差之比的分布规律。F分布的变量都服从χ2分布,可以设想为两个方差之比的分布规律。这些“分布”都说明变量的规律,某些具有相同特征的变量具有什么样的共同规律。现实中,按图索骥,依样画葫芦。当前27页,总共59页。三种抽样分布综述为什么要使用统计方法?因为要了解事物的数量特征几乎惟一的方法是抽样,随机抽样抽样可以有很多结果,众结果的随机性规律是正态分布为什么要导出三大抽样分布?因为要了解的数量特征的性质不同,比如,可能要了解样本方差的规律若干个变量都服从正态分布,每变量有不同取值,计算每组取值中各值的平方,再加起来,该总和服从χ2

分布每次抽样的误差与平均误差之比服从t分布两个样本的方差之比服从F分布什么是分布?骰子点数服从均匀分布,身高服从正态分布。分布就是各种情况发生概率的全体组合。当前28页,总共59页。6.4样本均值的分布与中心极限定理当前29页,总共59页。抽样分布抽样分布从总体种抽出容量相同的样本,计算统计量的值,然后按统计量的值所编制的频数分布。抽样分布的作用:根据抽样分布研究统计量的性质对统计推断方法进行评价当前30页,总共59页。

抽样分布:样本统计量所有可能值的概率分布。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量分布的形状及接近总体参数的程度STAT当前31页,总共59页。知道这些“分布”有什么用?从现象上看,事物非常复杂,但其中某些内容具有某种意义上的相同性质(比如7条鱼与7天之间都有7这个数量)从逻辑上看,可以在某些限定条件下构造许多模型,即数量关系(此处都用“等于”关系),这些关系的总和都符合逻辑,现实中事物如果符合那些限定条件,则其本角度的其他特征(可视为进一步的发展结果)都会服从逻辑模型所表述的变化规律统计分布类型就是:在某些限定条件下,考察不同类型的个别数量现象在总体上具有什么样的分布特征,熟知的如正态分布。这些模型的结果告诉我们各种情况出现的可能性。当前32页,总共59页。抽样分布分布的特征值:均值和标准差样本主要统计量:平均数比率(成数)方差STAT《统计学》第四章抽样估计当前33页,总共59页。在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布当前34页,总共59页。样本均值的抽样分布

与中心极限定理=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x

的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)当前35页,总共59页。中心极限定理

(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x当前36页,总共59页。学生ABCDEFG成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布样本均值样本均值样本均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数443211二者均值相等样本均值的平均数总体的平均数当前37页,总共59页。平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的。STAT当前38页,总共59页。

AnexampleAdieisthrowninfinitelymanytimes.LetXrepresentthenumberofspotsshowingonanythrow.一个骰子被投掷了无数次,用X表示每一次出现的点数.TheprobabilitydistributionofXisx123456p(x)1/61/61/61/61/61/6E(X)=1(1/6)+2(1/6)+3(1/6)+………=3.5V(X)=(1-3.5)2+(2-3.5)2+……………….=2.92当前39页,总共59页。Supposewewanttoestimatemfromthemeanofasampleofsizen=2.Whatisthedistributionthatcanfollow样本平均的分布是什么样?当前40页,总共59页。11.52.02.53.03.54.04.55.05.56.06/365/364/363/362/361/36E()=1.0(1/36)+1.5(2/36)+….=3.5V(X)=(1.0-3.5)2(1/36)+(1.5-3.5)2(2/36)...=1.46当前41页,总共59页。111666Noticethatissmallerthansx.Thelargerthesamplesizethesmaller.Therefore,tendstofallclosertom,asthesamplesizeincreases.当前42页,总共59页。Simulationofdicetossingn=2n=5n=10Mean=3.494 Stand.Dev.=0.544Mean=3.486 Stand.Dev.=1.215Mean=3.495 Stand.Dev.=0.749当前43页,总共59页。Thevarianceofthesamplemeanissmallerthanthevarianceofthepopulation.样本平均数方差小于总体方差123Also,Expectedvalueofthepopulation=(1+2+3)/3=2Mean=1.5Mean=2.5Mean=2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expectedvalueofthesamplemean=(1.5+2+2.5)/3=2Comparethevariabilityofthepopulationtothevariabilityofthesamplemean.Letustakesamplesoftwoobservations当前44页,总共59页。TheSamplingDistributionoftheSampleMean样本平均数分布当前45页,总共59页。抽样推断的理论基础

大数定律大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。其一般意义是:在随机试验过程中,每次试验的结果不同,但大量重复试验后,所出现结果的平均值总是接近某一确定的值。

中心极限定理

第一,如果总体很大,而且服从正态分布,样本平均数(或成数)的分布也同样服从正态分布。第二,如果总体很大,但不服从正态分布,只要样本容量足够大(n≥30),样本平均数(或成数)的分布趋近于正态分布。第三,样本平均数(或成数)的平均数,等于总体平均数(或成数)。

当前46页,总共59页。当前47页,总共59页。当前48页,总共59页。STAT《统计学》第四章抽样估计样本均值4547.55052.55557.560出现次数1123445离差-15-12.5-10-7.5-5-2.50样本均值62.56567.57072.575出现次数443211离差2.557.51012.515学生ABCDEFG成绩30405060708090离差-30-20-10010203020=s当前49页,总共59页。中心极限定理

(centrallimittheorem)x的分布趋于正态分布的过程当前50页,总共59页。6.5样本比例的抽样分布当前51页,总共59页。总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为

比例

(proportion)当前52页,总共59页。在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论