统计量及抽样分布_第1页
统计量及抽样分布_第2页
统计量及抽样分布_第3页
统计量及抽样分布_第4页
统计量及抽样分布_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章统计量及其抽样分布PowerPoint统计学2008年8月6.1统计量6.1..1统统计计量的概概念6.1..2常常用用统计量量6.1..3次次序序统计量量6.1..4充充分分统计量量参数和统统计量参数(parameter)描述总体体特征的的概括性性数字度度量,是是研究者想想要了解解的总体体的某种种特征值值一个总体体的参数数:总体体均值()、标准差差()、总体比比例();两个总总体参数数:(1-2)、(1-2)、(1/2)总体参数数通常用用希腊字字母表示示统计量(statistic)用来描述述样本特特征的概概括性数数字度量量,它是是根据样样本数据据计算出出来的一一些量,,是样本本的函数数一个总体体参数推推断时的的统计量量:样本本均值(x)、样本标准准差(s)、样本比例例(p)等两个总总体参数数推断时时的统计计量:(x1-x2)、(p1-p2)、(s1/s2)样本统计计量通常常用小写写英文字字母来表表示2008年8月常用统计计量样本均值值样本方差差样本标准准差2008年8月常用统计计量样本变异异系数K阶距K阶中心距距2008年8月次序统计计量哪些是次次序统计计量:中位数、、分位数数、四分分位数、、极差和和均值充分统计计量统计计量量加工过过程中一一点信息息都不损损失的统计计量通常常称为充充分统计计量。6.2关于分布布的几个个概念6.2..1抽抽样样分布6.2..2渐渐近近分布6.2..3随随机机模拟获获得的近近似分布布样本统计计量的概概率分布布,是一种理理论分布布在重复选选取容量量为n的样本时时,由该该统计量量的所有有可能取取值形成成的相对对频数分分布随机变量量是样本统计计量样本均值值,样本比例例,样本本方差等等结果来自自容量相同同的所有可能样本本提供了样样本统计计量长远远而稳定定的信息息,是进进行推断断的理论论基础,,也是抽抽样推断断科学性性的重要要依据抽样分布布(samplingdistribution)2008年8月抽样分布布的形成成过程(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本渐近分布布当n较大大时,就就用极限限分布作作为抽样样分布的一种种近似,,这种极极限分布布称为渐渐近分布。2分布由阿贝((Abbe)于1863年首先给给出,后后来由海海尔墨特特(Hermert)和卡·皮尔逊((K·Pearson)分别于1875年和1900年推导出出来设,,则令,,则y服从自由由度为1的2分布,即即对于n个正态随随机变量量y1,y2,yn,则随机机变量称为具有有n个自由度度的2分布,记记为c2-分布(2-distribution)2008年8月不同自由由度的c2-分布c2n=1n=4n=10n=202008年8月分布的变变量值始始终为正正分布的形形状取决决于其自自由度n的大小,,通常为为不对称称的正偏偏分布,,但随着着自由度度的增大大逐渐趋趋于对称称期望为::E(2)=n,方差为为:D(2)=2n(n为自由度度)可加性::若U和V为两个独独立的2分布随机机变量,,U~2(n1),V~2(n2),则U+V这一随机机变量服服从自由由度为n1+n2的2分布c2-分布(性质和特特点)2008年8月c2-分布(用Excel计算c2分布的概概率)利用Excel提供的【CHIDIST】统计函数数,计算算c2分布右单单尾的概概率值语法:CHIDIST(x,,degrees_freedom),其中df为自由度度,x,是随机变变量的取取值利用【CHIINV】函数则可可以计算算给定右右尾概率率和自由由度时相相应的反反函数值值语法:CHIINV(probability,degrees_freedom)用Excel计算c2分布的概概率2008年8月2008年8月t分布t-分布(t-distribution)提出者是是WilliamGosset,也被称称为学生生分布(student’st))t分布是类类似正态态分布的的一种对对称分布布,通常常要比正正态分布布平坦和和分散。。一个特特定的分分布依赖赖于称之之为自由由度的参参数。随随着自由由度的增增大,分分布也逐逐渐趋于于正态分分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z2008年8月t分布临界界值—t分布的的上α分位点tα(n)αtα(n)n>45,tα(n)≈≈zαZα为标准正正态分布布上α分位点点t1-α=-tαα2008年8月结论1:设总体X服从正态态分布N(μ,σ2),σ2未知.(x1,x2,…xn)为来自该该总体的的样本,则统计量量两个重要要结论2008年8月结论2:设总体X服从正态态分布N(μ1,σ2)总体Y服从正态态分布N(μ2,σ2)(σ2未知),X与Y独立,且且X1,X2,…,Xn1和Y1,Y2,…,Yn2分别是来来自总体体X和Y的样本,,则统计计量两个重要要结论2008年8月2008年8月t-分布(用Excel计算t分布的概概率和临临界值)利用Excel中的【TDIST】统计函数数,可以以计算给给定值和和自由度度时分布布的概率率值语法:TDIST(x,degrees_freedom,tails)利用【TINV】函数则可可以计算算给定概概率和自自由度时时的相应应语法:TINV(probability,degrees__freedom)用Excel计算t分布的临临界值2008年8月F分布2008年8月为纪念统统计学家家费希尔尔(R.A..Fisher)以其姓氏氏的第一一个字母母来命名名则设若U为服从自自由度为为n1的2分布,即即U~2(n1),V为服从自自由度为为n2的2分布,即即V~2(n2),且U和V相互独立立,则称F为服从自自由度n1和n2的F分布,记记为F-分布(Fdistribution)2008年8月不同自由由度的F分布F(1,10)(5,10)(10,10)2008年8月F分布的上上α分位点Fα(n1,n2)αFα(n1,n2)2008年8月~F(n1―1,n2―1)其中s12和s22分别是总总体X和Y的样本方方差。F分布在假设检验验、区间间估计、、方差分分析、回回归分析析及试验设设计等领领域有重重要的应应用设总体X~N(μ1,σ12),Y~N(μ2,σ22),X与Y独立,且且X1,X2,…,Xnl与Y1,Y2,…,Yn2分别是来来自总体体X和Y的样本,,则统计计量F=一个重要要结论2008年8月F-分布(用Excel计算F分布的概概率和临临街值)利用Excel提供的【FDIST】统计函数数,计算算分布右右单尾的的概率值值语法:FDIST(x,degrees__freedom1,,degrees_freedom2)利用【FINV】函数则可可以计算算给定单单尾概率率和自由由度时的的相应语法:FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel计算F分布的概概率2008年8月2008年8月样本均值值的分布布与中心心极限定定理在重复选选取容量量为n的样本时时,由样样本均值值的所有有可能取取值形成成的相对对频数分分布一种理论论概率分分布推断总体体均值的理论基基础样本均值值的分布布2008年8月样本均值值的分布布(例题分析析)【例】设一个总总体,含有4个元素(个体),即总体体单位数数N=4。4个个体分分别为x1=1,x2=2,x3=3,x4=4。总体的的均值、、方差及及分布如如下总体分布14230.1.2.3均值和方方差2008年8月样本均值值的分布布(例题分析析)现从总体体中抽取取n=2的简单随随机样本本,在重重复抽样样条件下下,共有有42=16个样本。。所有样样本的结结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)2008年8月样本均值值的分布布(例题分析析)计算出各各样本的的均值,,如下表表。并给给出样本本均值的的抽样分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P

(x)1.53.04.03.52.02.52008年8月样本均值值的分布布与总体体分布的的比较(例题分析析)=2..5σ2=1.25总体分布布样本均值值分布比较及结结论:1.样本均值值的均值值(数学学期望))等于总总体均值值2.样本均值值的方差差等于总总体方差差的1/n2008年8月样本均值值的分布布

与中中心极限限定理=50

=10X总体分布n=4抽样分布xn=16当总体服服从正态态分布N(μ,σ2)时,来自自该总体体的所有有容量为为n的样本的的均值x也服从正正态分布布,x的期望值值为μ,方差为为σ2/n。即x~N(μ,σ2/n)2008年8月中心极限限定理(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布从均值为为,方差为为2的一个任任意总体体中抽取取容量为为n的样本,,当n充分大时时,样本本均值的的抽样分分布近似似服从均均值为μ、方差为为σ2/n的正态分分布一个任意分布的总体x2008年8月中心极限限定理(centrallimittheorem)x的分布趋趋于正态态分布的的过程2008年8月抽样分布布与总体体分布的的关系总体分布布正态分布布非正态分分布大样本小样本样本均值值正态分布布样本均值值正态分布布样本均值值非正态分分布2008年8月样本均值值的分布布(实例))解:根据中心心极限定定理,不不论总体体的分布布是什么么形状,,在假定定总体分分布不是是很偏的的情形下下,当从从总体中中随机选选取n=36的样本本时,样样本均值值x的分布近近似服从从均值x===10、标准差的的正正态分布布,即X~N(10,0.12)【例6..4】设从一个个均值=10、标准差差=0.6的总体中中随机选选取容量量为n=36的样本。。假定该该总体不不是很偏偏的,要要求:(1)计算样本本均值x小于9.9近似概率率。(2)计算样本本均值x超过9.9近似概率率。(3)计算样本本均值x在总体均均值=10附近0.1范围内的的近似概概率。2008年8月样本均值值的分布布(实例))2008年8月样本均值值的分布布(实例))2008年8月样本比比例例的分分布布总体(或或样本))中具有有某种属属性的单单位与全全部单位位总数之之比不同性别别的人与与全部人人数之比比合格品((或不合合格品))与全全部产品品总数之之比总体比例例可表示示为样本比例例可表示示为

样本比例例的分布布(proportion)2008年8月在重复选选取容量量为n的样本时时,由样样本比例例的所有有可能取取值形成成的相对对频数分分布一种理论论概率分分布当样本容量量很大时,样本本比例的的抽样分分布可用用正态分分布近似似,即

样本比例例的分布布2008年8月样本比例例的抽样样分布(实例))解:(1)尽管我们们对电瓶瓶的寿命命分布形形状不甚甚了解,,但根据据中心极极限定理理可以推推出50个电瓶的的平均寿寿命的分分布近似似服从正正态分布布,其均均值【例6.5】】某汽车电电瓶商声声称其生生产的电电瓶具有有均值为为60个月、标标准差为为6个月的寿寿命分布布。现假假设质检检部门决决定检验验该厂的的说法是是否正确确,为此此随机抽抽取了50个该厂生生产的电电瓶进行行寿命检检验。(1假定厂商商声称是是正确的的,试描描述50个电瓶的的平均寿寿命的抽抽样分布布。(2)假定厂商商声称正正确,则则50个样品组组成的样样本的平平均寿命命不超过过57个月的概概率是多多少?2008年8月样本比例例的抽样样分布(实例))(2)如果厂方方声称是是正确的的,则观观察到50个电池的的平均寿寿命不超超过57个月的概概率为:如果厂方方声称是是正确的的,则观观察到50个电池的的平均寿寿命不超过57个月的概概率为0.0002。一个不不可能时时间。根根据小概概率事件原原理,观观察到的的50个电瓶的的平均寿寿命低于于57个月的事件是不不可能的的;反之之如果真真的观察察到50个电瓶的的寿命低低于57个月,则则有理由由怀疑厂厂方说法法的正确确性,即即认为厂厂方的说法是是不正确确的。2008年8月样本比例例抽样分分布(实例))解:已知X~N(9,22),根据上上述性质质10X也服从正正态分布布,由于于所以【例6.6】】设X~N((9,22),试描述10X的分布。。2008年8月样本比例例的分布布(实例))解:设600份报表中中至少有有一处错错误的报报表所占占的比例例为由题意可可知:【例6..7】假定某统统计人员员在其填填写的报报表中有有2%至至少会有有一处错错误,如如果我们们检查了了一个由由600份报表表组成的的随机样样本,其其中至少少有一处处错误的的报表所所占的比比重在0.025~0.070之间间的概率率为多大大?2008年8月样本比例例的分布布(实例))因为2008年8月样本比例例的分布布(实例))即该统计计人员所所填写的的报告中中至少有有一处错错误的报报表所占占的比例在在0.025~0.070之间的概概率为19.02%。2008年8月解:因为两个个总体均均为正态态分布,,所以8个新生的的平均成成绩x1,x2分别为正正态分布布,x1-x2也为正态态分布,,且两个总体体比例之之差分布布(实例))【例6..8】设有甲、、乙两所所著名高高校在某某年录取取新生时时,甲校校的平均均分为655分分,且服服从正态态分布,,标准差差为20分;乙乙校的平平均分为为625分,也也是正态态分布,,标准差差为25分。先先从甲、、乙两校校各随机机抽取8名新生生计算其其平均分分数,出出现甲校校比乙校校的平均均分低的的可能性性有多大大?2008年8月两个总体体比例之之差的估估计(实例))【例6.9】】一项抽样样调查表表明甲城城市的消消费者中中有15%的人喝过过商标为为“圣洁洁”牌的的矿泉水水,而城城市的消消费者中中只有8%的人喝过过该种矿矿泉水。。如果这这些数据据是真实实的,那那么当我我们分别别从甲城城市抽取取120人,乙城城市抽取取140人组成两两个独立立随机样样本时,,样本比比例差不低于0.08的概率有有多大??^解:根据题意意2008年8月样本方方差差的分分布布样本方差差的分布布在重复选选取容量量为n的样本时时,由样样本方差差的所有有可能取取值形成成的相对对频数分分布对于来自自正态总总体的简简单随机机样本,,则比值值的抽样分分布服从从自由度度为(n-1)的2分布,即即2008年8月统计量的的标准误误差统计量的的标准误误差(standarderror))样本统计计量抽样样分布的的标准差差,称为为统计量量的标准准误差衡量统计计量的离离散程度度,测度度了用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论