版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学-ch5suyl1第6章统计量与抽样分布
总体和样本的分布统计量抽样分布及抽样分布定理统计学--ch5suyl2§6.1总体和样样本的分分布§6.1.1统计推断断中的总总体及总总体分布布要了解研研究对象象的整体体情况,最理想的的方法似似乎是进进行普查查,但实际上上这样做做往往是是不必要要、不可可能或不不允许的的.如,要研究灯灯泡寿命命,由于寿命命试验是是破坏性性的,逐个试验验是不允允许的.数理统计计的方法法:从所研究究的全体体对象中中,抽取一小小部分来来进行试试验(称为抽样样),根据这一一小部分分所显示示的统计计特性,来推断整体的统计特特性.统计学--ch5suyl3※总体是根根据一定定的目的的确定的的所要研研究的事事物的全全体,它它是由客客观存在在的、具具有某种种共同性性质的众众多个别别事物构构成的整整体。总体是研究对象象的全体体。在具体的的统计推推断中,我们感兴兴趣的是是总体单单位的某某个或某某些数量量特征。。例如研研究某种种型号灯灯泡的寿寿命这一一数量特特征。总总体的含含义抽象象为所感感兴趣的的变量的的所有取取值,我我们可以以想象,,这些值值的出现现有不同同的频率率,假设设这批灯灯泡有无无限多个个,那么么频率就就收敛到到了概率率,从而而有了使使用寿命命这个随随机变量量的概率率分布。。这个分分布称为为总体或或总体分分布。总总体(总总体分布布)是对对客观对对象变量量取值情情况的数数学描述述。总体所含含个体的的数目称称为总体容量量.这样要研研究的总总体实质质上是某某个概率率分布,因此我们们将总体定义义为一个个随机变变量X.数理统计计学中““总体””这个基基本概念念从本质质上讲::总体就是是一个随随机变量量。我们对总体的研究,就是对相相应的随机变量量X的研究.统计学--ch5suyl4从社会统统计到数数理统计计总体的的演化实物总体体数字总体体分布总体体组成元素素具体对象象组成元素素重复数字字组成元素素数字的取取值及其其概率::分布研究的标标志数字的取取值和重重复的频频率例:研究究班级同同学的身身高班级的同同学的集集合(全全体同学学)组成元素素:每位位同学((具体对对象)同学身高高的集合合组成元素素:身高高的数字字(重复复数字))身高的取取值及其其概率组成元素素:身高高的分布布统计学--ch5suyl5对所研究究的对象象,我们常常常关心某某一项或或几项指指标.总体:研究对象象的某项项变量值值的全体体.个体:组成总体体的每一一个基本本元素.例如:①某工厂生生产的灯灯泡的使使用寿命命的全体体是一个个总体,而每一个个灯泡的的使用寿寿命是一一个个体体.而每个男男生的身身高是一一个个体体.②我校男生生的身高高的全体体是一个个总体,总体所含含个体的的数目称称为总体容量量.统计学--ch5suyl6一般地,我们是从从总体中中抽取一一部分,比如说n个进行观观测,再根据这这n个观测值值去推断断总体的的性质.在总体X中,抽取n个个体这n个个体称为总体X的一个样本.抽样就是抽取取样本的的过程.样本中所所含个体体的数目目n称为样本容量量.由于是从总体X中随机抽取出来的可能结果,是n个随机变变量,但是在一次抽取之后后,它们都是是具体的数数值,样本—通过观测测或试验验的方法法,获得得的总体体中一部部分个体体的集合合,称为为样本,,每个个个体的取取值称为为样本点点。§6.1.1统计推断断中的样样本及样样本分布布统计学--ch5suyl7如随机抽抽取n只灯泡,,试验得得到其使使用寿命命(x1,x2,…xn),称这n个确定的的数值(x1,x2,…xn)是灯泡使使用寿命命总体的的一个样样本。但但是,当当灯泡样样本点的的使用寿寿命还未未观测出出来时,,只能将将每个样样本点看看作与总总体同分分布的随随机变量量,这是是因为每每个样本本点的可可能取值值范围和和某个值值出现的的可能性性与总体体是一样样的,这这时样本本记为(X1,X2…Xn)。统计学--ch5suyl8在相同的的条件下下对总体体X进行行n次重重复独立立的观察察。将n次观观察结果果按试验验的次序序记为X1,X2,…,Xn(大写英语语字母表表示)。由于X1,X2,…,Xn是对随机机变量X观察的的结果,,且各次次观察是是在相同同的条件件下独立立进行的的,所以以有理由由认为X1,X2,…,Xn是相互独立立的,且都是是与总体体X具有有相同分布布的随机变量量。这样得到到的X1,X2,…,Xn称为来自自总体X的一个个简单随随机样本本,n称称为这个个样本的的容量。以后无另另外说明明,所得得的样本本都是指指简单随机机样本统计学--ch5suyl9n次观察察一经完完成,我我们就得得到一组组实数x1,x2,…,xn(小写英语语字母表表示),它们依次是是随机变变量X1,X2,…,Xn的观察值值,称为为样本观测值。对于有限限总体,,采用放放回抽样样就能得得到简单单随机样样本,但但放回抽抽样使用用起来不不方便,,当个体体的总数数N比样样本的容容量n大大得多时时,在实实际中可可将不放放回抽样样近似地地当作放放回抽样样来处理理.统计学--ch5suyl10简单随机机样本的的两个最最基本的的特性::(1)独立性是相互独立的随机变量.即中各个随机变量的取值互不影响,这时称
(2)代表性((同分布性性)即样样本中的的每个样样本点都都与总体体同分布布;即中每一个随机变量都与总体X有相同的概率分布.6.1..2统计推断断中的样样本及其其性质统计学--ch5suyl11总体和样样本的关关系数理统计计中,样样本和总总体具有有相同的的分布取值1概率0.2取值2:概率0.4取值3:取值0.1…分布总体体样品X1总体的分分布:总体中重重复数字字取各值值的概率率分布总体体总体各个个值的概概率可以以认为是是有相应应比重的的个体取取该值。。随机样本本由于每一一个体都都有均等等被抽中中的概率率,因而而样本取取总体各各个值的的概率即即样本分分布与总总体分布布相同。。样品X2样品Xn。。。统计学--ch5suyl12总体样本样本观察值?理论分布统计是从手中中已有的的资料——样本观察察值,去推断总总体的情情况——总体分布布.总体分布布决定了样本取值值的概率规规律,也就是样样本取到到样本观察值的规规律,因而可以以用样本本观察值值去推断总体体.样本是联系两两者的桥桥梁.总体、样样本、样样本观察察值的关关系如下下:统计学--ch5suyl13§6.2统计量统计量统计量分分布的概概念在统计推推断中,,总体信信息是未未知的,,但从总总体中抽抽取的样样本中含含有总体体的信息息,统计计推断就就是利用用样本的的信息来来推测总总体的信信息。然然而样本本的信息息是隐蔽蔽的,不不明显的的,必须须要经过过必要的的加工处处理才能能用来推推断总体体信息,,构造样样本统计计量是加加工样本本提出总总体信息息的有效效手段之之一。统计学--ch5suyl14§6.2.1统计量及及统计量量的分布布如果样本X1,…,Xn的函数T(X1,…,Xn)不含未知知参数,,则称T(X1,…,Xn)是总体X的一个统计量。。统计量有有以下两两个特征征:统计量是是样本的的函数;;统计量不不能含有有未知的总体参参数。统计学--ch5suyl15判断下列列是否为为统计量量是是是是是是统计学--ch5suyl16是不是是是是是统计学--ch5suyl172.样本k阶矩§6.2.2几个常用用的统计计量统计学--ch5suyl18样本均值值和方差差的性质质1.均值的性性质2.方差的性性质统计学--ch5suyl19证明:统计学--ch5suyl20统计学--ch5suyl213.顺序统计计量顺序统计计量:对于样样本X1,X2,…,Xn,如果按照照升幂排排列,得得到称X(1),X(2),…,X(n)为顺序统统计量。。统计学--ch5suyl22利用顺序序统计量量可以计计算一些些常用的的统计量量:(1)最大顺顺序统计计量和最最小顺序序统计量量(2)样本中中位数(3)样本极极差(4)样本的的p分位数(5)样本的的切尾均均值统计学--ch5suyl23统计量的的分布统计量分分布的概概念统计量既既然是随随机变量量的函数数,那么么它也应应该是随随机变量量,并有有其概率率分布,统计量的的分布也也称为抽抽样分布布。抽样分布布和统计计推断有有着密切切的联系系。统计量提提出以后后,必须须要知道道其分布布才能在在统计推推断中使使用,因因为只有有知道了了统计量量的分布布,才能能利用概概率论对对总体的的特征进进行推断断,并得得到相应应的推断断的置信信度。所所以在统统计推断断中,一一项重要要的工作作就是寻寻找统计计量和导导出统计计量的分分布。我我们从一一个简单单的例子子来讨论论统计量量分布的的概念。。统计学--ch5suyl24[例6.3]]设有一总总体N=3(2,4,6)。以样本本容量n=1、n=2、n=4及n=8,从总体体中进行行复置抽抽样,抽抽出全部部可能的的样本于于表6.1。表6.1中列出这这些不同同样本容容量的抽抽样分分布,并并在图4.1用方柱形形图表示示其分布布形状。。由表中第第一列当当N=3,n=1的总体平平均数和和方差为为:当样本容容量依次次为2、4、8时,其相相应为为4、4、4;其相相应为4/3、2/3、1/3。即,,。。统计学--ch5suyl25n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均数4444方差8/34/32/31/3表6.1各种不同同样本容容量的样样本平均均数())的抽样分分布统计学--ch5suyl26n=1n=2图6.1各种不同同样本容容量的分布方柱柱形图统计学--ch5suyl27图6.1各种不同同样本容容量的分布方柱柱形图n=4n=8统计学--ch5suyl28从这个例例子我们们可以了了解关于于样本均均值的分分布,即即所有可可能样本本计算出出的均值值所服从从的分布布(直方图图验证了了中心极极限定理理)。但是在在实际工工作中,,总体的的容量远远不止3,总体的的分布也也是十分分复杂的的,统计计量也各各有不同同,象这这样一一一列举给给出统计计量的分分布是行行不通的的,我们们必须借借助于总总体分布布的类型型来讨论论统计量量的分布布的情况况。后面面我们将将集中讨讨论正态态总体的的统计量量分布的的问题,,通常称为为样本的的精确分分布。统计学--ch5suyl29统计学--ch5suyl30§6.3抽样分布布及抽样样分布定定理主要内容容2—分布t—分布F—分布抽样分布布的重要要定理统计学--ch5suyl31为了讨论论统计量量的分布布,本节节首先介介绍数理理统计中中的三个个著名分分布,它它们是t分布,2分布和F分布。参数估计计和假设设检验等等统计推推断问题题中这三三个分布布有广泛泛的应用用。统计学--ch5suyl32§6.3.1分布的定定义为独立同同分布于于标准正正态总体体N(0,,1)的随机变变量列,,则称随随机变量量:所服从的的分布为为自由度度是n的分分布,记记为统计学--ch5suyl332(n)分布实质质上就是是参数为为n/2,,1/2的Γ分布,即2(n)的密度函函数为统计学--ch5suyl342分布随着自由由度n增增加,分分布渐近近于正态态。图4-12的概率密密度曲线线统计学--ch5suyl35(1)期望与与方差若X~2(n),则E(X))=n,D(X))=2n。2.2—分布的性性质特征征统计学--ch5suyl36(2)分布可可加性若若X~2(n1)),Y~2(n2)),X,Y独立,则则X+Y~~2(n1++n2))。统计学--ch5suyl37(3)关于自自由度统计学--ch5suyl38统计学--ch5suyl39(4)为便于今今后的应应用,现现在我们们引入上侧分位位数的概念.所谓一个个分布的的上侧分位位数就是是指这样样一个数数,它使使相应分分布的随随机变量量不小于于该数的的概率为为,比如,若若记2变量的上侧分位位数为,,则满足足统计学--ch5suyl40通过Excel查分位点点,函数数为CHIINV统计学--ch5suyl411.t—分布构造和密密度函数数t(n))称为自由由度为n的t—分布。§6.3.2t—分布t(n)的概率密密度为若~N(0,1),~2(n),与独立,则则统计学--ch5suyl42分子是标标准正态态随机变变量分母是自自由度为为n的卡方随随机变量量分子分母母相互独独立,且且满足构构造公式式新随机变变量服从从自由度度为n的t分布t分布的三三个要点点:统计学--ch5suyl43t分布的图图像统计学--ch5suyl44t分布和标标准正态态分布类类似,他他们都是是对称分分布。但但是t分布与标标准正态态分布也也是有区区别的。。t分布尾部部厚,即即服从tt分布的的随机变变量取到到尾部值值的概率率比标准准正态分分布略大大。而对对于接近近原点的的坐标点点,t分布的值值比标准准正态分分布的值值小。因因而t分布曲线线尾部又又厚于标标准正态态分布,,而峰低低于标准准正态分分布。图4-2t(n))密度函数数曲线统计学--ch5suyl452.t分布的性性质特征征(1)f(t)关于t=0(纵轴)对称。(2)f(t)的极限为为N(0,1)的密度函函数,即即(3)t分布的数数学期望望与方差差t分布的数数学期望望与方差差分别是是,统计学--ch5suyl46统计学--ch5suyl47通过Excel可得分位位点,函函数为TINV如查对对话框写写0.2,25统计学--ch5suyl48统计学--ch5suyl49§6.3.3F—分布若1~2(n1),2~2(n2),1,2独立,则则称为第一一自由度度为n1,第二自由由度为n2的F—分布,其概率密密度为1.F—分布构造和密密度函数数统计学--ch5suyl50分子是自自由度为为n1的卡方随随机变量量分母是自自由度为为n2的卡方随随机变量量分子分母母相互独独立,且且满足构构造公式式新随机变变量服从从第一自自由度为为n1第二自由由度为n2的F分布F分布的三三个要点点:统计学--ch5suyl51m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=15,n=10F分布密度度函数图图统计学--ch5suyl522.F---分布性质质特征(1)F分布的数数学期望望和方差差统计学--ch5suyl53(2)自由度度F分布有两两个自由由度,称称为第一一自由度度和第二二自由度度,分别别对应构构成F分布的分分子和分分母的自自由度。。两个自自由度的的不同组组合和形形成F分布曲线线的不同同形态,,这在F分布的图图形中已已经清楚楚看到了了。F分布的两两个自由由度还有有一个重重要性质质,它们们是可以以互相转转化的。。统计学--ch5suyl54(3)F分布的上侧临界界值是指满足足下式的的统计学--ch5suyl55统计学--ch5suyl56因为则.统计学--ch5suyl57统计学--ch5suyl58[例6-9]]设X1,X2,…,X9相互独立立,服从从正态分分布N(0,,16)),Y1,Y2,…,Y16相互独立立,服从从正态分分布N(0,,9),X1,X2,…,X9与Y1,Y2,…,Y16相互独立立,求随随机变量量所服从的的分布。。统计学--ch5suyl59从而根据t分布的构构造,则则统计学--ch5suyl60[例6-10]设总体X1,X2,…,X6服从N(0,,1)分布。试确定常常数c,使cY服从2。故因此统计学--ch5suyl61§6.3.4抽样分布布的重要要定理本节的前前面部分分,为我我们提供供了讨论论统计量量的分布布可以利利用的结结论,下下面开始始讨论总总体服从从正态分分布场合合的抽样样分布,,这是因因为在应应用中许许多随机机变量的的概率分分布或是是正态分分布,或或是近似似正态的的。统计学--ch5suyl62定理6.1抽样分布的的重要定定理设X为一个正正态总体体,即其简单随随机样本本为。。则有有与相互独立立;设母体(1)(2)则(3)统计学--ch5suyl63抽样分布布定理定理6-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024能源环境监测与治理服务合同范本3篇
- 2024简易版货运服务协议版B版
- 2024版栏杆购销合同范本
- 2025年度XX教育培训机构教学质量不可撤销担保协议3篇
- 2024甲午年建筑工程砌墙分包合同
- 2024行政处罚权委托及协助执法合作协议3篇
- 2024茶楼内部装饰设计合同
- 2024年适用:景点门票预订合同
- 2025年度城市地下综合管廊10kv配电设施建设合作协议3篇
- 2024药材采购合同范文:中药材市场垄断采购合同3篇
- 思博安根测仪热凝牙胶尖-说明书
- 信息学奥赛-计算机基础知识(完整版)资料
- 数字信号处理(课件)
- 出院小结模板
- HITACHI (日立)存储操作说明书
- 公路自然灾害防治对策课件
- (新版教材)苏教版二年级下册科学全册教案(教学设计)
- 61850基础技术介绍0001
- 电镜基本知识培训
- 耳鸣中医临床路径
- 围堰高喷防渗墙工程监理实施细则
评论
0/150
提交评论