(统计量与抽样分布)课件_第1页
(统计量与抽样分布)课件_第2页
(统计量与抽样分布)课件_第3页
(统计量与抽样分布)课件_第4页
(统计量与抽样分布)课件_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6.2统计量与抽样分布在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章”的数据.第6章数理统计基础6.2统计量与抽样分布第6章数理统计基础【例6.3】从某地区随机抽取50户农民,调查其人均年收入情况,得到数据(单位:元)如下: 试对该地区农民收入的水平和贫富悬殊程度做个大致分析.9248009167048701040824690574490972988126668476494040880461085260275478896270471285488876884888211928208786148467468287928726966449268081010728742850864738

6.2统计量与抽样分布【例6.3】从某地区随机抽取50户农民,调查其人均年收入情况解:显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很难得出什么印象.但是可以对这些数据稍事加工,如记各农户的人均年收入分别为x1,x2,...,x50,计算得到这样,就可以了解到该地区农民的平均收入和该地区农民贫富悬殊的大致情况:农民的年人均平均收入大约为809.52元,标准差约为155.85元,贫富悬殊不算很大.

6.2统计量与抽样分布解:显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很由此可见对样本的加工是十分重要的.对样本加工,主要就是构造统计量.6.2.1统计量定义6.2设X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称g(x1,x2,...,xn)为统计量g(X1,X2,…,Xn)的观测值.统计量是处理、分析数据的主要工具.对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数.

6.2统计量与抽样分布由此可见对样本的加工是十分重要的.对样本加工,主要就【例6.4】设X1,X2,…,Xn是来自总体X的样本,X~N(,

2),其中、2为未知参数,则X1,min{X1,X2,…,Xn}均为统计量,但诸如等均不是统计量,因它含有未知参数或.常用的统计量有如下几种:

6.2.1统计量【例6.4】设X1,X2,…,Xn是来自总体X的样本,X~N1.有关一维总体的统计量设X1,X2,…,Xn为总体X的样本,x1,x2,...,xn为样本观测值,(1)样本均值常用来作为总体期望(均值)的估计量,其观测值为

6.2.1统计量1.有关一维总体的统计量6.2.1统计量(2)样本方差(3)样本标准差样本方差和样本标准差刻画了样本数据的分散程度,常用来作为总体方差和标准差的估计量.观测值分别为

6.2.1统计量(2)样本方差6.2.1统计量(4)样本k阶原点矩(简称样本k阶矩),(k=1,2,…)(5)样本k阶中心矩,(k=2,3,…)显然Ak和Bk的观测值分别记为

6.2.1统计量(4)样本k阶原点矩(简称样本k阶矩)6.2.定理6.1设总体X的期望E(X)=

,方差D(X)=

2,X1,X2,…,Xn为总体X的样本,,S2分别为样本均值和样本方差,则

6.2.1统计量定理6.1设总体X的期望E(X)=,方差D(X)由辛钦大数定理和依概率收敛的性质可以证明定理6.2设总体X的k阶原点矩E(Xk)=

k存在(k=1,2,…,m),X1,X2,…,Xn为总体X的样本,g(t1,t2,…,tm)是m元连续函数,则特别有

6.2.1统计量由辛钦大数定理和依概率收敛的性质可以证明6.2.1统2.有关二维总体的统计量设(X1,Y1),(X2,Y2),…,(Xn,Yn)为二维总体(X,Y)的样本,其观测值为(x1,y1),(x2,y2),…,(xn,yn),则下列各量为统计量:(1)样本协方差(2)样本相关系数其中SXY和RXY常分别用来作为总体X和Y的协方差Cov(X,Y)与相关系数XY的估计量.

6.2.1统计量2.有关二维总体的统计量6.2.1统计量【实验6.2】用Excel对例6-3中的数据计算统计量样本均值、样本方差和样本标准差的观测值.

实验准备:(1)函数AVERAGE的使用格式:AVERAGE(number1,number2,...)功能:计算给定样本的算术平均值.(2)函数VAR的使用格式:VAR(number1,number2,...)功能:计算给定样本的方差.(3)函数STDEV的使用格式:STDEV(number1,number2,...)功能:计算给定样本的标准差.

6.2.1统计量【实验6.2】用Excel对例6-3中的数据计算统计量样本均

实验方法一:(1)输入数据及统计量名,如图6-7左所示.(2)计算样本均值,在单元格H2中输入公式:=AVERAGE(A2:E11)(3)计算样本方差s2,在单元格H3中输入公式:=VAR(A2:E11)(4)计算样本标准差s,在单元格H4中输入公式:=STDEV(A2:E11)计算结果:、s2=24288.91、s=155.85,如图6-7右所示.

6.2.1统计量实验方法一:6.2.1统计量图6-7计算统计量

6.2.1统计量6.2.1统计量

实验方法二:(1)输入整理数据,如图6-8左所示.(2)在Excel主菜单中选择“工具”“数据分析”,打开“数据分析”对话框,在“分析工具”列表中选择“描述统计”选项,单击“确定”按钮.(3)在打开的“描述统计”对话框中,依次输入“输入区域”和“输出区域”,选中“标志位于第一行”复选框,如图6-8中所示,单击“确定”按钮.得到描述统计的结果如图6-8右所示.

6.2.1统计量实验方法二:6.2.1统计量

图6-8描述统计

6.2.1统计量6.2.1统计量

6.2统计量与抽样分布6.2.2抽样分布统计量的分布称为抽样分布.为了研究抽样分布,先研究数理统计中三种重要的分布.6.2统计量与抽样分布6.2.2抽样分布

1.2分布

定义6.3设X1,X2,…,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量服从自由度为n的2分布,记为2~2(n).此处自由度指2中包含独立变量的个数.可以证明,2(n)的概率密度为其中()称为伽马函数,

6.2.2抽样分布1.2分布6.2.2抽样分布2分布概率密度

图6-92(n)分布的概率密度曲线可以看出,随着n的增大,的图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动.

6.2.2抽样分布2分布概率密度6.2.2抽样分布2分布具有下面性质:(1)(可加性)设是两个相互独立的随机变量,且

(2)设

证明(1)由2分布的定义易得证明.(2)因为存在相互独立、同分布于N(0,1)的随机变量X1,X2,…,Xn,使则

6.2.2抽样分布2分布具有下面性质:6.2.2抽样分布由于Xi独立,且注意到N(0,1)的四阶矩为3,可得

英国统计学家费歇(R.A.Fisher)曾证明,当n较大时,近似服从

6.2.2抽样分布由于Xi独立,且注意到N(0,1)的四阶矩为3,可得6.22.t分布定义6.4设X~N(0,1),Y~2(n),X与Y独立,则称随机变量服从自由度为的t分布,又称为学生氏分布(Studentdistribution),记为T

~t(n).可以证明t(n)的概率密度为

图6-10t分布的概率密度曲线

6.2.2抽样分布2.t分布6.2.2抽样分布

图6-10t分布的概率密度曲线显然t分布的概率密度是x的偶函数,图6-10描绘了n=1,3,7时t(n)的概率密度曲线.作为比较,还描绘了N(0,1)的概率密度曲线.

6.2.2抽样分布6.2.2抽样分布可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近.可以证明t分布具有下面性质:即当n趋向无穷时,t(n)近似于标准正态分布N(0,1).一般地,若n>30,就可认为t(n)基本与N(0,1)相差无几了.

6.2.2抽样分布可看出,随着n的增大,t(n)的概率密度曲线与6.2.23.F分布定义6.5设X~2(n1),Y~2(n2),且X与Y独立,称随机变量服从自由度为(n1,n2)的F分布,记为F~F(n1,n2).可以证明的概率密度函数为

6.2.2抽样分布3.F分布6.2.2抽样分布

6.2.2抽样分布图6-11F分布的概率密度曲线由F分布的定义容易看出,若F

~F(n1,n2),则1/F~F(n2,n1).6.2.2抽样分布4.正态总体的抽样分布定理在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究.因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差S2的抽样分布定理.

6.2.2抽样分布4.正态总体的抽样分布定理6.2.2抽样分布定理6.3设X1,X2,…,Xn为来自总体N(,

2)的样本,,S2分别为样本均值和样本方差,则有(1)(2)(3)与S2相互独立;(4)证明:由正态分布的性质容易得到(1),略去(2)和(3)的证明,下面仅证明4.

6.2.2抽样分布定理6.3设X1,X2,…,Xn为来自总体N(,2

证明(4):由(1)知,从而由(2)(3)知根据t分布的定义

6.2.2抽样分布

【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,402),抽取16个灯泡的样本,求平均寿命小于775小时的概率.

解:设灯泡寿命总体为X,因为X~N(800,402),n=16,所以样本均值故

6.2.2抽样分布【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,4【例6.6】设总体X~N(,102),抽取容量为n的样本,样本均值记为.欲使与的偏差小于5的概率大于0.95,样本容量n至少应该取多大?解:依题令,即因为总体,从而所以即查表知,由于单调不减,应有故n至少应该取为16.

6.2.2抽样分布【例6.6】设总体X~N(,102),抽取容量为n的样本,【例6.7】设X1,X2,…,Xn为总体X~N(,

2)的样本,求样本方差的均值和方差.

解:本题可以通过2分布的均值和方差简单求出.由定理6.3,所以有

于是

6.2.2抽样分布【例6.7】设X1,X2,…,Xn为总体X~N(,6.2.3分位数设X为一随机变量,我们知道对于给定的实数x,P{X>x}是事件{X>x}的概率.在统计中,我们常常需要对给定事件{X>x}的概率,由此确定的x取是一个临界点,称为分位数(点),有如下定义:定义6.6设X为随机变量,若对给定的

(0,1),存在x满足P{X>x}=,则称x为X的上

分位数(点).

6.2统计量与抽样分布6.2.3分位数6.2统计量与抽样分布若X具有密度f(x),P{X>x}=说明分位数x右边的一块阴影面积为,即

容易看出,X的上分位数x是关于

的减函数,即增大时x减少.下面给出几种常用分布的上分位数的求法:

6.2.3分位数若X具有密度f(x),6.2.3分位数1.设Z

N(0,1),记N(0,1)的上分位数为z,即有P{Z>z}=.由于(z)=P{Z

z}=1–P{Z

z}=1–,由标准正态分布函数表(附表2)反过来查,即可以得到z的值.为使用方便,表6-1列出了标准正态分布的几个常用分位数z的值.表6-1常用的标准正态分布的分位数0.0010.0050.010.0250.050.10z3.0902.5762.3261.9601.6451.282

6.2.3分位数1.设ZN(0,1),记N(0,1)的上分位数为z由N(0,1)的概率密度的对称性(见图6-13)可知所以z1-=–z.

图6-13z1-与z

6.2.3分位数由N(0,1)的概率密度的对称性(见图6-13)可知6.22.设2

~2(n),记2(n)的上分位数为2(n),即有P{2>2(n)}=.附表3中给出了时2(n)的值,当n>40时,由2(n)的渐近性质,有

6.2.3分位数2.设2~2(n),记2(n)的上分位数为3.设T~t(n),记t(n)的上分位数为t(n),即有P{T>t(n)}=;由t(n)的概率密度的对称性t1-(n)=–t(n)

图6-14t1-(n)与t(n)附表4中给出了时t(n)的值,当n>40时,由于t(n)近似N(0,1),所以t(n)

z

6.2.3分位数3.设T~t(n),记t(n)的上分位数为t(n),4.设F~F(n1,n2),记F(n1,n2)的上分位数为F(n1,n2),即有P{F>F(n1,n2)}=.附表5中给出部分F(n1,n2)的值.另外,由于F~F(n1,n2)时,1/F

~F(n2,n1),所以故

6.2.3分位数4.设F~F(n1,n2),记F(n1,n2)的上分【例6.8】求下列分位数:(1)z0.025;20..5(20);t0.1(25);F0.05(10,15);(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).

解:(1)查表6-1知z0.025=1.96.也可由标准正态分布函数表(附表2),对函数值(z0.025)=1–0.025=0.975反查表得z0.025=1.96.

6.2.3分位数【例6.8】求下列分位数:6.2.3分位数分别查附表3、附表4、附表5得到20.5(20)=31.4104、t0.1(25)=1.3164、F0.05(10,15)=2.54;(2)在附表4中没有=0.975,可先查出t0.025(4)=2.7764,利用对称性得到t0.975(4)=–t0.025(4)=–2.7764.(3)在附表4中查不到t0.05(55),用近似公式t0.05(55)

z0.05=1.645.

6.2.3分位数分别查附表3、附表4、附表5得到6.2.3分位数(4)在附表5中,查不到F0.9(14,10),但可查出F0.1(10,14)=2.10,故(5)在附表3表中查不到20.975(200),先查出z0.975=–z0.025=–1.96,再作如下近似计算

6.2.3分位数(4)在附表5中,查不到F0.9(14,10),但可查出【实验6.3】用Excel计算例6-8中的分位数:(1)z0.025;(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).

实验准备:(1)函数NORMSINV的使用格式:NORMSINV(probability)功能:返回标准正态分布的分布函数的反函数值.

6.2.3分位数【实验6.3】用Excel计算例6-8中的分位数:6.2.

(2)函数TINV的使用格式:TINV(probability,degrees_freedom)功能:返回给定自由度的t-分布的上/2分位数.其中=probability为t-分布的双尾概率,degrees_freedom为分布的自由度.(3)函数FINV的使用格式:FINV(probability,degrees_freedom1,degrees_freedom2)功能:返回F分布的上分位数,其中=probability为F分布的单尾概率,degrees_freedom1和degrees_freedom2为两个自由度.

6.2.3分位数(2)函数TINV的使用格式:6.2.3分(4)函数CHIINV的使用格式:CHIINV(probability,degrees_freedom)功能:返回2分布的上分位数.其中=probability为2分布的单尾概率,Degrees_freedom为自由度.

6.2.3分位数(4)函数CHIINV的使用格式:6.2.3实验步骤:(1)计算z0.025,在单元格B2中输入公式:=NORMSINV(0.975)(2)计算t0.975(4),由于t0.975(4)=-t0.025(4),在单元格B3中输入公式:=-TINV(2*0.025,4)(3)计算t0.05(55),在单元格B4中输入公式:=TINV(2*0.05,55)

6.2.3分位数实验步骤:6.2.3分位数(4)计算F0.9(14,10),在单元格B5中输入公式:=FINV(0.9,14,10)(5)计算20.975(200),在单元格B6中输入公式:=CHIINV(0.975,200)计算结果如图所示.

6.2.3分位数(4)计算F0.9(14,10),在单元格B5中输【例6.9】设X1,X2是总体X~N(1,2)的样本,试求概率P{(X1–X2)2

20.08}.

解法一:因为X~N(1,2),所以Xi~N(1,2),i=1,2,从而记,所以查表知,即所以

6.2.3分位数【例6.9】设X1,X2是总体X~N(1,2)的样本,试【例6.9】设X1,X2是总体X~N(1,2)的样本,试求概率P{(X1–X2)2

20.08}.解法二:因X~N(1,2),所以从而

6.2.3分位数【例6.9】设X1,X2是总体X~N(1,2)的样本,试由定理6.3容易证明下述有关两个总体的抽样分布定理.定理6.4

设,分别为来自N(1,12)和N(2,22)的样本,且它们相互独立,设,S12,,S22,分别为相应样本的样本均值和样本方差,则(1)(2)

6.2.3分位数由定理6.3容易证明下述有关两个总体的抽样分布定理.(3)当时,其中

6.2.3分位数(3)当时,6证:(1)由于,,又与独立,故由正态分布的性质知所以

6.2.3分位数证:(1)由于证:(2)由定理6.3,且来自两个总体的样本是独立的,由F分布的定义知

6.2.3分位数证:6.2.3分位数(3)根据(1)知,所以根据(2),由

2分布的性质由于U与V相互独立,按t分布的定义设,则结论成立.

6.2.3分位数(3)根据(1)知,6.2.3分位数【例6.10】设X1,X2,…,X25,Y1,Y2,…,Y25分别为来自两个独立总体N(0,16)和N(1,9)的样本,和分别表示相应的样本均值,求.

解:因为,且相互独立,所以故

=1–0.8413=0.1587.

6.2.3分位数【例6.10】设X1,X2,…,X25,Y1,Y2,…,Y2【例6.11】若从方差相等的两个正态总体中分别抽出n1=8和n2=12的独立样本,样本方差分别为S12和S22,求.

解:由于,n1=8,n2=12,所以因此查表知F0.01(7,11)=4.89,即P{F>4.89}=0.01,故

6.2.3分位数【例6.11】若从方差相等的两个正态总体中分别抽出n1=【质量控制问题解答】某食盐厂用包装机包装的食盐,每袋重量500g,通常在包装机正常的情况下,袋装食盐的重量X服从正态分布,均值为500g,标准差为25g.为进行生产质量控制,他们每天从当天的产品中随机抽出30袋进行严格称重,以检验包装机工作是否正常.某日,该厂随机抽取30袋盐的重量分别为:

从这些数据看,包装机的工作正常吗?475500485454504439492501463461464494512451434511513490521514449467499484508478479499529480【质量控制问题解答】47550048545450443949解:设X1,X2,…,X30为来自袋装盐重量总体X~N(500,252)的样本.由抽样数据得到:下面考察在包装机工作正常的情况下事件{|–500|15}出现的概率:由于X~N(500,252),由定理6.3知,于是【质量控制问题解答】解:设X1,X2,…,X30为来自袋装盐重量总体X~N(50这说明,如果包装机工作正常,{|–500|15}是一个小概率事件,但在本次抽样中却出现了,因此可以推断包装机出了故障,应该立即停产检修.在实际生产中,如果产品质量指标X~N(,2),人们常用质量控制图来控制产品质量.通常的做法是将产品质量的特征绘制在控制图上,然后观察这些值随时间如何波动.

图6-16质量控制图【质量控制问题解答】这说明,如果包装机工作正常,{|–500例如,可以把不同时间的样本均值绘制在图6-16上,图中的两条平行线分别为上控制限和下控制限,他们距中间的总体均值限(过程均值限)均相距,如果落在上、下控制限的外面,则有充分的理由说明目前的生产线工作不正常,即生产过程失控,应停产检修生产设备.事实上,由于总体X~N(,2),则有,从而【质量控制问题解答】例如,可以把不同时间的样本均值绘制在图6-16上即若生产线工作正常,落在上、下控制限的外面的概率是一个小概率事件,如果落在上、下控制限的外面,就有理由认为生产线失控,应该检修调整.上例中,两条控制限分别为和,而实际抽样的结果为,跑出了控制限,所以可以推断包装机出了故障.【质量控制问题解答】即若生产线工作正常,落在上、下控制限的外面的概率是一个小概

6.2统计量与抽样分布在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章”的数据.第6章数理统计基础6.2统计量与抽样分布第6章数理统计基础【例6.3】从某地区随机抽取50户农民,调查其人均年收入情况,得到数据(单位:元)如下: 试对该地区农民收入的水平和贫富悬殊程度做个大致分析.9248009167048701040824690574490972988126668476494040880461085260275478896270471285488876884888211928208786148467468287928726966449268081010728742850864738

6.2统计量与抽样分布【例6.3】从某地区随机抽取50户农民,调查其人均年收入情况解:显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很难得出什么印象.但是可以对这些数据稍事加工,如记各农户的人均年收入分别为x1,x2,...,x50,计算得到这样,就可以了解到该地区农民的平均收入和该地区农民贫富悬殊的大致情况:农民的年人均平均收入大约为809.52元,标准差约为155.85元,贫富悬殊不算很大.

6.2统计量与抽样分布解:显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很由此可见对样本的加工是十分重要的.对样本加工,主要就是构造统计量.6.2.1统计量定义6.2设X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称g(x1,x2,...,xn)为统计量g(X1,X2,…,Xn)的观测值.统计量是处理、分析数据的主要工具.对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数.

6.2统计量与抽样分布由此可见对样本的加工是十分重要的.对样本加工,主要就【例6.4】设X1,X2,…,Xn是来自总体X的样本,X~N(,

2),其中、2为未知参数,则X1,min{X1,X2,…,Xn}均为统计量,但诸如等均不是统计量,因它含有未知参数或.常用的统计量有如下几种:

6.2.1统计量【例6.4】设X1,X2,…,Xn是来自总体X的样本,X~N1.有关一维总体的统计量设X1,X2,…,Xn为总体X的样本,x1,x2,...,xn为样本观测值,(1)样本均值常用来作为总体期望(均值)的估计量,其观测值为

6.2.1统计量1.有关一维总体的统计量6.2.1统计量(2)样本方差(3)样本标准差样本方差和样本标准差刻画了样本数据的分散程度,常用来作为总体方差和标准差的估计量.观测值分别为

6.2.1统计量(2)样本方差6.2.1统计量(4)样本k阶原点矩(简称样本k阶矩),(k=1,2,…)(5)样本k阶中心矩,(k=2,3,…)显然Ak和Bk的观测值分别记为

6.2.1统计量(4)样本k阶原点矩(简称样本k阶矩)6.2.定理6.1设总体X的期望E(X)=

,方差D(X)=

2,X1,X2,…,Xn为总体X的样本,,S2分别为样本均值和样本方差,则

6.2.1统计量定理6.1设总体X的期望E(X)=,方差D(X)由辛钦大数定理和依概率收敛的性质可以证明定理6.2设总体X的k阶原点矩E(Xk)=

k存在(k=1,2,…,m),X1,X2,…,Xn为总体X的样本,g(t1,t2,…,tm)是m元连续函数,则特别有

6.2.1统计量由辛钦大数定理和依概率收敛的性质可以证明6.2.1统2.有关二维总体的统计量设(X1,Y1),(X2,Y2),…,(Xn,Yn)为二维总体(X,Y)的样本,其观测值为(x1,y1),(x2,y2),…,(xn,yn),则下列各量为统计量:(1)样本协方差(2)样本相关系数其中SXY和RXY常分别用来作为总体X和Y的协方差Cov(X,Y)与相关系数XY的估计量.

6.2.1统计量2.有关二维总体的统计量6.2.1统计量【实验6.2】用Excel对例6-3中的数据计算统计量样本均值、样本方差和样本标准差的观测值.

实验准备:(1)函数AVERAGE的使用格式:AVERAGE(number1,number2,...)功能:计算给定样本的算术平均值.(2)函数VAR的使用格式:VAR(number1,number2,...)功能:计算给定样本的方差.(3)函数STDEV的使用格式:STDEV(number1,number2,...)功能:计算给定样本的标准差.

6.2.1统计量【实验6.2】用Excel对例6-3中的数据计算统计量样本均

实验方法一:(1)输入数据及统计量名,如图6-7左所示.(2)计算样本均值,在单元格H2中输入公式:=AVERAGE(A2:E11)(3)计算样本方差s2,在单元格H3中输入公式:=VAR(A2:E11)(4)计算样本标准差s,在单元格H4中输入公式:=STDEV(A2:E11)计算结果:、s2=24288.91、s=155.85,如图6-7右所示.

6.2.1统计量实验方法一:6.2.1统计量图6-7计算统计量

6.2.1统计量6.2.1统计量

实验方法二:(1)输入整理数据,如图6-8左所示.(2)在Excel主菜单中选择“工具”“数据分析”,打开“数据分析”对话框,在“分析工具”列表中选择“描述统计”选项,单击“确定”按钮.(3)在打开的“描述统计”对话框中,依次输入“输入区域”和“输出区域”,选中“标志位于第一行”复选框,如图6-8中所示,单击“确定”按钮.得到描述统计的结果如图6-8右所示.

6.2.1统计量实验方法二:6.2.1统计量

图6-8描述统计

6.2.1统计量6.2.1统计量

6.2统计量与抽样分布6.2.2抽样分布统计量的分布称为抽样分布.为了研究抽样分布,先研究数理统计中三种重要的分布.6.2统计量与抽样分布6.2.2抽样分布

1.2分布

定义6.3设X1,X2,…,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量服从自由度为n的2分布,记为2~2(n).此处自由度指2中包含独立变量的个数.可以证明,2(n)的概率密度为其中()称为伽马函数,

6.2.2抽样分布1.2分布6.2.2抽样分布2分布概率密度

图6-92(n)分布的概率密度曲线可以看出,随着n的增大,的图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动.

6.2.2抽样分布2分布概率密度6.2.2抽样分布2分布具有下面性质:(1)(可加性)设是两个相互独立的随机变量,且

(2)设

证明(1)由2分布的定义易得证明.(2)因为存在相互独立、同分布于N(0,1)的随机变量X1,X2,…,Xn,使则

6.2.2抽样分布2分布具有下面性质:6.2.2抽样分布由于Xi独立,且注意到N(0,1)的四阶矩为3,可得

英国统计学家费歇(R.A.Fisher)曾证明,当n较大时,近似服从

6.2.2抽样分布由于Xi独立,且注意到N(0,1)的四阶矩为3,可得6.22.t分布定义6.4设X~N(0,1),Y~2(n),X与Y独立,则称随机变量服从自由度为的t分布,又称为学生氏分布(Studentdistribution),记为T

~t(n).可以证明t(n)的概率密度为

图6-10t分布的概率密度曲线

6.2.2抽样分布2.t分布6.2.2抽样分布

图6-10t分布的概率密度曲线显然t分布的概率密度是x的偶函数,图6-10描绘了n=1,3,7时t(n)的概率密度曲线.作为比较,还描绘了N(0,1)的概率密度曲线.

6.2.2抽样分布6.2.2抽样分布可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近.可以证明t分布具有下面性质:即当n趋向无穷时,t(n)近似于标准正态分布N(0,1).一般地,若n>30,就可认为t(n)基本与N(0,1)相差无几了.

6.2.2抽样分布可看出,随着n的增大,t(n)的概率密度曲线与6.2.23.F分布定义6.5设X~2(n1),Y~2(n2),且X与Y独立,称随机变量服从自由度为(n1,n2)的F分布,记为F~F(n1,n2).可以证明的概率密度函数为

6.2.2抽样分布3.F分布6.2.2抽样分布

6.2.2抽样分布图6-11F分布的概率密度曲线由F分布的定义容易看出,若F

~F(n1,n2),则1/F~F(n2,n1).6.2.2抽样分布4.正态总体的抽样分布定理在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究.因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差S2的抽样分布定理.

6.2.2抽样分布4.正态总体的抽样分布定理6.2.2抽样分布定理6.3设X1,X2,…,Xn为来自总体N(,

2)的样本,,S2分别为样本均值和样本方差,则有(1)(2)(3)与S2相互独立;(4)证明:由正态分布的性质容易得到(1),略去(2)和(3)的证明,下面仅证明4.

6.2.2抽样分布定理6.3设X1,X2,…,Xn为来自总体N(,2

证明(4):由(1)知,从而由(2)(3)知根据t分布的定义

6.2.2抽样分布

【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,402),抽取16个灯泡的样本,求平均寿命小于775小时的概率.

解:设灯泡寿命总体为X,因为X~N(800,402),n=16,所以样本均值故

6.2.2抽样分布【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,4【例6.6】设总体X~N(,102),抽取容量为n的样本,样本均值记为.欲使与的偏差小于5的概率大于0.95,样本容量n至少应该取多大?解:依题令,即因为总体,从而所以即查表知,由于单调不减,应有故n至少应该取为16.

6.2.2抽样分布【例6.6】设总体X~N(,102),抽取容量为n的样本,【例6.7】设X1,X2,…,Xn为总体X~N(,

2)的样本,求样本方差的均值和方差.

解:本题可以通过2分布的均值和方差简单求出.由定理6.3,所以有

于是

6.2.2抽样分布【例6.7】设X1,X2,…,Xn为总体X~N(,6.2.3分位数设X为一随机变量,我们知道对于给定的实数x,P{X>x}是事件{X>x}的概率.在统计中,我们常常需要对给定事件{X>x}的概率,由此确定的x取是一个临界点,称为分位数(点),有如下定义:定义6.6设X为随机变量,若对给定的

(0,1),存在x满足P{X>x}=,则称x为X的上

分位数(点).

6.2统计量与抽样分布6.2.3分位数6.2统计量与抽样分布若X具有密度f(x),P{X>x}=说明分位数x右边的一块阴影面积为,即

容易看出,X的上分位数x是关于

的减函数,即增大时x减少.下面给出几种常用分布的上分位数的求法:

6.2.3分位数若X具有密度f(x),6.2.3分位数1.设Z

N(0,1),记N(0,1)的上分位数为z,即有P{Z>z}=.由于(z)=P{Z

z}=1–P{Z

z}=1–,由标准正态分布函数表(附表2)反过来查,即可以得到z的值.为使用方便,表6-1列出了标准正态分布的几个常用分位数z的值.表6-1常用的标准正态分布的分位数0.0010.0050.010.0250.050.10z3.0902.5762.3261.9601.6451.282

6.2.3分位数1.设ZN(0,1),记N(0,1)的上分位数为z由N(0,1)的概率密度的对称性(见图6-13)可知所以z1-=–z.

图6-13z1-与z

6.2.3分位数由N(0,1)的概率密度的对称性(见图6-13)可知6.22.设2

~2(n),记2(n)的上分位数为2(n),即有P{2>2(n)}=.附表3中给出了时2(n)的值,当n>40时,由2(n)的渐近性质,有

6.2.3分位数2.设2~2(n),记2(n)的上分位数为3.设T~t(n),记t(n)的上分位数为t(n),即有P{T>t(n)}=;由t(n)的概率密度的对称性t1-(n)=–t(n)

图6-14t1-(n)与t(n)附表4中给出了时t(n)的值,当n>40时,由于t(n)近似N(0,1),所以t(n)

z

6.2.3分位数3.设T~t(n),记t(n)的上分位数为t(n),4.设F~F(n1,n2),记F(n1,n2)的上分位数为F(n1,n2),即有P{F>F(n1,n2)}=.附表5中给出部分F(n1,n2)的值.另外,由于F~F(n1,n2)时,1/F

~F(n2,n1),所以故

6.2.3分位数4.设F~F(n1,n2),记F(n1,n2)的上分【例6.8】求下列分位数:(1)z0.025;20..5(20);t0.1(25);F0.05(10,15);(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).

解:(1)查表6-1知z0.025=1.96.也可由标准正态分布函数表(附表2),对函数值(z0.025)=1–0.025=0.975反查表得z0.025=1.96.

6.2.3分位数【例6.8】求下列分位数:6.2.3分位数分别查附表3、附表4、附表5得到20.5(20)=31.4104、t0.1(25)=1.3164、F0.05(10,15)=2.54;(2)在附表4中没有=0.975,可先查出t0.025(4)=2.7764,利用对称性得到t0.975(4)=–t0.025(4)=–2.7764.(3)在附表4中查不到t0.05(55),用近似公式t0.05(55)

z0.05=1.645.

6.2.3分位数分别查附表3、附表4、附表5得到6.2.3分位数(4)在附表5中,查不到F0.9(14,10),但可查出F0.1(10,14)=2.10,故(5)在附表3表中查不到20.975(200),先查出z0.975=–z0.025=–1.96,再作如下近似计算

6.2.3分位数(4)在附表5中,查不到F0.9(14,10),但可查出【实验6.3】用Excel计算例6-8中的分位数:(1)z0.025;(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).

实验准备:(1)函数NORMSINV的使用格式:NORMSINV(probability)功能:返回标准正态分布的分布函数的反函数值.

6.2.3分位数【实验6.3】用Excel计算例6-8中的分位数:6.2.

(2)函数TINV的使用格式:TINV(probability,degrees_freedom)功能:返回给定自由度的t-分布的上/2分位数.其中=probability为t-分布的双尾概率,degrees_freedom为分布的自由度.(3)函数FINV的使用格式:FINV(probability,degrees_freedom1,degrees_freedom2)功能:返回F分布的上分位数,其中=probability为F分布的单尾概率,degrees_freedom1和degrees_freedom2为两个自由度.

6.2.3分位数(2)函数TINV的使用格式:6.2.3分(4)函数CHIINV的使用格式:CHIINV(probability,degrees_freedom)功能:返回2分布的上分位数.其中=probability为2分布的单尾概率,Degrees_freedom为自由度.

6.2.3分位数(4)函数CHIINV的使用格式:6.2.3实验步骤:(1)计算z0.025,在单元格B2中输入公式:=NORMSINV(0.975)(2)计算t0.975(4),由于t0.975(4)=-t0.025(4),在单元格B3中输入公式:=-TINV(2*0.025,4)(3)计算t0.05(55),在单元格B4中输入公式:=TINV(2*0.05,55)

6.2.3分位数实验步骤:6.2.3分位数(4)计算F0.9(14,10),在单元格B5中输入公式:=FINV(0.9,14,10)(5)计算20.975(200),在单元格B6中输入公式:=CHIINV(0.975,200)计算结果如图所示.

6.2.3分位数(4)计算F0.9(14,10),在单元格B5中输【例6.9】设X1,X2是总体X~N(1,2)的样本,试求概率P{(X1–X2)2

20.08}.

解法一:因为X~N(1,2),所以Xi~N(1,2),i=1,2,从而记,所以查表知,即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论