管理统计学第6章统计量与抽样分布D_第1页
管理统计学第6章统计量与抽样分布D_第2页
管理统计学第6章统计量与抽样分布D_第3页
管理统计学第6章统计量与抽样分布D_第4页
管理统计学第6章统计量与抽样分布D_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学管理统计学

你不必吃完整头牛,才知道它的肉是咬不动的。

——SamelJohson第6章统计量及其抽样分布6.1统计量6.2关于分布的几个概念6.3由正态分布导出的几个重要分布

6.4样本均值的分布与中心极限定理6.5样本比例的抽样分布6.6两个样本平均值之差的分布6.7关于样本方差的分布

学习目标了解统计量及其分布的几个概念了解由正态分布导出的几个重要分布

理解样本均值的分布与中心极限定理掌握单样本比例和样本方差的抽样分布抽样分布中的基本概念

总体与样本样本容量与样本个数重复抽样与不重复抽样总体参数与样本统计量一、总体和样本1.总体:是研究对象的全体,由许多具有某种相同性质的个体组成。总体中所包含的单位数用N表示。总体中各个单位的标志值用

表示。2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用

n

表示,为样本观察值。3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。二、样本容量与样本个数样本容量:一个样本中所包含的单位数,用n表示。n>30,大样本;n≤30,小样本。样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与样本容量、抽样方法、和抽样组织方式等因素有关。三、抽样方法重复抽样与不重复抽样1.重复抽样:(1)n个单位样本是由n次连续抽取结果构成;(2)每次抽取都是独立的;(3)每次抽取都在相同的条件下进行,每个单位在每次抽取中被抽中的机会相等。2.不重复抽样:(1)每次抽取不重复,相当于同时抽取n个单位样本;(2)每次抽取都是不独立的;(3)每个单位在每次抽取中中选机会相等,但是在不同次抽取中中选机会是不均等的。★在样本容量相同情况下,重复抽样的样本个数多于不重复抽样的样本个数,而不重复抽样的样本代表性高于重复抽样四、总体参数和样本统计量总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。样本统计量:根据样本分布计算的指标。是随机变量。平均数标准差、方差成数参数、2P统计量S、S2p总体样本样本统计量的问题因为样本是随机抽取的,则样本统计量是随机变量。在调查的例子中,当我们再重新选取200人的样本进行统计后,得到的上网时间的平均数就不一定还等于8.58小时,可能6小时,也可能只有4小时。既然每次抽取的样本之间的统计量都不一致,是否还能用来估计总体的参数?既然样本统计量是个随机变量,不妨先来看一下它概率分布如何6.1

统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量

6.1.4充分统计量p141

统计量(statistic)设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础常用统计量p140次序统计量一组样本观测值X1,X2,…,Xn由小到大的排序

X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,称X(1),X(2),…,X(n)为次序统计量中位数、分位数、四分位数等都是次序统计量6.2

关于分布的几个概念6.2.1抽样分布6.2.2渐进分布6.2.3随机模拟获得的近似分布

抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。例如:对总体均值进行推断,从N个单位中随机抽取n个单位组成样本,计算样本均值,假定全部可能的样本有k个,就有k个样本均值,则的概率分布就称为样本平均数的抽样分布。抽样分布(samplingdistribution)样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布(samplingdistribution)4.因为样本是随机抽取的,则样本统计量是随机变量。在开始的例子中,当我们再重新选取200人的样本进行统计后,得到的上网时间的平均数就不一定还等于8.58小时,可能6小时,也可能只有4小时。既然每次抽取的样本之间的统计量都不一致,是否还能用来估计总体的参数?既然样本统计量是个随机变量,不妨先来看一下它概率分布如何?202122第二次抽取可能被抽中的人员12345678910第一次抽取可能被抽中的人员11,1(1)1,2(1.5)1,3(2)1,4(2.5)1,5(3)1,6(3.5)1,7(4)1,8(4.5)1,9(5)1,10(5.5)22,1(1.5)2,2(2)2,3(2.5)2,4(3)2,5(3.5)2,6(4)2,7(4.5)2,8(5)2,9(5.5)2,10(6)33,1(2)3,2(2.5)3,3(3)3,4(3.5)3,5(4)3,6(4.5)3,7(5)3,8(5.5)3,9(6)3,10(6.5)44,1(2.5)4,2(3)4,3(3.5)4,4(4)4,5(4.5)4,6(5)4,7(5.5)4,8(6)4,9(6.5)4,10(7)55,1(3)5,2(3.5)5,3(4)5,4(4.5)5,5(5)5,6(5.5)5,7(6)5,8(6.5)5,9(7)5,10(7.5)66,1(3.5)6,2(4)6,3(4.5)6,4(5)6,5(5.5)6,6(6)6,7(6.5)6,8(7)6,9(7.5)6,10(8)77,1(4)7,2(4.5)7,3(5)7,4(5.5)7,5(6)7,6(6.5)7,7(7)7,8(7.5)7,9(8)7,10(8.5)88,1(4.5)8,2(5)8,3(5.5)8,4(6)8,5(6.5)8,6(7)8,7(7.5)8,8(8)8,9(8.5)8,10(9)99,1(5)9,2(5.5)9,3(6)9,4(6.5)9,5(7)9,6(7.5)9,7(8)9,8(8.5)9,9(9)9,10(9.5)1010,1(5.5)10,2(6)10,3(6.5)10,4(7)10,5(7.5)10,6(8)10,7(8.5)10,8(9)10,9(9.5)10,10(10)表 10人中有放回抽二人的全部可能样本23表

任职年限样本均值分布数列2425266.3由正态分布导出的几个重要分布6.3.12分布6.3.2t

分布6.3.3F

分布若随机变量X的概率密度函数记为正态分布一般正态分布正态分布标准正态分布:

当时, 记为U∽N(0,1)标准正态分布正态分布非标准正态分布向标准正态分布的转化

标准化因子

则U∽N(0,1)正态分布 查表 当u大于零时,可查正态分布表 但如果u<0时,则可由式φ(-u)=1-φ(u)求出正态分布线性性质: 如果,且相互独立。对

于常数,有下式成立:正态分布由阿贝(Abbe)

于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)

分别于1875年和1900年推导出来设,则令,则Y服从自由度为1的2分布,即

当总体,从中抽取容量为n的样本,则2分布(2

distribution)2分布 相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称期望为:E(2)=n,方差为:D(2)=2n(n为自由度)可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布2分布(性质和特点)c2分布(图示)不同容量样本的抽样分布c2n=1n=4n=10n=20χ2分布图

分布查表:对于给定的α,0<α<1,可在分布表中查得,即 例如

即指

分布t

分布t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布且X和Y相互独立,则称随机变量所遵循的分布规律为t­–分布。t分布图示xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zF

分布由统计学家费希尔(R.A.Fisher)

提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布

(F

distribution)F分布(图示)

不同自由度的F分布F(1,10)(5,10)(10,10)图4-4F分布图FF分布查表性质F分布6.4样本均值的分布与中心极限定理在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布重复抽样分布--样本平均数的分布例:四名工人甲乙丙丁,他们的日工资分别为50元、60元、70元、80元,则:样本样本变量x样本平均数离差序号样本单位1甲甲505050-152252甲乙506055-101003甲丙507060-5254甲丁508065005乙甲605055-101006乙乙606060-15257乙丙607065008乙丁6080705259丙甲705060-52510丙乙7060650011丙丙70707052512丙丁7080751010013丁甲8050650014丁乙80607052515丁丙8070751010016丁丁80808015225合计10401000样本均值50556065707580次数1234321概率0.06250.1250.18750.250.18750.1250.0625样本均值的抽样分布总体的均值,总体方差为,样本均值与总体均值相等,样本方差等于总体方差的该题中抽样方法改为不重复抽样,共有12个样本,抽样分布如下:计算得样本平均值的均值和样本方差分别为不重复抽样分布--样本平均数的分布样本均值5560657075次数22422概率0.1670.1670.3330.1670.167我们得到的假定从上面例子中,我们似乎可以得到这样的假定:重复抽样的样本均值的均值与总体的均值相等,样本均值的方差与总体方差之间的关系为不重复抽样的样本均值的均值与总体的均值相等,样本均值的方差与总体方差之间的关系为重复抽样下,样本均值的概率分布条形图如下样本均值的抽样分布与中心极限定理=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x

的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)中心极限定理(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程如果样本平均数是服从均值为、方差为σ2的非正态分布中抽取的n个单位的平均数,则随着n的增加样本平均数抽样分布逐渐逼近正态分布,即:在重复抽样下,不重复抽样下,大样本的平均数基本上服从正态分布。

p148例题6162小样本分布定理如果从均值为、方差未知的正态总体中抽取容量为n的样本,则样本统计量

服从自由度df=n-1的t分布,其中,s为样本标准差,即:由于用s代替未知的总体方差,所以样本统计量t不服从正态分布而服从t分布。6.5样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为

比例(proportion)在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似推断总体比例的理论基础 样本比例的抽样分布样本比例的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论