概率论与数理统计课件:第21讲 正态总体方差的检验_第1页
概率论与数理统计课件:第21讲 正态总体方差的检验_第2页
概率论与数理统计课件:第21讲 正态总体方差的检验_第3页
概率论与数理统计课件:第21讲 正态总体方差的检验_第4页
概率论与数理统计课件:第21讲 正态总体方差的检验_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 利用样本方差 S 2是2的一个无偏估计,且 (n-1)S2/ 2 2n-1 的结论。8.3.1 单个正态总体方差的 2 检验 设 X1, X2, , Xn 为来自总体 N( , 2) 的样本, 和 2未知,求下列假设的显著性水平为 的检验。思路分析: 1. H0: 2 =02;H1: 2 02 8.3 正态总体方差的检验 当原假设 H0: 2 = 02成立时,S2和02应该比较接近,即比值 S 2/02应接近于1。所以,这个比值过大或过小 时,应拒绝原假设。 合理的做法是: 找两个合适的界限 c1 和 c2 , 当 c1(n-1)S2/02 02 同理,当 H0: 2 = 02成立时,有,此

2、检验法也称 2 检验法。3*. H0: 2 02;H1: 2 02 (同2.)例1:某公司生产的发动机部件的直径 (单位: cm) 服从正态分布,并称其标准差 0=0.048 。现随机抽取5个部件,测得它们的直径为 1.32, 1.55, 1.36, 1.40, 1.44.取=0.05,问:(1). 能否认为该公司生产的发动机部件的直径 的标准差确实为= 0?(2). 能否认为 0?解: (1). 的问题就是检验 H0: 2 = 02; H1: 2 02.其中,n=5, =0.05,0=0.048.故,拒绝原假设 H0 ,即认为部件直径标准差不是 0.048 cm。 经计算,得 S2=0.00

3、778,故,拒绝原假设 H0,即认为部件的直径标准差超过了 0.048 cm。 (2). 的问题是检验 H0: 2 02 ; H1: 2 02. 该检验主要用于上节中实施两样本 t 检验之前,讨论 12 =22 的假设是否合理。8.3.2 两正态总体方差比的 F 检验1. H0: 12 = 22;H1: 12 22. 设X1, X2, , Xm和Y1, Y2, , Yn 分别为抽自正态总体 N(1, 12)和 N(2, 22)的样本, 欲检验 当 H0: 12=22 成立时, 12/22=1, 作为其估计,S12/S22也应与 1 相差不大。当该值过分地大或过分地小时,都应拒绝原假设成立。 合

4、理的思路是:找两个界限c1和c2, 当 c1 S12/S22 22 同理,当 H0: 12 =22成立时,有 S12/S22 Fm-1, n-1,例2:甲乙两厂生产同一种电阻,现从甲乙两厂的产品中分别随机地抽取12个和10个样品,测得它们的电阻值后,计算出样本方差分别为S12=1.40,S22=4.38。3. H0: 12 22;H1: 12 22结论同 2。 以上检验都用到了F分布,因此称上述检验为 F 检验。 假设两厂生产的电阻的电阻的阻值分别服从正态分布 N(1, 12)和 N(2, 22)。在显著性水平 = 0.10下, 是否可接受: (l).12 =22;(2).1222. 解:(1

5、). 的问题是检验 H0: 12 =22;H1: 12 22.其中,m=12, n=10, =0.10, S12=1.40, S22=4.38, S12/S22 =0.32。利用第六章学过的及P237的附表5,有 Fm-1, n-1(1- /2) = F11, 9(0.95) = 1/F9, 11(0.05) = 1/(2.90) = 0.34.因 S12/S22 = 0.32 0.34,所以,无须再考虑Fm-1, n-1(/2)的值,就可得到拒绝12 =22的结论。 查P237 附表5,因查不到 F11, 9(0.10),改用F10, 9(0.10)和F12, 9(0.10)的平均值近似之,

6、得 F11, 9(0.10)=F10, 9(0.10)+F12, 9(0.10)/2 2.42+2.38/2 = 2.40.因 S12/S22 = 0.32 22. 在前面的讨论中,我们总假定总体的分布形式是已知的。例如,假设总体分布为正态分布 N(, 2), 总体分布为区间 (a, b) 上的均匀分布,等等。 然而,在实际问题中,我们所遇到的总体服从何种分布往往并不知道。需要我们先对总体的分布形式提出假设,如:总体分布是正态分布N( , 2),总体分布是区间(a, b)上均匀分布等,然后利用数据 (样本) 对这一假设进行检验,看能否获得通过。8.4 拟合优度检验 这是一项非常重要的工作,许多

7、学者视它为近代统计学的开端。 解决这类问题的方法最早由英国统计学家 K. Pearson (皮尔逊) 于1900年在他发表的一篇文章中给出, 该方法后被称为 Pearson 2检验法,简称 2检验。 设F(x)为一已知的分布函数,现有样本X1, X2, , Xn,但我们并不知道样本的总体 分布是什么。现在试图检验 H0:总体 X 的分布函数为F(x) ; (1) 对立假设为 H1:总体 X 的分布函数非F(x)。如果 F(x) 形式已知,但含有未知参数 或参数向量 =(1, 2, r ) ,则记其为F(x, )。这种检验通常称为拟合优度检验。 不妨设总体 X 是连续型分布。检验思想与步骤如下:

8、(1). 将总体 X 的取值范围分成 k 个互不重叠的 小区间 I1, I2, , Ik,(2). 计算各子区间 Ii 上的理论频数。如果总体的分布函数为F(x, ),那么每个点落在区间 Ii 上的概率均为n 个点中,理论上有n pi ( )个点落在 Ii 上, (称为理论频数)。当分布函数中含有未知参数 时,理论频数也未知,要用来估计 n pi ( ),其中 为 的极大似然估。(3). 计算各子区间 Ii 上的实际频数 fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , k . 计数符号,取集合中元素的个数(4). 计算理论频数与实际频数的偏差平方和。可以证明:在 H

9、0 成立,且 n时, (5). H0 的显著性水平为 的检验的拒绝域为 注意:该检验方法是在 n 充分大时使用的,因而,使用时要注意 n 必须足够地大, 以及 npi 不能太小这两个条件。 在实用上,一般要求 n 50,以及所有npi 5。如果初始子区间划分不满足后一个条件, 则适当地将某些子区间合并,可使 npi 满足上述要求。例1:为检验棉纱的拉力强度 X (单位: 千克) 服从正态分布,从一批棉纱中随机抽取300条进行拉力试验,结果列在表8.2中。给定 = 0.01,检验假设 H0:拉力强度 X N(, 2) .解:本例中,并未给出各观测值 Xi 的具体值,只给出了各观测值的取值范围,这

10、样的数据称为区间数据。样本均值与样本方差可通过下列式计算: (1). 先将数据 Xi 分成13组,每组落入一个区 间,区间的端点为:(2). 计算数据落入各子区间的理论频数。因分布中含有两个未知参数,所以,理论频数只能近似地估计。落入第 i 个子区间Ii 的理论频数的估计为 , 其中(3). 计算数据落入各子区间上的实际频数 fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , 10 . (4). 计算检验统计量的值因为 k =10,r =2,所以上述 2分布的自由度为 k-r-1=7。由(5). H0 的显著性水平为 的检验 于是,拒绝原假设,即认为棉纱拉力强度不服从正

11、态分布。 孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两代杂交之后,发现一部分杂交豌豆呈黄色,另一部分呈绿色。其数目的比例大致是 3:1。 2检验的一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在1865年发表的论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,我们有必要在这里将这一情况介绍给大家。 这只是一个表面上的统计规律。但它启发孟德尔去发展一种理论,以解释这种现象。他大胆地假定存在一种实体,即现在我们称为“基因”的东西,决定了豌豆的颜色。这基因有黄绿两个状态,一共有四种组合:

12、 孟德尔把他的实验重复了多次,每次都得到类似结果。(黄, 黄),(黄, 绿),(绿, 黄),(绿, 绿). (黄, 黄),(黄, 绿),(绿, 黄),(绿, 绿). 孟德尔认为, 前三种配合使豆子呈黄色,而第四种配合使豆子呈绿色。从古典概率的观点看,黄色豆子出现的概率为3/4,绿色豆子出现的概率为1/4。这就解释了黄绿颜色豆子之比为什么总是接近 3:1 这个观察结果。 孟德尔这个发现的深远意义是他开辟了遗传学研究的新纪元。下面的例子就是用 2检验来检验孟德尔提出黄绿颜色豌豆数目之比为 3:1的论断。例2:孟德尔豌豆试验中,发现黄色豌豆为25粒, 绿色豌豆11粒,试在 =0.05下, 检验豌豆黄

13、绿之比为3:1。解:定义随机变量 X(1). 将 (-, ) 分成两个区间(2). 计算每个区间上的理论频数,这里 n = 25+11=36, 不存在要估计的未知参数, 故(3). 实际频数为,f1=25, f2=11 .(4). 计算统计量的值(5). H0 的显著性水平为 的检验 所以,接受原假设,即认为豌豆的黄绿之比为 3:1 。例3:某医院一年中出生的婴儿共计1521人,其中男婴802人,女婴719人。给定 =0.05,试问:能否认为男婴、女婴出生概率相同?解:用 X 表示服从两点分布的随机变量, X 取0, 1两个值,X=1表示男婴, X=0表是女婴。则问题就是检验假设 H0:p1 = PX=0=0.5.(1). 将 (-, ) 分成两个区间(2). 计算每个区间上的理论频数。因为两个区 间上的理论概率 p1= p2=0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论