随机性与独立性检验_第1页
随机性与独立性检验_第2页
随机性与独立性检验_第3页
随机性与独立性检验_第4页
随机性与独立性检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、西南交通大学1西南交通大学西南交通大学 李裕奇李裕奇西南交通大学2一一 观测数据随机化的检验观测数据随机化的检验二二 独立性的检验独立性的检验三三 r s列联表列联表 西南交通大学3一一 观测数据随机化的检验观测数据随机化的检验基本思想:基本思想:检验问题:检验问题:H0:对某一总体的观测是随机性的:对某一总体的观测是随机性的H1:对某一总体的观测不是随机性的:对某一总体的观测不是随机性的对于某一总体的观测数据:对于某一总体的观测数据:12,Nxxx1 、利用游程总数检验法来检验这批数据的、利用游程总数检验法来检验这批数据的随机性随机性西南交通大学41)对于一组观测数据,首先按得到数据的先)对

2、于一组观测数据,首先按得到数据的先后次序排列数据序列;后次序排列数据序列;2)再确定这组观测数据的中位数,并按顺)再确定这组观测数据的中位数,并按顺序与中位数逐个比较,小于中位数的,记为序与中位数逐个比较,小于中位数的,记为“-”元素,大于中位数的,记为元素,大于中位数的,记为“+”元素,元素,并按次顺序排成一个并按次顺序排成一个“+”与与“-”元素序列:元素序列: 3)连续出现)连续出现“+”元素为一个元素为一个+游程,连续游程,连续出现出现“-”元素为一个元素为一个- 游程,游程总数记为游程,游程总数记为U,最大游程长度数记为,最大游程长度数记为L。如上例。如上例U=8,L=4西南交通大学

3、5由由定理定理3.2知,在知,在m个个“+” 元素与元素与n个个“-” 元素的任一排列出现的概率相等的假定下,元素的任一排列出现的概率相等的假定下,“+”与与“-”序列的游程总数序列的游程总数U具有下列分布具有下列分布律:律: 112 2/1mnmnP Ukkkm 111121/11mnmnm nP Ukkkkkm 1,2,min, km n 西南交通大学64)当)当H0真时,即真时,即m个个“+” 元素与元素与n个个“-” 元元素的任一排列出现的概率相等,即数据序列中素的任一排列出现的概率相等,即数据序列中“+”与与“-”是随机出现的,因此是随机出现的,因此U有偏大的趋有偏大的趋势,故此时可

4、按势,故此时可按U的分布确定的分布确定H0的拒绝域:的拒绝域:(1)/ 2(1)(1)/2/22/2uiuP UuP Ui (1)/212(,)Uun n 或或(2)/212(,)Uun n (2)/22min(, ) 1(2)(2)/2/21/2m ni uuP UuP Ui 12min, ,max, nm n nm n 西南交通大学7随机化数据随机化数据检验法步骤:检验法步骤:1)提出统计假设:)提出统计假设:2)显著性水平?样本容量?)显著性水平?样本容量?4)判断:将样本数据按上述排成)判断:将样本数据按上述排成“+”与与“-”组成的元素序列,得出游程总数,并与临界组成的元素序列,得出

5、游程总数,并与临界值比较得结论值比较得结论H0:对某一总体的观测是随机性的:对某一总体的观测是随机性的H1:对某一总体的观测不是随机性的:对某一总体的观测不是随机性的3)H0的拒绝域:的拒绝域:(1)/2Uu 或或(2)/2Uu 西南交通大学8其中样本中位数为其中样本中位数为(1)( )(1)21122km nkkXmnkXXmnk 西南交通大学9例例4.1 对某段公路上一段时间内通过汽车车对某段公路上一段时间内通过汽车车辆数的观测,得到这段时间内通过的汽车辆辆数的观测,得到这段时间内通过的汽车辆数,连续记录了数,连续记录了24天,所获数据如下:天,所获数据如下:158471814214843

6、2253363891563566426303350 36041试就这组数据判断观测是否随机的?试就这组数据判断观测是否随机的?(0.05) 西南交通大学102 、利用游程长度检验法来检验这批数据的、利用游程长度检验法来检验这批数据的随机性步骤随机性步骤1)提出统计假设:)提出统计假设:2)显著性水平?样本容量?)显著性水平?样本容量?4)判断:将样本数据按上述排成)判断:将样本数据按上述排成“+”与与“-”组成的元素序列,得出最大游程长度,并与组成的元素序列,得出最大游程长度,并与临界值比较得结论临界值比较得结论H0:对某一总体的观测是随机性的:对某一总体的观测是随机性的H1:对某一总体的观测

7、不是随机性的:对某一总体的观测不是随机性的3)H0的拒绝域:的拒绝域:LL 西南交通大学11例例4.2 对某一总体进行观测,得到的数据按对某一总体进行观测,得到的数据按其获得的先后次序排列如下:其获得的先后次序排列如下:251837142148922153638265330385843564150 60 6463试用最大游程长度试用最大游程长度L作检验统计量,检验这作检验统计量,检验这组数据判断观测是否随机的?组数据判断观测是否随机的?(0.05) 西南交通大学12二二 独立性的检验独立性的检验1 二事件的独立性检验二事件的独立性检验基本思想:基本思想:检验问题:检验问题:H0:事件:事件A与

8、与B是相互独立的是相互独立的H1:事件:事件A与与B是相依的是相依的进行进行n次观察,每次观察只有四次观察,每次观察只有四种可能结果:种可能结果:ABABABAB西南交通大学13若若H0真时,由事件独立性知识可知真时,由事件独立性知识可知1.11.2()()P ABp pP ABp p 2.12.2()()P ABp pP ABp p 故若故若H0真时,在真时,在n次观察中事件次观察中事件A与与B实际实际出现与否的次数,与事件独立情况下理论出现与否的次数,与事件独立情况下理论出现的次数应是一致,不会偏离太多,因出现的次数应是一致,不会偏离太多,因此可利用卡方检验法检验此可利用卡方检验法检验A与

9、与B的独立性。的独立性。西南交通大学14列变量(列变量(B)总计总计B行变行变量量AAn11n12n11+ n12= n1.n21n22n21+ n22= n2.总计总计n11+ n21= n.1n12+ n22= n.2nn次观察结果如下次观察结果如下 ( 2 2 列联表)列联表)BA西南交通大学15其中其中11122122,nnnn分别表示分别表示ABABABAB在在n次观察中实际出现的次数次观察中实际出现的次数1.2.1.2.1.2.1.2()(),()()nnpP ApP AnnnnpP BpP Bnn 则事件则事件 的概率的估计为的概率的估计为A BA B西南交通大学162.12.2

10、22(),()n nn nP ABP ABnn 为理论概率为理论概率P(AiBj)的估计值的估计值1.11.12()nnn nP ABnnn 故知故知1.21.22()nnn nP ABnnn 西南交通大学17故实际频数与理论频数之差为:故实际频数与理论频数之差为:nnnnjiij. nnnnnnnjiji.2. 事件事件 发生的实际频数为发生的实际频数为nijABABABAB而事件而事件 发生的理论频数为发生的理论频数为:ABABABAB西南交通大学18)1()(22121.2.2 ijjijiijnnnnnnn对对2 2列联表列联表,构造统计量构造统计量故可利用此统计量建立故可利用此统计量

11、建立H0的拒绝域的拒绝域西南交通大学19独立性独立性检验法步骤:检验法步骤:1)提出统计假设:)提出统计假设:2)显著性水平?样本容量?)显著性水平?样本容量?4)判断:将样本数据由卡方计算表计算卡)判断:将样本数据由卡方计算表计算卡方值,并与临界值比较得结论方值,并与临界值比较得结论3)H0的拒绝域:的拒绝域:22(1) H0:事件:事件A与与B是相互独立的是相互独立的H1:事件:事件A与与B是相依的是相依的西南交通大学20例例4.3:分析吸烟量与年龄关系调查结果:分析吸烟量与年龄关系调查结果: 级别级别60岁以上岁以上 60岁以下岁以下20支以上支以上/日日50156520支以下支以下/日

12、日1025356040100西南交通大学2116.221004035)100403525(1004065)100406515(1006035)100603510(1006560)100656050(22222 计算卡方统计量的值计算卡方统计量的值:西南交通大学22其自由度为其自由度为1,对于显著性水平对于显著性水平=0.01=0.01时时, ,临界值临界值635. 6)1(201. 0 显然显然, 635. 6)1(16.22201. 02 所以我们应拒绝所以我们应拒绝H0,即认为吸烟量与,即认为吸烟量与年龄有关。年龄有关。西南交通大学232 二随机变量的独立性检验二随机变量的独立性检验基本思

13、想:基本思想:检验问题:检验问题:H0:二随机变量:二随机变量X与与Y是相互独立的是相互独立的H1:二随机变量:二随机变量X与与Y是相依的是相依的1)首先把)首先把X的一切可能值的集合的一切可能值的集合A与与Y的的一切可能值的集合一切可能值的集合B进行分割:进行分割:11()()riijisjijjAAA AijBBB Bij 西南交通大学242)对)对(X,Y)进行进行n次独立观测,分别记录事件次独立观测,分别记录事件 ,ijXA YB出现的频数,所得结果列成出现的频数,所得结果列成r s格列联表:格列联表:B1 B2 BsA1A2Arn11 n12 n1sn21 n22 n2snr1 nr

14、2 nrsn1.n2.nr.n.1 n.2 n.sn西南交通大学25故实际频数与理论频数之差为:故实际频数与理论频数之差为:nnnnjiij. 事件事件 发生的实际频数为发生的实际频数为nij而事件而事件 发生的理论频数为发生的理论频数为:nnnnnnnjiji.2. ,ijXA YB ,ijXA YB西南交通大学26.222.11()(1)(1)ijrsijijijn nnnrsn nn 对对r s列联表列联表,统计量统计量3) 若若H0真时,在真时,在n次观察中事件次观察中事件AiBj实际出实际出现的次数,与事件现的次数,与事件Ai与与Bj独立情况下理论出独立情况下理论出现的次数应是一致,

15、不会偏离太多,因此现的次数应是一致,不会偏离太多,因此可利用卡方检验法检验可利用卡方检验法检验X与与Y的独立性。的独立性。西南交通大学27随机变量独立性随机变量独立性检验法步骤:检验法步骤:1)提出统计假设:)提出统计假设:2)显著性水平?样本容量?)显著性水平?样本容量?4)判断:将样本数据由卡方计算表计算卡)判断:将样本数据由卡方计算表计算卡方值,并与临界值比较得结论方值,并与临界值比较得结论3)H0的拒绝域:的拒绝域:22(1)(1)rs H0:事件:事件X与与Y是相互独立的是相互独立的H1:事件:事件X与与Y是相依的是相依的西南交通大学28例例4.4 :从某系四个年级中随机抽取:从某系

16、四个年级中随机抽取155人,征人,征求对教学改革的意见,分三种情况统计如下:求对教学改革的意见,分三种情况统计如下: 年级年级(A)态态 度(度(B)赞成赞成不赞成不赞成无所谓无所谓一年级一年级30101252二年级二年级2461444三年级三年级202830四年级四年级184729922241155西南交通大学29计算卡方统计量的值计算卡方统计量的值: 4131.2.4131.2.2)()(ijjijiijijjijiijnnnnnnnnnnnnnn 59.12)23(404. 3205. 02 所以可以认为各年级不同意见的构成比没有所以可以认为各年级不同意见的构成比没有显著差异。显著差异。

17、西南交通大学30三三 r s 格列联表格列联表 1 r 2 格列联表的卡方值的化简式格列联表的卡方值的化简式 B1 B2A1A2Ar m1 n1-m1 m2 n2-m2 mr nr-mrn1n2nr n.1 n.2n西南交通大学312221()(1) riiimn prnpq 对对r 2列联表列联表,统计量统计量其中其中111riipmqpn 西南交通大学32随机变量独立性随机变量独立性检验法步骤:检验法步骤:1)提出统计假设:)提出统计假设:2)显著性水平?样本容量?)显著性水平?样本容量?4)判断:将样本数据由卡方计算表计算卡)判断:将样本数据由卡方计算表计算卡方值,并与临界值比较得结论方

18、值,并与临界值比较得结论3)H0的拒绝域:的拒绝域:22(1)r H0:事件:事件X与与Y是相互独立的是相互独立的H1:事件:事件X与与Y是相依的是相依的西南交通大学33例例4.5 下表为某地某年下表为某地某年12个月中出生的婴儿个月中出生的婴儿数,试问各月中男婴的出生率是否一样?数,试问各月中男婴的出生率是否一样?见见P97西南交通大学342 2 2 格列联表连续性修正格列联表连续性修正 222()(1)()()()()n adbcab cd ac bd 1 21 a a b ba+b 2 c d c dc+d a+c b+d n 西南交通大学35耶茨连续性修整统计量:耶茨连续性修整统计量:

19、222(0.5 )(1)()()()()n adbcnab cd ac bd 通过例通过例4.7可以看出对原统计量的可以看出对原统计量的一种改善一种改善西南交通大学363 2 2 格列联表格列联表Fisher精确性检验精确性检验方方法法进进行行检检验验:可可采采用用法法不不可可靠靠,时时,当当Fisher40, 52 nnij1 21 a a b ba+b2 c d c dc+d a+c b+d n 西南交通大学37若若A A,B B相互独立,边缘总计保持不变,频数相互独立,边缘总计保持不变,频数a,b,c,da,b,c,d任何一种特定排列的概率计算公式为任何一种特定排列的概率计算公式为:!)!()!()!()!(ndcbadbcadcbaPr 计算同样边缘总计的连带迹象的其它特定计算同样边缘总计的连带迹象的其它特定排列的总和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论