版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、/ 2检验是一种用途较广的显著性检验方法,它既适用于参数估 * 2检验是一种 第九章 使之适用于 这里只介绍用 计,也适用于非参数估计,同方差分析 F检验一样, 能同时对多种资料进行检验的方法。 在本章将阐述如何将统计假设检验的概念加以推广, 样本来自元素可分成三个或更多个类目的总体的情形。 / 2检验在检验两个以上样本率或构成比之间差异时有无显著性的方 法。 第一节 八分布与/2表 在第七章叙述总体方差的假设检验时,曾简单提到 定义:设从标准正态分布N (0, = 1,2,),它们的平方和记作 八, 八=u 12 + U 22 + ,+ U n2 1)中,取出n 即 n =2 U2 八分布。
2、 个样品u i ( i (9 1) 般称/ 2为服从参数为 n的/ 2的分布。(卡方分布) 如果从一般正态分布 N (卩,b 2 )中,抽出n个样品x i ,因为 /2 ,所以公式 (9 1)转化为: n X P 2 =送(一)2 n 艺(Xi iM (9 2) 有时在实用中,用 X代替 则有 丁 2 =送(X -X)2 = (n - 1)S2 这同第七章中提过的相同。 如果将/2的各种不同数值连同相应的相对出现频数列出, 就得 到/ 2 图9 1与几种自由度相对应的/ 2分布 由图 (1) (2) “对称”、 9 1可看到/ 2的样本分布形式有两个特点: 正态,而是正偏态分布,右侧无限延长以
3、横轴为渐近线; 不同自由度的/2取样分布不同。随自由度增大,曲线趋于 “正态”分布。实际上,在自由度为 30时,曲线基本对称 且近似正态分布。 / 2分布的实际重要性是基本于这样的事实,即对大样本而言, 量 (9 3) X 2 上dXJl i W T i 的分布接近于*2的分布。 10 式中:A =观察频数,即“实际数”; Ti =预期频数,即“理论数”; K=给定情形下实际数与理论数的配对数。 所以近似地有 (9 4) 值表所得的临界 ,拒绝Ho,则称在 /2= F (A-T)2 T 公式(9 4)是下面进行鼻2检验的常用公式。 / 2检验主要是根据样本算出的 / 2值与查 2 2 值/ a
4、(n)作比较。若/ 2 a(n) , P (Ho)W- 显著性水平o上差异有显著性意义;否则称在水平上差异无显著性 意义。 / 2分布的尾端面积或概率 P值在附表“ / 2值表”中按不同的 自由度n分别列出。至于自由度n是直接由资料划分类别的多少 所决定的,与样本的大小无关。确定 n的原则是:互相排斥的类别 数k,减去所受的限制数m ,即n二k m。 第二节两个样本率差别的/ 2检验 当两个样率不同时,可能由两个原因造成:一是差异由抽样误差 所致;二是它们来自不同质的总体,确有不同。为区分二者,则要做 检验。 / 2检验的步骤通过下例说明。 例9 1(资料同7 12)为研究游泳与患慢性鼻炎有无
5、关系, 随机抽测游泳与田径两专业的学生进行对比,抽测资料如下: 组别 患病人数 未患病人数 合计 患病率 游泳专业 20(13) 60(67) 80 25% 田径专业 6(13) 74(67) 80 7. 5% 合计 26 134 160 16. 25% 问患慢性鼻炎是否与专业有关? ( d = 0. 05) 上表中,2060 这四个格子内的数字是整个表的基本数 674 字,故这种资料称为“四格表资料”,或称为“ 2X 2列联表”。 解:(1)无效假设H 0 :兀1二兀2 (两专业患病率相同,均为合 计的患病率16. 25%) (2)计算八值: 宀二(A-T)2 T 实际数A已知,理论数T(表
6、中括号内的数字)是根据H 0推 算出来的: 先由合计的160人患病26人知理论上的患病率为 26 160 16. 25%,则游泳专业80人理论上的患病人数为 T11 = 80 X 空=13 160 由此可知理论数的计算公式为: n r - n c nr (9 5) 式中: r 行号,c 列号, n c c列的合计数,n n r r行的合计数, 总例数。 这样, Ti2 80134 160 67 T21 = 空些=13 160 T22 80M34 160 67 =(20-13)2 亠(60 - 67)2 亠(6-13)2 亠(74 -67)2 13671367 =3. 7692 + 0. 731
7、3 + 3. 7692 + 0. 7313 = 9. 001 (3) 取 a = 0. 05; “行X列表”资料的自由度为: n =(行数1)(列数1) = (r 1) (C 1) (9 6) 本例 n= 2 1) (2 1) = 1 查八值表得到0.05(1) = 3. 84 (4) 判断结果: 丁 2V 2 :*= 9. 001 上 0.05(1)= 3. 84 P (H。) 0. 05,拒绝H。,由数据上看,认为患慢性鼻 炎与游泳专业有关。 此结论与例7 11用U检验去作的结论一致。 我们还可以用四格表专用公式计算 / 2值: 7 2 (a + b) (c + d)(a + c)(b +
8、 d) (9 7) (ad - be)2 -n 20( a ) 60( b ) 6( c ) 74( d ) 代入公式(9 7)得: 式中a、b、c、d分别为四格表资料实际数,总例数 n二a + b + c + d。 把上例数据 (ad - b C)2 ”n (a + b)(C + d) (a + C )(b 中 d) =(20609260 9. 001 80X80X 26134 结果与前法相同。 2 另外需要注意:7 2 沪 只是一种近似。在1T40时,对于自由度为1的四格表来说为减小偏差,需要计算 校正的工2值。此时: /2=送(|A-T 卜 0.5)2 T 2 y 2=( |ad -bc
9、|- 0.5n ) -n (9 8) (a + b) (c + d) (a + c) (b + d) (9 9) 公式(9 8)为公式(9 4)的校正;公式(9 9)为公式(9 7)的校正。 第三节多个样本率(行X列表)的 /2检验 四格表是行X列表中最简单的形式。 至于行X列表(亦称r X c 表)的理论与计算步骤均与四格表类同。 值较为麻烦,为 用公式/ 2=送(A 小 去计算行X列表的 八 T 简便可用下面公式,由实际数直接计算出 /2值。 宀 n (送 一-1) n r n c (9 10) 例9 2 上例的结论认为患慢性鼻炎与游泳专业有关。 步了解患慢性鼻炎的发病率与游泳专项运动年限
10、有无关系, 资料如下表中。 为进一 收集调查 解:(1)无效假设H 0 :发病率与运动年限无关。 (2)计算/ 2值: Z 2 二 n (送 1) n r nc =281 X (丄 84 咒 41 802 84 咒 240 152 84咒 41 702 85 咒 240 102 + + 60咒 41 502122 + 60 x 2405241 + 40 -1 ) 52 沢 240 10.36 n=( r 1)( c- 1) 鼻 0.05(3) = 7. 81 =(4- 1) (2- 1) (3) 取 a = 0. 05, =3。查/ 2值表(书后附表6)知 (4) 判断结果: *20.05(3
11、),拒绝H 0 ,认为不同运动年限的游泳运 动员鼻炎发病率的差别的显著性意义。 行X列表八检验的注意事项: (1) 在行X列表中如果有五分之一以上的格子的理论数小于5, 或有一个格子的理论数小于1时,则应使理论数小于5的格子与邻组 合并以增大理论数。否则易导致错误的结论。但合并时要注意是否合 理,不同质的资料不可并组!此时只有增加观察例数再作统计分析。 (2) 做行X列表*2检验得到P( H 0 )w 0. 05,则拒绝无效假 设H0 ,说明被比较的几个样本率之间总的差别有显著性,但不能作 出任何两组间差别都有显著性的结论!要比较某两个样本率之间的差 别如何,需另作检验。 鼻2分布检验程序 、
12、程序功能 / 2检验常用于符合度分析。应用本程序时如按程序所问输入行 元素的个数、列元素的个数和每个元素值,程序就能自动计算出其2 值、自由度数及其结尾值(检验水平)。使用者将结尾值与给定的显 著性水平比较即能得出检验的结果。 二、程序中使用的主要符号说明 Z: TOTAL X - SQUARE VALUE 总计鼻 2 值; V : DEGREE OF FREEDOM自由度数; X2 : TAILEND VALUE 结尾值。 三、程序所依据的理论计算公式 k (f _f .)2 Z = Z(oi ei) i 3f oi 其中:foi为每一组的观察频数; fei为相应的理论频数。 5 四、程序名
13、称:X SQUARE . TES REM X Square. TES 10 P RINT x square. Tes 20 P RINT 30 DIM V1(25), V2(5), A(5), M(4) 40 INPUT “ number of rows =” , R 50 P RINT “ number of rows =” ; R 60 INPUT “number of columns =” , C 70 P RINT “number of columns =” ; C 80 P RINT “Contingency table :” 90 FOR I =1 TO R 100 P RINT
14、“ROW” ;I 110 FOR J =1 TO C 120 P RINT “Element ” ; J; 125 P RINT “Element ” , J; 130 INPUT E 131 EA = (I - -1)*C + J 132 V1(EA): =E 135 P RINT E 136 P RINT 140 NEXT J 145 P RINT 150 NEXT I 160 P RINT 170 L = 0 180 190 FOR I = 1 TO 200 FOR J = 1 TO 210 A(I) = A(I) + V1(M) 220 230 NEXT J 240 L = L + A
15、(I) 250 NEXT I 260 270 FOR I = 1 TO 280 FOR J = 1 TO N STEP C 290 V2(I) = V2(I) + V1(J) 300 NEXT 310 NEXT 320 330 PRINT Observed value ”; ;“ Expected value ” 340 350 360 370 380 390 400 410 420 430 460 XSQUARE CONTRIBUTION” FOR I = 1 TO C PRINT “Column” ; I FOR J = 1 TO R P = A(J) * V2(I) / L X = I
16、+ (J1) * C Y 二(V1(X) P)八 2 / P PTINT NEXT NEXT ”V1(X), ”P, V = (C1) * (R1) PRINT “X square = PRINT “Degree of freedom = 440 450 ; v 12 470 PRINT “Tial end value =” ; 480 R = 1 490 FOT I = V TO 2 STE P 2 500 R = R * I 510 NEXT I 520 K = Z 八(INT (V + 1) / 2) * EXP ( Z / 2) / R 530 IF INT (V / 2) = V / 2 THEN 560 540 J = SQR (2 / Z / 3. 1415926536) 550 GOTO 570 560 J = 1 570 L = 1 580 M = 1 590 V = V + 2 600 M = M * Z / V 610 IF M C列联表计算自由度? 4. 为调查某体校新生的运动能力,特作运动测试,结果受过基 础训练的58人中有40人成功;未受过基础训练的27人中有9人成 功。试问在a = 0. 05的显著性水平下,这些资料能否说明基础训练与 运动成绩有关系? 5. 某校高一男、女生体育锻炼的达标情况如下,试检验男、女 生达标率有无显
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年油田工程技术服务项目融资计划书
- 2024秋新沪科版物理八年级上册教学课件 第五章 质量 第三节 密度
- 机械原理考试题
- 养老院老人生活娱乐活动组织人员职业道德制度
- 养老院老人健康管理制度
- 《就业中国演讲》课件
- 《金地格林世界提案》课件
- 提前预支工资合同
- 2024事业单位保密协议范本与保密工作考核3篇
- 2024年度离婚协议书详述财产分配与子女抚养细节及责任2篇
- 安徽新时代十年伟大改革
- 第2课+古代希腊罗马(教学设计)-【中职专用】《世界历史》(高教版2023基础模块)
- 恶性肿瘤护理查房
- 安徽省马鞍山市第七中学2023-2024学年八年级上学期期末英语试题
- 教师职业介绍课件
- 国开电大专科《管理学基础》期末考试总题库2024版
- 量子机器学习及区块链技术导论
- 电子电路原理及应用
- 承包土地种植艾草计划书
- 肿瘤的类型和治疗手段
- 北京市东城区2023-2024学年六年级上学期期末数学试卷
评论
0/150
提交评论