第五讲非参数检验_第1页
第五讲非参数检验_第2页
第五讲非参数检验_第3页
第五讲非参数检验_第4页
第五讲非参数检验_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(优选)第五讲非参数检验目前一页\总数三十五页\编于九点第一节2检验

一、2统计量及分布例5.1根据遗传学理论,动物的性别比例是1:1。统计某羊场一年所产的876只羔羊中,有公羔428只,母羔448只。按1:1的性别比例计算,公、母羔均应为438只。以A表示实际观察次数,T表示理论次数,可将上述情况列成表5-1。目前二页\总数三十五页\编于九点表5-1羔羊性别实际观察次数与理论次数目前三页\总数三十五页\编于九点(5-1)

2是度量实际观察次数与理论次数偏离程度的一个统计量,2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。对于表5-1的资料,可计算得表明实际观察次数与理论次数是比较接近的。目前四页\总数三十五页\编于九点

2检验的一般原理2检验为:

当假设“H0:实际频数来自已知理论频数的总体,或实际频数代表的总体比例符合理论频数的比例。”为真时,2统计量很大是小概率事件,结合2分布的典型取值范围及其概率有:

2>2α,df(α≤0.05)是小概率事件,P≤α≤0.05。从而有如下结论:若2<20.05,df,P>0.05,不能拒绝H0;若2>2α,df(α≤0.05),P≤α≤0.05,拒绝H0。目前五页\总数三十五页\编于九点考虑到2统计量与2分布的近似程度有时不理想,在实际做2检验时常有如下要求:1.当自由度df=1时n≥40,诸T≥5,用不校正的2统计量;若所得P值小于且接近检验水准,则改用连续性校正2c统计量或确切概率法(Fisher精确概率);2c=∑(|A

-T|-0.5)2/T;n≥40,至少有1个T满足1≤T<5,则需要用连续性校正的2c统计量;当n<40或有理论频数T<1时,应考虑采用Fisher精确概率检验。目前六页\总数三十五页\编于九点2.当自由度df≥2,理论频数T<5的个数超过理论频数总个数的1/5时,可考虑适当并组,或补充试验以增加例数,使理论频数T<5的个数不超过1/5。也可采用Fisher精确概率检验。目前七页\总数三十五页\编于九点对计数资料,常用相对数来进行统计描述,常用的相对数有率和构成比。下面主要介绍做为样本统计量的率和构成比。1、样本率,简称率,也称为频率或强度相对数,其定义式为:率=×100%(或10000/00)例5.2汉族不同年龄组孕妇携带HBsAg(乙肝表面抗原)的情况如下表:二、计数资料的相对数实际发生某现象的观察单位数可能发生某现象的观察单位总数表中阳性率(%)一列,分母是各年龄段受检孕妇数,分子是其中携带HBsAg人数。该率描述的是各年龄段内受检孕妇中携带HBsAg的发生强度。年龄(岁)受检人数HBsAg阳性人数阳性构成比(%)阳性率(%)<203643.211.121-9856048.86.126-9995242.35.231-26364.92.3>364410.82.3

合计2327123100.05.3目前八页\总数三十五页\编于九点2、样本构成比,简称构成比,也称为结构比或比,其定义式为:构成比=×100%例5.2中阳性构成比(%)一列,分母是所有携带HBsAg的孕妇的总人数(不分年龄段),分子是其中各年龄段中携带HBsAg的孕妇人数。该一列构成比联合描述了携带HBsAg的孕妇,在各个年龄段中的比例构成(分布)情况。注意:1.率和构成比意义不同,不能相互错用。2.用样本率和样本构成比对总体率和总体构成比进行点估计时,分母应足够大(例如大于100),否则应当用实际观察的分母数n和分子数m表示为m/n。3.一组相关事物的构成比之和恒为100%,但一组率不具有这样的性质。分母中某个组例数各组例数总和年龄(岁)受检人数HBsAg阳性人数阳性构成比(%)阳性率(%)<203643.211.121-9856048.86.126-9995242.35.231-26364.92.3>364410.82.3合计2327123100.05.3目前九页\总数三十五页\编于九点三、适合性检验

testforgoodnessoffit

1、适合性检验的意义判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验称为适合性检验。目前十页\总数三十五页\编于九点若2(或2c)<20.05,P>0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若20.05≤2(或2c)<20.01,0.01<P≤0.05,表明实际观察次数与理论次数差异显著,实际观察的属性类别分配显著不符合已知属性类别分配的理论或学说;若2(或2c)≥20.01,P≤0.01,表明实际观察次数与理论次数差异极显著,实际观察的属性类别分配极显著不符合已知属性类别分配的理论或学说。目前十一页\总数三十五页\编于九点2、适合性检验的方法【例5.3】在进行山羊群体遗传检测时,观察了260只白色羊与黑色羊杂交的子二代毛色,其中181只为白色,79只为黑色,问此毛色的比率是否符合孟德尔遗传分离定律的3∶1比例?目前十二页\总数三十五页\编于九点

检验步骤如下:

(一)提出无效假设与备择假设H0:子二代分离现象符合3∶1的理论比例。HA:子二代分离现象不符合3∶1的理论比例。

(二)选择计算公式由于本例是涉及到两组毛色(白色与黑色),属性类别分类数k=2,自由度df=k-1=2-1=1,须使用校正公式来计算。目前十三页\总数三十五页\编于九点

(三)计算理论次数根据理论比率3∶1求理论次数:白色理论次数:T1=260×3/4=195黑色理论次数:T2=260×1/4=65或T2=260-T1=260-195=65

(四)计算

目前十四页\总数三十五页\编于九点表2c计算表目前十五页\总数三十五页\编于九点

(五)查临界2值,作出统计推断当自由度df=1时,查得20.05(1)=3.84,计算2c<20.05(1),P>0.05,不能否定H0,表明实际观察次数与理论次数差异不显著,可以认为白色羊与黑色羊的比率符合孟德尔遗传分离定律3∶1的理论比例。目前十六页\总数三十五页\编于九点【例5.4】在研究牛的毛色和角的有无两对相对性状分离现象时,用黑色无角牛和红色有角牛杂交,子二代出现黑色无角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头,共360头。试问这两对性状是否符合孟德尔遗传规律中9∶3∶3∶1的遗传比例?目前十七页\总数三十五页\编于九点检验步骤:

(一)提出无效假设与备择假设H0:实际观察次数之比符合9∶3∶3∶1的理论比例。HA:实际观察次数之比不符合9∶3∶3∶1的理论比例。

(二)选择计算公式

由于本例的属性类别分类数k=4:自由度df=k-1=4-1=3>1,故利用(5—1)式计算2。

(三)计算理论次数

依据各理论比例9:3:3:1计算理论次数:目前十八页\总数三十五页\编于九点

黑色无角牛的理论次数T1:360×9/16=202.5;黑色有角牛的理论次数T2:360×3/16=67.5;红色无角牛的理论次数T3:360×3/16=67.5;红色有角牛的理论次数T4:360×1/16=22.5。或T4=360-202.5-67.5-67.5=22.5

(四)列表计算2

目前十九页\总数三十五页\编于九点表2计算表0.33.3777目前二十页\总数三十五页\编于九点=0.5444+1.6333+0.3+0.9=3.3777

(五)查临界2值,作出统计推断当df=3时,20.05(3)=7.81,因2<2005(3)

,P>0.05,不能否定H0

,表明实际观察次数与理论次数差异不显著,可以认为毛色与角的有无两对性状杂交二代的分离现象符合孟德尔遗传规律中9∶3∶3∶1的遗传比例。目前二十一页\总数三十五页\编于九点齐一性2检验主要用于n个率或n个构成比之间的比较。

四、齐一性2检验目前二十二页\总数三十五页\编于九点1、两个率比较(四格表资料)的2检验例5.5对海锦止血粉中的甲、乙两处方,分别用66、54只实验犬,做快速止血效果对比试验,结果如下表。试检验甲、乙两处方间总体止血成功率有无差异。通常把例子中4个互不包含的数字即实际频数A(这里记为a=40,b=26,c=47,d=7)构成的列联表,称为四格表(或2×2表)。处方成功失败合计成功率甲40

266660.61%

乙47

75487.04%

合计873312072.50%47.8518.15ab39.1514.85cd目前二十三页\总数三十五页\编于九点假设H0:甲、乙两处方总体止血成功率相同。自由度df=(行数R–1)(列数C–1)=1理论频数的计算:当H0为真时,可将甲、乙两样本合并估计成功率约为72.50%,由此易求出甲66例中成功的理论频数Ta=66×72.5%=47.85,失败的理论频数Tb=66×(1-72.50%)=18.15,同理乙54例中Tc=39.15,Td=14.85。计算校正的2

统计量2c=∑(|A-T|-0.5)2/T

2c=(|40-47.85|-0.5)2/47.85+…+(|7-14.85|-0.5)2/14.85=9.123查2界值表得20.01(1)=6.635,因2c>20.01(1)

,P<0.01,结论:甲、乙两处方总体止血成功率不同。由试验数据看,乙处方优于甲处方。目前二十四页\总数三十五页\编于九点2、两个率比较(四格表资料)的Fisher精确概率检验例5.6A、B两种麻醉剂的副作用(梦幻、呓语)发生例数如下表。试检验两药副作用总体发生率是否相同。先化为四格表见下表。本例总例数n=21<40,且有2个理论频数T

<5(括号内为理论频数),应当用Fisher精确概率检验。药物观察例数梦幻、呓语发生发生率(%)A10550.0B1119.1合计21628.6药物未发生发生合计A5(7.14)5(2.86)10B10(7.86)1(3.14)11合计15621(n)目前二十五页\总数三十五页\编于九点Fisher精确概率检验的一般原理:1.把n=21不变且行、列合计也不变时的所有可能情况,按a从大到小(或从小到大)的顺序一一列出如下:(所有P值之和恒为1)abcd例5.65

51

1064011462937382847195601065合计1011615(1)(2)(3)(4)(5)(6)(7)Pi:

0.00390.05110.21280.36490.27370.08510.0085合计12.对每一种情况的四格表,均按上式计算概率P值。可以证明,所有P值之和恒为1。3.做双测检验时,把小于等于实际观察四格表(2)求得的P2=0.0511的Pi值相加,计算确切概率值P=0.0039+0.0085+0.0511=0.0635。由P>0.05,不能拒绝H0,即不能认为两药的麻醉效果有差异。做单测检验时,只需将与实际观察四格表(2)相邻的,小于等于P2的Pi值相加即可,确切概率值P=0.0039+0.0511=0.0550,结论同上。若P≤α≤0.05,拒绝H0,可作出相应结论。注意:一般Fisher精确概率检验都不用手算,而是应用SPSS等统计软件完成。发生未发生目前二十六页\总数三十五页\编于九点3、多个率、构成比比较(R×C表资料)的2检验

例5.75种食物样品的真菌检验结果如下表。试检验5种食品真菌检出率间有无差异。食品名生长真菌未长真菌合计真菌检出率(%)大米13(24.3)17(5.7)3043.3地瓜粉29(24.3)1(5.7)3096.7豆酱24(24.3)6(5.7)3080.0虾皮18(14.6)0(3.4)18100.0咸酸菜28(24.3)2(5.7)3093.3合计11226138(n)表中左边两列互不包含的数字,即实际频数A:1329241828171602构成的列联表,称为5×2表。一般的列联表称为R(行)×C(列)表。假设H0:5种食品总体真菌检出率相同。仿四格表检验,可求出各实际频数对应的理论频数T(见表中括号内数值):30×112/138=24.3,…,30×26/138=5.7。计算2统计量2=∑(A

–T)2/T=39.902自由度df=(R-1)(C-1)=(5-1)(2-1)=4,查2界值表得20.01,4=13.28,因2>20.01,4,P<0.01,结论:5种食品真菌检出率不都相同,其中大米检出率最低,虾皮检出率最高。目前二十七页\总数三十五页\编于九点例5.8维吾尔族和回族居民的血型分布资料如表。试检验两个民族血型总体构成比有无差异。这是一个2×4表。ABOAB合计维吾尔族442(427.8)483(457.4)416(476.4)172(151.4)1513回族369(383.2)384(409.6)487(426.6)115(135.6)1355合计8118679032872868假设H0:两民族血型总体构成比相同。各理论频数计算仿四格表,维吾尔族1513×(811/2868)=427.8,1513×(867/2868)=457.4,…,回族1355×(811/2868)=383.2,

…,1355×(287/2868)=135.6。计算2统计量2=∑(A–T)2/T

=26.154自由度df=(R-1)(C-1)=(2-1)(4-1)=3,查χ2界值表得2

0.01,3=11.34,因2>2

0.01,3,P<0.01,结论:两个民族血型总体构成比不同。目前二十八页\总数三十五页\编于九点四、R×C表(2行或2列表)的分割2检验例5.8中2×4表经检验,两民族血型总体构成比不同。为进一步分析这种不同是由哪个血型引起的,可对2×4表作如下分割,并分别作不校正的2检验。AB维吾尔族442483回族3693842=0.248<20.05,1=3.841,P>0.05,结论:尚不能说两民族A、B血型总体构成比不同。合并A、B为A+B,仿上一步再与AB做两民族间的比较。2=23.637>20.01,1=6.635,P<0.01,结论:两民族A+B+AB与O的血型总体构成比不同。即两民族血型总体构成比的不同,主要A+BAB维吾尔族925172回族7531152=2.295<20.05,1=3.841,P>0.05,结论:尚不能说明两民族A+B、AB血型总体构成比不同。合并A、B、AB为A+B+AB,仿上再与O做两民族间的比较。A+B+ABO维吾尔族1097416回族868487由血型O引起,回族O型血所占比例远高于维吾尔族。对例5.7中5×2表5个率的比较结论为5个总体率不都相同,为进一步两两检验哪些率之间有差别,也可仿上做5×2表的分割2检验(略)。目前二十九页\总数三十五页\编于九点独立性2检验,主要用于检验列联表中行代表的事物与列代表的事物之间,是否独立或是否存在关联。

五、独立性2检验Testofindependence目前三十页\总数三十五页\编于九点1、配对计数资料(四格表)的2检验例5.9对260份血清样品,分别用两种不同的免疫学检测方法,检验类风湿因子,结果如表。试检验两种方法的检测结果是否相互独立(是否有关联)。该四格表资料与两个率比较四格表的区别是:这里能事先人为确定的是n=260(总例数);而行的合计180、80与列的合计184、76均为随机的,试验不结束,这4个合计便不能确定。两个率比较例5.5中,甲、乙两行的合计66、54及总例数a172(T11)b8(T12)180

P11P12P1·c12(T21)d68(T22)80

P21P22

P2·B法

+–合计A法+

–合计18476n=260

P·1P·2n=120都是事先人为确定的,只有两个列的合计87、33是随机的,要待试验结束才能确定。目前三十一页\总数三十五页\编于九点假设H0:A、B两法检测结果相互独立(行代表的事物与列代表的事物间相互独立或无关联)。当H0为真时,由概率论知道,Pij=Pi··P·j,1≤i,j≤2。即T11/260=P11=P1··P·1=(180/260)(184/260)从而与实际频数a对应的理论频数T11=180×184/260=127.4同理与b对应的T12=180×76/260=52.6、与C对应的T21=80×184/260=56.6、与d对应的T22=80×76/260=23.4。可见,虽然配对四格表与非配对四格表统计设计不同,检验的假设H0也不同,但最终理论频数的计算结果相同。且自由度df=(R-1)(C-1)=1,计算校正的2

统计

2c=∑(|A–T|-0.5)2/T=169.866因2c>20.01,1=6.635,P<0.01,结论:两种方法的检测结果不独立。由a,d两格的例数占多数,可认为两种方法检测结果存在一致性关联。该结论可做为两种检验方法在实际应用中相互替代的参考依据。注意:当配对设计四格表中n<40或有理论频数T<1时,也应采用Fisher精确概率检验。目前三十二页\总数三十五页\编于九点2、配对计数资料(R×C表)的2检验例5.10对124例不同病型肝炎患者的病程及肝血流图波形进行统计,数据如下表。试检验不同病型与不同波形间是否相互独立(是否有关联)。该4×5列联表属配对计数资料,观察总例数n=124是事先人为确定这里应注意的是该数据表中,理论次数T<5的个数是14,已超过理论频数总个数的1/5。且其中T<1的个数达6个。这种情况将使2统计量与2分布的近似程度变坏,不适合做2检验。Ⅰ9036(29.76)29(27.58)25(28.31)0(2.90)0(1.45)Ⅱ193(6.32)7(5.82)7(5.98)1··(0.61)1·(0.31)Ⅲ62(1.98)0(1.84)4(1.89)0(0.19)0(0.10)Ⅳ90(2.98)2(2.76)3(2.83)3··(0.29)1·(0.15)例数正常波降低波低平波高舒张波锯齿波病型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论