生物统计学卡方检验市公开课金奖市赛课一等奖课件_第1页
生物统计学卡方检验市公开课金奖市赛课一等奖课件_第2页
生物统计学卡方检验市公开课金奖市赛课一等奖课件_第3页
生物统计学卡方检验市公开课金奖市赛课一等奖课件_第4页
生物统计学卡方检验市公开课金奖市赛课一等奖课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 卡方检验第1页教学目要求掌握:卡方检验适用条件和计算公式;适合性检验基本原理和方法;独立性检验原理和方法。熟悉:适合性检验和独立性检验应用。了解:适合性检验在遗传学及其它生物学科中上应用。第2页讲授内容一、卡方检验原理和方法二、适合性检验三、独立性检验第3页一、卡方检验原理和方法1、卡方检验原理 应用理论值(expected value,E)与观察值(observed value,O)之间偏离程度来决定卡方值大小。第4页2、卡方检验程序将观察值分为k组计算n次观察值中每组观察频数,记为Oi依据变量分布规律或概率运算法则,计算每组理论频率为Pi计算每组理论频数Ei检验Oi与Ei差异显著性

2、,判断二者之间不符合度第5页a、零假设:H0:O-E=0;备择假设: O-E0(这里检验不是参数,而是判断观察数是否符合理论分布)b、检验统计量:这里要求n充分大,当n50时(最好100),所定义检验统计量近似服从卡方分布,Ei=nPi不得小于5,若小于5,将尾区相邻组合并,直到合并后组Ei5,合并后再计算卡方值。第6页c、建立拒绝域d、作出统计学结论第7页用来检验观察数与依照某种假设或分布模型计算得到理论数之间一致性一个统计假设检验,方便判断该假设或模型是否与实际观察数相吻合。二、适合性检验(goodness of fit)第8页(一)总体参数未知正态性检验15515315915515015

3、9157159151152159158153153144156150157160150150150160156160155160151157155159161156141156145156153158161157149153153155162154152162155161159161156162151152154157162158155153151157156153147158155148163156163154158152163158154164155156158164148164154157165158166154154157167157159170158例1 高粱“三尺三”株高测定结果(

4、cm)第9页题解组号组限/cm组界/cm中值频数频率1141143140.5143.514210.012144146143.5146.514520.023147149146.5149.514840.044150152149.5152.5151130.135153155152.5155.5154230.236156158155.5158.5157280.287159161158.5161.5160150.158162164161.5164.5163100.10 9165167164.5167.516630.0310168170167.5170.516910.01总计1001高粱“三尺三”株高频数

5、分布表(1)将观察值分为k组;按照分组原理分成10组,制成频数分布表第10页(2)取得n次观察值中,第i组观察频数记为Oi,(3)第i组理论频率为Pi,其计算方法以下: 先计算样本平均数和标准差 假设高粱“三尺三”符合正态分布 。依据参数预计原理, 用 预计 , 用s/c4=4.98/0.9975=4.99预计(样本标准差分布矩系数C4、C5表)。即假设高粱株高x服从正态分布 依据正态分布概率计算关系,查附表1,计算各组组界理论频率第11页组号组界/cm观察频数(Oi)观察频率(Pi)理论频率(P)理论频数(Ei)1140.5143.510.010.0050.52143.5146.520.02

6、0.0222.23146.5149.540.040.0666.64149.5152.5130.130.14214.25152.5155.5230.230.21621.66155.5158.5280.280.23223.27158.5161.5150.150.17617.68161.5164.5100.10 0.0949.49164.5167.530.030.0353.510167.5170.510.010.0090.91001.00 1.00 100高粱“三尺三”株高观察频数和理论频数表(4)计算各组理论频数为Ei=npi,填入下表第12页组号组界/cm观察频数(Oi)观察频率(Pi)理论频率

7、(P)理论频数(Ei)卡方值13140.5149.570.070.0939.30 0.5694149.5152.5130.130.14214.20.1015152.5155.5230.230.21621.60.0916155.5158.5280.280.23223.20.9937158.5161.5150.150.17617.60.384810161.5164.5140.14 0.13813.80.003总计1001.00 1.00 1002.141(5)Oi与Ei进行比较,判断二者之间不符合度,检验程序以下:零假设:H0:O-E=0;HA: O-E0 检验统计量:高粱“三尺三”株高观察频数和

8、理论频数表(合并后)第13页卡方值自由度df=k-1-a,其中k为合并后组数,a为需要由样预计总体参数个数;合并后组数k=6,由样本预计了总体平均数和标准差,故a=2,df=3,不用校正,计算卡方值建立拒绝域结论:高粱株高服从正态分布第14页(二)总体参数已知正态性检验例2 自动包装袋装食盐重量是否服从正态分布?已知每袋标准重量为500g,调查了100袋,结果以下表所表示。袋装食盐重量调查表5005125155425225144884974754874975005185085305085004795065044934915064874864915054784925124984944824825

9、12527522470493548502496494494488505472482506478494518503503503485529476496500499484517517506500503527500499490496491491490520512482488509488518516516530508492486492536494500511511506493522524492478第15页题解 (1)零假设:H0:O-E=0;备择假设HA: O-E0 (2)分组:样本容量n=100,取组数m=10,组距为8g (3)计算理论频率pi和理论频数Ei (4)检验统计量计算 (5)自由度d

10、f=k-1-a=8-1-1=6 (6)拒绝域建立 (7)接收H0,服从正态分布第16页(三)总体参数未知二项分布检验例3 检验烟草种子发芽率,每个培养皿放10粒种子,共100个培养皿,试验结果以下表所表示。1000粒种子有590粒发芽,检验发芽种子数是否符合二项分布。第17页每皿发芽种子数Xi观察频数(Oi)001020344145226277198995100总计100烟草种子发芽率观察频数第18页每皿发芽种子数Xi观察频数(Oi)OiXi理论频率(P)理论频数(Ei)卡方值0000.00016.250.811000.00192000.012534120.0480 414560.120912

11、.090.3025221100.208720.870.0616271620.250325.030.1557191330.205820.580.12189720.111115.710.0995450.035510000.0051总计10059011001.539烟草种子发芽率观察频数和理论频数表第19页题解1、提出假设 H0:O-E=0;HA: O-E02、总体参数未知,需要由样本百分比预计P=590/1000=0.593、计算理论值和卡方值,理论频率Pi按照二项分布公式计算n=10,0k 10,理论数Ei=NPi4、拒绝域建立5、结论:种子发芽率服从二项分布第20页(四)总体参数已知二项分布检

12、验例4 水稻植株中对白叶枯病有抗性纯合体基因型为SS,对白叶枯病敏感纯合体为ss,杂合体基因型为Ss。其中抗性为显性性状,敏感为隐性性状,将Ss与ss进行杂交,20个后代中有14株抗性植株,6株敏感植株。问后代分离比是否符合孟德尔分离定律?表型观察频数( Oi )理论频数(Ei)卡方值抗性植株14101.225敏感植株6101.225总计20202.45第21页题解按照孟德尔分离定律,Ss与ss杂交后代代表型百分比应该为1:1,即10个抗性植株和10个敏感植株(1)提出假设 H0:O-E=0;HA: O-E0(2)计算理论值和卡方值:理论值就是依据孟德尔遗传定律计算得到后代分离理论数量(3)检

13、验统计量计算:本例是两组数据,没有预计参数,k=2,a=0,df=1,样本统计量需要连续矫正第22页(4)拒绝域建立(5)结论:符合孟德尔分离定律适合性检验自动程序:P=Chitest(Oi,Ei): Oi表示观察值区域;Ei表示理论值区域;用于适合性检验第23页三、独立性检验原理:经过观察数与理论数之间一致性判断事件之间独立性,即判断两个事件是否是独立事件或处理间差异是否显著。方法:将数据列成列联表,也称列联表卡方检验。第24页一、22列联表卡方检验(一)原理:例5 青霉素能够注射,也能够口服,天天给感冒患者口服或注射80万单位青霉素,调查两种给药方式药效,结果以下表所表示,试分析青霉素两种

14、给药方式药用效果是否有差异?第25页两种青霉素给药方式药用效果调查表给药方式有效(A)无效()总数有效率口服(B)58409859.20%注射( )64319567.40%总计12271193第26页普通考虑样本中各处理之间是否相关联,处理间是否是独立事件检验时以各处理间无关联或者各处理是独立事件作为零假设在一定自由度下和显著水平下进行卡方检验独立检验(independence test)第27页(二)检验程序1、提出假设 H0:O-E=0;HA: O-E02、依据概率乘法法则计算理论数:理论数计算方法给药方式有效(A)无效()总数口服(B)O1=58 E1=98122/193=61.95O2

15、=40 E2=9871/193=36.0598注射( )O3=64 E1=95122/193=60.05O4=31 E1=9571/193=34.9595总计12271193两种青霉素给药方式药用效果调查观察值和理论值第28页3、检验统计量:4、确定自由度: 22列联表自由度df=(r-1)(c-1),r是列联表行数,c是列联表列数,若自由度=1,则应做连续性校正,校正后统计量为:第29页5、拒绝域建立:6、结论 青霉素口服效果与注射效果差异不大。注意:22列联表卡方检验与之前讲吻合度检验一样,要求理论数不得小于5;当理论数小于5时,应使用22列联表准确检验法。第30页二、rc列联表行数和列数

16、都大于2时情况称为rc列联表,其理论数计算仍为第31页例6 植物转基因方法惯用有三种:基因枪介导转化法、农杆菌介导转化法和花粉管通道法,三种方法转化烟草成功率(种子数)如表所表示,问三种转基因方法转基因成功率差异是否显著?转基因方式阳性种子假阳性种子总数基因枪法19233783570农杆菌法31932973616花粉管法19436203814总数7051029511000三种方法转化烟草试验结果第32页题解1、提出假设 H0:O-E=0;HA: O-E02、依据概率乘法法则计算理论数:理论数转基因方式阳性种子假阳性种子总数基因枪法O1=192 E1=228.8O2=3378 E2=3341.2

17、3570农杆菌法O3=319 E3=231.8O4=3297 E4=3384.23616花粉管法O5=194 E5=244.4O6=3620 E6=3569.63814总数7051029511000三种方法转化烟草试验结果理论数第33页3、检验统计量:4、确定自由度: 列联表自由度df=(r-1)(c-1),r是列联表行数,c是列联表列数, df=(3-1)(2-1)=2,不用做连续性校正5、拒绝域建立: 6、结论 三种转基因方法成功率显著不一样。第34页三、 22列联表准确检验法aba+bcdc+da+cb+dN=a+b+c+d第35页检验程序:1、求组合概率:p值表示是在行总数和列总数保持不变情况下,上述列联表出现概率2、提出假设:列联表准确检验零假设仍为不存在处理效应,显著水平为第36页3、检验统计量:即p值,若a、b、c、d中任何一个出现0时,可直接用上述公式计算p值,反之则应该确保行总数和列总数不变条件下,将4格中最小那个数再逐一(每次降1)降低到0,得到2个或多个22列联表,并计算每种22列联表p值,并将多个p值之和作为总概率p4、拒绝域建立5、结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论