生物统计学与试验设计:第五章 χ2 检验_第1页
生物统计学与试验设计:第五章 χ2 检验_第2页
生物统计学与试验设计:第五章 χ2 检验_第3页
生物统计学与试验设计:第五章 χ2 检验_第4页
生物统计学与试验设计:第五章 χ2 检验_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章χ2

检验

独立性检验

适合性检验

χ2检验原理在动物科学研究和生产实践中有很多质量性状的数据资料(次数资料):■将其转化成百分率资料,用u-检验进行分析■直接使用χ2检验来进行分析

单个样本百分率的假设检验

两个样本百分率差异的假设检验第一节χ2检验原理1.基本原理从一个已知平均数为μ,方差为σ2的正态总体中,进行独立地抽样,可获得随机变量x,则其标准正态离差:~

N(0,1)如果连续进行n次独立抽样,可得n个标准正态离差ui,对这n个独立的标准正态离差ui进行平方求和就得到一个新的统计量χ2:如果用样本进行计算:在实际应用时,χ2定义为理论次数与观察次数间的符合程度:O—观察次数E—理论次数χ2检验主要应用于:□在遗传学中,研究杂交后代某一性状的分离比例是否符合孟德尔定律□在动物医学中,研究某种疾病的发生与某种致病因素是否相关联□在生物学中,研究群体的性别分离比例是否符合1∶1的比例孟德尔在利用豌豆进行遗传学试验时,发现F2代中红花和白花的数量分别为705和224,经过分析提出了著名的分离定律(lawofsegregation),认为豌豆花颜色是由一对等位基因控制的按照孟德尔的分离定律,可以计算出F2代红花和白花的理论次数:红花的理论次数:929×3/4=696.75

白花的理论次数:929×1/4=232.25

可以看出,理论次数与观察次数之间存在一定的差异:705-696.75=8.25224-232.25=-8.25观察次数与理论次数之间的差异越小,说明观察结果与理论值越相符

观察次数与理论次数之间的差异越大,说明观察结果与理论值越不符如何来定量地界定这种相符或不相符?■两个差值相加(705-596.75)+(224-232.5)=8.25+(-8.25)=0推而广之,观察次数与理论次数的离差之和等于0,即:

因此,简单相加根本不能反映出观察次数和理论次数之间的差异程度进行平方相加,和就不会再等于零了,即:■两个差值平方后相加平方后,可以使较大的差值变得更大,因而增加了分析问题的灵敏度

因此,平方相加可以反映出观察次数和理论次数之间的变异程度

由于每个样本的样本容量可能不相等,因而不同样本之间缺乏可比性■如果以理论次数为标准进行比较,则就可以顺利解决这个问题了,即:红花的χ2值:

白花的χ2值:

总的χ2值:

得到χ2值后,可以根据χ2分布来推断观察次数与理论次数之间是否相符

2.χ2的显著性检验

根据研究目的不同,χ2检验可分为2类:2.1适合性检验

适合性检验(testforgoodnessoffit)是用来检验某性状的观察次数与理论比例是否相符的一种χ2检验方法适合性检验的步骤为:

(1)提出假设H0:观察次数与理论次数是相符的HA:观察次数与理论次数是不相符的(3)查表,推断(2)计算χ2值2.2独立性检验

独立性检验(testforindependence)是研究两类试验因子之间是相互独立还是相互影响的一种χ2检验方法■独立性检验与适合性检验不同,独立性检验没有一个给定的理论次数■独立性检验所用的理论次数是在无效假设成立的前提下推算出来的

独立性检验的步骤为:(1)提出假设(2)计算χ2值(3)查表,推断H0:两类试验因子之间是相互独立的HA:两类试验因子之间是有关联的3.χ2的连续性校正◆χ2分布是一种连续型的分布类型◆在科学研究和临床实践中所得的次数资料属于离散型分布由次数资料得到的χ2统计量的抽样分布也具有离散性质,往往会造成偏低的估计,特别是在df

=1时为了改善χ2统计量抽样分布的连续性,统计学家提出了一个校正公式:

将观察次数与理论次数之差的绝对值减去0.5

连续性校正—

校正χ2值

0.5为连续性校正常数

连续性校正仅适用于df

=1的情况,当df≥2时一般不作校正4.χ2检验的自由度

t-检验的自由度与样本容量(n)有关配对数据:非配对数据:

χ2检验的自由度与观察次数、理论次数的多少无关而是由类别(n)来确定的豌豆花的颜色有红花和白花2类,自由度为:果蝇有4种类型:长灰、长黑、残灰和残黑,自由度为:第二节适合性检验适合性检验是用来检验实际的观察次数与理论比例是否相符的一种χ2检验方法适合性检验主要用于以下几个领域:(1)遗传学分析

(2)质量鉴定和规范化作业

(3)检验观测值的分布是否符合某种理论分布

◆孟德尔遗传定律◆哈代-温伯格平衡定律◆正态分布◆二项分布◆泊松分布例1:为了研究人口性别比例,现对某一地区2006-2009年新生婴儿进行抽样调查,发现20500名新生婴儿中男婴11200名,试问此地男女两性人口是否均衡?人口出生性别比(新生婴儿性别比)是衡量男女两性人口是否均衡的重要标志,国际上一般以每出生100名女性人口相对应出生的男性人口的数值来表示

绝大多数国家的人口生育史表明,在不进行人为控制的情况下,新生婴儿的性别比在102-107之间,为了计算方便,这里取105(1)提出假设H0:此地男女两性人口符合105:100的性别比例HA:此地男女两性人口不符合105:100的性别比例先根据105:100的理论比例计算理论次数:男性的理论次数:20500×105/205=10500

女性的理论次数:20500×100/205=10000

(3)查表,推断根据自由度df

=1,查χ2值表:P<0.01差异极显著此地男女两性人口不符合105:100的性别比例,男女两性人口严重失衡否定H0,接受HA课堂练习1:纯种白猪和纯种黑猪交配,F1后代全为白猪,F1代内横交,F2代毛色发生了分离。现统计了某一个猪场内F2代680头仔猪,发现白色仔猪494头,黑色仔猪186头,试问F2代仔猪的毛色性状是否符合孟德尔分离定律?例2:果蝇两对性状F2代表现出的4种不同的表型,观察次数分别为154、43、53、6,试问该批资料是否符合9:3:3:1的遗传比例?(1)提出假设H0:F2代表型符合9:3:3:1的遗传比例HA:F2代表型不符合9:3:3:1的遗传比例(2)计算χ2值根据9:3:3:1的理论比例计算理论次数:总观察次数:154+43+53+6=256A-B-:256×9/16=144A-bb:256×3/16=48aaB-:256×3/16=48

aabb:256×1/16=16(3)查表,推断根据自由度df

=3查表,可得:P<0.05说明F2代表型不符合9:3:3:1的遗传比例否定H0,接受HA当df≥2,χ2检验差异显著或极显著,表示整批资料不符合某一理论比例

根据总的χ2值无法判断出:到底是全部资料均不符合理论比例还是其中的部分资料不符合比例?为了确定各部分的符合程度,应当对总的χ2值进行分割,即χ2再分割(4)χ2再分割χ2再分割是建立在χ2具有可加性的特点上的,即:但这种可加性只有在次数资料各部分相互独立,并不作χ2的连续性校正时才成立的

差异显著前三部分的χ2值均较小,因此可先取前三部分的比率作χ2检验,即检验前三部分是否符合9:3:3的比例(a)检验前三部分是否符合9:3:3的遗传比例总观察次数为154+43+53=250计算理论次数:A-B-:250×9/15=150

A-bb:250×3/15=50

aaB-:250×3/15=50

接受H0,否定HA

说明前三部分实际观测值符合9:3:3的遗传比例P>0.05差异不显著(b)检验前三部分组合与aabb是否符合15:1的比例理论次数分别为:组合:256×15/16=240aabb:256×1/16=16P<0.05,差异显著,否定H0,接受HA

说明aabb不符合理论比例■

χ2适合性检验一般应针对大样本资料,样本容量过小会影响到检验的正确性,特别是理论比例中有较小值时,更应注意样本容量第三节独立性检验独立性检验是检验两个变量、两个试验因子之间是相互独立的还是相关的一种χ2检验方法独立性检验的无效假设H0:两因子相互独立(无关);备择假设HA:两因子相关独立性检验无已知的理论比例,因此必须用列表的方式根据现有的观察次数来推算理论次数独立性检验用列表的方式来推算理论次数的方法是建立在无效假设成立,也就是两因子无关的基础上的1.2×2列联表

独立性检验所列的两向表格称为列联表根据分组数的多少,列联表可分为2×2、2×C和R×C三种形式2×2列联表是列联表中最简单的一种形式C1C2R1abR2cd总和总和a+b=TR1c+d=TR2a+c=TC1b+d=TC2a+b+c+d=T例1:在将苗鸡放进鸡舍前一般要先对鸡舍进行消毒,以降低疾病的发生。现进行鸡舍消毒试验,得数据如下,试问消毒能否有效降低疾病的发生?

发病未发病合计消毒3092122不消毒5863121合计88155243(44.18)(43.82)(77.82)(77.18)(1)提出假设

H0:鸡舍消毒与疾病的发生无关HA:鸡舍消毒与疾病的发生相关独立性检验的自由度为:a格的理论次数:

b格的理论次数:(3)查表,推断P<0.01差异极显著鸡舍消毒可极显著地降低疾病的发生否定无效假设,接受备择假设2.2×C或R×2表例2:为了研究鸡的饲养密度与鸡的啄癖有无关系,设计了如下试验,按密度大小分为三种饲养方式,检查不同密度下有啄癖的鸡只数,得数据如下,并列成2×3表,试分析饲养密度与鸡的啄癖有无关系。较低中等较高合计啄癖数141722正常数798683248合计8090100270(6.52)(73.48)(7.33)(82.67)(8.15)(91.85)(1)提出假设

H0:鸡的啄癖与饲养密度无关HA:鸡的啄癖与饲养密度有关(2)计算χ2值

=(2-1)(3-1)=2(3)查表,推断P<0.01差异极显著否定无效假设,接受备择假设,即鸡的啄癖与饲养密度有极显著地关联(4)χ2再分割A.检验中等密度是否与鸡的啄癖有关分析较低饲养密度、中等饲养密度与啄癖的关系低中合计啄癖数1(2.35)4(2.65)5正常数79(77.65)86(87.35)165合计8090170经计算,可得:P>0.05中等饲养密度并不显著增加鸡的啄癖数B.检验高等饲养密度是否与啄癖有关将饲养较低饲养密度和中等饲养密度的合并起来检验较高饲养密度

合并高合计啄癖数5(13

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论