生物统计学拟合优检验_第1页
生物统计学拟合优检验_第2页
生物统计学拟合优检验_第3页
生物统计学拟合优检验_第4页
生物统计学拟合优检验_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在我们以前所介绍的有关统计推断的所有检验方法中,涉及到的生物性状都是基于正态分布的连续型数据。在现实生活中,我们遇到的研究对象决非全部如此!例1:以紫花大豆和白花大豆品种杂交,在F2代共得到289株,其中紫花208株,白花81株,如果花色受一对等位基因控制,则根据遗传学理论,F2代紫花与白花植株的分离比应为3:1,即紫花应该为216.75株,白花为72.25株,问现在的实验结果是否符合一对等位基因的遗传规律?例2:有人做给药方式与药效之间关系的试验,得出以下数据,问不同的给药方式对药物的效果有无影响?给药方式有效无效总数口服584098注射643195这一类数据的特点是都属于离散型数据,是通过数数的办法获得的原始数据,它们不再符合基于正态分布的u分布、t分布和F分布等,因此也就不能再用基于正态分布的u检验、t检验、F检验等对数据进行统计推断,而必须引入新的检验方法,这就是我们即将给大家介绍的新内容:拟和优度检验第六章拟合优度检验第一节拟合优度检验的一般原理一、什么是拟合优度检验1、概念拟合优度检验(goodnessoffittest)是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。拟合优度检验也有两种类型的错误。2、检验的类型第一种类型是检验观测数与理论数之间的一致性。第二种类型是通过检验观测值与理论数之间的一致性来判断事件之间的独立性。这两种类型的问题都使用了近似的2

检验。二、拟合优度检验的统计量

----离散型数据的2

拟和优度检验实际上是离散型数据的显著性测验。由于离散型数据不符合正态分布,因此不能用基于正态分布的u检验、t检验、F检验等,拟和优度检验需要有独特的检验统计量,我们通过实例来介绍有关的规定。例1:以紫花大豆和白花大豆品种杂交,在F2代共得到289株,其中紫花208株,白花81株,如果花色受一对等位基因控制,则根据遗传学理论,F2代紫花与白花植株的分离比应为3:1,即紫花应该为216.75株,白花为72.25株,问现在的试验结果是否符合一对等位基因的遗传规律?如果我们用n

来表示观察值总数,用“O”来表示实际观测值,用“T”来表示理论值,并且按照属性性状或质量性状对我们得到的后代进行分组,以“Oi”表示第i

组的实测值,以“Ti”表示第i

组的理论值,则有n=289,O1=208,O2=81,且,如果按照某种理论或模型第i组的概率为pi,则有,且第i

组的理论数Ti

应按:Ti=n·pi

计算,上例中的T1=np1=289×0.75=216.75,

T2=np2=289×0.25=72.25,且p1+p2=0.75+0.25=1,T1+T2=216.75+72.25=289现在的问题是Oi与Ti的差异是由于抽样误差造成的还是由于实测值Oi不符合某种理论或模型造成的?为了表示这种差异,我们以进行计算,可是有:若取表示实测值和理论值的不相符,显然:但是存在:①Oi=9,Ti=6,Oi-Ti=3,(Oi-Ti)2=9,

②Oi=49,Ti=46,Oi-Ti=3,(Oi-Ti)2=9,显然,前者的偏离大于后者。单纯以来表示实测值与理论值的偏差有缺陷,若能以来度量实测值与理论值的偏差,则不但避免了,而且还解决了前述问题。由于在n一定时,理论值更稳定,所以采用Ti的值求平均的偏离程度更可靠。我们将命名为2

,并且有近似地符合分布。当自由度df=1时,总是大于,需要矫正,可以按照计算,据此,我们可以对离散型数据进行近似的2检验!!!但这种近似的检验是有条件的,即观察值总数不得少于30,每种属性(或分组)的理论值不得少于5,否则,离散型数据的卡平方2与连续型数据的2的偏差就很大,这种检验的精度就不准了。三、拟和优度检验的程序1、根据属性性状对调查数据进行分组;2、根据某种理论、模型或假定,以n为基础计算理论数Ti;3、假设:H0:O=T,实测值与理论值相符,即试验结果符合某种理论、模型、假定;

HA:O≠T,实测值与理论值不相符,即试验结果不符合某种理论、模型或假定。4、显著水平:=0.05,=0.015、统计量的计算:或6、确定H0的拒绝域:7、结论,生物学的解释。(永远是单尾检验)第二节拟和优度检验(适合性测验,吻合度检验)一、适宜的对象:按属性分组,每一分组的理论数Ti可以按照总体分布或某种理论、模型或假说等事先计算出来。二、测验的目的:通过实测值判断试验结果是否与某总体分布、某理论、模型或假说等相吻合。三、自由度的确定:

df=k-1,其中k为属性性状的分组数,在例1中,按花色将大豆分成两组,则k=2,df=1。四、应用实例:例3:以紫花大豆和白花大豆品种杂交,在F2代共得到289株,其中紫花208株,白花81株,如果花色受一对等位基因控制,则根据遗传学理论,F2代紫花与白花植株的分离比应为3:1,问现在的试验结果是否符合一对等位基因的遗传规律?分析:①属性性状:紫花、白花,②符合的理论:分离规律,③紫花的概率p1:0.75,白花的概率p2:0.25,④紫花的理论数T1=np1=216.75株,白花的理论数T2=np2=72.25株推断过程:H0:O=T,HA:O≠T,=0.05,查表,df=k-1=2-1=1时,∴接受

H0:O=T,∵即大豆F2代的花色遗传符合一对等位基因的遗传规律。当df=1时需要对2

进行矫正由于矫正后的c2

比2

还小,所以,在这个特例中,对2

不进行矫正,对结论没有影响。例4:黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:Y-R-黄圆Y-rr黄皱yyR-绿圆yyrr绿皱总数31510110832556问试验结果是否符合自由组合律?解:若性状间相互独立,根据孟德尔的自由组合律,则可以有:计算出相应性状的理论数Ti,列于下表:Y-R-Y-rryyR-yyrr实际观测数O31510110832理论频率p9/163/163/161/16理论数T312.75104.25104.2534.75O-T2.25-3.253.75-2.75(O-T)25.062510.562514.06257.5625(O-T)2/T0.0160.1010.1350.2182=0.016+0.101+0.135+0.218=0.470H0:O=T,HA:O≠T,=0.05,2=0.470当df=k-1=4-1=3

时,查表即试验结果是否符合自由组合律。例2:有人做给药方式与药效之间关系的试验,得出以下数据,问不同的给药方式对药物的效果有无影响?

药效给药方式有效无效总数口服584098注射643195第三节独立性检验一、适宜的对象当实际观测值对应的理论数不能用某种理论、模型等进行计算,而需要从样本资料去推算时,所进行的2

检验。二、检验的目的这种类型的检验是要通过检验观测值与理论数之间的一致性来判断事件之间的独立性,也就是要研究两个或两个以上的因子彼此之间是相互独立的还是相互影响的,研究不同试验处理的差异显著性。

药效给药方式

有效

无效总数

口服584098

注射643195总数12271193三、理论数的确定例2:有人做给药方式与药效之间关系的试验,得出以下数据,问不同的给药方式对药物的效果有无影响?1、首先假设两个因子(即给药方式和药效)之间无关联,彼此独立。按照独立事件概率的乘法,可以计算出各个实际观测值的对应理论数。不论有效与否:

(A)(B)口服的概率P(B)=98/193,注射的概率P=95/193不论给药方式:有效的概率P(A)=122/193,无效的概率P=71/193口服并有效的概率:P(BA)=P(B)·P(A)=98/193×122/193口服并有效的人数:T11=n·P(BA)=193×98/193×122/193同理:

药效给药方式

有效

无效总数口服5861.954036.0598

注射6460.053134.9595

总数12271193这种类型的检验是要通过检验观测值与理论数之间的一致性来判断事件之间的独立性。。自由度的确定:df=1四、应用实例(一)、2×2列联表的检验例5:有人做给药方式与药效之间关系的试验,得出以下数据,问不同的给药方式对药物的效果有无影响?

药效给药方式

有效

无效总数

口服5861.954036.0598

注射6460.053134.9595总数12271193解:H0:O=T,给药方式与药效无关联,即不同的给药方式对药效没影响。

HA:O≠T,给药方式与药效有关联,即不同的给药方式对药效有影响。=0.05,当df=1时,查表∵∴接受H0:O=T,即:不同的给药方式对药效没影响。自由度为1,卡方要矫正!(二)r×c列联表的检验有时,我们在研究工作中,遇到的问题将不仅仅只是2×2列联表的检验问题,而是r×c列联表的检验。1、理论数与自由度的确定:

结果处理12•••c总数1T11T12T1cT1.2•••TijTi.rTr1Tr2Trc总数T.1T.2T.jn2、应用实例:例6:用三种射线照射“天津一号”大麦。将处理后的种子做根尖压片,观测染色体畸变情况,得到以下结果,问不同的处理方式所引起的染色体畸变的差异是否显著?

结果处理有桥细胞数无桥细胞数总数40Kr+N21923378357040Kr3193297361625Kr19436203814总数7051029511000

结果处理有桥细胞数无桥细胞数总数40Kr+N2192228.833783341.2357040Kr319231.832973384.2361625Kr194244.436203569.63814总数7051029511000解:①理论数与自由度的确定:df=(3-1)×(2-1)=2②H0:O=T,HA:O≠T,=0.05,∴接受HA:O≠T,即三种不同的处理射线对染色体畸变的影响差异显著。习题7.2:用两种不同的药物治疗末种疾病,服用A药物的30人中有18人痊愈,服用B药物的30人中有25人痊愈,问两种药物的疗效有无差异?问题的分析:1、离散型数据2、属于2×2列联表的独立性检验问题统计推断:H0:O=T(两种药物的种类与疗效无关,即两种药物的疗效无差异)HA:O≠T(两种药物的种类与疗效有关,即两种药物的疗效有差异)α=0.05(df=1,需要校正卡方)

疗效药物痊愈未痊愈行总数RiA1821.5128.530B2521.558.530列总数Cj431760查表,当df=(2-1)(2-1)=1时,∵∴接受

H0:O=T,推断结论:两种药物的种类与疗效无关,即两种药物的疗效无差异由于H0:O=T,而不是关于总体参数(μ或σ)的假设,因此卡方检验又被称为非参数统计推断。

疗效药物痊愈未痊愈行总数RiA1821.5128.530B2521.558.530列总数Cj431760实验数据符合Tij>5、n>30的要求,所以进行了卡方检验。如果上述实验的数据不符合Tij>5、n>30的要求,即:

疗效药物痊愈未痊愈行总数RiA54126B34326列总数Cj8412问两种药物的疗效有无差异?

疗效药物痊愈未痊愈行总数RiA516B3

36列总数Cj8412将12个人分成两组,每组6个人,一共有几种组合?将12个人分成两组,一组8个人,一组4个人,一共有几种组合?将12在行间分解6和6、在列间分解为8和4的全部组合数为:

疗效药物痊愈未痊愈行总数RiA516B3

36列总数Cj8412而将12分解为5、1、3、3的组合方式共有:由古典概率可知:若随机现象的基本事件总数为n,事件数为m,则随机事件A的概率为:

疗效药物痊愈未痊愈行总数RiA516B3

36列总数Cj8412试验数据出现下列2×2联表的概率为:若P>α,则接受H0:O=T若P<α,则需要计算若干Pi的值,当时,接受零假设,否则,拒绝H0。第四节22列联表的精确检验其中a、b、c、d中有小于5、且N小于30时,要进行22列联表的精确检验!1、若a、b、c、d中若有0出现时,计算出的P>0.05时,差异不显著,算出的P<0.05时,差异显著。2、若a、b、c、d无0出现时,则依次将a、b、c、d中最小的降为0,把各种情况下的概率P累加起来,此时若P>0.05时,则差异不显著;若算出的P<0.05,则差异显著,拒绝零假设。P(1)P(0)P=P0+P1+P2若P>接受零假设,否则则否。P(2)P(0)P(1)测验:1、一个小麦杂交组合的F2代单株,经抗锈病鉴定,得到抗病型植株124株,中度抗病型植株388株,感染型植株453株,问这一遗传分离是否符合1:2:1的分离比例。2、在日常生活中,有人惯用左手,也有人惯用右手;有人左眼的视力好,也有人右眼的视力好。现调查400个学生,其调查结果如下表,试问使用左手和使用右手,与左眼视力和右眼视力的好坏是否有联系性?调查项目惯用左手惯用右手总计左

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论