数据统计分析3.2_第1页
数据统计分析3.2_第2页
数据统计分析3.2_第3页
数据统计分析3.2_第4页
数据统计分析3.2_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六节 计数资料的显著 性检验x2检验1.1.概念:比较观测值与理论值是否符概念:比较观测值与理论值是否符合的假设检验叫合的假设检验叫适合性检验。适合性检验。2. 检验(适合度检验)原理:应用理论推算值(E)与实际观测值(O)之间的偏离程度来决定其2值的大小。niiiiEEO122)(22越小,表明实际观察值与理论值越接近;=0,表示两者完全吻合;越大,表示两者相差越大。22分布是连续型变量的分布,分布是一组曲线。3.2 检验的步骤:检验的步骤:(1)H0:理论值=观测值; HA:理论值观测值.(2)确定显著水平;一般为0.05或0.01(3)统计量2;(4)推断. 如果 , 接受H0 ,否定

2、H; 如果 , 否定H0 ,接受H ,表明:在显著标准下理论值与实际值差异是显著的.2222计算计算2 2时应注意的问题时应注意的问题: :(1)任何一组的理论次数Ei必须大于5.(2)在自由度df=1时需进行连续性矫正, ,公式为:niiiiEEO122) 5 . 0|(|例:有一鲤鱼遗传试验,以红色和青灰色杂交,其F2代获得不同分离尾数,问观测值是否符合孟德尔3:1遗传定律.体色青灰色红色总数F2观测尾数1503991602(1)H0:鲤鱼体色分离符合3:1,HA:不符.(2)=0.05 (3)计算2:df=2-1=1,需要进行连续性矫正.假设H0正确时,青灰色E1和红色E2理论数: E1

3、=16023/4=1201.5 E2=16021/4=400.5将数据代入公式得将数据代入公式得: :(4)推断:查2值表,当df=1时, 故否定H0,接受H.即认为鲤鱼体色F2分离不符合3:1比率.63.30122.22641.755 .400) 5 . 0| 5 .40099(|5 .1201) 5 . 0| 5 .12011503(|) 5 . 0|(|22122niiiiEEO84.3205.0205. 02 naA21naA25.122naA3232naA158152naA638972rnrraA221rmnmrramA22检验两组资料与某种理论比率符合度的检验两组资料与某种理论比率

4、符合度的2 2值公式值公式4.4.独立性检验独立性检验 研究两个或两个以上因子彼此之间独立的还是相互影响的一类统计方法.(2检验). 独立性检验的功效就是通过 与 是否一致来判断因素之间是否独立。 如吸烟与疾病的关系等.一、四格表x2检验 如果样本的属性有两类,每类属性又可分为两部分,把这些属性放入表格中,就构成了四格表,即2 22 2列表。列表。自由度为1,需校正。niiiiEEO122) 5 . 0|(|检验步骤检验步骤: :(1)H0:事件A和B无关 HA:事件A和B有关(2)确定(3)计算2值(4)df=(行-1)(列-1)(5)推断:若 表明实际观测与理论值不一致;若 ,表明实际观测

5、与理论值一致。2222例例: :某猪场采用一次配和两次配某猪场采用一次配和两次配, ,其受胎结果如表其受胎结果如表, ,试检验差异性试检验差异性. .(1)H0:两种方法与受胎率无关 HA:与受胎率有关 (2)=0.01 列 行受胎未受胎总合Tr受胎率单次配两次配110(130.61)116(95.39)68(47.39)14(34.61)17813061%89%总合Tc22682308*括号为E值(3) (3) 计算计算2值值理论数:E11=178226/308=130.61E12=17882/308=47.39E21=130226/308=95.39E22=13082/308=34.61d

6、f=(2-1)(2-1)=1, 需要进行连续性矫正555.27685.11534. 8240. 4096. 361.34) 5 . 0|61.3414(|39.47) 5 . 0|39.4768(|39.95) 5 . 0|39.95116(|61.130) 5 . 0|61.130110(|) 5 . 0|(|222222EEO(4)(4)推断推断, ,当当df=1时时, , , 拒绝H0,接受H;说明两种配种方法差异极显著.两次配大大提高了受胎率. 22列联表也可用下列公式:2263. 6201. 0rsmnNNbcad. .) 2/|(|222 N为总数,“nR”为行的合计数,“nC”为

7、列的合计数。)1(2nnfCRiN二、多格表x2检验 表的行数与列数都超过2,或行数为1,列数超过2。 2 2 *自由度按(行数-1)(列数-1) 当行数为1时,自由度:(列数-1) 注意尽量避免理论数小于5。 EEOi2三、2x2列联表的精确检验法 四格表中的任何一格的理论数都不得少于5,当少于5时用x2检验会有偏倚,需使用精确检验法。a ac cb bd d a+ba+b c+dc+da+ca+cb+db+d N= N=a+b+c+da+b+c+d概率通式: !)!( )!( )!( )!(dcbaNdbcadcbaPi第七节 方差分析变量分析方差分析用途: 1. 多个样本平均数的比较。多

8、个样本平均数的比较。 2. 分析多个因素间的交互作用。分析多个因素间的交互作用。 3. 回归方程的假设检验。回归方程的假设检验。 4. 同质性检验。同质性检验。方差分析基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。依据变异来源:试验总变异试验总变异处理间变异 (组间变异):由处理效应引起 处理内变异(组内变异):由随机误差引起 处理间变异处理间变异处理内变异处理内变异试验指标(experimental index): 为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。试验因素( experimental factor

9、): 试验中所研究的影响试验指标的因素。 单因素试验 两因素 多因素试验因素水平(level of factor): 试验因素所处的某种特定状态或数量等级。试验处理(treatment): 事先设计好的实施在实验单位上的具体项目。试验单位(试验单位( experimental unit experimental unit ): : 在实验中能接受不同试验处理的独立的试验载体。重复(repetition): 在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复。一、单因素多组群方差分析处理A1 A2 Ai An(组)x11 x21 xi1 xn1x12 x22 xi2 xn2x1

10、j x2j xij xnjx1k x2k xik xnk. xi.总和T iT1 T2 Tik TnkT=xij平均 xi x1 x2 xi xnx 每组具有k个观测值的n组样本符号表 线性可加模型: xij是在第i次处理下的第j次观测值,为总体平均数,i为处理效应,ij是试验误差。ijiijxijiijetxx 固定模型:各个处理的效应值i是固定的。随机模型:各个处理的效应值i不固定的。混合模型(1)平方和与自由度的分解总平方和=处理间平方和+处理内平方和 kniniijknxxxxxx11212112ij)()(k)(T2/kn=C,则:knTxknxxxxSSijijijkinjT222

11、2112ij)()(CxSST2ijtTeSSSSSSCSSniix12tk1(2)自由度分解 总自由度dfT=kn-1。处理间自由度:dft=n-1处理内自由度: dfe=dfT-dftTTTTdfSSSMS/2ttttdfSSSMS/2eeeedfSSSMS/2F检验 F= S12/S22将大方差做分子,使F值大于1,做单尾检验。不同处理差异显著性检验时: F= St2/Se2F 分布与拒绝域【例】某猪场对4个不同品种幼猪进行4个月增重测定,每个品种选择体重接近的幼猪4头,测定结果列如下表,试进行方差分析。重 复品种大白沈白沈黑沈花123431.924.031.835.924.825.72

12、6.825.922.223.026.724.327.030.829.024.6总和T123.6 103.296.2111.4T=434.4平均数30.925.824.127.9=27.2 (1)假设:H0:t2=e2,HA:t2e2 (2)显著水平 :=0.05,=0.01(3)统计量:3 .21396.1179326.120076 .240 .249 .3196.11793164 .434222222CCxSSnkTCT94.10396.1179390.11897)4 .1112 .1036 .123(4112222CCTkSSit36.10994.10330.213tTeSSSSSS自由度

13、: 方差:151441nkdfT3141ndft12315tTedfdfdf113. 912/36.109/647.343/94.103/eeetttdfSSMSdfSSMS不同品种猪4个月增重方差分析表变异来源dfSSs2FF0.05F0.01品种间品种内312103.94109.3634.6479.1133.802*3.49 5.95总变异15 213.30多重比较 适用范围:F值显著或极显著情况。(一) 最小显著差数法(LSD法)1.计算: 2.计算: 3.若 表明在给定水平上差异显著,反之不显著。LSD.jixx LSDxxji.)(jiexxdfaaStLSD 21222122.nn

14、nsnsnsSeeexxji当=0.05和0.01时.)(01. 001. 0)(05. 005. 0jiejiexxdfxxdfStLSDStLSDLSD法步骤:(1) 列出平均数的多重比较表,各处理按其平均数从大到小自上而下排列 (2)(2)计算最小显著差数计算最小显著差数 、 (3)(3)两两平均数的差数与两两平均数的差数与 、 比较,作出统计推断比较,作出统计推断。05. 0LSD01. 0LSD05. 0LSD01. 0LSD 1346. 24/113. 92/22.nSSexxji)(5233. 61346. 2056. 3)(6513. 41346. 2179. 2.)(01.

15、001. 0)(05. 005. 0kgStLSDkgStLSDjiejiexxdfxxdf多重比较字母标记法:多重比较字母标记法:(1)先将平均数从大到小排列,在最大平均数后标a(2)将标a的平均数与下面的平均数比较,凡相差不显著(LSD)标a,显著则标b。(3)以标b的平均数为标准,与各个比他大的平均数比较,凡相差不显著的在a右标b(4)以标b的最大平均数为标准,与下面未标记的平均数比较不显著标b,显著标c。如此反复。品种平均数差异显著性=0.05=0.01大白沈花沈白沈黑30.927.925.8 24.1aabbbAABABB多重比较多重比较* *标记法标记法 表明:大白与沈黑差异极显著

16、,大白与沈白差异显著。其他品种间差异不显著。品种平均数差异显著性-24.1-25.8-27.9大白沈花沈白沈黑30.927.925.824.16.8*3.81.75.1*2.13.0( (二二) )最小显著极差法最小显著极差法(LSR(LSR法法) )特点:把平均数的差数当作极差,根据极差范围内所包含的处理数(秩次距)M的不同而采用不同的检验尺度。有M-1秩次距,2为最小秩次距,常用LSR法: 新复极差法 q检验法。 1.新复极差法(SSR法)SSR法(shortest significant ranges),又称Duncan(邓肯法) 。查SSR表。最小显著极差: H0:A-B =0 xMd

17、faMaSSSRLSRe),(,2.q检验法(q test) 查q表, * 为极差xxSLSRSq/ )(/),(,MdfxMeqSLSRq检验: 062. 02kSSex256. 013. 4062. 0186. 000. 3062. 0),(01. 0,01. 0),(05. 0,05. 0 xMdfMxMdfMSqLSRSqLSRee3种多重比较方法关系: LSD法新复极差法q检验法当M=2时,取等号;M 3时,取小于号。2.重复数不相等均数的比较ixijCn/2)(kkknnkkkKiiiii222011) 1)()(02kexss计算平均数的标准误时,先计算平均数k0 :02k221exxss例:用某种小麦种子进行切胚乳试验分为3种处理:整粒小麦、切去一半胚乳、切去全部胚乳,同时播种到条件较一致的花盆中,出苗后每盆选留2株,成熟后进行单株考种,如下表,试进行方差分析。处理株号合计平均数1234567891021202429252224252822232525292130312627242626202120424414625.52

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论