版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、次数分布次数分布iiif yfyyfn()1iiifyysf7.47.4 独立性测验独立性测验7.47.4 独立性测验独立性测验独立性测验独立性测验(test for independence)(test for independence)u主要为探求两个变数间是否独立主要为探求两个变数间是否独立u这是次数资料的一种相关性研究。这是次数资料的一种相关性研究。7.47.4 独立性测验独立性测验独立性测验独立性测验(test for independence)(test for independence)计算过程计算过程: :将所得次数资料按两个变数作两向分组,排列成将所得次数资料按两个变数作两向
2、分组,排列成相依表相依表根据两个变数相互独立的假设,算出每一组格的根据两个变数相互独立的假设,算出每一组格的理论次数理论次数由由 算得算得 值值iEEO22)(27.47.4 独立性测验独立性测验独立性测验独立性测验(test for independence)(test for independence)uH H0 0:两个变数相互独立;:两个变数相互独立;H HA A:两个变数彼此相关:两个变数彼此相关u自由度自由度DFDF(r-1r-1)(c-1)(c-1)u当观察的当观察的2 2 时,接受时,接受H H0 0,即两个变数相互独立,即两个变数相互独立u当观察的当观察的2 2 时,接受时,
3、接受H H0 0,即两个变数相互独立,即两个变数相互独立2, 2, 6.4.1 26.4.1 22 2表的独立性测验表的独立性测验2 22 2相依表相依表u指横行和纵行皆分为两组的资料指横行和纵行皆分为两组的资料u其其=(2-1)(2-1)=1=(2-1)(2-1)=1u计算的计算的2 2值需作连续性矫正值需作连续性矫正a11a12R1a21a22R2C1C2n表7.8 22表的一般化形式6.4.1 26.4.1 22 2表的独立性测验表的独立性测验u调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散黑穗病的穗数,得相依表如下,试分析种子灭菌与否和散黑穗病穗多少是否有关处理项目处理项目发病穗数
4、发病穗数未发病穗数未发病穗数总数总数种子灭菌种子灭菌26(34.7)50(41.3)76种子未灭菌种子未灭菌184(175.3)200(208.7)384总数总数2102504606.4.1 26.4.1 22 2表的独立性测验表的独立性测验uH0:种子灭菌与否和散黑穗病病穗多少无关;HA:种子灭菌与否和散黑穗病病穗多少有关。u显著水平=0.05。u测验计算6.4.1 26.4.1 22 2表的独立性测验表的独立性测验在在H H0 0为正确的假设下为正确的假设下u对于对于1111细格,由于它是属于种子灭菌的,故种子作灭细格,由于它是属于种子灭菌的,故种子作灭菌处理的概率为菌处理的概率为76/4
5、6076/460u它又是属于发病穗数的,发病穗数的概率为它又是属于发病穗数的,发病穗数的概率为210/460210/460u因此,任一经种子作灭菌处理而又发病的麦穗的因此,任一经种子作灭菌处理而又发病的麦穗的概率为概率为p p1111=(76/460) =(76/460) (210/460)(210/460),6.4.1 26.4.1 22 2表的独立性测验表的独立性测验u因此格子因此格子1111的理论次数为:的理论次数为:uE E1111= =p p1111n n= (76/460) = (76/460) (210/460) (210/460) 460=34.7460=34.7u用同样的方法
6、算出其余格子的理论次数用同样的方法算出其余格子的理论次数u=(2-1)(2-1)=1=(2-1)(2-1)=122222(|2634.7| 0.5)(|5041.3| 0.5)34.741.3(|184 175.3| 0.5)(|200208.7| 0.5)4.267175.3208.7C6.4.1 26.4.1 22 2表的独立性测验表的独立性测验u查附表6, 现实得 u故P1=(2-1)(c-1)1,故无需作连续性矫正,故无需作连续性矫正横行因素横行因素纵纵 行行 因因 素素总总 计计12ic1a11a12a1ia1cR12a21a22a2ia2cR2总总 计计C1C2CiCcn2C表的一
7、般化形式6.4.2 26.4.2 2c c表的独立性测验表的独立性测验例例: :进行大豆等位酶Aph的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表,试分析大豆Aph等位酶的等位基因频率是否因物种而不同。物种物种等位基因等位基因 总计总计123野生大豆野生大豆29(23.66)68(123.87)96(45.47)193栽培大豆栽培大豆22(27.34)199(143.13)2(52.53)223总计总计51267984166.4.2 26.4.2 2c c表的独立性测验表的独立性测验u假设假设 H H0 0:等位基因频率与物种无关:等位基因频率与物种无关 H HA A:
8、不同物种等位基因频率不同:不同物种等位基因频率不同u显著水平显著水平=0.05=0.05u否定否定H0H0,接受,接受HAHA。不同物种。不同物种AphAph等位基因频率有显著相关等位基因频率有显著相关2222(2923.66)(68 123.87)(252.53)154.0223.66123.8752.532220.05,20.05,25.99;154.02;0.05P现实得6.4.3 6.4.3 r rc c表的独立性测验表的独立性测验u若横行分若横行分r r组,纵行分组,纵行分c c组,且组,且r r33,c c33,则为,则为 r rc c相依表相依表u其其=(=(r r-1)(-1)
9、(c c-1)-1)横行因素横行因素纵纵 行行 因因 素素总总 计计12ic1a11a12a1ia1cR12a21a22a2ia2cR2jaj1aj2ajiajcRjrar1ar2ariarcRr总总 计计C1C2CiCcnrc表的一般化形式6.4.3 6.4.3 r rc c表的独立性测验表的独立性测验u例:下表为不同灌溉方式下水稻叶片衰老情况的调查资料。试测验稻叶衰老情况是否与灌溉方式有关。灌溉方式绿叶数黄叶数枯叶数总计深水146(140.69)7(8.78)7(10.53)160浅水183(180.26)8(11.24)13(13.49)205湿润152(160.04)14(9.98)1
10、6(11.98)182总计48130365476.4.3 6.4.3 r rc c表的独立性测验表的独立性测验u假设H0:稻叶衰老情况与灌溉方式无关;对HA:稻叶衰老情况与灌溉方式无关u取=0.05u接受H0:不同的灌溉方式对水稻叶片的衰老情况没有显著影响2222(146 140.69)(78.78)(16 11.98)5.62140.698.7811.982220.05,40.05,49.49, 5.62 0.05P现6.5 6.5 的可加性和联合分析的可加性和联合分析26.5 6.5 的可加性和联合分析的可加性和联合分析2 例例7.11 表表7.13给出三个大豆组合给出三个大豆组合F3家系
11、世代对豆家系世代对豆秆黑潜蝇抗性家系与感性家系的分离数据,每一家系由秆黑潜蝇抗性家系与感性家系的分离数据,每一家系由1个个F2单株衍生,抗性家系中包括有全抗家系及抗感分离单株衍生,抗性家系中包括有全抗家系及抗感分离的家系。的家系。经对三个组合分别的经对三个组合分别的 测验,均符合测验,均符合3抗抗 1感感理论分离比例理论分离比例。现要求进一步检测三组合综合起来是否现要求进一步检测三组合综合起来是否符合符合3 1分离比例分离比例,三组合间是否一致符合三组合间是否一致符合3 1分离比分离比例,或三组合是否具同质性例,或三组合是否具同质性。222C组 合母本P1父本P2F3POE江宁剌文豆 邗江秋稻
12、黄乙抗2007375感02027250.210.120.500.75合计2020100100无锡长箕光甲 邳县天鹅蛋抗2006268.25感0202922.752.291.940.100.25合计20209191邳县天鹅蛋 南农1138-2抗0209095.25感2003731.751.160.960.250.50合计2020127127三组合综合抗225238.53.062.830.050.10感9379.5合计318318三组合累计3.66三个大豆组合F3家系世代对豆秆黑潜蝇抗性的分离数据(理论分离比为3抗 1感) H0:三组合综合起来符合:三组合综合起来符合3抗抗 1感分离比例,感分离比
13、例,HA:综合:综合群体不符合群体不符合3 1分离比例分离比例 及及H0:三组合的分离比表现同质,一致为:三组合的分离比表现同质,一致为3 1,HA:三:三组合分离比例不同质。组合分离比例不同质。 要测验上列假设,必须计算出相应的要测验上列假设,必须计算出相应的 值值 因为因为 不具可加性,只有不具可加性,只有 值具有可加性。值具有可加性。 222C6.5 6.5 的可加性和联合分析的可加性和联合分析2 三个组合综合为一群体时的三个组合综合为一群体时的 值,或称为值,或称为 =3.06,亦具,亦具1个自由度个自由度 这一值可用以测验第一个无效假设这一值可用以测验第一个无效假设 根据其概率为根据
14、其概率为0.050.10,可推论三合一的群体总的分离,可推论三合一的群体总的分离比例亦符合比例亦符合3 1。22T6.5 6.5 的可加性和联合分析的可加性和联合分析2 三组合各三组合各 的总和的总和 =3.66,具有,具有3个自由度个自由度 若将这若将这3个自由度分解个自由度分解 1个归属于三组合间的共性个归属于三组合间的共性 2个归属于三组合间的个性,个归属于三组合间的个性, 22i0632.T60006366322.Ti可用以测验第二个无效假设,三个组合的同质性可用以测验第二个无效假设,三个组合的同质性6.5 6.5 的可加性和联合分析的可加性和联合分析2三个组合的同质性三个组合的同质性
15、 =0.60, 时时P=0.500.75 说明符合同质性假设的概率甚大,接受此假设说明符合同质性假设的概率甚大,接受此假设 因而三个组合表现一致的因而三个组合表现一致的3 1分离比例是确实的分离比例是确实的 可推论大豆对豆秆黑潜蝇的抗性是由可推论大豆对豆秆黑潜蝇的抗性是由1对显性基因控制的,组合间对显性基因控制的,组合间表现出一致的结果表现出一致的结果22Ti26.5 6.5 的可加性和联合分析的可加性和联合分析2 本例中因试验结果很一致,因而引出了共同的结论本例中因试验结果很一致,因而引出了共同的结论 若各个若各个 的结果出入较大,的结果出入较大, 与个别组合的结果不一致,与个别组合的结果不
16、一致, 表现出显著性,那么将着重分析各组合间的非同质性及各表现出显著性,那么将着重分析各组合间的非同质性及各组合的特异性组合的特异性2i2T22Ti6.5 6.5 的可加性和联合分析的可加性和联合分析2次数分布次数分布iiif yfyyfn()1iiifyysf 前面几章讨论的资料和统计方法只着重一个单独变数,例如产量等变数的分布及其特征 在农业试验工作中,大部分问题是包括两个或两个以上变数在一起变异的问题 例如降雨量、温度和光照等气候因子对番茄产量的影响等。 把许多种变数摆在一起的研究,目的在于发现它们之间存在的规律性,以预测或估计变数间的变异趋向,在统计上称作回归与相关研究 研究两个变数之
17、间关系时,因变数不同而有两种不同的研究方法。 1.变数之间的关系变数之间的关系变数之间的关系函数关系函数关系统计关系统计关系函数关系函数关系 是一种一一对应的确定关系 不包含误差的干扰统计关系统计关系 一种非确定的关系 一个变数取值受到另一个变数的影响 两者之间既有关系,但又不是完全确定的函数关系 变数之间的关系受到误差的干扰变数之间的统计关系变数之间的统计关系因果关系因果关系相关关系相关关系自变数(自变数(independent variable)依变数(依变数(dependent variable)呈现出一种共同变化的特点呈现出一种共同变化的特点回归分析回归分析 对具有因果关系的两个变数,
18、可以推算出Y随X改变的方程 ,此时的方程称为Y依X的回归方程(regression equation of Yon X) 以计算回归方程为基础的分析方法称为回归分析 原则上两个变数中Y含有试验误差而X不含有试验误差时着重进行回归分析f(x) y回归分析的类型回归分析的类型回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归相关分析相关分析 对具有相关关系的两个变数,可以计算出表示相关密切程度的统计数,并检验其显著性 通常在Y和X均含有误差时着重进行相关分析相关分析相关分析 在直线相关时,这一统计数称为相关系数(correlat
19、ion coefficient),记为r 在多元相关时称为复相关系数(multiple correlation)记为Ry.1.2m 曲线相关时称为相关指数(correlation index),记为R相关系数相关系数简单相关系数简单相关系数r复相关系数复相关系数Ry.1.2.m相关指数相关指数R直线相关直线相关多元相关多元相关曲线相关曲线相关偏相关系数偏相关系数Ry.1多元相关多元相关相关系数的种类回归分析和相关关系 对具有因果关系的两个变数,统计分析的任务是由试验数据推算一个方程为y依x的回归方程 对具有相关关系的两个变数,统计分析的目标是计算表示y和x相关密切和程度的统计数并测其显著性 回
20、归分析和相关关系 原则上y含有试验误差而x不含试验误差时着重进行回归分析; y和x均含有试验误差时则着重去进行相关分析 但没有明显的界限,而实际它们的分析包括着相互的信息两个变数资料的散点图 对具有统计关系的两个变数资料,将其观测值分别以坐标点的形式标记与同一直角坐标平面上,获得散点图(scatter diagram) 通过散点图可以初步判定变数之间的关系 相关的性质和密切程度 变数的关系是直线型,还是非直线型 是否有一些特殊的点表示着其他因素的干扰1234x,生物产量(g)0.00.51.01.52.0y,稻谷产量(g)水稻单株生物产量与稻谷产量的散点图3.23.644.44.8x,每平方米
21、颖花数(万)05560657075y,结实率(%)水稻每平方米颖花数和结实率的散点图34567890250300350400450 x,最高叶面积指数y,产量(kg/亩)水稻最高叶面积指数和亩产量的散点图9.2 直线回归直线回归1.直线回归方程式直线回归方程式 在散点图上呈直线趋势的两个变数,如果要概括其在数量上的互变规律,即从X的变化来预测或估计Y的变化,则要采用直线回归方程来描述 linear regression equation 是和x对应的依变数的点估计值 a 是回归截距 (regression intercept) b是回归系数 (regression coefficient)y
22、yabx要使 能够最好地代表y和x在数量上的互变关系,必须使yabx21()nQyy最小21()nQyabx 最小YabXX iiYYY1.直线回归方程式直线回归方程式21()nQyabx 最小分别对a和b求偏导数并另其为0,即可获得正规方程组(normal equations):0)(2bxayaQ0)(2bxaybQ1.直线回归方程式直线回归方程式yxbanxyxbxa2正规方程组正规方程组解之得:解之得:2211()xyxynbxxn 2()()()xxyyxxxSPSSaybx1.直线回归方程式直线回归方程式 是x的离均差和y的 离均差的乘积和,简称为乘积和(sum of produc
23、ts),记作SP 分母是x的离均差平方和,记作SSx)(yyxx1.直线回归方程式直线回归方程式a、b的取值及意义的取值及意义 A、b皆可正可负 若b0或和0的差异不显著,表明y的变异和x的取值大小无关,直线回归关系不直线回归关系不能成立能成立0YabX b0YabX bXY0YabX b2.直线回归的计算直线回归的计算例例一些夏季害虫盛发期的早迟和春季温度高低一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续有关。江苏武进连续9年测定年测定3月下旬至月下旬至4 月中旬月中旬旬平均温度累积值旬平均温度累积值(x,旬旬.度度)和水稻一代三化螟盛和水稻一代三化螟盛发期发期(y,以以5月月10
24、日为日为0)的关系,得结果于下表。的关系,得结果于下表。试计算其直线回归方程。试计算其直线回归方程。Y12169273139-1X35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2由观察值计算一级数据935.534.144.2333.7nx222235.534.144.212517.49x1216( 1)70y 22221216( 1)79435.5 1234.1 1644.2 ( 1)2436.4yxy 由一级数据计算二级数据222222() /12517.49(333.7) /9144.6356() /794(70) /9249.5556/2436.4
25、(333.7 70)/9159.0444xySSxxnSSyynSPxyxyn /333.7/937.0778xxn/70/97.778yyn因而有:因而有:/159.0444/144.63561.0996/(.)xbSPSS 天旬度7.7778(1.0996 37.0778)48.5485()aybx 天从而得到回归方程:从而得到回归方程:48.58451.0996yx对回归方程的解析 回归系数的意义:当3月下旬至4月中旬的积温每提高1旬.度时,一代三化螟虫的盛发期平均将提早1.1天 截距的意义:若积温为0,则一代三化螟虫的盛发期将在6月2728日 由于x的实测区间为31.7,44.2,根据
26、回归方程对Y的预测只能内插而不能外延48.58451.0996yx 三、直线回归方程的图示303438425/5 -55/10 05/15 55/20 105/25 15(月月/日日)x,3月下旬至月下旬至4月中旬平均温度累积值月中旬平均温度累积值y,一代三化螟盛发期一代三化螟盛发期xy0996. 15485.48),(yx 例.在粉皮冬瓜雌花谢花后711天测量果实纵径,获得如下数据,试作回归分析谢花后天数谢花后天数x x7 78 89 910101111果实纵径果实纵径 y y14.314.316.816.817.217.217.617.618.518.5 例.测得大红番茄果实横径与果重的一
27、组数据资料,试作横径与果重两个变数间的回归分析。果实横径果实横径x x10109.69.69.29.28.98.98.58.58 87.87.87.77.77.47.47 7果重果重y y14014013213213013012112111611610810810510510610695959090四、直线回归的估计标准误 满足 为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。Q 就是误差的一种度量,称之为离回归平离回归平方和方和(sum of squares to deviation from regression)或剩余平方和剩余平方和2()Qyy四、直线回归的估计标准误 满足 为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。Q 就是误差的一种度量,称之为离回归平离回归平方和方和(sum of squares to deviation f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中地理必修一知识点总结(7篇)
- 线程间消息队列机制-洞察分析
- 橡胶智能检测技术-洞察分析
- 舞蹈编创技术革新-洞察分析
- 眼动分析与斜视治疗-洞察分析
- 物联网与智慧城市的融合-洞察分析
- 营销传播效果测量-洞察分析
- 物联网安全风险评估剖析-洞察分析
- 医疗保险对手术费用的影响-洞察分析
- 新媒体艺人粉丝行为-洞察分析
- 普通外科国家临床重点专科建设项目申报书
- 2020海湾JTW-LD-GST85B缆式线型感温火灾探测器
- 微测网题库完整版行测
- 2024中华人民共和国农村集体经济组织法详细解读课件
- 110kV变电站专项电气试验及调试方案
- 2024应急管理部国家自然灾害防治研究院公开招聘34人(高频重点提升专题训练)共500题附带答案详解
- 俄语入门智慧树知到期末考试答案章节答案2024年吉林师范大学
- 人教版七年级数学上册第一学期期末综合测试卷(2024年秋)
- 2023-2024学年吉林省长春七年级(上)期末英语试卷
- 委托付款四方协议
- 2023年北京语言大学事业编制人员招聘考试真题
评论
0/150
提交评论