Excel统计应用_第1页
Excel统计应用_第2页
Excel统计应用_第3页
Excel统计应用_第4页
Excel统计应用_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、EXCEL统计应用用EXCEL电子表格进行统计分析具有简单、易学、适用范围广、实用性较强等特点,“EXCEL统计应用”可作为生物统计学课程的补充教学,为本科生毕业论文的顺利完成打下基础。本课程以EXCEL电子表格为基础,选择性讲述如何利用电子表格中的统计工具进行常规生物统计分析的方法,主要内容有:数据整理(次数分布表及直方图的制作);描述统计及折线图、散点图的制作;均数差异显著性检验(t-test);单因素试验的方差分析(F-test);两因素交叉分组试验的方差分析(F-test);相关系数的计算;回归分析。主要内容及学时分配第一章数据整理(次数分布表及直方图的制作)3学时第二章描述统计及折线

2、图、散点图的制作3学时 第三章均数差异显著性检验(t-test)3学时第四章单因素试验的方差分析(F-test)3学时第五章两因素交叉分组试验的方差分析(F-test)3学时第六章相关系数的计算3学时第七章回归分析3学时第一章数据整理(次数分布表及直方图的制作)【说明】编制次数分布表与绘制直方图是整理数据最常用的方法,其特点是简单却相当繁琐,尤其是在数据量很大时。使用统计软件,利用计算机将使人们很容易解决这个问题。【目的】以“次数分布表及直方图的制作”为例学习EXCEL中有关数据整理的方法。【主要内容】1、采用“组距式分组法”进行分组。2、绘制直方图。【方法】连续性资料的整理与分组是采用组距式

3、分组法,在分组前需要确定全距、组数、组距、组中值和组限,然后将各个变数分别纳入相应的组内。在编制次数分布表的同时可以制作次数分布图(直方图)。第二章描述统计及折线图、散点图的制作【说明】描述统计分析常用的统计量有两类,一类是表示资料中心位置的统计量,有算术平均数、中数、众数等,另一类是表示资料变异程度的统计量,有方差、标准差、标准误等,此外还有表示资料分布情况的统计量,有峰值和偏斜度等。折线图应用广泛,多用来表示事物或现象随时间而变化的情况,可描述畜禽的相对生长、绝对生长、累积生长等。散点图多用于描述两变量间的关系,可建立依变量(y)对自变量仗)的线性、对数、乘幂、指数、多项式方程等。【目的】

4、结合实例,使用EXCEL进行描述统计分析及折线图、散点图的制作。【主要内容】1、描述统计分析。2、折线图的制作。3、散点图的制作。【方法】描述统计分析工具用于生成对输入区域中数据的单变量值的分析,提供有关数据趋中性和易变性的信息。在EXCEL的图表向导中学习折线图、散点图的制作。第三章均数差异显著性检验(t-test)【说明】统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,主要包括假设检验和参数估计。假设检验又叫显著性检验,是生物统计学中一个很重要的内容,而t-test是常用的显著性检验方法之一。【目的】结合实例,使用EXCEL进行不同试验设计的t-test。【主要内容】1、两样

5、本均数非配对试验设计的t-test。2、两样本均数配对试验设计的t-test。【方法】非配对试验设计的t-test,是指将试验单位随机地分为2组,各实施一种试验处理,这种设计方式也称为两个试验处理的完全随机化设计,由此得到的2个样本的观察值相互独立。在畜牧试验中,经常将同窝动物组成对子,用若干对动物进行试验,同一对子中2个动物随机地分到2个处理组中,这种试验设计称为配对试验设计,此时采用两样本均数配对试验设计的t-test进行均数差异显著性比较。结合实例分别进行两种t-test的操作。第四章单因素试验的方差分析(F-test)【说明】方差分析是将k个处理的观测值作为一个整体看待,把观测值总变异

6、的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差的估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析是在科研中广泛应用的进行多个处理间差异显著性检验的方法。在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素每个水平的优劣。【目的】结合实例,使用EXCEL进行单因素试验设计的方差分析。【主要内容】1、单因素等重复试验设计的方差分析。2、单因素不等重复试验设计的方差分析。【方法】试验中,当采用了完全随机化设计,

7、试验处理在2个以上时所得到的试验结果就必须采用单因素方差分析,根据各样本含量n是否相同,可将单因素方差分析分为处理内观察次数相等和不相等二种类型。鉴于处理内观察次数相等和不相等所采用的分析工具相同,故只介绍单因素不等重复试验设计的方差分析的方法。第五章两因素交叉分组试验的方差分析(F-test)【说明】两因素试验资料的方差分析,是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。试验因素A(a个水平)、B(b个水平)在试验中处于平等地位,试验单位分成ab个组,每组随机接受一种处理。【目的】结合实例,使用EXCEL进行两因素交叉分组试验设计的方差分析。【主要内容】1、两因素交叉分组无重复

8、试验资料的方差分析。2、两因素交叉分组有重复试验资料的方差分析。【方法】试验中,两因素中因素A(a个水平)和因素B(b个水平)交叉分组,k=ab,此时有两重情况:每个处理组1个试验单位(无重复)和每个处理组n个试验单位(有重复)。第六章相关系数的计算【说明】相关分析研究平行关系的相关变量之间的关系,包括直线相关分析(两个变量间的直线相关)、复相关分析(一个变量与多个变量间的线性相关)、偏相关分析(其余变量保持不变的情况下两个变量间的线性相关)等。相关分析可用于研究两个变量之间相关的程度和性质或一个变量与多个变量之间相关的程度及性质。【目的】结合实例,使用EXCEL进行相关分析中相关系数的计算。

9、【主要内容】1、简单相关系数的计算。2、偏相关系数的计算。【方法】利用相关系数分析工具一次能够计算多个变量之间的简单相关系数。偏相关系数是在多个相关变量的情况下其中2个变量在其余变量保持不变的情况下,其相关程度的一个度量值;偏相关系数的级数与保持不变的变量个数相等;求任意级偏相关系数最快的方法,就是采用简单相关系数矩阵的逆矩阵中对应元素的方法。第七章回归分析【说明】统计学上采用回归分析研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个依变量的回归分析称为

10、多元回归分析。回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量来预测、控制依变量。【目的】结合实例,使用EXCEL进行回归分析。【主要内容】1、一元直线回归:回归方程的建立、回归系数和回归截距的显著性检验等。2、多元线性回归:回归方程的建立、多元回归方程的显著性检验、偏回归系数和回归常数的显著性检验、最优回归方程的建立等。【方法】直线回归分析是分析2个变量之间的从属关系,以此建立直线回归方程,从而由1个变量来估计另1个变量,通常将被估计的变量称为依变量用y表示,另1个变量称为自变量用x表示;为建立回归方程必须计算出y对x的回归系数和

11、回归截距。多元回归分析是分析一个依变量与多个自变量之间的回归关系,以此建立多元回归方程,从而由多个自变量来估计依变量的数值;为建立多元回归方程必须计算出常数项及各个自变量对依变量的偏回归系数。【主要参考文献】1明道绪.生物统计附试验设计(第四版)M.北京:中国农业出版社,2008.徐宁迎,严竟天.EXCEL电子表格与生物M.北京:中国农业科技出版社,2000.贵州农学院主编.生物统计附试验设计M.北京:农业出版社,1989.南京农业大学主编.田间试验与统计方法M.北京:农业出版社,1988.吴仲贤.生物统计M.北京:北京农业大学出版社,1993.俞渭江,郭卓元.畜牧试验统计M.贵阳:贵州科技出

12、版社,1995.杨纪珂.应用生物统计M.北京:科学出版社,1983.盖钧益.试验统计方法M.北京:中国农业出版社,2000.第一章数据整理(次数分布表及直方图的制作)【说明】编制次数分布表与绘制直方图是整理数据最常用的方法,其特点是简单却相当繁琐,尤其是在数据量很大时。使用统计软件,利用计算机将使人们很容易解决这个问题。【目的】以“次数分布表及直方图的制作”为例学习EXCEL中有关数据整理的方法。【主要内容】1、采用“组距式分组法”进行分组。2、绘制直方图。【方法】连续性资料的整理与分组是采用组距式分组法,在分组前需要确定全距、组数、组距、组中值和组限,然后将各个变数分别纳入相应的组内。在编制

13、次数分布表的同时可以制作次数分布图(直方图)。1.1次数分布表从科学试验或生产实际中得到的大量原始资料,通常是杂乱无章的,只有经过分组整理后才能看出该资料的分布特征。编制次数分布表与绘制直方图是整理数据最常用的方法。连续性资料的整理与分组是采用“组距式分组法”。在分组前需要确定全距、组数、组距、组中值和组限,然后将各个变数分别纳入相应的组内。求全距全距是资料中变数的最大值与最小值之差,常用“R”表示。确定组数组数的确定通常参考下表进行,其常用“k”表示。表1-1样本大小与组数多少的关系变数的个数(n)分组的组数(k)306068601007101002009122005001217500以上1

14、730求组距每一组的范围称为组距,通常用“i”表示,其大小是根据等距离分组的原则用i=R/k计算所得。为方便进一步的分组可考虑将计算所得的小数化为整数。求组中值与组距每组中的最小值及最大值分别称为组下限和组上限,而它们的平均数就是组中值。注意:为避免分组时第一组中变数过多,一般第一组的组中值最好接近或等于资料中的最小值。在得到各组的组限后就可以利用电子表格中的“直方图”分析工具进行分组及绘制直方图。现以200头大白母猪(经产)的仔猪一月窝重的资料为例,操作步骤如下:表1-2200头大白母猪的仔猪一月窝重的资料(单位:kg)47.267.789.5108.553.031.560.784.062.

15、268.257.151.670.597.858.278.064.684.850.568.740.556.858.041.585.858.851.860.591.863.778.229.323.567.862.596.584.036.074.579.658.241.563.867.380.711.664.034.428.065.075.959.879.557.276.534.549.667.518.453.061.263.371.765.8103.512.058.569.840.255.085.066.539.875.555.5104.785.055.2104.275.366.096.720.5

16、15.720.026.379.377.4102.495.183.056.070.876.874.0118.542.426.686.853.043.883.071.836.067.872.590.5101.041.776.189.065.0100.031.471.894.570.188.756.427.981.536.788.579.469.579.572.165.523.240.249.981.041.576.972.082.164.469.854.168.640.586.759.525.062.870.090.667.156.773.862.372.3113.090.357.886.134.

17、039.449.741.050.467.579.568.338.368.634.014.625.554.394.388.485.060.881.052.5117.073.023.371.785.178.081.074.572.964.080.5108.672.587.556.090.889.470.655.5102.293.594.467.347.31、根据上述方法确定R=118.5-11.6=106.9k=14i=R/k=7.6-8m1=12第一组组下限为8,然后根据“等距离分组”原则类推于是分组:816241122、打开EXCEL电子表格,输入原始数据及各组的组上限(见操作图),200头大

18、白母猪仔猪一月窝重的原始数据输入区域是从A2开始到J21结束,各组的组上限输入区域是K2到K15。3、用鼠标选定工具菜单,单击鼠标左键,在出现的菜单中选定数据分析并单击鼠标左键,出现数据分析对话框。4、从数据分析对话框中选定直方图,然后选定确定按钮并单击鼠标左键,出现直方图对话框。5、在输入选项的输入区域中输A$A$2:$J$21,在接收区域中输入$K$2:$K$15,在输出选项中选定输出区域,然后输A$A$23,选定柏拉图(排序直方图)和累积百分率(见操作图)。6、在直方图对话框中选定确定按钮,单击鼠标左键,得到次数分布表(见表1-3)。在表1-3中,第一列是各组的组上限,第二列是各组的频数

19、,也称为次数,第三列是累积频率,第四列至第六列重复第一列到第三列的数值,但在排列顺序上是根据频率呈降序排列。表1-3次数分布表、柏拉图表及其累积频率接收频率累积接收频率累积15.942.00%71.93517.50%23.965.00%79.92831.50%31.999.50%63.92644.50%39.91014.50%87.92155.00%47.91321.00%55.91763.50%55.91729.50%95.91671.50%63.92642.50%47.91378.00%71.93560.00%39.91083.00%79.92874.00%31.9987.50%87.92

20、184.50%103.9891.50%95.91692.50%23.9694.50%103.9896.50%15.9496.50%111.9498.50%111.9498.5%119.93100.00%119.93100.00%其他0100.00%其他0100.00%次数分布图(直方图)如果希望在编制次数分布表的同时得到次数分布图,则在直方图对话框中必须选定图表输出。注意:直方图的输出类型是随着前面的选项而有所变化的,若在直方图对话框中,不选择柏拉图和累积百分率,只选择图表输出,这时输出的直方图形式见操作图。补充】表1-4200头大白母猪的仔猪一月窝重的次数分布表(单位:kg)组别组中值次数(

21、f)8124162062428932361040441348521756602664683572762880889610411284219216100810841163第二章描述统计及折线图、散点图的制作【说明】描述统计分析常用的统计量有两类,一类是表示资料中心位置的统计量,有算术平均数、中数、众数等,另一类是表示资料变异程度的统计量,有方差、标准差、标准误等,此外还有表示资料分布情况的统计量,有峰值和偏斜度等。折线图应用广泛,多用来表示事物或现象随时间而变化的情况,可描述畜禽的相对生长、绝对生长、累积生长等。散点图多用于描述两变量间的关系,可建立依变量(y)对自变量仗)的线性、对数、乘幂、指

22、数、多项式方程等。【目的】结合实例,使用EXCEL进行描述统计分析及折线图、散点图的制作。【主要内容】1、描述统计分析。2、折线图的制作。3、散点图的制作。【方法】描述统计分析工具用于生成对输入区域中数据的单变量值的分析,提供有关数据趋中性和易变性的信息。在EXCEL的图表向导中学习折线图、散点图的制作。2.1描述统计分析基本步骤1、用鼠标选定工具菜单,单击鼠标左键,在出现的菜单中选定描述统计并单击鼠标左键,出现描述统计对话框;2、在描述统计对话框中的输入区域中输入$人$2:$A$201,分组方式后的选项中选定逐列,在输出选项中选定输出区域,然后输入$B$2;3、在选项中选定汇总统计、平均数置

23、信度为95%;4、在描述统计对话框中选定确定按钮,单击鼠标左键,得到描述统计分析表(表2-1)。说明:算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。旨xx=n将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。a、未分组资料中位数的计算方法对于未分组资料,先将各观测值由小到大依次排列。当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(1)/2为中位数:Md=x(n+1)/2d(n+1)/2当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中x1+x位数,即:M=n/2(n/2+1)d2b、若资料已分

24、组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:Md资料中出现次数最多的那个观测值或次数最多一组的组中值为众数,记为M。极差也称为全距,是资料中最大值与最小值差。样本方差的计算公式为:S2=矗(x-无)2/n-1样本方差开平方根就为样本标准差,计算公式为:S=22n-1标准误是表示平均数的变异程度,计算公式为:SS邋O-x)2fx2-(x)2/nxJnn(n-1)n(n-1)偏斜度表示资料分布的情况,当偏斜度为零时资料的分布是对称的;当偏斜度为正值是分布正偏,即众数位于算术平均数的左侧;当偏斜度为负值时,分布偏负,即众数位于算术平均数的右侧。峰值也称为峭度,它是度量曲线形状

25、的一个量,当它等于零时,可以认为数据是服从正态分布的;当它为正值时曲线过于陡峭;当它为负值时,曲线过于平坦。置信半径的计算公式为:Ra=爲止表2-1200头大白母猪仔猪一月窝重的描述统计分析平均65.452标准误差1.587608891中值67.6模式85标准偏差22.45218025样本方差504.100398峰值-0.271757407偏斜度-0.25038337区域106.9最小值11.6最大值118.5求和13090.4计数200最大(2)117最小(2)12置信度(95%)3.130696969(置信半径)2.2折线图的制作折线图应用广泛,多用来表示事物或现象随时间而变化的情况,可描

26、述畜禽的相对生长、绝对生长、累积生长等。相对生长R=(末重一始重)/始重xlOO%,其描述的是生长发育强度绝对生长G=(W1-W0)/(t1-t0),W0为始重,即为前一次测定的重量;W为末重,即为后一次测定的重量;t0为前一次测定的日龄,-为后一次测定的日龄。其描述在一定时间内的增长量,说明某个时期的生长发育的绝对速度。累积生长:任何一个时期所测得的体重,都代表该家畜(禽)被测定以前生长发育l2的累积结果,这称为累积生长。器官指数=免疫器官鲜重(g)/宰前空腹活重(kg)xlOO%表2-2不同日龄免疫器官指数(X士SE,g/kg)日龄脾脏胸腺法氏囊71.0160.0203.2780.4352

27、.0220.192l4l.2l50.l405.8200.3783.5400.1402l1.0720.1896.3320.6783.8190.343282.6000.2995.9320.4673.5460.393352.5310.1725.0660.5081.1490.094421.8780.1186.4890.4280.7580.096举例】表2-3不同日龄不同组别胸腺重(g)日龄(d)I组II组III组W组胸腺141.421.231.321.67283.183.532.181.73424.303.203.822.052.3散点图的制作散点图多用于描述两变量间的关系,可建立依变量(y)对自变量

28、(x)的线性、对数、乘幂、指数、多项式方程等。【举例分析】免疫系统是脊椎动物和人类的防御系统,它与神经系统、内分泌系统、呼吸系统等一样,是机体的一个重要系统,是在系统发生过程中长期适应外界环境而形成的。免疫系统主要是指形成特异免疫应答的器官、组织、细胞和免疫活性介质,免疫器官是免疫活性细胞发育、增殖的场所,胸腺、法氏囊、脾脏是禽类最重要的免疫器官。 g(重脏脾y=-0.0003x3+0.0204x2-0.3511x+2.6493试验意义:免疫器官称重法是研究机体免疫体况的常用方法,常规的屠宰、解剖、称重的方法,需要耗费较多的人力、物力和时间,本次试验尝试建立免疫器官重(y)与日龄(x)的回归方

29、程,探讨通过日龄估测免疫器官重的方便而准确的途径。表2-4不同日龄免疫器官重(g)日龄脾脏胸腺法氏囊71.0163.2782.022141.2155.8203.540211.0726.3323.819282.6005.9323.546352.5315.0661.149421.8786.4890.758表2-5脾脏重(y)与日龄(x)的回归方程回归方式回归方程R2直线回归y=0.0399x+0.74010.5207对数回归y=0.7994lnx-0.71350.5340多项式回归y=-0.0003x3+0.0204x2-0.3511x+2.64930.8483幂回归y=0.3491x0.4990

30、.5980指数回归y=0.8606eO.O251x0.59303.0002.5002.0001.5001.0000.5000.00001020304050日龄(d)第三2章脾脏重均数差异显著性检回验和幂回归est)【说明】统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,主要包括假设检验和参数估计。假设检验又叫显著性检验,是生物统计学中一个很重要的内容,而t-test是常用的显著性检验方法之一。目的】结合实例,学会使用统计软件在计算机上进行不同试验设计的t-test。主要内容】1、两样本均数非配对试验设计的t-test。2、两样本均数配对试验设计的t-test。【方法】非配对试验设

31、计的t-test,是指将试验单位随机地分为2组,各实施一种试验处理,这种设计方式也称为两个试验处理的完全随机化设计,由此得到的2个样本的观察值相互独立。在畜牧试验中,经常将同窝动物组成对子,用若干对动物进行试验,同一对子中2个动物随机地分到2个处理组中,这种试验设计称为配对试验设计,此时采用两样本均数配对试验设计的t-test进行均数差异显著性比较。现结合实例分别进行两种t-test的操作。常用的t-test样本平均数与总体平均数差异显著性检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验

32、数值或期望数值。如畜禽正常生理指标、怀孕期、家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。检验的基本步骤是:提出无效假设H0:m=m0与备择假设HA:m1m0,其中m为样本所在总体平均数,m为已知总体平均数。X-计算t值。t=*卡;式中n为样本含量,Sx为样本标准误。一查临界t值,作出统计推断。由df=n-1查附表3得临界值t0.05及t0.01,将计算所得的t值的绝对值与其比较:若|tl0.05,不能否定H0:m=m0,表明样本平均数X与总体平均数差异不显著,可以认为样本是取自该总体;若t0.05即vt0.01|,则0.01VPS0.05,否定H0:m=m0,接

33、受Ha:m1m0,表明样本平均数X与总体平均数”差异显著,有95%的把握认为样本不是取自该总体;若1收0.01,则PS0.01,表明样本平均数X与总体平均数化差异极显著,有99%的把握认为样本不是取自该总体。非配对设计两样本平均数的差异显著性检验非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。非配对设计资料的一般形式见表3-1。表3-1非配对设计资料的一般形式基本步骤提出无效假设H:m=01与备择假设H:mA1计算t值。x-xt=1Sx1-x2df=(n

34、-1)+(n12-1)其中:Sx1-x2邋(X-X)2+(x-X)2111122?(_(n-1)+(n-1)nn1212(xx2-2_2n2(n-1)+(n-1)121n2(n-1)S2+(n-1)S211(n-1)+(n-1)12当n1=n2=n时邋(x-x)2+(x-x)2S_-=112xi-x2n(n-1)S2S21+2-nn2+S_2x2Sx-x为均数差异标准叫、n2,x、x,S2、s22,分别为两样本含量、平均数、均方。12121212根据df=(n1-1)+(n2-1),查临界值:t0.05、t0.oi,将计算所得t值的绝对值与其比较,作出统计推断。配对设计两样本平均数的差异显著性

35、检验非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单位不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一不同时间上分别接受前后两次处理,用其前后两次的观测值进行

36、自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。|同源配对指旨将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,然后对配对的两个个体随机地实施不同处理。个重复。配对的方式有两种:自身配对与司源配对自身配对指同一试验单位在二个配对设计试验资料的一般形式见表3-2。表3-2配对设计试验资料的一般形式处理P观测值直样本含量卩样本平均数二总体平均馥卩口|鼻Xie-*21HPXei-*-HP无2=迟工0H乩4HP

37、=互一疋24幽=期_禹4基本步骤提出无效假设H0:md=0与备择假设HA:md1。其中md为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数m与m之差,即m=m-m。TOC o 1-5 h z12d12所设无效假设、备择假设相当于H:m=m,H:m1m。012A12汁算t值dt=,df=n-1S-式中,d为差异标准误,计算公式为:S(d-d)2nn(n-1)n(n-1)d为两样本各对数据之差dj=Xj-x2j(j=1,2,n);d=*dj/n;Sd为d的标准差;n为配对的对子数,即试验的重复数。查临界t值,作出统计推断。根据df=n-l查临界t值:t1和t1,将计算所得0.02(n-

38、1)0.01(n-1)t值的绝对值与其比较,作出推断。3.2完全随机设计完全随机设计是根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不同处理的设计。这种设计保证每头供试验动物都有相同机会接受任何一种处理,而不受试验人员主观倾向的影响。在畜牧、水产等试验中,当试验条件特别是试验动物的初始条件比较一致时,可采用完全随机设计。这种设计应用了重复和随机两个原则,因此能使试验结果受非处理因素的影响基本一致,真实反映出试验的处理效应。随机分组的方法有抽签法和用随机数字表法。下面举例说明用随机数字表将试验动物分组的方法。完全随机的分组方法两个处理比较的分组【举例】现有同品种、同性别、同年龄、体

39、重相近的健康绵羊18只,试用完全随机的方法分成甲、乙两组。绵羊编号123456789101112131415161718随机数字160744998311463224201485884510937288组别乙甲乙甲甲甲乙乙乙乙乙甲乙甲乙甲乙乙调整统别甲甲首先将18只绵羊依次(体重)编为1,2,,18号,然后从随机数字表中任意一个随机数字开始,向任一方向(左、右、上、下)连续抄下18个(两位)数字,分别代表18只绵羊。令随机数字中的单数为甲组,双数为乙组。如从随机数字表(I)第12行第7列的16开始向右连续抄下18个随机数字填入表第二行。随机分组结果:甲组:2456121416乙组:1378910

40、1113151718甲组比乙组少4只,需要从乙组调整两只到甲组。仍用随机的方法进行调整。在前面18个随机数字后再接着抄下两个数字:71、23,分别除以11(调整时乙组的绵羊只数)、10(调整1只绵羊去甲组后乙组剩余的绵羊只数),余数为5、3,则把分配于乙组的第5只绵羊(9号)和余下10只的第3只绵羊(7号)分到甲组。调整后的甲、乙两组绵羊编号为:2456T91214138101113151T1、按体重由小到大依次编号。2、分组易调整难。3、调几抄几,倒过来除以“序数”4、除得尽的写除数,除不尽的写余数(看余数;余数为零,以除数代之)。5、逐个调整。6、“00”不弃。3.2.1.2三个以上处理比

41、较的分组【举例】设有同品种、同性别、体重相近的健康仔猪18头,按体重大小依次编为1、2、3、18号,试用完全随机的方法,把它们等分成甲、乙、丙三组。由随机数字表(II)第10列第2个数94开始,向下依次抄下18个数,填入下表第2横行。4r4r4r4r1T1U56理911J90蘭lb26lb534rIB25111120102201012201址别甲甲甲甲L甲LL甲丙甲LL甲调整址别丙L一律以3(处理数)除各随机数字,若余数为1,即将该动物归于甲组;余数为2,归入乙组;商为0或余数为0,归入丙组。结果归入甲组者8头,乙组5头,丙组5头。各组头数不等,应将甲组多余的2头调整1头给乙组、1头给丙组。调

42、整甲组的2头动物仍然采用随机的方法。从随机数字25后面接下去抄二个数63、62,然后分别以8(甲组原分配8头)、7除之(注意:若甲组原分配有9头,须将多余的3头调整给另外两组,则抄下三个随机数,分别以9、8、7除之),得第一个余数为7,第二个余数为6,则把原分配在甲组的8头仔猪中第7头仔猪即14号仔猪改为乙组;把甲组中余下的7头仔猪中的第6头仔猪即12号仔猪改为丙组。这样各组的仔猪数就相等了。调整后各组的仔猪编号如下:组别仔猪编号甲组1234718乙组5910141516用完全随机的方法将试验动物分为四组1、五组或更多的组,方法相同。3.2.2试验结果的统计分析k=2k3对于完全随机试验的统计

43、分析,由于试验处理数不同,统计分析方法也不同。3.2.2.1k=2两个处理的完全随机设计也就是非配对设计,对其试验结果采用非配对设计的t检验法进行统计分析。k3若获得的资料各处理重复数相等,则采用各处理重复数相等的单因素试验资料方差分析法分析;若在试验中,因受到条件的限制或供试动物出现疾病、死亡等使获得的资料各处理重复数不等,则采用各处理重复数不等的单因素试验资料方差分析法分析。3.2.3完全随机设计的优缺点3.2.3.1主要优点设计容易处理数与重复数都不受限制,适用于试验条件、环境、试验动物差异较小的试验。统计分析简单无论所获得的试验资料各处理重复数相同与否,都可采用t检验或方差分析法进行统

44、计分析。3.2.3.2主要缺点由于未应用试验设计三原则中的局部控制原则,非试验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。3.3两样本均数非配对试验设计的t-test【举例】现随机抽测8头大白猪与8头哈白猪经产母猪产仔数资料如下(单位:头):大白猪816121761465哈白猪14119121014138结合此例,操作步骤如下:1、将原始数据输入电子表格A1至B9区域中,其中在A1和B1单元格中分别输入大白猪和哈白猪2个标志。2、打开数据分析对话框,选定“t检验:双样本等方差假设”工具,并按确定按钮打开“t检验:双样本等

45、方差假设”对话框,在输入框的变量1区域中输入$A$1:$A$9,变量2区域中输入$B$1:$B$9,选定标志项,在输出区域中输入$C$1(见操作图)。3、按确定按钮所得的计算结果见表3-3。表3-3中由上而下依次排列的统计数是算术平均数、样本方差、样本含量、合并方差、假设平均差、总自由度、t值、计算所得t值的单尾概率、一尾检验时的临界t值(根据设定的显著水平所确定的,本例为a=0.05)、计算所得t值的双尾概率、两尾检验时的临界t值(确定同一尾检验)。根据表中的数值,可见本例的检验结果是差异不显著(p0.05)。表3-3双样本等方差假设t检验结果t-检验:双样本等方差假设大白猪哈白猪平均10.

46、511.375、.、/.方差23.428571435.125观测值88合并方差14.27678571假设平均差0df14tStat-0.463151237P(Tv=t)单尾0.325186838t单尾临界1.76130925P(T=t)双尾0.650373676t双尾临界2.1447885963.4两样本均数配对试验设计的t-test有国产与进口的膘厚测定仪,对14头肥猪进行测定,数据如下(单位:mm):进口3240273732352843404141354934国产4344303430312626424042433743结合此例,操作步骤如下:1、将进口与国产一起测定的原始数据分别输入A1至

47、A15与B1至B15。2、打开数据分析对话框,选定“t检验:平均值的成对二样本分析”工具,并按确定钮打开“t检验:平均值的成对二样本分析”对话框,在输入框的变量1区域中输入$A$1:$A$15,变量2区域中输入$B$1:$B$15,选定标志项,在输出区域中输入$C$1(见操作图)。3、按确定钮得到计算结果见表3-4。注意:表3-4的解释基本同表3-3。表3-4成对资料的t检验结果进口国产平均36.7142857136.5.、八方差36.6813186845.96153846观测值1414泊松相关系数0.292254695假设平均差0df13tStat0.104700722P(T=t)单尾0.4

48、59105728t单尾临界1.770931704P(T)差异显著性检验的方法。在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素每个水平的优劣。【目的】结合实例,学会使用统计软件进行单因素试验设计的方差分析。【主要内容】1、单因素等重复试验设计的方差分析。2、单因素不等重复试验设计的方差分析。【方法】在畜牧试验中,当采用了完全随机化设计,试验处理在2个以上时所得到的试验结果就必须采用单因素方差分析,根据各样本含量n是否相同,可将单因素方差分析分为处理内观察次数相等和不相等二种类型。鉴于处

49、理内观察次数相等和不相等所采用的分析工具相同,故只介绍单因素不等重复试验设计的方差分析的方法。4.1方差分析的基本概念方差分析(analysisofvariance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。“方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”,方差分析实质上是关于观测值变异原因的数量分析。几个常用术

50、语1、试验指标(experimentalindex)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。2、试验因素(experimentalfactor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验

51、指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、等表示。3、因素水平(leveloffactor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,来表示。如A、A2、.,B、B2、.,等。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素

52、的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3x3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。5、试验单位(experimentalunit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;

53、或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。6、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。方差分析的基本原理数据模式k个处理每个处理有n个观测值的数据模式处理J观测值门合计可心平均鬲心Xi13Xie3*!口j*!XlnPEl3EE3二1Ej3二1:P:P1!:卩1!恥Xii3XiEilil:P:P*1:卩*1和3二1二13耳表中x表示第i个处理的第j个观测值(i=l,2,.,k;j=l,2,.,n);x=anx表示第i个处理n个观测值的和;T

54、OC o 1-5 h zi.ijj=1knkx.=邋xij=xi.表示全部观测值的总和;ijii=1j=1i=1Ox.=xj/n=xi./n表示第i个处理的平均数;j=1x-=邋xj/kn=x-/kn表示全部观测值的总平均数;i=1j=1SST=SSt+SSeTtedf=df+dfT其中:/平方和与自由度的剖分SS=SkSnx2-CTiji=1j=1SSt=8x2-Cni.i=1SSe=SS-SSTtC=x2/kn称为矫正数鬃df=kn-1df=k-1ttMS=S2=SS/dfTTTT彳MS=S2=SS/dfttttLMS=S2=SS/dfeeee注意:总均方一般不等于处理间均方加处理内均方F

55、检验F=S2/S2tedf=df=k-1,df=df=k(n-1)1t2e实际进行F检验时,是将由试验资料所算得的F值与根据df产dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值0.05(df1,df2),0.01(df1,df2)相比较作出统计推断的。若FVF0.05(叭叽),即P0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“nS”或不标记符号;若FF,即P0.01,否定H0,接受HA,统计学上,把这一检验结果表0.01(dffdfj述为:各处理间差异极显著,在F值的右上方标记“*”。4

56、.3实例分析现有5个不同品种的若干头母猪的窝产仔数资料见表4-2表4-2五个不同品种的母猪产仔数ABCDEFG1品种号观察值21813129993278107431314101112125413988106512111514结合此例,操作步骤如下:1、将数据输入EXCEL电子表格中,数据区域见表4-2。2、打开数据分析对话框,选定“方差分析:单因素方差分析”工具,并按确定钮打开“方差分析:单因素方差分析”对话框,在输入框的输入区域中输入$A$2:$G$6,分组方式选定行并选定标志项,在输出区域中输入$A$8(见操作图)。3、按确定钮得到的计算结果包括2张表。其中一张表是各组情况的概述,内容有各

57、组的总和、平均数、方差和样本含量(表格省略)。另一张是方差分析表(见表4-3),表中第6列是实际概率值,第7列是5%显著水平的临界F值。表4-3五个不同品种母猪产仔数的方差分析表差异源SSdfMSFP-valueFcrit组间68.96417.245.4556960.0038892.866081组内63.2203.16总计132.1624注意方差分析有显著差异时还必须进行多重比较此时插入“EXCEL操作演示”第四章“Sheet2”中“DPS3.01”处理的方差分析及多重比较,讲解“字母标注法”。【举例】表4-3AA肉鸡的法氏囊指数(X土SE,g/kg)组别14日龄2842I2.3100.237

58、a1.1220.165bA0.5850.206aII2.2450.243a1.7400.185aAB0.8220.106aIII2.4300.320a2.1160.164aB0.8570.167aIV2.5730.158a1.6720.239abAB0.6740.113a注:同列肩标不同小写字母表示差异显著(P0.05);不同大写字母表示差异极显著(Pr00(24),表明相关系数极显著。而r2=0.25,即x变量或y变量的总变异能够通过y变量或x变量以直线回归的关系来估计的比重只占25%,其余的75%的变异无法借助直线回归来估计。【举例】现有某猪场50头肥猪5项胴体性状资料的数据列于表6-1,

59、其中瘦肉量为依变量y,眼肌面积为X、腿肉量为x2、腰肉量为x3、椎骨数为x4。请计算多个变量的简单相关系数。猪活体眼肌面积指猪最后肋骨处背最长肌横截面的面积;可以用求积仪测出,也可以用公式估算,眼肌面积=眼肌高(cm)x眼肌宽(cm)x0.7。大白一般在30平方厘米左右。根据猪的瘦肉率来看,瘦肉率高眼肌面积就大。表6-1某猪场50头肥猪的5项性状资料序号瘦肉量(kg)眼肌面积(cm2)腿肉量(kg)腰肉量(kg)椎骨数(个)115.0223.735.491.2128212.6222.344.321.3530314.8628.845.041.9229413.9827.674.721.492951

60、5.9120.835.351.5629612.4722.274.271.529715.827.575.251.8528814.3228.014.621.5129913.7624.794.421.46291015.1828.965.31.66281114.225.774.871.64281217.0723.175.81.9281315.428.575.221.66301415.9423.525.181.98261514.3321.864.861.59291615.1128.955.181.37281713.8124.534.881.39271815.5827.655.021.66291915.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论