生物统计学作业_第1页
生物统计学作业_第2页
生物统计学作业_第3页
生物统计学作业_第4页
生物统计学作业_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学作业

第一章概论

习题1.1答:

(1)生物统计学(biostatistics)-----是数理统计在生物学研究中的应

用,它是

应用数理统计的原理和方法来分析和解释生物界各种现象和试验调

查资料的一

门学科,属于应用统计学的一个分支。

(2)主要内容内容有:

试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设

计的方法;

统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差

分析、回归

和相关分析、协方差分析等。

(3)生物统计学的作用:

①提供整理、描述数据资料的科学方法并确定其特征;

②判断试验结果的可靠性;

③提供由样本推断总体的方法;

④试验设计的原则。

习题1.2答:

(1)总体(popilation):研究对象的全体,是具有相同性质的个体所

组成的集

合;

(2)个体(individual):组成总体的基本单元;

(3)样本(sample):由总体中抽出的若干个体所构成的集合,当n>30

时属于大

样本,n<30属于小样本;

(4)样本容量(samplesize):样本中个体的数目;

(5)变量(variable):又称变数,是相同性质的事物间表现差异性的

某项特征;

(6)参数(parameter):也称参量,是描述总体特征的数量;

(7)统计数(statistic):描述样本特征的数量。由于总体一般很大,

有时候甚

至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计

数来估计总

体的参数;

(8)效应(maineffect):“主效”的简称;由因素而引起试验差异的

作用;

(9)互作(Interactioneffct):两个或两个以上处理因素间的相互作

用产生的效

应;

(10)试验误差(experimentalerror):也叫误差,是指试验中不可控

因素所引

起的观测值偏离真值的差异。

习题1.3答:

随机误差(random)也称抽样误差或偶然误差,他是有实验中许多无法

控制的

偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免

的。随机误

差可以通过增加抽样或试验次数降低随机误差,但不能完全消除随机

误差。

系统误差(systematic)也称为片面误差,是由于实验处理以外的其他

条件

明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些

相对固定的

因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验

过程中是

可以避免的

习题1.4答:

准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标

或性状的

观测值与其真值接近的程度。精确性(precision)也称精确度,指调

查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。准确

性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来

衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异

程度的大小来衡量。

第二章试验资料的整理与特征数的计算

习题2.1

答:对于一组大小不同的数据划出等距的分组区间(称为组距),然后

将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表

式。这种统计表称之为次数分布表。

次数分布图就是在次数分布表的基础上,把次数分布资料画成统计图

形。

制表和绘图的基本步骤是:(1)求全距;(2)确定组数和组距;(3)

确定租限和组中值;(4)分组,编制次数分布表,或根据需要绘制条形图、

饼图、直方图等。

习题2.2

xl+x2++xn

n答:如果有n个数:xl,x2,?xn,那么这组数据的平均数x=,

这个平均数叫做算术平均数。

一般地,对于fl个xl,f2个x2,?,fn个xn,共fl+f2+?+fn个数

组成的xlfl+x2f2++xnfn

fl+f2++fn—组数据的平均数为。这个平均数叫做加权平均数,其中

fl,f2,?,fn叫做权,这个“权”,含有权衡所占份量的轻重之意,

即fi(i=l,2,?k)越大,表明xi的个数越多,“权”就越重。

算数平均数是加权平均数的一种特殊情况(当各项的权相等时),由

于它们都反映的是一组数据的平均水平,所以实质上是一样的。

习题2.3

答:平均数(mean)的用处有:

①平均数指出了一组数据资料内变量的中心位置,标志着资料所代

表性状的数

量水平和质量水平;

②作为样本或资料的代表数据与其它资料进行比较。

平均数的特性是:①离均差之和等于零;②离均差平方和为最小。

标准差(standarddeviation)的用处:

①标准差的大小,受实验或调查资料中多个观测值的影响,如果观

测值与观测

值之间差异较大,其离均差也大,因而标准差也大,反之则小;

②在计算标准差时,如果对各观测值加上火减去一个常数a,标准差

不变;如

果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了

a倍;③在正态分布中,一个样本变量的分布可以作如下估计:x土s内的

观测值个数约占观测值总个数的68.26%,x±2s内的观测值个数约占总个

数的95.49%,

x±3s内的观测值个数约占观测值总个数的99.73%。

标准差的特性:

①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均

数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的

大小判断平均数代表性的强弱;

②标准差的大小可以估计出变量的次数分布及各类观测值在总体中

所占的比例;③估计平均数的标准误,在计算平均数的标准误时,可根据

样本标准差代替总体标准差进行计算;

③进行平均数区间估计和变异系数的计算。

习题2.4

答:总体和样本的平均数都等于资料中各个观测值的总和除以观测值

的个数所得的商。二者区别在于,总体平均数用口表示,U=£x/N,公

式中分母为总体观测值的个数N,样本平均数用x=£x/n,公式中的分母

为样本观测值的个数no样本平均数是总体平均数U的无偏估计值。

总体和样本的标准差都等于离均差的平方和除以样本容量后的方根。

二者的区别在于,总体标准差用。表示,。

=,分母上总体观测值的个数N,标准差用s表示,,分母上是样本自

由度n-lo样本标准差s是总体标准差。的无偏估计值。

习题2.5

习题2.6答:

男子血清总胆固醇次数分布直方图

30

25

20

15

10

5

2.533.544.555.566.57

7.5

男子血清总胆固醇次数分布多边形图

30

25

20

15

10

5

2.753.754.755.756.75

由直方图和多边形图像可以得出结论:该地区30-40岁健康男子血清

总胆固醇在

2.50-7.50(mol/l)之间的分布呈现两头少中间集中的规律,即

3.50-6.00(mol/l)之间较为普遍。

习题2.7答:

由SPSS统计分析可知:

平均数=4.7398

标准差=0.86616

变异系数:CV=(s/x)*100%=(0.86616/4.7398)*100%=18.27%

习题2.8答:

由SPSS统计分析可知:

中值(即中位数)=4.6600,与平均数=4.7398比较可知:样本数据中

存在许多较大的极端值。

(1)相同点:都是用来描述数据集中趋势的统计量;都可用来反映

数据的一般

水平;都可用来作为一组数据的代表。

(2)不同点:均值反映了一组数据的平均大小,常用来代表一般数

据的总体平均水平。中值像一条分界线,将数据分成前半部分和后半部分,

用来代表一组数据的“中等水平”。

均值由于和每个数据都相关,比较可靠和稳定,反映出来的信息最充

分。既可描述一组数据本身的整体平均情况,也可用来作为不同组数据比

较的一个标准。中值可比性比较差,因为他只利用了部分数据。

习题2.9答:

由SPSS统计分析结果可知:

单养平均数为:x=42.70(kg);单养极差为:区=极大值一极小值

=55-25=30(kg);

单养标准差为:S=7.078(kg);单养变异系数为:CV=s/x*100%

=16.58%混养平均数为:x=52.10(kg)混养极差为:R=69-39=30(kg);

混养标准差为:S=6.335(kg);混养变异系数为:CV=s/x*100%=12.16%

从单养和混养的贻贝重量数据可以看出,混养贻贝平均重量大于单养。二

者极差相等,说明最大值、最小值差距相等。但单养的标准差和变异系数

都大于混养,说明单养贻贝的重量的整齐度没有与海带混养整齐度高。以

上结果表明,贻贝与海带混养效果较好。

第三章概率与概率分布

习题3.1

答:在一定条件下必然出现的事件叫必然事件;相反,在一定条件下必

然不出现的事件叫不可能事件;而在某些确定条件下可能出现,也可能不

出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C下21天会

孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做

血样化验,结果可能为阳性,也可能为阴性,这是随机事件。

习题3.2

答:事件A和事件B不能同时发生,即A2B=V,那么称事件A和事件

B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、。型、

AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有

一个发生,但二者不能同时发生即A+B=U,A2B=V,则称事件A与事件B为

对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的

发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A

与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。

习题3.3

答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A

发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验

次数n不断增加

时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事

件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概

率。

习题3.4答:正态分布是一种连续型随机变量的概率分布,它的分布

特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减

小,即中间多,两头少,两侧对称。U=0,。2=1的正态分布为标准正态

分布。

正态分布具有以下特点:

1

①、正态分布曲线是以平均数H为峰值的曲线,当x=u时、f(x)取最

大值02n②、正态分布是以口为中心向左右两侧对称的分布;x-u

③、。;的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以

正态分布以x轴为渐近线,x的取值区间为(-8,+8);

④、正态分布曲线完全由参数口和。来决定

⑤、正态分布曲线在x=H土。处各有一个拐点;

⑥、正态分布曲线与x轴所围成的面积必定等于1。

正态分布具有两个参数口和。,U决定正态分布曲线在x轴上的中心

位置,口减小曲线左移,增大则曲线右移;。决定正态分布曲线的展开程

度,。越小曲线展开程度越小,曲线越陡,。越大曲线展开程度越大,曲

线越矮宽。

习题3.5答:

(1)P(0.3<H^1.8)=F(U=1.8)-F(U=0.3)=0.96407-

0.6179=0.34617

(2)P(-l<U^1)=F(U=1)-F(U=-1)=0.8413-0.1379=0.7034

(3)P(-2<RW2)=F(U=2)-F(U=-2)=0.97725-0.01831=0.95894

(4)P(-1.96<U^1.96)=F(U=1.96)一F(U=-1.96)=0.9750-

0.025=0.95

(5)P(-2.58<□W2.58)=F(U=2.58)-F(H=-2.58)=0.99506-

0.00494=0.99

习题3.6答:

(1)ul=x-u

a=-3-4

4=-1.75,U2=x-u

o4=4-=0,4

P(-3<xW4)=P(-1.75<U^0)=0.5-0.4=0.1

(2)口=x-u

0=2.4

4-4=-0.4,

P(xW2.4)=P(口W-0.4)=0.3446

(3)|i=x-u

a-4=-1.48=-1.374

P(x>-1.48)=P(P>-1.37)=1-P(U=-1.37)

=1-0.08379=0.916

(4)pi=x-u

o=-l

4-4=-1.25

P(x>-l)=P(U>-1.25)=1-P(U=-1.25)=1-0.1056=0.89

习题3.7答:

(1)F1代非糯杂合体Ww与糯稻亲本ww回交,后代非糯杂合体Ww

与糯稻纯合体ww各占一半,即概率均为0.5,故在后代N=200株中预期

糯稻和非糯稻均为0.53200=100(株)。

(2)F1代非糯杂合体Ww自交,后代非糯杂合体WW:非糯杂合体

Ww:糯稻杂合体ww=l:2:l,但表型非糯:糯稻=3:1,即非糯和糯稻的概

率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.2532000=500

(株),非糯稻应为0.7532000=1500(株)。

习题3.8答:

解:根据研究的目的基因,可将F2代分为纯合正常抗绣植株和非纯合

正常抗绣植株,且不同大麦出现该目的基因为独立的,同时出现纯合正常

抗绣植株的概率p=0.0036,非常小,故该题可用二项分布或泊松分布的概率

函数公式计算。

(1)X=np=200*0.0036=0,72,代入泊松分布概率函数公式:

P(X)=-0.72*x!xX=0,1,2?200

F2代出现纯合正常抗锈植株的各种可能株数的概率分别为:

P(0)=0.487

P(1)=0.350

P(2)=0.126

P(3)=0.030

P(4)=0.005

P(5)=0.001

P(X>6)=1-P(0)-P(1)-P(2)-P(3)-P(4)-P(5)

=1-0,487-0.350-0.126-0.030-0.005-0.001=0,001

出现6或6株以上纯合正常抗锈植株的概率总共为0.001,已经非常

小了,不必再一一计算。

(2)欲求P(X21)=0.99.则P(0)=0.01,即

P(X)=-入0

0!=0.01,

对两边求对数,则有:

n=4.605/0.0036=1279株

因此,希望有0.99的概率保证获得1株或1株以上纯合正常抗锈植株,

则F2代至少应种1279株。

习题3.9答:

解:小白鼠接种病菌后,要么生存要么死亡,个体间又相互独立,故

服从二项分布。设事件A为接种病菌后生存,由已知得P=0.425,n=5,x=4,

则“四生一死”的概率为:

P(4)=

习题3.10答:

(1)CPq4455-4=530.4253(1-0.425)1=0.0938x-u4U

Ul=x-uO=10-162=-3,U2=0-16=202=2,因而落于10到20之间的

数据的百分数为:P(10<x<20)=P(-3<U<2)=F(U=2)-F(H

=-3)=0.97725-0.00135=0.9759=97.6

(2)l=x-u

。16=12-=-2,U2=2x-u。-16=20

2=2,

因而小于12的数据的百分数为:

P(x<12)=P(U<-2)=F(U=-2)=0.02275=2.3%

大于20的数据的百分数为:

P(x>20)=P(U>;2)=1-F(U=2)=1-0.97725=0.02275=2.3%

习题3.11答:

⑴df=5时,P(tW-2.571)=0.05,P(t>4.032)=0.99;

(2)df=2时,P(xW0.05)=0.975,P(x>5.99)=0.95,22

P(0.05<x2<7,38)=0.95;

⑶dfl=3,df2=10时,P(FS3.71)=0.95,P(FM6.55)=0.99。

第四章统计推断

习题4.1

答:统计推断是根据理论分布由一个样本或一系列样本所得的结果来

推断总体特征的过程。统计推断主要包括参数统计和假设检验两个方面。

假设检验是根

据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两

种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一

定概率水平(或显著水平)上应该接受或否定的那种假设的推断。参数估

计则是由样本结果对总体参数在一定概率水平下所做出的估计。参数估计

包括点估计和区间估计。

习题4.2

答:小概率原理是指概率很小的事件在一次试验中被认为是几乎不可

能会发生的,一般统计学中常把概率概率小于0.05或0.01的时间作为小

概率事件。他是假设检验的依据,如果在无效假设H0成立的条件,某事

件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;如

果某事件的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接

受HAo

习题4.3

答::在假设检验中如果H0是真实的,检验后却否定了它,就犯了第

一类错误,即a错误或弃真错误;如果H0不是真实的,检验后却接受了

它,就犯了第二类错误,即8错误或纳伪错误。

假设检验中的两类错误是弃真错误和取伪错误。为了减少犯两类错误

的概率要做到:①显著水平a的取值不可以太高也不可太低,一般去0.05

作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增

加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,

减少两类错误。

习题4.4

答:区间估计指根据一个样本的观测值给出总体参数的估计范围给出

总体参数落在这一区间的概率。点估计是指从总体中抽取一个样本,根据

样本的统计量对总体的未知参数作出一个数值点的估计。置信度与区间估

计的关系为:对于同一总体,置信度越大,置信区间就越小,置信度越小,

置信区间越大。

习题4.5

解:(1)假设HO:口="0=2环,即新饲养方法与常规饲养方法所育对

虾体重相同。

对HA:UW口0;

(2)选取显著水平a=0。5;

X-U20-211.2o(3)检验计算:ox===0.12;u===-8.33;o0.12n

(4)推断:口分布中,当a=0Q5时,R0.05=1.96。实得U>1.96,

P<0.05,故在

0.05显著水平上否定H0,接受HA,认为新饲养方法的对虾体重与常

规饲养方法有显著差异。

由此可知,对虾体重的区间估计为:

Ll=x-uaa=20—1.9630.12=19.76(%),

L2=x+uaax=20+1.9630.12=20.24(%)

习题4.6

解:①建立无效假设:该测量结果和常规枝条氮含量无差别。

从SPSS数据输出可以看出,

自由度为df=9,t值为-0.371,双尾检验p=0.719>0.05,故接受无效

假设,认为该测量结果和常规树枝含氮量无差别。

习题4.7

解:(1)假设HO:U=H0=47.3g,即三化螟两代每卵块的卵数相同。

对HA:UW口0;

(2)选取显著水平a=0.01;

(3)检验计算:

sxl-x2=sls+2nln2

=22=25,4246.82+12869=6.07u=xl-x2

sxl-x247.3-74.9=-4.55;6.07

0.01(4)推断:现实得H>口=2.58,P<0.01,故否定HO,接受HA,

即三化螟两代

每卵块的卵数存在极显著差别,由于xl<x2,所以可以得出三化螟

第二代每卵块的卵数极显著高于第一代的结论。

习题4.8

解:(1)建立假设,认为北方动物比南方动物具有较短的附肢;

(2)SPSS数据分析(见文件)

(3)结果分析由SPSS数据输出表格可知,方差齐性检验F=0.355,

P=.561>0.05,故接受假设,认为北方和南方动物附肢无差别。

习题4.9

解:(1)建立假设,认为中草药青木香没有降低血压的作用。(2)

SPSS数据分析操作(见文件)

(3)由表格的内容可知,治疗前后,t=5.701,df=12,P=0<0.05,

所以拒绝假设,认为治疗前后有明显的疗效。

习题4.10

解:(1)建立假设,认为A、B两种病毒对药草的致病力一样。(2)

SPSS数据分析操作(见文件)

(3)由表格的内容可知,接种A、B两种病毒后,t=2.625,df=7,

P=0.034<0.05,所以拒绝假设,认为A、B两种病毒对药草的致病力不一

样,有显著差别。

习题4.11

(1)假设HO:pWpO,即该批棉花种子不合格。对HO:p>pO。(2)

确定显著水平a=0.05.

x77?==(3)检验计算:q=l-p=l-0.80=0.20,p=0.77,nlOO

op?=

pq0.80?0.20

==0.04,uc=nlOO

?'P-P

ap?

0.50.5

0.77-0.80-n==0.625

0.04

(4)推断:由于RC<U0.05=1.64,P>0.05,故接受HO,认为这

批棉花种子不合格。

(5)由上可知,置信度为95%的棉花种子发芽率的区间估计为:

0.5

?-|iaopLl=p=0.77-1.9630.04-=0.69?

1000.5

?+|iaopL2=p=0.77+1.9630.04+=0.85?

100

习题4.12

解:(1)假设H0:即两医院乳腺癌手术后5年的生存率间没有显著差

异;HA:即两医院乳腺癌手术后5年的生存率间有显著差异。

(2)确定显著性水平a=0.05

(3)计算统计量,经SPSS独立样本T检验得到如下结果:

⑷作出推断:由上表可知P=0.296>;a=0.05,故接受H0,否定HA;

即两医院乳腺癌手术后5年的生存率间未达著差异。

习题4.13

(1)建立假设,认为A、B两种饲料对鱼的体重增加量方差同质。(2)

SPSS数据分析操作(见文件)

所以接受假设,认为A、B两种饲料对鱼的体重增加量方差同质。

第五章X2检验

习题5.1

答:X2检验主要有三种用途:一个样本方差的同质性检验,适合性检

验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体

方差和给定总体方差是否差异显著;适合性检验是比较观测值与理论值是

否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关

联关系的假设检验。

习题5.2

答:X2检验的步骤为:

(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起,即观

测值=理论值;备择假设HA:观测值与理论值的差值不等于0,即观测值

W理论值(2)确定显著水平a,一般可确定为0.05或0.01

(3)计算样本的X2,求得各个理论次数Ei,并根据各实际次数Oi,代

入公式,计算出样本的x2。(4)进行统计推断

习题5.3

解:(1)H0:野兔性别比例符合1:1;HA:野兔性别比例

不符合1:1;

(2)确定显著性水平a=0.01

(3)计算统计量,经SPSS统计分析检验得到如下结果:

性别

雄性雌性总数

观察数

期望数

残差

(4)查X2值表,当df=l时,x20.01=6.63。

而经SPSS统计分析实际得至I」的的x2=5,881>x20.01=6.63

故应否定H0,接受HA,即认为野兔性别比例不符合1:1的比率。

习题5.4

解:(1)H0:大麦F2的芒性状表型符合9:3:4;HA:大麦

F2的芒性状表型不符合9:3:4;

(2)确定显著性水平a=0.05

(3)计算统计量,经SPSS统计分析检验得到如下结果:

卡方df渐近显著性

率。单元最小期望频率为116.3。

检验统计量

性状

.041a

a.O个单元(0.0%)具有小于5的期望频

(4)查X2值表,当df=2时,x20.05=5.99。

而经SPSS统计分析实际得到的的x2=0,041<x20.05=5.99,

故应接受H0,否定HA,即认为大麦F2的芒性状表型符合9:3:4。

习题5.5

解:(1)H0:这群儿童的性别比例符合1:1;HA:这群儿

童的性别比例不符合1:1;

(2)确定显著性水平a=0.05

(3)计算统计量,经SPSS统计分析检验得到如下结果:

检验统计量

卡方df渐近显著性

率。单元最小期望频率为373.5oa,O个单元(0.0%)具有小于5的

期望频

,性另I」1

12.082a

(4)查X2值表,当df=l时,x20.05=3.84。

而经SPSS统计分析实际得到的的x2=12.082>;x20.05=3.84,

故应否定H0,否定HA,即认为这群儿童的性别比例不合理,不符合

l:lo

习题5.6

解:(1)HO:这两种苹果耐贮性不同;HA:这两种苹果耐

贮性相同;

(2)确定显著性水平a=0.05

(3)计算统计量,经SPSS统计分析检验得到如下结果:

(4)查X2值表,当df=l时,x20.05=3.84。

而经SPSS统计分析实际得到的的x2>x20.05=3.84,

故应否定H0,接受HA,即认为这两种苹果耐贮性相同,没有显著差

异。

习题5.7

解:(1)H0:小麦的品种与赤霉病的发生无关;HA:小麦

的品种与赤霉病的发生有关系;

(2)确定显著性水平a=0.01

(3)计算统计量,经SPSS统计分析检验得到如下结果:

检验统计量

卡方

BCDE总数

df渐近显著性

a.KruskalWallis检验b.分组变量:小麦品种

健康患病

a,b

(4)查X2值表,当df=4时,x20.01=o13.28。

而经SPSS统计分析,x2=420.5>x20.01=13.28,P<0.01,

故应拒绝HO,接受HA,说明小麦的品种与赤霉病的发生有密切关系,

不同品种的小麦感染赤霉病的概率有差异。

习题5.8

解:(1)H0:灌溉方式的不同与叶片的衰老无关;HA:灌

溉方式的不同与叶片的衰老有关系;

(2)确定显著性水平a=0.05(3)计算统计量,经SPSS统计分析检

验得到如下结果:

灌溉方式1

叶片

3总数

2

N秩均值22

(4)查x值表,当df=2时,x0.05

而经SPSS统计分析实际得到的的x2=5,3<x20.05=5.99

故应接受H0,否定HA,说明三种类型的灌溉方式对叶片的衰老没有

影响。

第六章方差分析

习题6.1

答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。

(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为

处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从

而检验处理效应是否显著。

(3)方差分析的基本步骤如下:

a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由

度。b.列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。

c.若F检验显著,对个处理平均数进行多重比较。习题6.2

答:(1)多个平均数两两间的相互比较称为多重比较。

(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其

中最小显著极差法又有新复极差检验和q检验法。

(3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是

将全部平均数从大到小依次排列,然后在最大的平均数上标字母a,将该

平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之

相差显著的则标以字母b。再以该标有b的平均数为标准,与各个比它大

的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再

以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不

显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的

平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面

的平均数比较后为止。这样各平均数间,凡有一个相同标记的字母即为差

异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,

用大写字母标记。

梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行

比较。差数>;LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差

数的右上角标上“*”号;差数>LSD(LSR)0.01说明处理平均数间的差异

达到极显著水平,在差数的右上角标上“**”号。差数<LSD(LSR)0.05,

说明差异不显著。

习题6.3

答:方差分析有3个基本假定,即正态性、可加性和方差同质性。方

差分析有效性是建立在3个基本假定的基础上的。

因为通常情况下,在生物学研究中我们得到的样本数据是非正态性分

布,且有可能方差不同质,所以必须经过适当的数据转换改善样本数据,

才能进行方差分析。

习题6.4解:根据题目所给信息可知该题属于组内观测次数相等的单

因素方差分析,SPSS

理种子后,对芽长有极显著的影响。

a.将使用调和均值样本大小=3.000。

多重比较的结论:

用LSD法、SSR法、q法进行多重比较的结果是相同的,多重比较结

果表明,用氟化钠浸种后,与对照相比,芽长降低,其中10ug/g与对照

相比,差异不显著;对照与50ug/g,1001ig/g差异达到极显著水平;10

Ug/g与50ug/g差异达显著水平,与100Rg/g差异达极显著水平;50U

g/g与100口g/g差异不显著。

习题6.5解:根据题目所给信息可知该题属于组内观测次数不等的单

因素方差分析,SPSS方差分析,结果如下:

方差分析结果见下表:

由上述方差分析计算所得到的F值达到极显著水平,表明母猪对仔猪

体重存在极显著的影响作用。

习题6.6解:根据题目所给信息可知该题是两因素无重复观测值得方

差分析,可以分别对品种、室温这两个因素的效应进行分析,且品种、室

温均为固定因素,可依固定模型进行分析。

以家兔品种作为因素A,该因素有4个水平;以室温作为因素B,该

因素有7个水平,经SPSS统计分析结果如下:

多重比较(LSD检验)(1)品种间比较:

LSD检验结果表明,品种m与品种I、品种IV差异达极显著水平;品

种n与品种w差异达极显著水平。

多个比较

因变量:mg2

1

341

2

LSD

1

3

241

4

23

1

Dunnettt(双侧)

b

(I)家兔品种(J)家兔品种均值差值(I-J)标准误差Sig,95%置信

区间下限

上限

-18.0018.1418.0026.29-18.14-26.2918.1426.29********

34

444

23

基于观测到的均值。

误差项为均值方(错误)=91.798。*.均值差值在.05级别上较显著。

b.Dunnettt-检验将一个组当作一个控制,并将其他所有组与该组进行

比较。

LSD检验结果表明,品种HI与品种I、品种IV差异达极显著水平;品

种n与品种w差异达极显著水平。

(2)室温间比较

多个比较

因变量:mg30度25度20度

35度

15度10度5度35度25度

30度

15度10度5度35度

LSD

25度

15度10度5度35度30度

20度

15度10度5度35度

15度

30度25度

-30.75-40.75-56.00-31.00-16.00*****

(I)室温(J)室温均值差值(I-J)

25.0040.0058.2556.0027.5017.50-25.0015.0033.2531.00-40.00-15.0018.2516.

00-22.50-58.25-33.25-18.25******************

标准误差Sig,95%置信区间下限

上限20度

30度20度

25度

20度10度5度35度30度

10度

20度15度5度35度30度

5度

20度15度10度

35度30度

Dunnettt(双侧)

20度15度10度

基于观测到的均值。

误差项为均值方(错误)=91.798。*.均值差值在.05级别上较显著。

5度5度5度

b

-28.50-38.50-27.5030.7528.50-17.5022.5040.7538.50-22.50-40.75-38.50****

25度

25度

5度5度5度

25度

b.Dunnettt-检验将一个组当作一个控制,并将其他所有组与该组进行

比较。

LSD检验结果表明,35°C与25°C,20°C,15°C的温度差异均达

到极显著水平,与30°C,10°C,5°C的温度差异达到显著水平;30°C

与20°C,15°C的温度差异均达到极显著水平,与35°C,25°C的温度

差异达到显著水平,与10°C,5°C的温度差异不显著;25°C与35°C

的温度差异达到极显著水平,与30°C,20°C,15°C,5°C的温度差异

达显著水平,与10°C的温度差异不显著;20°C与35°C,30°C,10°

C,5°C的差异达到极显著水平,与25°C的温度差异达到显著水平,与

15°C的温度差异不显著;15°C与35°C,30°C,5°C的温度差异达到

极显著水平,与25°C,10°C的温度差异达到显著水平,与20°C的差

异不显著;10°C与35°C,20°C,15°C的温度差异达显著水平,与30°

C,25°C,5°C的温度差异不显著;5°C与20°C,15°C的温度差异达

极显著,与35°C,30°C,25°C,10°C的温度差异不显著。习题6.7解:

根据题目所给信息可知本题为有重复观测值的二因素方差分析,原料和发

温度均为固定因素,可按固定模型进行分析,以原料作为因素A,因

素A有3个水平;以发酵温度作为因素B,因素B有3个水平;每一个处

理均重复4次,实验共有36个观测值。经SPSS方差分析,得到如下结果:

经过方差分析可知:原料、温度间的差异均达极显著水平,原料X温

度的差异达显著水平。

多重比较(LSD检验)

温度的检验:

多个比较

1

习题6.8解:根据题目所给信息可知,此题为3因素方差分析,且3

个因素均为固定因素,可依固定模型进行分析,数据共有60个。经SPSS

方差分析,得到如下结果:X种子类型和处理时间X浓度X种子类型均达

极显著差异,而处理时间X种子类型未达

显著性差异。

第七章直线回归与相关分析

习题7.1

答:回归分析是用来研究呈因果关系的相关变量间的关系的统计分析

方法,其中表示原因的变量为自变量,表示结果的变量为因变量。回归截

距是当自变量为零时,因变量的取值,即回归线在y轴上的截距;回归系

数是回归直线的斜率,其含义是自变量改变一个单位,因变量y平均增加

或减少的单位数。

习题7.2

答:在直线回归中,依变量y的总变异(y-y)分解为两部分,一部分

是由于与

?-y)(即回归变异:由于受自变量x的制约自变量x的相关性所引起

的变异(y

所引起的变异);一部分是由于试验误差或其他未受控制的因素所引

起的变异

?),即剩余变异。(y-y

每一部分的平方和计算如下:

习题7.3

答:相关分析是用来研究呈平行关系的相关变量之间的关系的统计方

法。相关系数表示变量x与变量y相关的程度和性质,决定系数是相关系

数的平方,表示变量x引起y变异的回归平方和和占y变异总平方和的比

率,它只能表示相关的程度而不能表示相关的性质。

习题7.4

解:(1)根据题目所给信息,通过SPSS回归分析得到如下结果:

(2)回归系数的显著性检验

由上表可知,t=5.339;查t值表,当df=n-2=12-2=10时,t0.05(10)=2.228

即t=5.339>t(0.05)10=2.228,应否定HO:8=0,接受HA:BW0,即认为

该回归系数达极显著水平。

(3)该地区4月份下旬均温为18℃时,5月上旬50株棉蛇虫预期头数。

当x=18时,有:

y=-283.6799+18.0836x=283,6799+18.0836x18=41.8249^42

即当该地区4月份下旬均温为18℃时,5月上旬50株棉鲂虫预期头

数为42头。

习题7.5

解:根据题目所给信息,通过SPSS回归分析得到如下结果(如下表所

示)

y=-47.3530+0.2610x

(2)对所建立的直线回归方程进行显著性检验

假设H0:大白鼠进食量x与体重增加量y之间无线性关系;HA:

二者之间存在线性关系。将F检验结果列于表:

线回归关系,

(3)进食量为900时,即当X=9OOI3寸,y=187.5740,大白鼠的体

重95%置信区间:(166.6619,208.4861)

习题7.6

解:根据题目所给信息,通过SPSS相关分析得到如下统计结果:

相关分析结果表明,相关系数肩标“*”即为P<0Q5,差异是显著

的。

第八章可直线化的非线性回归分析

习题8.1

答:生物学中常见的曲线类型有倒数函数曲线、指数函数曲线、对数

函数曲线、基函数曲线、S型曲线等类型。

确定两个变量之间的曲线类型,常用的有图示法和直线化法:

(1)图示法是根据所获试验资料的自然尺度绘出散点图,然后按照

散点图的趋势绘出能够反映它们之间变化规律的曲线,并与已知曲线相比

较,找出与之较为相似的曲线图形,该曲线即为选定的类型;

(2)直线化法是根据散点图进行直观的比较,选出一种曲线类型,

并将原数据进行转换,将曲线方程直线化,用转化后的数据绘出散点图,

若该图形为直线趋势,即表明选取的曲线类型是恰当的,否则需要进行重

新选择。

习题8.2

答:非线性回归曲线进行直线化时,常用的方法有,直接引入新变量

和方程变换后再引入新变量两种方法。

⑴直接引入新变量的方法是直接引入新变量,从而使变量间为直线关

系;

(2)方程变换后再引入新变量的方法是将原曲线方程进行一定的数学

变换后,再引入新变量,从而使变量间为直线关系。

第九章抽样原理与方法

习题9.1

答:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选

一部分单位进行调查,并对全部调查研究对象作出估计和推断的一种调

查方法。

常用的抽样调查方法有随机抽样,顺序抽样和典型抽样。

随机抽样是指在抽样过程中,总体内所有个体都具有相同的被抽取的

概率。由于抽样的随机性,可以正确的估计试验误差,从而推出科学合理

的结论。随机抽样可分为以下几种方法:简单随机抽样,分层随机抽样,

整体抽样和双重抽样。⑴简单随机抽样的结果可用统计方进行分析,

从而对总体作出推断,并对推断的可靠性作出度量。适用于个体间差异较

小,所需抽取的样本单位数较小的情况。对于那些具有某种趋向或差异明

显和点片式差异的总体不宜使用。

⑵分层随机抽样是一种混合抽样。其特点是将总体按变异原因或程度

划分成若干区层,然后再用简单随机抽样方法,从各区层按一定的抽样分

数抽选抽样单位。分层随机抽样具有以下优点:

①若总体内各抽样单位间的差异比较明显,可以把总体分为几个比较

同质的区层,从而提高抽样的准确度;

②分层随机抽样类似于随机区组设计,既运用了随机原来,也运用了

局部控制原理,这样不仅可以降低抽样误差,也可以运用统计方法来估算

抽样误差。

⑶整体抽样是把总体分成若干群,以群为单位,进行随机抽样,对抽

到的样本作全面调查,因此也称为整群抽样。整体抽样具有以下优点:

①一个群只要一个编号,因而减少了抽样单位编号数,且因调查单位

数减少,工作方便;

②与简单随机抽样相比较,它常常提供较为准确的总体估计值,特别

是害虫危害作物这类不均匀的研究对象,采用整体抽样更为有利;

③只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。

⑷双重抽样是在抽样调查时要求随机抽出两个样本,涉及两个变量。

双重抽样具有以下两个优点:

①对于复杂性状的调查研究可以通过仅测量少量抽样单位而获得相

应于大量抽样单位的精确度;

②当复杂性状必须通过破坏性测定才能调查时,则仅有这种双重抽样

方法可用。

顺序抽样是按某种既定顺序从总体中抽取一定数量的个体构成样本。

抽样顺序的优点表现在:

①可避免抽样时受人们主观偏见的影响,而简便易行;

②容易得到一个按比例分配的样本;

③如果样本的观察单位在总体分布均匀,其取样个体在总体内分布较

均匀,这时采用顺序抽样的抽样误差较小。其缺点表现在:①如果总体内

存在周期性变异或单调增(减)趋势时,则很可能会得到一个偏差很大的

样本,产生明显的系

统误差;②顺序抽样得到的样本并不是彼此独立的,因此,对抽样误

差的估计只是近似的。通过顺序抽样的方法,不能计算抽样误差,估计总

体平均数的置信区间。

典型抽样是根据初步资料或经验判断,有意识,有目的的选取一个典

型群体作为样本进行调查记载,以估计整个总体。这种抽样方法完全依赖

于调查工作者的经验和技能,结果不稳定,且没有运用随机原理,因而无

法估计抽样误差。典型抽样多用于大规模社会经济调查,而在总体相对较

小或要求估算抽样误差时,一般不采用这种方法。

习题9.2=解:0.05

2L

2242L2=4*20.52=174.244174(头)该结果表明,随机调查174头仔猪,

就有的概率保证体重误差不超过

95%0.5kgo

习题9.3

解:根据题意,p=15%=0.15,则q=l-0.15=0.85.,允许误差L=3%=0.03。

计算样本容量:(只)

n=4pq4*0.15*0.85==566,67^567

22L0.03

结果表明,需要调查567只鸡,才有95%的可靠性达到允许误差为3%

的要求。

习题9.4

=d

以n=6,自由度df=6-l=5,t解:n=0.05d2224*232=5.92

比6(对)(0.05,5)

2=2.571,计算得:tn=2(0.05,5)d

2s=*3d222=9.78^10

以n=10,自由度df=10-1=9,t=2.2以,计算得:(0.05,9)

s=3d

以n=8,自由度df=8-l=7,t2n=t22(0.05,9)d2*22=7.57七8

(0.05,7)=2,,365,计算得:2

n=t2(0.05,7)d

2s=3d2*22=8.27七8

因此,需要8对实验鸡,才有95%的可靠度使平均数d在3枚以内。

习题9.5

解:以a=0.05,n>30,t0.05比2计算,则:n=20,0522

2(xl-x2)1,5(x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论