高级生物统计讲义全

上传人：文*** IP属地：河北上传时间：2023-07-10 格式：PDF 页数：134 大小：18.71MB 积分：12 举报 版权申诉

已阅读5页，还剩129页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

《高级生物统计》讲义

李远景

安徽农业大学理学院统计教研室

2006年

学分：2个总学时50（理论课29,SAS实验课21）

教学方法：1、各种分析方法适宜的试验资料

2、各种分析方法的分析目的

3、各种分析方法的分析思路

4、各种分析方法的具体分析方法主要通过SAS分析软件解决

第一讲生物统计学基础知识

第一节主要内容及重要

一、基本概念

1、生物统计学概念概念1：研究生物数量特征和数量变化规律的方法论学科。

量变—质变量变是基础，质变是必然

概念2：由样本推断总体的方法论学科。

试验研究的目的是为了获得总体的基本信息、基本特征。试验研究的方法则是抽样

研究，然后由样本的试验结果来推断总体的特征。样本-总体统计数f参数

'处理本身效应（总体效文）

处理的表面效应《

・试验误差效应

统计推断：利用概率论和抽样分布原理，（排除试验误差的影响）由样本结果推断总

体特征。

2、总体：具有相同性质的所有个体组成的集团（有限、无限总体）。

3、样本（随机）：由总体中随机抽取的部分个体组成的集团。

4、参数：由总体中的全部个体计算出的总体特征值，〃、b?、

5、统计数：由样本中的全部个体计算出的样本特征值，亢、$2、s。

二、主要内容和作用两方面：试验设计和统计分析关系：统计学原理为试验

设计提供合理的依据，而试验设计则是进行正确统计分析的前提。

1,试验设计科学地设计处理及处理和重复区组的科学的设置（排列）方法。

主要内容处理的确定、试验误差的控制、试验设计的原则、试验设计（的方

法）。

主要作用科学地设计处理和试验，把试验误差控制到最小的程度，获得准确

的试验结果。

2、统计分析基础统计显著性测验、方差分析、一元线性相关回归等

高级统计多因素方差分析、多元回归分析、通径分析、典型相关

分析、聚类分析、判别分析等。

主要作用科学地分析试验结果，排除试验误差的影响，真正发现事物的数

量特征和数量变化的规律。

第二节试验误差及其控制

一、试验误差的概念（随机误差）：试验结果因受随机因素的影响而与处理真

值的差异（不可完全消除，与人为差错不同）。

二、试验误差的主要来源1、试验材料本身固有的差异

2、试验操作管理技术水平不一致造成的差异

3、外界环境条件不一致造成的差异

三、试验误差控制的主要途径1、选择纯合一致的试验材料（可区组控制）

2、试验操作管理技术水平的标准化（可区组控制）

3、控制外界环境条件的差异（可区组控制）

第三节试验设计

一、试验设计的三原则1、重复其作用是估计和降低试验误差

2、随机化其作用是无偏估计试验误差，获得随机变量

3、局部（区组）控制其作用是最大程度地降低试验误差

二、区组设置的灵活性设置区组的原则：同一区组内尽可能相同，不同区组间可以存

在差异。所以在材料的应用、操作管理、外界环境条件的控制等均可采用区组控制手段。

第四节统计假设测验（差异显著性检验）

一、基本概念

1、适宜的试验资料（1）随机样本（2）统计数的抽样分布规律已知。

2、分析目的由样本推断总体（判断试验结果中的差异是由试验误差引起的还是由

真实差异引起的）。

3、分析思路对样本所属的总体提出假设（无效假设和备择假设），计算样本在无效

假设的总体中出现的概率，若概率大就接受无效假设；若概率小就否定

无效假设，接受备择假设。

4、分析方法:三大步.

5、小概率事件的实际不可能性原理概率很小的事件可以认为它在一次正常的试验中

是不可能发生的

应用：如果事先假设了一些条件，在这些假设的条件下若计算出某一事件为一小

概率事件，然而它在一次正常的试验中竟然发生了，则说明假设的条件不正

确，从而否定这个假设（接受另外一个相反的假设）。

二、统计假设测验的基本原理和方法

例原品种〃o=300公斤/亩，cr=75公斤/亩，新品种n=25,了=330公斤/亩。问新品

种的总体平均亩产量〃与〃0差异是否显著或是否相同？

（一）、提出统计假设对样本所属的总体提出假设（两个假设相对立）

1、无效假设"o：假设样本所属总体（特征值）相对已知或相比较的总体（特征值）

无自己的独特效用或相同（差异不显著），即“o：〃="o=3OO公斤/亩。含义：

Ay=30公斤/亩由试验误差造成（由其造成的概率很大）。

2、备择假设“小假设样本所属总体（特征值）相对已知或相比较的总体（特征值）

有自己的独特效用或不同（差异显著），即"八：〃。或"八：4H300公斤/

亩。含义：Ay=30公斤/亩由真实差异造成（而由试验误差造成的概率很小）。

（二）在"°假设为正确的假定前提下，研究抽样分布，从而计算出样本在“。假设的总

体中出现的概率。

》一出y-M5一〃。330-300。

u=--------=---=----=-----=2

在标准正态分布（〃）中P刎21.96）=0.05,问=2,、、0.05。说明在H。：

〃=〃。=300公斤/亩的总体中由随机抽样获得了=330公斤/亩的样本的概率0.05,或由

随机误差造成包=30公斤/亩这样大的差异的概率0.05,而由真实差异造成Ay=30公

斤/亩这样大的差异的概率则为P=0.95o

（三）根据“小概率事件的实际不可能性原理”作出应接受那种假设的推断。若概率

小，说明“°假设的条件不正确，从而否定接受说明试验结果中的差异由真实

差异造成的概率很大，或样本所属的总体确实与“°假设的总体显著不同，称为差异显著；

若概率大，则接受“0,称为差异不显著。

本例闷=2〉1.96,、、0.05,否定a。，接受“八：〃片〃°，差异显著。

显著水平a：用来进行假设测验的小概率标准。a=0.05（M0（）5=I.96）,a=0.01

（〃＜如=2.58）。显著水平a选用的规则：统计上达显著，实际上又有一定的应用价值。

（1）若试验误差较大，精确度较低，应选低水平c=0.05

（2）若试验误差较小，精确度较高，应选高水平a=0.01

第五节方差分析

一、基本知识

1、方差分析：利用方差（变异量）分析因素间相对重要程度的数学方法。

2、适宜资料：多个处理（单、多因素）差异性比较试验；不同因素间变异程度

（重要程度）的假设测验。

3、分析目的：通过方差差异的显著性测验，判断出因素间的相对重要程度。

4、分析思路：任何事物都受多种因素的影响，其中起重要作用的因素引起的变异

（方差）就大；起次要作用的因素引起的变异（方差）就小；而它们的

变异（方差）如果能显著大于试验误差引起的变异（方差），则说明该

因素的作用（效应）是显著的；否则就不显著。

三、分析方法：三大步骤

例有一6（K=6）个处理（A、B、C、D、C、E）的比较试验，3（N=3）次重复，

随机区组设计，试验设计排列图和试验结果如下：

E4A2D3B2F2C3区组1

B3F2C3D4A1E3区组2

F2C3A3E5B4D5区组3

处理区组1区组2区组3

A21362

B23193

C33393

D345124

E435124

F22262

1616227'=54

进行方差分析并解释方差分析结果。

对一个资料进行方差分析，首先要分析引起该资料数据发生变异的原因。

总变异=区组间变异+处理间变异+误差变异

由于方差S2=3\所以方差分析的第一步就是平方和SS和自由度DF的分解。

（一）、平方和SS和自由度DF的分解：即把一个资料的总变异的平方和SS和自由

度DF分解为各因素及误差因素的平方和SS和自由度DF。

平方和SS的分解式：

Nkkn

-冽2=Kt(%-守+这(%—歹)2+£t(y—/_勇+歹)2

1i11

总变异SST二区组间变异SSr+处理间变异SSI+误差项变异SSe

自由度DF的分解式：总自由度DFT二区组自由度DF「+处理自由度DFt+误差自由度DFe

(kn-1)=(n-1)+(k-1)+(n-l)(k-l)

T2542「

C=—=——=162S,=5V-C=182—162=20

kn6x3乙

SS,=^-^-C=12SS=SS-SS-SS,=4

SS,不一C=4eTr

（二）、列方差分析表，进行F测验

单因素随机区组设计方差分析表（固定模型）

变异来源DFSSMSFFO.05Fo.oi

区组间2425.0*4.107.56

处理间5122.46.0**3.335.64

误差项1040.4

总变异1720

F测验表明（1）区组间差异显著，说明区组控制误差效果显著

（2）处理间查验及显著，需多重比较以明确各处理间的差异性。

（三）、多重比较（多个处理间差异性测验）

常用的有三种方法LSD发、SSR法和Q法，本例采用SSR法：SE==0.37

P23456处理0.050.01

SSR（）,O53.153.303.373.433.46D4aA

SSRO.OI4.484.734.884.965.06E4aA

LSR0.051.171.221.251.271.28B3abAB

LSRO.OI1.671.751.811.841.87C3abAB

A2bB

F2bB

多重比较表明：DEBC间差异不显著，AF间差异不显著，但D、E与A、F间差异及显著。

第六节一元线性相关回归分析

一、基本知识

1、适宜资料：两个变量间呈线性相关回归关系的试验资料

2、分析目的：分析一个自变量对一个依变量的影响是否呈显著的线性相关回归关

系，若显著，建立线性回归方程（模型），用以预测和控制.

3、分析思路：若变量间的关系呈线性变化，则可利用最小平方法原理用一个线性方

程配合该变化关系，若回归变异显著大于误差变异，说明自变量对依变量的线性影响是显著

的，否则它们的线性关系就不显著。

二、分析方法

例江苏武进县连续9年测定三月下旬至四月中旬旬平均累积温度和一代三化螟盛

发期的关系（y以5月10号为0）的数据，问X对Y是否呈显著的线性相关回归影响？

x累积温度35.534.131.740.336.840.231.739.244.2

y盛发期12169273139—1

基本统计量：

VariableNMeanStdDevSumMinimumMaximum

x937.077784.25199333.7000031.7000044.20000

y97.777785.5852070.00000-1.0000016.00000

（一）、绘制散点图，判断关系趋势类型

xvs.ysocres

Plotofy*x.Symbolusedis'.

20+

10+**

0+*

H------------------+------------------+------------------+------------------+------------------+------------------+-

30.032.535.037.540.042.545.0

本例的散点图基本呈线性趋势

（二）、计算相关系数并进行相关关系的显著性测验

相关系数：表示变量间相关性质和密切程度的统计数，或回归平方和占总平方和比例

的平方根。Z（y一9）2=Z（夕一A）?+Z（y-沙2

即y的总变异SSLX引起的回归变异u+误差引起的离回归变异Q

-159.0444

-0.8371

Z（y-刃J144.6356*249.5556

查表。⑺=0-798,M=O.8371〉6OI（7）=O.798表明相关极显著（同一个资料相关

显著回归必显著，相关的显著性测验可以查表进行）。

/=（-0.8371）2=07008=70.08%表明在y的总变异中因x的作用引起的变异占

70.08%«

TheSASSystem

TheCORRProcedure

PearsonCorrelationCoefficients,N=9

Prob>|r|underHO:Rho=0

x1.00000-0.83714（0.0049）

y-0.83714（0.0049）1.0000

相关极显著

（三）、建立线性回归方程：主要是利用最小平方法建立直线回归方程。

如果变量间呈直线关系，希望用一直线方程y=a+bx来描述它们的关系，建立

方程的原理为最小平方法：各观察值（点）与直线上对应值（点）的距离（之差）平方之和

为最小：0=z（y—$）2=Z{y—1+法）F=最小，先求偏导数建立方程组：

Z孙一工工枷

即可求出6=,a=y-bx

々Zx+bZx?=2孙2>2-（2>）%

20+

30.032.535.037.540.042.545.0

=fxy-fRnsp-159.0444

b===-1.0996[天/(旬.度)]

/Ex、(EM/”F=1好6356

a=y-bx=7.7778-（-1.0996x37.0778）=48.5485（天）

下面是采用F测验检验回归关系的显著性：如果因x引起的回归变异（方差U）能显著

的大于误差引起的离回归变异（方差），即回归关系显著，否则就不显著

回归方差_回归平方和"/回归自由度1

一离回归方差一离回归平方和0/离回归自由度（九-2）

TheSASSystem

TheREGProcedure(Model:MODEL1)

DependentVariable:y

AnalysisofVariance

SumofMean

SourceDFSquaresSquareFValuePr>F

Model1174.88878174.8887816.400.0049

Error774.6667810.66668

CorrectedTotal8249.55556

F测验表明一元线性回归极显著

RootMSE3.26599R-Square0.7008

DependentMean7.77778AdjR-Sq0.6581

CoeffVar41.99128

TheSASSystem

TheREGProcedure(Model:MODEL1)

DependentVariable:y

ParameterEstimates

ParameterStandard

VariableDFEstimateErrortValuePr>|t

Intercept148.5493210.127794.790.0020

X1-1.099620.27157-4.050.0049

一元线性回归方程为：y=48.5493-1.0996X

（四）、绘制直线回归图

y=48.549-1.0996x

17.5-

15.0-

12.5-

10.0-

k7.5-

5.0-

2.5'

o.o-

-2.5'

y=48.549-1.0996x

■+

十

十+

十

3032343638404244

+为实际点+为95%上限点+为95%下限点

第二讲逐步回归分析

STEPWISEREGRESSIONANALYSIS

基本知识：

一、适宜资料：多个自变量对一个依变量的影响呈线性回归模型的多变量资料。

二、分析目的：建立多元线性回归方程，分析多个自变量对一个依变量的综合作用及各

自变量的绝对作用（bi）,从而发现规律，以利预测和控制。

三、分析思路：将偏回归平方和（作用）最大且显著的自变量依次（逐步）引入回归方

程，同时在每步中剔除不显著的自变量，直至既无显著的自变量可引入，又无不显

著的自变量可剔除为止，这时的回归方程即为最优回归方程，即''有进有出”的思

路。

“最优”：回归方程中只包含所有有显著影响的自变量。

四、分析方法：主要采用消元变换法解相关阵，共有六步（见后）。

在多元线性回归分析时，为建立一个较为简化又能准确预测依变量的最优回归方程，通

常是逐个剔除复回归方程中经检验对y影响不显著的所有自变量。这种先全部引入，后逐个

剔除的方法，也是建立最优回归方程的一种分析法。此类分析法还很多，它们多适用于自变

量个数较少，或大多数自变量对y有显著影响的资料分析。否则，计算量将大大增加。目前

较为常用的逐步回归分析法是按自变量与y影响程度的大小，逐个地由大至小将自变量引入

回归方程。而每引入一个自变量，都要对方程中的各个自变量作显著性检验。检验时先选偏

回归平方和最小的自变量进行检验，若为显著，余者皆为显著；若检验差异不显著，即从方

程中剔除，直至留在方程中的自变量均检验为显著后，再引入另一个与y影响最大的变量，

并进行显著性检验。如此反复，直至没有自变量可再被引入，而方程中所有自变量均与y

存在显著的线性关系为止。

第一节逐步回归分析的基本方法

逐步回归分析的基本方法可以通过一个实例介绍其分析步骤。

例1为考察舍内干球温度（X1）、湿球温度（X2）、露点温度（X3）、相对湿度（X4）及

舒适度指数（X5）对罗曼蛋鸡产蛋率（y）的影响。随机抽测12个位点各64只鸡在56—67

周令的平均周产蛋率如表1—1。

表各变量的观察值、平均数及标准差n=12

周令X1，℃X2，℃X3，℃X4，%X5y,%

5622.116.713.358.468.670.9

5717.412.69.058.662.266.7

5820.115.712.560.266.464.3

■■■।■।

■1■।■।■1।1।।(

6513.89.45.258.057.360.5

6613.09.46.460.456.760.5

6713.410.78.371.258.058.9

X17.213.310.364.462.563.4

S4.13.84.47.05.63.8

一、计算相关系数阵

1、计算各变量的平均数（为表1—1）

设自变量XI，X2,…，Xm与依变量y存在线性关系，m元线性回归方程为：

5=仇＞+仇西+b2x2+…+bmxm（1—1）

%=y一aX—-----b“K（1—2）

若有n对观察值：

Xkl，Xk2，…，Xkm，yk，k=l,2,…，H

则各变量平均数：

X=^Hxkii=l,2,•••,m（1—3）

y=ity^（1—4）

本例计算结果列于表1—1。

2、计算离差阵

自变量平方和SSi，自变量间及其与依变量间的乘积和SPij及SPiy由下式算出：

SSj=Z（Xh——吊）2=Zx京一（2q）2/〃（1-5）

xxxn

SF-j=Y（xki-Xj）（xkj-Xj）=Y^kikj-kikjI-j=L2,…,m,i#j（1-6）

SPR=Z（x*j-万）（y*-50=Zxkiyk-Zxki^yk/n（1—7）

同一元线性回归分析一样，多元线性回归方程的建立也必须使离回归平方和最小即

Q=Z（y-"=Z{y-3+优（％-用）+打（%2-元2）+…-•+超风一猊）］}2=

Zb'一»一伪（王一石）一打（工2一反）一“…•一〃”（/—吃,）『=最小,

若令y==xi-xt,X2=x2-x2,……,Xm=xin-xm,则有：

0=工（丫_仇*1_a乂2_.…..-b,nXj=最小

要使。为最小，就必须使也、b2..............bm的偏微分方程皆等与零，即有:

粉一.fxfXz-••…f,xM=o

半=一2工(”力因—犷2一.•….一犷,“凡=0

祟=—2工(iXiX?-••…fX.JX/0

经整理可得方程组：

仿..….+〃“ZX|X,,=Zx，

4ZX1X2+b?£x；+….+"ZX2X,“=Zx?y

仿ZX|X,,+b^x2xm+.•….+a，Zx：=Zx,J

由于

SS|=£X；,SS2=£x；,......,SSm=£X;；SP[2=£X\X2,......,SP[m

SP2m=E2,^……；SPi、,=ZX",......,SPmy=£XmY

于是可得正规方程组：

ss®+spl2b2+…+spXmbm=sply

S〃2也+SS2b2+•••+SP2mbm=Sp2y

<k1一Q)

SP”M+Sp“,力[+…+SS,力“，=SP,”

本例m=5,n=12算得：

184.9〃]+167.6%+184.8/+72.20〃+251.1%=135.6

167他+158.8%+181.6%+125.3“+232.5仇=105.1

,184.8仇+181.662+212.94+188.3〃+261.3%=103.4(1—9)

72.20仇+125.3%+188.3/+539.0%+141.2/=一77.5

251.14+232.5%+261.3%+141.2/+344.9d=171.5

3、计算相关系数阵

在逐步回归中，为便于计算和表达，通常将离差阵化为相关阵，计算公式为：

rij=spij/(ssissj),/2i、j=l,2,…，m,y(1—10)

可为X1，X2，…，xm,y间的相关系数，且「产1,于是正规方程组(1—8)可改写为：

AlPl+ri2P2+.・・+%〃P，〃=、y

0]〃]+02P2+・..+马〃，〃，〃二弓)，

GlPl+小2〃2+…+小,〃亿〃=Gy

本例由公式(1-10)算得:

Pi+0.9762P2+0.9312%+0.2287P4+0.9944/75=0.7910

0.9762Pl+〃2+09875凸+0.4283P4+0.9936P5=0.6615

,0.9312/?,+0.9875P2+p3+0.5557p4+0.9642P5=0.5615(1—12)

0.2287P1+0.4283p?+0.5557py++0.3275=—0.2648

0.9944p1+0.9936p2+0.9642p3+0.3275p4+p5=0.7325

方程组(1-12)中的p与方程组(1-8)中bi间的关系为：

bi=piSy/Sxii=l,2,…，m(1—13)

式中S》,Sy为各自变量、依变量的标准差。

二、确定显著的F检验水准

为引入有显著作用的自变量，在进行逐步回归计算前，先要确定显著的F检验水准，作

为引入或剔除变量的标准。F检验水准要根据具体情况而定。一般地，为使回归方程中包含

较多的自变量，显著水准a不要定的太小。显著水准F的取值与自由度有关，而且在逐步回

归的分析中，由于自变量引入和剔除的变化，其剩余自由度也在不断变化，若样本的观察数

为n,自变量的个数为m,则剩余自由度为n-m-1。如果n相对较大，m与n就相差较大。

m个自变量被引入的个数的多少对剩余自由度的影响也就不会太大。此时可确定一个固定的

F检验值，不必每次查表更换之。但本例n=12,m=5,剩余自由度分别为6、7、8、9、10。

其F值相差不太大，故可选一个共用检验的F值，作为引入和剔除自变量的标准。同时也

要注意显著水准a的选定，不能太小，如本例可选a=0.，Fo.s6)=3.78。亦可指定F值，

如本例为F=5»

三、选取自变量

由(1-12)式得相关阵R(°)：

’10.97620.93120.22870.99440.7910、

0.976210.98750.42830.99360.6615

0.93120.987510.55570.96420.5615

R(0)=

0.22870.42830.555710.3275-.2648

0.99440.99360.96420.327510.7325

k0.79100.66150.5615-.26480.73251>

1、引入第一个自变数

(1)对5个自变量计算偏回归平方和，各自变量的偏回归平方和5为：

ui=rfy,rai=l,2,…，5(1—14)

以5值的大小作为被引入回归方程后对方差的贡献，Ui最大的值是对方差贡献最大的自

变量。该自变量应优先引入回归方程。本例为：

一=［展于/谓)=0.79102/1=0.6257

式中右上角括号内1和0分别表示第一次计算以及相关系数来自R⑼阵中的元素。以

下的意义均同。以此类推又有：

碎=［琛)］2/例=066152/1=0.4376

说"=［瑞丁/嘤=0.56152/1=0.3153

*=［嚓］2/蜡=(-0.2648)2/1=0.0701

公1）=［琮］2/或））=073252/1=0.5366

由上述计算知，“，⑴中以X1为最大，故先引入XI。

（2）对如引入回归方程是否显著进行F检验

其计算公式为：

Fi=Ui/[(1-Eui)/(n-1-1)](i=l,2,…，m)(1—15)

(或E=[(ry-uj)/(n-1-1)])»本次引入K为1,L为0。

F|=U]/[(1-wf0)/(12-1-1)]=0.6257/[(1-0.6257)/10]=16.72

B>5,故差异显著，可引入回归方程。

（3）剔除或引入一个自变量Xk后，相关系数阵R（L）=（堵）按下列公式进行消去变换，而

成R（w）=（浮）

〃片=1/曜

尸(/+1)_/)//)

©一'kj/rkk（i）

V(16)

伊=-蹙/琳（2女）

〃=琛）-蹙碍7以a、/，）

由于引入XI，故按上式K+1,L=0时把R⑼变换为R⑴。

。0.97620.93120.22870.99440.7910、

-0.97620.0470340.0784630.2050430.022867-0.110674

-0.93120.0784630.1328670.3427350.038215-0.175079

D(l)—

K—

-0.22870.2050430.3427350.9476960.100081-0.445702

-0.99440.0228670.0382150.1000810.011169-0.055040

、—0.7910-0.110674-0.175079-0.445702-0.054070.374319)

2、引入第二个自变量L=1

（1）计算各自变量偏回归平方和，按（1-14）式算得：

公”=[媪)]2/解)=07912"=06257(已选)

»<2)=啰『/理=(-0.110674)2/0.047034=0.2604

齿2)=畤]2/感)=(-0.175079)2/0.132867=0.2307

«<2)=[或『/瑁，=(一0.4457。2)2/0.947696=。.2096

心2)=屋；)了/或)=(-0.05407)2/0.011169=0.2618

由于方程中仅含一个自变量XI。而它是前一步刚选入的，不可能立即被剔除，故无须

作检验而直接引入贡献最大的U5⑵，即X5.

（2）对X5引入回归方程，进行F检验，按（1-15）式算得：

F5="?/［（1--up）/（n-2-1）］=0.2618/（（1-0.6257-0.2618）/9］=20.94

=us2)/【(fyy-us2))/(n-2-1)]=0.2618/[(0.3743-0.2618)/9]=20.94

F5>5,差异显著，可把X5引入回归方程。

（3）引入X5后，按（1-16）式进行消去变换，使R⑴变换成R⑵。

(89.533563-1.069698-2.471164-8.681726-89.321435.604968、

1.0696980.0002170.0002230.000141-2.0473630.000027

2.4711640.0002230.0021330.000305-3.4215240.009923

8.6817260.0001410.0003050.05091-8.9606050.038798

-89.0321432.0493633.4215248.96060589.53353-4.841078

1-5.6049680.0000270.0099230.0387984.8410780.1125619,

(4)对引入XI，X5进行显著性检验

先算出各偏回归平方和及剩余平方和：

“f)=［咕?产/(：)=56049682/89.533563=0.3509(己选)

必3)=［琮］2/皮)=0.0000272/0.000217=0.000003

.)=［啜］2/号)=0.0099232/0.002113=0.0466

=［嚓F/瑞)=0.0387982/0.05091=0.0296

母)=屋；)］2/或)=(-4.841078)2/89.53353=0.2618(已选)

剩余平方和Q(2)=八甲=0.1125

—yy

F=uf/［。⑵/(n-2-1)］=0.2618/(0.1125/9)=20.94

•••-3)>母)，.•.Fl>F5>5,差异均显著,XI、X5不被剔除。

3、引入第三个自变量L=2,除X1,X5外，数U3⑶最大，故引入X3。

(1)对X3引入回归方程是否显著进行F检验

F3=uf/［(Q⑵-M*)/(n-3-l)］=0.0466/［(0.1125-0.0466)/8］=5.68

F3>5,差异显著，可把X3引入回归方程。

（2）引入X3后，应对R⑵进行消去变换，即将R⑵变换为R⑶。变换后的R⑶如下:

/2979.57196-0.8088991169.50497-8.325026-4090.5215017.209967、

0.8088990.000193-0.1055370.000109-172.940585-0.001020

1169.504970.105537473.2607670.144345-1619.2730714.696167

R⑶二

8.3250260.000109-0.1443450.050866-8.4667270.037366

-4090.52128172.940585-1619.2730718.4667275629.90709-20.90913

1-17.209967-0.0001020-4.6961670.03736620.909130.06596电

4、引入第四个自变量L=3

（1）计算各偏回归平方程和

靖）=［偿］2/甫）=17.209972/2979.57196=0.0994（已选）

=［以）『/瑙）=（_o001020）2/0.000193=0.00005

“£）=⑹）［2/瑁）=46961672/473.260767=0.0466（已选）

“伊/瑙）=00373662/0.050866=0.0274

大町==（-20.90913）2/5629.90709=0.0777（已选）

剩余平方和Q⑶=0.06596

（2）剔除引入方程中差异不显著的自变量，已引入的X1,X3,X5中偏回归平方和最小的为

U3>=0.0466,

F3=H(/[(Q⑶/(n-3-l)]=0.0466/(0.066/8)=5.65

F3>5,所以X3不被剔除，偏回归平方和更大的X|,X5更不会被剔除，故方程中无剔

除的自变量。

(3)引入新变量未引入的X2,X4中〃了>心4),故引入x-其检验结果为：

4)(3)4)

F4=M(/[(Q-U^)/(n-4-l)=0.0274/[(0.0666-0.0274)/7]=4.97

由于F4

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

高级生物统计讲义全

文档简介

温馨提示

最新文档

评论

高级生物统计讲义全

文档简介

温馨提示

最新文档

评论

相关文档