专题一:通径分析_第1页
专题一:通径分析_第2页
专题一:通径分析_第3页
专题一:通径分析_第4页
专题一:通径分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SAS9.0在通径分析中的应用,冯跃华 编著,搜集变量资料是农业科学研究经常采用的方法,如:搜集作物的产量与其构成因素穗数、粒数、粒重等资料,研究这些变量的目的是想知道这些变量之间的关系,许多人往往采用简单回归和相关或多元回归分析。,但是,多元回归分析虽然在一定程度上能反映各个变量的真实关系,然而多元回归在分析偏回归系数时带有单位,使自变量对依变量的效应不能直接进行比较,从而不能比较各自变量的相对重要性。 要解决这个问题,进行通径分析(即为通径系数的分析)是一个比较好的选择。然而令人感到棘手的是,面对繁杂的计算公式往往感到无从下手,下面从通径系数的概念入手,引出通径系数的求算方法,并利用SAS

2、完成通径分析全过程。,1 通径和通径系数的概念 1.1 通径 设依变量y和两个自变量x1、x2之间有如下关系:,“”中表示变量间存在因果关系,箭头方向是原因到结果,称为通径。 “ ”表示变量间存在相关关系,称为相关线,,图 1,x1y,x2y为直接通径,由于x1,x2存在相关关系,又产生了两条间接通径,一条是x1是通过x2而作用于Y的通径,记作x1x2Y,一条是x2是通过x1而作用于y的通径,记作x2x1y。 这种情况可以推广到i个自变量,并记 直接通径为iy(i=1,2,3m); 间接通径为ijy(i=1,2,3m,ij ) , 但也可统一记作ijy,当i=j时为直接通径,ij时为间接通径。

3、,图 1,1.2 通径系数 表示各条通径对于改变依变量的相对重要性的统计数就叫通径系数(path coefficient), 记作PijY 或简写为PijY。 通径系数的定义可以由偏回归系数导出。 例如水稻单株产量y(kg)与x1(穗数)、x2(单穗粒数)、x3(粒重)间存在着线性回归关系。其回归关系为:y=b0+b1x1+b2x2+b3x3,此式中b0为常数,b1、b2、b3分别表示y对x1、y对x2、y对x3的偏回归系数,偏回归系数是带有单位的,如b1,b2的单位分别为:kg/穗,kg/粒。所以不便于偏回归系数进行直接比较。所以常常将其标准化之后以便于消去单位,进行直接比较。下面进行回归方

4、程的标准化:,y = b0+b1x1+b1x2+b1x3 (1) 由(1)对y求平均数得: y=b0+b1x1+b1x2 +b1x3 (2) 用(1)式减(2)得: y- y= b1(x1- x1)+ b2(x2- x2)+ b3(x3- x3) (3) 由(3)式除Sy得: (y- y)/ S y = b1(x1- x1)/ S y + b2(x2- x2) / S y+ b3(x3-x3)/ S y (4),将(4)式做相应得恒等变换: (y-y)/ Sy= b1(Sx1/Sy)(x1- x1)/ Sx1+ b2(S x2/ S y)(x2- x2)/Sx2+ b3(Sx3/Sy)(x3-

5、 x3)/Sx3 (5) 其中Sy,Sx1,Sx2,Sx3分别为y,x1 ,x2,x3的样本标准差,并令: y=(y-y)/Sy, x1= (x1- x1)/S x1, x2 = (x2- x2)/Sx2, x3 = (x3- x3)/Sx3 , y、x1、x2、x3即为变量y、x1、x2、x3的标准化,,将(5)式改写成下式: yb1(Sx1/Sy) x1+ b2(Sx2/Sy) x2 + b3(Sx3/Sy) x3 则b1(Sx1/Sy),b2(Sx2/Sy),b3(Sx3/ Sy)为变量标准化后的偏回归系数,它是不带单位的相对数,这样就可以用以估计x1,x2,x3对y直接影响效应的大小,

6、并比较其重要性。,因此通径系数的定义: 若相关变量y与x1、x2 xk间存在着直线回归关系,其回归方程为: y=b0+b1x1+b1x2+ +bkxk, 则变量标准化后的各偏回归系数b1(Sx1/S y),b2(Sx2/S y),bk(Sxk/Sy)分别为自变量x1 x2 xk对依变量的直接通径系数, 即:P1y= b1(Sx1/Sy),P2y= b2(Sx2/Sy), , Pky= bk(Sxk/S y),简言之,通径系数是变量标准化的各偏回归系数,用以表示相关变量因果关系的一个统计量。,2 通径系数的类型 通径系数包括直接通径系数和间接通径系数两种类型。 2.1 直接通径系数 对于回归方程

7、y= b0+b1x1+b2x2+b3x3+bkxk,则有x1对y的直接通径系数为P1y=b1*Sx1/Sy, x2对y的直接通径系数为P2y=b1*Sx2/Sy,xk对y的直接通径系数为Pky=b1*Sxk/Sy,其中Sx1、Sx2、Sy分别为x1 、x2、 xk的样本标准差。,2.2 间接通径系数 由许多自变量影响着依变量,但是它们的重要性是不同的,其中一个自变量可能通过其它自变量对依变量起作用,这时可用间接通径系数来表示它。如xi通过xj 对y起作用,间接通径系数为:rijPjy,rij表示xi和xj之间的相关系数,Pjy表示xj对y的直接通径系数。,2.3 直接、间接通径系数和相关系数的

8、关系 依据回归系数和通径系数的定义以及最小二乘法原理可得到: rij = Piy + rijPjy(ij,i、j=1,2,3.K) 即:一个自变量对因变量的直接通径系数和间接通径系数的总和等于这个自变量与因变量之间的相关系数。 例如:对多元回归方程y=bo+b1x1+b2x2+b3x3, 有: r1y=P1y+r12P2y+r13P3y r2y=P2y+r21P1y+r23P3y r3y=P3y+r31P1y+r32P2y 并可以得到表1:,表1 直接通径系数和间接通径系数表,注:蓝色部分为直接通径系数,其它为间接通径系数。,3、通径系数的性质 通径系数有以下几个性质: 1)一个具有k个自变量

9、的反应系统,共有m个直接通径系数和m(m-1)个间接通径系数。 2)进行通径分析的基础是Y和Xi都具有线性关系,而且Y可以被线性分解。 3)通径系数是具有向量的。如:Xi和Y不可以互换,即:PiyPyi。它的取值在实数范围内可以大于1或小于-1。 4)通径系数是变量标准化的偏回归系数,它能够表示变量间的因果关系,故具有回归系数性质。 5)通径系数不带具体单位,因而又具有相关系数的性质,表示原因与结果的相关关系。所以通径系数是介于回归系数和相关系数之间的一种统计量。 6)通径系数可以表示某个自变量的相对重要性。,4、应用SAS进行通径分析的具体过程 SAS是美国使用的最为广泛的三大著名统计分析软

10、件(SAS, SPSS和SYSTAT)之一,是目前国际上最为流行的一种大型的统计分析系统,被誉为统计分析的标准软件。对于通径系数,如采用其它常规的统计方法,往往颇费周折。如采用SAS软件,往往比较简单,较快的完成分析过程。下面通过一个实例,介绍应用SAS进行通径分析的基本作法。 例:测定“丰产3号”小麦的每株穗数(1),每穗结实小穗数(2,主茎),百粒重(3,克),和每株籽粒产量(Y,克)的关系,得结果于表1,试求Y依Xi的最优线性回归方程,并作通径分析。,表1 “丰产3号”小麦的每株穗数(x1)、每穗结实小穗数(x2)、百粒重(x3)、株高(x4)和每株籽粒产量(Y)的关系,4.1 直接通径

11、系数的求法 在sas的程序窗口中输入以下程序: DM log;clear;output;clear; ods rtf file=D:sas2003tongjing.rtf; PROC IMPORT OUT = tongjing DATAFILE = D:sas2003tongjing.xls DBMS = EXCEL2000 REPLACE; SHEET = Sheet1$; GETNAMES = YES; RUN; proc reg corr data = tongjing; /*进行回归分析和相关分析*/ model y=x1-x3/selection=stepwise sls=.05 s

12、le=.05 STB; /*表示选用逐步回归法进行分析,sls=和sle=定义选入和剔除自变量的限制水平(0.05),STB给出直接通径系数*/ run;quit; ods rtf close;,D:sas2003通径分析程序,D:sas2003tongjing.xls,D:sas2003tongjing.rtf,The REG Procedure Model: MODEL1 Dependent Variable: y y Stepwise Selection: Step 1,The REG Procedure Model: MODEL1 Dependent Variable: y y Ste

13、pwise Selection: Step 2,All variables left in the model are significant at the 0.0500 level. All variables have been entered into the model.,以上结果给出了四个变量(x1,x2,x3,y)间的相关系数,并经逐步回归,三个变量全部保留在回归方程中,可以建立如下回归方程:y = -46.966359 + 2.01314X1+ 0.67464X2 + 7.83023X3。 三个自变量全部达到0.05显著水平,还可以达到许多信息: (1)回归平方和及均方,剩余平方

14、和及均方,总平方和,决定系数(R2),自变量和回归截距标准误(standard error)。 (2)直接通径系数(standardized Estimate) P1y = 0.75342 P2y = 0.19929 P3y = 0.34139,4.2 间接通径系数的求法 由通径系数的定义可得: P12y = r12*P2y = -0.1357*0.19929 = -0.02704 P13y = r13*P3y = 0.5007*0.34139 = 0.1709 P21y = r21*P1y = -0.1357*0.75342 = -0.1022 P23y = r23*P3y = -0.148

15、9*0.34139 = -0.05083 P31y = r31*P1y = 0.5007*0.75342 = 0.3772 P32y = r32*P2y = -0.1489*0.19929 = -0.02967 最后得到表2:,表2 直接通径系数和间接通径系数表,注:斜体部分为直接通径系数,其它为间接通径系数。,由表2可知: 就直接通径系数而言,P1yP3yP2y,说明每株穗数对产量影响较大,百粒重次之,每穗小穗数最小。 就间接通径系数而言,虽然x3与y有较大的相关系数(0.6889),但x3对y的直接影响只有0.3414,还有一部分是x3通过x1对y起作用。,X1:每株穗数、 x2:每穗结实小穗数、 x3:百粒重,4.3 小结 通径系数是一种重要得统计量,它可以表示各变量之间的关系,并且可以确定自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论