第二讲--通径分析_第1页
第二讲--通径分析_第2页
第二讲--通径分析_第3页
第二讲--通径分析_第4页
第二讲--通径分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第二讲第二讲 通径分析通径分析 PATH ANALYSIS 在生物界中,数量性状间的关系往往是彼此相关的。从统计学上讲,研究多 个相关变量间的关系,可根据相关变量间是因果关系或平行关系,采用不同的统 计分析方法。若变量间互为因果而呈平行关系时,多采用相关分析。若变量间因 果分明,多采用多元线性回归分析。如第一讲中因果分明,产蛋率为果,各环境 参数为因。然而,相关变量内的这两种分析方法都存在一定的局限性。如简单相 关系数固然可以用来度量两变量间的相关密切程度。但其中也包含有其他相关变 量对它们的影响。因此,多少包含有虚伪的成分了。尤其在分析原因对结果作用 方面。相关系数无法表明。就此而言,多元

2、回归分析中的偏回归系数,在一定程 度上可指出各原因对结果的直接作用,但因带有不同单位,故不能直接比较各原 因对结果的作用大小,即使单位相同,若各原因(自变量)的变异度(标准差) 不同,也是无法比较的。何况偏回归系数也不能解释与其他相关原因共同对结果 的作用。为此,1921年SWright发表了一篇“相关与相关原因”的论文,文中对 相关系数进行剖分,找出了用来表明各原因对结果所起直接作用大小的统计量, 即通径系数。之后,该方法不断得到应用和完善,成为具有直观、精确等特点的 一种重要分析方法。 第一节 通径分析的基本原理 一、通径分析的基本原理与性质 为叙述方便,先讨论两个原因(自变量)x1 ,x

3、2 及结果(依变量)y三个相 关变量,后再推广至一般。假设x1 ,x2 与y间存在线性关系,则x1 ,x2与y的回 归方程为: 或 y=b0+b1x1+b2x2+e (22) (22)式中b0为常数项,b1 ,b2 分别为y对x1 ,x2 的偏回归系数,e为与各变 量相互独立的误差项(或剩余项)。x1 ,x2 间存在相关,则(22)式的关系可 用图1示之。 图1 通径图 图1中,单箭头表示自变量间存在因果关系,方向由原因到结果,称为通径。双 箭头表示变量间存在平行关系,称为相关线, (21) 22110 xbxbby 若不考虑误差项e,(22)式可改写成为: y= b0+b1x1+b2x2 (

4、23) 将(23)式减(24)式可得: 将(25)式两边平方后求和,并遍除以n1,可得: (27)式中b1 Sx1/Sy,b2 Sx2/Sy为标准偏回归系数,也叫通径系数, 分别记作Py1 ,Py2 ,用来表示x1,x2对y影响的相对重要性。由于是 不带单位的相关系数,故可直接用于比较对结果影响的大小。 1 )( 2 1 )( 1 )( 1 )( 2211 21 2 222 2 2 112 1 2 n xxxx bb n xx b n xx b n yy 即 (26) 1221 22 2 22 1 2 2 21 COVbbSbSbS xxy (26)式两边同除以 得: 2 y S 12 2 1

5、 212112 21 2 2 2 1 xxy x y x y x y x SS COV S S b S S b S S b S S b(27) (21) )()( 222111 xxbxxbyy (25) 其中: (24) 22110 22110 xbxbby xbxbyb 通径系数的平方称为决定系数,表示各原因对结果相对的决定程度 即: 所以(27)式可改写成 dy.1+dy.2+2 Py.1 Py.2 r12=1 (28) 其中2 Py.1 Py.2 r12可以看成相关原因x1 ,x2 共同对结果y的相对决定程度,称 为相关原因x1 ,x2 共同对结果y的决定系数,记为dy.12 ,所以(

6、28)式又可 写成: dy.1+dy.2+dy.12=1 (29) 由(29)式可推广到一般,即,如果相关变量x1 ,x2,xm,y间存在线 性关系,复回归方程为: y= b0+b1x1+b2x2+bmxm 且x1 ,x2,xm两两相关,即r120,r130,rm-1, m0,不考虑e时,则 x1 ,x2,xm对结果y 的决定系数之和加上两两相关原因共同对结果y的决定系 数等于1,即 : dy.1+dy.2+dy.m+dy.12+dy.13+dy.m-1 m=1 (210) 简写为: 2 1 1 2 11 y yy S Sx bPd 2 2 2 2 22 y yy S Sx bPd 因为 21

7、 21 21 1212 1212 ) 1)(1(1 xx xx xx SS COV nn SSSS n SP SSSSSPr 若考虑误差项e,则 dy.i+dy.ij1,而把 1dy.idy.ij叫作误差对结果 y的决定系数,记为dy.e。如果dy.e 的绝对值较大,说明可能还有一些对 结果影响较大的原因未被考虑进去。显然,误差项到y的通径系数: 对于(21)式,为求b1,b2可得下列两个方程: SS1b1+SP12b2=SP1y (211) SP21b1+SS2b2=SP2y (212) 先对以上两式的各项除以n1后,(211)式再除以Sx1Sy,(212) 式除以Sx2Sy可得: 即: P

8、y.1 +r12Py.2=r1y (213) r21Py.1+ Py.2=r2y (214) yx y x x y x y x xx yx y y x xxx x y x SS COV S S S S b S S b SS COV SS COV S S b SS COV S S S S b 22 221 21 1 2 211 11 2 21 21 1 2 12 1 eyey dP . 1 . 1 ijy m ji iy m i dd 其中 , dy.ij=2Py.i Py.j rij (i,j=1,2,m,iF0.01, p3.15,故差异显著,可选入。 =0.59502/1=0.3540 =

9、0.37082/1=0.1375 )0( 11 2)0( 1 ) 1 ( 1 rru y )0( 22 2)0( 2 ) 1 ( 2 rru y )0( 33 2)0( 3 ) 1 ( 3 rru y ) 0( 44 2) 0( 4 ) 1 ( 4 rru y ) 0( 55 2) 0( 5 ) 1 ( 5 rru y =(-0.1964)2/1=0.00386 =0.03202/1=0.0010 =0.39712/1=0.1577 =0.37082/1=0.1375 (或Fi=( ui)/(n11)。本次选入K为1,L为0。 )1 ( yy r F1=u1/(1- )/(35-1-1)=0.

10、3540/(1-0.3540)/33=18.08 )1 ( 1 u 由于引选x1,故按上式K+1,L=0时。 2、选入第二个自变量 L=1 (1)计算各自变量偏回归平方和,按(114)式算得: 由于方程中仅含一个自变量x1。而它是前一步刚选入的,不可能立即被剔除, 故无须作检验而直接引入贡献最大的u2(2),即x2。 (3)剔除或选入一个自变量xk后,相关系数阵R(L)= 依(116)式把R(0) 变换为R(1) )(l ij r 645975. 0147080. 0066221. 0093367. 0417443. 05950. 0 147080. 0858624. 0547606. 019

11、1277. 0346284. 03760. 0 066221. 0547606. 0690753. 0004470. 0420991. 05561. 0 093367. 0191277. 0004470. 0955606. 0156425. 02107. 0 417443. 0346284. 0420991. 0156425. 0861988. 03715. 0 5950. 03760. 05561. 02107. 03715. 01 ) 1 ( R ) 1 ( 11 2) 1 ( 1 )2( 1 rru y )1( 22 2)1( 2 )2( 2 rru y ) 1 ( 33 2) 1 (

12、3 )2( 3 rru y ) 1 ( 44 2) 1 ( 4 )2( 4 rru y ) 1 ( 55 2) 1 ( 5 )2( 5 rru y =0.59502/1=0.3540(已选) =(-0.417443)2/0.861988=0.2022 =(-0.093367)2/0.955606=0.0091 =0.066212/0.690753=0.0064 =0.1470802/0.858624=0.02519 (2)对选进x2进行F检验,按(115)式算得: F23.15,差异显著,可选进x2。 (3)选进x2后,按(116)式进行消去变换,使R(1)变换成R(2)。 (4)对选进的x1

13、,x2进行显著性检验 先算出各偏回归平方和及剩余平方和: 443816. 0020618. 0137656. 0017614. 0484279. 0774910. 0 020618. 0719512. 0378483. 0254117. 0401727. 0149242. 0 137656. 0378483. 0485143. 0071927. 04883951. 0737539. 0 017614. 0254117. 0071927. 0927220. 018147. 0143284. 0 484279. 0401727. 0488395. 0181470. 0160109. 1430980

14、. 0 774910. 0149242. 0737539. 0143284. 0430980. 0160109. 1 )2( R 58.1432/ )2022. 064975. 0/(2020. 0)12/()/( 58.1432/ )2022. 03540. 01/(2022. 0)12/()1/( )2( 2 ) 1 (2 2 )2( 2 ) 1 ( 1 )2( 22 nuru nuuuF yy 3、选入第三个自变量 L=2,除x1 ,x2外,数u4(3)最大,故选入x4。 (1)对选入的x3是否显著进行F检验 F40.05)。其他分析步骤可参考例1。 剩余平方和 4438. 0 )2()

15、2( yy rQ 58.14)32/4438. 0/(2022. 0)12/(/ )2()3( 2 nQuF ,F1F23.15,差异均显著,x1、x2不被剔除。 )3( 2 )3( 1 uu =0.0391/(0.4438-0.0391)/31=2.995 )13/()/( )3( 4 )2()3( 44 nuQuF 习习 题题 2.1 考察14个不同桑品种4个桑叶的理化性状为总含氮量(x1,%)、可容性 糖(x2,%)、叶绿素含量(x3,%)、单叶面积重(x4,g/100cm2)及万头产茧 层量(y)。算得相关系数如下表,试作通径分析。 各变量的简单相关系数(rij)、平均数( )及标准差

16、(S) (答案:Py.1=0.33892,Py.2=0.43881,Py.3=0.07242,Py.4=-0.26539,R2=0.9007) 2.2 测得某猪场50头肥猪5项胴体性状瘦肉量(y,kg)、眼肌面积(X1,cm2) 、腿肉量(X2,kg)、腰肉量(X3,kg)、椎骨数(X4,个)的资料如下,试作 逐步通径分析。 x 算得二级数据为:ss1=739.6526,sp12=36.6241,sp13=14.1018,sp14=-85.5450, sp1y=111.4707,ss2=8.8284,sp23=2.5618,sp24=1.6050,sp2y=21.0275,ss3=2.6690, sp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论