




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 线性回归与相关线性回归与相关060120180施氮量施氮量 (kg N/ha)2468产量产量 (Tons/ha)Chapter 5 Linear regression and correlation第一节第一节 一元线性回归与相关一元线性回归与相关1. 回归与相关的概念回归与相关的概念1变量变量 (Variable) 描述事物特征或特质的数量指标,这些指标因条件不同而按一定的规律描述事物特征或特质的数量指标,这些指标因条件不同而按一定的规律变化,故称变量。如:不同田块的土壤有机质含量变化,故称变量。如:不同田块的土壤有机质含量; 不同小麦品种的千粒重不同小麦品种的千粒重;不同大
2、丽轮枝菌的致病力等等。不同大丽轮枝菌的致病力等等。2变量间的关系变量间的关系 (Relationships between variables) 函数关系函数关系 (Functional relationship): 处于同一个统一体中的两个变量,它们之间互相联系着同时在变化,处于同一个统一体中的两个变量,它们之间互相联系着同时在变化,其中一个变化,另一个也按一定的规律相应地变化,而且一个变量取定某其中一个变化,另一个也按一定的规律相应地变化,而且一个变量取定某个数值,另一个变量也按照一定的规律有一个完全确定的数值与之对应。个数值,另一个变量也按照一定的规律有一个完全确定的数值与之对应。常以常
3、以 y=(x) 表示。如:路程和时间的关系:表示。如:路程和时间的关系:s = vt;消光值和溶液浓度的关;消光值和溶液浓度的关系:系:E = RC,等等。,等等。 相关关系相关关系 (Correlation relationship): 当一个变量取定某个数值时,另一个变量出现的对应值不是完全确定的。如:当一个变量取定某个数值时,另一个变量出现的对应值不是完全确定的。如:施氮量和作物产量的关系;施氮量和作物产量的关系; 土壤有机质和土壤全氮含量。土壤有机质和土壤全氮含量。2. 2. 相关关系的类型相关关系的类型 yxxyxy xy xyxy 相关关系的规律是概率性的,相关关系资料必须用相关关
4、系的规律是概率性的,相关关系资料必须用适当的统计方法处理后,才能使其规律呈现出来。适当的统计方法处理后,才能使其规律呈现出来。 1) 对具有相关关系的变量进行抽样研究,建立能表达两者关系对具有相关关系的变量进行抽样研究,建立能表达两者关系的回归方程。的回归方程。3. 3. 回归分析回归分析 (Regression analysis)(Regression analysis)研究相关关系中变量与变量间数量关系的一种数学方法。研究相关关系中变量与变量间数量关系的一种数学方法。主要包括:主要包括:2) 2) 通过对方程的统计检验,判断变量相关关系的密切程度;通过对方程的统计检验,判断变量相关关系的密
5、切程度;3) 3) 依据回归方程及其误差精度),从一个或多个变量的已知值依据回归方程及其误差精度),从一个或多个变量的已知值估测另一个变量的取值范围,进行预测。估测另一个变量的取值范围,进行预测。Relationship between ear length (cm) and yield per plant of maize (g)陕西旬邑县苹果黑星病病叶率随时间变化图陕西旬邑县苹果黑星病病叶率随时间变化图陕西杨凌小麦条锈病病叶率随时间变化图陕西杨凌小麦条锈病病叶率随时间变化图表表1 双变量双变量X, Y总体模式表总体模式表X Y y,x X1 Y11 Y12 Y1n Y1 X2 Y21 Y2
6、2 Y2n Y2 Xn Yn1 Yn2 Ynn Yn对于一个双变量总体对于一个双变量总体 :令令 是是 时所有时所有 的平均值,在统计学上称为的平均值,在统计学上称为 的条件平均数或的条件平均数或条件期望值则:条件期望值则:称为回归函数,表示称为回归函数,表示 y y 依依 x x 变化而回归。变化而回归。 如果变量如果变量 x 和和 y 是直线相关关系,则上述回归函数可表示成:是直线相关关系,则上述回归函数可表示成:称为直线回归方程。称为直线回归方程。ixy,ixx yy)(,xfixyixy,xxyi0,又称为又称为Y Y的回归值。的回归值。),(ijiyx如果变量如果变量 x 和和 y
7、是直线相关关系,则上述回归方程可表示成:是直线相关关系,则上述回归方程可表示成:用用 作为作为 的估计值,则上述回归函数可表示为:的估计值,则上述回归函数可表示为:称为样本回归方程。称为样本回归方程。 称为样本线性回归方程。称为样本线性回归方程。如果变量如果变量 x 和和 y 呈曲线相关关系如抛物线),则上述回归方程可表示成:呈曲线相关关系如抛物线),则上述回归方程可表示成:称为样本非线性回归方程。称为样本非线性回归方程。对于一个双变量样本对于一个双变量样本 :),(ijiyxy ixy,)(xfy bxby020bxbxby1 1当两个变量有因果关系时,则原因变量为自变量,结果变量为依变量。
8、当两个变量有因果关系时,则原因变量为自变量,结果变量为依变量。2 2当两个变量没有因果关系时,则根据研究目的确定。当两个变量没有因果关系时,则根据研究目的确定。3 3当两个变量中,有一个是非随机变量时,则非随机变量必为自变量。当两个变量中,有一个是非随机变量时,则非随机变量必为自变量。4 4当两个变量均为随机变量时,则根据研究目的确定。当两个变量均为随机变量时,则根据研究目的确定。例:例:1 1施肥量施肥量 (x) (x) 作物产量作物产量 (y)(y)。2 2土壤有机质含量土壤有机质含量 (x) (x) 土壤土壤全氮含量全氮含量 (y) (y) 。自变量自变量 (x, independent
9、 variable) 和依变量和依变量 (y, dependent variable)4. 4. 相关分析相关分析 (Correlation (Correlation analysis)analysis) 研究变量之间相关关系的密切程度及其性质研究变量之间相关关系的密切程度及其性质 (正相关或负相关正相关或负相关), 并用一个数量性指标来描述,这个指标称为相关系数并用一个数量性指标来描述,这个指标称为相关系数 (r) 。相关分析。相关分析不具备预测功能。不具备预测功能。?相关分析与回归分析有何关系?相关分析与回归分析有何关系? 5. 相关分析与回归分析必须注意的问题相关分析与回归分析必须注意的
10、问题1相关的科学性。相关的科学性。2相关的可比性。相关的可比性。3作回归和相关分析时,作回归和相关分析时,x 的取值范围要尽可能大,而且观察值应在的取值范围要尽可能大,而且观察值应在5 对以上。对以上。表表1 一个双变量一个双变量X,Y样本的模式表样本的模式表X XX1 Y11 Y12 Y1n X1 Y11 Y12 Y1n X2 Y21 Y22 Y2nX2 Y21 Y22 Y2nXm Ym1 Ym2 YmaXm Ym1 Ym2 YmaY Y二、二、 一元线性回归分析一元线性回归分析 1. 一元线性回归方程的建立一元线性回归方程的建立1利用变量利用变量 (x, y) 作散点图作散点图 (Scat
11、ter diagram) 进行初步判断。进行初步判断。 xy2直线回归方程直线回归方程 (Linear regression equation) 的配置的配置确定直线方程的原则:确定直线方程的原则:xy y y y y直线方程的通式为:直线方程的通式为:称为称为 依依 的直线回归方程式。的直线回归方程式。:回归系数:回归系数 (Regression (Regression coefficient);coefficient);:回归截矩:回归截矩 (Regression (Regression intercept).intercept).:自变量:自变量 (Independent variabl
12、e); :回归值:回归值; ;bxby0y y xb0bx欲使建立的回归方程最好,须使欲使建立的回归方程最好,须使 和和 之间的差异最小。之间的差异最小。 y 2)(yyQ= = 最小最小y确定确定 b0 及及 b 值的方法值的方法 (最小二乘法最小二乘法):要使要使则有:则有:2)(yyQ= = 最小最小bxby0yxbnb0 xyxbxb20 xxxynnllxxyyxxxxyxxyb22121)()()(xbyb00222)(200)(0200 xbybbxbybbxbybQ0222)(2020)(20 xbxyxbxbxbybbxbybQ因为因为 上式及本式称为正规方程组上式及本式称为
13、正规方程组 (Normal equations). 亦可用矩阵形式表示。亦可用矩阵形式表示。 直线回归方程的特点直线回归方程的特点(1直线回归方程一定通过点直线回归方程一定通过点(2回归系数回归系数 b 的符号取决于的符号取决于 lxy b 0 时,时,x 与与y 正相关;正相关; b |r| under H0: Rho=0 Prob |r| under H0: Rho=0 x y x y x 1.00000 0.96412 x 1.00000 0.96412 .0001 .0001 y 0.96412 1.00000 y 0.96412 1.00000 .0001 |r| under H0:
14、 Rho=0 Prob |r| under H0: Rho=0 x y x y x 1.00000 -0.83714 x 1.00000 -0.83714 0.0049 0.0049 y -0.83714 1.00000 y -0.83714 1.00000 0.0049 0.0049outp, Pearsonouts, Spearmanoutk, Kendallouth, Hoeffding50. 305. 4|05. 4|50. 305. 42067. 08371. 02067. 0298371. 018371. 07,01. 02tttSrr说明3月下旬至4月中旬积温和一代三化螟蛾盛发期
15、间存在真实的直线相关关系。相关系数的t测验T T测验法测验法 查查r表,当自由度为表,当自由度为7,显著水平分别为,显著水平分别为0.05和和0.01时,对应的时,对应的r值分别为值分别为0.666和和0.798。|r|=0.83710.798 因而,两个变量在因而,两个变量在0.01 水平上显著,即认为水平上显著,即认为两个变量之间存在显著的直线相关关系。两个变量之间存在显著的直线相关关系。r r值法值法第三节第三节 多元线性回归与相关多元线性回归与相关Multivariate linear Multivariate linear regressionregression0
16、0.41317212529-200204060籽粒产量( 克/ 盆)苗期施氮( g N / Kg土 )土壤含水量( % ) 在自然界中,与依变量y有关系的变量不止有一个,而是多个,它们之间的关系也不一定是线性的。例如,作物产量的高低。例如,作物产量的高低。多元回归多元回归: 研究变量研究变量y 与多个变量之间的定量关系称为多元回归与多个变量之间的定量关系称为多元回归 (Multiple regression)。许多多元非线性回归都可以化为多元。许多多元非线性回归都可以化为多元线性回归来处理。线性回归来处理。 播期播期 (Sowing date)密度密度(Density)施肥量施肥量 (Fert
17、ilization rates)土壤肥力土壤肥力 (Soil fertility)雨量雨量 (Rainfall)光照光照 (Sunshine)气温气温 (Temperature)病虫害病虫害 (Damage by pests and disease)1. 多元线性回归的数学模型(Mathematical model of multiple regression)NNpNNpppyxxxNyxxxyxxxyxxx212222211112112121试验号试验号 设变量设变量 y y 与另外与另外 p p 个变量个变量 x1, x2, , xp x1, x2, , xp 的内在关的内在关系是线性的
18、,如果做了系是线性的,如果做了 N N 次试验,其结果如下表:次试验,其结果如下表: NNppNNNppppxxxyxxxyxxxy2211022222211021112211101上表中的数据可以假定具有如下数学模型:上表中的数据可以假定具有如下数学模型: ppxxxy22110N,2,1即 NNpNNpppyxxxNyxxxyxxxyxxx212222211112112121试验号试验号 NNppNNNppppxxxyxxxyxxxy2211022222211021112211101或者 ppxxxy22110N,2,1p,10N,21), 0(2N式中式中 是待估计参数,是待估计参数,
19、是是N个独立且服从正态分布个独立且服从正态分布 的随机变量。的随机变量。 、称为多元线性回归的数学模型。称为多元线性回归的数学模型。 ppxbxbxbby22110用试验结果进行估计时,可得相应的多元线性回归方程为:用试验结果进行估计时,可得相应的多元线性回归方程为: ppxbxbxbby22110 式中式中 b0 为常数项,为常数项,bj 为为 y 对对 xj 的偏回归系数,它是表示的偏回归系数,它是表示当其它当其它 x 固定不变时,固定不变时,xj 变化一个单位而使变化一个单位而使 y 平均变化的数平均变化的数值。值。 如果令: Nyyyy321YNpNNpppxxxxxxxxxxxx21
20、3323122221112111111Xp10N10则模型可以写成矩阵形式则模型可以写成矩阵形式: XYNNppNNNppppxxxyxxxyxxxy2211022222211021112211101多元线性回归多元线性回归的数学模型的数学模型:YNyyyy321XNpNNpppxxxxxxxxxxxx213323122221112111111p10则模型可以写成矩阵形式则模型可以写成矩阵形式: XYN 1N (p+1)(p+1) 1N 1Why?N212. 2. 多元线性回归方程的建立多元线性回归方程的建立确定直线方程的原则:确定直线方程的原则:确定确定 b0 及及 bj 值:值:欲使建立的
21、回归方程最好,须使欲使建立的回归方程最好,须使 和和 之间的差异最小。之间的差异最小。 yy = = 最小最小2)(yyQ要使要使则有:则有:2)(yyQ= = 最小,最小,0)(20)(222110)(22110)(22211002221100jppbxbxbxbbybQppbxbxbxbbybQxxbxbxbbyxbxbxbbyjppjpp0)(20)(222110)(22110)(22211002221100jppbxbxbxbbybQppbxbxbxbbybQxxbxbxbbyxbxbxbbyjppjpp即即 yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxyb
22、xbxbxNbpppppppppppp)()()()()()()()()()()()()()()(2221102222212102112211210122110上式及本式称为正规方程组上式及本式称为正规方程组 (Normal equations). 对正规方程组求解,即得对正规方程组求解,即得b0, bj. 如果令如果令A为正规方程组的系数矩阵,即为正规方程组的系数矩阵,即 :yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxNbpppppppppppp)()()()()()()()()()()()()()()(22211022222121021122112
23、1012211022122221212121121pppppppxxxxxxxxxxxxxxxxxxxxxNANpNNpppxxxxxxxxxxxx213323122221112111111NpppNNxxxxxxxxx212221212111111XX(p+1) (p+1),方阵方阵 (p+1) pp (p+1)Structure matrixByxyxyxyp21YXNpppNNxxxxxxxxx212221212111111Nyyyy321(p+1) pN 1令令B B为正规方程组右端的常数项矩阵,即:为正规方程组右端的常数项矩阵,即:令令 则正规方程组则正规方程组YXBbXXAb)(对
24、上式求解,得:对上式求解,得: bYXXXBA11)(),(210pbbbbbpbbbb210yxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxNbpppppppppppp)()()()()()()()()()()()()()()(2221102222212102112211210122110可以写成矩阵形式:可以写成矩阵形式:表表 10株玉米穗行数株玉米穗行数 x1,行粒数,行粒数 x2与单株产量与单株产量 y例:例:处置处置 穗行数穗行数 x1 行粒数行粒数 x2 单株产量单株产量 y 1 16 29 139 2 16 32 150 3 14 32 13
25、3 4 12 39 142 5 18 26 143 6 14 37 160 7 16 31 147 8 14 38 161 9 14 40 169 10 14 28 134欲建立的二元线性回归方程为:欲建立的二元线性回归方程为: 调查某玉米综合种调查某玉米综合种1010株,该品种每株玉米皆为单果穗。试建立每穗株,该品种每株玉米皆为单果穗。试建立每穗行数、行粒数与单株产量间的二元线性回归方程。行数、行粒数与单株产量间的二元线性回归方程。 22110 xbxbbyYXXXBA11)(bb210bbbYXXXBA11)(pbbbb210XYNyyyy321常数项矩阵y y 矩阵矩阵结构矩阵结构矩阵Y
26、XBNpNNpppxxxxxxxxxxxx213323122221112111111yxyxyxyp21X28161401413814131161371412618139121321413216129161134169161147160143142133150139YXXA222122121121xxxxxxxxxxN1124449143324914227615033215010结构矩阵结构矩阵y y 矩阵矩阵YXB49450221201478XXA222122121121xxxxxxxxxxN1124449143324914227615033215010常数项矩阵常数项矩阵该方程有唯一解的条
27、件是该方程有唯一解的条件是:A-1 是方程系数矩阵的逆矩阵是方程系数矩阵的逆矩阵, 称相关矩阵。称相关矩阵。 是系数矩阵是系数矩阵 A 的行列式。的行列式。Aij 是是 中元素中元素 aij 的代数余的代数余子式。子式。式中:式中:对对 求解得:求解得:BAb 210bbbbBA10AAA33231332221231211111AAAAAAAAAAA33231332221231211111AAAAAAAAAAAb210bbbBA16888. 49790. 95480.157每穗行数、行粒数与单株产量间的二元线性回归方程为:每穗行数、行粒数与单株产量间的二元线性回归方程为: 2606601853
28、266022165515218532551521443948140561216888. 4979. 9548.157xxy3. 3. 多元线性回归方程的显著性检验多元线性回归方程的显著性检验1) 因变量观察值的变异来源划分因变量观察值的变异来源划分2) 变异平方和的分解与计算变异平方和的分解与计算(1) 回归方程的显著性检验回归方程的显著性检验)()(yyyyyy总变异总变异 = 剩余变异剩余变异 + 回归变异回归变异222)()()(yyyyyySSTSST = SS剩剩 + SS回回其中其中 B0, Bj为常数项矩阵为常数项矩阵 B 中的元中的元素素平方和的计算平方和的计算yyNyTlyy
29、ySS2)(22)(SST = SS剩剩 + SS回回即2)(yyQ2)(yyU令 jjBbBbyyyQ0022)(QlQSSUyyTUQSST3) 自由度的分解与计算自由度的分解与计算4) F值的计算值的计算5) 统计推断统计推断F F 否定否定H0 ,接受,接受 HA总自由度:总自由度: dfT = N 1 回归自由度:回归自由度: df回回 = m 剩余自由度剩余自由度: df剩剩 = dfT - df回回 = N m 1F =S2S2回回S2S2剩剩SS回回/df回回 SSSS剩剩/df/df剩剩 =1) 偏回归平方和偏回归平方和各偏回归系数的平方和,称为偏各偏回归系数的平方和,称为偏
30、 回归平方和。记作回归平方和。记作 PjCjj为正规方程组系数矩阵为正规方程组系数矩阵 A 的逆矩阵的逆矩阵 A-1 主对角线上元素。主对角线上元素。bj为为 y 对对 xj 的偏回归系数的偏回归系数2) 自由度的计算自由度的计算 3) F值的计算值的计算4) 统计推断统计推断(2) (2) 偏回归系数的显著性检验偏回归系数的显著性检验jjjCbjP2F =Pj /1 SS剩剩/ df剩剩 F F 否定否定H0 ,接受,接受 HA偏偏 回归平方和的自由度为偏回归系数的自由度,即为:回归平方和的自由度为偏回归系数的自由度,即为:1(3) (3) 自变量的重要性和取舍自变量的重要性和取舍 对于偏回
31、归系数不显著的自变量应按照其偏回归平方和的大对于偏回归系数不显著的自变量应按照其偏回归平方和的大小,从小到大逐步舍去,并重新进行回归及检验,直到所保留自变小,从小到大逐步舍去,并重新进行回归及检验,直到所保留自变量的偏回归系数均显著为止。此称为逐步回归。量的偏回归系数均显著为止。此称为逐步回归。多元线性回归方程的显著性检验多元线性回归方程的显著性检验 (F(F检验检验) ) H0: H0: 回归关系不显著;回归关系不显著;HA: HA: 回归关系显著回归关系显著; ; 计算统计量计算统计量F:F:Nyyyyl2)(26 .132110/1478)134150139(22222211002BbB
32、bBbyQ31.294994506888. 422120979. 91478548129231.296 .1321QlUyy49450221201478YXB回归回归 1292.29 2 646.1451292.29 2 646.145154.318154.318* * * 4.74 4.74 9.559.55剩余剩余 29.31 7 4.1871 变因变因 SS df MS F F0.05 F0.01总变异总变异 1321.6 9 二元线性回归方程的显著性检验方差分析表二元线性回归方程的显著性检验方差分析表故该二元线性回归方程的回归关系极显著水平故该二元线性回归方程
33、的回归关系极显著水平偏回归系数的显著性检验偏回归系数的显著性检验 计算偏回归平方和计算偏回归平方和 x1 631.455 1 631.455150.81* 5.59 12.2 x2 1188.47 1 1188.47 283.84* 5.59 12.2变因变因 SS df MS F F0.05 F0.01总变异总变异 1321.6 9 剩余剩余 29.31 7 4.1871 回归 1292.29 2 646.145154.318* 4.74 9.551577. 0979. 9121121cbP455.6310185. 0689. 4222222cbP471.1188偏回归系数的显著性检验方差分
34、析表偏回归系数的显著性检验方差分析表216888. 4979. 9548.157xxy可以使用 二、二、 多元相关分析多元相关分析1. 多元相关多元相关 指指 m 个自变量与个自变量与 1 个因变量的总相关。多元相关系数记作:个因变量的总相关。多元相关系数记作: R = SSSS回回SSTSSTR的存在区间为的存在区间为 0,1 。1计算计算 R; 2由由Df= N M-1,变量个数为,变量个数为M, 查相关系数表附表查相关系数表附表10得得R,假如:,假如: R R 表明两变量的相关关系达显著或极显著水平。表明两变量的相关关系达显著或极显著水平。,myR12简记作:简记作:R多元相关系数或复
35、相关系数多元相关系数或复相关系数 (R) yylUR 或或多元相关系数的显著性检验多元相关系数的显著性检验:Nyyyyl2)(229.129231.296 .1321QlUyy6 .132110/1478)134150139(2222yylUR = 0.9888 * m=3, df剩剩 = N m 1=6, R0.01= 0.886, 2. 偏相关偏相关 (Partial correlation) 偏相关系数偏相关系数 (Partial correlation coefficient) 偏相关系数的定义偏相关系数的定义: 在其它各个变量都保持一定在其它各个变量都保持一定时,指定的两个变量间相关
36、的密切程度。偏相关又称为时,指定的两个变量间相关的密切程度。偏相关又称为净相关。净相关。 偏相关系数的表示方法偏相关系数的表示方法: r12, 34m, 简记作:简记作: r12 , rij 偏相关系数的取值范围偏相关系数的取值范围 : -1, 1mmmmmmmmrrrrrrrrrrrrrrrrR321233323122322211131211mmmmmmmmCCCCCCCCCCCCCCCCR3212333231223222111312111jjiiijCCCijr 由由 Df= N m,查表变量个数为,查表变量个数为 2, 查相关系数表附表查相关系数表附表10得得 r,假如:假如: r r
37、表明两变量的相关关系达显著或极显著水平。表明两变量的相关关系达显著或极显著水平。333231232221131211rrrrrrrrrR17029. 02697. 07029. 018695. 02697. 08695. 013332312322211312111CCCCCCCCCR7232.355847.689998.495847.687740.1355582.999998.495582.990809.749927.022111212CCCr9719.033111313CCCr9848.033222323CCCrDf = N m =7,查表变量个数为,查表变量个数为 2666. 07,05.
38、 0r798. 07,01. 0r以下内容自学以下内容自学例例 支崇远对贵阳成年水牛支崇远对贵阳成年水牛39头实测了体重头实测了体重(y/kg)、胸围、胸围(x1 /cm) 、体斜长、体斜长(x2 /cm)和体高和体高(x3 /cm) ,资料列于表,资料列于表4-4-2中,试建立三元线性回归方程。中,试建立三元线性回归方程。 编号12345678体重443.5507.5462.5514.0471.5545540.5536胸围194200194211205204315207体长146150150153153153154142体高122.1123.5126.5134.5129.5125.5133.
39、0128.5编号910111213141516体重468550.5492.0583442.5439.5477.5450胸围201199200210194190203194体长153160149160140147148135体高128.7127.5123.5138.6124121129118编号1718192021222324体重466480422413.5471.0414.5410428.5胸围190190185183193188179193体长135138.5140130145133140140体高122124119.5114123.5119119116编号2526272829303132体
40、重468517.5578620481702420491胸围190195.5207.5211203220197194体长155150160150137165142149体高120.5129.5128.5132.5130142.2124122编号33343536373839体重515483505465460404496胸围198200197192185187194体长150135153144154151152体高131.5128124119.5119.5123.0120.0表表 39头成年水牛实测体重、体尺数据表头成年水牛实测体重、体尺数据表25.847574, 5 .5741; 5 .15206
41、46,7693222211xxxx233124885.1,613312.86;1133959xxx x1323965451.85,720207.7;19034.5x xx xy2129434166.25;3772275.25,2814701yx yx y7 .23954923yx由表4-4-2数据计算一级统计数据:由一级统计数据计算二级统计数据:06.488,26.125,22.147,26.197321yxxx9359.315239)(212111xxl3974.261539)(222222xxl5344.138439)(232333xxl212121123205.160139)(lxxxx
42、l313131138103.181339)(lxxxxl323232232987.113839)(lxxxxl0897.14411039)(22yylyy1090.1759839)(111yxyxly4551.1292039)(222yxyxly9526.1119239)(333yxyxly平方和lxx交叉积lxy3152.93591601.32051813.81031601.32052615.39741138.29871813.81031138.29871384.5344xxL17598.109012920.455111192.9526xyL计算 并估计各偏回归系数得出回归方程:1xxL10
43、.00129958.51792230.00163248.51792230.00060100.00038250.0016340.00038250.00317522xx LT1T123( ,)(3.49698, 1.984559, 1.871436)xxxyb b bL L3371.7283322110 xbxbxbyb123728.3371 3.496981.9845591.871436xxx y计算U,Q,U1,U2,U3并检验 5351.108128332211yyylblblbU5546.35981ULQyye4418.94100012995. 049698. 3211211cbU4201
44、.65530006010. 0984559. 1222222cbU0016.110300317522. 0871436. 1233233cbUUUUUUj8635.17066321表表 三元线性回归方程的方差分析三元线性回归方程的方差分析12. 4)35, 1 (05. 0F145. 7)35, 1 (01. 0F40. 4)35, 3(01. 0F变异来源 df(自由度)SS(平方和)MS(均方)FFaX119410.4418(U1)9410.44189.154*X216553.4201(U2)6553.42016.3746*X311103.0016(U3)1103.00161回归3(p)1
45、08128.5546(U)36042.84535.06*剩余35(n-p-1)35981.5546(Q)1028.0444总变异38(n-1)144110.0897(Lyy)275%,yyRU l*0.8662R 01109. 4871436. 100317522. 00016324. 049698. 33333111bccbb10502. 2871436. 100317522. 00003825. 0984559. 13333222bccbb5335.1070250016.11035351.1081283*UUU5562.370840016.11035546.359813*UQQ,36, 2
46、*eUff*9478.51362QUF25. 5)36, 2(01. 0F0687.6132*21*1*0 xbxbyb12613.06874.011092.10502xx y%3 .740897.1441105335.1070252R剔除x3后:111222()()()pppyb xxbxxbxxyT()ybxxT120000T120000001 ,()()1, 1()()xxxxNynyNynyyxxLxxxxLxx002T1002T1001()()(1)11()()(1)xxeyxxeSQnpnSQnpnyxxLxxxxLxx其中 10.00129958.51792230.0016324
47、8.51792230.00060100.00038250.0016340.00038250.00317522xx L200-7693/39=2.7436150-5741.5/39=2.7821123.5-4885.1/39=-1.7590(2.7436,2.7821,1.7590)例如: 用线性回归解决多项式非线性回归问题用线性回归解决多项式非线性回归问题 ppxxxy2210,221ppxxxxxxppxxxy2211031622521421322110zzzzzzzy,2142132211zzxzxzxzx3322110 xxxy如:如:令:令:表表 废品率废品率y y与化学成分与化学成分
48、x x的记录的记录xx 122xx xx 122xx y (%)(0.01%)y (%)(0.01%)1.303411560.444016001.003612960.564116810.733713690.304217640.903814440.424318490.813915210.354318490.703915210.404520250.603915210.414722090.504016000.60482304354045500.811.2图4-4-1 废品率y与化学成分x的散点图及回归曲线图,02.10y 6263. 01602.10y,6511x 6875.401
49、66511x,267092x 3125.166916267092x44.221)(1212111xnxl1513685)(1222222xnxl18283)(121212112xxnxxll649.11)(1111yxnyxly05.923)(1222yxnyxly4982. 1)(122ynylyy正则方程组为05.923151368518283649.111828344.2212121bbbb,009301. 0,8205. 021bb484.1822110 xbxbyb218.4840.82050.009301xxy2102bbx,20210244b bbby极值:11.44009301
50、. 02)8205. 0(0 x204 18.484 0.009301 ( 0.8205)0.394 0.009301 y当某化学成分含量在0.44%左右时,平均废品率最小,约为0.39% 通径分析与偏相关分析 偏相关Partial Correlation):是在其余M2个变量皆固定时,指定的两个变量间的相关。偏回归系数bi不能反映自变量的相对重要性,因为:bi 带有具体的单位,单位不同无法比较;即使单位相同,Xi的变异程度不同,也不能比较。但可以采用标准化的偏回归系数,也称通径系数Path coefficient):yxiixyiiSSSSbnSSnSSbP) 1/(/1) 1/(/1即对分
51、子和分母分别除以即对分子和分母分别除以Y和和Xi的标准差,就可以消除单位和变异度的影响,的标准差,就可以消除单位和变异度的影响,其统计学意义是若增加一个标准差单位,其统计学意义是若增加一个标准差单位,Y将增加或减少将增加或减少Pi个标准差单位。个标准差单位。通径分析实质上是标准化的多元线性回归分析 *11221212PPPyPyxxxxxxbbbSSSSypjSSbbnlSnlSyjjjjjjyyy, 2 , 1,1,1*1b*2b*3b*eb12r23r1x2x3x13ry图图4-5-1 y关于各关于各x的通径图的通径图 yyyrbbrbrrbrbbrrbrbrb3*3*232*1312*3
52、23*2*1211*1313*1212*1*T12(,) ,pb bbb) 1,() 1/()1 (/) 1/(/22pnpFpnRpRpnQpUF) 1(1)1 (2*pntpnRcbtjjjj2*T1 12 2yyp pyxyRUb rb rb r b R*T*2*112ppxxjjjkkjjj kbb r bb R b2*2(=2()jjjjkkjjjkkjkRbxyRRb r bxxy对 的直接决定系数), 相关路对 的相关决定系数jkjjyjjkjjbrbRRR2*2)(2决策系数 【例4-5-2】 关于小麦产量y与其构成因素x1百粒重)、x2 (每株穗数)、x3(每穗粒数x4(每穗
53、粒重的通径分析试验为随机区组设计,参试品种10个,重复3次误差自由度为18,遗传型的自由度为9,遗传相关系数的显著性临界值为 x1X2X3X4yX110.2740.7060.5250.050X210.3000.4740.477X30.6650.256X410.440735. 0)9(,602. 0)9(01. 005. 0rr050. 0525. 0706. 0274. 0*4*3*2*1bbbb477. 0474. 0300. 0274. 0*4*3*2*1bbbb256. 0665. 0300. 0706. 0*4*3*2*1bbbb440. 0665. 0474. 0525. 0*4*3*2*1bbbb313. 0321. 0*2*1bb908. 0180. 1*4*3bb14 42.02240.09101.29640.15650.09101.29460.09350.6280()1.29640.09352.62491.10930.15650.62801.10932.1175xxjicR861. 0)9(,931. 0,867. 001. 0*2RRrbRjyj325. 3)9(,262. 2)9(, )9(9)1 (01. 005. 02*tttRcbtjjjj*4*3*2*12659.10,9826.11,5259. 4,713
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小班语言活动《水果屋》教案设计
- 小学生法制教育:法律小种子在童心发芽
- 2025公寓装修项目施工合同
- 2025项目经理施工的合同
- 2024-2025教科版科学一年级下册(2024)期末考试卷及答案
- 2025房屋租赁中介服务合同样本
- 颅内取栓术后护理
- 2025武汉市瓷砖买卖合同
- 2025双方委托设备维护保养合同范本
- 2025安置房买卖合同(协议)
- 26 跨学科实践“制作能升空的飞机模型”(教学设计)2024-2025学年初中物理项目化课程案例
- 数控刀片合金知识
- 2025届上海市(春秋考)高考英语考纲词汇对照表清单
- 内蒙古赤峰市松山区2023-2024学年八年级下学期期中考试数学试卷(含答案)
- 大型设备吊装地基处理方案
- 2025年公开招聘卫生系统工作人员历年管理单位笔试遴选500模拟题附带答案详解
- 智能垃圾桶产品介绍
- 2025深圳劳动合同下载
- 建筑工地住房安全协议书(2篇)
- 【MOOC】中医与辨证-暨南大学 中国大学慕课MOOC答案
- 设备稼动率分析报告
评论
0/150
提交评论