版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第七七章章 直线回归与相关分析直线回归与相关分析变量之间常常是变量之间常常是相互影响、彼此相关相互影响、彼此相关的,的,例如例如 产量与施肥量有关,产量与施肥量有关,病虫害发生时期与温度有关,病虫害发生时期与温度有关,小麦单位面积产量与单位面积穗数、每穗小麦单位面积产量与单位面积穗数、每穗粒数、千粒重有关,等等。粒数、千粒重有关,等等。常常需要研究两个或多个变量之间的关系。常常需要研究两个或多个变量之间的关系。变量间的关系有两类变量间的关系有两类,一类是变量间存在,一类是变量间存在着完全确定性的关系,可以用精确的数学表达着完全确定性的关系,可以用精确的数学表达式来表示。式来表示。如长方体的体
2、积(如长方体的体积(V V)与长()与长(a a)、宽()、宽(b b)、)、高(高(h h)的关系可以表达为:)的关系可以表达为: V=abhV=abh 它们之间的关系是确定性的,只要知道了其它们之间的关系是确定性的,只要知道了其中中3 3个变量的值就可以精确地计算出另一个变量个变量的值就可以精确地计算出另一个变量的值。的值。这类变量间的关系称为函数关系这类变量间的关系称为函数关系。另一类是变量间不存在完全的确定性关系,另一类是变量间不存在完全的确定性关系,不能用精确的数学公式来表示。不能用精确的数学公式来表示。如如 产量与施肥量的关系,产量与施肥量的关系,病虫害发生时期与温度的关系,病虫害
3、发生时期与温度的关系,小麦单位面积产量与单位面积穗数、每穗小麦单位面积产量与单位面积穗数、每穗粒数、千粒重的关系等。粒数、千粒重的关系等。这些变量间都存在着十分密切的关系,但这些变量间都存在着十分密切的关系,但由于随机误差的影响,不能由一个或几个变量由于随机误差的影响,不能由一个或几个变量的值精确地求出另一个变量的值。这样的变量的值精确地求出另一个变量的值。这样的变量在生物界中是大量存在的,统计学中把这类变在生物界中是大量存在的,统计学中把这类变量称为量称为相关变量相关变量。相关变量间的关系分为两种:相关变量间的关系分为两种:一种是因果关系,即一个变量的变化受另一种是因果关系,即一个变量的变化
4、受另一个或几个变量的影响。一个或几个变量的影响。如如 病虫害发生时期受温度的影响,病虫害发生时期受温度的影响,小麦单位面积产量受单位面积穗数、每穗小麦单位面积产量受单位面积穗数、每穗粒数、千粒重的影响;粒数、千粒重的影响;另一种是平行关系,即二个变量相互影另一种是平行关系,即二个变量相互影响,互为因果。响,互为因果。如小麦每穗粒数与千粒重之间的关系,如小麦每穗粒数与千粒重之间的关系,株高与穗长之间的关系等都属于平行关系。株高与穗长之间的关系等都属于平行关系。统计学上采用回归分析统计学上采用回归分析 研究呈因果关研究呈因果关系的相关变量间的关系。系的相关变量间的关系。表示原因的变量称为表示原因的
5、变量称为自变量自变量,表示结果,表示结果的变量称为的变量称为依变量依变量。研究研究“一因一果一因一果”,即一个自变量与一,即一个自变量与一个依变量的回归分析称为个依变量的回归分析称为一元回归分析一元回归分析;研究研究“多因一果多因一果”,即多个自变量与一,即多个自变量与一个依变量的回归分析称为个依变量的回归分析称为多元回归分析多元回归分析。一元回归分析又分为直线回归分析与曲一元回归分析又分为直线回归分析与曲线回归分析两种;线回归分析两种;多元回归分析又分为多元线性回归分析多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。与多元非线性回归分析两种。回归分析的任务回归分析的任务是揭示出呈
6、因果关系的是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量(结果)。(原因)来预测、控制依变量(结果)。统计学上采用相关分析研究呈平行关系统计学上采用相关分析研究呈平行关系的相关变量之间的关系。的相关变量之间的关系。对两个变量间的直线关系进行相关分析对两个变量间的直线关系进行相关分析称为称为直线相关分析(也叫简单相关分析)直线相关分析(也叫简单相关分析);对多个变量进行相关分析时,研究一个对多个变量进行相关分析时,研究一个变量与多个变量间的线性相
7、关称为变量与多个变量间的线性相关称为复相关分复相关分析析; 研究其余变量保持不变的情况下两个变量研究其余变量保持不变的情况下两个变量间的线性相关称为间的线性相关称为偏相关分析偏相关分析。在相关分析中,。在相关分析中,不区分自变量和依变量。不区分自变量和依变量。相关分析只研究两个变量之间线性相关的相关分析只研究两个变量之间线性相关的程度和性质或一个变量与多个变量之间线性相程度和性质或一个变量与多个变量之间线性相关的程度,不能用一个或多个变量去预测、控关的程度,不能用一个或多个变量去预测、控制另一个变量的变化。制另一个变量的变化。本章介绍直线回归与相关分析。本章介绍直线回归与相关分析。 第一节第一
8、节 直线回归分析直线回归分析对于两个相关变量对于两个相关变量x x和和y y,通过试验或调,通过试验或调查获得查获得n n对观测值,(对观测值,(x x1 1,y y1 1),(),(x x2 2,y y2 2),), ,(,(x xn n,y yn n),作出),作出散点图散点图。 从散点图可以看出:从散点图可以看出:两个变量间关系的类型,是直线还是两个变量间关系的类型,是直线还是曲线。曲线。 图(图(a a)、)、(d)(d)表明表明 x x 与与 y y是完全直线关是完全直线关系,这种情况在生物界不多见;图(系,这种情况在生物界不多见;图(b b)、)、(e) (e) 表明表明x x与与
9、y y是直线相关关系,这种情况在生物是直线相关关系,这种情况在生物界较常见;图(界较常见;图(f f)表明)表明x x与与y y是曲线关系,这是曲线关系,这种情况在生物界也较常见;图(种情况在生物界也较常见;图(c c)表明)表明x x与与y y无关。无关。两个变量间关系的性质(是同向增减两个变量间关系的性质(是同向增减还是异向增减。还是异向增减。 图(图(a a)、)、(b) (b) 表明表明 x x与与y y的直线关系是的直线关系是同向增减,图(同向增减,图(d d)、)、(e) (e) 表明表明 x x与与y y的是直的是直线关系是异向增减)和程度(是密切还是不线关系是异向增减)和程度(
10、是密切还是不密切)。密切)。是否有异常观测值。是否有异常观测值。 一、直线回归方程的建立一、直线回归方程的建立 如果呈因果关系的两个相关变量如果呈因果关系的两个相关变量x x与与y y间的间的关系是直线关系,由于依变量关系是直线关系,由于依变量x x与与y y间的关系是间的关系是直线关系,由于依变量直线关系,由于依变量 的实际观测值总是带的实际观测值总是带有随机误差,因而有随机误差,因而 可表示为:可表示为:yiiiyx( (i i=1,2, , =1,2, , n n) ) (7171) iy 为总体回归系数为总体回归系数 i i 为相互独立、且都服从为相互独立、且都服从N N(0 0,2
11、2) 的随机变量。的随机变量。 为总体回归截距为总体回归截距 其中,其中, 在在x x, ,y y的直角坐标平面上可以作出无数条直的直角坐标平面上可以作出无数条直线线 ,回归直线是指所有直线中最接近散点图全,回归直线是指所有直线中最接近散点图全部散点的直线。部散点的直线。 设直线回归方程设直线回归方程 为:为: yabx(7-2) (7-2) a a、b b应使回归估计值应使回归估计值与实际观测值的偏差与实际观测值的偏差平方和最小,即:平方和最小,即:22()()Qyyyabx最小最小 令令 Q Q对对a a、b b的一阶偏导数等于的一阶偏导数等于0 0,即:,即: 2()0Qyabxa 2(
12、)0Qyabx xb 整理得关于整理得关于a a、b b的正规方程组的正规方程组 anbxy2axbxxy 解正规方程组,得:解正规方程组,得:222()()/() /()()()xyxxyxynbxxnSPxxyyxxSSaybx(7-37-3) (7-47-4) (7-37-3)式中的分子是自变量)式中的分子是自变量x x的离均差与的离均差与依变量依变量y y的离均差的乘积和的离均差的乘积和 ,简,简称乘积和,记作称乘积和,记作 ,分母是自变量,分母是自变量x x的离均差的离均差平方和平方和 ,记作,记作 。()()xxyyxySP2()xxxSSa a叫做样本回归截距,是总体回归截距的叫
13、做样本回归截距,是总体回归截距的最小二乘估计值也是无偏估计值,是回归直线最小二乘估计值也是无偏估计值,是回归直线与与y y轴交点的纵坐标,当轴交点的纵坐标,当x x=0=0时,时, = =a a; y b b叫做样本回归系数,是总体回归系数叫做样本回归系数,是总体回归系数 的最小二乘估计值也是无偏估计值,表的最小二乘估计值也是无偏估计值,表示示x x改变一个单位,改变一个单位,y y平均改变的数量,平均改变的数量,b b的的符号反映了符号反映了x x影响影响y y的性质,的性质,b b的绝对值大小的绝对值大小反映了反映了x x影响影响y y的大小;的大小; 叫做回归估计值叫做回归估计值 ,是当
14、,是当x x在其研究在其研究范围内取某一个值时,范围内取某一个值时,y y总体平均数总体平均数( )的估计值。)的估计值。x y如果将(如果将(7-37-3)式代入()式代入(7-27-2)式,得到回)式,得到回归方程的另一种形式:归方程的另一种形式:()yybxbxyb xx(7-57-5) 【例【例7171】 江苏武进县测定江苏武进县测定1956-19641956-1964年年间间3 3月下旬至月下旬至4 4月中旬平均温度累积值月中旬平均温度累积值 ( (x x,单,单位:旬位:旬 度度) )和一代三化螟蛾盛发期和一代三化螟蛾盛发期 (y y,以,以5 5月月1010日为日为0 0)的资料
15、如下表,建立)的资料如下表,建立y y与与x x的直线回归的直线回归方程。方程。表表7-1 7-1 平均温度累积值平均温度累积值( (x x) )与一代三化螟盛发期(与一代三化螟盛发期(y y)资料)资料 1 1、作、作散点图散点图 -505101520293439444948.5485 1.0996yx(月/日)5/255/205/155/105/55/30 x,3月下旬至4月中旬平均温度累计值 y,一代三化螟盛发期图7-2 旬平均温度累积值和一代三化螟蛾盛发期的关系2 2、计算回归系数、计算回归系数b b,回归截距,回归截距a a,建立直线回归方程建立直线回归方程 /333.7/937.0
16、778xx n/70/97.7778yy n222/12517.49333.7/9144.6356xSSxxn 222/79470/9249.5556ySSyyn ()()/2436.4(333.7 70)/9159.0444xySPxyxyn /159.0444/144.63561.0996xyxbSPSS (天(天/ /旬旬度)度)7.7778( 1.0996 37.0778)48.5485aybx (天)(天) 直线回归方程为:直线回归方程为:48.5485 1.0996yx上述回归方程的显著性还有待检验。上述回归方程的显著性还有待检验。注意注意,由于实测区间为,由于实测区间为31.73
17、1.7,44.244.2,当,当 31.731.7或或 44.244.2时,时, 的变化是否还符合的变化是否还符合 的规律,还必须提供新的依据。的规律,还必须提供新的依据。 如果显著,回归系数如果显著,回归系数 = -1.0996= -1.0996的意义为:当的意义为:当3 3月下旬的积温(月下旬的积温( )每提高)每提高1 1旬旬 度时,一代三化螟度时,一代三化螟盛发期将平均提早盛发期将平均提早1.09961.0996天;天; bx回归截距回归截距 =48.5485=48.5485的意义为:若的意义为:若3 3月下旬的积月下旬的积温为温为0 0,则一代三化螟盛发期为,则一代三化螟盛发期为48
18、.548548.5485,即在,即在6 6月月27-27-2828日。日。axy48.5485 1.0996yxx 3 3、直线回归方程的离回归标准误、直线回归方程的离回归标准误 偏差平方和的大小表示了实测点偏差平方和的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。统计学已经证明:在直线回为离回归平方和。统计学已经证明:在直线回归分析中离回归平方和的自由度为归分析中离回归平方和的自由度为n n-2-2。2()yy于是可求得离回归均方为:于是可求得离回归均方为: 2() /(2)yyn离回归均方是模型(离回归均方是模型(7-17-
19、1)中方差)中方差2 2的估计的估计值。值。离回归均方的平方根叫离回归标准误,记离回归均方的平方根叫离回归标准误,记为,即为,即 yxS2()2yxyySn(7-67-6) 离回归标准误离回归标准误的大小表示了回归直线的大小表示了回归直线与实测点,即回归估计值与实际观测值与实测点,即回归估计值与实际观测值y y偏离偏离度的大小。度的大小。yxS y以后将证明:以后将证明:22()xyyxSPyySSSS(7-77-7) 对于【例对于【例7171】有】有 222144.6356()( 159.0444)249.555674.6670 xyyxSPyySSSS 所以所以 2()74.6670292
20、yxyySn=3.2660=3.2660(天)(天) 三、直线回归的显著性检验三、直线回归的显著性检验如何判断直线回归方程所反应的两个变如何判断直线回归方程所反应的两个变量间的直线关系的真实性呢?这取决于变量量间的直线关系的真实性呢?这取决于变量y y与与x x间是否存在直线关系,也就是须对直线回间是否存在直线关系,也就是须对直线回归进行显著性检验。归进行显著性检验。 直线回归显著性检验的方法有直线回归显著性检验的方法有F F检验和检验和t t检验两种。检验两种。 从从图图7-37-3看到,看到,可表示为与可表示为与 之和,即之和,即:()yy()yy()yy()()()yyyyyy则有则有:
21、 : 2()yy2()()yyyy 22()()2()()yyyyyyyy(一)(一)F检验检验1 1、依变量、依变量y y的总平方和与自由度的分解的总平方和与自由度的分解 由于由于()yabxyb xx所以所以()yyb xx于是于是 ()()()()yyyyb xxyy ()()()b xxyyb xx()()()()b xxyyb xxb xx 2xyxb SPbSS20 xyxyxyxxxSPSPSPSSSSSS 所以所以2()yy22()()yyyy(7-87-8) 反映了反映了y y的总变异程度,称为的总变异程度,称为y y的总平方和,记为;的总平方和,记为;2()yyySS反映了
22、由于反映了由于y y与与x x间存在直线关间存在直线关系所引起的系所引起的y y的变异程度,称为回归平方和,的变异程度,称为回归平方和,记为记为 ;2()yyRSS 反映了除反映了除y y与与x x存在直线关系存在直线关系以外的原因以外的原因 (包括随机误差)(包括随机误差) 所引起的所引起的y y的变异程度的变异程度 ,称为离回归平方和或剩余平,称为离回归平方和或剩余平方和方和 , 记为记为 。2()yyrSS 于是,(于是,(7-87-8)式又可表示为:)式又可表示为:yRrSSSSSS 与此相对应,与此相对应, yRrdfdfdf(7-97-9) (7-107-10) 在直线回归分析中在
23、直线回归分析中1Rdf 1ydfn2rdfn 、回归关系显著性检验、回归关系显著性检验F F 检验检验 对对y y与与x x间是否存在直线关系的假设检验其间是否存在直线关系的假设检验其无效假设:无效假设: =0=0,备择假设:,备择假设: 00。0HAH在无效假设成立的条件下,回归均方与离在无效假设成立的条件下,回归均方与离回归均方的比值服从和的回归均方的比值服从和的F F分分布,所以可以用布,所以可以用11df 22dfn/(2)RRRRrrrrMSMSdfSSFMSSSdfSSn, df1=1,df2=n-2 (7-11) 来检验回归关系即回归方程的显著性。来检验回归关系即回归方程的显著性
24、。 22() ()RSSyyb xx 222()xxybxxb SSbSP(7-12)2xyxyxyxxSPSPSPSSSS(7-13)2xyryRyxSPSSSSSSSSSS对于对于【例【例7171】 249.5556ySS ,159.0444xySP 144.6356xSS 22( 159.0444)174.8886144.6356xyRxSPSSSS,249.5556 174.888674.6670ryRSSSSSS 而,而, 于是于是 1,927Rrdfdf174.888616.4074.6670/7ReMSFMS , , , , p p0.010.01,表明一代三化螟蛾盛发期(,表明
25、一代三化螟蛾盛发期(y y)与积)与积温(温( )的直线回归关系极显著。)的直线回归关系极显著。0.01(1,7)12.25F0.01(1,7)16.4012.25FFx 3 3、回归系数的显著性检验、回归系数的显著性检验t t检验检验 回归系数显著性检验的无效假设和备择假回归系数显著性检验的无效假设和备择假设分别为设分别为 :0 0, :00。 0HAHt t检验的计算公式为:检验的计算公式为: ,bbtS2dfn(7-147-14) 其中,为回归系数标准误其中,为回归系数标准误 : yxbxSSSS(7-157-15) 对于【例对于【例7171】 ,已计算得已计算得1.0996b 144.
26、6356xSS 3.266yxS, , , 故有故有 3.2660.2715144.6356yxbxSSSS1.09964.050.2715bbtS , ,因因 , ,否,否定定 :0 0,接受,接受 :00,即一代三化螟,即一代三化螟蛾盛发期(蛾盛发期(y y)与积温()与积温(x x)的直线回归系数)的直线回归系数b b=-1.0996=-1.0996极显著,表明一代三化螟蛾盛发期极显著,表明一代三化螟蛾盛发期与积温间存在极显著的直线关系。与积温间存在极显著的直线关系。0.01(7)3.50t0.01(7)4.05tt0.01P 0HAH F F 检验的结果与检验的结果与t t检验的结果一
27、致。检验的结果一致。 事实上,统计学已证明,在直线回归分析事实上,统计学已证明,在直线回归分析中,这二种检验方法是等价的,可任选一种进中,这二种检验方法是等价的,可任选一种进行检验。行检验。 四、直线回归的区间估计四、直线回归的区间估计 经检验直线回归关系显著之后:经检验直线回归关系显著之后: 可用样本统计数可用样本统计数 来估计总体参来估计总体参数,数, ,ab, 可利用来估计某一值对应的总可利用来估计某一值对应的总体的平均数();体的平均数(); yxyx 还可对总体参数还可对总体参数,某一值对应的,某一值对应的总体的平均数()和单个观测值作出总体的平均数()和单个观测值作出区间估计,即求
28、出它们在一定置信度下的置信区间估计,即求出它们在一定置信度下的置信区间。区间。 ,xyxy表表7-27-2 回归截距,回归系数,总体回归截距,回归系数,总体平均数()和单个观测值平均数()和单个观测值 置信度为置信度为()的置信区间()的置信区间 xy1 【例【例7272】 根据【例根据【例7171】的资料估计:】的资料估计:(1 1)当)当3 3月下旬至月下旬至4 4月中旬的积温为月中旬的积温为4040旬旬 度时,历年的一代三化螟蛾平均盛发期在何时度时,历年的一代三化螟蛾平均盛发期在何时(置信度为(置信度为9595)?)?(2 2)某年)某年3 3月下旬至月下旬至4 4月中旬的积温为月中旬的
29、积温为4040旬旬 度时,该年的一代三化螟蛾盛发期在何时度时,该年的一代三化螟蛾盛发期在何时(置信度为(置信度为9595)?)?利用直线回归方程利用直线回归方程 计计算当算当 时的时的 , 48.5485 1.0996yx40 x y48.5485 1.0996 404.56y 因为因为 23.2661.351(4037.0778)9144.6356yS23.26613.531(4037.0778)9144.6356yS将将 =4.56=4.56、 、 2.36代入,得代入,得 所以所以 (1 1)在置信度为)在置信度为9595时,时, 的的 总体平均数(总体平均数( )的置信区间为:)的置信
30、区间为: 40 x yx0.05(7)0.05(7)()yyytSxytS y1.35ys0.05(7)t4.56(2.36 1.35)()4.56(2.36 1.35)x1.4()7.7x即当即当3 3月下旬至月下旬至4 4月中旬的积温为月中旬的积温为4040旬旬 度时,度时,历年的一代三化螟蛾平均盛发期在历年的一代三化螟蛾平均盛发期在1.4, 7.71.4, 7.7或或5 5月月12181218日,置信度为日,置信度为9595。(2 2)在置信度为)在置信度为9595时,时, 的单个观的单个观测值测值 的置信区间为:的置信区间为:40 x y0.05(7)0.05(7)yyytSyytS将
31、将 =4.56=4.56、 、 2.36代入,代入,得得 y3.53ys0.05(7)t4.56(2.36 3.53) 4.56(2.36 3.53)y 3.819.9y 即当某年即当某年3 3月下旬至月下旬至4 4月中旬的积温为月中旬的积温为4040旬旬 度时,度时,该年的一代三化螟蛾盛发期在该年的一代三化螟蛾盛发期在-3.8, 19.9-3.8, 19.9或或5 5月月630630日,置信度为日,置信度为9595。类似地,可求出取其它值时总体平均数类似地,可求出取其它值时总体平均数()和单个观测值的()和单个观测值的95%95%置信区间,列于表置信区间,列于表7-37-3。 xyx表表7-
32、3 7-3 一代三化螟蛾盛发期一代三化螟蛾盛发期95%95%置信区间置信区间 从从和的计算公式看出,越接近,和的计算公式看出,越接近,和越小,置信区间的置信距也越小,预测越和越小,置信区间的置信距也越小,预测越精确。精确。 ySySxx ySyS第二节第二节 直线相关分析直线相关分析进行直线相关分析的基本任务在于根据进行直线相关分析的基本任务在于根据x x、y y的实际观测值计算表示两个相关变量的实际观测值计算表示两个相关变量x x与与y y线性相线性相关程度和性质的统计数关程度和性质的统计数相关系数相关系数r r,并进行,并进行显著性检验。显著性检验。 一、决定系数和相关系数、决定系数和相关
33、系数已经证明了等式:已经证明了等式: 2()yy22()()yyyy。 从这个等式不难看到:从这个等式不难看到:y y与与x x直线回归效果的好坏直线回归效果的好坏取决于回归平方和与离回归平方和取决于回归平方和与离回归平方和的大小,或者说取决于回归平方和在的大小,或者说取决于回归平方和在y y的总的总平方和中所占比例的大小。这个比例越大,平方和中所占比例的大小。这个比例越大,y y与与x x的直线回归效果就越好,反之则差。的直线回归效果就越好,反之则差。2()yy2()yy2()yy2()yy比值叫做比值叫做x x对对y y的决定系的决定系数数 ,记为,记为 r r2 2,即,即2() /yy
34、2()yy222()()yyryy(7-167-16) 决定系数的大小表示了回归方程估测可靠决定系数的大小表示了回归方程估测可靠程度的高低,或者说表示了回归直线拟合度的高程度的高低,或者说表示了回归直线拟合度的高低,显然低,显然00r r2 211。 因为因为2222()()xyxyxyyxxyxyxySPSP SPyyrb byySS SSSSSS而而SPSPxyxy/ /SSSSx x是以是以x x为自变量、为自变量、y y为依变量时的为依变量时的回归系数回归系数b byxyx。 若把若把y y作为自变量、作为自变量、x x作为依变量,则回归作为依变量,则回归系数系数b bxyxy= =S
35、PSPxyxy/ /SSSSy y。 所以决定系数所以决定系数r r2 2等于等于y y对对x x的回归系数与的回归系数与x x对对y y的回归系数的乘积。的回归系数的乘积。这就是说,决定系数反应了这就是说,决定系数反应了x x为自变量、为自变量、y y为依变量和为依变量和y y为自变量、为自变量、x x为依变量时两个相关变为依变量时两个相关变量量x x与与y y直线相关的信息,即决定系数表示了两个直线相关的信息,即决定系数表示了两个互为因果关系的相关变量间直线相关的程度。但互为因果关系的相关变量间直线相关的程度。但决定系数介于决定系数介于0 0和和1 1之间,不能反应直线关系的性之间,不能反
36、应直线关系的性质质是同向增减或是异向增减。是同向增减或是异向增减。若求若求r r2 2的平方根,且取平方根的符号与乘的平方根,且取平方根的符号与乘积和积和SPSPxyxy的符号一致,即与的符号一致,即与b bxyxy 、b byxyx的符号一致,的符号一致,这样求出的平方根既可表示这样求出的平方根既可表示y y与与x x的直线相关的的直线相关的程度,也可表示程度,也可表示y y与与x x直线相关的性质。直线相关的性质。统计学上把这样计算所得的统计数称为统计学上把这样计算所得的统计数称为x x与与y y的相关系数的相关系数, ,记为记为r r,即,即xyxySPrSS SS(7-17)2222(
37、)()()()xyxynxyxynn(7-18)显然显然 -1-1r r11。当。当r r0 0时,相关变量时,相关变量x x与与y y异向增减,称为异向增减,称为x x与与y y负相关;当负相关;当r r0 0时,相关变时,相关变量量x x与与y y同向增减,称为同向增减,称为x x与与y y正相关。正相关。【例【例7373】 计算【例计算【例7171】资料】资料3 3月下旬月下旬至至4 4月中旬积温和一代三化螟蛾盛发期的决定系月中旬积温和一代三化螟蛾盛发期的决定系数和相关系数。数和相关系数。已经算得已经算得249.5556ySS 144.6356xSS 、159.0444xySP 222(
38、 159.0444)0.7007.144.6356 249.5556xyxySPrSS SS 、表明,用一代三化螟盛发期(表明,用一代三化螟盛发期(y y)与)与3 3月下月下旬至旬至4 4月中旬积温(月中旬积温(x x)的直线回归方程来进行)的直线回归方程来进行预测其可靠程度为预测其可靠程度为70.0770.07。 .159.04440.8371144.6356 249.5556xyxySPrSS SS 二、相关系数的显著性检验二、相关系数的显著性检验 上述根据实际观测值计算得来的上述根据实际观测值计算得来的r r是样本相是样本相关系数,关系数, 它是双变量正态总体的总体相关系数它是双变量正
39、态总体的总体相关系数的估计值。样本相关系数的估计值。样本相关系数r r是否来自是否来自00的的总体,还须对样本相关系数总体,还须对样本相关系数r r 进行显著性检验。进行显著性检验。此时无效假设、备择假设为此时无效假设、备择假设为: : :0H=0=0,AH00。 采用查表法对相关系数采用查表法对相关系数r r进行显著性检验进行显著性检验 具体作法是:具体作法是: 先根据自由度先根据自由度n n-2-2查临界查临界r r值值( (附附表表8)8),得,得 0.05(2)nr ,0.01(2)nr。若若| |r r| | ,p p0.050.05,则相关系数,则相关系数r r不显著,在不显著,在
40、r r的右上方标记的右上方标记“nsns”或不标记符号;或不标记符号; 0.05(2)nr若若 |r r| | ,0.010.01p p0.050.05,则相关系数,则相关系数r r显著,在显著,在r r的右上方标记的右上方标记“* *”; 0.05(2)nr0.01(2)nr若若| |r r| | ,p p0.010.01, 则相关系则相关系数数r r极显著,在极显著,在r r的右上方标记的右上方标记“* * *”。0.01(2)nr对于【例对于【例7373】,】, =0.666=0.666, =0.798=0.798,而而 | |r r|=0.8371|=0.8371 ,p p0.010.
41、01,表明一代三,表明一代三化螟盛发期与化螟盛发期与3 3月下旬至月下旬至4 4月中旬积温的相关系数月中旬积温的相关系数极显著,即一代三化螟盛发期与极显著,即一代三化螟盛发期与3 3月下旬至月下旬至4 4月中月中旬积温呈极显著负相关,积温越高,螟蛾的盛发旬积温呈极显著负相关,积温越高,螟蛾的盛发期越早。期越早。 0.05(7)r0.01(7)r0.01(7)r 三、直线相关分析与回归分析的关系三、直线相关分析与回归分析的关系相关变量相关变量x x与与y y的相关系数的相关系数r r是是y y对对x x的回归系的回归系数数 与与x x对对y y的回归系数的回归系数 的几何平均数:的几何平均数: yxbyxxyrb byxb这表明直线相关分析与回归分析关系十分密这表明直线相关分析与回归分析关系十分密切。切。 直线回归分析将二个相关变量区分为自变量和依直线回归分析将二个相关变量区分为自变量和依变量,侧重于寻求它们之间的联系形式变量,侧重于寻求它们之间的联系形式直线回归直线回归方程;方程;直线相关分析不区分自变量和依变量,侧重于揭直线相关分析不区分自变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版市政工程挖掘机租赁及施工配合合同协议书3篇
- 2025版智能交通管理系统软件开发与运营服务合同3篇
- 2025版城市绿地养护劳务分包合同模板4篇
- 企业人力资源管理概念
- 二零二五版知识产权保密与竞业限制服务合同3篇
- 塑料薄膜光学性能研究考核试卷
- 2025版事业单位教师岗位聘用合同续签协议书3篇
- 2025年度码头转租及船舶停靠服务外包合同4篇
- 04毛首鞭形线虫简称鞭虫47课件讲解
- 2025年食品行业食品安全风险评估合同范本3篇
- 垃圾处理厂工程施工组织设计
- 天疱疮患者护理
- 2025年蛇年新年金蛇贺岁金蛇狂舞春添彩玉树临风福满门模板
- 《建筑制图及阴影透视(第2版)》课件 4-直线的投影
- 新生物医药产业中的人工智能药物设计研究与应用
- 防打架殴斗安全教育课件
- 损失补偿申请书范文
- 压力与浮力的原理解析
- 铁路损伤图谱PDF
- 装修家庭风水学入门基础
- 移动商务内容运营(吴洪贵)任务二 社群的种类与维护
评论
0/150
提交评论