薪酬设计回归分析_第1页
薪酬设计回归分析_第2页
薪酬设计回归分析_第3页
薪酬设计回归分析_第4页
薪酬设计回归分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关与回归分析第一节简单线性相关分析一、相关关系的概念与种类(一)相关关系的概念在自然界和人类社会中, 普遍着存在现象之间的相互依赖、相互制约的关系。一些现象在数量上的发展变化经常伴随着另一些现象数量上的发展变化。现象间的数量关系可分为两种基本类型:函数关系。它是指现象间存在的严格依存的、确定的因果关系,一种现象的数量变化必然决定着另一种现象的数量变化,这种关系可通过精确的数学表达式来反映,比如,圆面积同其半径的关系为 s=n r2,自由落体落下的距1 2离同时间的关系为h= gt2,等等。相关关系。指的是现象之间确实存在着数量关2系,但这种关系不是严格确定的,当一种现象的数量发生变化时,另一

2、种现象的数量可能在一定范围内发生变化,出现不同的数值。比如,单位产品成本同产量之间的关系,一般说来,当工厂规模扩大,产品产量增加时,单位产品成本会随之下降,这种 变化趋势体现了规模经济的效应,具有客观性和普遍性。 但由于影响产品成本的因素众多,有主要的,也有次要的,有必然的,也有偶然的,有随机的,也有非随机的, 有观察得到的,也有观察不到的,等等。同一产量水平下,可能会出现各种各样的单 位成本,或者某一确定的单位成本对应着不同的产量,两者的关系不是唯一确定的。 粮食收获量与施肥量之间、商品价格与需求量之间、 身高与体重之间等都具有类似的特征,这种关系就是相关关系。函数关系与相关关系既有区别,又

3、有联系。由于观察和实验中的误差,函数关系往往通过相关关系表现出来;而当对现象之间的内在联系和规律性了解得更加清楚的 时候,相关关系又可能转化为函数关系。在社会经济领域里,一般说来,函数关系反 映了现象间关系的理想化状态,相关关系则反映了现象间关系的现实化状态,只有在大量观察时,在平均的意义上,它才能被描述。综上所述,相关关系是现象之间确实存在的,但关系数值不固定的相互依存关系。 相关分析则是研究一个变量与另一个变量或另一组变量之间相关密切程度和相关方 向的一种统计分析方法。(二)相关关系的种类现象之间的相关关系是很复杂的,从不同的角度看,相关关系有不同的种类。1. 固定相关和随机相关。 按变量

4、的性质(是否是随机变量),相关关系可分固定相 关和随机相关。固定相关是指一个随机变量与另一个或一组非随机变量之间的的相关关系。例如,农作物的施肥量是一个可控制的变量,农作物收获量是一个不确定的变量,两个变量之间的关系表现为一个随机变量与另一个非随机变量之间的固定相关。 随机相关是指一个随机变量与另一个或一组随机变量之间的相关关系。例如,大学生的身高和体重之间的关系就是两个随机变量之间的随机相关关系,如果观察某一身高的一组学生时,其体重各不相同,会形成一个分布;如果观察某一体重的一组学生时, 其身高也不相同并形成一个分布,两个变量均为随机变量。2. 简单相关和多元相关。按变量的多少,相关关系可分

5、为简单相关和多元相关。 简单相关,又称单相关,是指一个随机变量与另一个随机变量或非随机变量之间的相 关关系;多元相关,又称复相关,是指一个随机变量与另一组随机变量或非随机变量 之间的相关关系。按变量之间的相关方向不同, 简单相关又可分为正相关和负相关。当自变量的值增加,因变量的值也相应地增加;自变量的值减少,因变量的值也随之减少时,这样 的相关关系就是正相关。反之,当自变量的值增加时,因变量的值随之减少;自变量 的值减少时,因变量的值反而增加,具有这种特点的相关关系就是负相关。多元相关可进一步分解为简单相关和偏相关。 偏相关是指在测定一个随机变量与 某个或某些随机变量或非随机变量之间的相互关系

6、后,该随机变量与某一新增加的随机量或非随变量之间的相关关系,又称之为净相关。3. 线性相关和非线性相关。按变量之间的相关形式,相关关系可分为线性相关和非线性相关。若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系表 现为线性组合时,则称它们之间的相关关系为线性相关。反之,若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系不能表现为线性组合,而只能表现为非线性组合时,则称它们之间的相关关系为非线性相关。4. 完全相关、不完全相关和不相关。按变量之间的相关程度不同,相关关系可分为完全相关、不完全相关和不相关。若一个变量的值完全由另一个或一组变量的值所 决定,则称变量之间的这种相

7、关关系为完全相关,即函数关系。若一个变量的值与另一个或一组变量的值有关, 但其中要受到随机因素的影响,则称变量之间的这种相关关系为不完全相关。 若一个变量的值完全不受另一个或一组变量值的影响,则称变量之间不相关。大量社会经济现象之间的相关关系都属于不完全相关,不完全相关是相关分析的基本内容。完全相关和不相关可视为相关关系中的特例。二、简单线性相关图表判定两变量之间的相关程度和相关方向是简单线性相关分析的重要内容之一。其最简单、最直观的方法就是列相关表、绘制相关图。简单线性相关关系有固定简单线性相关与随机简单线性相关之分。简单线性相关图表可用于直观地表明这两类简单线性相关变量之间的相关程度和相关

8、方向。(一)固定简单线性相关图表已知有两个变量,设 y是随机变量,x是非随机变量,对应于 x的每一个给定的取值,y有多个可能的取值,但在一次试验中,y只取其中一个可能值。由于 x是非随机变量,在实验中其取值可以控制并重复进行,所以在n次试验中,x可能取n个相同或不同的值,相应地也有 n个y的值,即得到一一对应的样本资料 (x,y)。将这 些数据按x的取值由小到大依次对应排列, 即构成固定简单线性相关表, 又称之为一 维相关表。例9.1 某地区居民人均收入水平 具有相关关系,编制相关表如下(见表(x)与其食品支出占生活费支出比重9-1):(y)之间表9-1一维相关表人均收 入水平 (元)x280

9、3203905306506707908809101050食品支 出占生 活费支 出比重(%)y68.367.566.264.956.760.254.449.050.543.6从表9-1可以粗略看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重有下降的趋势。将一一对应的(x,y)描点于坐标系上,即构成散点图,又称相关图。在相关图上, 以横轴表示非随机变量(x),以纵轴表示随机变量(y),通过观察各对变量值坐标点 的分布状况,可以大致判断变量之间相关的形态、方向和密切程度。禾U用表9-1资料,可绘制相关图如下(见图9-1):80%重比的出支用费活生占出支品食y706040 30 -50-

10、20 -10 -x01002003004005006007008009001000 1100人均收入水平(元)图9-1居民人均收入水平与其食品支出的关系图从图9-1可以看出,随着居民人均收入水平的提高,食品支出占生活费支出的比 重明显降低,并大致呈线性下降趋势,即负线性相关。一些常见的相关分布状态可用下述各图表示(见图9-2):xxx xx xx较显著的线性正相关较显著的线性负相关xxxx x不相关不显著的线性负相关图9-2 几种常见的相关散点图(二)随机简单线性相关图表设x、y为两个随机变量,将观测值 (x,y)分组之后按顺序排列,x从小到大排 列,y从大到小排列,形成一棋盘式平衡表,称之为

11、二维相关表。例9.2某地区为研究降雨量和农作物平均每亩收获量的关系,从40个降雨量不同的试验田中获得40对数据。用x表示降雨量,y表示平均每亩收获量。据此可编出二维相关表如下(见表 9-2)。该表中,中间每一格列出的是 x、y的联合频数,它表明 x和y同时取某值的次 数;最后一列每一格是每一行的联合频数的和, 它表明y取某值的次数;最后一行每 一格则是每一列的联合频数的和,它表明 x取某值的次数。24022262202351112001363131801231601113列和(f i)36141151P 40从表9-2可以粗略看出,降雨量与收获量之间大致呈线性正相关关系。 利用表9-2资料,可

12、绘制相关图如下(见图9-3):2802602 #1*12402 .222201 2 *3 *5 1200 1 *3 *6 3180t-1 21601 *1 114012010080604020tox01 li1)II)0246810 121416 18 20降雨量(毫米)斤公量获收亩每均平图9-3降雨量与收获量之间相关图三、简单相关系数二2 XY式中,匚X禾口二Y表示变量X和Y的标准差,对有限总体而言,其计算公式为Ox)2f NPY)2N(式 9.2)(式 9.3)(一)简单相关系数的意义简单线性相关图表虽然直观,但不能精确地描述现象间的相关关系。测量两个变量之间线性相关程度和相关方向的指标,

13、称为简单相关系数。总体相关系数一般用 R表示,定义式为(式 9.1)-2xy表示两个变量 X和Y之间的协方差,计算公式为:二 2xy 二(式 9.4 )这里,变量X和Y为总体变量,N为总体单位数,ix和y分别为变量X及Y的总体平均数,计算式为(式 9.5)(式 9.6)要理解相关系数 R的意义,首先要明确协方差;. 2 XY和标准差二X、厂Y在反映变 量之间相关关系中的作用。、.、 2协方差二xy反映了变量X和Y的共变性,可以显示两个变量的相关方向和相关 关系的密切程度,它可能出现以下几种情况:第一,所有相关点均为正相关,则二2XY 0 ,说明两个变量之间正线性相关。第二,所有相关点均为负相关

14、,则二2xy 0 ,说明两个变量之间负线性相关。第三,在全部相关点中,既有正相关、又有负相关和零相关,在计算协方差时就 会出现正负抵销。抵销的结果如为正数则是正相关,如为负数则是负相关。数值大表示相关程度强,数值小则表示相关关系弱。若正、负全部低销掉了,结果为零,则表 示不相关。第三种情况是实际经济生活中最常见到的情况。此外,还有两种极端的情况: 当所有相关点都是零相关时, 抵销结果为零,表示两个变量完全没有相关关系。 当所有 相关点全部落在直线上时,表示两个变量完全线性相关,即存在函数关系。进一步,相关系数是一个界于 +1和-1之间的数,即-1 401842400 -85202=0.67四、

15、相关系数的统计推断总体相关系数 R一般是未知的,能够计算出的只是样本相关系数r,r虽然能够提供关于总体相关程度与方向的某种信息,r愈大,在一定程度上说明总体相关程度愈高,但也可能犯错误。这就需要根据样本资料对总体相关系数R进行检验和估计。(一)关于总体相关系数 R的检验由于相关系数r的分布复杂,不能直接利用它去进行统计推断,但如果设1 1 RZr= |n()(式 9.15)2 1 -R1 1亠rzr= ln( ) (式 9.16)2 1-r可以证明,当样本(x,y )抽自正态分布总体时,zr近似服从平均值为 Zr,方差为丄n -3的正态分布,于是z=(z r-Z r) . n 3(式 9.17

16、)近似服从标准正态分布。据此可以检验 禾U用例9.1资料,R=-0.90,统计假设为计算的样本相关系数R=R(R=0)r=-0.98,是否可以认为总体相关系数此时,于是,检验统计量z=(zr-ZR).一 n - 3=(-2.298+1.472)H0:H:1 R1 R)1 r1 Zr=ln(21 一 一乙=;| n()21 -.r.10 -3R=-0.90R-0.901 1-0.90、,门ln() =-1.4722 10.901 1-0.98、_ln() 2.2982 10.98=-2.185当显著水平a =5%寸,查正态分布表可得Za = Z0.025 = 1.96 a Z二-2.186 ,2

17、故否定H),接受H,即不能认为总体的相关系数R=-0.90。同理,也可以对总体相关系数进行单边检验。(二)关于总体相关系数 R的区间估计首先,求出Zr的估计区间。若与估计保证程度对应的概率度为Z, Zr的估计区间就为Z对于例9.1 , Zr的95%置信估计区间为-2.298-1.96.10 -3乞 ZR2.298+1.96,10 -3即-3.039Z1-1.557根据Zr的置信区间,可以换算出 R的置信区间:1 1 + R当 Zr=_1 n() =-3.039 时,R=-0.992 1 -R1 1 + R当 Zr=|n() =-1.557 时,R=-0.922 1 -R计算结果说明,居民人均收

18、入水平与食品支出占生活费支出比重之间的总体相关 系数R的95%的置信区间为-0.99至-0.92。同理,也可类似地对例 9.2进行分析,请读者自己思考。第二节简单线性回归分析一、回归分析的概念和种类从历史上看,“回归”概念的提出是要早于“相关”的,生物统计学家高尔顿在 研究豌豆和人体的身高遗传规律时,首先提出“回归”的思想。1887年,他第一次将“回复” (Reversion )作为统计概念使用,后改为“回归”(Regression ) 一词。1888年他又引入“相关”(Correlation )的概念。原来,他在研究人类身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身高总有向一般人口

19、的平均身高回归的倾向。通俗的讲就是,高个子父母,其子女一般不象他们那样高,而矮个子父母,其子女一般也不象他们那样矮,因为子女的身高不仅受到父母的影响(尽管程度最 强),还要受其上两代共四个双亲的影响(尽管程度相对弱一些),上三代共八个双亲的影响(尽管程度更加弱一些),如此等等,即子女的身高要受到其 2n(n趋近无穷) 个祖先的整体(即总体)影响,是遗传和变异的统一结果。回归和相关已成为统计学中最基本的概念之一,其分析方法已是最标准、最常用的统计工具之一。从狭义上看,相关分析的任务主要是评判现象之间的相关程度高低 以及相关的方向的,而回归分析则是在相关分析的基础上进一步借用数学方程将那种 显著存

20、在的相关关系表示出来,从而使这种被揭示出的关系具体化并可运用于实践中 去。但也常从广义的角度去理解相关和回归,此时回归分析就包含着相关分析。回归分析最基本的分类就是一元回归和多元回归,前者是指两个变量之间的回归分析,如收入与意愿支出之间的关系;后者则是指三个或三个以上变量之间的关系, 如消费支出与收入及商品价格之间的关系等。进一步,一元回归还可细分为线性回归和非线性回归两种,前者是指两个相关变量之间的关系可以通过数学中的线性组合来描述,后者则没有这种特征, 即两个相关变量之间的关系不能通过数学中的线性组合来描述,而表现为某种曲线模型。二、简单线性回归方程总体的简单线性回归模型可表示为Y=A+B

21、X+e (式 9.18)上式中,X称为自变量,Y称为因变量,e称为随机误差值。从这里可以看出相关分析与回归分析的显著区别,在前述的相关分析中通常可以将变量X和Y视作是某种“对等”的因素,而在这里的回归分析中,它们却是不“对 等”的。自变量是解释变量或预测变量,并假定它是可以控制的无测量误差的非随机变量;相反,因变量是被解释变量或被预测变量,它是随机变量,即相同的Y可能是由于不同的X所造成,或者相同的 X可能引起不同的 Y,其表现正是随机误差项 e。 随机误差值e是观察值Y能被自变量X解释后所剩下的值, 故又称为残差值,它是随 机变量。A和B为未知待估的总体参数,又称其为回归系数。由此可见,实际

22、观测值Y被分割为两个部分:一是可解释的肯定项A+BX二是不可解释的随机项 e。与相关分析类似,总体的回归模型Y=A+BX+e是未知的,如何根据样本资料去估计它就成为回归分析的基本任务。由此可以假设样本的回归方程如下:= a bx (式 9.19)上式中,Y?、a和b分别为丫、A和B的估计值。如果对变量X和Y联合进行n次观察,就可以获得一个样本(x,y),据此就可 求出a、b的值。求a、b的方法有多种,但一般是采用最小平方法。它要求观察值y与估计值丫?的离差平方和达到最小值,即Q = 3(y -丫)2 = 3(y - a - bx)2=最小值满足这一要求的a和b可由下述标准方程求出解方程得:b

23、JD叮)冲今(式 9.20 ) 二(x-x)n二x -(=x)a 二 y-bx=-b-(式 9.21)n n例9.3为研究某类企业的生产量和单位成本之间的关系,现随机抽取10个企业,得如下数据(见表9-7 ):根据该资料,经计算可得表 9-8 :表9-7 10个企业的生产量和单位成本情况编号12345678910产量(万件)2344566789单位成本(元/件)52545248484645444038表9-8兀线性回归计算表编号产量(万件)x单位成本(元/件)y2x2 yxy彳y-Y?12524270410454.35-2.3523549291616252.101.90345216270420

24、849.852.15444816230419247.85-1.85554825230424047.600.40664636211627645.350.65764536202527045.35-0.35874449193630843.100.90984064160032040.85-0.851093881144434238.60-0.60合计54467336 :220532422 4670由上表资料,可得:n Fxy 龙Xy10 X 2422 54 x 467b22 =2= - 2.25n2x - (=X)10336 -54心、1X 46754ab(-2.25)= 58.85n n io10这样

25、就可以得到生产量(x)和单位成本(y)之间的样本回归方程Y = a bx =58.85-2.25x在简单线性回归方程 Y?二a,bx中,a为截距,b为斜率,后者表示自变量x变 化一个单位时,Y?将平均变化b个单位。当b取正值时,表明x和y的变化方向相同, 当b取负值时,表明x和y的变化方向相反。本例中,b =-2.25,表明产量每增加1万件时,单位成本将平均下降2.25元。根据样本资料获得的回归方程 Y = a bx又称为经验方程,如果计算出观察值 y 的估计值Y?,并进一步求出残差 y- Y?,就可以观察回归方程对总体方程拟合的优良 程度。对于某一特定的自变量 x而言,观察值y同其估计值Y?

26、是有一定差别的,比如,当产量为5万件时,实际单位成本为 48元,而其估计值为 47.60元,两者相差0.4 元,但全部残差项之和等于零 (见表9-8),这说明估计值平均来说是无偏的。 事实上, 最小平方估计量还满足下式工(y- Y?)=0这里,Y表示估计值Y?的平均值,即 =空n从理论上讲,最小平方法具有优良特性,因为参数 A、B的最小平方估计量 a、 b是最优的线性无偏估计量,这一性质通常称为“高斯一马尔科夫定理”,这也是最小平方法获得广泛应用的主要原因。此外,如果记随机误差项 e的方差为它也是未知的总体参数,其无偏估计量为Q _ 1(y -Y)2n-2 n-2(式 9.22)上式中,Q =

27、(y -Y?)2称为剩余离差平方和或残差平方和,n-2为自由度。三、离差分析对于某一个观察值 yi,其离差大小可通过观察值yi与全部观察值的均值 y之差yi- y表示出来,yi - y又可进一步分解为Y?- y和yi-Y?两部分,即yi- y =(Y?- y)+( yi-y?)可以证明,当变量 X和Y之间线性相关时,还进一步存在下述等式关系1( y- y)2=(Y?- y)2+u( y-Y?)2通常记_ 2T( y- y)R( Y?- y)2分别称T、R和Q为总离差平方和、回归离差平方和和剩余离差平方和。总离差平方和反映了样本中全部数据的总波动程度;回归离差平方和反映了回归估计值自身的离散程度

28、,它是由于回归方程及自变量x取值不同所造成的,是可以解释的差别;剩余离差平方和是回归拟合后所剩下的部分,是不能解释的变差,故又称为残差平方和。显然,T中R的比重愈大,或者Q的比重愈小,则说明线性回归拟合愈好, 反之, 拟合就愈差。由此可以建立下述指标(式 9.23)称r2为样本相关程度的判定系数,珂T为样本相关系数。由此就可直观地看2出r和r(1)(2)(3)(4)步判定。2=224.78的特性:2r 1 或-1 _r _+1|r|愈接近于1,相关程度愈强;|r|愈接近于0,相关程度愈弱。r取正值时表明正相关,r取负值时表明负相关。r只能表明总体是否可能存在线性相关,当 |r|很小甚至接近于

29、0时,只能说明总体可能不存在线性相关,但是否存在非线性相关还需进从计算角度看,上述几种离差还可表示为T=Z( y - y )2= y2 _(2y)2nR-(Y?- y)2=b2= x- x )2=b2 Zx2Q = 1(y -Y?)2=T-R对于例9.3,有2 1 2 1 2T=3y2Zy) 2 =22053-X (467) =244.10n102 2 1 2 2 1R= b Zx-x)2=(-2.25)X 336-X (54)n10Q =T-R=244.1-224.78=19.32计算结果说明:单位成本的总离差平方和为244.10,其中由于产量变化所造成的为224.78 ,占92.09%,由

30、于产量以外的所有因素共同造成的为19.55,占8.01%。r=224.78244.10=0.96据此计算的相关系数为四、统计推断依据样本数据得到的经验回归方程,是否能够较好地拟合了总体的实际情况,须通过统计检验加以判断。Y服从正态分布时,从中随机抽取样本( x, y),回归系数 A a和b也服从正态分布,其平均值分别为(式 9.24)a =ab =B(式 9.25)可以证明:当变量 和B的最小平方估计值方差分别为2-a二 2 Lx2-n(x -乂)2(式 9.26)nLx2-x)2 n2-b =CT2gx)2CT2Lx2 -丄)2n(式 9.27)于是,就可建立两个标准正态统计量a A z =

31、cra(式 9.28)(式 9.29)222并且,二a和二b的计算式中-一般未知,但其无偏估计量为n 2 n 2据此对A和B进行统计假设检验的步骤如下(仍以例 9.3的资料):(1)检验A第一步:建立统计假设H):A=OH:A#0第二步:计算z统计量由于:?2 二n 219.32=2.41510 -2:?&2Hx22 1 2 n* -x) n2.415 336=1.8281210 336542 10;?a = .1.828 =1.352因此,检验统计量为a - A 58.85 - 0=43.5281.352第三步:确定显著水平,做出判断若设a =5%经查表得=Z0 975 =1.96z=43.

32、528,拒绝零假设,即认为回1_S*2归系数A显著的不为零。(2)检验B同理,可对回归系数 B进行检验。若统计假设为H):B=0H:B却c?221 2IX2(9)2n此时2.415=0.0541233654210:?b = 0.054=0.233检验统计量- 2.25-0=-9.6570.233由于Z . = z0.975 =1.96|z|=9.657,拒绝零假设,即认为回归系数B也显著的不1 2等于零,说明单位成本同产量之间存在显著的线性相关关系。与前面的讨论类似,也可对A和B进行单边检验以及 A和B是否显著的与某一确定值相同或不相同的检验。 但通常进行的是对 A=0和B=0的检验。对A=0

33、的检验是考 察回归直线是否通过坐标原点;由于B表示X变化一个单位时对 Y的影响程度,因此对B=0的检验实际是考察这种程度是否为零,即是否存在线性相关关系。另外,通过最小平方法获得的 a和b只是A和B的点估计量,在此基础上可进一 步给出它们的区间估计。当置信度为1 a时,A和B的置信区间分别为a-EA a +Aa(式 9.30)b-=b 空 A :Sb+=b(式 9.31 )这里乙=Z -.6(式 9.32 )二 b=z -.6(式 933 )i舍2对于例9.3,当置信概率为95%寸? =z ? =1.96 X 1.352=2.65a 1丄a2?b = z 一 ;?b =1.96 X 0.233

34、=0.4612于是可得A和B的置信区间分别为58.85-2.65 A 58.85+2.65即 56.20 - A _61.50-2.55-0.46 B -2.55+0.46即-3.01 B 2.09X=Xo五、回归预测拟合的回归方程及其参数通过检验后,经常要应用它去预测,显然,给定 时,Y的点预测量为(式 9.34 )(式 9.35)(式 9.36)Y? = a + bx0Y的置信度为1-的区间预测量为Y?-s 兰 Y d?+%这里5=育 Y022.(X。-X)23(xX)2=:;21 1 _(X X)(式 9.37 )n女一丄)2n接上面的例子,当产量为 10万件时,单位成本的点预测值为Y。

35、=a bx0=58.85-2.2510=36.35 (元)由于2-Yo.(X。X)2 Lx2 丄()2n54 21 (10)2=3.807=2.4151 10 -10336- 汇54210二丫0 =、3.807 =1.951当产量为10万件,置信度为95%寸,由于?Y =z 一;2 =1.96 X 1.95仁3.82 丫01、丫02_于是可得单位成本的预测区间为Y0- ?0 y 兰丫0+&丫36.35-3.82 Y 36.35+3.82即32.53元乞Y 2X2 =-0.23410从而可得经验方程133- (-0.697 )39 =7.50610 10Y = a +biXi+b2X2=7.50

36、6+0.234x i-0.697x回归方程表明:在价格不变情况下,消费者收入增加1百元时,对该商品的需求 平均上升0.234件;在消费者收入不变情况下, 价格每上涨1元时,对该商品的需求 平均下降0.697件。从数学角度看,回归方程 Y?=7.506+0.234x i-0.697x 2是一个以Y?为纵坐标轴、xi 和X2为横坐标轴的回归平面。此外,回归方程Y=A+BXi+B2Xz+BX+e中的随机误差项 e的方差(T2也是未知的, 其无偏估计量为Q _ 3(y -Y?)上式中,n-k-1为自由度。从这里可以看出,样本容量n必须大于或等于k+2,即nK+2,否则就无法估计 b 2。事实上,实践中进行回归分析时,样本观察值数目 要比k+2大得多。、多元线性相关分析对多元线性回归方程而言,总离差平方和T同样可以分解为回归离差平方和R及残差平方和Q两部分,即T=R+Q由此,可以定义出样本的复判定系数,即(式 9.49 )r2反映了经验方程对总体线性相关关系的拟合优度的大小,其值愈大,说明回归方程的拟合优度愈高,反之,拟合优度愈低。显然,0W r2w 1, r称为复相关系数,它测定了因变量 y与k个自变量X1、X2、Xk之间线性相关程度的大小。r称为复相关系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论