何晓群版应用回归分析考试重点题型_第1页
何晓群版应用回归分析考试重点题型_第2页
何晓群版应用回归分析考试重点题型_第3页
何晓群版应用回归分析考试重点题型_第4页
何晓群版应用回归分析考试重点题型_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

何群用归考重点型

一元,元线形回归析:一.请别叙述变量统计关与函数关系区别,及相关分析回归分析联系与区别答:各然现象或社现象之普遍存在着种联系根据这些联系的紧程度不同,将之分函数关系与计关系一种情下某变量Y能被其余的一类量X完全决定1n这时两之间存在着全的确性关系,这关系可通过一个函数f(X)表示。这样确定性系被称为函关系。1n另一种况下变量之虽然存紧密的联系但并不互相唯一确,这种非确性的紧联系被称为计关系相关分与回归分析是研究边统计关系方法,实际问题的理中往往结使用两。两者的区主要在:标不同:相分析主要用刻画X,Y两变量间联系的切程,而回归分析此之外,还心对未察Y的预测与控。度不同:相关分中X,Y变量地位相,因此设两者都是机变量而回归分中只将变量作为主要研对象,因而往假设Y是随机变量,X是非随变量。二.请述(一元)元线性归模型及其本假设答:元线性型的基形式是:y=x+i0i

i

,其中,称为归系数为随机差。0i其基本设为:G-M假设:i(

,i

j

ijij或者更的正态性假:立同分布,i

N(0。2.多元线性模型基本假是:

nny=X

称为回归数阵,

1

,

,

n

称为随误差其基本设为:a.G-M设:i(

,i

j

ijij或者更的正态性假:

i

独立同布,

N(0。b.rank(X)=p+1<n三请述小法最然)本思、基与,对作较答:1.最小二乘的基本思路通过最化残平方和,(y---...-x)2=(y'(y0i0ipipi求得回系数的估值。其论基础是函极值理。i2最大似然法基本思是最大化似函数L

/2

)

/2

1

)}求得回系数估计值。其论基础函数极值理。i3.者对的估计结论一致的且结果均具线性,偏性,稳定(在-M假设下最小方差线无偏估,在正态性设下是小方差无偏计,具参见问四。4.对来说,用最大然法需要的设较强需要态性假,而最小二法本身需要任何假。但是最大似然法以得到2不行。

的估计而最小二乘四假设通过最二乘估得到回归方y+i1i22ip

ˆˆˆˆˆˆˆˆˆˆˆˆˆ估计,叙述估计量(

及残差的定义其性质答:估计量具有性,无性,稳定性即:a.的线性变换

x'x

xy是无偏的。E.在假设下是最小方差线无偏估,在正性假设是最方差无偏估计

。2.残差ii

,它具以下性ia.=Ei

i

D(eI-H)

,中Hx'x

x',I是单位阵即e))2iiic.

h元素。iiCov(

,e)且正态性假下两者立.

i

2i

服从自度为n-p-1的开方分布,

ii

五、叙多元线性回中常见显著性检验法及其系。答:常的显著性检方法有验,检验,偏检验三。假设验水平为。1.F检验H=...备择假12pi检验统量:

SSRpSSE/n

F(p,n判断法:Fn时拒绝假设。2.t检验

ˆˆ0000TTˆˆˆ10T2ˆˆ0000TTˆˆˆ10T2Tˆˆˆ10:备择假0jjj检验统量:t=

jjj

t(n中(x'x)jj

判断法:|t|3.检验

时拒绝假设:备择假0jjj检验统量:F=j

SSRSSR(j)SSE/

F(1,n其剔除x后回归平方和。(j)j判断法:FF时绝原假设。j4.者的关系。t检与偏检验等价F检验与另两者不(质上是两者的前提通常先验,再做t验或偏F检验。六、给一元回归模估计值点估计与区估计(信度1-)答:未观测x处,y的点估计0

+。2.在未观测点x处,y的区间估计为(预区间)000

00

1)其中0nLxx

2n相当大时(n>15),可简化为03.在未观测x处,Ey的区间估为(信区间000

(n00

1(x)其中nLxx

2

。3.给定置信界与置信下界T时,x的取值范为21ˆˆ时,10211ˆˆ,1x21

jniiyyiˆˆˆˆˆjniiyyiˆˆˆˆˆ七.叙述样本数与回归数标准化的义与方答:多线性回归模中,由自变量的数级差异大,因而舍误差将对估计精度造成较的影响同时自变量单位不也会造成回方程的释比较难,因而通需要对本数据进行处理,数据的标准。数据的准化通常这进行:x*ij

xijLjj

j

1n,其中x,L(x)ijjjijjii

y1y*=i其中y,L(yLii

利用标化样本数据得到的归方程系数*称为标准化回归系,其满足:ii

LiiLyy

ipi

.八.给出偏决定数、偏关系数的定答:当其余自变固定时对y的影程度称的偏决系数,定义ii为r;1,2,...ip

SSE,...x,,...x)x)1iiSSE(x,...x,,...x)1ii2.当其余自量固定,x与x的相关度称为两者偏相关数,定ij义为riji

,

j...p

ijii

jj

,其中是样本相关阵的i行列的代余子式ij

2424242424nnˆˆˆ2424242424nnˆˆˆ计算:1.(20分)近来某时杂志进了一项关于清数字视的调查。于各不同品不同型号的字电视该杂志基于面质量出了一个测总分x(…24同该杂志收集了些数字电视平均市售价y。ii数据显i

i

ii

i

2

yi

2

877429461,yiii

ii假设样数据符合正性假设随机项的方为。据以上条件请分)建y于x的元线性回归程分)给作

的无偏计。(5分)在

=0.05的显著水平下,检变量之的显著性(已知:F10.05(5分)假设种新上的数电视的分为45分,请给其市场议价y,并作该价的置信平为的区估计。0解)根据题,有:x=45.42y=5962.54

-----------1分LX2-n(X)1023.83iiL=X-nXYiii

----------1分------------1分从而=1

LxyLxx

62.13,3140.590

ˆˆˆˆ所以回方程为3140.59

(2)

y-n(y)ii

------3L3952123.96,SSE=SST所以

1n-2

SSE919621

-------2分(3)立假设为:原假H:择假01

------1SSR/1构造检统计量:F=4.30SSE/

F(1,22)

------3分由于F=4.30F以拒原假设0.05即认为量之间存在著的线关系。(4)y的估值为x0001由于样量较大,所可以用似公式计算测区间即价格y的预测区为0

------1分------1分------1

0

958.97=(7854.38)

------3分某市最进行一项有公共交通的查发现公交车维护费

i与其已用月数x之间的关可以用元线回归模yii01i

i

描述,其差项满足i

i

其中随机项满G-M设。实的实际ii观测数(10组由下表出,请根据据给出回归模型的计,并测某辆使用了的公交车的护费用。已使用数维护费

614968

456317

485198

555048

299182

435696

604858658319

294571

316887解:由误差项满足i除自相性。

i

而满G-M设,所可以通差分法来消ii------1分对原样数据做一阶分y,x,得到差分数据样iiiiii

,中,中自变量-1637-2614175分因变量1349-111-15413-348-83346分904681-362-37423168------4由于差数据必然已心化,以差分回归型为ˆˆii

=

iiii

i------4从而回方程为y=-14.16(x即=y-14.16(x)iiiiiiii

------4分将x48带入上述方程,:11

11

------2分3.参数检验(方差)

ˆ121nnˆ1ˆˆ1ˆˆˆ121nnˆ1ˆˆ1ˆˆ证:1对元性型明种验计等证:对一元线性回模型来,F检验、检验、相性检验原假设与备假设相,均为原假0择假01

------2分SSRLnr而三者检验统计量别为:F=,t=xx,t。SSE/n-2------1分由各参的定义,)2ii1,r2ii

iL2L

xx

------3所以F

SSE/

11SSEn

L12

------2t22

r

2

L1LyyLyyxxLyy

SSRSSE/n-2

------2分所以

,即三检验完全等。2.

在,求证

=

1ni

(yii

)

2

()/

ˆnnn1niiˆˆˆˆˆˆnnn1niiˆˆˆˆˆˆiii

=

1ni

(y)2ii

(元是

的偏计a.记

H=

Hy

。记

y

,iii

。)E[(IY](IH)E(Y)XHX)------4分D(e)CoV[(IH)Y,(IY](IH)CoV(Y,Y)(I

(IH)(IH)'

(I------4分所

0,ii

)i------2分从)2)(Iiiiiii

i------5分即

=yi

)

2

的无偏计,证毕。b.

记e-则e0.iiii

分从而Ee

i

D)(yiii

))Var(ii

),ii

)

分由正态假设,Var)i

Var(=Var(+)=Var()+x2Var()+2xCov)i1i0i1i12x(x)ix]i]LLLnLxxxxxx

,yˆˆˆiiiiiiiiinn,yˆˆˆiiiiiiiiinnˆ)Cov(y,),y))Cov(y)iii1iiii(x)(x))ii]LnLxx分

从而Ee

i

(1-hii

1n)ni

()ni

分所以

1=(yi

)

2

的无偏计

分3算元性型

的望与差4.证数标化参估值间转关5.明dw取范(0<=dw<=4DW

t

ttt

)

t

et

2ttt

t

ett

分t

t

t

eett

e2t

e2ttt样本充大时,可以为tttt从而

etttt

],

etttt

分t

t所以2(1

)

分又

,从而DW其余:一.叙全模型、选型的优点答:设模型为y=+x+...+01

mm

,选模为y=+01

pp(p<m)那么:1.选模型的点为a.设与xj

,...x至少一个关则是有偏的即E=mjpjpjpj选模型的预值

0p

是有偏,即E

0p

y。02.选模型的点为:a.选模型回参数的差较小(稳性较高即D(D(jp选模型的预值的残方差更小,)),中0pm

0p

e00m

0m

0c.选模型的测值的方误差更小即EeEe2D)m0

二.叙变量选择的本准则答:通根据以下三准则进变量选择。1.自由度调的复定系数大自由度整的复决定数是基拟合效果提的变量择参数,定为R2

nn

SSR(1),中是回归方程的定系数拟合优度。2.赤池信息(AIC或SBC最赤池信量是基于最似然原提出的变量择参数定义为SSEAIC=nln(nSBC是对AIC的修正,定为

SSEn

)+2ln(p)。3.Mallows统计量最小pMallows统计是基于预测果(均误差)提出变量选参数定义为Cp

SSEpSSE

(np。三.叙变量选择的本方法其比较答:变选择的基本法有以三种:1.进法,具体骤为:a.对所有可变量x,x作一元线回归,这个回归方程分1别作F验选择其中统量最大F若F(1,n2),将1iii选作回自变量。对所有的二变量对xx)...(x,)作二元性回归对1i2ii这个回归程分别作()检验,选择中统计量最值F。2j若FF(1,n则将选作回归变量。2jjc.以此类推,直引入q自变量后所有q+1元归方程统计量值均于(1,。2.后退法,体步骤:

a.对全部可变量x,x作线性回,对该回归程作t检1验,选其中统计量小值。若tt11i

,则将删除。i对剩余自变作p-1元线性回,对该回归程作t检验,择其中统量最小值t。若2j

2j

2),则x删除。jc.以此类推,直所有剩自变均能通t检。3.步回归法,体步骤:a.使用前进选择自量。每选入一个变量,利用后退法除所有要删除的自量。c.以此类推,直剩余自量均能被选。由于前法有进无出自变量选入之后无被删除后退法出无进(变量被删除无法被次选入所以在择效上通常不如逐回归。四.叙所有违背基假设的形及其检验改进方答:违基本假设的形一共四种:异方差性、相关性、异值以及多重线性。1.异方差性a.以通过spearman等级关系数检验其方法为:原假H:0

s

备择设

s

,其中

n(n

62i

d,d是|e的等级差。iiii检验统量:

n1s

s

t(p,n判断法:t

n2)时拒原假设以通过权最小二乘改进2.自相关性a.回归阶数为时可通过D-W检法检,其方法:根据样容量与解释变量个数p+1查dw下届与dwL上界。计算D-W统计量,其定义为U

LiiiiiiLiiiiiiDW=i

iii

)

i若

LU<DWUU<DWU<DWL

L

存在正自相关不能判断无自相关性不能判断存在负自相关以通过代法或者差法改进3.常值异常值以简单分为异常值的异常值两。a.y的异常值可以用差大小断,通常认学生化差|SRE|>3者标准残差|即说明是异常值精确的iii判断可用学生化删残差进行,其中(i)SRE

(i)

i

nnpi

1/2

。x的常值以用库距离D判断,定义为ie2D=i

2

ii)ii

2

,中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论