版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节概念第二节回归模型第三节参数的最小二乘估计第四节模型检验第五节预测小结第2章一元线性回归模型第一节基本概念
1.确定性关系若一个变量能够被一个或若干个其它变量的数值按某一规律唯一地确定。函数关系
2.非确定性关系(相关关系或回归关系)若一个变量不能根据其它有关变量的数值精确地求出其数值,但可以通过大量的统计资料得出它们之间的数量变化规律。
3.相关分析主要研究变量之间的相互关联程度,用相关系数表示。包括简单相关和多重相关(复相关)。
4.回归分析(RegressionAnalysis)研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。
分析被解释变量与解释变量之间的统计依赖关系,目的在于通过后者的已知或设定值去估计或预测前者的均值。这里:前一个变量被称为被解释变量(ExplainedVariable)或因变量(DependentVariable),后一个(些)变量被称为解释变量(ExplanatoryVariable)或自变量(IndependentVariable)。回归分析构成计量经济学的方法论基础,其主要内容包括:
(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。例如,
函数关系:统计依赖关系/统计相关关系:对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的.相关系数:统计依赖关系
回归分析正相关相关分析
不相关负相关正相关线性相关不相关负相关有因果关系无因果关系非线性相关①不线性相关并不意味着不相关;
②有相关关系并不意味着一定有因果关系;③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。
④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分因变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。▲注意:某社区家庭可支配收入(X)和消费支出(Y)统计X800110014001700200023002600290032003500Y5616388691023125414081650196920902299594748913110013091452173819912134232162781492411441364155117492046217825306388479791155139715951804206822662629
93510121210140816501848210123542860
96810451243147416721881218924862871
1078125414961683192522332552
1122129814961716196922442585
1155133115621749201322992640
118813641573177120352310
12101408160618042101
1430165018702112
1485171619472200
2002
共计242049501149516445193052387025025214502128515510平均60582510451265148517051925214523652585
根据每个家庭的收入和支出绘出散点图,大致可看出二者间的关系:在统计意义上,二者成正比。
通过对收入和支出的调查结果,处于不同收入阶层的居民有一个平均的支出水平,这一支出水平Y与收入X大致呈线性关系。
图中的这条通过各收入阶层平均支出额的直线,描述了这一依赖关系。我们把这条线称为回归直线。YX60514002000260035008003200总体回归模型:
样本回归模型:总体回归模型第二节回归模型:
YX140020003200800样本回归模型2600一、几个概念1.条件分布(Conditionaldistribution):以X取定值为条件的Y的条件分布。2.条件概率(Conditionalprobability):给定X的Y的概率,记为P(Y|X)。例如,P(Y=594|X=800)=1/4;P(Y=1551|X=2300)=1/14。3.条件期望(conditionalExpectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=800)=561×1/4+594×1/4+627×1/4+638×1/4=6054.总体回归曲线(PopularRegressionCurve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。二、总体回归函数(PopularRegressionFunction,PRF)
E(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=0+1Xi其中0和1为未知而固定的参数,称为回归系数。0和1
分别称为截距和斜率系数。上述方程也称为线性总体回归函数。三、“线性”的含义“线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。四、PRF的随机设定将个别的Yi围绕其期望值的离差(Deviation)表述如下:
ui=Yi-E(Y|Xi)或Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochasticerror)或随机干扰项(Stochasticdisturbance)。线性总体回归函数:
PRF:Yi=0+1Xi+ui=E(Y|Xi)+ui随机误差项主要包括下列因素的影响:1)在解释变量中被忽略的因素的影响;2)变量观测值的观测误差的影响;3)模型关系的设定误差的影响;4)其它随机因素的影响。产生并设计随机误差项的主要原因:1)理论的含糊性;理论不能完全说明影响因变量的所有影响因素。2)数据的欠缺;无法获得有关数据。3)简化原则。尽可能使回归模型简单。五、随机扰动项的意义
六、样本回归函数(SRF,SampleRegression
Function)由于在大多数情况下,我们不可能得到X、Y的所有可能的数值,只能用抽样的方法,取得X、Y的样本观测值,用样本回归方程SRF去拟合总体回归方程PRF。X(收入)800110014001700200023002600290032003500Y(支出)59463811221155140815951969207825852530样本1样本2样本回归函数SRF:
在回归分析中,我们用SRF估计PRF。X(收入)800110014001700200023002600290032003500Y(支出)62781411221298156217162013229925852860第三节参数的最小二乘估计(LeastSquaresEstimation,LSE)考虑回归模型:其中ui是除了X以外的其它若干随机因素。一、最小二乘估计的基本假定1、零均值。随机扰动项ui的均值为零。即,E(ui|Xi)=02、同方差。随机扰动项ui的方差相等。即
Var(ui|Xi)=E[(ui-E(ui))|Xi]2
=E(ui2|Xi)2=23、无自相关。各个扰动项无自相关。即:4、随机扰动项ui解释变量Xi不相关。即Cov(ui,Xi)=E[ui-Eui][Xi-EXi]=0i=1,2,…,n5、ui服从正态分布,即ui~N(0,δ2),i=1,2,…,n二、普通最小二乘估计(OrdinaryLeastSquares,OLS)基本思路:用样本回归函数估计总体回归函数。估计估计出的参数使残差的平方和最小。真实值用根据最大化的一阶条件:例1,已知某商品的需求量Y(万吨)随价格X(元)变化的统计资料如下,求需求量Y随价格X变化的回归方程。年份1991199219931994199519961997199819992000需求量10075807050659010011065价格5766875439几个常用结果:三、最小二乘估计OLS的性质(高斯-马尔柯夫定理)
在所有线性无偏估计量中,OLS估计量有最小方差,即OLS是BLUE(BestLinearUnbiasedEstimator)。
1.线性性
2.无偏性
3.最小方差性(1)线性性:为Yi的线性函数
2、无偏性:最小二乘估计
的数学期望值分别等于总体回归系数的值
3、最小方差性:
OLS估计量
在所有线性无偏估计量中,具有最小方差。即四、最小二乘估计的方差第四节模型检验一、经济意义检验检验所建的模型的是否符合经济理论,主要是检验模型参数的符号和大小是否与经济理论以及人们的经验一致二、统计检验
1、拟合优度检验(判定系数)
拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2
。基本思路:因变量Y的总变异,能够被X的变异解释的比例越大,则说明OLS回归线对总体的解释程度越好,反之就越差。总的离差平方和的分解:PRFXiXSRFY估计的Y值围绕其均值的总变异。
未被解释的Y值围绕回归线的Y值的变异。
总离差平方和(TSS):说明实际的Y值围绕其均值的总变异。
R2测度了在Y的总变异中,由回归模型解释的部分所占的比例。R2越高,回归模型拟合的程度就越好。
R2的性质:(1)非负。(2)0≤R2≤1其它表达方式:定义拟合优度R2:例2:对例1进行拟合优度检验,并说明其意义。82.73%2、相关系数检验
相关系数:表示两个随机变量之间的相关程度。定义为:以样本方差和样本协方差估计X、Y的方差和协方差,样本相关系数为:
样本相关系数的平方与拟合优度相等,但二者的意义不同。(拟合优度是回归分析中提出的,而相关系数是相关分析中提出的。)相关系数检验的步骤:例3,对例1进行相关系数检验。3、F检验(总体回归方程显著性检验)三大分布:t:标准正态除以卡方开方的分布(注意自由度)F:两个独立的卡方变量之商的分布(注意自由度):若干个独立的标准正态平方和的分布F检验的步骤:离差平方和平方和SS自由度DF均方差MSF值F临界值显著性ESS1ESS/1******/RSSn-2RSS/n-2TSSn-1方差分析(analysisofvariance,ANOVA)
表思路:若ESS/RSS比较大,则X对Y的解释程度就比较高,可以推测总体存在线性关系。一般情况下,拟合优度R2与F检验具有一致性:例4,对例1进行F检验解:TSS=3272.5ESS=2707.5RSS=565F*=(2707.5×8)/565=38.3338.33>F0.05(1,8)=5.32
因此,回归方程显著成立.
方差分析表:AnalysisofVarianceSOURCEDFSSMSFpRegression12707.52707.538.340.000Error8565.070.6Total93272.54、t检验(参数显著性检验)T检验的步骤:例5,对例1进行t检验。三、预测(PredictionForecast)(一)点预测点预测的两种解释:X0YX12(二)区间预测(IntervalEstimation)
1、总体均值E(Y0|X0)的区间预测区间估计(预测):为了判断点估计与真值的接近程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的程度。-t/2t/2o/2/22、总体个别值Y0的区间预测各种预测值的关系XY0Y的均值的区间预测Y的个别值的区间预测例6,在例1中,若X0=10,求Y0及E(Y0|X0)的预测值和预测区间
六、案例分析小结:一元线性回归分析的主要步骤1、建立回归模型研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量(Y,X),建立线性回归模型,确定解释变量和被解释变量。如果不明确两个变量是否为线性关系,也可以根据散点图来分析。建立回归模型可以是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东碧桂园职业学院《视频编辑技巧》2023-2024学年第一学期期末试卷
- 共青科技职业学院《内科护理学实训一》2023-2024学年第一学期期末试卷
- 赣南医学院《制造工程训练D》2023-2024学年第一学期期末试卷
- 赣南卫生健康职业学院《医学综合2(临床综合技能)》2023-2024学年第一学期期末试卷
- 《夹层玻璃中间膜》课件
- 七年级语文上册单元清六新人教版
- 三年级科学上册第三单元天气与我们的生活第十六课树叶落了教案青岛版
- 汛期和夏季安全培训课件
- 防止儿童丢失安全课件
- 安全班队会课件
- 苏少版(2024)小学美术一年级上册教学设计(附教材目录)
- 2024-2030年中国高岭土市场运行态势分析与发展现状调研报告
- 2023-2024学年天津市部分区九年级(上)期末物理试卷
- 《ESPEN重症病人营养指南(2023版)》解读课件
- 小学英语一般疑问句和特殊疑问句(附练习题)
- 信息安全技术课件整套电子教案
- 2024年安徽省行政执法人员资格认证考试试题含答案
- 2024年放射工作人员放射防护培训考试题及答案
- 2024年1月国开电大专科《渠道管理》期末考试试题及答案
- JGT302-2022卷帘门窗规范
- 居家养老单项服务及收费
评论
0/150
提交评论