线性回归模型的有偏估计_第1页
线性回归模型的有偏估计_第2页
线性回归模型的有偏估计_第3页
线性回归模型的有偏估计_第4页
线性回归模型的有偏估计_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学的统计学基础——简要复习数理统计学线性回归模型的有偏估计共62页,您现在浏览的是第1页!为什么要复习数理统计学数理统计学是计量经济学的基础,它为计量经济学提供了唯一而有效的方法。数理统计较难,而且许多同学对于数学公式与数学符号的健忘,提醒我们有必要在展开计量经济学讨论之前,对本课程中经常使用到的数理统计学基本内容事先进行一些温习和回顾。线性回归模型的有偏估计共62页,您现在浏览的是第2页!主要内容节基本概念第二节对总体的描述——随机变量的数字特征第三节对样本的描述——样本分布的数字特征第四节随机变量的分布——总体和样本的连接点第五节通过样本,估计总体(一)——估计量的特征第六节通过样本,估计总体(二)——估计方法第七节通过样本,估计总体(三)——假设检验

线性回归模型的有偏估计共62页,您现在浏览的是第3页!1.1总体(集合)、个体(构成集合的元素)、样本和样本容量研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。

注意:抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。线性回归模型的有偏估计共62页,您现在浏览的是第4页!总体、随机变量、样本间的联系样本就是一个随机变量,所谓“样本容量为n的样本”就是n个相互独立且与总体有相同分布的随机变量X1,……,Xn。每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(x1,……,xn)。样本是总体的一部分。总体一般是未知的,一般要通过样本才能部分地推知总体的情况。线性回归模型的有偏估计共62页,您现在浏览的是第5页!1.4随机变量的分布函数定义若X为一随机变量,对任意实数x,称F(x)=P(Xx)为随机变量X的分布函数。线性回归模型的有偏估计共62页,您现在浏览的是第6页!分布密度函数的性质:概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比分布函数更直观。线性回归模型的有偏估计共62页,您现在浏览的是第7页!第二节对总体的描述

——随机变量的数字特征2.1、数学期望2.2、方差2.3、数学期望与方差的图示线性回归模型的有偏估计共62页,您现在浏览的是第8页!2.1.2数学期望的性质(1)如果a、b为常数,则E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则E[g(X)+f(X)]=E[g(X)]+E[f(X)](4)如果X、Y是两个独立的随机变量,则E(X.Y)=E(X).E(Y)线性回归模型的有偏估计共62页,您现在浏览的是第9页!2.2.2方差的意义(1)离均差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。(2)一般情况下,我们采用方差来描述离散程度。因为离均差的和为0,无法体现随机变量的总离散程度。方差中由于有平方,从而消除了正负号的影响,并易于加总。线性回归模型的有偏估计共62页,您现在浏览的是第10页!数学期望与方差的图示数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。1.方差同、期望变大2.期望同、方差变小51055线性回归模型的有偏估计共62页,您现在浏览的是第11页!第四节随机变量的分布

——总体和样本的连接点4.1几种重要的分布4.2分布:总体和样本之间的连接点

学习的重点应放在确定X服从什么分布,和各种分布的联系上。线性回归模型的有偏估计共62页,您现在浏览的是第12页!4.1.1正态分布定义正态分布的定义定理正态分布的数学期望和方差线性回归模型的有偏估计共62页,您现在浏览的是第13页!正态分布的标准化定义标准正态分布定理正态分布标准化线性回归模型的有偏估计共62页,您现在浏览的是第14页!4.1.22分布2分布的定义N=7N=11概率xN为自由度线性回归模型的有偏估计共62页,您现在浏览的是第15页!4.1.3t分布t分布的定义概率密度x标准正态分布t-分布0线性回归模型的有偏估计共62页,您现在浏览的是第16页!4.1.5临界值点:(1)标准正态分布、t分布临界值点(双侧)/2/21-类似:线性回归模型的有偏估计共62页,您现在浏览的是第17页!4.2分布:总体和样本之间的连接点线性回归模型的有偏估计共62页,您现在浏览的是第18页!5.1无偏性定义的真值的真值有偏无偏线性回归模型的有偏估计共62页,您现在浏览的是第19页!形象感觉无偏性和有效性:重庆长安厂4支比赛用枪的抽样结果准而不精又精又准精而不准不精不准一次射击就是一次抽样。试问:哪些是无偏估计?哪些是有偏估计?哪些是有效估计?线性回归模型的有偏估计共62页,您现在浏览的是第20页!5.3一致性的定义线性回归模型的有偏估计共62页,您现在浏览的是第21页!第六节

通过样本,估计总体(二)

——估计方法点估计区间估计区间估计的概念、步骤应用:对总体期望的区间估计1、已知方差,对数学期望E进行区间估计正态总体一般总体大样本下2、方差未知,对数学期望E进行区间估计大样本下/小样本下线性回归模型的有偏估计共62页,您现在浏览的是第22页!对区间估计的形象比喻我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计。(某甲的成绩为被估计的参数)P(1<<2)=大概的准确程度(1-)

如:P(75<<85)=95%=1-5%“大概80分左右”冒险率(也叫显著水平)下限上限置信系数1-线性回归模型的有偏估计共62页,您现在浏览的是第23页!6.3已知方差,对总体期望值E=的区间估计(1)正态总体;(2)一般总体,大样本下。线性回归模型的有偏估计共62页,您现在浏览的是第24页!/2/21-图示如下线性回归模型的有偏估计共62页,您现在浏览的是第25页!6.4方差未知,正态总体,对数学期望E=u的区间估计(1)大样本下根据中心极限定理,Var()可以用代替,所以仍按已知方差正态分布的方法进行的置信区间估计。线性回归模型的有偏估计共62页,您现在浏览的是第26页!区间估计,统计量的选择小结线性回归模型的有偏估计共62页,您现在浏览的是第27页!7.1假设检验的概念定义:称对任何一个随机变量未知的分布类型或参数的假设为统计假设,简称假设。检验该假设是否正确称为假设检验。在统计假设,如H0:p=0.5(称为原假设)H1:p0.5(称为备择假设)

线性回归模型的有偏估计共62页,您现在浏览的是第28页!显著性水平是小概率事件发生的概率;在假设检验中也称为置信水平。线性回归模型的有偏估计共62页,您现在浏览的是第29页!假设检验的具体操作步骤

(以正态总体、已知方差,检验均值u为例)1、提出零假设H0:=0H1:

03、确定显著水平,如=0.05,查表得相应的临界值/24、判断和下结论:若|U|/2,拒绝H0;若|U|</2,接受H0;(判断区域图示)5、依据结论,作出经济学上的解释。线性回归模型的有偏估计共62页,您现在浏览的是第30页!课本:第二章第三节(P30)回归系数的区间估计;随机扰动项方差的区间估计;回归系数的假设检验(t检验)。原假设、意义。随机扰动项方差的假设检验线性回归模型的有偏估计共62页,您现在浏览的是第31页!临界值点:(2)卡方分布(双侧)、F分布(单侧)临界值点x概率密度1-/2/21-x返回线性回归模型的有偏估计共62页,您现在浏览的是第32页!节基本概念总体和个体样本和样本容量随机变量统计量随机变量的分布函数和分布密度函数线性回归模型的有偏估计共62页,您现在浏览的是第33页!1.2随机变量根据概率不同而取不同数值的变量称为随机变量(RandomVariable)。一个随机变量具有下列特性:可以取许多不同的数值,取这些数值的概率为p,线性回归模型的有偏估计共62页,您现在浏览的是第34页!1.3统计量设(x1,x2,……,xn)为一组样本观察值,函数y=f(x1,x2,……,xn)若不含有未知参数,则称为统计量。统计量一般是连续函数。由于样本是随机变量,因而它的函数y也是随机变量,所以,统计量也是随机变量。统计量一般用它来提取由样本带来的总体信息。线性回归模型的有偏估计共62页,您现在浏览的是第35页!连续型随机变量的分布密度定义:对于任何实数x,如果随机变量X的分布函数F(x)可以写成线性回归模型的有偏估计共62页,您现在浏览的是第36页!举例:正态分布X~N(u,)x2x2f(x)F(x)x1x1XX线性回归模型的有偏估计共62页,您现在浏览的是第37页!2.1.1数学期望:一个加权平均值数学期望描述随机变量(总体)的一般水平。定义2.1离散型随机变量数学期望的定义:定义2.2连续型随机变量数学期望的定义变量X的取值x1x2……xn相应概率Pp1p2……pn线性回归模型的有偏估计共62页,您现在浏览的是第38页!2.2.1方差的定义定义离均差如果随机变量X的数学期望E(X)存在,称[X-E(X)]为随机变量X的离均差。显然,随机变量离均差的数学期望是0,即E[X-E(X)]=0定义方差、标准差随机变量离均差平方的数学期望叫随机变量的方差,记作Var(x)或D(x)。方差的算术平方根叫标准差。线性回归模型的有偏估计共62页,您现在浏览的是第39页!2.2.3方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x))2线性回归模型的有偏估计共62页,您现在浏览的是第40页!第三节对样本的描述

——样本分布的数字特征一、样本均值:二、样本方差、样本标准差线性回归模型的有偏估计共62页,您现在浏览的是第41页!4.1几种重要的分布4.1.1正态分布4.1.2卡方分布4.1.3t分布4.1.4F分布4.1.5临界值点线性回归模型的有偏估计共62页,您现在浏览的是第42页!正态分布图示x2x2f(x)F(x)x1x1XX线性回归模型的有偏估计共62页,您现在浏览的是第43页!关于正态分布的和线性回归模型的有偏估计共62页,您现在浏览的是第44页!定理2分布的和仍然服从2分布线性回归模型的有偏估计共62页,您现在浏览的是第45页!4.1.4F分布F分布的定义x概率密度线性回归模型的有偏估计共62页,您现在浏览的是第46页!临界值点:(2)卡方分布(双侧)、F分布(单侧)临界值点x概率密度1-/2/21-x线性回归模型的有偏估计共62页,您现在浏览的是第47页!第五节

通过样本,估计总体(一)

——估计量的特征无偏性有效性兼顾无偏和有效:最小均方误一致性大样本下,具一致性的估计量具“无偏”和“有效”特性。线性回归模型的有偏估计共62页,您现在浏览的是第48页!5.2有效性定义线性回归模型的有偏估计共62页,您现在浏览的是第49页!偏差与方差的权衡:最小均方误有偏,方差极小无偏,方差极大线性回归模型的有偏估计共62页,您现在浏览的是第50页!n增大时,一致估计量的“无偏”“有效”特性N小N大N极大的真值。线性回归模型的有偏估计共62页,您现在浏览的是第51页!6.1区间估计的概念所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。具体作法是找出两个统计量1(x1,…,xn)与2(x1,…,xn),使P(1<<2)=1-(1,2)称为置信区间,1-称为置信系数(置信度),称为冒险率(测不准的概率)或者显著水平,一般取5%或1%。线性回归模型的有偏估计共62页,您现在浏览的是第52页!6.2区间估计的步骤:1)找一个含有该参数的统计量;2)构造一个概率为的事件;3)通过该事件解出该参数的区间估计.线性回归模型的有偏估计共62页,您现在浏览的是第53页!(1)正态总体,方差已知,估计均值u线性回归模型的有偏估计共62页,您现在浏览的是第54页!(2)一般总体,方差已知,大样本下数学期望E的区间估计中心极限定理指出,无论是否为正态总体,当样本容量相当大时,有样本平均数渐进地服从正态分布。在n>=30时,近似地,样本平均数N(,2/n)。所以,对于大样本仍可以按正态总体进行均值的区间估计。线性回归模型的有偏估计共62页,您现在浏览的是第55页!(2)小样本下线性回归模型的有偏估计共62页,您现在浏览的是第56页!第七节通过样本,估计总体(三)

——假设检验基本概念:假设检验,原假设/备择假设小概率事件原理在假设检验中的应用置信水平假设检验的步骤应用:正态总体期望的假设检验(方差已知/方差未知)(t检验等)方差的假设检验线性回归模型的有偏估计共62页,您现在浏览的是第57页!7.2“小概率原理”在假设检验中的应用数理统计学中的“小概率原理”认

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论