计量经济学的基本数学工具省公共课一等奖全国赛课获奖课件_第1页
计量经济学的基本数学工具省公共课一等奖全国赛课获奖课件_第2页
计量经济学的基本数学工具省公共课一等奖全国赛课获奖课件_第3页
计量经济学的基本数学工具省公共课一等奖全国赛课获奖课件_第4页
计量经济学的基本数学工具省公共课一等奖全国赛课获奖课件_第5页
已阅读5页,还剩192页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章回顾:《计量经济学》基本数学工具代数知识数理统计基础主要内容概率论基础计量经济学第1页

求和运算子(SummationOperator)是用以表示多个数求和运算一个缩略符号。假如表示n个数一个序列,那么我们就把这n个数总和写为:第一节代数知识一、求和运算子与描述统计量1、求和运算子计量经济学第2页性质SUM.1:对任意常数c,

求和运算子性质性质SUM.2:对任意常数c,

性质SUM.3:若是n个数对组成一个集合,且a和b是常数,则

计量经济学第3页2、平均数给定n个数,我们把它们加起来再除以n,便算出它们平均数(average)或均值:当这些是某特定变量(如受教育年数)一个数据样本时,我们常称之为样本均值,以强调它是从一个特定数据集计算出来。样本均值是描述统计量(DescriptiveStatistic)一个例子;此时,这个统计量描述了点集集中趋势。计量经济学第4页均值性质假设我们取x每次观察值并从中减去其均值:(这里“d”表示对均值离差)。那么,这些离差之和必为零:计量经济学第5页均值离差主要性质离差平方和等于平方和减去平方n倍:请加以证实。另请证实:给定两个变量数据集

计量经济学第6页集中趋势另一个表示:中位数均值是我们所关注集中趋势指标,但有时用中位数(Median)或样本中位数表示中心值也有价值。为了得到n个数中位数,我们先把值按从小到大次序排列。然后,若n是奇数,则样本中位数就是按次序居中那个数,比如,给定一组数字,中位数就是2。普通说来,中位数和均值相比,对数列中级(大或小)值改变没那么敏感。若n是偶数,则居中数字便有两个,此时定义中位数方法就不是唯一。通常把中位数定义为两个居中数字均值(仍指从小到大排序数列)。计量经济学第7页二、线性函数性质

假如两个变量x和y关系是:我们便说y是x线性函数(LinearFunction):而和是描述这一关系两个参数,为截距(Intercept),为斜率(Slope)。一个线性函数定义特征在于,y改变量总是x改变量倍:其中,表示“改变量”。换句话说,x对y边际效应(MarginalEffect)是一个等于常数。计量经济学第8页例2.1.1线性住房支出函数假定每个月住房支出和每个月收入关系式是Housing=164+0.27income那么,每增加1元收入,就有0.27元用于住房支出,假如家庭收入增加200元,那么住房支出就增加0.27×200=54元。机械解释上述方程,即时一个没有收入家庭也有164元住房支出,这当然是不真实。对低收入水平家庭,这个线性函数不能很好描述housing和income之间关系,这就是为何我们最终还得用其它函数形式来描述这种关系。计量经济学第9页图2.1.1Housing=164+0.27income图形例2.1.1线性住房支出函数计量经济学第10页例2.1.1线性住房支出函数

在上述方程中,把收入用于住房边际消费倾向(MPC)是0.27。它不一样于平均消费倾向(APC):APC并非常数,它总比MPC大,但伴随收入增加越来越靠近MPC。计量经济学第11页线性函数性质多于两个变量线性函数:假定y与两个变量和有普通形式关系:因为这个函数图形是三维,所以相当难以想象,不过依然是截距(即=0和=0时y取值),且和都是特定斜率度量。由方程(A.12)可知,给定和改变量,y改变量是若不改变,即,则有所以是关系式在坐标上斜率:计量经济学第12页因为它度量了保持固定时,y怎样随而变,所以常把叫做对y偏效应(PartialEffect)。因为偏效应包括保持其它原因不变,所以它与其它条件不变(CeterisParibus)概念有亲密联络,参数可作类似解释:即若,则所以,是对y偏效应。线性函数性质计量经济学第13页假定大学生每个月对CD需求量与CD价格和每个月零花钱有以下关系:式中,price为每张碟价格,income以元计算。需求曲线表示在保持收入(和其它原因)不变情况下,quantity和price关系。例2.1.2对CD需求计量经济学第14页图2.1.2quantity=120-9.8price+0.03income在income固定为900元时图形例2.1.2对CD需求计量经济学第15页图2.1.2描绘了在收入水平为900元时二维图形。需求曲线斜率-9.8是价格对数量偏效应:保持收入固定不变,假如CD碟价格增加1元,那么需求量就下跌9.8。(我们把CD碟只能离散购置事实抽象化。)收入增加只是使需求曲线向上移动(改变了截距),但斜率依然不变。例2.1.2对CD需求计量经济学第16页线性函数基本性质:不论x初始值是什么,x每改变一个单位都造成y一样改变。x对y边际效应是常数,这对许多经济关系来说多少有点不真实。比如,边际酬劳递减这个主要经济概念就不符合线性关系。

为了建立各种经济现象模型,我们需要研究一些非线性函数(nonlinearfunction)。

非线性函数特点是,给定x改变,y改变依赖于x初始值。三、若干特殊函数及其性质计量经济学第17页1.二次函数

刻画酬劳递减规律一个简单方法,就是在线性关系中添加一个二次项。考虑方程式式中,,和为参数。当时,y和x之间关系呈抛物线状,而且能够证实,函数最大值出现在计量经济学第18页1.二次函数比如,若y=6+8x-2x2。(从而=8且=-2),则y最大值出现在x*=8/4=2处,而且这个最大值是6+8×2-2×(2)2=14。图2.1.3y=6+8x-2x2

图形计量经济学第19页

对方程式意味着x对y边际效应递减(diminishingmarginaleffect),这从图中清楚可见,应用微积分知识,也能够经过求这个二次函数一阶导数得出。斜率=方程右端是此二次函数对x导数(derivative)。一样,则意味着x对y边际效应递增(increasingmarginaleffect),二次函数图形就呈U行,函数最小值出现在点处。1.二次函数计量经济学第20页

在计量经济分析中起着最主要作用非线性函数是自然对数(naturelogarithm),或简称为对数函数(logfunction),记为还有几个不一样符号能够表示自然对数,最惯用是或。当对数使用几个不一样底数时,这些不一样符号是有作用。当前,只有自然对数最主要,所以我们都用表示自然对数。2.自然对数计量经济学第21页2.自然对数图2.1.4y=log(x)图形计量经济学第22页2.自然对数

从图能看出以下性质:1.当y=log(x)时,y和x关系表现出边际酬劳递减。2.当y=log(x)时,x对y永远没有负效应:函数斜率伴随x增大越来越靠近零,然而这个斜率永远到不了零,所以更不会是负。3.log(x)可正可负:log(x)<0,0<x<1;log(1)=0;log(x)>0,x>14.一些有用性质(切记):

log(x1·x2)=log(x1)+log(x2),x1,x2>0log(x1/x2)=log(x1)-log(x2),x1,x2>0

log(xc)=c·log(x),x>0,c为任意实数计量经济学第23页2.自然对数

对数可用于计量经济学应用中各种近似计算。1.对于x≈0,有log(1+x)≈x。这个近似计算伴随x变大而越来越不准确。2.两对数之差可用作百分比改变近似值。令x0和x1为两个正数,能够证实(利用微积分),对x微小改变,有假如我们用100乘以上述方程,并记那么,对x微小改变,便有“微小”含义取决于详细情况。计量经济学第24页2.自然对数近似计算作用:定义y对x弹性(elasticity)为换言之,y对x弹性就是当x增加1%时y百分数改变。若y是x线性函数:,则这个弹性是它显著取决于x取值(弹性并非沿着需求曲线保持不变)。计量经济学第25页2.自然对数不但在需求理论中,在许多应用经济学领域,弹性都是非常主要。在许多情况下,使用一个常弹性模型都很方便,而对数函数能帮助我们设定这么模型。假如我们对x和y都使用对数近似计算,弹性就近似等于所以,一个常弹性模型(constantelasticitymodel)可近似描述为方程式中,为y对x弹性(假定x,y>0)。这类模型在经验经济学中饰演着主要角色。当前,式中只是靠近于弹性这一事实并不主要,能够忽略。计量经济学第26页例2.1.3常弹性需求函数若q代表需求量而p代表价格,而且二者关系为则需求价格弹性是-1.25.初略地说,价格每增加1%,将造成需求量下降1.25%。计量经济学第27页2.自然对数在经验研究工作中还经常出现使用对数函数其它可能性。假定y>0,且则,从而。由此可知,当y和x有上述方程所表示关系时,计量经济学第28页例2.1.4对数工资方程假设小时工资与受教育年数有以下关系:依据前面所述方程,有由此可知,多受一年教育将使小时工资增加约9.4%。通常把%△y/△x称为y对x半弹性(semi-elasticity),半弹性表示当x增加一个单位时y百分数改变。在上述模型中,半弹性是个常数而且等于,在上述例子中,我们能够方便把工资和教育关系概括为:多受一年教育——不论所受教育起点怎样——都将使工资提升约9.4%。这说明了这类模型在经济学中主要作用。计量经济学第29页2.自然对数另一个关系式在应用经济学中也是有意义:其中,x>0。若取y改变,则有,这又能够写为。利用近似计算,可得当x增加1%时,y改变个单位。计量经济学第30页例2.1.5劳动供给函数假定一个工人劳动供给可描述为式中,wage为小时工资而hours为每七天工作小时数,于是,由方程可得:换言之,工资每增加1%,将使每七天工作小时增加约0.45或略小于半个小时。若工资增加10%,则或约四个半小时。注意:不宜对更大工资百分数改变应用这个近似计算。计量经济学第31页考虑方程此处log(y)是x线性函数,不过怎样写出y本身作为x一个函数呢?指数函数(exponentialfunction)给出了答案。我们把指数函数写为y=exp(x),有时也写为,但在我们课程中这个符号不惯用。指数函数两个主要数值是exp(0)=1和exp(1)=2.7183(取4位小数)。

3.指数函数计量经济学第32页3.指数函数图2.1.4y=exp(x)图形计量经济学第33页从上图能够看出,exp(x)对任何x值都有定义,而且总大于零。指数函数在以下意义上是对数函数反函数:对全部x,都有log﹝exp(x)﹞=x,而对x>0,有exp﹝log(x)﹞=x。换言之,对数“解除了”指数,反之亦然。对数函数和指数函数互为反函数。指数函数两个有用性质是

exp(x1+x2)=exp(x1)exp(x2)和exp﹝c·log(x)﹞=xc3.指数函数计量经济学第34页记忆:经济学中惯用一些函数及其导数有

4.微分学计量经济学第35页当y是多元函数时,偏导数(partialderivative)概念便很主要。假定y=f(x1,x2),此时便有两个偏导数,一个关于x1,另一个关于x2。y对x1偏导数记为,就是把x2看做常数时方程对x1普通导数。类似,就是固定x1时方程对x2导数。若则这些偏导数可被视为经济学所定义偏效应。4.微分学计量经济学第36页把工资与受教育年数和工作经验(以年计)相联络一个函数是exper对wage偏效应就是上式对exper偏导数:这是增加一年工作经验所造成工资近似改变。注意这个偏效应与exper和educ初始水平都相关系。比如,一个从educ=12和exper=5开始工人,再增加一年工作经验,将使工资增加约0.19-0.08×5+0.007×12=0.234元。准确改变经过计算,结果是0.23,和近似计算结果非常靠近。例2.1.6含交互项工资方程计量经济学第37页在最小化或最大化单或多变量函数时,微分计算起着主要作用。假如是一个k元可微函数,则

在全部可能xj值中最小化或最大化f必要条件是换言之,f全部偏导数在处都必须取值为零。这些条件被称为函数最小化或最大化一阶条件(firstordercondition)。4.微分学计量经济学第38页参看附件习题册。思索题计量经济学第39页一、随机变量及其概率分布假设我们掷一枚钱币10次,并计算出现正面次数,这就是一个试验(experiment)例子。普通地说,一个试验是指最少在理论上能够无限重复下去任何一个程序,而且它有一个定义完好结果集。

一个随机变量(randomvariable)是指一个含有数值特征并由一个试验来决定其结果变量。

第二节概率论基础计量经济学第40页按照概率和统计学通例,我们一律用大写字母如常见W,X,Y和Z表示随机变量,而用对应小写字母w,x,y和z表示随机变量特定结果。比如,在掷币试验中,令X为一枚钱币投掷10次出现正面次数。所以X并不是任何详细数值,但我们知道X将在集合中取一个值。比喻说,一个特殊结果是x=6。我们用下标表示一系列随机变量。比如,我们统计随机选择20个家庭去年收入。能够用X1,X2,··,X20表示这些随机变量,并用x1,x2,···,x20表示其特殊结果。一、随机变量及其概率分布计量经济学第41页如定义所言,即使随机变量描述是一些定性事件,我们也总定义它结果是数值。比如,考虑只掷一枚钱币,其两个结果是正面和反面。我们能够定义一个随机变量以下:假如出现正面则X=1;假如出现反面则X=0。一个只能取0和1两个值随机变量叫做贝努利(或二值)随机变量〔Bernoulli(orbinary)randomvariable〕。X~Bernoulli(θ)(读作“X服从一个成功概率为θ贝努利分布):P(X=1)=θ,P(X=0)=1-θ一、随机变量及其概率分布计量经济学第42页1.离散随机变量

离散随机变量(discreterandomvariable)是指一个只取有限个或可数无限个数值随机变量。“可数无限个”:即使随机变量可取无限个值,但这些值能够和正整数一一对应。贝努力随机变量是离散随机变量最简单例子。

一、随机变量及其概率分布计量经济学第43页一个离散随机变量要由它全部可能值和取每个值对应概率来完整描述。假如X取k个可能值其概率p1,p2,···,pk被定义为

pj=P(X=xj),j=1,2,···,k(读作:“X取值xj概率等于pj”。)其中,每个pj都在0-1之间,而且

p1+p2+···+pk=11.离散随机变量计量经济学第44页X概率密度函数(probabilitydensityfunction,pdf)概括了X可能结果及其对应概率信息:

而且对某个j,凡是不等于xjx都有f(x)=0。换言之,对任何实数x,f(x)都是随机变量X取该特定值x概率。当我们设计多于一个随机变量时,有时需要给所考虑pdf加一个下标:比如fx是Xpdf,fY是Ypdf等等。1.离散随机变量计量经济学第45页给定任一离散随机变量pdf,就不难计算关于该随机变量任何事件概率。比如,设X为一名篮球运动员在两次罚球中命中次数。所以X三个可能值是{0,1,2}。假定Xpdf是f(0)=0.20,f(1)=0.44和f(2)=0.36这三个概率之和必定为1.利用这个pdf,我们能算出该运动员最少投中一球概率:P(X≥1)=P(X=1)+P(X=2)=0.44+0.36=0.80。Xpdf以下列图示:1.离散随机变量计量经济学第46页012xf(x)1.离散随机变量图2.2.1两次罚球命中次数pdf计量经济学第47页2.连续随机变量

连续随机变量(continuousrandomvariable)是指一个取任何实数概率都为零变量。这个定义有点违反直觉,因为在任何应用中,我们最终都会观察到一个随机变量取得某种结果。这里思想是,一个连续随机变量X可能取值如此之多,以致我们无法用正整数去计算,因而,逻辑上一致性就要求X必须以零概率取每一个值。

一、随机变量及其概率分布计量经济学第48页在计算连续随机变量概率时,讨论一个连续随机变量取某特定值概率是没有意义,最方便是使用累积分布函数(cumulativedistributionfunction,cdf)。设X为任意随机变量,它对任何实数xcdf被定义为F(x)≡P(X≤x)对于一个连续随机变量,F(x)就是概率密度函数f之下、点x以左面积。因为F(x)就是一个概率,所以它总是介于0-1之间。另外,若x1<x2,则P(X≤x1)≤P(X≤x2),即F(x1)≤F(x2)。这意味着cdf是x一个增(最少非减)函数。2.连续随机变量计量经济学第49页cdf有以下两个对计算概率颇为有用主要性质:

1.对任何数c,P(X>c)=1-F(c)

2.对任何两个数a<b,P(a<X≤b)=F(b)-F(a)

在我们学习计量经济课时,用cdf仅计算连续随机变量概率,所以在概率命题中不等式是否严格不等便无所谓。也就是说,对于一个连续随机变量X,有P(X≥c)=P(X>c)和P(a<X<b)=P(a≤X≤b)=P(a≤X<b)=P(a<X≤b)

对于概率和统计学中全部主要连续分布,其累积分布函数已被制成表格,其中最为人们熟知是正态分布。2.连续随机变量计量经济学第50页1.联合分布与独立性令X和Y为离散随机变量。那么(X,Y)联合分布(jointdistribution)由它们联合概率密度函数充分描述:上式右端是X=x和Y=y概率。若我们知道X和Ypdf,就轻易得到它们联合pdf。详细而言,我们说X和Y相互独立充要条件是,对全部x和y,都有式中,fX为Xpdf而fY为Ypdf。二、联合分布、条件分布与独立性计量经济学第51页在多个随机变量背景中,fX和fY这两个pdf常被称为边缘概率密度函数(marginalprobabilitydensityfunction),以区分于联合pdf,即fX,Y。上述独立性定义适合用于离散和连续随机变量。假如X和Y都是离散,那么上式就等同于P(X=x,Y=y)=P(X=x)·P(Y=y)因为仅需要知道P(X=x)与P(Y=y),所以计算联合概率相当轻易。

若两随机变量不独立,则称它们是相依。1.联合分布与独立性计量经济学第52页考虑篮球运动员两次罚球。令X为贝努利随机变量:假如第一次命中它等于1,不然等于0。再令Y为贝努利随机变量:假如第二次命中它等于1,不然等于0。假设该运动员每次罚球命中率都是80%,即P(X=1)=P(Y=1)=0.8,问两罚两中概率是多少?例2.2.1罚球命中率若X和Y独立,则很轻易回答这个问题:P(X=1,Y=1)=P(X=1)·P(Y=1)=0.8×0.8=0.64。所以,有64%机会两罚两中。若第二次命中机会依赖于第一次是否命中,即X和Y不独立,这种简单计算便不再正确。计量经济学第53页随机变量独立性是一个十分主要概念。若X和Y独立,则知道X结果并不改变Y出现各种可能结果概率,反之亦然。

关于独立性一个有用结论是,若X和Y独立,而我们对任意函数g和h定义两个新随机变量g(X)和h(Y),则这些新随机变量也是独立。1.联合分布与独立性计量经济学第54页在计量经济学中,我们通常也对一个随机变量(称之为Y)与另外一个或多个随机变量联络感兴趣。暂且假设我们只对一个变量影响感兴趣,并称之为X。关于X怎样影响Y,我们所能知道,都包含在给定X时Y条件分布(conditionaldistribution)中,由条件概率密度函数概括这一信息被定义为:对全部满足x值,都有2.条件分布计量经济学第55页当X和Y都是离散变量时,上式可解释为其中,上式右端读作“给定X=x时Y=y概率”。当Y是连续变量时,因为前述理由,不能直接解释为概率,但能够经过计算条件概率密度函数之下面积来求出条件概率。条件分布一个主要性质是,若X和Y是独立随机变量,知道X取什么值无助于确定Y取各值概率(反之亦然)。这就是说,且。2.条件分布计量经济学第56页再次考虑篮球员两次投篮例子。假定条件密度是这意味着球员第二次罚球命中概率依赖于第一次罚球是否命中:假如第一次命中,则第二次命中概率是0.85;假如第一次失误,则第二次命中概率是0.70。这就是说,X和Y不是独立,而是相关。我们若知道P(X=1),便能够计算P(X=1,Y=1)。假定第一次命中概率是0.8,即P(X=1)=0.8,那么我们得到两罚两中概率为P(X=1,Y=1)=P(Y=1|X=1)·P(X=1)=0.85×0.8=0.68例2.2.2罚球命中率计量经济学第57页多数情况下我们只对随机变量分布少数几个性质感兴趣。这些特征可分成三类:集中趋势度量、变异或分散程度度量以及两个随机变量之间关联性度量。1.集中趋势一个度量:期望值期望值是我们在计量经济学学习中碰到最主要概率性概念之一。设X为一随机变量。它期望值(expectedvalueorexpectation),记做E(X),就是对X全部可能值一个加权平均。权数由概率密度函数决定。有时期望值又被称为总体均值,尤其是在我们强调X代表了总体中某个变量时。三、概率分布特征计量经济学第58页当X是取有限个值[比喻说]离散随机变量时,期望值准确定义最为简单。令f(x)表示X概率密度函数,则X期望值为加权平均:给定pdf在X每个可能结果处取值,这很轻易计算。1.集中趋势一个度量:期望值计量经济学第59页假定X分别以概率1/8、1/2和3/8取值-1、0和2,则

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8例2.2.3计算一个期望值计量经济学第60页假如X是一个连续随机变量,则E(X)被定义为一个积分:这依然能够解释为一个加权平均。和离散情形不一样,E(X)总是X可能结果之一。本课程中,即使我们需要用到概率论中一些特殊随机变量期望值相关熟悉结论,但我们并不需要用积分去计算期望值。1.集中趋势一个度量:期望值计量经济学第61页给定随机变量X和函数g(·),能够产生一个新随机变量g(X)。比如,若X是一随机变量,则X

2和log(X)(X>0)也是随机变量。g(X)期望值依然是一个加权平均:

或者,对一个连续随机变量来说,1.集中趋势一个度量:期望值计量经济学第62页例2.2.3:假定X分别以概率1/8、1/2和3/8取值-1、0和2,则:

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8

对于例2.2.3中随机变量,令g(X)=X2,便有E(X2)=(-1)2×1/8+(0)2×(1/2)+(2)2×(3/8)=13/8例2.2.4X2期望值计量经济学第63页性质1.对任意常数c,E(c)=c。性质2.对任意常数a和b,E(aX+b)=aE(X)+b。性质3.假如是常数而是随机变量,则或者,利用求和符号,作为一个特例,取每个aj=1,我们有所以,和期望值就是期望值之和。在数理统计推导中经常用到这个性质。2.期望值性质计量经济学第64页令X1,X2和X3分别为比萨店在某日出售小、中、大比萨个数。这些随机变量期望值是E(X1)=25,E(X2)=57和E(X3)=40。小、中、大比萨价格分别是5.50、7.60和9.15美元。所以,该日出售比萨期望收入是E(5.5X1+7.60X2+9.15X3)=5.50E(X1)+7.60E(X2)+9.15E(X3)=5.5×25+7.60×57+9.15×40=936.70即936.70美元。这不过是期望收入,详细某一天实际收入普通都会有所差异。例2.2.5求期望收入计量经济学第65页度量集中趋势另一个方法是用中位数(median)。若X是连续,则X中位数(比喻说m)就是这么一个数:pdf之下二分之一面积在m之左,另二分之一面积在m之右。当X是离散且取有奇数个值时,中位数就是按大小排序后居中一个数。若X可能取偶数个值,则实际上有两个中位数;有时取这两个数平均,便得到唯一一个中位数。普通而言,中位数,有时记为Med(X),和期望值E(X)是不相同。作为集中趋势度量,不能说哪一个比另一个更加好,二者都是度量X分布中心有效方法。2.集中趋势另一个度量:中位数计量经济学第66页尽管一个随机变量集中趋势颇有价值,但它还不能通知我们关于这个随机变量分布一切。下列图给出了两个含有相同均值随机变量pdf。显然X分布比Y分布更紧密地集中在其中心周围。3.变异性度量:方差与标准差图2.2.2有相同均值但不相同分布随机变量fXfY计量经济学第67页对一个随机变量X,令μ=E(X)。为了度量X离其期望值多远,有许各种方法,而最简单一个代数方法就是用差异平方(X-μ)2。(平方是为了消除距离度量符号,由此得到正值符合我们对距离直观认识。)因这一距离随X每一结果而变,故本身就是一个随机变量。正如我们需要用一个数来总结X集中趋势那样,我们也需要用一个数来告诉我们X平均而言离μ有多远。一个这么数就是方差(variance),它告诉我们X对其均值期望距离:方差有时记为,由方程知方差必定非负。4.方差计量经济学第68页

性质1.当且仅当存在常数c使得P(X=c)=1时[此时E(X)=c],Var(X)=0。也就是说,任何常数方差都是零,而且,若一个随机变量有零方差,则它本质上就是常量。

性质2.对任意常数a和b,都有Var(aX+b)=a2Var(X)。这意味着,把一个常数加到一个随机变量上不会改变其方差,但用一个常数去乘一个随机变量使其方差增大该常数平方倍。比如,若X指摄氏温度,而Y=32+(9/5)X为华氏温度,则Var(Y)=(9/5)2Var(X)=(81/25)Var(X)方差两个主要性质计量经济学第69页一个随机变量标准差,记为sd(X),就是它方差正平方根:sd(X)≡+。标准差有时又记做。标准差有两个主要性质可从方差两个性质中直接推出。

性质1.对任意常数c,sd(c)=0性质2.对任意常数a和b,sd(aX+b)=|a|sd(X)尤其是,若a>0,则sd(aX)=a·sd(X)。5.标准差计量经济学第70页作为方差和标准差性质一个应用——而且本身也是有实际意义一个问题——假如给定随机变量X,我们将它减去其均值μ并除以其标准差б,便定义了一个新随机变量

Z≡这又可写为Z=aX+b,其中a=(1/б)而b=-(μ/б)。可得:E(Z)=aE(X)+b=(μ/б)-(μ/б)=0Var(Z)=a2Var(X)=б2/б2=1所以,随机变量Z均值为零,方差(或者标准差)为1。这一过程有时被称为将随机变量X标准化,而Z则叫做标准化随机变量(standardizedrandomvariable)。5.标准化一个随机变量计量经济学第71页1.关联度:协方差与相关即使两个随机变量联合pdf完整地描述了它们之间关系,但对于它们大致怎样相互变动,仍需要一个扼要度量伎俩。正准期望值和方差一样,这类似于用一个数字来概括整个分布某首先,现在要概括便是两个随机变量联合pdf。四、联合与条件分布特征计量经济学第72页两个随机变量X和Y之间协方差(covariance)(有时也叫做总体协方差,以强调它考虑是描述一个总体两个随机变量之间关系),被定义为乘积(X-μX)(Y-μY)期望值:有时又记为。若,则平均而言,当X超出其均值时,Y也超出其均值;若,则平均而言,当X超出其均值时,Y低于其均值。2.协方差计量经济学第73页计算几个有用表示式以下:协方差度量两个随机变量之间线性相依性(lineardependence)。一个正协方差表示两随机变量同向移动,而一个负协方差则表示两随机变量反向移动。2.协方差计量经济学第74页

性质Cov.1:若X和Y相互独立,则注意:此性质反命题并不成立:X和Y之间协方差为零并不意味着X和Y相互独立。

性质Cov.2:对任意常数a1,b1,a2和b2,都有此性质主要含义在于,两个随机变量之间协方差会因为将二者或者二者之一乘以一个常数倍而改变。这在经济学中之所以主要,是因为诸如货币变量和通货膨胀率等,都可使用不一样度量单位进行定义而不改变其实质。协方差性质计量经济学第75页最终,知道任何两随机变量之协方差绝对值必定不会超出它们标准差之积也有用处,此即著名柯西-施瓦茨不等式(Cauchy-Schwartzinequality)。

性质COV.3协方差性质计量经济学第76页假定我们想知道劳动总体中受教育程度和年薪之间关系,我们就可令X代表教育,Y代表薪水,然后计算它们协方差。然而我们得到答案却取决于教育和薪水度量单位。协方差性质Cov.2意味着,教育和薪水之间协方差,视薪水是以美元还是以千美元度量或者教育是以月还是以年计算而定。很显著,变量度量单位选择对它们有多强关系并没有影响。不过它们之间协方差却与度量单位相关。3.相关系数计量经济学第77页取决于度量单位是协方差一个缺点。为克服这一缺点,现引进X和Y相关系数(correlationcoefficient):X和Y相关系数有时记做(而且有时称总体相关)。3.相关系数计量经济学第78页性质Corr.1

-1≤Corr(X,Y)≤1若Corr(X,Y)=0,或等价地Cov(X,Y)=0,则X和Y之间就不存在线性关系,并称X和Y为不相关随机变量(uncorrelatedrandomvariables);不然X和Y就是相关。Corr(X,Y)=1意味着一个完全正线性关系,意思是说,我们对某常数a和某常数b>0能够写Y=a+bX。Corr(X,Y)=-1则意味着一个完全负线性关系,使得对某个b<0有Y=a+bX。+1和-1两个极端情形极少出现。靠近1或-1值便意味着较强线性关系。3.相关系数计量经济学第79页性质Corr.2

对于常数a1,b1,a2和b2,若a1a2>0,则Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若a1a2<0,则Corr(a1X+b1,a2Y+b2)=-Corr(X,Y)作为一个例子,假定薪水和教育总体相关系数是0.15.这一度量将与用美元、千美元或任何其它单位计算薪水都无关;与用年、季、月或其它单位来衡量受教育时间也无关。3.相关系数计量经济学第80页一旦定义了协方差和相关系数,就能够把方差主要性质完整地列出来。

性质VAR.3对于常数a和b,有由此可知,若X和Y不相关(从而Cov(X,Y)=0)则和在后一情形中,要注意为何差方差是(两个)方差之和,而不是方差之差。4.随机变量之和方差计量经济学第81页例:令X为星期五夜晚某酒店赚到利润,而Y为接下来星期六夜晚赚到利润。所以,Z=X+Y就是这两个夜晚赚利润。假定X和Y都有一个300美元期望值和一个15美元标准差(因而方差为225)。两夜晚期望利润将是E(Z)=E(X)+E(Y)=2×300=600美元。若X和Y独立,从而它们也不相关,则总利润方差便是两个方差之和:Var(Z)=Var(X)+Var(Y)=2×225=450。于是总利润标准差是,约为21.21美元。4.随机变量之和方差计量经济学第82页从两个变量推广到多于两个变量情形。若随机变量中每一个变量与集合中其它任何一个变量都不相关,我们便称其为两两不相关随机变量(pairwiseuncorrelatedrandomvariables)。也就是说,对全部,都有4.随机变量之和方差计量经济学第83页

性质VAR.4若是两两不相关随机变量且是常数,则用求和符号便可写为此性质一个特殊情形就是,对全部i都取ai=1.这时,对两两不相关随机变量来说,和方差就是方差之和:4.随机变量之和方差计量经济学第84页协方差和相关系数都是对两个随机变量之间线性关系度量,而且对称地处理二者。在社会科学中更多情况是,我们想用一个变量X去解释另一个变量Y。而且,若Y和X有非线性形式关系,则我们还希望知道这个形式。把Y叫做被解释变量,而X叫做解释变量。比如Y代表小时工资,而X代表受过正式教育年数。能够经过给定X下Y条件期望(conditionalexpectation)(有时又称条件均值)来概括Y和X之间关系。即,一旦我们知道X取了某个特定值x,就能依据X这个结果算出Y期望值。记作E(Y|X=x)或简记E(Y|x)。普通情形是,伴随x改变,E(Y|x)也会改变。5.条件期望计量经济学第85页当Y是取值为离散随机变量时,则有当Y连续时,E(Y|x)便由对y全部可能值求积分来定义。好比无条件期望那样,条件期望也是对Y全部可能值一个加权平均,只不过这时权数反应了X已取了某个特殊值情形。所以,E(Y|x)是x某个函数,这个函数告诉我们Y期望值怎样随x而改变。5.条件期望计量经济学第86页例令(X,Y)代表一个工人总体,其中X为受教育年数,Y为小时工资。那么,E(Y|x=12)便是总体中全部受了教育(相当于读完高中)工人平均小时工资。E(Y|x=16)则是全部受过教育工人平均小时工资。跟踪各种教育水平期望值,便为工资和教育之间关系提供了主要信息。5.条件期望计量经济学第87页5.条件期望4812EDUCE(WAGE|EDUC)1620图2.2.3小时工资在给定各种教育水平下期望值计量经济学第88页标准上,能够在每个教育水平上求出小时工资期望值,然后将这些期望值列表。因为教育改变范围很大——且可度量为一年某个分数——所以用这种方法显示平均工资和受教育程度之间关系很烦琐。计量经济学中经典方法是,设定一些足以刻画这种关系简单函数。作为一个例子,假设WAGE在给定EDUC时期望值是以下线性函数:E(WAGE|EDUC)=1.05+0.45EDUC假定这一关系对工人总体成立,则受8年和教育者平均工资分别是多少?EDUC系数怎样解释?5.条件期望计量经济学第89页条件期望也可能是个非线性函数。比如,令E(Y|x)=10/x,其中X是一个恒大于零随机变量。这个函数图形以下列图。它能够代表一个需求函数,其中Y为需求量,而X为价格。若Y和X关系确实如此,则诸如相关分析一类线性关联分析便不适当。5.条件期望E(Y|x)x计量经济学第90页条件期望一些基本性质对计量经济分析中推导颇为有用。

性质CE.1对任意函数c(X),都有E[c(X)|X]=c(X)。这意味着,当我们计算以X为条件期望值时,X函数可视为常数。比如E(X2|X)=X2。直观上,这无非就是说,若知道了X,也就知道了X2。

6.条件期望性质计量经济学第91页性质CE.2对任意函数a(X)和b(X),有

比如,我们能很轻易地计算像XY+2X2这种函数条件期望:6.条件期望性质计量经济学第92页性质CE.3若X和Y相互独立,则E(Y|X)=E(Y)。这个性质意味着,若X和Y相互独立,则Y在给定X时期望值与X无关,这是E(Y|X)必定等于Y(无条件)期望。在工资与教育一例中,假设工资独立于教育,则高中毕业生和大学毕业生平均工资便相同。这几乎无疑是错误,所以我们不能假定工资与教育是独立。6.条件期望性质计量经济学第93页性质CE.4E[E(Y|X)]=E(Y)。这个性质意味着,假如我们先把E(Y|X)看做X函数,再求这个函数期望值,那么结果就是E(Y)。

例:令Y=WAGE和X=EDUC,其中WAGE为小时工资,而EDUC为受教育年数。假定给定EDUC下WAGE期望值是E(WAGE|EDUC)=4+0.6EDUC,且E(EDUC)=11.5。则有E(WAGE)=E(4+0.6EDUC)=4+0.6E(EDUC)=10.90美元/小时。6.条件期望性质计量经济学第94页性质CE.5若E(Y|X)=E(Y),则Cov(X,Y)=0(因而Corr(X,Y)=0。实际上X每个函数都与Y不相关。该性质含义是,若对X了解不能改变Y期望值,则X和Y必定不相关。注意:此性质逆命题不成立。若X和Y不相关,E(Y|X)依然可能取决于X。6.条件期望性质计量经济学第95页

给定随机变量X和Y,Y以X=x为条件方差,无非就是在给定X=x下与Y条件分布相联络方差:公式惯用于计算。

性质CV.1若X和Y相互独立,则Var(Y|X)=Var(Y)。因为在给定X下Y分布与X无关,而Var(Y|X)无非就是这个分布特征之一,所以这个性质相当显著。7.条件方差计量经济学第96页1.正态分布正态分布和由它衍生出来分布是统计学和计量经济学中最广泛使用分布。假定在总体上定义随机变量是正态分布,将使概率计算得以简化。五、正态及其相关分布μx一个正态随机变量fx图2.2.4正态概率密度函数普通形状计量经济学第97页在数学上,Xpdf可写为:其中,和。我们说X有一个均值为μ和方差为б2正态分布(normaldistribution),记作X~Normal(μ,б2)。因正态分布对称于μ,故μ也是X中位数。有时又把正态分布叫做高斯分布,以纪念注明统计学家高斯(C.F.Gauss)。1.正态分布计量经济学第98页一些随机变量粗略地看似乎遵照正态分布。人类身高和体重、考试得分以及某县失业率,大致上都有类似于正态分布图形pdf。另一些分布如收入分布,则不像正态密度函数那样分布。在大多数国家里,收入都不对称于任何数值而分布;分布是朝上端偏斜。有时一个变量可经过变换而取得正态性。一个常见变换是取自然对数,这对取正值随机变量来说是有意义。若X是正随机变量(比如收入),而Y=log(X)含有正态分布,我们便说X服从一个对数正态(lognormal)分布。人们发觉,对数正态分布颇适合许多国家收入分布。诸如商品价格等另一些变量,看来也适合描述为对数正态分布。1.正态分布计量经济学第99页正态分布一个特殊情形是它均值为0和方差(因而标准差)为1。若随机变量Z服从Normal(0,1)分布,我们便说它服从标准正态分布(standardnormaldistribution),一个标准正态随机变量pdf被记为φ(z);依据μ=0和б2=1式,它由下式给出:2.标准正态分布计量经济学第100页-303z010.5图2.2.5标准正态累积分布函数标准正态累积分布函数被记为φ(z),即位于φ之下、z以左面积;φ(z)=P(Z≤z);因Z是连续,故也能够写成φ(z)=P(Z<z)。2.标准正态分布计量经济学第101页没有可用来求φ(z)值简单公式[因为φ(z)是函数积分,而这个积分没有一个封闭形式]。然而φ(z)值很轻易制成表格。对于z≤-3.1,

φ(z)小于0.001,而对于z≥-3.1,φ(z)大于0.999.大多数统计学和计量经济学软件包都含有计算标准正态cdf值简单命令,所以我们完全能防止使用印刷表格而取得对应于任意z值概率。2.标准正态分布计量经济学第102页借助于概率论中基本结论——尤其是相关cdf性质——我们能够利用标准正态cdf计算包括一个标准正态随机变量任何事件概率。最主要公式是P(Z>z)=1-φ(z)P(Z<-z)=P(Z>z)和P(a≤Z≤b)=φ(b)-φ(a)因为Z是连续随机变量,所以不论不等式是否严格,这三个公式全都成立。2.标准正态分布计量经济学第103页在大多数应用中,我们首先碰到是一个正态分布随机变量X~Normal(μ,б2),其中μ不等于0且б2≠1。利用以下性质,可将任何一个正态随机变量转换成一个标准正态分布。

性质NORMAL.1:若X~Normal(μ,б2),则(X-μ)/б~Normal(0,1)。这说明了怎样把任意一个正态随机变量转换成标准正态。比如,X~Normal(3,4),而我们要计算P(X≤1)。我们总是把X规范化为一个标准正态变量:

P(X≤1)=P(X-3≤1-3)=P[(X-3)/2≤-1]=P(Z≤-1)=φ(-1)=0.1592.标准正态分布计量经济学第104页首先我们计算当X~Normal(4,9)时P(2<X≤6)(因为X是连续随机变量,所以用或都无关紧要)。现在下面我们来计算P(|X|>2):例2.2.6正态随机变量概率计量经济学第105页性质NORMAL.2:若X~Normal(μ,б2),则aX+b~Normal(aμ+b,a2б2)。性质NORMAL.3:若X和Y联合正态分布,则它们独立充要条件是Cov(X,Y)=0性质NORMAL.4:独立同分布正态随机变量任意线性组合都是正态分布。这说明了,独立正态分布随机变量平均是一个正态分布变量。若Y1,Y2,···,Yn为独立随机变量,且每一遍了都服从Y~Normal(μ,б2)分布,则这个结论在对正态总体均值统计推断中起关键作用。3.正态分布其它性质计量经济学第106页卡方分布(分布)是一个连续型随机变量概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、19所发觉,它是由正态分布派生出来,主要用于列联表检验。1.卡方分布数学形式设随机变量X1,X2,…Xk,相互独立,且都服从同一正态分布N(μ,σ2)。那么,我们能够先把它们变为标准正态变量Z1,Z2,…Zk,k个独立标准正态变量平方和被定义为卡方分布(分布)随机变量(读作卡方)六、卡方分布计量经济学第107页X即所谓含有n个自由度(degreesoffreedom,df)

分布。自由度概念在我们计量经济学中饰演着主要角色。1.卡方分布数学形式计量经济学第108页下列图为含有不一样自由度pdf图形。2.卡方分布性质图2.2.6有各种自由度分布计量经济学第109页

t分布在经典统计学和多元回归分析中广为应用:它能够从一个标准正态和一个分布得到。设Z服从标准正态分布,而X服从自由度为n分布。于是,随机变量便服从自由度为nt分布(tdistribution),记为T~tn。t分布自由度得子分母中随机变量。

t分布pdf有一个类似于标准正态分布形状,只是它更散开一些,因而尾端有较大面积。伴随自由度不停变大,t分布越来越靠近于标准正态分布。七、t分布计量经济学第110页图2.2.7有各种自由度t分布七、t分布计量经济学第111页统计学和计量经济学中另一主要分布是F分布。尤其是在多元回归分析中,要用F分布去检验假设。为了定义F随机变量,令

和,并假定X1和X2独立,则随机变量服从一个自由度为(k1,k2)F分布(Fdistribution)。记为。八、F分布计量经济学第112页图2.2.8各种自由度k1和k2分布八、F分布计量经济学第113页参看附件习题册。思索题计量经济学第114页一、总体、参数与随机抽样统计推断指利用来自总体一个样本而获知该总体一些情况。所谓总体(population),指任何定义完好一组对象,这些对象能够是个人、企业、城市或其它很多可能性。所谓“获知”,能够有很多含义,但大致归类为预计(estimation)和假设检验(hypothesistesting)两个范围。

第三节数理统计基础计量经济学第115页例1:劳动经济学家想了解中国全体就业成人教育回报,问再多受一年教育,工作平均增加百分数是多少?要取得中国全体就业人口工资和教育信息既不现实又不经济,但我们能够取得总体中一个子集数据。利用搜集到这些数据,一位劳动经济学家可能能汇报他对再受一年教育回报最好预计为7.5%。这就是点预计(pointestimate)一个例子。或者,他想汇报一个范围,比喻说“教育回报在5.6%~9.4%之间”。这是区间预计(intervalestimate)一个例子。一、总体、参数与随机抽样计量经济学第116页例2:城市经济学家想知道邻里犯罪计划是否与低犯罪率相关。经过在取自总体一个样本中比较了安排和不安排监控计划邻里犯罪率,他能够得到两结论之一:邻里犯罪监控计划对犯罪率确实有影响,或者没有影响。这个例子就属于假设检验范围。一、总体、参数与随机抽样计量经济学第117页统计推断第一步就是要明确所关注总体,而且一定要使之非常详细。一旦明确了总体是什么,就可对所关注总体关系建立或设定一个模型。这个模型将包括一些概率分布或概率分布特征,而这又取决于一些未知参数。所谓参数,就是决定变量关系之方向和强度一些常数。如劳动经济学例子中,所关注参数是总体中教育回报(率)。一、总体、参数与随机抽样计量经济学第118页令Y为一个随机变量,代表着概率密度函数为f(y;θ)一个总体,其中f(y;θ)依赖于单个参数θ

。假定除了θ值未知外,Y概率密度函数pdf是已知。不一样θ值将意味着不一样概率分布,所以我们对θ值感兴趣。假如我们能得到该总体某种样本,就能了解θ一些情况。最轻易处理抽样方案是随机抽样。抽样计量经济学第119页若Y1,Y2,···Yn是含有同一概率密度函数f(y;θ)独立随机变量,我们称为来自f(y;θ)随机样本(randomsample)[或者说来自由所代表总体一个随机样本]。

当是来自密度f(y;θ)一个随机样本时,我们又称Yi是取自f(y;θ)独立同分布(independent,identicallydistributed,i.i.d)样本。抽样计量经济学第120页在随机抽样定义中,Y1,Y2,···Yn随机性质反应了这么事实:在抽样实际完成之前,许多不一样结果都有可能。比如,我们获取了n=100个中国家庭家庭收入,那么对于由100个家庭组成每个不一样本,我们观察到收入都将有所不一样。一旦得到了一个样本,我们就得到一个数集,比喻说,这就是我们要加以研究数据。假定这个样原来自一个随机抽样模式是否适当,还要求我们对实际抽样过程有所了解。抽样计量经济学第121页“有限样本”一词来自以下事实:不论样本容量怎样,所讨论性质对任何样本容量都成立。有时把这些性质叫做小样本性质。1.预计量与预计值给定一个随机样本,它来自一个取决于某未知参数θ总体分布,θ一个预计量(estimator)就是赋予样本每个可能结果一个θ值法则。这个法则在进行抽样之前就已经确立,详细而言,不论实际得到什么样数据,这个法则都不会改变。二、预计量有限样本性质计量经济学第122页作为预计量一个例子,令为取自均值为μ总体一个随机样本。μ一个预计量,就是这个随机样本均值我们把叫做样本均值(sampleaverage),不过它不一样于我们在代数知识中作为一个描述统计量而定义一个数集样本均值。这里是一个预计量。给定随机变量Y1,Y2,···Yn任何一个结果,我们都用一样法则去预计μ:取其平均。对于实际结果,预计值(estimate)就是该样本均值:1.预计量与预计值计量经济学第123页假设我们得到美国10个城市以下失业率样本:例2.3.1:城市失业率城市失业率123456789105.16.49.24.17.58.32.63.55.87.5我们对美国平均城市失业率预计值是。普通地说,每个样本都有一个不一样预计值,不过求预计值法则是一样,不论在样本中出现是哪些城市,也不论样本中有多少个城市。计量经济学第124页更普通地说,参数θ一个预计量W可表示为一个抽象数学公式:其中,h代表随机变量Y1,Y2,···Yn某个已知函数。如一样本均值特殊情形那样,W也因取决于随机样本而成为一个随机变量:W伴随我们从总体中抽到不一样随机样本而可能改变。当我们把一个特定数集[比如]带入函数h中时,我们便得到θ一个预计值,记为:。有时把W叫做点预计量,而把w叫做点预计值,以区分区间预计量和区间预计值。1.预计量与预计值计量经济学第125页为了评价不一样预计方法,我们研究随机变量W之概率分布各种性质。一个预计量分布常被称为抽样分布(samplingdistribution),因为这个分布描述了W在不一样随机样本上取各种结果可能性。因为有没有限种组合数据以预计参数法则,我们需要一些有意义准则来挑选预计量,或者最少淘汰一些预计量。所以,我们必须告别描述统计量范围,不再仅为总结一组数据而计算诸如样本均值之类东西。在数理统计学中,我们研究是预计量抽样分布。1.预计量与预计值计量经济学第126页标准上,给定Yi概率分布和函数h,我们就能求出W整个抽样分布。通常在评价W作为θ一个预计量时,集中考虑W分布少数几个特征比较简单。一个预计量第一个主要性质就是关于它期望值。

无偏预计量:若θ预计量W对一切可能θ值,都有E(W)=θ则W

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论