下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、名词解释1、 因果效应:在理想化随机对照实验中得到的,某一给定的行为或处理对结果的影响2、 实验数据:来源于为评价某种处理(某项政策)抑或某种因果效应而设计的实验3、 观测数据:通过观察实验之外的实际行为而获得的数据4、 截面数据:对不同个体如工人、消费者、公司或政府机关等在某一特定时间段内收集到的数据5、 时间序列数据:对同一个体(个人、公司、国家等)在多个时期内收集到的数据6、 面板数据:即纵向数据,是多个个体分别在两个或多个时期内观测到的数据7、 离散型随机变量:一些随机变量是离散的 连续型随机变量:一些随机变量是连续的8、 期望值:随机变量经过多次重复实验出现的长期平均值,记作e(y)
2、9、 期望:y的长期平均值,记作y10、 方差:是y 距离其均值的偏差平方的期望值,记作var(y)11、 标准差:方差的平方根来表示偏差程度,记作y12、 独立性:两个随机变量x和y中的一个变量无法提供另一个变量的相关信息13、 标准正态分布:指那些均值的正态分布,记作n(0,1)14、 简单随机抽样:n个对象从总体中抽取,且总体中的每一个个体都有相等的可能性被选入样本15、 独立分布:两个随机变量x和y中的一个变量无法提供另一个变量的相关信息,那么这两个变量x和y独立分布16、 偏差:设;一致性:当样本容量增大时,落入真实值的微小领域区间内的概率接近于1,即是一致的有效性:如果的方差比更小
3、,那么可以说更有效17、 最小二乘估计量:最小化误差平方和的估计量m18、 值:即显著性概率,指原假设为真的情况下,抽取到的统计量与原假设之间的差异程度至少等于样本计算值与 原假设之间差异程度的概率19、 第一类错误:拒绝了实际上为真的原假设20、 一元线性回归模型:;代表变化一个单位所导致y的变化量21、 普通最小二乘(ols)估:选择使得估计的回归线与观测数据尽可能接近的回归系数,其中近似程度用给定x时预 测y的误差的平方和来度量22、 回归:可以由解释(或预测)的样本方差的比例,即23、 最小二乘假设:给定时误差项的条件均值为零:; 从联合总体中抽取的满足独立同分布; 大异常值不存在:即
4、具有非零有限的四阶距24、 置信区间:以95%的概率包含真值的区间,即在所有可能随机抽取的样本中有95%包含了的真值25、 同方差:若对于任意i=1,2,.,n,给定为常数且不依赖于,则 称误差项是同方差26、 异方差:若对于任意i=1,2,.,n,给定为常数且依赖于,则称 误差项是异方差27、 遗漏变量偏差:指ols估计量中存在的偏差,它是在回归变量x与遗漏变量相关时产生的28、 多元回归模型:;代表在其他影响y的因素不变的 前提下,变化一个单位所导致y的变化量29、 调整():是的一种修正形式,由于加入新变量后不一定增大,即30、 虚拟变量陷阱:如果有g个二元变量,且每个观测都只属于其中一
5、类,又如果回归中包含截距项以及所有g个二 元变量,则会因为完全多重共线性而无法进行回归31、 控制变量:回归中保持某些因素不变的回归量32、 二次回归模型:33、 非线性回归函数:,i=1,.,n;其中f()为非线性回归函数34、 多项式回归模型:35、 双对数模型:填空题1、 计量经济学提供了利用观测数据(而非实验数据)或者来自现实世界不太完美的实验数据估计因果效应的方法2、 截面数据 是多个个体在同一时间点上收集到的数据; 时间序列数据是一个个体在多个时间点上收集到的数据;面板数据 是多个个体分别在多个时间点上收集到的数据3、 随机变量y的期望值(也可称为均值,y)记作e(y),是变量的概
6、率加权平均值; y的方差为,y的标准差是方差的平方根4、 两个随机变量x和y的联合概率由它们的联合概率分布所表示;给定x=下y的条件概率分布是指给定x取值为的条件时,y的概率分布5、 正态分布随机变量具有钟形概率密度;若要计算有关正态随机变量的概率,首先需要对其标准化,然后再查阅附录表1的标准正态累积分布表6、 简单随机抽样可以产生n个随机观测值,.,它们是独立分布的7、 样本均值为独立分布时,有: 的抽样分布均值为;是无偏的; 根据大数定律,是一致的; 根据中心极限定理,当样本容量较大时,的抽样分布是近似正态的8、 t统计量可以用来计算和原假设相关的p值;较小的p值意味着原假设是错误的9、
7、的95%置信区间是指在95%全部可能样本中包含真值的区间10、 样本相关系数是总体相关系数的估计量,它度量了两个变量之间的线性关系它们的散点图究竟有多近似于一条直线11、 总体回归线的函数,表示y的均值:斜率表示x变化一个单位时对应y的预期变化;截距决定了回归线的水平(或高低)12、 利用样本观测数据(),i=1,2,. ,n使用普通最小二乘法可以估计总体回归线;回归截距和斜率的ols估计量分别记为13、 和回归标准误差(ser)度量了与总体回归线的接近程度;其中的取值范围为0到1;取值较大表明 接近总体回归线;回归标准误差是回归误差的标准差的估计量14、线性回归模型中有三个重要假设:给定时误
8、差项的条件均值为零:; 从联合总体中抽取的满足独立同分布; 大异常值不存在:即具有非零有限的四阶距; 若这些假设成立,则ols估计量是无偏的一致的大样本时服从正态分布15、对回归系数的假设检验类似于对总体均值的假设检验,都是利用t统计量来计算p值,从而确定是接受还是拒绝 原假设;类似于总体均值的置信区间,回归系数的95%置信区间为估计量1.96标准误差16、如果三个最小二乘假设成立,回归误差同方差并且服从正态分布,则利用同方差适用标准误差计算的t统计量在原假设下服从学生t分布;当样本容量足够大时,学生t分布和正态分布之间的差异可忽略不计17、若遗漏变量(1)与回归中的回归变量相关;(2)是y的
9、决定因素之一,则会产生遗漏变量偏差(同时满足)18、多元回归模型是包含多个回归变量,每个回归变量都对应一个回归系数 其中系数表示在其他回归变量不变的情况下,变化一个单位时y的预期变化,其他回归系数的解释与之类似19、可通过ols估计多元回归中的系数;当满足四个最小二乘假设时,ols估计量是无偏一致估计量,并且在i大样本 下服从正态分布 给定的条件均值为零,即; 从联合分布中抽取的=1,.,n满足独立同分布; 不存在大异常值,即非零有限四阶距;不存在完全多重共线性20、在多元回归中,当某个回归变量是其他回归变量的完全线性组合时就产生了完全多重共线性,通常是有选择回归变量时的错误引起的,因此处理完
10、全多重共线性的方法是改变回归变量集21、回归标准误差、都表示多元回归模型的拟合优度22、当系数涉及多个约束时的假设称为联合假设,可利用f统计量进行检验23、在非线性回归中,总体回归函数的斜率依赖于一个或多个解释变量的取值24、两个变量的乘积项称为交互项,在回归中加入交互项可以使其中一个变量的回归斜率依赖于另一个变量的取值计算题p41 2.2 使用表2-2中的概率密度计算e(y)和e(x)pr(x=0)=0.30 pr(x=1)=0.70pr(y=0)=0.20 pr(y=1)=0.78e(x)=0*0.30+1*0.70=0.70e(y)=0*0.22+1*0.78=0.782.6下面的表格给
11、出了基于2008年美国适龄人口从业状况和接受大学教育的联合分布(1) e(y)=0*0.046+1*0.954=0.954(2) 失业率=pr(y=0)=0.046(3) e(y丨x=1)=0*pr(y=0丨x=1)+1*pr(y=1丨x=1)=0.332/0.341=0.9736 e(y丨x=0)=0*pr(y=0丨x=0)+1*pr(y=1丨x=0)=0.622/0.659=0.94385(4) 大学毕业生的失业率=1-e(y丨x=1)=1-0.9736=0.0264 非大学毕业生的失业率=1-e(y丨x=0)=1-0.94385=0.5615(5) pr(x=1丨y=0)=0.009/0
12、.046=0.196 pr(x=0丨y=0)=0.037/0.046=0.804(6) p(x=xi,y=yi)=p(x=xi)*p(y=yi) 独立 反之不独立p71 3.8对1000个随机抽取的高三学生安排一项新版的sat测试。测试成绩的样本均值为1110,而样本标准差为123。构建高三学生测试成绩总体均值的95%置信区间。11101.96*123=1110241.08=868.92,1351.08p97 4.1假设某研究所人员基于100组三年级的班级规模(cs)和平均测试成绩(testscore)数据估计的ols回归为:(1)520.4-5.82*22=392.36(2) 回归预测值:1
13、=520.4-582*19=409.82 2=520.4-582*23=386.542-1=386.54-409.82=-23.28(3) cs均值=21.4=x的均值 yi=520.4-5.82xiyi=100*520.4-5.82xiy的均值=yi/n=520.4-582x的均值=520.4-5.82*21.4=395.852p122 5.1假设某研究所人员基于100组三年级的班级规模(cs)和平均测试成绩(testscore)数据估计的ols回归为:(1) t=1帽-1/s1帽=-5.82-1/2.21即丨1帽-1/s1帽丨1.96,丨-5.82-1/2.21丨1.9695%置信区间对应
14、的双边临界值1.96,-5.821.96*2.21 -10.1516,-1.4884(2) h0:1=0,h1:10t=1帽-1/s1帽=-5.82-0/2.21=-2.63对应双边检验的p值为0.0099。在5%水平和1%水平下都拒绝元假设。说明班级规模是影响测试成绩的显著变量。p147 6.2根据表6-2中第(1)列的回归结果回答:(1) wage帽=12.69+5.46x1wage0帽=12.69+5.46*0=12.69 wage1帽=12.69+5.46*1=18.15所以具有大学学历的员工收入比具有高中学历的员工收入高每小时5.46美元(2) wage帽=12.69-2.64x2w
15、age0帽=12.69-2.64*0=12.69 wage1帽=12.69-2.64*1=10.05所以男比女高2.64美元/每小时6.5数据来源于2003年某社区220个住房销售的样本数据。(1) 价格预计增加23.4千美元(2) 价格预计增加23.4*1+0.156*100=39千美元(3) 损失48.8千美元6.6某研究人员计划利用美国县级随机样本数据研究警察对犯罪的因果效应。(1)遗漏了变量,如经济发展水平,经济发展水平是犯罪的一个最顶因素又与警备力量相关。会导致遗漏变量偏差。(2)经济发展水平正向影响犯罪率,又与警备力量正相关,警备力量负向影响犯罪率,犯罪率因而遗漏经济发展水平这个变量会低估警备力量对犯罪率的影响。丨1帽丨丨1丨,1帽0,10p171 7.2根据表7-2第(1)列的回归结果回答:=12.69+5.46x1-2.64x2(1) 原假设h0:1=0 备择假设h1:10构造统计量t=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防暑降温的宣传横幅标语(60句)
- 《供配电技术》2.1 教案
- 销售业务年终的总结
- 投标单位授权委托书(10篇)
- 有关青春的三分钟演讲稿(34篇)
- 内蒙古呼伦贝尔市(2024年-2025年小学五年级语文)人教版课后作业(上学期)试卷及答案
- 2024年人造原油项目资金申请报告代可行性研究报告
- 计算机应用基础教案
- 上海市县(2024年-2025年小学五年级语文)统编版阶段练习((上下)学期)试卷及答案
- 四年级数学(简便运算)计算题专项练习与答案
- XX银行信息系统软件版本管理办法
- 叉车选型的注意点
- 第一单元 计算机中的编码 课件 初中信息技术七年级上册
- 烧结过程中氮氧化物生成机理及控制
- GB/T 7701.2-2008煤质颗粒活性炭净化水用煤质颗粒活性炭
- GB/T 26832-2011无损检测仪器钢丝绳电磁检测仪技术条件
- GB/T 11375-1999金属和其他无机覆盖层热喷涂操作安全
- GA 1800.3-2021电力系统治安反恐防范要求第3部分:水力发电企业
- 英属哥伦比亚大学PPT
- 《文献阅读》课件
- 2022年新版《建设工程工程量清单计价规范》
评论
0/150
提交评论