计量经济学实际案例_第1页
计量经济学实际案例_第2页
计量经济学实际案例_第3页
计量经济学实际案例_第4页
计量经济学实际案例_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、初步的统计分析性别

身高体重性别

身高体重女有效的N4141男有效的N3232均值163.561052.4634均值175.281365.7969中值164.000053.0000中值174.500065.0000标准差5.215604.96033标准差5.697967.56356方差27.20224.605方差32.46757.207偏度.664-.184偏度.404.153峰度1.478.720峰度-.334.170以下两幅图反映了全体学生的身高体重的频率分布,我们可以发现本班上的全体学生的身高体重大致服从正态分布。二、均值分析1、分性别对身高进行的比较假设男女身高相等,否定假设可认为男生身高明显高于女生。2、分南北地区进行比较(1)身高假设两者均值相等,检验结果不能否定原假设,因而不能认为南北方身高有显著差异。(2)体重通过假设两者均值相等,检验结果无法否定原假设,因而认为南北方体重没有明显差异。3、分出生年份月份进行比较年份性别身高体重84男均值172.0056.00N11总计均值172.0056.00N1185男均值180.3370.67N33女均值161.0051.00N22总计均值172.6062.80N5586男均值174.2065.40N2020女均值162.1152.28N1818总计均值168.4759.18N383887男均值178.5066.58N66女均值164.8352.83N1818总计均值168.2556.27N242488男均值170.5065.00N22女均值167.0053.50N22总计均值168.7559.25N4489女均值165.0050.00N11总计均值165.0050.00N11总计男均值175.2865.80N3232女均值163.5652.46N4141总计均值168.7058.31N7373 ANOVA表平方和df均方F显著性身高*年份组间(组合)107.446521.489.323.897组内4455.9246766.506总计4563.37072体重*年份组间(组合)307.565561.513.730.603组内5645.2506784.257总计5952.81572由表可看出,各年份出生的人身高体重无显著性差异。月份性别身高体重1男均值177.0065.00N22女均值162.4051.40N55总计均值166.5755.29N772男均值176.0073.33N33女均值166.0054.67N33总计均值171.0064.00N663男均值174.5069.50N44女均值160.2550.75N44总计均值167.3860.13N884男均值181.2568.50N44女均值162.2552.00N44总计均值171.7560.25N885男均值169.5065.25N22女均值156.0043.00N11总计均值165.0057.83N336男均值175.0063.00N11女均值171.5057.50N44总计均值172.2058.60N557男均值171.0064.33N33女均值167.0050.50N22总计均值169.4058.80N558男均值179.2064.90N55女均值161.5052.50N22总计均值174.1461.36N779男均值171.6758.00N33女均值163.3354.33N33总计均值167.5056.17N6610男均值174.6761.83N33总计均值174.6761.83N3311女均值162.5051.67N1212总计均值162.5051.67N121212男均值171.0066.50N22女均值167.0057.00N11总计均值169.6763.33N33总计男均值175.2865.80N3232女均值163.5652.46N4141总计均值168.7058.31N7373 ANOVA表平方和df均方F显著性身高*月份组间(组合)1043.5901194.8721.644.109组内3519.7806157.701总计4563.37072体重*月份组间(组合)1052.1541195.6501.191.313组内4900.6616180.339总计5952.81572由表同样可得出,各月出生的人身高体重无显著性差异。三、回归分析全班数据散点图情况如下:1、未去奇异点回归方程为:Y=0.882X-90.4612、去奇异点输入/移去的变量(b)模型输入的变量移去的变量方法1身高(a).输入a已输入所有请求的变量。b因变量:体重 模型摘要(b)模型RR方调整的R方估计的标准差1.808(a).653.6485.121a预测变量:(常量),身高。b因变量:体重 ANOVA(b)模型平方和df均方F显著性1回归3447.99013447.990131.489.000(a)残差1835.5907026.223合计5283.58071a预测变量:(常量),身高。b因变量:体重 系数(a)模型非标准化系数标准化系数t显著性B的95%置信区间B标准误Beta下限上限1(常量)-88.74712.807-6.929.000-114.291-63.203身高.870.076.80811.467.000.7181.021a因变量:体重 残差统计量(a)极小值极大值均值标准差N预测值45.2074.7757.956.96972残差-13.56914.628.0005.08572标准预测值-1.8312.413.0001.00072标准残差-2.6502.857.000.99372a因变量:体重由散点图观察,身高与体重之间有比较明显的线性关系。并且剔除序号37奇异点,得到改进的线性回归方程。Y=0.870*X-88.7473、分性别回归分析(1)男生先检验此样本数据是否满足一元线性回归模型的基本假设a、干扰项零均值和同方差性从图中我们可以看出对所有i,εi基本满足正态分布N(0,)b、无自相关性利用SPSS软件计算出Durbin-Watson检验值为2.220,非常接近2,说明εi之间基本无自相关现我们用最小二乘法估计该模型的系数:记总体回归α+βxi的估计为:ŷi=a+bxi通过最小二乘估计,得运用该样本数据,经计算,我们最后可以得到:a=-20.641b=0.493现在我们对模型进行检验SST=1773.430SSE=1528.671SSR=244.758R2=SSR/SST=0.138调整的R2=0.109说明拟合度并不是很好,也许随着样本的增大,拟合度将会变得理想。我们现在对参数β进行检验假设H0:β=0H1:β≠0构造F统计量得到方差分析表 ANOVA(b)ModelSumofSquaresdfMeanSquareFSig.1Regression244.7581244.7584.803.036(a)Residual1528.6713050.956Total1773.43031aPredictors:(Constant),身高bDependentVariable:体重从表中,我们可以看出显著性小于0.05,故否定原假设,故认为β不为0于是我们给出模型:Y=-20.641+0.493x对α,β的区间估计(取置信度为0.95)=得到β的双侧置信区间:0.034≤β≤0.953 由此可以得到α双侧置信区间:-101.228≤α≤59.946对σ2的点估计为s2=∑ie2i/(n-2)=49.308同前面一样,得到σ2的95%的置信区间:≤σ2≤于是31.889≤σ2≤78.610接着,我们就可以做预测了得到置信区间(置信度为0.95):有一个同学身高为175cm,则根据我们的推断,其体重应该在(51.109,80.159)(单位:KG),期望值为65.634KG,而这位同学的真实体重为(2)女生同上,可以得到女生的身高和体重之间大致存在着以下的线性关系:Y=-55.667+0.661x对α,β的区间估计(取置信度为0.95)=得到β的双侧置信区间:0.440≤β≤0.883 由此可以得到α双侧置信区间:-91.905≤α≤-19.429对σ2的点估计为s2=∑ie2i/(n-2)=12.716同前面一样,得到σ2的95%的置信区间:≤σ2≤于是10.023≤σ2≤24.707接着,我们就可以做预测了得到置信区间(置信度为0.95):有一个同学身高为160cm,则根据我们的推断,其体重应该在(42.700,57.486)(单位:KG),期望值为50.093KG,而这位同学的真实体重为四、对回归分析方法的比较1、利用本科生男女生身高体重的相关数据资料,分别作了以下估计:(1)分别估计男生和女生的模型,结果如下(RSS为残差平方和):男生:RSS=867.5619女生:RSS=562.3358(2)将男生和女生的数据合并成一个大样本,估计,结果如下:RSS=1842.836(3)估计变截距固定效应模型,结果如下(D=0为男生,D=1为女生):RSS=1558.651下面对三种估计方法的比较分析设S1为第一种估计方法下两个模型的残差平方和RSS之和,S2为第二种估计方法下的残差平均和RSS,S3为第三种估计方法下的残差平均和RSS。S1=867.5619+562.3358=1429.898;S2=1842.836;S3=1558.651作两项约束条件检验:第二种估计方法与第一种估计方法的本质差异在于:对模型施加约束“截距和斜率在男生和女生之间无差异”假设,检验过程:>F0.05(2,69)从而拒绝“截距和斜率在男生和女生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。第一种估计方式与第三种估计方式的本质差异在于:对模型施加约束“斜率在男生和女生之间相同,但截距不同”假设,检验过程:>F0.05(1,69)从而拒绝“斜率在男生和女生间相同,但截距不同”假设,即放弃第三种估计方式的结果,说明男生和女生之间,身高和体重的关系,无论在均值水平上还是变动率上都存在显著差异。从而认为,对本科男女生身高体重关系的回归应采用估计方法(1)。2、利用本科生和研究生男女生(研修班数据)身高体重的相关数据资料,分别作了以下估计:(1)分别估计本科男生、研究男生和本科女生、研究女生的模型,结果如下(RSS为残差平方和):本科男生:RSS=867.5619研究男生:RSS=631.1248本科女生:RSS=562.3358研究女生:RSS=257.9198(2)将本科男生和研究男生的数据合并成一个大样本,本科女生和研究女生的数据合并成一个大样本,估计,结果如下:男生:RSS=1715.577女生:RSS=925.5335(3)估计变截距固定效应模型,结果如下(D=0为本科生,D=1为研究生):男生:RSS=1499女生:RSS=889.9618下面对三种估计方法的比较分析设S11,S12为第一种估计方法下男生和女生分别的残差平方和RSS之和,S21,S22为第二种估计方法下男生和女生分别的残差平均和RSS,S31,S32为第三种估计方法下男生和女生分别的残差平均和RSS。S11=867.5619+631.1248=1498.687;S12=562.3358+257.9198=820.2557;S21=1715.577;S22=925.5335;S31=1499;S32=889.9618对男生作两项约束条件检验:第二种估计方法与第一种估计方法的本质差异在于:对模型施加约束“截距和斜率在本科男生和研究男生之间无差异”假设,检验过程:>F0.05(2,61)从而拒绝“截距和斜率在本科男生和研究男生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。第一种估计方式与第三种估计方式的本质差异在于:对模型施加约束“斜率在本科男生和研究男生之间相同,但截距不同”假设,检验过程:<F0.05(1,61)从而接受“斜率在男生和女生之间相同,但截距不同”假设,即接受第三种估计方式的结果。由上述比较,从而认为,对本科男生和研究男生身高体重关系的回归应采用估计方法(3)。对女生作两项约束条件检验:第二种估计方法与第一种估计方法的本质差异在于:对模型施加约束“截距和斜率在本科女生和研究女生之间无差异”假设,检验过程:>F0.05(2,64)从而拒绝“截距和斜率在本科女生和研究女生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。第一种估计方式与第三种估计方式的本质差异在于:对模型施加约束“斜率在本科女生和研究女生之间相同,但截距不同”假设,检验过程:>F0.05(1,64)从而拒绝“斜率在男生和女生之间相同,但截距不同”假设,即拒绝第三种估计方式的结果。由上述比较,从而认为,对本科女生和研究女生身高体重关系的回归应采用估计方法(1)。数据来源:本课程73同学的身高和体重数据序号性别出生年月籍贯身高(cm)体重(kg)111987.08.27扬10.10大连16850311986.07.22杭州16762411986.09.03新08.26蜀05.27三晋16872711987.05.27金04.28温02.13江苏182801011988.02.27浙江170701111986.07.05安徽170631221988.7杭州165511311987.6南京175631411986.8杭州178531521987.2杭州165531621986.4吉林165571721987.12山东167571821986.8长春164521921987.3湖南158522021986.1山西164562121987.4天津157452221986.11宁波162522311986.1.6吉林173652411986.4.21大连176702521986.2.21山西165552611986.4.2吉林188752721986.11.11杭州170582821986.11.14上海166502921987.6.21河南175633021987.4.26温州168523111988.3.7湖南衡阳171603221986.11.18杭州160493321987.1.15青岛166553411987.2.20绍兴176703511985.3.15海宁182623621986.11.10西安160473721985.6.16四川163493821986.1.2山西154403911986.8.14济南174694011986.4.1吉林180614111987.1.18重庆181654221986.11.24成都160434311984.9.6扬州172564421986.11.6浙江155534521987.3.16河北156504611986.12.10浙江165634711985.12.19湖北177704811986.3.16安徽171844921986.11.22浙江162605021985.8.23黑龙江159535121987.7.1浙江169505211986.10.13北京177655321987.5.4福建156435411986.10.21广东179715511986.8.19成都183705621989.11.22江苏165505721987.9.3吉林159505821987.2.26吉林168565921986.4.17辽宁159546011986.3.27吉林174726111986.7.21湖北176686221987.1.3山西太原165516321986.11陕西165536421986.11.11山西太原160536521987.3.11浙江宁波161466621987.1.25浙江163556721986.9.26上海162576821986.11.25浙江165526921987.6.13福建福州180647021987.6.20合肥168547121987.3.24黑龙江166557221988.9.1浙江169567311986.9.3浙江17262研修班同学身高体重数据序号性别出生年月籍贯身高(cm)体重(kg)1男80.6浙江172602男74.1浙江175603男78.8河南176604女82.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论