重庆大学数理统计大作业_第1页
重庆大学数理统计大作业_第2页
重庆大学数理统计大作业_第3页
重庆大学数理统计大作业_第4页
重庆大学数理统计大作业_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、研究生课程考核试卷适用于课程论文、提交报告科 目: 数理统计 教 师: 刘琼荪 姓 名: xxx 学 号: 20210702xxx 专 业: 机械工程 类 别: 学术 上课时间: 2021 年 3 月至 2021 年 4 月 考 生 成 绩:卷面成绩平时成绩课程综合成绩阅卷评语: 阅卷教师 (签名) 我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代开展至今已有60多年的历史,这期间中国民航经历了曲折的开展。随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,

2、假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。关键词:民航客运量 影响因素 回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。截止2004年底,我国定期航班航线到达1200条,其中国内航线包括香港、澳门航线975条,国际航线225条,境内民航定期航班通航机场133个不含香港、澳门,形成了以北京、上海、广州机

3、场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。2004年中国民航运输总周转量到达230亿吨公里不包括香港、澳门特别行政区以及台湾省,在国际民航组织188个缔约国中名列第3位。从上述事实可以看出我国民航的开展所取得的成果显著。当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值亿元,城市居民消费水平绝对元,定期航班航线里程万千里等1。为了研究过去的情况,从中国统计年鉴2得到19

4、94年统计摘要,分析类似因素对我国航空客运量的影响。二、数据描述如下为所得统计数据:表1 1978-1993年统计数据年份y民航客运量万人x1国民收入亿元x2消费额亿元x3铁路客运量万人x4民航航线里程万公里x5来华旅游入境人数万人1978231301018888149119792983350219586389161980343368825319220419814013941279995300198244542583054999221983391473633581060441984554565239051103531985744702048791121101986997785955521085

5、791987131093136386112429198814421173880381226451989128313176900511380719901660143849663957121991217816557109699508119922886202231298599693199333832488215949105458三、模型建立:1提出假设条件,明确概念,引进参数;参考相关书籍3,设随机变量民航客运量为万人,解释变量,分别为国民收入亿元,消费额亿元,铁路客运量万人,民航航线里程万公里,来华旅游入境人数万人,且回归函数,称,为多元线性回归模型,为回归系数,为随机误差。为上述来自多元线性回归

6、模型的样本值,满足:为了便于对模型进行参数估计、模型检验、变量选择等,有必要对模型作如下一些根本假定。1. 解释变量,是可控制的、非随机变量,互不相关。2. 随机误差项具有零均值和同方差的性质,即,并且,那么有。3. 随机变量误差项服从正态分布,即2模型构建:由表1通过EXCEL绘制变量对因变量的关系散点图如下:图1 民航客运量与国民收入关系图图2 民航客运量与消费额关系图图3 民航客运量与铁路客运量关系图图4 民航客运量与民航航线里程关系图图5 民航客运量与来华旅游入境人数关系图由以上的散点图看出:与存在非线性关系,但与其它几个变量根本是线性相关的。所以首先考虑回归模型为多元线性模型。四、模

7、型求解。采用最小二乘估计法求解模型参数,采用SPSS软件计算,得到如下结果:表2 拟合过程小结表3 方差分析表4 回归过程统计量图6 残差图那么回归方程为五、模型分析检验1决定系数由决定系数看出回归方程高度显著。2方差分析表3回归系数的显著性检验t检验:回归系数的显著性检验由显著性一列看出自变量的回归系数都通过了t检验即收尾概率小于规定的显著性水平0.05,说明5个自变量对的影响显著。其中铁路客运量的显著性为最大,但仍小于5%。4检验残差序列的自相关性D-W检验:D-W=1.9932,所以认为模型不存在序列的自相关性。6异方差检验从残差图看出所有点落在±2之间,没有明显变化趋势,所以

8、认为综上,认为用最小二乘估计的方法估计的模型理论上是有效的。7 模型进一步分析虽然,模型通过了检验,但是由之前的图可知与正相关,但国民消费额的回归系数是负值,显然是矛盾的,同时和的VIF很大,的VIF也大于10,其原因是自变量之间的共线性,因而回归模型还要就共线性问题进行谈论。如下表是各变量之间的相关系数:表5 相关系数表可以看出,与,的相关系数都在0.9以上,说明所选自变量与高度线性相关,验证之前的散点图。用与自变量作多元线性回归是适合的。另一方面,与各变量的相关系数均小于0.5,而,之间的相关系数均到达0.9以上,所以应尝试解决它们之间的共线性。首先剔除VIF最大的,计算剩余变量参与的回归

9、方程。结果如下:表6 统计量表可以看出,当前的VIF最大,同时远大于0.05,故继续剔除。计算剩余参数的回归方程,结果如下:表7 统计量表表8 拟合过程小结表9 方差分析表可以看出三个变量的VIF均小于10,且均通过了t检验。说明此回归模型不存在强多重共线性,回归系数也有合理的经济解释。说明回归方程高度显著,方差分析的结果也说明回归方程显著性高。图7 残差直方图图8 残差正态P-P图由P-P图和直方图可知残差服从正态分布,所以模型是有效的4。所以民航客运量的回归模型为:。六、岭回归模型除了上述方法,在处理自变量之间存在强线性相关的情况时,可以采用岭回归进行估计虽然牺牲了一定的无偏性5。采用SP

10、SS编写程序运行可得到如下岭回归结果。表10 K值表图9 岭迹图由上述结果,可知RSQ均大于0.98,再进行岭回归,得岭回归模型:表11 岭回归统计表可以看出除了的回归系数为负,其余均为正,同时各变量的显著性检验均通过。方差分析显示回归模型高度显著。所以该方法所得的回归模型为:七、主要的结论或发现。比拟两种方法的得到的回归模型:可以看出两种模型均认为,对的正面奉献度度小于,或者认为可以忽略。这说明国民收入和消费额对于民航客运量的影响很小。查阅相关历史可知,我国民航的开展有多个阶段。第一阶段是50到70年代末,主要是军队管民航,经营上采取高度集中的方案经济体制,航空运输规模较小且开展缓慢。第二阶

11、段是从1980-1992年,民航实施企业化改革,成立了新的地区管理局、国家骨干航空公司和一些区域性的航空公司。这个阶段正是数据来源时期。在该时期,民航的开展仍处于起步阶段,同时该时期即使是经济相对兴旺的沿海地区也尚未到达小康阶段,出行乘坐飞机仍是绝大多数人所不能承受的。所以来自国内的客运量是相当小的。这也解释了为什么游客数量的回归系数大于,事实上,两者的线性相关程度很高,国民收入提高,消费自然上升,而是与y的关系最直接的,航线里程数的增加,自然反映客运量的增加,所以该自变量的系数是最大的。的系数为负,很显然两种交通方式是竞争关系,但是正如前面所分析,人们出远门乘飞机很少,无论乘火车的人数如何增

12、加,对飞机的客运量产生的影响很小,所以的系数依旧很小。为了表达所有变量对y的影响,最终决定使用 作为回归模型。参考资料1 彭立南,影响民航客运量因素的相关性分析及实证研究,中国市场,2021 ,35 (798 ):160-1612 中国统计年鉴,197819933 杨虎、刘琼荪、钟波,?数理统计?,高等教育出版社,2004,103-1184 卢文岱、朱红兵,?SPSS统计分析?第五版,电子工业出版社,2021,270-3005 何晓群、刘文卿,?应用回归分析?第三版,中国人民大学出版社,2021,169-189附录Spss 岭回归代码INCLUDE 'C:Program Files (

13、x86)SPSSIncPASWStatistics18SamplesEnglishRidge Regression.sps'.RIDGEREG DEP=y /ENTER x1 x2 x3 x4 x5INCLUDE 'C:Program Files (x86)SPSSIncPASWStatistics18SamplesEnglishRidge Regression.sps'.RIDGEREG DEP=y /ENTER x1 x2 x3 x4 x5/k=0.085.Sps文件修改代码*-.* Calculate raw coefficients from standardi

14、zed ones, compute standard errors* of coefficients, and an intercept term with standard error. Then print* out similar to REGRESSION output.*-从这里开始是给出系数估计. compute beta=b;0. compute b= ( b &/ std ) * sy. compute intercpt=ybar-t(b)*t(xmean). compute b=b;intercpt. compute xpx=(sse/(sst*(n-nv-1)*in

15、v(xpx+(k &* ident(nv,nv)*xpx*                                 inv(xpx+(k &* ident(nv,nv). compute xpx=(sy*sy)*(mdiag(1 &/ std)*xpx*mdiag(1 &/ std). compute seb=sqrt(diag(xpx)

16、. compute seb0=sqrt( (sse)/(n*(n-nv-1) + xmean*xpx*t(xmean). compute seb=seb;seb0. compute rnms=varname,'Constant'. compute ratio=b &/ seb. compute ppp=2*(1-tcdf(abs(ratio),n-nv-1). compute bvec=b,seb,beta,ratio,ppp. print bvec/title='-Variables in the Equation-'  /rnames=rnms /clabels='B' 'SE(B)' 'Beta' 'T' 'sig

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论