北京空气质量以及可能影响因素调查研究-_第1页
北京空气质量以及可能影响因素调查研究-_第2页
北京空气质量以及可能影响因素调查研究-_第3页
北京空气质量以及可能影响因素调查研究-_第4页
北京空气质量以及可能影响因素调查研究-_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、商务统计学课程报告北京空气质量以及可能影响因素调查研究基于因子分析和线性回归小组成员姓名:周坤郝策张庆庆郝坤2016年5月7号 商务统计学课程报告摘要北京空气质量近些年成为人们关注的热点,客观地评价其变化趋势和影响因素,不仅有利于正确认识北京空气质量,也为有效预测和控制提供依据。本文主要通过对其他文献研究和空气质量评价体系,尽可能选取多的与北京空气质量可能有关的因素,希望找出具体的影响因素,更加清晰认识到北京的空气质量的罪魁祸首。通过选取北京2008年至2014年的相关数据,先通过因子分析的方法,提取四个公共因子,构建新的空气质量评价体系。然后用因子得分矩阵,得到四个的得分结果,用这个结果作为

2、自变量,空气质量优良天数作为因变量做回归分析,最终得到一个线性回归模型,可以很好的解释北京空气质量的影响因素。关键词:北京空气质量因子分析回归分析模型构建AbstractBeijing's air quality in recent years becomes the focus of public, objective evaluation of its trends and influencing factors can not only conducive to a correct understanding of Beijing's air quality, but a

3、lso provide the basis for effective prediction and control.In this paper, by factors other literature research and air quality evaluation system, select the number of Beijing's air quality as possible and may be relevant to find out which specific factors, a clearer understanding of the air qual

4、ity in Beijing is the culprit. By selecting the relevant data in Beijing from 2008 to 2014, first by the method of factor analysis extracted four common factors to build a new air quality evaluation system. Then scoring matrix by a factor to obtain the results of four scores, as a result of using th

5、is argument, the air quality days to do as the dependent variable regression analysis, end up with a linear regression model can well explain the factors that affect air quality in Beijing.Keywords: Beijing Air Quality ,Factor Analysis ,Regression ,Model 商务统计学课程报告目录摘要 (11绪论 (31.研究背景及目的 (32.可能影响因素与空气

6、质量评价体系的构建 (32 空气质量影响的因素选取 (33数据分析与研究 (53.1 数据采集 (53.2 数据因子分析与描述 (53.2.1 数据标准化处理 (53.2.2 因子分析和可行性分析 (63.2.3 提取公因子 (63.2.4 因子命名与新空气质量评价体系的构建 (93.3 因子的回归分析与描述 (103.3.1因子的回归分析 (103.3.2回归分析结果的解释 (143.4 数据可视化描述与解释 (144结论 (16参考文献 (16附录 (17图表目录图表 1 变异数总计 (7图表 2 碎石图 (8图表 3 因子旋转组件矩阵 (9图表 4 组件评分系数矩阵 (12图表 5 因子

7、得分变换 (12图表 6回归模型摘要 (13图表 7 回归模型系数 (13图表 8 年份趋势图 (15 商务统计学课程报告1绪论1.研究背景及目的近年来工业化和城镇化的快速发展,我国的经济飞速增长。但同时出现的环境问题也日益突出,最受大家关注的莫过于雾霾与PM2.5,越来越频发的雾霾天气严重影响了人们的正常生活和身体健康。那么北京作为国家首都,经济政治文化中心,那么它的空气质量也当然备受关注,研究影响空气质量因素也显得尤为必要,因为一些预防治理政策都要以此为依据。在想到这篇文章的题目时,就想知道大家说的空气质量到底和什么因素有关呢?现有的质量评价体系又是怎么样的,是不是很全面很有说服力呢?因此

8、在一些研究的基础上,本文想通过分析得到更全面的,更具有说服力的的评价体系,找到更多的可能影响空气质量的因素。2.可能影响因素与空气质量评价体系的构建在分析了一些文献和自己的想法后,选取了以下的21个可能影响因素,可吸入物颗粒年日均值,二氧化硫排放量,氮氧化物年日均值,粗钢产量,水泥产量钢材产量,发电量年,平均降水量年,平均气温,平均气压,大风日数,雨日数,日照数机动车拥有量,环境污染治理投资城市绿化覆盖率,常住人口密度,用电量,煤炭日均消耗量,汽油日均消耗量,天然气日均消耗量希望通过这些因素构建新的质量评价体系。2 空气质量影响的因素选取 商务统计学课程报告 商务统计学课程报告 影响空气质量不

9、仅有以上几个方面,其他的因素当然还有很多,本文由于获取数据途径和考虑范围有限,只能选取以上因素进行分析,数据选取于北京市统计年鉴。3数据分析与研究3.1 数据采集数据主要来源于北京统计年鉴和国家统计年鉴,选取北京市2008年至2014年这七年的数据作为分析样本,具体数据见附录。3.2 数据因子分析与描述3.2.1 数据标准化处理本文选取的指标不是同一个量纲和量纲单位,不能直接对不同量纲的指标进行比较。为了对整体指标进行综合评价,需要先对评价指标进行数学变换来消除指标量纲的影响,即进行无量纲化处理。标准化法是目前使用较为广泛的一种无量纲化方法,公式如下所示:商务统计学课程报告 Z=XJY其中,Z

10、为原始变量X标准化后的数值,JY为X的期望值,为X的标准差。3.2.2 因子分析和可行性分析应用KMO和Bartlett球形检验测定样本是否适宜做因子分析。KMO的值在01之间,越接近于1,变量间的偏相关性越强,因子分析效果越小。可是当我们把所有因子输入做可行性分析时,并没有输出相关系数矩阵,显示为此矩阵为非正定矩阵,但输出了因子分析的结果,研究和查找资料发现,可能是由于样本数太少,也可能是某些变量间相关性太强,进一步发现后面一些变量的方差太小,也就是特征值太小,意味着主成分方差过小,也说明主成分包含的信息量少,因此可能无法满足正定矩阵的条件。此种情况可以采取逐一淘汰变量的方法,最终得到检验的

11、结果,由于影响不大,也可以直接使用因子分析得出的结果,本文采取第二种方法。3.2.3 提取公因子利用特征值作为保留主成分标准,经SPSS分析得到如下主成分方差累计贡献率的表格:说明的变异数总计组件起始特征值撷取平方和载入循环平方和载入总计变异的 % 累加 % 总计变异的 % 累加 % 总计1 13.256 63.125 63.125 13.256 63.125 63.125 11.1692 3.128 14.894 78.019 3.128 14.894 78.019 3.5213 2.533 12.062 90.081 2.533 12.062 90.081 3.1824 1.026 4.8

12、84 94.964 1.026 4.884 94.964 2.0715 .757 3.607 98.5716 .300 1.429 100.0007 2.946E-15 1.403E-14 100.000 商务统计学课程报告8 1.376E-15 6.551E-15 100.0009 4.802E-16 2.287E-15 100.00010 4.185E-16 1.993E-15 100.00011 2.903E-16 1.382E-15 100.00012 1.224E-16 5.829E-16 100.00013 2.597E-17 1.237E-16 100.00014 -4.159E

13、-17 -1.980E-16 100.00015 -1.641E-16 -7.813E-16 100.00016 -2.168E-16 -1.032E-15 100.00017 -2.979E-16 -1.419E-15 100.00018 -3.429E-16 -1.633E-15 100.00019 -5.111E-16 -2.434E-15 100.00020 -6.181E-16 -2.943E-15 100.00021 -1.447E-15 -6.891E-15 100.000提取方法:主成分分析图表 1 变异数总计根据上表可知,提取因子因子有四个,累计方差贡献率为94.964,碎石

14、图如下: 商务统计学课程报告 图表 2 碎石图由上图可直观看出,因子4和因子5很接近,而且从因子4开始,下降趋势很缓慢,因此提取四个因子是合理的。4个因子的旋转矩阵如下表: 商务统计学课程报告 图表 3 因子旋转组件矩阵3.2.4 因子命名与新空气质量评价体系的构建根据旋转矩阵我们可以看出,可吸入颗粒物年日均值(x1,二氧化硫排放量(x2, 氮氧化物年日均值(x3, 环境污染治理投资(x4, 粗钢产量(x5, 钢材产量(x6 发电量(x8, 日均用电量(x9, 汽油日均消耗量(x11, 天然气年日均消耗量(x12, 雨日数(x17, 机动车拥有量(x19, 常住人口密度(x20, 城市绿化覆盖

15、率(x21,在因子1上有较高载荷,这些变量比较综合,涉及到各个方面,里面主要有工 商务统计学课程报告业产能,污染物排放以及人口与活动方面的因素,因此可以命名为“污染物排放与人类活动指数”,记为Y1。年平均降水量(x13大风日数(x16在因子2上载荷较大,因此可以命名为“自然风雨量指数”,记为Y2。水泥产量(x7煤炭日均消耗量(10年平均气温(x14平均气压(x15在因子3上的载荷较大,但这里面包含有气象,能源消耗,水泥产量,之间跨度较大,但仔细分析下,可以找到这几个变量之间的关系,水泥生产必然会造成大量的烟粉尘,传统工业也主要是使用煤炭,煤炭的燃烧,会导致温室效应,这样会影响气温与气压这些气象

16、因素,压强和温度又和城市热岛效应有关,在一定程度上影响空气质量,因此可将因子3命名为“温压指数”记为Y3只有日照数(x18在因子4上有较大载荷,有关研究表明太阳辐射也和空气质量有一定的关系,因此可将该因子命名为“太阳辐射指数”,记为Y4。通过以上的因子分析可见,在选取的21个可能有关因素变量中可分为四个主成分因子,分别命名为“污染物排放与人类活动指数”,“自然风雨量指数”“温压指数”与“太阳辐射指数”。可见目前的AQI评价空气质量的体系并不是很完善,不过它选取的变量也是因子分析得到的因子1,是贡献率最大的因子,所以它可以很好的体现一个城市的实时空气质量,是比较科学的。不过想评价一个城市的全年综

17、合空气质量,我们可以这四个因子进行分析,因此可据此四个指数构建一个新的评价体系。下面本文将围绕这四个因子与空气质量等级做回归分析,发现其中的规律,并予以解释。3.3 因子的回归分析与描述3.3.1因子的回归分析根据以上提取的因子,本文尝试用提取的因子作为自变量,空气质量指数等级达到及好于二级的天数作为因变量去做回归分析。组件得分矩阵如下 商务统计学课程报告 商务统计学课程报告图表 4 组件评分系数矩阵用得分系数矩阵作为每个自变量在公因子上的回归线性系数,因此可得到各个因子的线性表达式:Y1=-0.054x1-0.068x2+0.175x3+0.068x4-0.065x5-0.019x6+0.0

18、95x7+0.033x8+0.106x9+0.089x11+0.058x12-0.057x13-0.031x14-0.034x15+0.047x16-0.161x17+0.120x18+0.120x19+0.098x20+0.098x21Y2=0.168x1+0.021x2+0.225x3+0.003x4+0.109x5+0.140x6+0.123x7+0.008x8+0.007x9+0.1 45x10+0.015x11+0.044x12-0.308x13+0.075x14-0.057x15+0.281x16-0.091x17+0.021x18+0.032x19-0.001x20+0.032x

19、21Y3=0.12x1-0.058x2-0.006x3-0.080x4-0.070x5-0.085x6-0.143x7-0.063x8-0.035x9+0.239x10+0.012x11-0.003x12-0.003x13-0.024x13+0.409x14+0.337x15-0.003x16+0.018x17+0.145x18-0.032x19-0.032x20+0.011x21Y4=-0.006x1+0.027x2-0.223x3+0.123x4+0.130x5+0.018x6-0.293x7+0.234x8-0.047x9+0.051x10-0.021x11+0.117x12-0.50x

20、13-0.177x14-0.169x15-0.084x16+0.220x17-0.683x18-0.079x19-0.029x20-0.038x21依据以上式子对标准化的原始数据进行变换,可得下表: 图表 5 因子得分变换 商务统计学课程报告然后用提取的因子作为自变量,空气质量指数等级达到及好于二级的天数作为因变量去做回归分析。运用输入检验的方法,四个因子都进入了回归模型,具体分析结果如下: 图表6回归模型摘要 图表7 回归模型系数记空气质量达到二级及好于二级天数为P由上表可知,该回归模型的相关性较好,且通过了T检验,由非标准化系数得到的回归的方程为:P=-35.020Y1-4.713Y2-1

21、4.724Y3-31.182Y4+249.571系数标准化得到的方程为P=-0.623Y1-0.084Y2-0.262Y3-0.555Y4 商务统计学课程报告得到这个线性模型就可以用于预测和解释北京的空气质量,为空气质量的控制和治理提供思路。3.3.2回归分析结果的解释因为P是空气质量优良的天数,所以与这些影响因素都成负相关,系数为负数。而且可以看出因子1影响最大,因子1为“污染物排放和人类活动”,因此想要控制空气质量,我们必须要减少污染物排放,尽量使用清洁能源,使用公共交通出行,加大对污染治理的投资等等。通过因子2也可发现自然风雨量影响不是很大,但在一定程度上是会影响到某地区的空气质量。在常

22、识中,降雨量多,风力充沛的地方空气质量自然会比较好,一是因为污染物可以随着降雨落到地面,大风也可以将污染物转移。这样就不难解释,为什么北京一刮大风PM2.5就下降很多,甚至万里无云,所以大家戏称“治霾全靠风”。因子3也是与P成负相关,可见“温压指数”也是比较重要一个影响因素,它综合体现一个地区的气象因素,相关文献研究表明,温度对空气污染物有一定的影响,气压也会影响污染物的走向与流动,因此不仅要关注人类活动对空气质量的影响,通过本文分析得知,想要评价一个地区的空气质量,必须全面考虑,避免片面其他信息影响自己的判断。因子4也是自然因素,不过不清楚统计局的统计标准,是如何计算日照数,不过可以明白的是

23、,阳关辐射在一定程度上也会影响空气质量。3.4 数据可视化描述与解释 商 务 统 计 学 课 程 报 告 年份趋势图 350 300 250 2.00000 1.50000 1.00000 0.50000 天数 200 150 100 50 0 2,014 2,013 2,012 2,011 2,010 2,009 2,008 0.00000 -0.50000 -1.00000 -1.50000 -2.00000 -2.50000 年份 空气质量好于二级天数 自然风雨量指数 太阳辐射指数 污染物排放和人类活动指数 温压指数 图表 8 年份趋势图 从上面的年份趋势图可看出:因子 1 在逐年上升,

24、说明北京这几年快速发展,污染 物排放和人类活动肯定会增加,这也说明因子 1 很好解释了北京空气质量的影响因 素,其他因子一直在波动,但明显在 2011 年后呈现上升趋势,气候因素会发生变化, 也与北京人口连年增加,人类活动愈来愈剧烈有关。当然可以看出空气质量优良的天 数在 2012 后突然减少较大,这很值得关注,查找文献和研究近年北京发展也没发现有 特别波动大的地方,最后发现可能是由于 2012 年后空气质量评价指数改变了,由以前 的 API 改为 AQI,AQI 里面增加了几项空气污染物监测值,这里就有大家熟悉的 PM2.5 和 PM10,所以就不难理解空气质量优良天数为什么会突然减少这么多

25、了。 综上分析,本文对空气质量影响因素的分析和解释还是比较科学合理的。 15 无量纲 商 务 统 计 学 课 程 报 告 4 结论 本文的结论就是,在分析了现有的空气质量评价体系和一些文献,选取了选取了 21 个可能影响因素,最终通过因子分析得到四个因子,进行命名后得到四个影响空气 质量的指数,然后根据因子得分矩阵计算出每个因子的得分,再把空气质量优良的天 数作为因变量,四个因子作为自变量,进行回归分析,最终得到一个模型。再考虑中 间 2012 年时改为 AQI 评价体系,解释了突变情况。通过对这个模型的解释,我们可以 全面认识到影响空气质量因素,这样可以改变大众对空气污染的单一认识,能从更多

26、 方面去制定治理和防护措施,尽可能去控制北京空气质量,通过以上分析,本文得到 了预期的效果,构建了新的质量评价体系。本文结合了因子分析和回归分析两种方 法,选取因素覆盖面广,是一个创新点。 参考文献 1周惠彬,谢小燕.应用统计学M.成都:西南财经大学出版社,2000. 2陶求华,李峥嵘,蒋福建.基于气象和空气质量观测数据的日太阳辐射估计J.集美 大学学报(自然科学版), 2014,(五. 3陈月霞,曹琳,杨淑平.气温对大气主要污染物的影响A. 4王亚妮.雾霾的影响因素及治理措施研究. 5周文华.人类活动对北京空气质量影响的综合生态评价. 6曹伟华.北京地区雾霾气候特征及影响因子分析. 7周景博

27、.北京市空气污染指数及影响因素分析. 8张冲.中国主要城市宜居水平研究. 16 商 务 统 计 学 课 程 报 告 附录 年份 空气质 量好于 二级天 数 168 167 281 286 286 285 274 水泥产 量万吨 可吸入颗 粒物年日 均值 毫 克/立方 米 0.116 0.108 0.109 0.114 0.121 0.121 0.122 发电量 万千瓦 时 3385699 3312116 2908214 2628331 2688350 2424839 2431255 大风日 数 二氧化 硫排放 量 氮氧化 物年日 均值 环境污染治 理投资 亿 元 粗钢产 量 万 吨 钢材产量 万吨 2014 2013 2012 2011 2010 2009 2008 年份 7.9 8.7 9.4 9.8 11.5 11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论