版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(由组委会填写)第十届华为杯全国研究生数学建棋光赛题目空气中pm2.5问题的研究摘要:本文建立了相关性分析模型,灰色关联度模型,混合回归模型,高斯烟羽 模型,分期治理最优化模型等模型,通过定量与定性分析的方法,从相关因素、 分布与演变、控制管理三个方面,对pm2. 5进行了深入的研究与探讨。针对问题一:1、以六种污染物为相关量,建立了相关性分析模型。将附件1的数据代入 模型中,求得的结果表明:相关性最高的指标组是pm2.5和co,其相关系数为0. 82,相关性最低的指标组是n02和3,其相关系数为-0.063,即独立性最强。2、以pm2. 5为参考数列,其它5种污染物为比较数列,建立了灰色关联
2、 度分析模型,将附件1的数据代入模型中,求得的结果表明:pm2. 5与其它五 种污染物的平均关联度为0.80,可见相关性较高。以pm2. 5为因变量,其它 五种污染物为自变量,先后建立多元线性回归模型和混合回归模型,模型结果 表明:混合回归模型更优(相关系数由0.85增加为0.89)。3、利用互联网收集到全国76个城市aqi的6个监测指标和湿度数据,以 pm2. 5为因变量,其它五种污染物为自变量,建立了线性回归模型。将湿度指 标也考虑为自变量后,回归模型的相关系数得到明显提升(由0.88提升到0. 92),表明湿度与pm2. 5存在较强的相关性。针对问题二:1、通过伽马分布预测出2013年西
3、安市13个地区pm2.5的全部数据,利用 matlab画出了 pm2. 5时空分布图,并得出了三种分布规律。考虑到各地区 “污染程度”为较模糊的概念,因此建立了模糊综合评价模型,对每个地区的 污染程度进行了综合评价,模型结果表明:高压开关厂地区污染指数最高 (94. 39),阎良区地区污染指数最低(75. 27)。2、对pm2. 5受风力影响在大气中扩散的问题,建立了高斯烟羽模型进行 分析。假设风向为正北向,风速为40 “,扩散系数为0.00001,排放源有 效高度为50w,初始浓度为各监测站点的最高值,对模型进行求解,得到13 个地区的扩散数据(仅列出高压开关厂地区的上风处扩散数据):距离(
4、aw)02468101112pm2. 5 浓度(#g/w3)1000850703480292108210时间(min)0203658821061151213、将pm2. 5污染程度划分为重度污染、中度污染和细轻度污染(安全)_个级别,同样假设风向为正北向,风速为40aw/a,扩散系数ct为0.00001,排放源有效高度为50w,初始浓度为某站点最高值2倍,利用高斯烟羽模型求出 13个地区的扩散数据,结合各个地区之间的距离,得到了各地区的污染程度。 以高压开关厂为例,得到结果如下:轻度污染(安全)中度污染重度污染阎良区临潼区广运潭 纺织城长安区市体育馆曲江文化集团 兴庆小区其它地区4、利用互联网
5、收集到了福岛第一核电站的放射性物质扩散数据,将放射性 物质与pm2.5扩散数据进行对比,发现两者的扩散规律总体一致,从而验证了 模型的合理性。利用物质的自身沉降作用和雨水吸附作用对高斯烟羽模型进行 了修正,得到了修正后更为一般性的扩散模型。针对问题三:1、根据以往空气质量的变化趋势及pm2. 5当前年平均浓度(280#g/w3), 预测出在不治理的情况下,五年后pm2. 5年平均浓度为324#g/w3。然后采用 分期治理的思想,将五年的治理时期分为前期、中期和后期。考虑到实际治理 进度的变化规律与柯西分布函数相似,通过计算机模拟找出了最理想的柯西分 布函数,由此确定了 pm2. 5的分期治理计
6、划:时期前期(准备期)中期(治理期)后期(稳固期)年次第一年第二年第三年第四年第五年治理量百分比()9.632.738. 815.33.6治理量31. 1105.94125.7149.5711.662、以专项治理总费用最小为目标,建立了最优化模型。然后同样采用分期 治理的思想,利用柯西分析函数对最优化模型进行修正,得到修正后的分期治 理最优化模型。以数据1中pm2. 5年平均浓度(82 #g/w3)为初始浓度,假设 最终治理目标为30#g/w3,对模型进行求解,得到总费用为3.38 (百万),逐 年治理计划如下表:时期前期(准备期)匚p期(治理期)后期(稳固期)年次第一年第二年第三年第四年第五
7、年治理量#g/w34.1513.6519.19.853.25费用(百万元)0.0860.9321.8240.4850.053将模型得到的治理计划与实际环境治理计划进行对比,发现两者的治理进 度变化规律总体一致,从而验证了模型的合理性。关键字:相关性分析模型灰色关联度模型高斯烟羽模型柯西分布函数1问题重述1.1问题背景“2013年初以来,中国发生大范围持续雾霾天气。据统计,受影响面积约 占国土面积的1/4,受影响人口约6亿人”。对空气质量监测,预报和控制等问 题,国家和地方政府均制定了相应政策、法规和管理办法。调整了环境空气功 能区分类等。aqi是无量纲指数,它的分项监测指标为6个基本监测指标(
8、二 氧化硫s2、二氧化氮n2、可吸入颗粒物pm10、细颗粒物pm2.5、臭氧3 和一氧化碳co等6项)。新标准中,首次将产生灰霾的主要因素对人类 健康危害极大的细颗粒物pm2.5的浓度指标作为空气质量监测指标。1.2问题的提出对细颗粒物pm2.5及相关的因素的统计数据还太少,对pm2.5的客观规律 也了解得很不够。我们必须千方百计利用现有的数据开展研究,同时新课题、 探索性研究、“灰箱问题”也有可能成为数学建模爱好者的用武之地。1.3本文所需解决的问题一、pm2.5的相关因素分析请依据附件1或附件2中的数据或自行采集数据,利用或建立适当的数学 模型,对aqi中6个基本监测指标的相关与独立性进行
9、定量分析,尤其是对其 中pm2.5 (含量)与其它5项分指标及其对应污染物(含量)之间的相关性及 其关系进行分析。如果你们进而发现aqi基本监测指标以外的、与pm2.5强相 关的(可监测的)成分要素,请陈述你们的方法、定量分析结果、数据及来源。二、pm2.5的分布与演变及应急处理请依据附件2、附件3中的数据或自行采集某地区的数据,通过数学建模 探索完成以下研究:1、描述该地区内pm2.5的时空分布及其规律,并结合环境保护部新修订 的环境空气质量标准地区进行污染评估。2、建立能够刻画该地区pm2.5的发生和演变(扩散与衰减等)规律的数 学模型,合理考虑风力、湿度等天气和季节因素的影响,并利用该地
10、区的数据 进行定量与定性分析。3、假设该地区某监测点处的pm2.5的浓度突然增至数倍,且延续数小时, 请建立针对这种突发情形的污染扩散预测与评估方法。并以该地区pm2.5监测 数据最高的一天为例,在全地区pm2.5浓度最高点处的浓度增至2倍,持续2 小时,利用你们的模型进行预测评估,给出重度污染和可能安全地区。4、采用适当方法检验你们模型和方法的合理性,并根据已有研究成果探索 pm2.5的成因、演变等一般性规律。三、空气质量的控制管理数据1所在地区的环境保护部门考虑治污达标的紧迫性和可行性,在未来 五年内,拟采取综合治理和专项治理相结合的逐年达到治理目标的方案。请考 虑以下问题:1、该地区目前
11、pm2.5的年平均浓度估计为280 (单位为g/w3),要未来 五年内逐年减少pm2.5的年平均浓度,最终达到年终平均浓度统计指标35 (单 位为g/m3),请给出合理的治理计划,即给出每年的全年年终平均治理指标。2、据估算,综合治理费用,每减少一个pm2.5浓度单位,当年需投入一 个费用单位(百万元),专项治理投入费用是当年所减少pm2.5浓度平方的(1) 005倍(百万元)。请你为数据1所在地区设计有效的专项治理计划,使得既 达到预定pm2.5减排计划,同时使经费投入较为合理,要求你给出五年投入总 经费和逐年经费投入预算计划,并论述该方案的合理性。2模型假设与符号说明2.1模型假设假设1:
12、连续排放时pm2.5排放的速率恒定;假设2: pm2.5在平整、无障碍的地面上空扩散;假设3:地面及地标地物对pm2.5无吸收;假设4:风向水平,风速和风向恒定;假设5:风速大于无风情况下放射性气体扩散的速度;假设6:排放源的源强是连续且均匀的,初始时刻pm2.5的浓度、温度呈 均匀分布。2.2符号说明表2-1符号说明参数符号符号说明x (/ = 1,2,,6)分别代表s2、n2、pm10、co、3、pm2.5的监测指标作=1,2,5)分别代表so2、no2、pm10、co、3对pm2.5的关联度xpm2.5第i年减少(治理)量y代表样本pm2.5的含量u平均风速dpm2.5物质粒子直径扩散系
13、数apm2. 5年平均增长率c0pm2. 5初始浓度c第y年pm2. 5浓度z五年专项治理投入总经费si每年专项治理投入费用第一年到第i年pm2. 5的累计减少量与pm2. 5初始量之比3问题分析3.1针对问题一1、对aqi中6个基本监测指标的相关与独立性进行定量分析:这个问题 是典型的相关性分析问题,因此可以建立相关性分析模型来求解。2、对pm2. 5含量与其它5项污染物含量之间的相关性及其关系进行分析: 首先可以利用灰色关联度模型分析pm2. 5含量与其它5项污染物含量的关联 度,然后可以以pm2. 5含量为因变量,其它污染物含量为自变量,先后建立多 元线性回归方程和混合回归模型,从而确定
14、pm2. 5与其它污染物的定量关系。3、pm2. 5其它相关因素的探寻:题目中提到了二氧化硫(s2),二氧化 氮(n2),一氧化碳(co)是在一定环境条件下形成pm2. 5前的主要气态物 体,可以认为这些污染物在空气中通过物理和化学反应转化为了 pm2. 5,而水 一般都是化学反应不可缺少的物质,因此有理由相信空气湿度与pm2. 5有关。 首先可以通过互联网收集到湿度数据,然后对数据进行分析,说明湿度与pm2. 5 的相关性。3.2针对问题二1、描述该地区pm2. 5的时空分布及其规律,并地区进行污染评估:首先 可以利用matlab画出该地区pm2. 5的时空分布图,并由时空分布图分析 pm2
15、. 5的分布规律。由于“污染程度”属于比较模糊的概念,因此可以利用模 糊综合评价模型对各站点进行综合污染评估。2、建立能够刻画该地区pm2. 5的扩散规律的数学模型,并利用该地区的 数据进行定量与定性分析:考虑风速的情况下,空气中污染物的扩散,可以采 用高斯烟羽模型进行分析,利用此模型求出西安市13个地区pm2. 5的扩散数 据,从而对该地区的污染情况进行定量与定性分析。3、全地区pm2. 5含量最高点处的含量增至2倍,持续2小时,利用模型 进行预测评估,给出重度污染和可能安全地区:首先根据新修订的环境空气 质量标准将pm2. 5划分为重度污染,中度污染,轻度污染(安全)三个等级, 然后利用模
16、型求出各个地区的扩散数据,最后结合各地区的两两距离,判断各 个地区的污染情况。4、采用适当方法检验模型和方法的合理性,并根据已有研究成果探索 pm2. 5的成因、演变等一般性规律:由于发射性物质在大气中的扩散规律与 pm2. 5的扩散规律相似,因此可以将模型求出的pm2. 5的扩散数据与已有的 放射性物质扩散数据进行对比,从而检验结果和模型的合理性。对pm2. 5扩散-5-4.2数据补全4.2.1附件1数据补全一般性规律的探索,可以利用pm2. 5自身沉降作用、雨水吸附作用等一般性因 素对高斯扩散模型进行修正,从而得出pm2. 5更为一般性的扩散规律。3.3针对问题三1、给出合理的pm2. 5
17、治理计划:考虑到实际环境治理过程中,往往是分 期进行治理工作的,而且治理进度是先慢变快,再由快变慢(这种变化规律与 柯西分布函数的变化规律很相似)。因此可以将pm2. 5的治理计划分为前期(准 备期),中期(治理期),后期(稳固期)三个时期,并由柯西分布函数对治理 计划进行模拟,得出与实际环境治理过程相符的分期治理计划。2、给出合理的pm2. 5专项治理计划:首先可以以专项治理费用最小为目 标,建立最优化模型,同样可以引入分期治理的思想,利用柯西分布函数对模 型最优化模型进行修正,得到修正后的分期治理最优化模型。4数据分析4.1数据收集利用互联网收集到2013年9月20日上午10点整,全国76
18、个城市aqi的 6种污染物浓度数据及湿度数据,如表4-1 (仅列出部分城市数据,详细结果见 附录一)表4-1 76个城市aqi和湿度数据城市pm2.5(mg / m3 )pm10(mg / m3 )co(mg / m3 )n2(mg / m3 )3(mg / m3 )s2(mg / m3 )湿度(%)海口7160.375510266福州12320.4672058628成都20290.7044419993舟山14360.701473272厦门14410.341479250丽水19440.43119681030拉萨16331.62416351316惠州28520.70722691866上海2145
19、0.56614831062张家口11250.29820712035嘉兴25420.35426921263温州24470.6242268868中山38720.91137353161东莞44820.96144655562盐城18570.24811611257珠海20441州16470.5312161979广州50720.82830462658深圳38741.11441462568江门32591.06522562757-7 -1、利用回归方程补全数据附件1中2013年4月29日和6月7日的pm10数据缺失。以pm2. 5为自变量,其他五种污染物为因变量,建立了多元线性回归方
20、程,并用附件1中未 缺少的数据对模型进行求解,得到回归方程(a = 0.85),利用此模型对缺失数 据进行预测,结果如表4-2:表4-2 pm10数据预测日期pm102013年4月29日642013年6月7日422、利用伽马分布补全数据利用卡方拟合优度检验对附件1中pm2. 5数据进行检测,发现数据服从伽 马分布:表4-3卡方拟合检验结果附件1中pm2.5卡方拟合优度检验假设检验零假设服从伽马分布自由度4卡方统计量1.8p值0.6显著性水平0.1结果接受零假设利用伽马分布对附件1中2013年8月27日至2013年12月31日的pm2. 5数据进行预测,预测结果如表4-4 (仅列出部分数据,详细
21、数据见附录二):表4-4附件1全年pm2. 5数据时期pm2. 5含量2013年4月27日1442013年4月28日1042013年4月29日492013年4月30日542013年5月1日1972013年5月2日1892013年5月3日612013年5月4日1562013年5月5日1092013年5月6日722013年5月7日502013年5月8日1142013年5月9日192013年5月10日25同样利用卡方拟合优度检验对附件2中13个站点的pm2. 5数据进行检测, 发现数据也服从伽马分布:表4-5卡方拟合优度检验附件2中pm2.5卡方拟合优度检验假设检验零假设服从伽马分布自由度4卡方统计
22、量1.6p值0.3显著性水平0.1结果接受零假设利用伽马分布对附件2中全年的pm2. 5数据进行预测,预测结果如表4-6 (仅高压开关厂的部分数据,详细数据见附录三):表4-6高压开关厂pm2. 5全年数据时期pm2. 5含量2013年4月27日80.62013年4月28日143.72013年4月29日1812013年4月30日75. 82013年5月1日69.42013年5月2日1642013年5月3日79. 82013年5月4日137.42013年5月5日1792013年5月6日131. 82013年5月7日3312013年5月8日552013年5月9日2862013年5月10日1644.
23、3数据处理4.3.1附件1中pm2.5分指数数据转化为浓度数据利用参考文献2给出的污染项目的空气质量分指数计算公式,将附件1中 各种污染物的分指数数据转化为浓度数据,结果如表4-7 (仅列出部分数据, 详细数据见附录二):表4-7附件1的浓度数据时期pm分指数pm浓度2013年1月1日90672013年1月2日143109.42013年1月3日5841.42013年1月4日142108.62013年1月5日175132.52013年1月6日2151652013年1月7日2502002013年1月8日3092592013年1月9日2732232013年1月10日3292792013年1月11日2
24、992492013年1月12日2992492013年1月13日2461962013年1月14日2612112013年1月15日2602104.3.2附件2中pm2.5等级划分及频数统计根据新修订的环境空气质量标准将pm2. 5划分为5个等级,如表4-8:表4-8 pm2. 5等级划分等级一级二级三级四级五级pm2. 50-7576-115116-150151-250250根据pm2. 5的5个等级,对附件2中pm2. 5数据进行频数统计,统计结 果为:表4-9附件2中pm2. 5等级频数统计级监测站一级二级三级四级五级高压开关厂155451114108兴庆小区2463638484纺织城2166
25、787593小寨4272696981市人民体育场3045459090高新西区27514893114经开区2757578181长安区3672667584阎良区30633910893临撞区3951577872曲江文化集团4266726387广运市平均275769931024.3.3附件2中13个站点的空间分布及距离确定1、13个站点的空间分布图利用google地图可以画出西安市13个站点的空间分布图,如图4-1 (a-m 分别高压开关厂、高新西区、小寨、市体育馆、曲江文化集团、兴庆小区、纺 织城、广运潭、草滩、经开区、临潼区、阎良区、长安区)图4
26、-1 13个站点(地区)空间分布图由空间分布图及西安市实际地图,可以发现13个站点均匀分布在西安市9 个行政区中,因此可以利用这13个站点的数据分别对西安市13个地区进行分 析。详细分布情况见表4-10:表4-10 13个站点行政区的分布行政区监测站点地区面积(平方千米)莲湖区高压开关厂38雁塔区(西北)高新西区152雁塔区(东南)小寨152新城区(西北)市体育馆31新城区(西南)曲江文化集团31碑林区兴庆小区22灞桥区(南区)纺织城322灞桥区(北区)广运潭322未央区(东北)草滩261未央区(西南)经开区261临撞区临撞区898阎良区阎良区240长安区长安区15832、13个站点的距离确定
27、。利用google地图距离计算公式,结合13个站点的空间分布图,可以算出 13个站点(地区)的两两距离,结果如表4-11 (以高压开关厂为例):表4-11各站点距高压开关厂的距离地区监测站点距离(千米)莲湖区高压开关厂0雁塔区(西北)高新西区3.28雁塔区(东南)小寨6.29新城区(西北)市体育馆4.13新城区(西南)曲江文化集团5.2碑林区兴庆小区5.14灞桥区(南区)纺织城14.47灞桥区(北区)广运潭14.82未央区(东北)草滩2.8未央区(西南)经开区4.64临撞区临撞区30.71阎良区阎良区52.7长安区长安区11.824.3.4浓度增加为2倍后污染程度等级划分根据新修订的环境空气质
28、量标准将pm2. 5污染等级划分为三个等级, 如表4-12:表4-12 pm2. 5污染等级划分污染程度轻度污染(安全)中度污染重度污染pm2. 5 浓度(邱/3 )0-350350-500500-10005问题一的解答6.1.1 aqi中6个监测指标的相关与独立性分析 5.1.1相关性分析模型的建立(5-1)(5-2)cov( x, y)扣(x)挪)进而可建立6个监测指标的相关性分析模型:一 _cov(xilxi)_ pl d (x.d(x.)其中:i或/ = 1,2,.,6;代表二氧化硫(so2)的监测指标;x2代表二氧化氮(n2)的监测指标;x3代表可吸入颗粒物(pm10)的监测指标;代
29、表一氧化碳(co)的监测指标; ;代表臭氧(3)的监测指标; 代表pm2.5的监测指标。5.1.2相关性分析模型的求解用matlab对模型进行求解,得出结果如表5-1:表5-1相目关性模型求解结果指标s2no2pm10coo3pm2.5s210.8070.6800.659-0.1790.726n20.80710.7290.626-0.0630.734pm100.6800.72910.588-0.0660.780co0.6590.6260.58810.5870.8223-0.179-0.063-0.067-0.3811-0.352pm2.50.7260.7340.7800.822-0.3521由
30、表5-1得出各污染指标相关性的柱状示意图5-1:-11 -(e)(f)图5-1 (a)-(f)各污染指标相关性的柱状示意图5.1.3结果分析由相关性分析模型的结果可以得到如下结论:6.2 相关性高的指标组联系最为紧密的监测指标组依次是:(pm2.5,co), (s2,n2),(pm2.5, pm10) , (pm2.5,no2) , (pm2.5,so2),相关系数均在 0.7 以上。6.3 pm2.5与其它指标相关性最高pm2.5监测指标与co, pm10, n2,so2监测指标的相关均较高,相关 系数均在0.7以上,表明pm2.5与这些指标的监测但与3的相关系数只有 -0.352。(3)
31、o3与其它指标相关性低由结果表格及示意图可以看出,o3与其它5项监测指标的相关性较差且均 为负相关,相关系数均在-0.4以下。6.1.2 pm2.5含量与其它5项污染物含量的相关性分析5.2.1灰色关联度模型的建立作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较 分析,所谓发展态势比较,也就是系统各时期有关统计数据的几何关系的比较。 定义一设有序列x = (x(1),x(2),.,x()则称映射(5-3)(5-4)/(x)=少(左),左= 1,2,为序列x到序列的数据变换。(4) 当f (x(k) = .y(k), x(1) 0x(1)称/是初始化变换。(5) 当(6)(7)
32、f (x(k) = y(k),x = - z x(k)(5-5)称f是均值化变换。 3)当f (x(k)x(k)max x(k)k=y(k)(5-6)称f是百分比变换。 4)当(5-7)f (x(k) = x(i. = y(k), min x(k) 0min x(k)kk称f是倍数变换。5)当xn k=1姻(5-8)f (x(k)x(k) - min x(k)k-=y (k)max x(k)k(5-9)其中x0为大于零的某个值,称f是归一化变换。 6)当称f是极差最大值化变换。2、关联分析定义2 选取参考数列x0 = x0 (k) |k = 1,2,,n = (x0 (1), x0 (2),,
33、x0 (n)其中k表示时刻。假设有m个比较数列x. = x. (k) |k = 1,2,,n = (x. (1),x. (2),x. (n),/ = 1,2,,tox(k)min min |x0 (t) -(t)| + p max max |x0 (t) - x“t)|x0 (k) - xt (k) + p max max |x0 (t) -(t)|(5-10)则称为比较数列x.对参考数列x0在k时刻的关联系数,其中p e0,1为分辨系数。 称(5-10)式中爪爪卜|尤0(-夂(|、爪&爪$|尤0(-弋(|分别为两级最小差及两级最大差。一般来讲,分辨系数p越大,分辨率越大;p越小,分辨率越小。
34、(5-10)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度 的一种指标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于 比较,为此我们给出-15-定义3称:为数列&对参考数列的关联度。其中:g :s2对pm2.5的关联度; r2:n2对pm2.5的关联度; r3 :pm10对pm2.5的关联度; r4:co对pm2.5的关联度; r5 :3对pm2.5的关联度。5.2.2灰色关联度模型的求解在利用(5-10)式及(5-11)式计算关联度之前,本文需要对数据的进行初 始化处理。一般来讲,实际问题中的不同数列往往具有不同的量纲,而本文在 计算关联系数时,要求量纲要相同。因此,需
35、要首先对各种数据进行无量纲化。 另外,为了易于比较,要求所有数列有公共的交点。为了解决上述问题,本文 对给定数列进行变换定义4 给定数列x = (x(1),x(2),x(n),称;=卜,:,嘌(5-12)i x(1)x(1)为原始数据x的初始化数列。由于3指标与pm2.5指标成负相关性,即3含量越高,pm2.5含量越低, 故采取以下公式进行无量纲转化x.(1) x. x.(1) x.(1)! l、.(2)、.(3)、.(4)、.(5)利用matlab编程对模型进求解(=0.5 ),得到结果如图5-2:表5-2灰色关联度模型的求解结果(pm2.5,s2)(pm2.5,no2)(pm2.5,pm1
36、0)(pm2.5,co)(pm2.5,o31 小时)r1r2rr4r50.7850.8370.8580.8720.645图5-2:关联度柱状图-17-由关联度模型的结果可得出如下结论:pm2.5含量与其它五项污染物含量 的关联度均较高,因此可以然后以pm2. 5为因变量,其它五种污染物为自变量, 建立了线性回归模型。5.3pm2.5含量与其它5项污染物含量回归方程5.3.1多元线性回归模型的建立以m个自变量xm,因变量少,建立多元线性回归方程:y = p+pi+.+pmxm+s s n(0,ct2)(5-14)式中戽,a,,凡,都是与xl5x2,x5无关的未知参数,其中,a称为 回归系数。现得
37、到个独立观测数据(y.,xn,,x5),/ = 1,5,由(5-14)式得i y. = p + pl x.1 + + pmxrm + s s n(0,ct2),. = 1,,(5-15)记1 x11 x15x =_1 xn1 xn5 _,y =_ yn _(5-16)(5-14)可以表示为:s sj, p = p p p5ry = x p + s |s n(0,a2en)(5-17)其中五为阶单位矩阵。结合上述建模过程及本文自变量与因变量关系,得到多元线性回归方程:y = p + p1x1 + p2 x2 + . + p5 x5 + ss n(0,ct2)其中 y 代表样本 pm2.5 含量,
38、x.(/ = 1,2,.,5)分别代表 so2、no2、pm10、co、3的含量,p(/ = 0,1,2,.,50)代表回归系数,s表示随机误差。5.3.2多元线性回归模型的求解利用matlab工具箱函数regress,直接对多元线性回归方程进行求解, 得到的结果如表5-3:表5-3多元线性回归模型的求解结果参数参数估计值置信区间p0-5.299-18.130, 7.531a0.116-0.156 ,0.388a0.270-0.009 ,0.549a0.4840.396, 0.572a39.22930.546,47.911a-0.163-0.220,-0.106r2 = 0.853, f =
39、269.263, p = 0.0000表5-3得出,尺2 =0.8009指因变量(蛋白质含量)的85.3%可由模型确 定,f值远远超过了 f检验的临界值,p远远小于显著性水平0.05,因而问题 一的模型整体上看来是可用的。但是考虑到实际生活中,pm2.5的含量和监测 关系到人们的工作生活和生命健康,因此尺2 =0.85的准确性肯定还达不到要 求,模型需要优化。5.3.3交叉回归模型的建立由相关性模型可知:相关性较高的含量指标组为(s2,n2)、(n2,pm10)、 (s2,pm10)、(s2,co)、(n2,co)、(pm10,co)(相关系数均在 0.6 以上),因此我们有理由相信这六组变量
40、的交互作用会对pm2.5的含量产生影响。在多元线性回归方程的基础上,本文引入了 x,2,x2x3,等六项交叉项,建 立如下交叉回归模型:7 = 0+1+2+ + 5+怂2+ + 爲23+5(5 19)n (0,ct2)-其中代表样本pm2.5含量,x!(/ = 1,2,.,5)分别代表so2、no2、pm10、co、3的含量,爲(/ = 0,1,2,.,50)代表回归系数,e表示随机误差。5.3.4交叉回归模型的求解利用matlab工具箱函数regress,直接对交叉回归方程进行求解,得到 的结果如表5-4:5.3.6结果分析参数参数估计值置信区间p09.749-8.916, 28.414pi
41、0.656-0.047 ,1.359a0.7380.121 ,1.355p-0.009-0.177, 0.159p423.346-1.369,48.062r2 = 0.893, f = 170.708, p = 0.0000表5-4得出,尺2 =0.893指因变量(蛋白质含量)的89.3%可由模型确定, f值远远超过了 f检验的临界值,p远远小于显著性水平0.05,因而模型整体 上看来是可用的。交叉回归方程为:y = 9.749 + 0.656 +0.738x2 +. 0.152尤5 +0.198x2 +. + o.49ix3x5 (5-20) 5.3.5交叉回归模型的检验将原始数据代入到交叉
42、回归方程中,得到pm2.5的实验数据。将实验数据 与实际pm2.5的数据进行残差及剩余标准差检验。由matlab可求出交叉回归方程的残差图及剩余标准差:由残差图及剩余标准差可以看出,交叉回归模型与数据拟合程度较好,准 确度较高,这说明模型是完全可用的。在多元回归模型的基础上,增加了相关性较高的6项交互项,使回归模型 的准确率得到了明显的提高(由a值由0.85增加到0.89),使得模型更加优化, pm2.5预测更加准确。5.4pm2.5相关因素的探讨一空气湿度5.4.1空气湿度的说明空气湿度是表示空气中水汽含量和湿润程度的气象要素,即代表空气中的 含水量。研究表明:二氧化硫(s2 ),二氧化氮(
43、n2 ),一氧化碳(co)是 在一定环境条件下形成pm2.5前的主要气态物体,可以认为这些污染物在空气 中通过物理和化学反应转化为了 pm2.5,而水一般都是化学反应不可缺少的物 质,因此有理由相信空气湿度与pm2.5有关。5.4.2空气湿度与pm2.5的关系探讨为了说明空气湿度对pm2.5是否有关,本文首先根据在互联网上收集到的 湿度及pm2.5数据建立关于不含空气湿度变量的线性回归模型一,然后建立含 有空气湿度变量的线性回归模型二,通过两种线性回归方程一、二的结果比较, 分析说明pm2.5与空气湿度的关系。利用matlab求出模型一、二的结果如表5-5:表5-5模型一二结果对比参数模型一模
44、型二r20.8760.916f81.08868.815p005.4.3 结果分析由上述结果可知,增加空气湿度指标后,线性回归方程的相关系数得到了 明显提升(由0.876增加到0.916),这表明空气湿度对pm2.5存在着较强的影 响,引入pm2.5指标后,有利于用提高pm2.5预测的准确度。6问题二的解答6.1西安pm2.5的时空分布及规律探讨6.3.1 pm2.5时空分布图及规律探讨1、pm2.5时空分布图结合附件2西安市13个监测站点的pm2.5指标及其空间分布,利用 matlab画出13个地区的pm2.5时空分布图,如图6-1 (由于篇幅所限,给 出部分地区时空分布图,详细结果见附录四)
45、:另外,莲湖区(高压开关厂)全年的pm2.5时空分布图如下图所示:图6-2莲湖区(高压开关厂)全年的pm2.5时空分布图 2、pm2.5的分布规律由pm2.5的时空分布图及附件数据可以得到如下规律:6.4.1 3月份pm2.5浓度最低,9月份pm2.5浓度最高。对西安市13个区的全年数据进行统计,发现3月份pm2.5平均浓度最低 (108),9月份pm2.5浓度最高(155)。6.4.2 市区pm2.5浓度明显大于郊区浓度。13个站点(地区)中长安区、阎良区、临潼区为郊区,其余十个区为市区。 统计附件数据可得出:市区pm2.5浓度平均值约为157,郊区pm2.5浓度平均 值约为113,市区pm
46、2.5污染程度明显大于郊区。6.4.3 市区西部pm2.5浓度明显大于东部浓度。市区西部pm2.5浓度平均值约为162,市区东部pm2.5浓度平均值约为-21-7.1 pm2.5地区污染评估6.2.1模糊综合评价模型的建立考虑到各个地区的pm2.5 “污染程度”属于较为“模糊”的概念,而且评 价因素较多,因此本文决定使用模糊评价模型对地区污染进行综合评价。1、模糊综合评价模型的建立模糊综合评价方法,是应用模糊关系合成的原理,从多个因素(指标)对 被评价事物隶属等级状况进行综合性评判的一种方法。其具体的步骤为: 确定评判对象的因素论域为 = (%,2,,w); 确定评语等级论域f,f = (v1
47、5v2,vn)。通常评语有f=(很高,高,较高,.,较低,低,很低); 进行单因素评判,建立模糊关系矩阵ar12 r1 mr =r2122* r2m,0 r. 1v rmrn 2rnm j其中4为v中因素对于f中等级的隶属关系;(1) 确定评判因素权向量d = (%,%,) , d是v中各因素对被评事物 的隶属关系,它取决于人们进行模糊综合评判是的着眼点,即根据评判时各因 素的重要性分配权重;(2) 选择评价的合成算子,将d与a合成得到5 =供人,人)。综上所述,模糊综合评价模型为:rnr12r1mb = dor = (a”a2,an)o21r22 r2mv rn1rn2rnm =(4.) +
48、 -+(.),7 = 1,2,-, j sh j(6-1)其中:5为pm2. 5污染程度综合评价指数,为模糊算子。6.2.2模糊综合评价模型的求解 1、pm2.5浓度分级及频数统计首先根据新修订的环境空气质量标准将pm2.5浓度划分为5个等级, 然后对附件2中13个监测站点pm2.5浓度的进行统计,得到各个站点的pm2.5 对应的等级频数,如表6-1 (详细过程见数据分析)-27 -级监测站一级二级三级四级五级高压开关厂155451114108兴庆小区2463638484纺织城2166787593小寨4272696981市人民体育场3045459090高新西区27514893114经开区275
49、7578181长安区3672667584阎良区30633910893临撞区3951577872曲江文化集团4266726387广运滩186036123992、模型求解将附件2统计的分级频数数据代入模型中,得到各个监测站点的pm2. 5污 染指数,结果如表6-2:表6-2模糊综合评价模型的结果监测站开关厂广运潭纺织城小寨市体育场高新西区经开区污染指数94.3992.4189.1984.5091.0092.9788.71监测站长安区阎良区临撞区草滩兴庆小区曲江集团全市平均污染指数83.9575.2781.2693.3988.8785.2787.78由结果可得到如下结论:1 市区pm2.5污染程度明显大于郊区污染程度。由模型结果可得,市区pm2.5平均污染指数89.67,郊区(长安区,临潼区,阎良区)平均污染指数为80.16,显然市区污染程度明显大于郊区污染程度。 市区西部pm2. 5污染程度明显大于东部污染程度。由模型结果可得,市区西部(高压开关厂,高新区)pm2. 5平均污染指数 为93. 68,市区东部pm2. 5为89. 16,显然市区西部pm2. 5污染程度明显大于 东部污染程度。7.2 pm2.5的扩散与衰减规律模型探讨pm2.5高斯烟羽模型的建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度民办学校教师职称评定与晋升合同3篇
- 2025版高端住宅门窗定制与施工一体化合同3篇
- 二零二五年度新能源出租车司机聘用合同样本
- 二零二五年度出租车公司司机外包管理合同法律意见
- 2025知识产权劳动合同补充协议范本:企业知识产权布局与战略规划3篇
- 二零二五年度土地承包经营权转让合同
- 2025年度智能化农业大棚建设与土地租赁合同
- 2025年度木托盘生产原料供应链金融合同4篇
- 二零二五年度牛羊肉产业链投资合作合同4篇
- 2025年度农业种植与农产品溯源技术服务合同4篇
- 2024年安全教育培训试题附完整答案(夺冠系列)
- 神农架研学课程设计
- 文化资本与民族认同建构-洞察分析
- 2025新译林版英语七年级下单词默写表
- 【超星学习通】马克思主义基本原理(南开大学)尔雅章节测试网课答案
- 《锡膏培训教材》课件
- 断绝父子关系协议书
- 福建省公路水运工程试验检测费用参考指标
- 2024年中国工业涂料行业发展现状、市场前景、投资方向分析报告(智研咨询发布)
- 自然科学基础(小学教育专业)全套教学课件
- 《工程勘察资质分级标准和工程设计资质分级标准》
评论
0/150
提交评论