高速公路路面质量的评价问题国防科技大学饶彬孙蕾唐荣富_第1页
高速公路路面质量的评价问题国防科技大学饶彬孙蕾唐荣富_第2页
高速公路路面质量的评价问题国防科技大学饶彬孙蕾唐荣富_第3页
高速公路路面质量的评价问题国防科技大学饶彬孙蕾唐荣富_第4页
高速公路路面质量的评价问题国防科技大学饶彬孙蕾唐荣富_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、题号 C 全国第四届研究生数学建模竞赛 题 目 高速公路路面质量的评价问题 摘 要高速公路路面质量的评价问题本质上属于多元统计分析的内容,需要理清指标间、因素间以及指标与因素间的各项关系。本文首先对数据进行了预处理,包括异常值和缺失数据的修正以及数据的标准化处理。然后采用相关分析法、方差分析法、总体最小二乘技术、晶体分布法和主成分分析法对问题(15)进行了回答。 对于问题1,采用相关分析法分析了四个质量指标间的线性关系和非线性关系,得出了部分指标间具有弱线性相关性的结论。分析指出了指标间虽然有弱相关性但并不能给出一个确定的函数关系式,而且还带有一定的随机性。 对于问题2,首先分析了10个因素指

2、标的信息存在较大的冗余性,采用相关分析,并结合总体最小二乘法拟合出了部分因素指标间的数学表达式。进一步分析得出只需测量其中的5个关键指标即可(参看P8页图6)。其次,按照一定的规则对这几个关键因素指标的试验水平划分等级。最后,采用多因子方差分析法检验各因素指标对质量指标的影响能力。结论见P13页图13。对于问题3,首先阐明了压实度理论上界的物理背景与数学含义。其次结合数据和工程背景,将集料看成是由粗料和细料两个总体构成。进一步将粗细集料实体简化为标准球体,则压实度理论上界问题就可以归结为球体的装箱问题。文章给出了一种晶体分布法解决装箱问题,然后从理论上推导得出了压实度理论上界与集料级配比(即筛

3、孔通过率)的关系,并结合数据给出了定量分析。对于问题4,和问题二的处理方法类似,将沥青类型、碎石质量、生产厂家等因素分成简单的几个等级,前一个问采用单因子方差分析法进行处理,后一问涉及到两种影响因子,采用双因子方差分析法进行检验。结论参见P24P27。参赛密码 (由组委会填写)对于问题5,根据试验结果对建设部门提出了一些有用的建议。(1)因素指标的测量可以简化,只需要测试6个指标即可,分析了其理论依据;(2)提出了采用主成分分析法对高速公路的综合质量进行评估的方法。(3)分析了贝叶斯网络在处理高速公路路面质量评价问题的优缺点。参赛队号 9000218 参赛学校 国防科技大学 参赛队员姓名 饶彬

4、 孙蕾 唐荣富 1 问题重述(略,参看原题)2 问题分析高速公路路面质量的设计问题具有非常重要的现实意义,一方面可以降低高速公路的运行成本,另外一方面可以保障运输任务的安全。设计任务的一个非常重要的问题是找出对高速公路路面质量有较大影响的因素以及评价高速公路路面质量的指标体系,另外还要分析因素与因素间、因素与指标间、以及指标与指标间的关系,才能根据分析结果找出较优的方案,改良设计任务,提高路面质量。但是由于我国建设高速公路的历史不长,对高速公路路面各因素的影响还不太了解,无法给出其解析的表达式,只能从试验数据或计算数据出发,从中挖掘规律,建立各种指标和影响因素的经验模型。从本质上讲,高速公路路

5、面质量的评价问题属于多元统计分析的内容。本题中涉及10个因素指标,4个质量评价指标和290组实验样本数据。由于数据来源于真实的测试数据,将不可避免的引入粗大误差(异常值)和随机误差,另外数据的量纲也不一致,因此首先应对数据进行预处理。又因为缺乏指标间和各种因素间的先验计算公式,在分析它们之间的关系时首先应该进行相关性检验,如果相关性显著,再采用总体最小二乘方法拟合参数。采用总体最小二乘算法的根据是设计矩阵和观测矩阵都带有随机误差,常规最小二乘算法估计精度不够。最后,题目中五个问题各有特点,决定了解决的方法也不同。对于问题一,将4个评价指标当成是4个随机变量,采用相关分析法分析它们之间的线性相关

6、关系,得出了部分指标间具有弱线性相关性的结论。并分析了描述指标与指标关系的困难性,也是说四个指标间并没有明确的函数关系,而是还带有一定的随机性。对于问题二,本质上属于方差分析的内容。首先,因为10个因素指标之间具有较强的相关特性,信息的冗余性很大,本文采用相关分析,并结合总体最小二乘法拟合出了部分因素指标间的数学表达式。因此从理论上可以不需要测试10个因素指标,只需测量其中的5个关键指标即可。其次,按照一定的规则对这几个关键因素指标的试验水平划分等级。最后,考虑到质量指标同时受到多个因素指标的影响,因此不宜采用单因子方差分析法进行分析,而采用多因子方差分析法检验各因素指标对质量指标的影响能力。

7、对于问题三,首先阐明了压实度理论上界的物理过程与数学含义。其次结合实测数据和工程背景,将集料看成是由粗料和细料两个总体构成。如果将粗细集料实体简化为标准球体,则压实度理论上界问题就可以归结为球体的装箱问题。文章给出了一种晶体分步法解决装箱问题,然后从理论上推导得出了压实度理论上界与集料级配比(即筛孔通过率)的关系,并结合数据给出了定量分析。对于问题四,和问题二的处理方法类似,需要将沥青类型、碎石质量、生产厂家等因素分成简单的几个等级,前面一个问可以采用单因子方差分析法,后一问涉及到两种影响因子,可以采用双因子方差分析法对影响的显著性进行检验。对于问题五,根据试验结果对建设部门提出了一些有用的建

8、议。(1)因素指标的测量可以简化,只需要测试6个指标即可,分析了其理论依据;(2)提出了采用主成分分析法对高速公路的综合质量进行评估的方法。2.1指标分析首先我们来分析一下10个因素指标的具体涵义。(1)油石比:定义为混合料中沥青与集料(即矿粉、碎石)的质量比,即: ,其中为混合物中沥青的质量,为混合物中集料(矿粉和碎石)的质量,表示粗碎石质量,表示细碎石质量,表示矿粉质量。(2)筛孔通过率:显然筛孔通过率应为筛孔直径的函数,即,。且,。反映了集料粗细程度的分布,设为集料质量的分布函数,则应有,的计算可以采用差分的方法获得。(3)空隙率(VV):定义为混合料经碾压后达到设计压实状态时,其中空隙

9、体积占总体积的百分比。即:,其中表示空隙所占体积,表示沥青所占体积,表示集料所占体积,上标“撇”在这里无特殊说明均表示压实后的状态。(4)矿料间隙率(VMA):定义为压实状态时,混合料中“有效沥青体积空隙体积”占总体积的百分比,即:。(5)饱和度(VFA):等于(VMA-VV)/VMA,单位是,反映有效沥青体积占VMA体积的百分率。即。(6)粉胶比(DP):定义为混合料中矿粉质量与沥青质量的比。即。(7)毛体积密度:定义为达到设计压实状态的试件的密度。即。(8)最大理论密度:定义为混合料理论上的最大密度,即如果不含任何空隙时混合料的密度。VV100毛体积密度/最大理论密度100。因此有。(9)

10、%Gmm(最初):即混合料在最初压实状态的压实度。最初压实状态的压实度为经过少数几次碾压后的压实度。压实度试件密度/最大理论密度100。(10)%Gmm(最大):混合料试件成型时达最大压实状态时的压实度。一般应达到或略超过设计压实度。显然上述指标之间在理论上具有较强的关系,例如,即是说各个指标间是有一定的相关关系的(不一定是线性相关性)。对于实测数据而言,因为测量误差的影响以及一些其他因素,往往导致这些理论等式并不一定严格成立。2.2数据分析 由于数据来源于真实的测试数据,将不可避免的引入粗大误差(异常值)和随机误差,因此首先应对数据进行预处理。(1)异常数据的处理 由于本文采取的方法是多元统

11、计处理的方法,近代稳健统计学的研究表明4,在应用各种回归模型时,观测数据中不能有一个粗大误差,否则结果是不可靠的。本题中的数据明显含有过失误差,例如192次试验测得的VMA值为“15.33”,明显是人为疏忽造成的,又例如序号为226的弯拉应变系数,给出的结果为31450,明显高于其他测试数据(其他数据变化范围都在2247.0,2917.1之间),因此可以预先剔除掉。但是剔除的方法不能太过主观,应该遵循一定的规则。 对于静态的过失误差数据,国家标准里面有一些剔除的算法,如罗曼诺夫斯基准则和格拉布斯准则等。但这些方法的前提是数据本身必须符合正态分布。本题涉及290组测试结果、10个影响因素、4个评

12、价指标。从数据上看,变化范围都不太大,可以近似看成是290次独立等精度的测量,但从分布上看和正态分布相接近,为了充分提高数据的利用率,本文提出了一种异常值剔除的迭代法,对少量的异常值进行剔除。算法步骤如下:异常值迭代剔除法1. 给定初值,计算均值,方差。2. 第次迭代,计算,具体做法是对,如果,则;3. 如果,则迭代结束,即为所求的野值点集合;如果,计算均值,方差,令,返回第2步。其中为预先设定的阈值参数,一般取24,本文取4,以便提高阀值,充分利用数据利用率。通过解算,本文共剔除了4个异常值数据,虽然和真实数据相比变化不大,但提高了数据的可信度。(2)缺失数据的处理测试结果中含有许多空格和斜

13、杠线,表示测试结果未知或未做。如果简单地将这些含有缺失数据的纪录剔除掉,将会减少样本含量,且其它未缺失的信息利用不上。如果简单地采用均值填充的方法又显得精度不够。本文采取的办法是区别对待,例如对于岩石和沥青类型中的缺失数据,统一划为其他类型;对于筛孔百分率的缺失数据,因为通过率具有严格的数学和物理基础,即筛孔越大,通过率越高,可以采用已知数据进行多项式拟合的方法预测缺失数据的值,另外很多数据的缺失值是因为前面的试验已经达到100%了,对于更大的筛孔,通过率肯定也为100%,只需将其补成100%就行了;对于10个影响因素的缺失值,由于部分因素之间满足严格的数学关系式(例如),可以利用它们之间的关

14、系式进行反推;对于4个评价指标之间的缺失值,由于目前为止并不知道它们之间的影响因素,可以利用已有数据分析它们之间的相关关系,相关性如果显著则建立回归模型来补齐。图1 筛孔通过率原始数据 图2 修正后的筛孔通过率如图1是筛孔通过率的原始测试数据,中间有许多断点。考虑到筛孔通过率的物理规则是筛孔越大,通过率越高,这是一个物理连续过程,因此可以用平滑的连续曲线来拟合(也可以用插值进行处理),进而填补缺失数据。本文采用三次多项式函数来进行拟合,修正后的筛孔通过率数据见图2。可见,修正结果良好。这样混合物的筛孔通过率就可以反映在拟合的多项式系数上了,如果只是粗略的分析,用一个线性函数的斜率就可以近似反映

15、出混合物粗细的分布情况。另外对于没有进行筛孔通过率测试的试验,由于差别都不大,可以采用平均值进行补齐。(3)量纲的处理考虑到本文的指标数据变化范围非常大,直接处理计算量大,且不好分析指标和因素间的相关关系。为了方便起见,本文将所有数据进行标准化处理,即其中表示试验样本号,表示指标编号,表示指标均值,表示指标标准差。为了方便起见,以后无特殊说明均省略“*”符号,用表示标准化后的数据。标准化后的数据并不影响指标间的相关关系,但处理起来更加方便和直观。3 问题一求解(相关分析法)问题一要求描述高速公路路面质量的抗水损害性能、高温性能、低温性能的四个指标之间有没有数量关系?如果有数量关系,请建立它们之

16、间的数学模型。为了方便起见,设抗水损害性能中的冻融批劈裂强度比(TSR%)为,浸水 马歇尔稳定度 比(S0)为,车辙测试为,弯拉应变为。由于事先无法得到4个指标间的先验公式(线性的或非线性),首先考虑的方法应是线性回归方法,非线性回归目前尚无有效的处理办法。先考虑一元线性回归的情况,可以用4个指标两两间的线性相关系数来衡量,即R统计量进行计算, 表示正线性相关,表示负线性相关,在0附近表示两随机变量基本上不相关。试验结果见表1,由表1可见,四个指标之间具有弱的正线性相关性。正相关性表明4个指标变化趋势一样,都是越大越好。其中TSR指标和S0指标的正相关性为0.3035,弯拉应变和车辙的正相关性

17、为0.3091,相关性稍微明显些;TSR和车辙的正相关性为0.1493,车辙和弯拉应变的相关性为0.1004,相关性稍微弱一些。图3是四个指标实际的变化图,由图可以看出四个指标间的相关性并不是很明显。我们以指标(车辙)和指标(弯拉应变)进行线性回归(因为它们的线性相关性稍微好一些),结果见图4,由图也可以看出弯拉应变指标虽然总体上随着车辙指标的增大而增大,但它们之间的线性相关性并不是很明显,说明还有一些随机因素在起作用。 图3 四个评价指标变化图 图4 弯拉应变和车辙之间的线性拟合图表1 四个评价指标间的线性相关系数TSRS0车辙弯拉应变TSR1.00000.30350.14930.1004S

18、01.00000.29970.2017车辙1.00000.3091弯拉应变1.0000由于一元线性相关性非常微弱,可以再考虑多元线性回归方法,即某个指标可能与其他某几个指标之间成线性相关关系,即可能有如下的公式: (1)其中的,为了估计参数和作显著性检验,需要采用最小二乘估计方法。这里我们不采用常规的最小二乘方法,而是采用总体最小二乘估计法。因为传统最小二乘法是建立在设计矩阵精确已知,有误差的情况下的。而我们所获得的试验数据和都是有误差的,所以用最小二乘方法将会导致大的误差。而采用总体最小二乘方法同时考虑到了和的扰动,将会得到比一般最小二乘更好的拟合效果(总体最小二乘算法见问题二的求解,这里不

19、过多阐述)。经过多元线性回归,我们发现当时,R统计量的值为0.0965,时,R2统计量的值为0.1683, 时,R统计量的值为0.1568, 时,R2统计量的值为0.1092。可见,四个指标间的多元线性关系也不是很明显。因此,四个指标间有可能具有一定的非线性关系。为了考察指标间的非线性关系,假设指标和之间具有非线性函数关系,其中的函数关系未知,假设为连续可微函数,则由Weierstrass定理知,总可以表示成关于的多项式,只要阶数足够,其逼近精度能达到足够高。本文采用多项式形式的总体最小二乘方法进行解算,发现四个指标之间的多项式关系并不明显,反映在算法上就是拟合的残差都非常大。残差随着拟合阶数

20、的增加逐渐下降,但下降的并不明显,因此可以认为指标和之间并无实质的联系,可以认为它们基本上是两个独立的指标,其他两个指标间也具有类似的计算结果。当然还可以采用其他分析方法,例如考虑4个指标间用函数基表示的方法,或者采用神经网络、贝叶斯网络的方法来进行分析。但是就第一问而言,一般采用线性相关分析法就够了。如果指标间有明显的关系,反映在图上应该近似是一条直线或曲线。打点结果如果是星云状的,则说明两者关系不明显。结果应该遵循实事求是的态度,在没有先验知识的情况下非要拟合出一个复杂的数学公式是不科学的。就像测量人的身高和体重一样,虽然身高和体重有一定的关系,但并不能说得到了一个人的身高就知道了他的体重

21、,还有一些随机的因素必须要考虑。结论:四个指标间有一定的弱相关性,其中TSR指标和S0指标的相关性为0.3035,弯拉应变和车辙的相关性为0.3091,其它指标间的相关性不明显。因此四个指标间并无明显的数学关系,在对路面质量进行评价时,4个指标都应进行测量。4 问题二求解(方差分析方法)问题二要求建立描述高速公路路面的抗水损害性能、高温性能、低温性能的四个质量指标和认为影响高速公路路面质量的最重要的和比较重要的因素之间比较精确的数学模型,选择这些因素的理由是什么?根据模型认为采用什么样的方案可以提高高速公路路面的质量。对于问题二,本质上属于方差分析内容。在分析某个因素指标对某个评价指标的影响是

22、否显著时,其他的几个指标都应该处于同一试验水平条件下。另外,10个因素指标之间具有很强的相关特性(例如,以及,知道了其中的两个就知道了另外一个),也即是说因素间有比较严重的冗余信息,完全可以提取出几个主要指标就可以反映和10个指标的所有内容。再利用提取的主要因素指标和4个质量指标分别进行方差分析,就能够分析各种因素对路面质量的影响是否显著。考虑到10个指标之间可能存在交互作用,采取的方法应该以多因子方差分析为主。4.1评定试验水平因为在分析某个因素指标对某个评价指标的影响是否显著时,其他的几个指标都应该处于同一试验水平条件下。而同一试验水平的标准比较含糊,必须定量化。因此首先应该对因素指标评定

23、试验等级,为了方便起见,本文对10个影响因素按一定的规则评定为“高”“低”两个等级。等级划分门限的原则是高低数据各占一半。当然,还有其他的划分方法,例如划分为3个等级或者更多的等级等。但就本题而言,样本数比较有限,为了增加因子分析的可信度,采用两个等级试验水平的划分是可行的。筛孔通过率试验水平的划分比较特殊,前面已分析过筛孔通过率不是一个简单的指标,而是一个分布函数。直接对分布函数进行处理非常困难,涉及的变量有13个,且混合物的分布函数是一个复杂函数,用常规的分布函数族难以拟合。我们对集料的分布密度进行分析,发现密度函数的线性分布特性非常明显(对绝大多数试验而言),如图5所示。因此我们可以用密

24、度函数的斜率来反映指标的试验水平。 图5 集料粗细程度的分布密度函数 图6 十个指标间的相关关系4.2冗余性分析采用相关分析法,得到10个因素指标之间的相关系数(见表2),由表可见部分因素之间相关性较强,而有些因素之间的相关性则较弱,本文以相关系数为界限,得到10个指标之间的关系图(见图6)。可见,指标 之间的相关性比较强,它们反映的基本上都是沥青和集料的比例;指标之间的相关性也较强,它们反映了混合物的密度特性;指标的相关性也较强,它们反映了混合物压实度的特性。由此可见,理论分析结果和试验数据结果吻合的很好,都反映出指标数据的冗余性。因此,对于高速公路建设部门而言,没有必要同时测量10个指标的

25、数据,只需找出其中几个有关键影响因素的指标即可。表2 十个影响因素之间的相关系数(阴影部分表示相关性强)X1X2X3X4X5X6X7X8X9X10.78442-0.116460.874030.79283-0.0954-0.26646-0.207760.255390.056848X21-0.110440.859720.77956-0.33114-0.26427-0.254560.115480.022476X31-0.0851-0.370110.14025-0.05535-0.06452-0.06722-0.02426X410.89802-0.19192-0.08427-0.037960.2648

26、70.028776X51-0.25358-0.022810.0082570.249850.086227X610.258020.184930.0833370.2057X710.827760.136560.041262X810.178280.048483X910.85614X101另外,从图五可以看出相互线性相关,实际上线性相关性具有传递性,下面证明之。定理1:若随机变量与近似线性正相关,与近似线性正相关,则与近似线性正相关。证明:设随机变量和的均方根分别为和,已知与近似线性相关,则有, 其中表示相关系数。不难推得和满足关系式:。又因为与近似线性正相关,则有。而方差为0的变量必然a.e.为常数,即

27、,因此有 ,同理有,代入即有,即是说与近似线性正相关,证毕。这样,原来的10个指标我们可以缩减为5个指标,即,其他5个指标基本上都可以由这5个指标线性表出。我们采用总体最小二乘法对10个因素之间关系进行线性拟合。在290组试验中,设和是两组线性相关指标的样本值,两两配对,组成数据点集合,我们的目标是找到一条直线使集合中各点到直线的距离平方和最小。这里采用的总体最小二乘方法和最小二乘方法有所不同。最小二乘方法是建立在是精确已知,有误差的情况下的。而我们所获得的试验数据,都是有误差的,所以用最小二乘方法将会导致大的误差。而采用总体最小二乘方法同时考虑到了,的扰动,将会得到比一般最小二乘更好的拟合效

28、果。考虑数据拟合问题:给定个数据点,希望对这些点拟合成一直线。假定直线方程为。若直线通过点,则。现在考虑让拟合直线通过已知个数据点的中心,若将代入,则可将直线方程写作或者用斜率形式等价写为参数向量称为拟合直线的法向量(normal vector),而称为拟合直线的斜率。于是,直线拟合问题变成了法向量或者斜率参数的求解。显然,将个已知数据点代入直线方程后,直线方程不可能严格满足,会存在拟合误差。总体最小二乘拟合就是使各个已知数据点到直线方程的距离平方和最小化。点到直线的距离由确定。于是,已知的个数据点到直线的距离平方和为可以写成单位向量与矩阵的乘积,即 (2)其中, 总体最小二乘方法归纳如下:

29、1. 计算均值点,;2. 按照(2)式构造矩阵。3. 计算矩阵的最小特征值及其对应的特征向量;则由法方程确定的直线可以使得距离平方和达到最小。 图7油石比和VMA的关系图 图8 VMA和VFA的关系图采用总体最小二乘方法进行拟合,部分结果见图7和图8,可见部份因素指标间的线性相关性比较明显。拟合出的各因素间的关系如下: (3) 需要说明的是由于受到噪声和随机因素的影响,上述关系式并不一定严格成立,而只是指标间的一种近似关系。4.3方差分析 前面通过相关分析的方法,将主要影响指标缩减为5个,即。可以认为如果质量指标和因素有关,则根据图6知也和、和有关。简化指标的好处有两点:一是质量监测部门不需要

30、同时测量10个指标,只需测量5个就可以达到相同的测试目的,而信息含量基本不变;另外一点好处是便于进行方差分析。本题中如果直接对10个因素和4个质量指标进行方差分析,必须考虑因素与因素之间交互的情况,这样会导致数据量的不足和造成各总体方差水平的不一致性,而缩减为5个指标后,处理相对容易些。考虑到4个质量指标同时受到多个因素指标的影响,因此采用单因子方差分析法进行分析是不适宜的,而采用多因子方差分析法检验各因素指标对质量指标的影响能力。进行多因子方差分析的目的是检验某个因素指标或某几个因素指标对某个评价指标是否具有显著影响。为了充分利用数据,使结果更具有可信性,前面我们已对各因素指标的试验水平分为

31、两个等级“高”和“低”。下面首先描述多因子方差分析的基本原理。为方便起见,以双因子方差分析为例4。设因子有个试验水平,因子有个试验水平,。将条件下所考察的指标看成是一个总体,共有个总体,假定其服从。为检验假设:一切彼此相等,需从每一总体中独立抽取样本,记其试验结果为,其中是试验次数。于是有数据构造式这里。令,则(1)与有交互作用的情况下,检验的假设为 (4)(2)与有交互作用的情况下,检验的假设仅为和。检验的统计量分别为; (5)其中,拒绝域分别为 (6)采用Matlab的统计工具箱,我们对每个质量指标做了多因素方差分析。因为已经提取了缩减成了5个关键指标,另外高速公路的建设主要是物理变化,因

32、此可以基本上不用考虑指标互相交互的情况。结果见图912以及表3。图中最右边一列表示各因子的值,倒数第二列表示检验的F值。理论上值越小,值越大,则影响越显著。一般认为表示拒绝原假设,即该因素指标对质量指标有显著影响。表3给出了影响因素与指标体系两两间因子分析的结果。 图9 五个关键因素对TSR的 图10五个关键因素对S0的方差分析结果 方差分析结果 图11 五个关键因素对车辙的 图12五个关键因素对弯拉应变的方差分析结果 方差分析结果表3 单因素方差的分析结果(表示影响显著,表示不显著)(1)油石比(3)VV(6)DP(7)毛体 积密度(9)GMM最初TSR0.91560.97250.60420

33、.69730.0432S00.37310.80950.51610.97690.2906车辙0.00230.73270.01680.09810.0433弯拉0.00010.3150.5040.27640.6499图13 因素与质量指标间的关系根据检验数据,还可以画出因素与质量指标之间的关系图,见图13。图中比较粗的连线表示显著性也相对强一些。根据前面指标间的相关分析和因子分析的结果,可以得出一些结论:1)影响抗水损害性能的关键指标为和;2)影响路面高温性能的主要指标有除了以外的其他9个指标,其中(油石比)的影响性最大;3)影响路面低温性能的指标有。4.4因素与指标间的数学模型前面通过多因子分析法

34、,已经找出了影响四个质量指标的关键因素,虽然通过检验已经知道它们之间有某种关系,但究竟是什么关系,关系明不明显还需要进行线性拟合。部分线性拟合结果见图14,15。由图可以看出,指标和因素间的关系还是不是很明显。图14 X1和Y4的拟合图 图15 X1和Y3的拟合图结论:10个影响因素指标存在较大的冗余性,部分因素指标之间存在较大的相关性(图6),因此可以缩减为5个关键因素指标。采用多因素方差分析可以对因素与指标间的关系作显著性检验。虽然部分因素指标对质量指标起显著作用(图13),但影响质量指标的因素太多,并不能完整建立起指标和主要因素间的数学表达式。5 问题三求解5.1问题剖析1. 路面压实度

35、的上界的理解显然对于任何一个大于等于100的数而言,都是路面压实度的一个上界,但是这样考虑问题,在实际中是没有什么意义的。从出题专家的角度看,这里所谓数学意义下,路面压实度的上界应该是希望我们探讨路面压实度的上确界,或者求解一个压实度的上界,使之尽可能的接近上确界。事实上,我们可以证明经过无限次碾压,路面压实度会达到其上确界。定理2经过无限次碾压,路面压实度数列是收敛的,收敛极限就是其上确界。证明:设路面碾压次数为,第次碾压后的路面压实度为,试件的体积随着的增大而递减,而路面压实度试件密度/最大理论密度100试件质量/试件体积/最大理论密度100,故路面压实度随的增大而单调递增,即。同时,路面

36、压实度不可能超过100,所以由单调有界定理,数列的极限一定存在。由极限的定义和确界原理,就等于极限。也就是说经过无限次的碾压,路面压实度最终会达到其上确界。在实际中,我们不可能对路面进行无限次碾压,而且工程中达到或略超过设计压实度后,就会停止碾压,理论上的上确界在实际中很难达到。所以只能从理论的角度去分析路面压实度的上界和筛孔通过率的关系。2. 筛孔通过率与路面压实度的上界的关系。筛孔通过率是指即集料中能够通过直径大小不同的各种筛孔的各部分的质量占集料总质量的比例,是反映集料粗细程度及大小搭配情况的指标。集料颗粒大小分布概率的差别决定了碾压到极限时试件的颗粒排列结构,从而引起空隙大小的不同以及

37、压实度上确界的差异。所以筛孔通过率和路面压实度的上界是有必然联系的。我们将建立数学模型描述它们的数量关系。3求解思路 我们假设集料颗粒为球体,而公路的形状看成一个装满球体的容器。由定理1,经过无限次碾压路面,可以使路面压实度达到上确界。因此,我们就将求解路面压实度的上界问题转化为了球体装箱问题,即寻找一种方法使得公路的试件密度达到上确界,并讨论不同直径球体的配置比例和这个上界之间的关系。这个问题比普通的装箱问题复杂很多。普通的装箱问题是给定了所装不同物体的特征,从而将注意力集中在求解如何是箱子的利用率最大上,这个问题本身就是NP问题,在有效时间内,人们只能求出近似解。而我们这个问题比普通的装箱

38、问题更复杂之处在于不同直径的球体概率密度函数是随着筛孔通过率变化的,同时公路的体积远远大于球体的体积,要装的“箱子”可以看成是无限大的,球体的个数也可以看成是无限多的,这给寻找合适的装箱方法带来了巨大的困难。若要在此基础上讨论筛孔通过率和路面压实度上界的关系将更加困难,所以必须将问题根据实际情况进行简化,从而找到筛孔通过率和路面压实度上界的内在关系。我们的模型首先给出一般的理论推导公式,然后根据附件中给的筛孔通过率,画出不同直径集料颗粒的概率分布图,跟据该图特点及工程背景将集料分为大直径的粗料和小直径的细料两类,然后采用化学上一种非常密集的晶体原子的排列方式对球体进行排列得到上确界的近似解。最

39、后分析了这两种集料的比例与路面压实度的上确界的数值关系,并根据附件中的数据通过计算验证了我们所给出的关系的合理性。5.2基本模型根据压实度定义,路面压实度=试件密度/最大理论密度100。而实际路面混合料密度与路面实际空隙率密切相关。因此,路面压实度的上界问题可以归结为路面实际空隙率的极小化问题。以下,我们称本文推导的集料密度、混合料密度为“计算密度”,以区别与“最大理论密度”、“表观密度”等。基本模型建立如下:1 拟合集料的概率密度分布函数。假设筛孔通过率分别为、,且假设反映集料粗细程度的概率密度函数为。为简单起见,不妨假设所有集料(碎石、矿粉)都是标准球体,从而可以视为关于集料半径的函数。故

40、半径为的集料实体个数为,其中为半径为的集料实体的体积,为表观相对密度,表示集料总质量。2 极小化空隙率。设计一种路面集料填充规则,希望当给定(即给定级配组成)后,集料按规则分布后使其空隙率达到极小,并计算其空隙率函数为。3计算路面压实度的上界。假设各类集料的密度主要与大小相关,故各类集料的密度为关于半径的函数,并设各类半径的集料占所有集料体积比例为。由于空气的密度与集料、沥青的密度约差三个数量级,因此我们将大气的密度的影响忽略不计。设沥青密度为,油石比为,最大理论密度为。如果沥青被空隙完全吸收,则混合料的计算密度为 (7)若沥青完全不被空隙吸收,则混合料的计算密度为 (8)通常情况下,沥青由于

41、其流动性差,只能部分地被空隙吸收而不可能完全被吸收,因此,可以加权修正计算密度如下: (9)为加权系数。因此,路面压实度的上界为 (10)其中。首先,我们对集料的分布概率进行离散简化。用表示直径为的集料分布率,其中,。通过差分,我们得到概率分布图如下。纵坐标表示集料直径的分布率,横坐标表示筛孔直径。需要特别注意的是,此处的离散分布率假设与4.1节的连续分布假设是不相同的,连续分布是把分布率看成是孔径区间上的均匀分布,因而两者得到的分布率图像是不一致的。图16 集料直径的分布概率从图16看出,集料的直径分布特点是概率分布曲线呈双峰状,直径大的集料和直径小的集料比较多,中等直径的集料比较少。这组数

42、据来源于工程,也的确是于工程背景相吻合的。采用多级嵌挤密集配设计方法铺路时,人们通常用碎石机按大小直径两种规格进行粉碎,所以打出来的石头直径就是以点的概率密度为峰尖,呈双峰状分布。然后将粗集料形成的嵌挤成骨架结构,以提高沥青混合料的稳定性,细集料逐级依次填充从而形成多级嵌挤的集(矿)料级配1。所以无论是从工程背景,还是数据分析来看,我们都可以把问题简化成只有两种直径的球体来做。5.3 空隙率及路面压实度理论上界推导由于我们假设集料实体为标准球体,而公路形状可以认为是长方体容器。因此,集料的分布规则问题可以转化为球体装箱问题。与一般装箱问题不同的是:由于公路的量级远大于集料实体直径,本问题中的长

43、方箱可以认为是无限的。我们的处理过程为:建立一种规则,先将所有直径为的大球(粗料)排入无限箱,然后将直径为的小球(细料)排入无限箱,并使得无限箱的空隙尽可能小。1 晶体分布法借用化学上原子在晶体中的排列形式,在此我们提出一种装箱方法(以下称为“晶体分布法”):考虑一个边长为的正方体,分别以它的八个顶点、六个面的中心为球心,以半径作球。因此在这个正方体内的球体体积恰好为四个完整球体的体积(八个顶点中,每个顶点有八分之一的球体;六个面中,每个面有二分之一的球体,见图17),因此密度计算如下: (11)图17晶体分布法排列球体我们认为这样求解球体排布问题的优点在于这种排列方法把球排列得非常紧密,每个

44、球跟上,中,下每层各4个球相切,一共12个,这也是一个球同时能相切的最多球的个数。已经证明,在某种程度上这种分布规则可以使得达到空隙率最小3。尽管这该装箱方法看起来似乎在正方体内似乎没有一个完整的球,但是考虑到在一个无限大的方体容器内,以这样的正方体来填充整个方体容器时,不完整球体的体积与完整体积的球体总体积比较而言是微乎其微的。因此,利用极限的思想,可以认为这种装箱方法的非空隙率为0.740,并记为。2 理论推导我们采用晶体分布法先对粗料进行排列。对于细料排列,可以认为细料的一部分填入粗料排列形成的空隙,另一部分仍按晶体分布法进行排列,并假设填入空隙的细料所占所有细料的比重为。当粗料所占集料

45、的比重大时,空隙没有被填满,即所有的细料都用来填充空隙了。当粗料所占集料的比重很小时,。若意味着只有粗料,没有细料。以下我们推导按晶体分布法排列所得的空隙率。设粗料所占集料的比重为。由附表四及附表五知,粗料与细料的密度通常并不一样(可能与材质有关),因此我们假设粗料与细料的密度分别为、,其体积分别为、,则 (12)当按晶体分布法填入粗料时,空隙体积为,所占体积为。填充细料后,一部分细料填充粗料的空隙,这部分细料不会增加新的体积。而另一部分细料(体积为)也按晶体分布法填充,新增的空隙体积为,所需总体积为。故此时容器总体积为因此,可得集料的计算密度为 (13)再考虑沥青的对密度的影响。假设混入沥青

46、后,沥青被空隙完全吸收,则此时混合料的计算密度为 (14)若沥青完全不被空隙吸收,则混合料的计算密度为 (15)因此对,进行加权,设为的权值,得到混合料的修正计算密度为 (16)由文献2,可以取0.4至0.6之间。从而,路面压实度的理论上界为 (17)3.4 定量分析在本节我们通过数学推导,定量分析粗料占集料比重与集料的计算密度之间的数量关系。由于正是表征了集料的级配比,反映了筛孔通过率,因此,此即是定量分析了筛孔通过率与集料的计算密度的数量关系。此外,我们还定量分析了压实度的理论上界与(即与筛孔通过率)的数量关系。并且按附录所给数据计算出了压实度可达到理论上界的试验结果。1 集料的计算密度仍

47、采用3.3的记号,有 (18) (19)(1)当时,此时表现为细料过少,而不足以按晶体分布法填充粗料的空隙。此时,为关于的递减函数,即增加细料可以减少空隙,提高计算密度。 (20) (21)(2)当时,即当细料不至于很少,足以按晶体分布法填充粗料的空隙。当时,粗料所占集料的比重可计算得 (22)此时,集料的计算密度与的关系为 (23)需要注意的是,当时,上式不成立(主要是因为在推导过程中使用了作为除数),容易计算得时。容易知,当细料直径粗料直径,细料可以按晶体分布法完全填入粗料形成的空隙,而且满足:细料体积与空隙体积的比例恰好满足时,即,集料的计算密度最大,此时满足 (24) (25)采用附件

48、四与附件五的高速公路表面层数据,由(18)-(25)式可得 (26) (27)即当粗料与细料比重为时,集料的计算密度达到最大。根据(1)(2)的讨论,仍采用附件四与附件五的数据,可以考察集料计算密度与粗料所占比重的数量关系如图18所示。图18 集料计算密度与粗料比重的关系曲线图2 压实度理论上界沥青的密度通常为,在本文中我们取中位值,小于集料的密度。要得到压实度上界,就要获得混合料的密度上界。而由于沥青密度小于集料密度,那么混合料的密度上界应在集料的最大计算密度的基础上混入沥青。若沥青被完全吸收,则沥青的体积应恰为获得集料的最大计算密度时空隙的体积,即 (28)此时油石比应为 (29)混合料的

49、密度上界 (30)则压实度理论上界 (31)如果沥青完全不被吸收,估计集料的密度为,比沥青密度大的多(从图也可看出)。因此,当沥青完全不被吸收时,应不混入沥青,此时混合料的密度达到上界,且与集料的最大理论密度相等,即。压实度理论上界为 (32)现在我们采用附件四与附件五的高速公路表面层数据,以附录资料的最大理论密度的均值2.575作为混合料的最大理论上界,选取修正权值,计算压实度理论上界如下。此处计算得到的压实度理论上界比附录资料的一般%Gmm(最大)都要小,这主要是由两个原因得到的:1 据查阅资料2知,我国目前采用测量%Gmm(最大)的方法存在误差,可能使得%Gmm(最大)偏大。2在实际中,

50、集料的形状及大小要复杂的多,从而使得集料的多级挤嵌作用要比模型中的填充作用强,从而使得实际空隙比模型推导的空隙要小,压实度增大。3我们建立的模型只简单区分了粗料与细料,并以两组实体分别代表集料。事实上,集料的直径大小分布是连续的而且远比双峰模型复杂的多。根据我们的模型建立过程可知,如果我们增加粗料与细料的区分度,如以三种或更多的直径大小不同的实体代替两组实体的做法,压实度理论上界比此试验结果要大。3 模型进一步讨论(1) 如果考虑三类不同半径的集料实体,而且这三类实体仍可以按晶体分步法填充,且认为集料密度为2.55,则同计算可得结果:此时,压实度理论上界大于或接近%Gmm(最大)。(2)根据我

51、们后来所查的资料,对于球体装无限箱的问题,目前已有的研究结果表明,通过非常复杂的方法,可以使得非空隙率可以达到0.773。以下,我们根据这个新的参数,仍使用与上相同的数据,给出相应结果如下。对于两类不同半径的集料实体,相应地有:对于三类不同半径的集料实体,相应地有:6问题四求解问题四要求沥青质量、碎石质量对高速公路路面抗水损害性能、高温性能、低温性能究竟有没有影响,你们的观点是什么?根据是什么?不同厂家、不同产地的但型号相同、类型相同的沥青、碎石质量对高速公路路面抗水损害性能、高温性能、低温性能究竟有没有影响,你们的观点是什么?根据又是什么?问题四的求解思路和问题二一样,采用方差分析的方法对路

52、面质量进行显著性检验。为了充分保证显著性检验的数据量,对沥青种类和碎石成份不能分得过细。6.1沥青对路面质量的影响本文的沥青我们暂时分为三类,普通沥青含“25”为第一类总体,改性沥青含“13”的为第二类总体,含“20”的为第三类总体,其他沥青由于样本量不足(小于50)不予分析。 图19 沥青成份对路面质量的影响图(a)为沥青对TSR指标的影响,(b)为沥青对S0的影响,(c)为沥青对车辙的影响,(d)为沥青对弯拉应变的影响。方差分析的试验结果见图19,图中所示的值越大,值越小()表明影响越显著。为显著与否的衡量标准。另外,箱图中心线的位置越平,表明总体差异小,实验结果越不显著。本文的实验结果表

53、明沥青成份的不同对车辙和弯拉应变的影响非常显著,对S0的影响比较显著,而对TSR的影响不明显。另外从箱图可以看出,改性沥青“13”和“20”的性能相当,但与普通沥青“25”的差别较大。再来考虑不同产地,但型号相同的沥青对四个质量指标的影响情况。前面已经分析了改性沥青不同种类间的差异非常小,因此沥青型号暂时可以只考虑两类,即改性沥青和普通沥青。产地的划分原则上也不能太细,化得太细则样本量不够,(例如韩国沥青出现的次数最多,也只有38次,其中还包含普通沥青和改性沥青两类)本文只抽取两个最多的样本进行分析,即产地分别为韩国和湘阴的情况。发现这两个产地间的不同对4个质量指标并无明显影响(图20给出了其

54、对TSR的影响图)。图20 沥青产地对TSR的影响6.2 岩石对路面质量的影响岩石的质量本文只抽取其中的两种,即石灰岩和玄武岩,因为它们的样本比较足量。方差分析的结果见图21,结果表明岩石的种类对TSR和S0 ,即抗水性能无显著影响,而对车辙和弯拉应变影响较为显著。图21 岩石成份对路面质量的影响图(a)为岩石对TSR指标的影响,(b)为岩石对S0的影响,(c)为岩石对车辙的影响,(d)为岩石对弯拉应变的影响。不同产地岩石的影响本文将其分为南方产地和北方产地两种,经过检验,和沥青产地的影响类似,都是对四项指标无明显影响。归其原因,产地虽然分成了南北两方或国内国外,但两种水平下都包含了多个厂家,

55、其平均性能的差别并不是很大。另外一个原因是,样本数据虽然有290组,但真正厂家相同的数据却不多,造成同一水平下的样本数过小,因此结果缺乏可信度。7 问题五求解问题五要求根据你们对数据分析的结果,现在测试高速公路路面质量的试验项目中是否有重要的遗漏?你们对高速公路建设部门有什么建议?根据试验结果我们对建设部门提出了一些有用的建议。(1)因素指标的测量可以简化,只需要测试6个指标即可,分析了其理论依据;(2)提出了采用主成分分析法对高速公路的综合质量进行评估的方法。(3)分析了贝叶斯网络在处理高速公路路面质量评价问题的优缺点。7.1 指标设计问题前面的相关分析已经得出了10个因素指标之间具有较强的

56、相关性。即这10个指标间的信息是有冗余的。指标间的关系见下 (33)以及和。因此理论上不必计算10个指标,取五个指标基本上就可以了。指标虽然减少了,但反映的信息量却基本不变。指标的具体物理含义为:指标它们反映的基本上都是沥青和集料的比例;指标反映了混合物的密度特性;指标反映了混合物压实度的特性;指标反映了空隙率。7.2 路面综合质量的评价问题本题中路面质量的评价需要四个指标,且这四个指标都是越大越好,在工程上,通常需要对路面的综合质量进行评价,即对各种高速公路进行综合打分。传统的方法是靠专家给出四个指标的权因子,然后加权评分。但这种方法带有较大的主观色彩。且根据问题1的分析知道,四个指标之间还

57、是有一定的弱相关性的,例如TSR和S0都是反映抗水害性能,直接加权有可能过分夸大某个指标的权重因子。针对这种情况本文提出了一种基于主成分分析法的高速公路路面综合质量的评估方法。 主成分分析(principal components analysis, PCA),也称主分量分析,是一种用较少的综合分析指标代替原来较多的指标,综合提取信息的有效方法。它利用了降维的思想,从指标代表性的角度来筛选指标,挑选因子负荷绝对值较大的指标为主要指标。其优点在于它确定的权数是基于由数据本身特性而得出的,不受主观因素的影响。因此对于相关性较强的数据,用主成分分析法进行分析极为有利。设为个观测指标,这里,为其标准化

58、观测矩阵(),为其相关系数矩阵,为个常数向量。考虑如下线性组合:为个新指标。的样本方差为,协方差。希望用较少的新指标代替原来的个指标,就要求它们含有尽可能多的原指标信息且互不相关。指标中信息量的大小通常用该指标的方差来计量,方差越大,信息含量就越大,反之则越小。设的特征根和对应的正交化单位特征向量分别为和,则可以证明当时,有,详细分析过程请参看文献5。此时令 则和分别称为第个主成分的贡献率和前个主成分的累积贡献率。累积贡献率表明了前个主成分占所有指标总信息量的份额,一般当时,就可以用个主成分来表示原有指标而不会损失多少信息。此时,路面的综合质量评价函数为: (34)对本文的数据进行主成分分析,得到贡献率见表4,由表可见,选取3个主成分因子,其信息含量就已经达到70%了。由此得到3个主分量。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论