2.3数据的无量纲化处理及示例_第1页
2.3数据的无量纲化处理及示例_第2页
2.3数据的无量纲化处理及示例_第3页
2.3数据的无量纲化处理及示例_第4页
2.3数据的无量纲化处理及示例_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.3数据的无量纲化处理及示例

数据的无量纲处理方法及示例在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据标准化,利用标准化后的数据进行分析。数据标准化处理主要包括同趋化处理和无量纲化处理两个方面。数据的同趋化处理主要解决不同性质的数据问题,对不同性质指标直接累加不能正确反应不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对评价体系的作用力同趋化。数据无量纲化主要解决数据的不可比性,在此处主要介绍几种数据的无量纲化的处理方式。(1)极值化方法可以选择如下的三种方式:TOC\o"1-5"\h\z(A) X X-V1 J •X i -LimaxminR(B)即每一个变量除以该变量取值的全距,标准化后的每个变量的取值范围限于[-1,1]。(B)xminxminX i -i imaxminR即每一个变量与变量最小值之差除以该变量取值的全距,标准化后各变量的取值范围限于[0,1]。(C)x,即每一个变量值除以该变量取X Limax值的最大值,标准化后使变量的最大取值为1。采用极值化方法对变量数据无量纲化是通过变量取值的最大值和最小值将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级的影响。由于极值化方法对变量无量纲化过程中仅仅对该变量的最大值和最小值这两个极端值有关,而与其他取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。(2)标准化方法利用X,XX来计算,即每一个变量值与其平^xii均值之差除以该变量的标准差,无量纲化后各变量的平均值为了0,标准差为1,从而消除量纲和数量级的影响。虽然该方法在无量纲化过程中利用了所有的数据信息,但是该方法在无量纲化后不仅使得转换后的各变量均值相同,且标准差也相同,即无量纲化的同时还消除了各变量在变异程度上的差异。(3)均值化方法

计算公式为:一该方法在消除量纲和数X'TiXi量级影响的同时,保留了各变量取值差异程度上的信息。 =(4)标准差化方法计算公式为:X,X。该方法是标准化方法的X ii基础上的一种变形,两者的差别仅在无量纲化后各变量的均值上,标准化方法处理后各变量的均值为0,而标准差化方法处理后各变量均值为原始变量均值与标准差的比值。综上所述,针对不同类型的数据,可以选择相应的无量纲化方法。如下的示例就是一个典型的评价体系中无量纲化的范例。示例:近年来我国淡水湖水质富营养化的污染日益严重,如何对湖泊水质的富营养化进行综合评价与治理是摆在我们面前的任务,下面两个表格分别为我国5个湖泊的实测数据和湖泊水质评价标准。表2-2全国五个主要湖泊评价参数的实测数据总磷耗氧量|透明度I总氨(总磷耗氧量|透明度I总氨(mg/L)(mg/L)(m)(mg/L)杭州西湖13010.300.352.76武汉东湖10510.700.402.0青海湖201.44.50.22巢湖306.260.25167滇池2010.130.500.23表2-3湖泊水质评价标准评价参数极贫营养贫营养中营养—/工,—富营养极富营养J总阴举<1423110>660耗氧量<0.090.361.807.10>27.1透明度>37122.40.55<0.17总氨<0.020.060.311.20>4.6要求:(1)试用以上数据,分析总磷,耗氧量,

透明度,总氨这4个指标对湖泊水质评价富营养化的作用。(2)对这5个湖泊的水质综合评价,确定水质等级。在进行综合评价之前,首先要对评价的指标进行分析。通常评价指标分成效益型,成本型和固定型指标。效益型指标是指那些数值越大影响力越大的统计指标(也称正向型指标);成本型指标是指数值越小越好的指标(也称逆向型指标);而固定型指标是指数值越接近于某个常数越好的指标(也称适度型指标)。如果每个评价指标的属性不一样,则在综合评价时就容易发生偏差,必须先对各评价指标统一属性。建模步骤(i)建立无量纲化实测数据矩阵和评价标准矩阵,下,矩阵,下,其中实测数据矩阵和等级标准矩阵如13010.30.352.7613010.30.352.7640510.70.42.0]201.44.50.22,306.260.251.672010.130.50.23X1 4 23 110660r0.09 0.36 1.8 7.10 27」Y37 12 2.4 0.55 0.170.02 0.06 0.31 1.2 4.6然后建立无量纲化实测数据矩阵A和无量纲化A等级标准矩阵5,其中

1.00000.96260.71431.00000.80771.00000.62500.7246]A0.15380.13080.05560.0797,0.23080.58501.00000.60510.15380.94670.50000.08330.0(150.00610.03480.16671.00000.00330.01330.06640.26201.0000.0.00460.01420.07080.30911.00000.00430.01300.06740.26091.0000B得到x/maxxj3ij ij得到x/maxxj3ij ija<jij minxXxj3ij\J Nbkty/maxy

kt ktkmminy/yJ ktktkTOC\o"1-5"\h\z(ii)计算各评价指标的权重 I5 ,(b )5 ,(b )2iji4 ,i1,2,3,44£M1 5入—b ,s5.iji然后计算变异系数m=互ws/,最后对变异系数归一化得到各指标的权重为=M

w0.27670.24440.23470.2442(iii)建立各湖泊水质的综合评价模型通常可以利用向量之间的距离来衡量两个向量之间的接近程度,在Matlab中,有以下的函数命令来计算向量之间的距离;dist(〜):计算w中的每个行向量和p中每个

列向量之间的欧式距离;mandist():绝对值距离。w,p计算a中各行向量到5中各列向量之间的欧氏距离,dij4( )dijab7若一dik若一dikmin{d},则第,个湖泊属于第趣。ij1j5J1.84721.83121.737不1.84721.83121.737不1.37690.28811.59591.57981.48591.12710.5034d0.21850.20450.13670.33831.79171.32011.30381.20820.83920.9591=1.07931.06500.9867|0.7328|1.3450这说明杭州西湖,武汉东湖都属于极富营养水质,青海湖属于中营养水质,而巢湖和滇池属于富营养水质。同时也可以计算a中各行向量到5中各列向量之间的绝对值距离4DIabI,ij ikik若Dikmin{若Dikmin{D},则第,个湖泊属于第谶。ij1j5J<<3.66313.63033.43742.67830.32313.14363.11082.91782.15870.84271-0.40620.37340.21100.57873.58002.40712.37432.18141.42231.57911.67011.63741.4444P66Q2.3161D其评价结果与利用欧氏距离得到的评价结果完全一样。所以,从上面的计算可以看出,尽管欧氏距离和绝对值距离的意义完全不一样,但对湖泊水质的评价等级是一样的,这表明了方法的稳定性。程序:X=[13010.30.352.76;10510.70.42;201.44.50.22306.260.251.67;2010.130.50.23];Y=[1423100660;0.090.361.87.127.1;37122.40.550.17;0.020.060.311.24.6];B1=Y(1,:)./660;B2=Y(2,:)./27.1;B3=0.17

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论