数据标准化方法_第1页
数据标准化方法_第2页
数据标准化方法_第3页
数据标准化方法_第4页
数据标准化方法_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据标准化方法问题1:将一个人的体重和身高相加在一起有无什么意义?答:量纲(就是单位)不同的量相加是没有意义的。不加处理就将两个不同量纲的量相加这是数学建模的大忌!问题2:如何将一个人的体重G和身高H这两个指标综合为一个指标用以评价一个人身材?答:通常考虑加法模型和乘法模型。乘法模型在这里不太适合,故考虑加法模型,一般采用加权组合的方式,即P=wG+wH,这里w+w=1,但是这样就犯了一个严重的错误。1212因此需要先对G,H进行预处理〜无量纲化,也就是数据标准化方法。数据标准化方法主要有以下三种:规范化方法对序列x,x,・・・,x进行变换:12nx-min{x}y—1Wj§njimax{x}一min{x}1§j§nj1§j§nj则新序列y,y,・・・,ye[0,1]且无量纲。一般的数据需要时都可以考虑先进行规范化处TOC\o"1-5"\h\z12n理。正规化方法对序列x,x,・・・,x进行变换:12ny—,这里;—-£x,s——£(x一;)2{sn°n一1:—1i—1则新序列y,y,・・・,y的均值为0,而方差为1,且无量纲。12n归一化方法对正项序列x,x,・・・,x进行变换:12nxy=—i£nxi—1则新序列y,则新序列y,y,・・・,12ye[0,1]且无量纲,并且显然有£ny—1。i归一化方法在确定权重时经常用到。针对实际情况,也可能有其他一些量化方法,或者要综合使用多种方法,总之最后的结果都是无量纲化。

例1:DVD分发问题中满意度的量化现有20种dvd要分发给100个会员,规定如果要向某人发放DVD,则一次发给3张,问如何对这些DVD进行分配,才能使会员获得最大的满意度?DVD编号DVD现有数量C0001C0002会员偏C0003DVD编号DVD现有数量C0001C0002会员偏C0003好C0004C0005D001D002D003D004D005122108002109D00640000007060000000450000注:表中的数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的订单中。解:我们考虑三种方法进行变换,然后对它们进行比较。利用公式f(x)=(11-x)/101利用公式f(x)=1/x2利用模糊数学中的隶属函数的概念,选取合适的函数,对满意度进行量化f(x)=aln(11-x)+b,1<x<10,这里a,b为待定常数3令f(1)=1,f(10)=0.05代入可得a,b。33f(f(x)=0.41258ln(11-x)+0.05,1<x<103结论:方法1可行;方法2不太可取;方法3可行。注意:无论采用哪一种方法,对每一个会员的满度度均需要作归一化处理,使得每一个会员对选中的DVD的满意度之和等于1,(算出的每人的满意度或综合满意度都应该介于0-1之间)。

例2:长江水质的定量综合评价(2005年赛题)表是《地表水环境质量标准》,给出了水质类别的分类标准。序号W准值项目、\I类II类皿类W类V类劣V类1溶解氧(DO)三7.5(或饱和率90%)653202高锰酸盐指数(CODMn)W2461015oo3氨氮(NH3-NW0.150.51.01.52.0oo4PH值(无量纲)69表给出了17个观测点的水质情况。序号点位名称断面情况主要监测项目(单位:mg/L)水质类别pH*DOCODMnNH3-N本月1四川攀枝花干流7.66.80.20.1II2重庆朱沱干流(川-渝省界)7.638.412.80.34II3湖北宜昌南津关干流(三峡水库出口)7.077.815.80.55III4湖南岳阳城陵矶干流7.586.472.90.34II5江西九江河西水干流(鄂-赣省界)7.346.191.70.13II6安徽安庆皖河口干流7.526.543.20.22II7江苏南京林山干流(皖-苏省界)7.786.93.10.11II8四川乐山岷江大岷江(与大渡河汇合7.664.25.80.53IV9四川宜宾凉姜沟岷江(入长江前)8.017.632.40.25II10四川泸州沱江二沱江(入长江前)7.634.023.61.06IV11湖北丹江口胡家丹江口水库(库体)8.6310.21.80.1I12湖南长沙新港湘江(洞庭湖入口)7.426.454.30.99III13湖南岳阳岳阳楼洞庭湖出口7.736.261.40.21II14湖北武汉宗关汉江(入长江前)86.432.40.17II15江西南昌滁槎赣江(鄱阳湖入口)6.645.181.10.92III16江西九江蛤蟆石鄱阳湖出口7.286.872.70.15II17江苏扬州三江营夹江(南水北调取水7.296.91.60.15II分析水质的类别的确定可知口)它是由首要污染物决定的。请根据以上数据对长江当前的水质情况做出定量的综合评价。解:1、数据的标准化处理溶解氧是极大型指标(指标越大,水质越好),PH值是居中型指标,其余两种是极小型指标,统一进行极小型处理。1TOC\o"1-5"\h\z(1)溶解氧:P*=——,i=1,2,・・.,17(共有17个观测点)i1Pi1(2)PH值:P*=P一7,i=1,2,.・・,17i4i4然后对P*,P*,P*,P*进行规范化处理,即:i1i2i3i4P*一minx=~ji,i=1,2,・.・,17,j=1,2,3,4ijmax一miniiTOC\o"1-5"\h\z得到规范化矩阵X=(X),这里xG[0,1]且无量纲。i17X4ij2、确定四种指标的权重(变权函数的确定)原则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论