




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教程MATLAB数据归一化汇总(最全面的归一化介绍)几个要说明的函数接口:1. Y,PS = mapminmax(X)2. Y,PS = mapminmax(X,FP)3. Y = mapminmax(apply,X,PS)4. X = mapminmax(reverse,Y,PS)复制代码用实例来讲解,测试数据1. x1 = 1 2 4, x2 = 5 2 3;2. y,ps = mapminmax(x1)3. y =4. -1.0000 -0.3333 1.00005.6. ps =7. name: mapminmax8. xrows: 19. xmax: 410. xmin: 111. xrange: 312. yrows: 113. ymax: 114. ymin: -115. yrange: 2复制代码其中y是对进行某种规范化后得到的数据,这种规范化的映射记录在结构体ps中.让我们来看一下这个规范化的映射到底是怎样的?1. Algorithm2. It is assumed that X has only finite real values, and that the elements of each row are not all equal.3.4. * y = (ymax-ymin)*(x-xmin)/(xmax-xmin) + ymin;复制代码* 关于此算法的一个问题.算法的假设是每一行的元素都不想相同,那如果都相同怎么办?实现的办法是,如果有一行的元素都相同比如xt = 1 1 1,此时xmax = xmin = 1,把此时的变换变为y = ymin,matlab内部就是这么解决的.否则该除以0了,没有意义!也就是说对x1 = 1 2 4采用这个映射 f: 2*(x-xmin)/(xmax-xmin)+(-1),就可以得到y = -1.0000 -0.3333 1.0000我们来看一下是不是: 对于x1而言 xmin = 1,xmax = 4;则y(1) = 2*(1 - 1)/(4-1)+(-1) = -1; y(2) = 2*(2 - 1)/(4-1)+(-1) = -1/3 = -0.3333; y(3) = 2*(4-1)/(4-1)+(-1) = 1;看来的确就是这个映射来实现的.对于上面algorithm中的映射函数 其中ymin,和ymax是参数,可以自己设定,默认为-1,1;比如:1. y,ps = mapminmax(x1)2. ps.ymin = 0;3. y,ps = mapminmax(x1,ps)4. y =5. 0 0.3333 1.00006.7. ps =8. name: mapminmax9. xrows: 110. xmax: 411. xmin: 112. xrange: 313. yrows: 114. ymax: 115. ymin: 016. yrange: 1复制代码则此时的映射函数为: f: 1*(x-xmin)/(xmax-xmin)+(0),是否是这样的这回你可自己验证.O(_)O如果我对x1 = 1 2 4采用了某种规范化的方式, 现在我要对x2 = 5 2 3采用同样的规范化方式同样的映射,如下可办到:1. y1,ps = mapminmax(x1);2. y2 = mapminmax(apply,x2,ps)3. y2 =4. 1.6667 -0.3333 0.3333复制代码即对x1采用的规范化映射为: f: 2*(x-1)/(4-1)+(-1),(记录在ps中),对x2也要采取这个映射.x2 = 5,2,3,用这个映射我们来算一下.1. y2(1) = 2(5-1)/(4-1)+(-1) = 5/3 = 1+2/3 = 1.666672. y2(2) = 2(2-1)/(4-1)+(-1) = -1/3 = -0.33333. y2(3) = 2(3-1)/(4-1)+(-1) = 1/3 = 0.3333复制代码X = mapminmax(reverse,Y,PS)的作用就是进行反归一化,讲归一化的数据反归一化再得到原来的数据:1. y1,ps = mapminmax(x1);2. xtt = mapminmax(reverse,y1,ps)3. xtt =4. 1 2 4复制代码此时又得到了原来的x1(xtt = x1);=Matlab 数字归一化问题(by yingzhilian)/viewth . %3D1&sid=Xs3tJM-归一化化定义:我是这样认为的,归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。在matlab里面,用于归一化的方法共有三种:(1)premnmx、postmnmx、tramnmx(2)prestd、poststd、trastd(3)是用matlab语言自己编程。premnmx指的是归一到1 1,prestd归一到单位方差和零均值。(3)关于自己编程一般是归一到0.10.9 。具体用法见下面实例。为什么要用归一化呢?首先先说一个概念,叫做奇异样本数据,所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量。下面举例:1. m=0.11 0.15 0.32 0.45 30;2. 0.13 0.24 0.27 0.25 45;复制代码其中的第五列数据相对于其他4列数据就可以成为奇异样本数据(下面所说的网络均值bp)。奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛,所以对于训练样本存在奇异样本数据的数据集在训练之前,最好先进形归一化,若不存在奇异样本数据,则不需要事先归一化。具体举例:1. close all2. clear3. echo on4. clc5. %BP建模6. %原始数据归一化7. m_data=1047.92 1047.83 0.39 0.39 1.0 3500 5075;8. 1047.83 1047.68 0.39 0.401.0 3452 4912;9. 1047.68 1047.520.400.41 1.03404 4749;10. 1047.521047.270.410.42 1.03356 4586;11. 1047.271047.41 0.42 0.431.033084423;12. 1046.731046.74 1.70 1.80 0.7527332465;13. 1046.741046.821.801.78 0.752419 2185;14. 1046.82 1046.731.781.750.75 21051905;15. 1046.731046.48 1.75 1.85 0.70 17911625;16. 1046.481046.031.851.820.70 1477 1345;17. 1046.03 1045.33 1.82 1.680.7011631065;18. 1045.331044.951.681.71 0.70849785;19. 1044.951045.21 1.711.720.70533508;20. 1045.21 1045.641.721.70 0.70 567526;21. 1045.64 1045.44 1.701.690.70601544;22. 1045.44 1045.781.691.69 0.70635562;23. 1045.78 1046.201.691.52 0.75667580;24. %定义网络输入p和期望输出t25. pause26. clc27. p1=m_data(:,1:5);28. t1=m_data(:,6:7);29. p=p1;t=t1;30. pn,minp,maxp,tn,mint,maxt=premnmx(p,t)31. %设置网络隐单元的神经元数(530验证后5个最好)32. n=5;33. %建立相应的BP网络34. pause35. clc36. net=newff(minmax(pn),n,2,tansig,purelin,traingdm);37. inputWeights=net.IW1,1;38. inputbias=net.b1;39. layerWeights=net.IW1,1;40. layerbias=net.b2;41. pause42. clc43. % 训练网络44. net.trainParam.show=50;45. net.trainParam.lr=0.05;46. net.trainParam.mc=0.9;47. net.trainParam.epochs=200000;48. net.trainParam.goal=1e-3;49. pause50. clc51. %调用TRAINGDM算法训练BP网络52. net=train(net,pn,tn);53. %对BP网络进行仿真54. A=sim(net,pn);55. E=A-tn;56. M=sse(E)57. N=mse(E)58. pause59. clc60. p2=1046.20 1046.05 1.52 1.538 0.75;61. 1046.05 1046.85 1.538 1.510 0.75;62. 1046.85 1046.60 1.510 1.408 0.75;63. 1046.60 1046.77 1.408 1.403 0.75;64. 1046.77 1047.18 1.403 1.319 0.75;65. p2=p2;66. p2n=tramnmx(p2,minp,maxp);67. a2n=sim(net,p2n);68. a2=postmnmx(a2n,mint,maxt)69. echo off70. pause71. clc复制代码程序说明:所用样本数据(见m_data)包括输入和输出数据,都先进行归一化,还有一个问题就是你要进行预测的样本数据(见本例p2)在进行仿真前,必须要用tramnmx函数进行事先归一化处理,然后才能用于预测,最后的仿真结果要用postmnmx进行反归一,这时的输出数据才是您所需要的预测结果。个人认为:tansig、purelin、logsig是网络结构的传递函数,本身和归一化没什么直接关系,归一化只是一种数据预处理方法。=需要说明的事并不是任何问题都必须事先把原始数据进行规范化,也就是数据规范化这一步并不是必须要做的,要具体问题具体看待,测试表明有时候规范化后的预测准确率比没有规范化的预测准确率低很多.就最大最小值法而言,当你用这种方式将原始数据规范化后,事实上意味着你承认了一个假设就是测试数据集的每一模式的所有特征分量的最大值(最小值)不会大于(小于)训练数据集的每一模式的所有特征分量的最大值(最小值),但这条假设显然过于强,实际情况并不一定会这样.使用平均数方差法也会有同样类似的问题.故数据规范化这一步并不是必须要做的,要具体问题具体看待. faruto 按实现上面的规范化代码:复制内容到剪贴板代码:1. function normal = normalization(x,kind)2. % by Li Yang BNU MATH Email: QQ:5166674083. % last modified 2009.2.244. %5. if nargin 26. kind = 2;%kind = 1 or 2 表示第一类或第二类规范化7. end8. m,n= size(x);9. normal = zeros(m,n);10. % normalize the data x to 0,111. if kind = 112. for i = 1:m13. ma = max( x(i,:) );14. mi = min( x(i,:) );15. normal(i,:) = ( x(i,:)-mi )./( ma-mi );16. end17. end18. % normalize the data x to -1,119. if kind = 220. for i = 1:m21. mea = mean( x(i,:) );22. va = var( x(i,:) );23. normal(i,:) = ( x(i,:)-mea )/va;24. end25. end复制代码=由于采集的各数据单位不一致,因而须对数据进行-1,1归一化处理,归一化方法主要有如下几种,供大家参考:(by james)1、线性函数转换,表达式如下:y=(x-MinValue)/(MaxValue-MinValue)说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。2、对数函数转换,表达式如下:y=log10(x)说明:以10为底的对数函数转换。3、反余切函数转换,表达式如下:y=atan(x)*2/PI归一化是为了加快训练网络的收敛性,可以不进行归一化处理归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1-+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。为了避免出现这种情况,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。归一化是因为sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。所以这样做分类的问题时用0.9 0.1 0.1就要比用1 0 0要好。但是归一化处理并不总是合适的,根据输出值的分布情况,标准化等其它统计变换方法有时可能更好。关于用premnmx语句进行归一化:premnmx语句的语法格式是:Pn,minp,maxp,Tn,mint,maxt=premnmx(P,T)其中P,T分别为原始输入和输出数据,minp和maxp分别为P中的最小值和最大值。mint和maxt分别为T的最小值和最大值。premnmx函数用于将网络的输入数据或输出数据进行归一化,归一化后的数据将分布在-1,1区间内。我们在训练网络时如果所用的是经过归一化的样本数据,那么
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商洛职业技术学院《航线设计》2023-2024学年第二学期期末试卷
- 南溪县2024-2025学年四年级数学第二学期期末监测试题含解析
- 清远职业技术学院《图文信息处理与再现》2023-2024学年第二学期期末试卷
- 浙江交通职业技术学院《药剂学实验仿真》2023-2024学年第二学期期末试卷
- 山东农业工程学院《生物技术制药双语》2023-2024学年第二学期期末试卷
- 山东省潍坊市临朐县2024-2025学年高考全真模拟考卷物理试题含解析
- 四川省巴中学市恩阳区实验中学2025届初三第二次校模拟考试英语试题含答案
- 吉林省吉林市吉化九中学2025届初三下学期暑假联考化学试题含解析
- 江苏省徐州市邳州市运河中学2025届初三下学期期末教学质量检测试题(一模)数学试题含解析
- 长春工业大学《放射生物学》2023-2024学年第二学期期末试卷
- 2025年山东省东营市广饶县一中中考一模英语试题(原卷版+解析版)
- 工贸行业隐患排查指导手册
- 形势与政策(贵州财经大学)知到智慧树章节答案
- GB/T 36187-2024冷冻鱼糜
- 2023年江苏省五年制专转本英语统考真题(试卷+答案)
- 20S805-1 雨水调蓄设施-钢筋混凝土雨水调蓄池
- GB3469-83《文献类型与文献载体代码》
- 互联网大学生创新创业大赛培训
- 3号钢筋加工场桁吊安装方案
- 部编版(统编)六年级语文下册文学常识及文化常识(共4页)
- 世界500强企业企业文化(企业使命、愿景、核心价值观)集锦
评论
0/150
提交评论