Matlab笔记——模糊聚类分析原理及实现023_第1页
Matlab笔记——模糊聚类分析原理及实现023_第2页
Matlab笔记——模糊聚类分析原理及实现023_第3页
Matlab笔记——模糊聚类分析原理及实现023_第4页
Matlab笔记——模糊聚类分析原理及实现023_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、23. 模糊聚类分析原理及实现聚类分析,就是用数学方法研究和处理所给定对象,按照事物间的相似性进行区分和分类的过程。 传统的聚类分析是一种硬划分,它把每个待识别的对象严格地划分到某个类中,具有非此即彼的性质,这种分类的类别界限是分明的。随着模糊理论的建立,人们开始用模糊的方法来处理聚类问题,称为模糊聚类分析。由于模糊聚类得到了样本数与各个类别的不确定性程度,表达了样本类属的中介性,即建立起了样本对于类别的不确定性的描述,能更客观地反映现实世界。本篇先介绍传统的两种(适合数据量较小情形,及理解模糊聚类原理):基于择近原则、模糊等价关系的模糊聚类方法。(一)预备知识一、模糊等价矩阵定义1设R=(r

2、ij)n×n为模糊矩阵,I为n阶单位矩阵,若R满足i) 自反性:IR (等价于rii =1);ii) 对称性:RT=R;则称R为模糊相似矩阵,若再满足iii) 传递性:R2R(等价于)则称R为模糊等价矩阵。定理1设R为n阶模糊相似矩阵,则存在一个最小的自然数k(k<n), 使得Rk为模糊等价矩阵,且对一切大于k的自然数l,恒有Rl=Rk. Rk称为R的传递闭包矩阵,记为t(R).二、模糊矩阵的-截矩阵定义2设A=(aij)n×m为模糊矩阵,对任意的0,1, 作矩阵其中,称为模糊矩阵A的-截矩阵。显然,A为布尔矩阵,且其等价性与与A一致。意义:将模糊等价矩阵转化为等价的

3、布尔矩阵,可以得到有限论域上的普通等价关系,而等价关系是可以分类的。因此,当在0,1上变动时,由A得到不同的分类。若12, 则A1A2, 从而由A2确定的分类是由A1确定的分类的加细。当从1递减变化到0时,A的分类由细变粗,逐渐归并,形成一个分级聚类树。例1设U=u1, u2, u3, u4, u5, 对给定的U上的模糊等价关系让从1到0变化,观察分类过程。 (1) 当=1时,分类结果为5类:(每行代表一类,1代表对应元素在该类)u1, u2, u3, u4, u5 (2) 当=0.8时,分类结果为4类:u1, u3, u2, u4, u5 (3) 当=0.6时,分类结果为3类:u1, u3,

4、 u2, u4, u5 (4) 当=0.5时,分类结果为2类:u1, u3, u4, u5, u2 (4) 当=0.4(R中的最小值)时,分类结果为1类:u1, u2, u3, u4, u5整个动态分类过程如下:(二)基于择近原则的模糊聚类择近原则就是利用贴近度来实现分类操作,贴近度用来衡量两个模糊集A和B的接近程度,用N(A,B)表示。贴近度越大,表明二者越接近。设论域有限或者在一定区间,即U=u1, u2, , un或U=a,b, 常用的贴近度有以下三种: (1) 海明贴近度(2) 欧氏贴近度(3) 格贴近度其中,.Matlab实现:格贴近度的实现函数fuz_closing.mfuncti

5、on y=fuz_closing(A,B,type)%要求A与B列数相同的行向量m,n=size(A);switch typecase 1 %海明贴近度 y=1-sum(abs(A-B)/n; case 2 %欧氏贴近度 y=1-(sum(A-B).2)(1/2)/sqrt(n); case 3 %格贴近度 y1=max(min(ones(m,n)-A,ones(m,n)-B); %ones(m,n)-A等于Ac y2=max(min(A,B); y=min(y1,y2);end例2 设某产品的质量等级分为5级,其中一级有5种评判因素u1, u2, u3, u4, u5. 每一等级的模糊集为B

6、1=0.5 0.5 0.6 0.4 0.3B2=0.3 0.3 0.4 0.2 0.2B3=0.2 0.2 0.3 0.1 0.1B4=0.1 0.1 0.2 0.1 0B5=0.1 0.1 0.1 0.1 0假设某产品各评判因素的值为A=0.4 0.3 0.2 0.1 0.2, 问该产品属于哪个等级?代码:A=0.4 0.3 0.2 0.1 0.2;B=0.5 0.5 0.6 0.4 0.3; 0.3 0.3 0.4 0.2 0.2; 0.2 0.2 0.3 0.1 0.1; 0.1 0.1 0.2 0.1 0; 0.1 0.1 0.1 0.1 0;fori=1:5haiming(i)=fu

7、z_closing(A,B(i,:),1);oushi(i)=fuz_closing(A,B(i,:),2);ge(i)=fuz_closing(A,B(i,:),3);endhaimingoushige运行结果:haiming = 0.7800 0.9200 0.9000 0.8600 0.8400oushi = 0.5081 0.9106 0.8658 0.6870 0.6422ge = 0.4000 0.3000 0.2000 0.2000 0.1000可见样本A与各等级的格贴近度分别为0.4, 0.3, 0.2, 0.2, 0.1, 故可认为该产品属于B1等级。若按令两种贴近度判断,该

8、产品属于B2等级。(三)基于模糊等价关系的模糊聚类一、算法步骤1. 样本数据归一化设X=x1, x2, , xn为要分类的n个样本,每个样本有m个指标,即xi= xi1, xi2, , xim, i=1,2,.,n得到原始数据矩阵X=(xij)n×m.由于不同指标的数据量纲不同,为了使数据能够比较,要先对X做归一化处理。2. 建立模糊相似矩阵R先建立样本xi与xj相似程度rij, 进而构造模糊相似矩阵R=(rij)n×n建立rij常用的方法有:(1) 相似系数法夹角余弦法:相关系数法:(2)距离法一般取rij=1-c(d(xi,xj), 其中c和为适当选取的参数,使得0ri

9、j1. 常用的距离有:海明距离:欧氏距离:切比雪夫距离:(3) 贴近度法最大最小法:算术平均最小法:几何平均最小法:3. 求出R的传递闭包t(R)即改造相似关系为等价关系:令, 再令, , 直到满足与Rl相等,即为t(R), 仍记为R. 4. 选取合适的, 利用-截矩阵R进行分类(参考例1)。二、Matlab实现求模糊相似矩阵R的函数:fuz_distance.mfunction R=fuz_distance(x,type)%x为归一化的数据矩阵, type选择计算相似程度的方法%返回模糊相似矩阵Rn,m=size(x);%距离法的选择参数c和a, 需要根据具体情况修改以保证R(i,j)属于0

10、,1c=0.1;a=1;fori=1:nfor j=1:nswitch typecase 1 %夹角余弦法 R(i,j)=(x(i,:)*x(j,:)')/(norm(x(i,:),2)*norm(x(j,:),2); case 2 %相关系数法Dxi=abs(x(i,:)-mean(x(i,:);Dxj=abs(x(j,:)-mean(x(j,:); R(i,j)=(Dxi*Dxj')/(norm(Dxi,2)*norm(Dxj,2);case 3 %海明距离法 d=sum(abs(x(i,:)-x(j,:);R(i,j)=1-c*da;case 4 %欧氏距离法 d=nor

11、m(x(i,:)-x(j,:),2);R(i,j)=1-c*da;case 5 %切比雪夫距离法 d=max(abs(x(i,:)-x(j,:);R(i,j)=1-c*da;case 6 最大最小(贴近度)法R(i,j)=sum(min(x(i,:);x(j,:)/sum(max(x(i,:);x(j,:);case 7 算术平均最小(贴近度)法 R(i,j)=2*sum(min(x(i,:);x(j,:)/sum(x(i,:)+x(j,:);case 8 %几何平均最小(贴近度)法R(i,j)=sum(min(x(i,:);x(j,:)/sum(sqrt(x(i,:).*x(j,:);end

12、endend求R的传递闭包t(R)的函数:tran_R.mfunction B,k=tran_R(R)%R为模糊相似矩阵, 循环构造满足传递性的t(R)%k为满足R2k = Rk的最小的自然数kn=length(R);B=zeros(n,n);flag=0;k=1/2;while flag=0 B=fco(R,R); %做模糊合成运算 k=2*k;if B=Rflag=1;else R=B; %循环计算R传递闭包endend上面的函数tran_R.m调用函数矩阵模糊合成算子函数:fco.mfunction B=fco(Q,R)%实现模糊合成算子的计算, 要求Q的列数等于R的行数n,m=size

13、(Q); m,l=size(R);B=zeros(n,l);fori=1:nfor k=1:l B(i,k)=max(min(Q(i,:);R(:,k)'); endend求t(R)的-截矩阵的函数:fuz_lamda.mfunction y=fuz_lamda(X,m)%用-截矩阵将样本分成m类, m总样本数lamda=unique(X)' %根据R中的值取值%unique函数取矩阵不重复元素组成向量并从小到大排好序X(find(X<lamda(m)=0;X(find(X>=lamda(m)=1;y=X;例3某地区设有11个雨量站,其分布如图所示:10年来各雨量站

14、测得的年降雨量表如下:现因经费问题,希望撤销几个雨量站,问撤销哪些雨量站而不会太多地减少降雨信息?分析:对11个雨量站进行模糊聚类,同一类的只需保留一个即可。比如,已知该市决定撤销6个只保留5个雨量站,则模糊聚类为5类。代码:loaddata;%数据归一化X,ps=mapminmax(data',0,1);X=X'%选择计算相似程度的方法type=3; %c=0.1, a=1, 此时也称绝对值减数法%求模糊相似矩阵R0R0=fuz_distance(X,type)%将模糊相似矩阵R0改造成模糊等价矩阵RR,k=tran_R(R0)%求将样本分成8类的-截矩阵R_lamda=fu

15、z_lamda(R,8)运行结果及说明:归一化后的数据矩阵X:模糊相似矩阵R0:由R0改造成的模糊等价矩阵R:k = 8说明R16=R8.将样本分为5类的-截矩阵R_lamda:可以判断5类分别是:x1,x7 x2, x4,x5,x6 x3, x9 x8, x11 x10注:对于这类C均值模糊聚类问题,也可以直接调用Matlab自带的模糊聚类函数fcm.m求解。调用方式:center,U, obj_fcn,=fcm(data,cluster_n)其中,data为归一化后的样本数据,每一行是一个样本;cluster_n为聚类数;center返回最终的聚类中心矩阵;U为最终的模糊分区矩阵;obj_fcn为迭代过程中的目标函数值(越小越好)。代码:(X为前面已归一化的样本数据)center,U, obj_fcn=fcm(X,5)maxU=max(U);index1 = find(U(1,:)=maxU); %第一类index2 = find(U(2,:)=maxU); %第二类index3 = find(U(3,:)=maxU); %第三类index4 = find(U(4,:)=maxU); %第四类index5 = find(U(5,:)=maxU);

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论