版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、模糊聚类分析聚类分析:按照一定要求和原则对事物进行分类。聚类:普通分类——清晰事物模糊分类——带有模糊性的事物三种模糊聚类方法:传递闭包法——基于模糊等价关系;直接聚类法——基于模糊相似关系;模糊聚类法——基于模糊划分.一、模糊聚类分析聚类分析:按照一定要求和原则对事物进行分类。1二、模糊聚类分析的步骤1.选取特征指标
特征要有明确的意义,要有较强的分辨力,有代表性,并确定描述特征的变量。分类事物的特征指标选择的如何,对分类结果有直接的影响。
二、模糊聚类分析的步骤1.选取特征指标22.数据标准化(正规化)令其中,xi为原始数据;是原始数据的均值;是原始数据的标准差;是数据处理后的数据。2.数据标准化(正规化)令其中,xi为原始数据;是原始数据33.标定
设为待分类的对象,uj有m个刻划其特征的数据,就是根据实际情况,按一个准则或某一种方法,给论域U中的元素两两之间都赋以区间[0,1]内的一个数,叫做相似系数。它的大小表征两个元素彼此接近或相似的程度。,然后对于ui与uj,用rij表示ui与uj的当rij=0时,表示ui与uj截然不同;当rij=1时,表示ui与uj可以等同(不能说是完全相同);rij可根据具体问题来选取。方法有:的相似程度,要求3.标定设为待分类的对象,uj有m个刻划其特征4(1)数量积法,其中显然.如果rij中出现负值,可采用下面方法将全体rij进行重新调整.方法1令,则方法2令其中于是(1)数量积法,其中显然.如果rij中出现负值,可采用下5(2)夹角余弦法如果rij中出现负值,也可采用上面方法调整.(3)相关系数法其中(2)夹角余弦法如果rij中出现负值,也可采用上面方法调整.6(4)最大最小法(5)算术平均最小法(6)几何平均最小法(4)最大最小法(5)算术平均最小法(6)几何平均最小法7(8)指数相似系数法其中sk适当选择.(9)绝对值倒数法M适当选取使rij在[0,1]中且分散开(7)绝对值指数法(8)指数相似系数法其中sk适当选择.(9)绝对值倒数法8(11)非参数法中正数个数,中负数个数,令则(10)绝对值减数法(11)非参数法中正数个数,中负数个数,令则(10)绝对值减9(12)贴近度法如果特征则ui,uj
可看作模糊向量,以它们的贴近度D(ui,uj)为其相似程度.i)格贴近度,其中ii)距离贴近度其中c,a为适当选择参数值,d(ui,uj)为模糊集各种距离.iii)算术平均最小贴近度(12)贴近度法如果特征则ui,uj可看作模糊向量,10(13)主观评定法请有实际经验者直接对ui,uj的相似程度评分,作为rij的值.通过标定求出相似系数后,便可得到以rij为元素的模糊相似矩阵R(rij).4.聚类选择一种合适的聚类方法,便可得到分类结果.(13)主观评定法请有实际经验者直接对ui,uj11三、传递闭包法1.传递闭包法根据标定所得模糊矩阵R,求出其传递闭包为模糊等价矩阵,对,令λ从1降到0得到,根据进行分类:归为一类.2.最佳阈值λ的选取聚类图给出各λ值对应的分类,形成一种动态聚类,便于全面了解元素聚类,然后根据实际需要选择其阈值λ,便可确定元素的一种分类,至于如何选择阈值λ,使分类更加合理,除了凭经验外,还可用F-统计量来选取.三、传递闭包法1.传递闭包法根据标定所得模糊矩阵R,求出其12F-统计量:为待分类事物的全体,设xjk为描述元素uj
第k
个特征的数据.设c
为对应于λ
值的类数,ni为第
i
类元素的个数,第
i
类元素记为记为第i
类元素的第k
个特征的平均值,而称为第i类的聚类中心向量;为全体元素的中心向量,而F-统计量:为待分类事物的全体,设xjk为描述元素uj13于是,称为F-统计量,其中为第i类中元素与中心的距离.
可见,F-统计量的分子表征类与类间的距离,分母表征类内元素间的距离.因此,F值越大,说明分类越合理,与此分类相对应的F-统计量最大的阈值λ为最佳值.于是,称为F-统计量,其中为第i类中元素与中心的距离.14求传递闭包的简便方法设为模糊相似矩阵,求t(A).(1)求,假定,把A中的a1m,am1,a11,amm用圆圈圈起来,并记(2)在A中第一行、第m行中剩下的元素中找最大元素,即.且设在第p列.用即分别代替a1p与amp以及它们的对称元素,最后用圆圈将它们及圈起来.求传递闭包的简便方法设为模糊相似矩阵,求t(A).(1)15(3)假定A中有圈的k行是行.而所在的列是ij列,在这些行中剩下的元素中找最大元并设在第l行,用分别代替继续此过程,到k=n-1,得到t(A).还有逐步平方法:及其对称矩阵,并把all圈起来(3)假定A中有圈的k行是行.而所在的列是i16四、基于模糊相似关系的直接聚类法1.最大树法
聚类原则是:ui与uj在λ水平同类当且仅当在相似矩阵R的图中,存在一条权重不低于λ的路联结ui与uj.画出以被分类元素为结点,以相似矩阵R的元素rij为权重的一颗最大树;(2)取定,砍断权重低于λ的枝,得到一个不连通图,各连通分支变构成了在λ水平上的分类.四、基于模糊相似关系的直接聚类法1.最大树法聚类原则172.编网法对给定的模糊相似矩阵R,取定水平,作截矩阵Rλ
,在Rλ
的主对角线上填入元素的符号,在对角线下方以结点号“*”代替1,而“0”则略去不写,由结点向主对角线上引经线和纬线,称之为编网,通过经线和纬线能互相连接起来的元素,属于同类,从而实现了分类.2.编网法对给定的模糊相似矩阵R,取定水平,作截矩阵Rλ18五、基于模糊划分的模糊聚类法1.c-划分(1)普通c-划分如果划分把普通集合分成c类,则此划分就叫普通c-划分,即:若设的特征可表为,那么U的普通c-划分是指U的c个子集满足:(1)(2)五、基于模糊划分的模糊聚类法1.c-划分(1)普通19其中且满足(1)(2)(表示每个uj必属于且仅属于一类);(表示每类Ai至少有一个元素);反过来,任一满足条件(1)、(2)、(3)的矩阵对应着U的一个分类.(1)(2)(3)这样的分类结果可以用一个c×n矩阵(称为c-划分)来表示.其中且满足(1)(2)(表示每个uj必属于且仅属于一类)20例如,设U={u1,u2,u3,u4},若分类结果为{u1},{u2,u3},{u4},则对应的分类矩阵为如果分类矩阵为则对应着U的分类为{u1},{u2,u3},{u4}.例如,设U={u1,u2,u3,u4},若分类结21记V为c×n实矩阵的集合,且显然,对于给定的U及分类数c,类的分法不是唯一的.Mc包含了U的所有可能c类划分的结果,Mc称为将U分成c类的分类空间.这样的分类是通常的分类,称为硬分类.记V为c×n实矩阵的集合,且显然,22(2)模糊c-划分设,一个c×n模糊矩阵若满足(1)(2)(表示每个uj属于c个模糊子集Ai的程度总和为1);(表示每类Ai不等于空集或U);则称A称为U的模糊c-划分矩阵.(2)模糊c-划分设,一个c×n模糊矩阵若满足23记Mfc称为U的c类软分类空间.显然若将Mc和Mfc定义中的条件:放宽为则这样的分类空间分别称为退化的硬分类空间和退化的软分类空间.分别记为Mco和Mfco,显然记Mfc称为U的c类软分类空间.显然若将Mc242.目标函数聚类法和硬c-均值算法划分(1)目标函数法目标函数是对给定的c的所有候选类进行度量,最优的类就是使目标函数达到局部最小值的类.对于硬分类情形,通常所选取的目标函数是总体组内误差平方和,其定义为这里将每类Ai中元素各特征分别取平均值,所得的聚类中心向量记为vi,也称为Ai的聚类中心.由于Ai类中元素个数,Ai类中元素向量和为,因此聚类中心向量2.目标函数聚类法和硬c-均值算法划分(1)目标函数25记V称为聚类中心矩阵.若,则uj到聚类中心vi的距离为Ai
中全体元素到中心距离平方和为而V中所有元素到其所在类中心距离平方和为最理想的c-划分显然是使J(A,V)取极小的A.记V称为聚类中心矩阵.若,则uj到聚类中心vi的距离为26(2)硬c-均值算法步骤1:假设给出n个数据点,其中.取定并初始化步骤2:当迭代次数为时,计算聚类中心向量其中,步骤3:用下式将A(l)更新为(2)硬c-均值算法步骤1:假设给出n个数据点,其27步骤4:比较A(l)和A(l+1),若,则停止算法;否则,令l=l+1,返回步骤2.直观上看,硬c-均值算法:猜想c的硬分类(步骤1),寻找各分类的中心(步骤2),重新分配类的隶属度以减少数据和当前中心的误差平方(步骤3),当循环不再能显著的降低J(A,V)时,停止算法(步骤4).步骤4:比较A(l)和A(l+1),若,则停止算283.模糊c-均值算法定义目标函数其中是一个加权指数.模糊c-均值算法的目标在于找到和,使得Jm(A,V)最小下面,首先建立这个最小化问题的必要条件,然后根据此条件提出模糊c-均值算法.3.模糊c-均值算法定义目标函数其中是29定理令为一给定数据集.设定,假设对所有,则仅当和时,才是Jm(A,V)的局部最小值.定理令为一给定数据集.设定,假设对所有,则仅当和时,才30模糊c-均值算法(ISODATA方法)步骤:步骤1:给定数据集设定,并初始化步骤2:当迭代次数为时,计算聚类中心向量步骤3:用下式将
,更新为模糊c-均值算法(ISODATA方法)步骤:步骤131步骤4:若,则停止算法;否则令l=l+1,返回步骤2.注意:本方法要求,因此取初
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年投资款转为项目融资借款合同范本及合规审查3篇
- 2025年潮州货运资格证题库在线练习
- 2025年淮安道路货运从业资格证模拟考试官方题下载
- 2025年大同考货运从业资格证
- 2025年货运从业资格证考试技巧与方法
- 洛阳理工学院《大数据平台核心技术》2023-2024学年第一学期期末试卷
- 火车站采暖系统施工协议
- 2024年物业抵押借款合同
- 商业地带净水机租赁合同协议书
- 文化场馆改造增补合同
- 安徽省蚌埠市联考2024-2025学年七年级上学期12月期末考试英语试题(无答案)
- 心理健康课件教学课件
- 2024至2030年中国甲醚化氨基树脂行业投资前景及策略咨询研究报告
- 贵州省建筑工程施工资料管理导则
- 2024年度钢模板生产与销售承包合同3篇
- 《QHSE体系培训》课件
- 计量经济学论文-城镇单位就业人员工资总额的影响因素
- 《农业企业经营管理》试题及答案(U)
- 山东省聊城市2024-2025学年高一上学期11月期中物理试题
- 孙悟空课件教学课件
- 华南理工大学《自然语言处理》2023-2024学年期末试卷
评论
0/150
提交评论