版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、论文题目 模糊k均值分类器指导老师论文完成人论文结构设计 前言1 模糊集合理论2 模糊聚类分析方法3 模糊k均值分类器的算法实现4 模糊k均值分类器运用实例5 结论、致谢词、参考文献2对于一个普通的集合 ,空间中任一元素 ,要么 要么 ,二者必居其一。如果利用特征函数法来描述元素属于集合的程度,则对于集合 ,其特征函数 可以标记为: 从上式可以看出,对于任意给定的 都有唯一确定的特征函数 与之对应,因此可以将集合 表示为: 其中 是从 到 的一个映射,它唯一确定了集合 。1.1 经典集合与特征函数 3 由此可见,经典集合A 与其特征函数 u A 是一一对应的 由于uA 只取0和1两个值,故经典
2、集合A 只能用来描述界限分明的研究对象,对界限不分明的对象却无能为力。比如,对“年轻”这个模糊概念,用经典集合就无法给出合理的描述。而在自然界和现实生活中,模糊现象是普遍存在的。因此,必须把经典集合扩充,使之能够刻划模糊现象和解决模糊性问题。41.2模糊集合的定义 .adeh 教授于1965年提出了模糊集合概念,具体定义如下: 定义1.2.1模糊集合:论域 上 X 的模糊集合 由隶属度 来表征,其中 在实轴的闭区间0,1上取值, 的值反应了 中的 元素 对于 的隶属程度。 :X 0,1 , 所确定的集合 为 X 上的模糊集合,而称 为模糊集合 的隶属函数,A ( u )称为元素 u 对于 的隶
3、属度。 1图1.1隶属度函数5由此可见, 模糊集合 是一个抽象的概念,其元素是不确定的, 我们只能通过隶属函数来认识和掌握 (u)的数值的大小反映了论域X 中的元素 u 对于模糊集合 的隶属程度, (u)的值越接近于1 ,表示u隶属于 的程度越高;而 (u)的值越接近于,表示u隶属于 的程度越低特别地,若 (u) =,则认为u完全属于 ; 若 (u) =,则认为u完全不属于 因此, 经典集合可看作是特殊的模糊集合 换言之,模糊集合是经典集合的推广。6 1.3 模糊集合的表示方法1 扎德表示法例1.3.1:设U =u1 , u2 , u3 , u4 , u5 ,则 表示论域U 上 u1 对于A
4、的隶属度为0.87 , u2 对于A 的隶属度为0.75 , u3 对于A 的隶属度为0.96 , u4 对于A 的隶属度为0.78 , u5 对于A 的隶属度为0.56 的模糊集合 。72. 向量表示法 当论域U =u1 , u2 , , un 时, A F ( U ) 也可用如下向量来表示: A=(A(u1 ) ,A(u2), ,A( un) (1) 例如,例1.2.1中的模糊集合A也可表示为 A=(0.87 ,0.75, 0.96,0.78,0.56) 由于A( ui ) 0,1(i=1,2,n ),故称式(1)所示的向量为模糊向量。81.4 模糊关系与模糊矩阵1.4.1 普通关系与Bo
5、ole矩阵例如 设U表示某校全体学生的集合, R=(u, v)| v是u的同学. 则R表示U上的“同学”关系定1.4.2 设U=u1,u2, , um, V=v1,v2, , vn, RP(UV), 令rij=R (ui, vj)(i=1,2,m ; j=1,2,n), 则R=(rij)mn 为一个mn 矩阵, 由于故R=(rij)mn是一个布尔矩阵 . 这说明:有限论域间的普通关系可由Boole矩阵来表示. 91.4.2 模糊关系与模糊矩阵 定义1.3.3 设U, V 为两个论域, 若RF(UV)则称R为U到V的一个模糊关系. 对(u, v)UV , 称R(u, v)为u对v具有模糊关系R的
6、相关程度.特别地 (1) 称RF(UU) 为U上的模糊关系; (2) 若(u, v)UU,有 则称R为U上的恒等关系 , 这时记R = I ; (3) 若(u, v)UV, 有R(u, v)=0,则称 R为U到V的零关系 ,这时记R = 0 ; (4) 若(u, v)UV,有R(u, v)=1, 则称R为全称关系 ,这时记R = E .10由定义可见, R(u, v)反映了u对于v的相关程度,若R(u, v)越接近于1,则u与v对R的关系越密切;若R(u, v)越接近于0,则u与v对R的关系越稀疏.特别地,当R(u, v) 0,1时,与u与v对R具有明确关系.因此,模糊关系是普通关系的推广,它
7、能从更深刻的意义上表现出事物的更广泛的联系. 定义3.1.4 设U=u1,u2, , um, V=v1,v2, , vn, RF(UV), 则可以用一个mn阶矩阵来表示,即R=(rij)mn ,其中rij=R (ui, vj)(i=1,2,m ; j=1,2,n), 由于R (ui, vj) 0,1,故称R=(rij)mn为模糊矩阵 . 由于0,1 0,1, 故模糊矩阵是Boole矩阵的推广.11例1.4.1设U=u1,u2, u3, u4 为生产资料商品集, V =v1,v2为两种消费品的集合, W=w1,w2, w3为三个市场的细分,以R表示U到V的原料供应关系,以Q表示V到W的市场占有关
8、系。模糊关系矩阵表示如下:12 主要内容3.1 算法简介3.2 算法原理3.3 算法实例3.4 分类器算法步骤3.5 流程图3 模糊k均值分类器的实现132模糊聚类分析方法1 分类数不定(根据不同要求对事物进行动态聚类)2 分类数确定(主要是基于目标函数的聚类 如模糊k均值聚类分析)3 在摄动有意义的情况下的聚类143.1算法简介 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。 它是将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类间独
9、立。153.2 算法原理聚类:将物理或抽象对象的集合分组成为由类似的对象组成的多各类的过程被称为聚类。所形成的类是一组数据对象的集合,这些对象与同一个类中的对象彼此相似,与其他类中的对象相异。对于数据聚类的效果,可以使用类内距离来描述。在空间中,定义两个对象的距离,使用欧式空间的距离公式。设x1 ,x2 是两个样本数据,分别有n 个属性。则其空间距离定义为 : 类内总距离定义为: 其中K表示的是分类数, 表示类别点, 表示第 i类的中心, 表示属于第 i类的第几个点。16Step1:为中心向量 , , 初始化k 个种子 Step2: 分类: 将样本分配给距离其最近的中心向量 表示各聚类中心点(
10、类距离平均值)Step3:确定中心: 用各个聚类的中心向量作为新的中心 Step4:计算准则函数E : 若 的值和前一次分类的 不相等,重复分类和确定中心的步骤, 直至算法收敛 173.3 算法实例Oxy10220031.50450552数据对象集合S见表1,作为一个聚类分析的二维样本,要求的类的数量k=2。(1)选择 , 为初始的簇中心即 , 。(2)对剩余的每个对象,根据其与各个类中心的距离,将它赋给最近的类。 对 : 显然 ,故将 分配给18Oxy10220031.50450552对于 :因为 所以将 分配给 对于 :因为 所以将 分配给更新得到新的分类 和计算平方误差准则,单个方差为1
11、9,。总体平均方差是:(3)计算新的类的中心。 重复(2)和(3),得到O1分配给C1;O2分配给C2,O3分配给C2 ,O4分配给C2,O5分配给C1。更新,得到新类和 。 中心为 , 。单个方差分别为总体平均误差是: 由上可以看出,第一次迭代后,总体平均误差值52.2525.65,显著减小。由于在两次迭代中,类中心不变,所以停止迭代过程,算法停止。 Oxy10220031.5045055220k-means算法的性能分析主要优点:是解决聚类问题的一种经典算法,简单、快速。对处理大数据集,该算法是相对可伸缩和高效率的。当结果类是密集的,而类与类之间区别明显时, 它的效果较好。主要缺点在类的平
12、均值被定义的情况下才能使用,这对于处理符号属性的数据不适用。该算法对于连续型数据的分聚类有较好效果,不适用于离散型数据必须事先给出k(要生成的类的数目),而且对初值敏感,对于不同的初始值,可能会导致不同结果。213.4 分类器算法步骤 输入:类的数目 和包含M N个数据其中M为样本数目,N为样本属性(维数)。 输出:k 个类,使平方误差准则最小。 算法步骤: 1.为每个聚类确定一个初始聚类中心,这样就有 k个初始聚类中心。 2.将样本集中的样本按照最小距离原则分配到最邻近聚类 3.更新簇的平均值,即类中心,重新计算每个类中对象的平均值; 4.如果新的平均值发生改变,转至(2)步; 5.新的平均
13、值不在发生改变,算法聚类结束,得到k个聚类 。223.5 流程图k均值算法流程图 开始输入聚类样本的属性(维数),样本数目,类别(簇)数K对新生成的类重新计算平均值新的平均值改变结束聚类NY234实例演示例: 为了检验分类器的效果,我们抽取出宁夏磁窑堡井田的煤层地址条件进行模糊分类,从而说明模糊K均值分类器在工业实际上的重要应用。选择磁窑堡井田某煤层的12个煤层段作为分类对象的集合: 并且采用如下煤层分类特性指标: 煤层厚度用 ;煤层倾角 ;煤厚标准率 : 式中 M为大于可采厚度的钻孔数,n 为煤层内钻孔个数;24煤厚离差系数 :离差系数 r是一种离散性参数,它反映煤层内煤厚偏离平均厚度的大小,即 式中 为煤厚的标准差,即 这里 为煤层的平均值 , 为煤层内各钻孔的煤厚 , 为煤层内钻孔个数。 于是对于分类煤层集合 中任一对象 均对应一个分类特性指标四维向量: 分类煤层集合 中各煤层段的特性指标见表4.1:25表4.1 各煤层的特性指标26打开分类器输入样本属性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025《Young在春晚》招商方案-
- 医学资料档案管理制度
- 人教部编版四年级语文上册第16课《麻雀》精美课件
- 算法设计与分析 课件 5.3-动态规划-原理方法步骤
- 2024年西宁客运资格证培训资料
- 2024年盐城申请客运从业资格证理论考试题
- 2024年曲靖客运从业资格证培训考试资料
- 2024年孝感道路客运输从业资格证理论考题
- 吉首大学《建筑美学》2021-2022学年第一学期期末试卷
- 吉首大学《常微分方程》2021-2022学年第一学期期末试卷
- 医疗设备采购 投标技术方案 (技术方案)
- 《化学课程思政元素》
- 2024继续教育《医学科研诚信与医学了研究伦理》答案
- 门诊品管圈课件:提高门诊治疗患者健康教育的满意度
- 职业生涯报告六篇
- 作业本印制服务投标方案(技术标)
- 上虞净化工程施工方案范本
- 【语文】宁波市小学四年级上册期中试卷
- 辽宁省沈阳市铁西区2023-2024学年七年级上学期期中地理试题
- 环保设施安全风险评估报告
- 建设工程消防验收技术服务项目方案(技术标 )
评论
0/150
提交评论