




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模糊数学在数据挖掘中的应用研究作者:JSJ(浙江工业大学之江学院 信息与计算科学1202)摘要:二十世纪六十年代,产生了模糊数学这门新兴学科。模糊数学作为一个新兴的数学分支,使过去那些与数学毫不相关或关系不大的学科(如生物学、心理学、语言学、社会科学等)都有可能用定量化和数学化加以描述和处理,从而显示了强大的生命力和渗透力,使数学的应用范围大大扩展。模糊数学自身的理论研究进展迅速;模糊数学目前在自动控制技术领域仍然得到最广泛的应用,并在计算机仿真技术、多媒体辨识等领域的应用取得突破性进展;模糊聚类分析理论和模糊综合评判原理等更多地被应用于经济管理、环境科学以及医药、生物、农业、文体等领域,并取
2、得很好效果。关键词:模糊聚类分析 模糊数学 应用1.引言:模糊数学是运用数学方法研究和处理模糊性现象的一门数学新分支。它以“模糊集合”论为基础。它提供了一种处理不肯定性和不精确性问题的新方法,是描述人脑思维处理模糊信息的有力工具。 模糊数学由美国控制论专家L.A.扎德(L.A.Zadeh,1921-)教授所创立。他于1965年发表了题为模糊集合论(FuzzySets)的论文,从而宣告模糊数学的诞生。L.A.扎德教授提出了“模糊集合论”。在此基础上,现在已形成一个模糊数学体系。 模糊数学产生的直接动力,与系统科学的发展有着密切的关系。在多变量、非线性、时变的大系统
3、中,复杂性与精确性形成了尖锐的矛盾,它给描述模糊系统提供了有力的工具。L.A.扎德教授于1975年所发表的长篇连载论著语言变量的概念及其在近似推理中的应用,提出了语言变量的概念并探索了它的含义。模糊语言的概念是模糊集合理论中最重要的发展之一,语言变量的概念是模糊语言理论的重要方面。语言概率及其计算、模糊逻辑及近似推理则可以当作语言变量的应用来处理。人类语言表达主客观模糊性的能力特别引人注目,或许从研究模糊语言入手就能把握住主客观的模糊性、找出处理这些模糊性的方法。有人预言,这一理论和方法将对控制理论、人工智能等作出重要贡献。模糊数学诞生至今仅有22年历史,然而它发展迅速、应用广泛。它涉及纯粹数
4、学、应用数学、自然科学、人文科学和管理科学等方面。在图象识别、人工智能、自动控制、信息处理、经济学、心理学、社会学、生态学、语言学、管理科学、医疗诊断、哲学研究等领域中,都得到广泛应用。把模糊数学理论应用于决策研究,形成了模糊决策技术。只要经过仔细深入研究就会发现,在多数情况下,决策目标与约束条件均带有一定的模糊性,对复杂大系统的决策过程尤其是如此。在这种情况下,运用模糊决策技术,会显得更加自然,也将会获得更加良好的效果。 2.理论基础:一、模糊数学基本概念:1.模糊集(Fuzzy set)定义1 (1)设X是论域,称映射A:X0,1为X上的模糊集合(Fuzzy set)简称F集,记
5、为A。称A(x)为元素x相对于F集的隶属度。称A(·)为F集A的隶属函数。(2)模糊集合的运算:,并集:,交集:,补集:,2.幂集定义2 称论域X上的F集的全体集合为X上的F-幂集。3.模糊集的-截集定义3已知U上模糊子集对,则称为模糊集的-截集;称为模糊集的-强截集;称为、的置信水平或阈值。4. 三角范数、反三角范数定义4称二元函数T:0,1*0,1à0,1为三角模或三角范数,简称T-范数,满足以下条件:若a,b,c,d0,1,有:交换律:T(a,b)=T(b,a)结合律:T(T(a,b),c)=T(a,T(b,c)单调性:ac,bd时,T(a,b) T(c,d)边界条件
6、:T(a,1)=a,T(0,a)=0二、模糊数学的基本定理:1. 模糊截积定义5已知U上模糊子集,对,也是U上模糊集,其隶属函数为:;称为为与的模糊截积。2. 分解定理1已知模糊子集,则。推论1:对。3. 分解定理2已知模糊子集,则。推论2:对。三、模糊关系:1.模糊关系与模糊关系的合成(1)模糊关系定义6从U到V 上的一个模糊关系:,表示具有的关系程度,。(满足01)称为U到V 上的一个模糊关系的模糊矩阵。模糊关系性质:xU,有R(x, x) = 0,则R满足反自反性;x,yU,xy,有R(x, y)= R(y, x),则R具有对称性;x,yU,有R(x, y)=R(y, x) = 0,则R
7、具有反对称性;(x,y),(x,z),(y,z) U×V,有R(x, z)(R(x,y)R(y, z),则R满足传递性。1)F相似关系:设R是论域U×V上的模糊关系,若R满足自反性和对称性,称R为模糊相似关系。2)F等价关系:若R满足自反性、对称性和传递性,称R为模糊等价关系。(2 )F集的内积与外积定义7 设论域为X,A,BF(X),称为F集A与B的内积;称为F集A与B的外积。(3 )格贴近度定义8 设论域为X,A,BF(X),称(A·B) ()()为格贴近度。2.模糊等价矩阵及其矩阵定义9设方阵为以模糊矩阵,若满足=则称为模糊等价矩阵。模糊等价矩阵可以反映模糊
8、分类关系的传递性,即描述诸如“甲像乙,乙像丙,则甲像丙”这样的关系。设为一个模糊等价阵,01为一个给定的数,令 则称矩阵为的截阵。例如,为一个模糊等价阵,取0.4<,则=;若取,则=。3.模糊聚类分析的在数据挖掘的应用实例:一.问题的提出:设某地区设置有11个雨量站,其分布图见图5-1,10年来各雨量站所测得的年降雨量列入表5-1中。现因经费问题,希望撤销几个雨量站,问撤销那些雨量站,而不会太多的减少降雨信息?图5-1表5-1年降雨量列入年序号1276324159413292258311303175243320225128734934431045428545140230747031924
9、3329056347950222122032041123242462322432812673102733152853273525291311502388330410352267603290292646615822417816420350232024027835072583274324013613813014134021994218453365357452384420482228360316252915827141030828341020117943034218510324406235520442520358343251282371应该撤销那些雨量站,涉及雨量站的分布,地形,地貌,人员,设备等众
10、多因素。我们仅考虑尽可能地减少降雨信息问题。一个自然的想法是就10年来各雨量站所获得的降雨信息之间的相似性,对全部雨量站进行分类,撤去“同类”(所获降雨信息十分相似)的雨量站中“多余”的站。二.问题求解 :假设为使问题简化,特作如下假设(1)每个观测站具有同等规模及仪器设备;(2)每个观测站的经费开支均等;具有相同的被裁可能性。分析:对上述撤销观测站的问题用基于模糊等价矩阵的模糊聚类方法进行分析,原始数据如上。三.求解步骤:1.利用相关系数法,构造模糊相似关系矩阵,其中 其中,1,2,,11, ,1,2,,11。用C#语言编程计算出模糊相似关系矩阵,得到模糊相似矩阵。R=对这个模糊相似矩阵用平
11、方法作传递闭包运算,求 即t()=。注:是对称矩阵,故只写出它的下三角矩阵。取,则=故第二行(列),第四行(列)完全一致,故同属一类,所以此时可以将观测站分为9类,,,,,,这表明,若只裁减一个观测站,可以裁中的一个。若要裁掉更多的观测站,则要降低置信水平,对不同的作同样分析,得到0.995时,可分为8类,即,,,,,,;=0.994时,可分为7类,,, ,,,;=0.962时,可分为6类,,, ,, ,;0.719时,可分为5类,,, ,,,;图5-2聚类谱系图再具体分析图5-1,我们可以看到虽然和,分为一类,但和,观测点相距较远,撤去是不太合适的,保留而撤去,就更不合适了。因此还是将其分为
12、6类,即,, ,,,依据每类最少保留一个站的原则,最多可撤去5个站。实际应该撤去哪几个站就应该依据其他条件来确定了。由本例可以看出,当需要比较聚类的数据较多时,一般采用模糊聚类法进行分析,在分析过程中,复杂的数据运算都可以在计算机上实现,从而减少繁琐的手工操作。4.模糊聚类分析的优缺点:优点:聚类分析模型的优点就是直观,结论形式简明。缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。5.总 结:本文主要介绍了模糊数学的基本概念和模糊聚类的一些基础知识方法,并给出了实例分析,体现了模糊数学思想在数据挖掘领域的重要角色。 通过学习模糊数学这门课程,掌握了模糊数学的基本知识和思想,获益匪浅。模糊数学的思想和自己所修方向(信计与计算科学)的结合,不失为一种解决该领域的难题的行之有效的方法。如果我在研究的领域遇见相关的问题,我们便可以结合模糊的思想,借助于模糊集、粗糙集等理论知识来深化研究。同时彰显模糊数学的魅力,以及交叉学科相互渗透解决难题能力。参考文献: 1.宋晓秋.模糊数学原理与方法(第二版).中国矿业大学出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动合同转让合同
- 大型石材采购合同协议
- 液化气购销合同细则
- 财务管理咨询服务合同例文
- 校园安保人员服务合同
- 重型起重机采购合同
- 工业机器人习题库含答案
- 水利工程劳务分包:合同范本大全
- 电商产品代理销售合同
- 练摊经济学课件
- 肩肘倒立公开课教案陈勇
- JJF 1603-2016(0.1~2.5)THz太赫兹光谱仪校准规范
- 《民法典》-第二编 物权编-案例分析,解读-3
- GB/T 1266-2006化学试剂氯化钠
- 海岸动力学全册配套完整课件
- 工作面防飞矸封闭式管理规定
- 纤维素酶活性的测定
- 干部人事档案管理岗位培训的讲义课件
- 验电接地环安装规范
- 计算机监控系统安装单元工程质量验收评定表
- 外墙干挂大理石施工方案(标准版)
评论
0/150
提交评论