版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、主要内容1、粗糙集理论基本概念2、粗糙集的应用第1页/共25页工作成绩粗糙集的相关基本概念 粗糙集理论由波兰科学家Z.Pawlak于1982年提出,它是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。第2页/共25页粗糙集的相关基本概念1.信息系统2.知识约简第3页/共25页粗糙集1.信息系统 定义1.1 信息系统是一个四元组 ,其中: (1) 是对象的非空有限集合,即 ,称为论域, 中的每个 称为一个对象; (2) 是属性的非空有限集合,即 , 中的每个 称为一个属性; (3) , 是属性的值域; (4) 称为信息函
2、数,它为每个对象关于每个属性赋予了一个信息值,且对于任意 ,有 。在不引起混淆的前提下,信息系统通常可简写为 。),(fVAUS U,21nxxxU,U)(nixiA,21naaaAA)(mjajaAaVV aVVAUf:AaUx,aVaxf),(),(AUS 第4页/共25页粗糙集1.信息系统 定义1.2 若 ,且 ,则 中全部等价关系的交集称为 上的不可分辨关系,记为: 且有RP PPP ),(),(,),()(qyfqxfPqUUyxPindPPindPind)()(,PHHPindxX)( 设 是 上的一个等价关系, 表示 的所有等价类,或 上的划分构成的集合, 表示包含元素 的 等价
3、类。 RURU /URUX RXR第5页/共25页粗糙集1.信息系统 定义1.3 设 为一知识表达系统, , 称为条件属性集, 称为决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。 ),(fVAUS DCDCA,CD条件属性条件属性决策属性决策属性患者头痛肌肉痛体温流感a是是正常否b是是高是c否否高是d否是很高否一个信息系统的例子第6页/共25页粗糙集1.信息系统 定义1.5 若 则 为 粗糙集。否则称 为 精确集。 XRXRXRXR 定义1.4 设 为一知识表达系统, ,一个等价关系 。称 为 关于 的下近似。称 为 关于 的上近似。),(fVAUS UXX且)(AindR/XY
4、RUYXR XR/XYRUYXRXR第7页/共25页粗糙集2.知识约简 定义2.1 设 为一个信息系统, ,如果 ,则称 在 中是不必要的,否则称是必要的。 ),(fVAUS Aa)()(AindaAindaA 定义2.2 设 为一个信息系统,如果 在 中都是必要的,则称属性集 是独立的,否则称是相关的。),(fVAUS AaAA 定理1 如果 是独立的, ,则 也是独立的。 AP AP第8页/共25页粗糙集2.知识约简 定义2.3 设 为一个信息系统, ,如果 是独立的,且 ,则称 是 的一个约简。),(fVAUS AP P)()(AindPindPA 定义2.4 设 为一个信息系统, 中所
5、有必要属性组成的集合称为属性集 的核,记为 。),(fVAUS AA)(Acore 定理2 ,其中 表示 的所有约简。)()(AredAcore)(AredA第9页/共25页粗糙集2.知识约简 定义2.5 设 为一个信息系统, 是非空属性集, , 为决策属性 相对于 的相对正域。),(fVDCAUSCDdCB,)(/)()(dindUXXBdposB dB 定义2.6 设 和 都是等价关系族,如果则称 是 上 可约去的;否则 是 上 不可约去的。 PQ)()()()(QindposQindposRpindPindPRPPQQR第10页/共25页粗糙集2.知识约简 定义2.7 如果 上的每一个等
6、价关系 都是 不可约去的,则 是 独立的或者 关于 是独立的。PPRQQQP 定义2.8 所有 中 不可约去的等价关系的集合称为 的 核,记为 。PQQP)(PcoreQ第11页/共25页粗糙集2.知识约简 定义2.9 设有信息系统 , 是记录 在属性 上的值, 表示分辨矩阵中第 行,第 列的元素, 被定义为:其中Sj)(xaxia)()(,)()(,)()(jijijiijxDxDxDxDxaxaAaCUnnji;, 2 , 1,ijCijC 定义2.10 区分函数是从分辨矩阵中构造的。约简算法的方法是先求 的每个属性的析取,然后再求所有 的合取。分辨矩阵是一个对称 矩阵。 在实际运用中,一
7、般只列出它的下三角阵 。nnijCijC第12页/共25页工作成绩粗糙集的应用 基于粗糙集的小型电子商务挖掘模型第13页/共25页粗糙集建立模型 数据挖掘的一般过程包括:数据采集、数据清洗、挖掘算法确定、数据挖掘、模式解释及知识评价。从理论研究到应用实现,设计的技术主要有分类技术、聚类技术、粗糙集技术、统计技术和关联技术等。这里,结合粗糙集建立如图所示的挖掘模型。 数据采集粗糙集数据清洗(预处理)粗糙集数据挖掘粗糙集规则提取解释模型得出结论第14页/共25页粗糙集数据清洗 下表是某电子商店的购物记录,P、Q、R、S代表四种商品;Customer No.为客户号;“Y”表示购买了某商品;“N”表
8、示没有购买某商品第15页/共25页粗糙集数据清洗条件属性条件属性决策属性决策属性Customer No.PQRSYYNNYYYYYYYYNYNNNNYNNYYYNNYYNYYY1t2t3t4t5t6t7t8t 根据粗糙集理论,论域 ,条件属性集 ,决策属性集 。,87654321ttttttttU,RQPC SD 第16页/共25页粗糙集数据清洗一、利用正域约简 计算正域:,)(864321ttttttDposC)(,)(864321)(DposttttttDposCPC)(,)(4321)(DposttttDposCQC)()()(DposDposCRC)(,)(41),(DposttDpo
9、sCQPC)()(),(DposDposCRPC)()(),(DposDposCRQC第17页/共25页粗糙集数据清洗二、利用区分矩阵约简 RPRQQRPQRQRPRPQPQPRPRRRQRRQQRQRQPRPQPRPRPRQPRPRR)()()()()()()(第18页/共25页粗糙集数据挖掘 因此, 的 约简为Q,R。经过粗糙集数据清洗得到下表CD条件属性条件属性决策属性决策属性Customer No.QRSYNNYYYYYYYNNNYNYYYNYYYYY1t2t3t4t5t6t7t8t第19页/共25页粗糙集规则提取 定义决策规则为: 其中, 为对等价类的描述。 定义规则 的确定性因子显
10、然 当 时, 是确定的; 当 时, 是不确定的jijiijYXYdesXdesr),()(:()desijrijijiXYXYX),(1),(0jiYX1),(jiYX1),(0jiYXijrijr第20页/共25页粗糙集规则提取 提取决策规则可以得到以下确定性规则: (购买Q)且(不购买R)(不购买S) (购买Q)且(购买R)(购买S) 不确定规则为: (不购买Q)且(购买R)(购买S) (不购买Q)且(购买R)(不购买S) 5 . 0)(SRQ,买买不买5 . 0)(SRQ,不买买不买第21页/共25页粗糙集 经过挖掘可得到大量的模式和规则,需对规则作进一步的筛选、合并。上述例子经合并后最终得到两条确定性规则。 对于不确定规则,可作参考或直接删除均可。 基于上述规则,可作决策:在电子商店中,可将商品P,Q,R按顺序相邻摆放在一起,可提高销售。 知识评价第22页/共25页粗糙集 通过以上分析,所建立的基于粗糙集的小型电子商务
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度卫星遥感数据服务与应用合同4篇
- 二零二四年度环保技术研发与成果转化合同2篇
- 2024年兼职招聘平台服务合同3篇
- 2024年度软装样品房制作合同3篇
- 2024年度特许经营合同(餐饮)
- 二零二四年度建筑施工质量保修合同2篇
- 2024年住房租赁押金贷款合同2篇
- 2024年度融资租赁合同:租赁公司为甲方提供设备的融资租赁服务条款3篇
- 二零二四年度水利工程合同:洒水车水利租赁合同(2024版)3篇
- 2024版二人股东合作合同样本
- 6人小品《没有学习的人不伤心》台词完整版
- 收音机FM指标测试方法3页
- 兽药大鼠传统致畸试验指导原则
- 英格索兰空压机控制器操作说明书
- 苏州商业市场市调简析报告
- 论现代企业人力资源管理中激励机制的应用以腾讯公司为例
- CRRT治疗剂量的计算
- 量子力学公式
- (完整)风景园林概论知识点,推荐文档
- 小学语文课标目标解读PPT学习教案
- 烟草专卖局(公司)员工考核管理办法
评论
0/150
提交评论