




已阅读5页,还剩52页未读, 继续免费阅读
(应用数学专业论文)基于粗集理论的投资决策模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 本文应用粗集理论分别从管理者和投资者角度建立了投资决策的模型。 一方面从投资行业的管理者角度出发,研究了投资行业的客户关系管理决策 模型,并结合风险较高、竞争较为激烈的保险投资业建立了实例模型。文中应用 新型数据处理工具相集理论来实现数据的分类、简化、规则提取。粗糙集理 论处理数据时不需要了解数据的先验信息,而粗集的这一优点适用于现代投资行 业对处理数据的客观性的要求。因为随着信息技术的飞速发展,经济的快速增长, 国内国际竞争日趋激烈,投资行业中客户的高速流动、流失、客户生命周期的缩 短等问题日趋严重,客户的不确定性、模糊性特点显著增强,无法找到有价值或 价值长久的先验信息。基于粗集的数据挖掘技术可以帮助投资行业管理客户生命 周期的各个阶段;挖掘数据间的内在规律,得到数据的最简规则表达;帮助行业 确定客户盼特点,进而能为客户提供针对性的服务:数据挖掘能够将客户按不同 的属性分成不同的类型,行业因此就可以按不同类型的客户提供不同的服务。通 过c r m 的数据挖掘不仅为投资行业提供客户的管理决策,实现客户资源的有效管 理,真正实现以“客户为中心”,提高客户的满意度。根据客户属性特征和决策 规则我们可以发现新客户、保持老客户、服务好大客户,从而为行业的中长期发 展提供战略决策。同时,c 跚的数据挖掘也为投资者提供投资决策,投资者可以 从数据的挖掘结果归类自己的所属群体,进而决定投资决策。 另外一方面从投资主体出发投资者的角度,研究了投资目标选取的决策 模型,并建立了证券组合投资决策实例模型。在此模型中运用了两种不同的处理 模糊和不确定性数学工具相集理论和模糊集理论。粗集理论处理数据具有很 强的客观性,模糊集理论通过模糊综合评价可以将不确定性的知识得到量化结 果。文中将两者处理数据的优点有机结合起来处理不完全、不确定性知识。从组 合投资决策分析角度和投资者的决策规则出发,应用粗糙集理论,对不确定性证 券组合投资风险决策的信息系统进行知识约简和对各风险因素权重分析、挖掘数 据间的相互关系,得出各评价指标的客观权重,从系统数据中发现隐含知识和进 行数据挖掘,并结合模糊综合评价的数学工具对投资决策进行综合评价,从而提 摘 要 高投资者的风险决策和判断能力。在投资决策量化方面做了一些尝试和探讨。通 过实践结果表明文中所建模型是可行的和有效性的,对投资者有效地规避风险, 提高投资决策能力具有现实指导意义。 本文两个模型的研究即相互区别,又相互联系。随着市场经济的飞速发展, 产业结构的立体化、投资主体的多元化进程加快。对于一个投资行业来说不仅是 投资客体的管理者,同时也是其他行业的投资者。所以作为投资行业的客户关系 管理决策和作为投资主体的投资目标的选取决策都是整个行业的重要决策问题。 本文希望通过两方面模型的研究,为投资决策研究和数据挖掘技术做些尝试和探 讨。 关键词:粗集理论,知识约简,规则挖掘,c p a i ( 客户关系管理) ,投资决策, 模糊综合评价 a b s t r a d a bs t r a c t i nt h i st h e s i s ,t w oi n t e r a c t i v em o d e l sw e r ep r e s e n t e dt oa d d r e s s i n v e s t m e n td e c i s i o n - m a k i n g f i r s t ,s t a r t i n gf r o mt h es t a n d p o i n to ft h er o l eo fam a n a g e r i n i n v e s t m e n ti n d u s t r y ,ag e n e r a ld e c i s i o nm o d e lw a sp r o p o s e df o rc u s t o m e r r e l a t i o n s h i pm a n a g e m e n t ( c r m ) t h e na ne x a m p l e w a sg i v e nf o rt h e i n s u r a n c ei n d u s t r yw h e r er i s k sa n dc o m p e t i t i o n sa r eh i g h an e wd a t a p r o c e s s i n gt o o l ,r o u g hs e tt h e o r y ,w a su s e dt oc l a s s i f y ,s i m p l i f ya n d e x t r a c tt h ed a t a a na d v a n t a g eo fr o u g hs e tt h e o r yi si td o e sn o tr e q u i r e f u l lu n d e r s t a n d i n ga n dp r o o fo ft h ed a t a ,w h i c hi sb e c o m i n gv e r y i m p o r t a n tf o rm o d e r n i n v e s t m e n t i n d u s t r i e ss i n c et h e r ea r em a n y u n c e r t a i n t i e si nt h ec u s t o m e r si nt h i se v e r c h a n g i n gs o c i e t y t h ed a t a m i n i n gt e c h n i q u eb a s e do nr o u g hs e t sc o u l dh e l ps e r v et h ec u s t o m e r si n t h e i re a c h “l i f e ”p h a s e s , r e v e a lg e n e r a l i z a t i o n s ,a n do b t a i nt h e s i m p l e s t d a t ae x p r e s s i o n m e a n s : i tc o u l da l s o h e l pi d e n t i f y c h a r a c t e r i s t i c so fc u s t o m e r s a n di m p r o v es e r v i c e so nap e r s o n a lb a s i s t h u s ,u n d e rt h ea i do fd a t a - m i n i n gt e c h n i q u e ,t h ec r md e c i s i o nm o d e l c o u l dn o to n l yp r o v i d ee f f e c t i v em a n a g e m e n tf o rc u s t o m e r s ,b u ta l s o r e a l i z ee f f i c i e n tc u s t o m e r - c e n t e r e d s e r v i c e s ,i m p r o v e c u s t o m e r s a t i s f a c t i o nd e g r e e ,a n dd e v e l o pn e wc u s t o m e r s m e a n w h i l e ,i tc o u l db e u s e f u lf o ri n v e s t m e n td e c is i o n - n m k i n g 一o nt h eo t h e rh a n d , ap o r t f o l i oi n v e s t m e n td e c i s i o n m o d e lw a s e s t a b l i s h e df o rt h ep u r p o s eo fc h o o s i n gp o t e n t i a li n v e s t m e n tp a r t n e r s i nt h i sm o d e l ,t w om a t h e m a t i c a lt o o l s ,r o u g hs e t sa n df u z z yt h e o r i e sa r e c o m b i n e dt oa d d r e s si n c o m p l e t ea n du n c e r t a i nd a t as y s t e i r o u g hs e t t h e o r yi si m p o r t a n ti nr e t a i n i n gd a t ao b j e c t i v i t ya n df u z z ys e tt h e o r y i sa _ b l et oo b t a i nq u a n t i t a t i v er e s u l t sf r o mu n c e r t a i n t i e s b a s e do n g e n e r a lp o r t f o l i oi n v e s t m e n td e c i s i o n - m a k i n gr u l e s ,r o u g hs e tt h e o r yw a s a p p l i e d t om a k e k n o w l e d g e r e d u c t i o no nt h eu n c e r t a i np o r t f o l i o i n v e s t m e n tr i s kd e c i s i o ni n f o r m a t i o ns y s t e m ,t oa n a l y z et h ew e i g h to f v a r i o u sr i s ki n d e x e sa n dt oe x p l o r er e l e v a n c yi nt h ed a t as t u d i e d a s ar e s u l t ,e a c hw e i g h to fe v a l u a t i o ni n d e x e sc o u l db eo b t a i n e d f u z z y c o m p r e h e n s i v ee v a l u a t i o nm e t h o dw a sf i n a l l ya p p l i e dt oe v a l u a t et h e i n v e s t m e n t d e c i s i o nm o d e l t h ep r e s e n tm e t h o dp r o v e de f f e c t i v ei n p r a c t i c ea n dp r o v i d e sau s e f u lt o o lf o ri n v e s t o r st oe v a d er i s k si n d e c i s i o n - m a k i n g t h et w om o d e l ss t u d i e dh e r e d i f f e r f r o m e a c ho t h e ra n dy e ta r e i n t e r l o c k i n g w i t ht h er a p i dd e v e l o p m e n to f m a r k e te c o n o m y ,t h e p r o c e s s e st o w a r dm u l t i - s t r u c t u r e di n d u s t r i a l i z a t i o na n dm u l t i - r o l e d i n v e s t m e n te n t i t i e sa r ed e e p e n e d f o ri n s t a n c e ,a ni n v e s t m e n ti n d u s t r y a c t sn o to n l ya st h em a n a g e ri t s e l f ,b u ta l s oa ni n v e s t o ro fo t h e r i n d u s t r i e s t h u s ,i na ni n v e s t m e n ti n d u s t r y ,b o t hc u s t o m e rr e l a t i o n s h i p m a n a g e m e n tp o l i c ya n di n v e s t m e n to r i e n t a t i o np o l i c ya r eb e c o m i n g i m p o r t a n t t h ep r e s e n tw o r ki si na na t t e m p tt op r o v i d ew o r k a b l em o d e l s f o ri n v e s t m e n td e c i s i o n - m a k i n ga n dd a t am i n i n gp r o c e s s e s k e yw o r d s :r o u i g hs e tt h e o r y ,k n o w l e d g er e d u c t i o n ,r u l em i n i n g ,c u s t o m e r r e l a t i o n s h i pm a n a g e m e n t ( c r m ) ,i n v e s t m e n td e c i s i o n - m a k i n g , f u z z yc o m p r e h e n s i v ee v a l u a t i o n i v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得或其他教育机构 的学位或证书而使) 1 1 过的材料。与我一同x - 作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意。 学位论文作者戮叫聱子签字魄砷年仁月巧日 学位论文版权使用授权书 本学位论文作者完全了解有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权可以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:驯筝争 签字日期:矽7 年严月2 歹日 工作单位: 通讯地址: 导师签名:7 互华乏 签字日期:矿叼年叶月万日 电话: 邮编: 第一章 绪论 第一章绪论 1 1 本文研究的背景、目的和意义 风险投资是现代高新技术产业必不可少的金融支柱,是调整产业结构和产品 结构、优化资源配置的基本途径,是投资者实现经济利益的重要手段。随着现代 经济的飞速发展和市场体制的不断完善,产业结构的立体化、投资主体的多元化 进程加快,对于每个投资行业来说不仅是投资客体的管理者,同时也是其他行业 的投资者。投资决策和管理决策的不同选择,投资者所承担的投资风险和所获取 的投资收益也将有所不同。所以管理决策和投资目标的选择决策的合理性、科学 性是成功投资的重要保证,是投资行为的前提条件。本文针对现代三大金融支柱 的保险业和证券业的管理决策和投资决策问题进行了研究并建立了相关模型。 管理就是决策,管理的核心就是决策“1 。随着信息技术的飞速发展、经济的 快速增长、国内国际竞争日趋激烈,买方市场的形成,投资行业中客户的高速流 动、流失、客户生命周期的缩短等问题日趋严重。对客户的争夺,赢得客户,争 取和维系客户,c r m ( 客户关系管理) 是现代投资行业长远发展的战略关键。本 文通过粗集数据挖掘技术帮助投资行业管理客户生命周期的各个阶段。利用粗集 理论不仅可以从大量的客户数据中,挖掘出潜在的,有价值的知识,对海量数据 进化简化;而且还可以挖掘数据间的内在规律,得到数据的最简规则表达;帮助 行业确定客户的特点,为客户提供针对性的服务;数据挖掘能够将客户按不同的 属性分成不同的类型,行业因此就可以按不同类型的客户提供不同的服务从而达 到提高客户的满意度,使追求客户满意度成为企业经营管理的主旋律;利用c 跚 系统,投资企业能够收集、追踪和分析客户信息,能够帮助管理者关注客户,掌 握客户需求,观察、分析客户行为对企业收益的影响,使企业收益及企业与客户 的关系都得到最优化,有效地保持老客户、争取新客户、让客户创造更多的利润。 通过c r m 的数据挖掘,挖掘客户规则,可以给管理者提供具体的决策行为指导行 业的市场行为,为投资行业的中长期发展提供战略性、决策性的技术支持进而实 现最大利润。为此投资行业才能在激烈竞争的环境下寻找生存,追求发展。所以 建立并维持与客户的关系已成为现代投资行业在商业竞争中获取优势地位的重 要基础,同时也具有重大意义。 安徽大学硕士学位论文 基于粗集理论的投资决策模型研究 本文的另外一部分研究是通过运用粗糙集理论在处理不完整和不确定性知 识方面的优点,对投资者的投资目标的选择决策进行研究。对目前投资种类繁多, 风险各异,投资者如何选择投资目标、如何规避风险、在风险等同的条件下如何 确定收益最大的投资品种,文中从投资者的角度建立了证券组合投资决策实例模 型。在此模型中运用了两种不同的处理模糊和不确定性数学工具粗集理论和 模糊集理论。粗集理论处理数据具有很强的客观性;模糊集理论通过模糊综合评 价可以将不确定性的知识得到量化结果。文中将两者处理数据的优点有机结合起 来处理不完全、不确定性知识。从组合投资决策分析角度和投资者的决策规则出 发,应用粗糙集理论,对不确定性证券组合投资风险决策的信息系统进行知识约 简和对各风险因素权重分析、挖掘数据间的相互关系,得出各评价指标的客观权 重,从系统数据中发现隐含知识,对投资决策进行数据挖掘,并结合模糊综合评 价的数学工具对投资决策进行综合评价,从而提高投资者的风险决策和判断能 力。在投资决策量化方面做了一些尝试和探索。通过实践结果表明文中所建模型 是可行且有效性的,对投资者有效地规避风险,提高投资决策能力具有现实指导 意义。 1 2 粗糙集理论的特点和研究现状 1 2 1 粗糙集理论的特点 r o u g h 集是一种新的处理模糊和不确定性知识的数学工具,是由波兰数学家 z p a w l a k 于1 9 8 2 年提出的。”,其主要思想是在保持分类能力不变的前提下, 通过知识约简,删除其中冗余或不重要的知识信息,导出问题的决策或分类规则, 达到提高对有效数据的处理分析的速度和准确度。具有以下几个鲜明特点: ( 1 ) 具有很强的客观性 用粗集处理不确定信息不需要提供任何先验知识,具有很强的客观性,从信 息库本身就可以挖掘数据之间的联系,如权重系数,粗糙隶属函数等,而其他处 理不确定信息的理论工具如模糊集和概率统计方法等都需要提供一些数据以外 的附加信息或先验知识,具有一定的主观性。 ( 2 ) 具有很强的数据挖掘处理能力 粗集能表达和处理不完备信息;通过知识约简,在能保留关键信息的前提下 2 第一章绪论 对海量数据进行挖掘得到知识的最小表达;能识别评估数据之间的依赖关系、权 重系数;能得到易于证实的决策规则。 ( 3 )具有很强的相容性 粗糙集不仅能独立的处理数据,而且能够和其他理论和处理工具相容,相互 集成,彼此互补。如与模糊集的集成;与人工神经网络的集成;另外与证据理论 也有一定交叠性。在实际中越来越得到广泛的应用。 1 2 2 粗糙集理论的研究现状 1 9 9 1 年,p a w l a k 出版了专著r o u g hs e t s - - t h e o r e t i c a la s p e c t so f r e a s o n i n ga b o u td a t a ,对粗集理论的研究进行了全面的总结,标志着粗集理论 的研究和应用进入了一个新阶段。从1 9 9 2 年开始,每年都召开以粗集为主题的 国际会议,推动了粗集理论的研究和应用。我国从9 4 年开始了对粗集理论的研 究,目前主要集中在对它的数学性质、算法研究、应用研究等。如今在我国也相 继出版了有关粗集理论及应用的著作,如刘清先生的( r o u g h 集及r o u g h 推理, 张文修先生等的粗糙集理论与方法以及0 6 年史开泉先生的s 一粗集与粗决 策对粗系统理论进行了拓展和创新,动态s 一粗集的提出,给粗集对动态数据 的挖掘研究提供了理论依据和新的研究思想。目前,粗糙集已被成功应用于机器 学习、知识获取、数据挖掘、决策分析、专家系统、归纳推理、模式识别和智能 控制等诸多领域睁。已成为信息处理技术的一个新的学术热点,引起人们越来 越多的关注,并在许多领域得到了成功的应用。 1 3 本文的主要研究内容及创新点 本文针对粗糙集理论处理数据的客观性、相容性及强大的数据挖掘能力等处 理不确定性问题的优点,分别研究了投资行业的客户关系管理决策模型和投资目 标选取的证券组合投资决策模型。具体完成了以下理论方法及应用研究。 第一章,阐述了本文研究的背景、目的和意义,粗集理论的主要特点和研究 现状以及本文的主要研究内容及创新点。 第二章,研究了租糙集理论的知识表达系统、知识的依赖性、属性的重要性、 知识约简等基本概念和基本理论。详细研究了基于粗集理论决策系统的属性约简 和决策规则提取。 安徽大学硕士学位论文基于粗集理论的投资决策模型研究 第三章和第四章是本文的重点,是本文的主要应用研究。 第三章,主要研究了投资行业的客户关系管理决策模型。首先介绍了c r m 概 念及c r m 在投资行业中的重要性及意义、c 列国内外研究现状和粗集理论与投资 行业中的c r m 数据挖掘。最后结合风险较高、竞争较为激烈的保险投资业建立了 实例模型,在模型中用粗集理论来实现数据的分类、简化、规则提取,通过c r m 的数据挖掘不仅为投资行业提供客户的管理决策,实现客户资源的有效管理,真 正实现以“客户为中心”,提高客户的满意度,改善客户关系,从而提高企业盈 利,达到最大的长期价值。同时,c r m 的数据挖掘也为投资者提供投资决策,投 资者可以从数据的挖掘结果归类自己的所属群体,进而决定投资决策。 第四章,主要研究了投资目标选取的决策模型。在此模型中运用了两种不同 的处理模糊和不确定性数学工具相集理论和模糊集理论。粗集理论处理数据 具有很强的客观性,模糊集理论通过模糊综合评价可以将不确定性的知识得到量 化结果。文中将两者处理数据的优点有机结合起来处理不完全、不确定性知识。 首先介绍了模糊集基本知识、模糊综合评价方法、证券组合投资的决策及决策过 程、风险因素,最后建立了证券组合投资决策实例模型。通过模型的研究得到了 投资决策的量化结果,对投资者有效地规避风险,提高投资者的风险决策和判断 能力具有现实指导意义。 本文的创新点在以下方面: 本文将粗集理论的数据挖掘成功应用到投资行业的客户关系管理决策,并结 合风险较高、竞争较为激烈的保险投资业建立了实例模型,建立了基于粗集理论 的保险投资行业中的c r m 数据的知识表达系统并进行有效的决策规则提取。 建立了基于粗集理论的关于投资目标选取的证券组合投资决策模型。综合应 用了粗集理论和模糊集理论,将两者处理模糊和不确定性数据的优点有机结合在 一起,为不同数学工具的相容交叉应用问题以及决策分析方法的集成问题进行了 尝试和探讨。 文中解决了模糊综合评价中因素权重系数的主观化问题,从数据系统的本身 出发得到了各因素的权重系数,大大增强了量化评价的客观性和科学性。 4 第二章粗糙集理论的基本知识 第二章粗糙集理论的基本知识 2 1 基本概念 2 1 1 知识发现、知识表达系统及决策表 ( 1 )知识发现 知识是人类通过实践认识客观世界的规律,是对现实世界客观个体的描述, 是通过对信息加工处理、解释、挑选和改造而形成的。知识发现( k n o w l e d g e d i s c o v e r yi nd a t a b a s e ,l ( d d ) 的过程也是人类对客观世界认知的过程。目前, 知识发现已逐渐兴起一个应用研究领域。知识发现的过程包括以下几个阶段:数 据准备,数据挖掘和知识评价,其中数据准备阶段可分为数据选取、数据预处理 和数据转换。数据挖掘则是知识发现的主要阶段,对数据要按照一定的目标和任 务进行分类、约简、聚类总结、规则挖掘,从数据提取用户所需要的知识。知识 评价则是将发现的知识以用户能够理解的方式呈现给用户。 ( 2 ) 知识表达系统及决策表n 幻 知识表达系统,是由所研究的对象组成,对象的信息是通过指定对象的基本 特征即属性和它们的特征值即属性值来描述的,表示为: s = ( u ,a ,v ,f ) : 其中,u :对象的非空有限集合,称为论域; a :属性的非空有限集合; v _ u 圪,v i 是属性a 的值域; * f :u x a - + v 是一个信息函数,它为每个对象的每个属性赋予一个信息 值,。b p v a e a ,x e u ,f ( x 。8 ) e v 知识表达系统也称为信息系统。通常也用s = ( u ,a ) 来代替s = ( u ,a ,v , f ) 知识表达系统的数据以关系的形式表示。关系表的行对应要研究的对象,每 行表示系统的一条信息,列对应对象的属性,对象的信息是通过指定对象的各属 性值来表达。在信息系统中,一个属性对应一个等价关系,一个表可以看作是定 义的一族等价关系,即知识库。 5 安教大学硕士学位论文基于粗集理论的投资决策模型研究 信息系统s = ( u ,a ,v ,f ) ,当a = c u d ,c n d = 中,c 称为条件属性集,d 称 为决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。 2 1 2 知识的依赖性、属性的重要性n 2 1 及权重n 3 1 在决策表,各个属性的重要性是不一样的,要找出某些属性或属性集的重要 性,通常采用从决策表中去掉一些属性,然后再分析没有这些属性后分类有什么 变化,若去掉该属性后分类变化较大,则说明该属性的重要性高,否则,则说明 该属性的重要性较低。 因此,引入决策表中属性的重要性定义: 设知识的依赖度为k ,属性的重要度为6 ,知识库s = ( u ,a ,v ,f ),且p ,q 量r , r 为u 上的等价类,当k ( q ) = i p o s ,( q ) i ju i 时,称知识q 是k ( o k 1 ) 度依 赖于知识p 的,记作p 内其中帕( q ) 是q 和p 间的依赖度,p o s ,( q ) 为o 的p 正 域。a = c u d ,c n d = o ,属性a 仨c 关于决策d 的重要性定义为岛( a ) = 托( d ) 一 t c - i ( d ) 。 对于每一个属性的重要性进行归一化处理,就可以得到属性的权重,定义属 月 性c t e c 权重w c t ,w c i _ 南( c - ) d ( c ,) 。 7 j = 1 2 1 3 上近似、下近似及正域1 2 3 ( 1 )不可区分关系 不可区分关系( i n d i s c e r n i b i l i t y ) ,若p e a ,且p o ,p 中所有等价类的交n p 也是一个等价关系,称为p 上的不可区分关系,记为i n d ( p ) 。若a 是u 上的一 个等价类,u i n d ( a ) ( 或有u a 代替) 表示a 的所有等价类( 或是u 的一个分类) 构 成的集合, x 表示包含元素x a u 的a 等价类。一个知识库( 信息系统) 就是一 个关系系统k _ ( u ,a ) 。 ( 2 ) 上近似、下近似及正域 知识库k ( u ,r ) ,对于每个子集) 畦u 和一个等价关系r i n d ( k ) x 的r 下近似集;r _ x = u y u rly x ) , 6 第二章粗糙集理论的基本知识 x 的r 上近似集r x - u y u rly n x m ) , 集合b n r ( x ) = r x - 星x 称x 的r 边界域; p o s ( x ) = 墨x 称为x 的r 正域; n e g n ( x ) = u - r x 称为x 的r 负域。 2 1 - 4 约简和核1 2 1 ( 1 )必要和不必要属性 r 为一族等价关系,r e r ,如果:i n d ( r ) = i n d ( r - 研) ,则称亓为r 中不必要 的;否则称厅为r 中必要的。如果每一个艇r 都为r 中必要的,则称r 为独立 的;否则称r 为依赖的。 ( 2 )约简和核及相互关系 设q p ,如果q 是独立的,且i n d ( q ) = i n d ( p ) ,则称9 为p 的一个约简。 p 中所有必要关系组成的集合称为p 的核,记作c o r e ( p ) 。 有关核与约简的关系定理:所有约简的交为核,即: 定理2 1 :c o r e ( p ) = n r e d ( p ) ,其中r e d ( p ) 表示p 的所有约简。 核的用处有两个方面:第一它可以作为所有约简的计算基础,因为核包含在 所有的约简之中,并且可以直接按定义进行计算;第二可以得到在知识约简中核 是不能消去的知识特征集合。 ( 3 )知识的相对约简和相对核 相对约简和相对核主要是描述在知识系统中一个分类相对于另一个分类的 重要性 首先介绍一个分类相对于另一个分类的正域: 令p 和9 为u 中的等价关系,q 的p 正域记为p o s ,( q ) ,则 p o s p ( q ) = u p ( x ) ( x e u 口, q 的p 正域是u 中所有根据分类u p 的信息可以准确地划分到关系q 的等价 类中去的对象集合。 当p 和o 为等价关系族时,r p ,如果 安徽大学硕士学位论文 基于粗集理论的投资决策模型研究 p o s 。- _ d 伊) ( i n d ( q ) ) = p o s 。j i d 一眼( i n d ( q ) ) 则称r 为p 中q 不必要的,否则r 为p 中q 必要的。 一般我们用p o s 一( q ) 代替p o s 。p ) ( i n d ( q ) ) ,如果p 中的每个r 都为q 必要的, 则称p 为q 独立的( 或p 相对于q 独立) 。 设s o p ,s 为p 的q 约简当且仅当s 是p 的q 独立子族且p o s 。( q ) = p o s ,( q ) ,p 的q 约简称为相对约简。 p 中所有q 必要的原始关系构成的集合称为p 的q 核,简称为相对核。记为 c o r e 口( p ) 相对核和相对约简有以下: 定理2 2 :c o r e o ( p ) = f l r e d ( p ) ,其中r e c i o ( p ) 是所有p 的q 约简构成的集合。 2 2 决策表的属性约简 2 2 1 决策表及其相容性 决策表中的决策规则可分为相容决策规则和不相容决策规则,对于决策表来 说,只有当决策表的所有决策规则都是相容的,则称该决策表是相容的,否则, 该决策表是不相容的。关于决策表的相容性有下面的命题。 命题1 当且仅当c ;d ,决策信息表s = ( u ,c u d ,v ,f ) 是相容的。 即对于每个c 。:c j 意味着d i = d ,则称决策规则是相容的,否则称为不相容的; 只有当所有的决策规则都是相容的,决策信息表才是相容的,否则决策信息表是 不相容的。 命题2 每个决策信息表s = ( u ,c u d ,v ,f ) 都可以分解为两个决策信息表 s l = ( u t ,c u d ,v ,f ) 和s := ( u s ,c u d ,v ,f ) ,表s 。中c j 。d ,表s :中c j 扣, 其中。u 。= p o s 。( d ) ,睁u b n 。( x ) ,x e u i n d ( c ) 。 通过上面两个命题我们获得了如何判断一个决策信息表是否是相容的,以及 如何处理不相容决策表的方法,这样处理后可以使粗糙集理论进行数据约简时始 终处理的是相容决策信息表。 本文所涉及到的决策表都是相容决策表。 8 第二章粗糙集理论的基本知识 2 2 2 决策系统中属性约简理论涉及到的概念h 1 对于一个决策系统d t = ( u ,c u d ,v ,f ) ,c n d = m ,c 称为条件属性集, d 称为决策属性集。 必要性:若p o s 娜l ( d ) = p o s 。( d ) ,b c _ c ,则称b 在b 中相对于d 是不必要的, 否则是必要的。 独立性:b _ c c ,若b 中每个知识都是必要的,则称b 相对于d 是独立的。 p a w l a k 约简:b c ,若p o s 。( d ) = p o s 。( d ) 且b 是相对独立的,则称b 为c 的 一个p a w l a k 相对约简。 约简与核是粗糙集理论的核心内容之一。 知识约简就是在保持知识库分类能力不变条件下,删除其中不相关或不重要 的知识( 即冗余知识) ,得到最简知识表达。 对决策表的约简称为知识的相对约简。 核是信息系统最重要的属性集合,在决策表又叫相对核。 知识约简包括属性和属性值约简。对一个信息系统来说,求取所有的约简是 n p 难题,任何非穷举的算法都不能保证所得结果是最优的。目前已有的知识约 简算法有:基于不可区分关系的代数方法即根据属性重要性定义的p a w l a k 约简 算法,基于粗糙逻辑运算的方法即根据区分矩阵和区分函数进行逻辑运算、基于 互信息的属性约简算法、x h h u 算法、基于信息熵的约简算法,带局部回溯的 属性约简算法“、基于广义信息表约简算法和基于距离图的属性约简算法“”。本 文将对前两种通常算法进行详细介绍并进行实证分析。 2 2 3基于属性重要性的p a w l a k 属性约简 ( 1 ) 基于属性重要性的p a w l a k 约简算法 具体算法可概括如下; s t e pi 输入信息系统s = ( u ,a ) 。 s t e p2 删除相同的行,删除相同的列,对信息库进行预处理。 s t e p3 判断u i n d ( c - c - ) = i n d ( c ) ,若非,则输出c 。 s t e p4i = i + l 重复s t e p3 。 9 安徽大学硕士学位论文基于粗集理论的投资决策模型研究 s t e p5 输出核c o r e ( c o ) 。 s t e p5c o j b ,求m i n ( b ) ,满足c o b c ,且p o s s ( d ) = p o s 。( d ) 。 s t e p6 若p o s n ( d ) = p o s c ( d ) ,成立,则输出b ,否则转向s t e p5 。 ( 2 ) 基于属性重要性的p a w l a k 约简算法实例分析 设决策表:d t = ( u ,c ud ,v ,f ) ,c nd = ,c 称为条件属性集,d 称为决 策属性集。论域u = c l t 。,c l t :,c l t 。,c l t l c l t 。,c l t 。) ,条件属性集c _ a ,b ,c ,d ,e ) , 决策属性集d : f 。如表2 1 。 表2 1 决策系统初值表 根据等价类和正域的定义可得: w i n d ( d ) = “c l t l ,c l t 2 ,c l t 3 ) , c l t 4 ,c l t 5 ,c l t 。) u i n d ( c ) = “c l t 。 , c l t 。 , c l t 。) , c l t l , c l t 。) , c l t 。 ) p o s 。( d ) = c l t l ,c l t 2 ,c l t 3 ,c l t 4 ,c l t 5 ,c l t e 第一步,根据属性的必要性求决策表的相对核。 u i n d ( c 一 a ) = “c l t 。 , c l t :,c l t 。 , c l t 。 , c l t 。 , c l t ;) ) u i n d ( c ) u i n d ( c 一 b ) = “c l t 。) , c l t z ) , c l t 。 , c l t 。) , c l t 。) , c l t 。 ) _ u i n d ( c ) u i n d ( c - c ) = “c l t 。 , c l t 。 , c l t 。 , c l t 。) ,f c l t 。 , c l t 。 ) = u i n d ( c ) u i n d ( c 一 d ”= c l t 。) , c l t 。) , c l t 。,c l t 。 , c l t 。 , c l t 。”u i n d ( c ) u i n d ( c 一 e ”= “c l t 。 , c l t : , c l t 。 , c l t 。 , c l t ;) , c l t 。 ) = u i n d ( c ) 得到属性a 和属性d 为在决策表d t 中为必要属性,所以,核c o r e ( d t ) = ( a ,d ) 第二步,根据正域搜索决策表的相对约简。 u i n d a ,d = c l t l ,c l t 4 , c l t :) , c l t 3 , c l t ;,c l t 。 l o 第二章粗糙集理论的基本知识 p o s 。,d ( d ) = c l t 2 ,c l t 3 ,c l t ;,c l t 。 p o s 。( d ) u i n d a ,d ,b = ( c l t 。,c l t 4 , c l t 2 ,f c l t 。 , c l t 5 ,c l t 。) ) p o s l ( d ) = c l t 2 ,c l t 。,c l t 5 ,c l t e p o s 。( d ) u i n d a ,d ,c = c l t 。 ,( c l t :) , c l t ,) , c l t 。 , c l t ; , c l t 。 p o s f 。,d 。 ( d ) = c l t l ,c l t 2 ,c l t 3 c l t 4 ,c l t 5 ,c l t 6 = p o s c ( d ) u i n d a ,d ,e ) = “c l t 。 , c l t :) , c l t 3 ) , c l t 。) ,f c l t 。 , c l t 。 p o s 【。 j ( d ) = c l t l ,c l t 2 c l t 3 ,c l t 4 ,c l t 5 ,c l t 6 ) - p o s c ( d ) 搜索到两个相对的最小约简为( a ,d ,c ) 和 a ,d ,e 从该算法可以看出,该算法在求出相对核以后,寻求最小约简过程是一种无 序的穷举搜索判断过程,为了减少搜索时间的复杂性,可以对该算法进行改进, 如可以对属性进行排序以减少重复循环次数,特别对于多属性的决策系统,改进 算法就有很大的优越性。 2 2 4 基于区分函数和区分矩阵的属性约简 ( 1 ) 基于区分函数和区分矩阵的属性约简 该算法是由波兰华沙大学数学家a s k o w r o n 提出的。该算法主要是将对属性 组合情况的搜索转化为对逻辑公式的化简。首先构造区分矩阵,在区分矩阵的基 础上得出区分函数。然后应用吸收律对区分函数进行简化,使之成为析取范式, 则所得每个主蕴含式均为约简。该算法可以求出所有可能的约简。 ( 2 ) 区分矩阵。1 。埘 信息系统s = u ,a ,v ,f ,i u f = n s 的区分矩阵是一个n n 矩阵,其任 一元素为a ( x ,y ) , a ( x ,y ) = a e aif ( x ,a ) m f ( y ,a ) ) 其中,a a ,x ,y e u ,f ( x ,a ) 6 v ,即a ( x ,y ) 是区别对象集u 中x 和y 的所有属性的集合。 另外,对于决策表相应的区分矩阵可定义为: 信息系统s = u ,a ,v ,f ) ,a ( x ) 是对象x 在属性a 上的值。即a ( x ) = f ( x ,a ) 。 c ”表示区分矩阵第i 行,第j 列的元素,则s 的区分矩阵定义为 安徽大学硕士学位论文基于粗集理论的投资决策模型研究 f 口c :a ( x i ) a ( x ,) d ( x i ) d ( x ,) 白严1 。 d ( x f ) = d ( x ;) 其中i ,j = l ,2 ,3 ,n 这里n = l u i ,a = c u d ,c 称为条件属性集,d 称为决策 属性集。c 。是区别对象集u 中x ,和x j 的所有属性的集合。 显然,区分矩阵为对称矩阵。 ( 3 ) 区分函数蚴 信息系统s 的区分函数用表示,是一个布尔函数,对s 中的每一个属性 a e a ,指定一个布尔变量“a ”,若a ( x ,y ) = a 。,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品宣传服务协议合同
- 土方买卖合同协议书
- 劳务派遣与工厂签合同
- 手房卖买定金合同
- 南京住宅租赁合同
- 绿化养护合同范本
- 轿车租给公司合同范本
- 摄像仪维修合同范本
- 露营免责协议合同范本
- 借钱分期还款合同范本
- 2025年初级会计师考试学员疑惑解答试题及答案
- DB51T3251-2025煤矿井下应急广播系统使用管理规范
- 体检中心工作制度和岗位职责
- 相反国课件-大班
- 国家开放大学《初级经济学》形考任务1-3参考答案
- 基于单片机的接触器控制器设计
- 建筑幕墙设计说明(最新规范)
- [工学]日产200吨复合果蔬汁的工厂设计
- 医药企业采购工作流程图(精华版)
- 内科学教学课件:21 消化道出血
- 汽车零部件有限公司各部长绩效考核KPI
评论
0/150
提交评论