




已阅读5页,还剩122页未读, 继续免费阅读
(管理科学与工程专业论文)数据包络分析若干理论和方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
致谢 致谢 本文是在导师梁楔教授、c gl e e 教授的悉心指导下完成的。论文从选题、 写作、修改到定稿的全过程,两位老师都给予了耐心的指导。感谢两位老师三年 来从人生态度、学习、科研、生活等诸多方面给予的关怀和指导,使我的人生历 程上了一个新的台阶。他们渊博的学识、敏锐而深刻的学术直觉、严谨务实的研 究作风、勤奋努力的工作态度、民主宽容的学术风格、乐观向上、胸怀丌阀的人 生态度使我深感敬佩,并将永沐教泽,受用一生。在此,向两位导师表示深深的 敬意和衷心的感谢! 特别感谢美国d a v i d l o l s o n 教授( 论文指导委员会成员) ,黄志民教授,他 们不仅在本论文的论证与写作过程中给予了诸多的指导和帮助,还在科研和学习 的其它方面给我关心和引导。感谢滑铁卢大学j i mb o o k b i n d e r 教授,y o r k 大学 c o o kw a d e 教授,z y a n g 教授,q u e e n s l a n d 大学数掘挖掘实验室的教授们在随 机建模、博弈论、机器学习等方面多次提出创建性的建议。 与论文相关的讨论中,曾得到陈华平教授,赵定涛教授,华中生教授等诸多 的帮助和指导,笔者深受启迪。谨向各位师长致以减挚的谢意! 我所接触的中国科学技术大学商学院、研究生院、招生就业办的老师们,多 伦多大学求学期间工业工程系的老师们,他( 她) 们以学生为中心的友善服务态 度与优质工作,给我留下了深刻而美好的印象,并致谢意! 近四年的学习生活中,我有幸认识了很多师兄弟、同学和朋友并得到了他 ( 她) 们不少的帮助和支持,他们是王国华、余玉刚、王志强、杨峰、杜少甬、 汪明、刘韵毅、徐西平等等,在此也深表谢意【 最后要感谢我的家人,感谢他们多年来对我求学的理解和支持。求学期唰, 父母无微不至的关爱一直陪伴着我、激励若我,弟弟替我承担了绝大部分对家中 的责任,女朋友为我伺出很多但仍给予坚定的支持和不断的鼓励。证是他( 她) 们的关爱和无私奉献,使得我能够坚定信心并顺利完成学业。 吴德胜 2 0 0 6 年1 月于多伦多大学 内容摘要 内容摘要 数据包络分析方法是一种非参数估计方法,适于处理多指标数据,并且不需 要数据本身满足一个明确的函数形式,因此,该方法在很多领域被认为是一种主 要的评估工具。然而,由于某些实际问题往往伴有不确定性,需要考虑环境参数 及竞争情况等,经典的数据包络分析方法在解决实际问题时经常失效。本文拟通 过引入博弈论、模糊集及机器学习等多个领域的理论构建新的模型解决上述问 题。文章就数据包络分析理论与方法的热点问题进行了研究,主要的内容和创新 之处有: 一、本文建立了m a x m i nd e an a s h 讨价还价模型。m a x m i nd e an a s h 讨 价还价模型通过最大化最小效率单元的效率,结合自评与互评的思路,在一定程 度上克服了仅仅采用自评思想的经典d e a 模型的缺陷。 二、本文提出了一种与经典c c r 模型完全等价的模型集成比例分析模 型,并用于决策单元的效率分析。该模型从新的视角透视了数据包络分析模型, 并对前沿面分析作出了深层次的解释。关于集成比例分析的数个性质定理都与现 有文献的结论一致;运用该模型可以轻松地判断位于前沿面上的单元和有效前沿 面上的单元。本文提出并论证了关于集成比例分析( a r a ) 模型中有效决策单元 的恒等式,理论上考察了决策单元的增减对决策单元a r a 有效性的影响。前沿面 单元的判定推论使得在e x c e l 中实现d e a m o n t ec a r l o 模拟变得相当简便;本文 研究出在e x c e l 中实施d e a m o n t ec a r l o 模拟的步骤,并采用具体算例分别实施 了5 0 0 0 次和1 0 0 0 0 次的d e am o n t ec a r l o 模拟仿真。 三、本文阐述了系统的效率分析评估问题,提出了基于多个不同子系统同时 评估的数据包络分析模型。结合模糊集合理论,运用模糊数据包络分析模型对加 拿大银行产业的效率进行了系统分析。这些模型同样可以广泛应用于其他行业的 系统评估中。 四、本文提出了数据包络分析数据挖掘集成模型,并将模型用于银行业的实 证分析。该模型结合了数据包络分析方法易于对多属性单元进行效率分析和数据 挖掘模型适合处理不确定非精确信息的双重优点,具有较强的扩展性,可选用贝 叶斯网络、原始贝叶斯网络、近邻树、支持向量机、神经网络、决策树、变化学 习( 包括背包、提升和栈) 多种机器学习方法。 5 内容摘要 本研究工作提出了若干运用数据包络分析方法进行系统评估的方向,在理 论上综合运用了博弈论、模糊集理论、机器学习和数据挖掘多个领域的知识, 将数据包络分析理论推向深入;在实践中对银行产业效率问题、人寿保险行业问 题等多个具体问题进行案例分析,将理论知识充分应用到实际工作中。所以,本 研究工作具有重要的理论价值和实际意义。 关键词:数据包络分析博弈论纳什均衡模糊集理论数据挖掘机器学习 效率分析绩效评估集成比率分析银行产业人寿保险行业 6 a b s t r a c t a b s t r a c t d a t ae n v e l o p m e n ta n a l y s i s ( d e a ) i sb e l i e v e dt ob eal e a d i n ga p p r o a c ht oe x e c u t e p e r f o r m a n c ea n a l y s i si nm o s ti n d u s t r i e si nl i t e r a t u r es i n c ei tp r o v i d e sab e t t e rw a yt o o r g a n i z ea n da n a l y z ed a t aw h i c ha l l o w se f f i c i e n c yt oc h a n g eo v e rt i m ea n dr e q u i r e s n op r i o ra s s u m p t i o no nt h es p e c i f i c a t i o no ft h eb e s tp r a c t i c ef r o n t i e r a n y w a y , c l a s s i c a ld e am o d e l se n c o u n t e rm a n yh u r d l e sw h e na p p l i e dt or e a l w o r l dp r o b l e m s w h e r eu n c e r t a i n t y , e n v i r o n m e n t a lf a c t o r sa n dc o m p e t i t i o na r eo fi m p o r t a n c e t h i s t h e s i sa i m st os o l v et h ea b o v ep r o b l e m sb yi n t r o d u c i n gg a m et h e o r y ,f u z z ys e tt h e o r y a n dm a c h i n el e a r n i n gt h e o r yt od e v e l o pn e wa g g r e g a t i o nm o d e l sw i t hd e a t h i st h e s i ss t u d i e ss t a t e - o f - t h e a r tt o p i c si nd e at h e o r ya n d - a p p r o a c h i t sm a i nc o n t e n t sa n di n n o v a t i o n sa r ea sf o l l o w s i d e ag a m ei sd i s c u s s e dt h r o u g hm a x r a i nd e an a s hb a r g a i n i n gm o d e l t h e m o d e la p p l i e st h ei d e at h a tc o m b i n e ss e l f - r a t e da n do t h e r - r a t e ds c h e m e t h u s ,t os o m e e x t e n t ,t w oi n t e r - r e l a t e dp r o b l e m st h a ta r ew e a kd i s c r i m i n a t i n gp o w e ra n d u n r e a l i s t i c w e i g h td i s t r i b u t i o no c c u r r e di nc l a s s i c a ld e a a r es o l v e d i i a na g g r e g a t e dr a t i oa n a l y s i sm o d e li s p r o p o s e d f o r e v a l u a t i n g r e l a t i v e e f f i c i e n c yo fd e c i s i o nm a k i n gu n i t s ( d m u s ) i ti ss h o w nt h a tt h i sp r o p o s e dr a t i o m o d e li se q u i v a l e n tt ot h ec c r d e am o d e l t h i se q u i v a l e n c ep r o p e r t yo f f e r sa g r e a td e a lo fo p p o r t u n i t i e sf o rd e a t ob ei n t e r p r e t e da n da p p l i e di nd i f f e r e n tw a y s t h i sm o d e la l s oo f f e r sa ni n s i g h ti n t ot h ef r o n t i e ra n a l y s i s w h e t h e rad m ui so n t h ef r o n t i e ro re f f i c i e n tf r o n t i e ri tc a nb ei n f o r m e db yu s i n gt h ea g g r e g a t e dr a t i o a n a l y s i s s e v e r a lr e s u l t sd e v e l o p e di nt h ep a p e ra r ec o i n c i d e n tw i t ht h a ti nt h e l i t e r a t u r e f o r m u l a r sr e g a r d i n gh o wt oa c h i e v ea r ae f f i c i e n ta r ep r e s e n t e da n d p r o o f e d t h ee f f e c to fc h a n g i n g t h en u m b e ro fd m u so v e ra r ae f f i c i e n c yi s c a r e f u l l ye x a m e d t h e o r e m sa b o u th o w t ot e r mt h ef r o n t i e rd m u sg r e a t l yf a c i l i t a t e t h ed e am o n t ec a r l os i m u l a t i o ns ot h a ti no u rp a p e rw ec a ni m p l e m e n tt h ea l g o r i t h m o fd e am o n t ec a r l os i m u l a t i o ni ne x c e lf o r5 0 0 0a n d10 0 0 0i t e r a t i o n sr e s p e c t i v e l y 7 a b s t r a c t i i i w ed i s c u s st h ep e r f o r m a n c ee v a l u a t i o na n de f f i c i e n c ya n a l y s i sf r oas y s t e m c o m p o s i n go fs e v e r a ls u b s y s t e m s s e v e r a ln e wd e a m o d e l sa r ed e v e l o p e dt oh a n d l e t h e s ep r o b l e m s t oa n a l i z et h ep e r f o r m a n c eo fc a n a d i a nb a n kb r a n c h e s ,f u z z yd e ai s e m p l o y e ds ot h a tw ec a l le x e c u t eas y s t e m a t i ca n a l y s i s t h e s em o d e l sa r ee x p e c t e dt o a p p l y t oo t h e r s y s t e m s i nt h e p r e s e n c e o fs y s t e m a t i cp e r f o r m a n c ee v a l u a t i o n p r o b l e m s i v a g e n e r i c m o d e li s p r o p o s e db yi n t e g r a t i n gd e aa n d d a t am i n i n g a p p r o a c h e s c a s es t u d yi si m p l e m e n t e di nb a n ki n d u s t r ye f f i c i e n c ya n a l y s i sb yu s eo f t h ei n t e g r a t e dm o d e l t h em o d e le x h i b i t sa d v a n t a g e so fb o t hd e aa n dm a c h i n e l e a r n i n g t h ei n t e g r a t e dm o d e lc a nb ee a s i l ye x t e n d e da n dt h i st h e s i sd e m o n s t r a t et h e u t i l i z a t i o no fac o u p l eo fm a c h i n el e a r n i n ga l g o r i t h m si no u rs t u d y ,i e ,b a y e s ,n a i v e b a y e s ,n e a r e s tn e i g h b o r , s u p p o r tv e c t o rm a c h i n e ,n e u r a ln e t w o r k ,c 4 5d e c i s i o nt r e e , m e t a - l e a r n e ri n c l u d i n gb a g g i n g ( v o t i n g ,a v e r a g i n g ) ,b o o s t i n ga n ds t a c k i n g t h i st h e s i sd e m o n s t r a t e ss e v e r a ld i r e c t i o n st os o l v es y s t e m a t i cp e r f o r m a n c e a n a l y s i sp r o b l e m t h e o r e t i c a l l y , i tc r e a t i v e l yc o m b i n e sk n o w l e d g ei ng a m et h e o r y , f u z z ys e tt h e o r y , m a c h i n el e a r n i n ga n dd a t am i n i n gt h e o r ya n dd e at h e o r yi n t o i n t e g r a t e dm o d e l s m o d e l sd e v e l o p e di nt h i sw a y a r eu s e di nm a n yc a s es t u d i e s ,s u c h a sb a n kb r a n c he f f i c i e n c ya n a l y s i s ,l i f e & h e a l t hi n s u r e rp e r f o r m a n c ea n a l y s i s h e n c e , t h i st h e s i se x h i h b i t sv a l u e sf o rb o t ht h er e s e a r c h e r sa n dp r a c t i t i o n e r si n t h a ti t a p p r o p r i a t e l ya p p l y i t sd e v e l o p e dm o d e l si n t or e a l w o r dp r o b l e m s k e yw o r d s :d a t ae n v e l o p m e n ta n a l y s i s ( d e a ) ,g a m et h e o r y ,n a s he q u i l i b r i u m , f u z z ys e tt h e o r y , d a t am i n i n g ,m a c h i n el e a r n i n g ,e f f i c i e n c ya n a l y s i s ,p e r f o r m a n c e e v a l u a t i o n ,a g g r e g a t e dr a t i oa n a l y s i s ,b a n ki n d u s t r y ,l i f ea n dh e a l t hi n s u r a n c e i n d u s t r y 8 第一章 引言 1 1 研究背景 “n o t h i n g i se v e rs e t t l e du n t i li ti ss e t t l e dr i g h t ” - - - - - r u d y a r dk i p l i n g 第一章引言 1 1 1 数据包络分析理论应用的快速发展与评估问题 在市场经济突飞猛进、竞争逐步走向“同质”的今天,如何实现效率与效益 的快速发展是各行各业永恒的课题,关于效率与效益的评估问题成为组织的核心 战略任务之一。当今社会瞬息万变而又处处充满竞争合作,社会生活的各个环节 蕴涵着系统与子系统的关系,复杂的系统关系给组织的的评估工作带来了诸多挑 战。寻求恰当的工具模型,是评估领域的科学工作者们的要务之一。 由c h a r n e s ,c o o p e r 和r h o d e s ( 1 9 7 8 ) g i j 建并发展而来的d e a ( 数据包络分 析) ,是一种确定有效生产前沿面及评估决策单元( d m u ) 相对有效性的非参数 方法。c h a m e s ,c o o p e r 和r h o d e s 的文章因为得到9 8 9 次s s c i 和s c i 引用( 2 0 0 3 年2 月以前) 而成为d e a 领域的经典。d e a 模型及其拓展的主要形式包括c c r 和b c c 模型( c h a r n e s ,c o o p e r 和r h o d e s19 7 8 及b a n k e r , c h a m e s 和c o o p e r19 8 4 ) ; 模型的改进及延伸包括置信域( a s s u r a n c er e g i o n ) 模型( t h o m p s o ne ta 1 1 9 8 6 ) ,锥 性比率模型( c h a m e se ta 1 1 9 8 9a n d1 9 9 0 ) 。l a n d ,l o v e l l 和t h o r e ( 1 9 9 2a n d1 9 9 4 ) , o l e s e n 和p e t e r s e n ( 19 9 5 ) ,及c o o p e r , h u a n g 和l i ( 19 9 6 ,l9 9 8 ,2 0 0 2 ,a n d2 0 0 4 ) 等 还探讨了随机机会约束模型。 自1 9 7 8 年提出d e a 之后,很多领域的学者们认识到d e a 是一种优秀的运 筹建模工具( 如c h a r n e s 和c o o p e r ,1 9 8 5 ;s e i f o r d 和t h r a l l ,1 9 9 0 ) 。d e a 借鉴 了计量经济学的边际效益理论和高等数学中的线性规划模型,通过界定是否位于 “生产前沿面”上来比较各决策单元之间的相对效率和规模收益,显示最优值( 投 影值) 。其突出优点是,它所需指标少,具有较高的灵敏度与可靠性,可以对无 法价格化甚至难以轻易确定权重的指标进行分析,各测量指标能够以原来的面目 1 根据文献标准,一篇文章如果被引言超过5 0 0 次则成为经典之作 9 第一章引言 出现,不必统一单位,大大简化了测量过程,保证了原始信息的完整,也避免了 人为确定权重的主观影响。d e a 可以对具有多指标投入和多指标产出特点的相同 类型单元的相对效率进行综合评价,不需要任何变量问的函数假设,特别适合性 质相同的单元之间的评估比较( a t h a n a s s o p o u l o sa n dg i o k a s ,1 9 9 7 ;a t h a n a s s o p o u l o s a n dk a r k a z i s ,1 9 9 7 ;a t h a n a s s o p o u l o sa n dm y l o n o p o u l o s ,1 9 9 7 ) 。上述优点使得d e a 方法在非盈利性组织以及盈利性组织均得到广泛的应用,这些应用领域具体包括 教育、健康保健行业、银行业、人寿保险行业、军队、审计业、市场调研、零售 业、组织效力、交通运输、房屋租赁和制造业等。目前,这一方法应用的领域 正在不断扩大。图1 1 是学者g a b r i e lt a v a r e s ( 2 0 0 2 ) 关于2 0 0 2 年以前d e a 研究 情况的一个统计。统计表明,该期间共有3 2 0 2 篇关于d e a 的文章在各类杂志发 表。 g a b r i e l t a v a r e s ( 2 0 0 2 ) ,“ab i b l i o g r a p h y o fd a t a e n v e l o p m e n ta n a l y s i s ( 1 9 7 8 2 0 0 1 ) ”r u t c o r r e s e a r c hr e p o r tr r r01 0 2 ,w h e r e3 2 0 2d e a p u b l i c a t i o n sa n d215 2d e a a u t h o r sa r er e p o s e d 图1 1d e a 文献的总体统计情况 最近的关于d e a 研究情况的调研是g a t t o u f i 等人于2 0 0 4 年9 月先后发表在 t h ej o u r n a lo ft h eo p e r a t i o n a lr e s e a r c hs o c i e t y ,s o c i o e c o n o m i cp l a n n i n gs c i e n c e s 上的三篇文章。o a t t o u f i 等人( 2 0 0 4 a ,b ,c ) 的统计结果表明:2 0 0 1 年8 月以前, 有大约1 8 0 0 篇关于d e a 的文章在超过4 9 0 种各类杂志发表,这些文章的作者来 自4 2 个国家。表1 1 给出了1 9 7 8 - 2 0 0 1 年间发表的d e a 文章及杂志分布情况, 图1 2 和图1 3 分别描绘了各年发表的d e a 文章及发表d e a 文章的杂志统计分 布图。表1 1 、图1 2 和图1 3 都充分说明了d e a 的快速发展,尤其体现在 1 9 9 9 年至2 0 0 1 年间。目前,这一方法应用的领域正在不断扩大。 第一章引言 注:该表在综合g a t t o u f ie ta 1 ( 2 0 0 4 b ) 表1 ,5 的基础上制成 第一章引言 器蘸抟鬟梦罐教l ;豢j 鎏攀i 躺誊藩l 蕊j 。黎 , 一 基棼簿 z k ”,? ,+ j 4 i 、? “? 、“:v 7 。一4 1 , ;, 溪搿黥譬强藤:德戮篓| 。,惑誊。瀑0 j 爱_ 一、j 、:t 。二。j 。 o 。:, 。、 7 ,:。,:,n。,i : 。 i c 、j。 一 j :+ 鬈 j 群:霞誉雩:鬻9 鬻。? 怒:擎黔嚣。;? j “i ”j “:j ;j i 一? ? ”;露f 7 。j 墨i 琴j = 焉l 。r 。 ? , ;譬、 矗 ,l j l 等。:善。、j 簿,- ! 蔓:j ,、o j 一“j i :+ 。碍。,“美、4 譬+ 。:? a 勰。二南; ,:一 j7 一i 一o 一;卜一1 二: : 妒: :1 x i 一 :r弧 、 ? 露7 。一| 。f , ,誊雾。霪“i 一# 。? j 1 - 、? ? 、。誊:。n 耋一乳 ,_j ;j:冀 # 一 1|-薯黧溅nl1-_蠢-n 1 4 1 1瓣 。- = ;7 ? 。?讳 计 i 、 l l i 女; 、 、 、。、 、 、 、 、 、 、吖n j y 蚰一 图1 2 各年发表d e a 文章杂志分布图 簦箨巍雾蘩妻鬟;舞藿鬻鬻,熬嚣鬻鬻瓣然j 棼 簇i 参囊鬻鬈囊叠鞴;摹麓鬻? i 蒜辫瑟瑟颡蕤鬻瓣麟瓣繇舅 瀵蘩零辫i 鬻囊篱漆蘩蓼囊鬻j 螽鬻囊0 浚簿j 冀豺囊 筵攀霹芝嚣辫搿鬻攀1 鬻笺:罐:鬻器筝鬻:雾鹊燮 。r 叫 。-j - 二一。 t、,1, 。 计 i z 臻i 譬藩耄蠢j 毫囊蠹纛;蓊豢慧i 篓;i 蠹j 妻鬻蠢j 誊灏棼凄;慧 i 誉豢,j j i 篱j o ? j 誉i i 警建j ? j ;纂誊j :篡i i ,耋i i 冬一囊挚j i :鬻。 善辫誉誊鬻熬警鬻孽雾麓j 鬟鬻蠢耄鬻避鬻鬻葛雾象:簿爹辩i 鋈鬻 蠢嚣萎三纛荔! ,i 鬈g 毫琴:鬻笼j 篱鬟;名蠢:篓曩誊蒜囊蕊纛i :豁 r :譬鬃豢豢麓譬二曩簿象警,戳菱嚣;繁“譬簿j 鬟;害窭j 獯鬻羹鬻鬻:篷潮麓零j 黪! 麓繇鬻镰i 辫萎礤辍: 耵i # 挣l 嘲w 1 l i 蜚l 私i i 讳 钳i ! f i l l i # 1 ;时a 砧1 叶t 镕摊辨0 辩l 辩瑚,* 7 i 辫t 御0 t 婶脚 y e a r s 图1 3 各年发表的d e a 文章统计分布图 1 2 册 踟 毫_ 撕 o j卫c吒l譬ii_甍=ojm暑l摹0,-0 kqolz 垂薹 油 嘶 惭 斟 善 斟 螂 鼬 o c童_u_锋矗j屯|o每o#-,黧 第一章引言 为了更清楚地说明d e a 的快速发展,作者引用g a t t o u f i 等人( 2 0 0 4 b ) 关于 d e a 与m s o s 领域的经典领域流程车间调度( f l o ws h o ps c h e d u l i n g ) ,单元制 造( c e l l u l a rm a n u f a c t u r i n g ) 的发展比较研究。这三类m s o s 领域的发展比较情况 在图1 4 中绘出。虽然d e a 诞生在1 9 7 8 年,晚于另两类( 流程车间调度和单元 制造的研究分别始于1 9 5 2 年和1 9 6 9 年) ,但是d e a 领域的年发表文章数量远远 高于流程车间调度和单元制造。d e a 、流程车间调度和单元制造的年发表文章数 量分别为:1 7 9 7 2 3 = 7 8 2 ,3 1 6 4 9 = 6 4 及3 7 4 3 2 = 1 1 7 。 鬻然黼一攀 ;_ 攀薯、菇攀:爹 茹震繇磷餐羹菱繇纂 :菇0 黪孝豢嚣篱:_ f ,l i o 豢w s l i 媾o p j s _ e h ,e 二f l u t l 。g 1 。 曩0 鬈豢雾鬈- 舞誓。瑟萎誊。誉;菱j 誊 ;? 篓 i 蠹j 毒! 誓。交警爹一;羹篁誊誊萋 黪:拳誊霉潞豢麓。落萋攀誊鬻、釜: 一 寸” 2叠= :宝釜甜 罱器嗣蕞譬导等荨等 y e a ro f t h e1 1 f ec y c l e 图1 4 三类m s o s 领域的发展比较 d e a 作为评估工具类似一个“黑匣子”,极大的方便了评估者们的工作:但是 这个“黑匣子”也存在诸多缺陷。实际应用当中,d e a 的诸多假设使得其应用常 常受限,如其根据分段线性估计特点估计出的前沿面,经常造成过多评估单元有 效;单元同一性假设使得其无法评估具有不同外在特性的单元等等。面对d e a 的 这些缺陷,在数据包络分析中引入新的理论! 寻求有效的绩效评估技术和方法, 针对具体问题综合运用数据包络分析方法和其它方法,建立基于实际问题的集成 评估模型,不但能将数据包络分析理论推向深入,具有重要的理论意义,而且具 有广阔的市场前景和重大的实际应用价值。 世置岩厶o1盏嚣算z。、1高inchlu 第一章引言 1 1 2 研究现状 d e a 模型本身的发展已经比较完备,当前开展的工作主要着眼于现实应用并 开发基于现实问题的模型对其缺陷加以克服。承接上节的讨论,我们在表1 2 中 总结了d e a 的特点与应用需求的冲突。 表1 2d e a 的特点与评估需求的冲突 分段线性 输入输 d e a 估计 确定性假设单元同一性出数据非负, ( p i e c e w i s e 的特点 ( d e t e r m i n i s t i c ) ( h o m o g e n e i t y ) 无异常数据 1 i n e a r ( o u t l i e r ) e s t i m a t i o n ) 非合理权难以处理不确 难以处理n o n 难以处 缺陷重,过多有效单定性变量,环境变理o u t l i e r ,零 元量 h o m o g e n e i t y 情况。 数据,负数据 应用 考虑更公 不确定性、环各单元不具有 存在 平的评估机制,境变量及定性数据 同一性,比如评价不 o u t l i e r ,零数 需求 据,负数据甚 合理权重等必须加以考虑同地区的银行效率 至缺失数据 解决引入博弈 引入模糊集, 开发新的d e a 引入机 机器学习数据挖掘 器学习数据挖 方法模型 模型 模型 掘模型 本文紧紧围绕d e a 的上述问题,开发一系列的模型力图克服这些缺陷。下 面通过文献调研来阐述数据包络分析博弈模型和数据包络分析机器学习数据挖 掘集成模型的研究。 d e a 与博弈论的相似之处在于它们不但是一门理论技术,更是一种解决实 际问题的方法工具。但是在美国o r m s 旗舰杂志发表文献的调查表明,d e a 的 应用文献占整个d e a 文献的6 7 ,远远高于博弈论领域的数字2 1 ( g a t t o u f i e ta 1 ,2 0 0 4 b ) 。从这个角度来讲,d e a 与博弈论相得益彰,结合d e a 与博弈 论建模的研究工作也引起学者们的兴趣。d e a 与博弈论的第一篇文章是由 b a n k e r 等( 1 9 8 0 ) 完成的,他考虑无约束二人零和有限搏弈,从二人零和博弈的 角度给出了c c r d e a 的解释。随后陆续有学者开展了这方面的工作。这方面的 文献分别总结在表1 3 。 表1 3 的文献统计表明,尽管关于d e a 与博弈论的工作不是很多,但是这 第一章引裔 个分支一直是学者们关注的对象。文献统计进一步表明,关于非合作多人博弈与 d e a 的研究工作尚属空白,而这将在本论文的第二章进行讨论。 表1 3d e a 博弈模型文献 博弈模型作者问题研究 n a k a b a y a s h i a n d 简化c c r 模型,仅考虑投入或者产出或者两 合作博弈 t o n e ( 2 0 0 6 ) 者差值;考虑核, s h a p l e y 值 二人零和有限 在o l y m p i c 竞赛中,奖牌的数量是一定,a 国 博弈 l i n se ta 1 ( 2 0 0 3 ) 多得一枚奖牌,其他国家就少得一枚,由此建 立零和收益d e a 模型 连续博弈,二 人零和无限博 h a oe ta 1 ( 2 0 0 0 ) 考虑综合d e a 、凸锥理论与零利博弈结合 弈 连续博弈,二 人零和无限博s e m p l e ( 19 9 7 ) 以多面锥( p o l y h e d r a lc o n e ) 扩展r o u s s e a u 和s e m p l e ( 1 9 9 5 ) 的工作 弈 连续博弈,二 r o u s s e a u 和 以c c r 原问题对偶问题为中心建立二人零和 人零和无限博 弈 s e m p l e ( 1 9 9 5 ) 博弈 有约束二人零 考虑b c c 模型扩展b a n k e r ( 1 9 8 0 ) 的:l j 作,对 和有限博弈 b a n k e re ta 1 ( 19 8 9 ) 其二 :作作出进一步解释 无约束二人零应用b a n k e r ( 1 9 8 0 ) 的模型分析空军车辆维修 和有限博弈 c l a r k e ( 19 8 8 ) 效率 无约束二人零从二人零和博弈的角度给出了c c rd e a 的解 和有限博弈 b a n k e r ( 1 9 8 0 ) 释 最近十几年,随着信息技术及其相关技术的飞速发展,人类的数值计算和数 据存储分析能力大大提高。有效的实践管理需要借助于信息技术发展的相关成 果,已经逐渐达成一种共识。数据挖掘作为从数据中寻求有意义的模式和规则的 信息技术,是当前一种热门的研究内容,并且已经在包括金融数据分析信用评估 等领域获得了很好的应用。d e a 领域的学者们关注并逐步引入了数据挖掘这一新 兴领域的工具,表1 4 统计了综合运用d e a 和数据挖掘机器学习模型的文献。 第一章引言 表1 4 综合运用数据包络分析和机器学习模型的文献 模型作者问题研究主要贡献 神经网络辅助估计 神经网络辅助估计的前 a t h a n a s s o p o u l o s a n d 效率前沿面;d e a 沿面对噪音稳健;神经 c u r r a m ,19 9 6 ; c o s t aa n d 作为数据前处理手 网络的预测结果类似 d e a 和 m a r k e l l o s , 19 9 7 ;w a n g , 段,结合神经网络预 c o l s 和d e a :基于 神经网 2 0 0 3 ;f l e i s s i g e t a 1 ,2 0 0 0 ;测雇员数:利用时 d e a 有效单元数据训练 络 p e n d h a r k a ra n d 间序列数据分析 出来的神经网络比基于 r o d g e r ,2 0 0 3 ;s a n t i ne ta 1 , l o n d o n 地铁效率: 非有效单元数据的神 2 0 0 4 神经网络作成本前 经网络预测准确率高 沿面估计 技术转产商业化; 可处理财务非财务数据 d e a 和 s o h n a n d m o o n ,2 0 0 4 ; 政府基金的使用效 及环境变量;提供智能 m o o na n d s o h n ,2 0 0 5 ; 率评价:关于经典线 决策树 性规划模型、d e a 化管理;对于小规模财 c i e l e ne t a 1 ,2 0 0 4务数据,d e a 比决策树 和决策树分类能力 的比较分析 ( c 5 0 ) 的分类能力强 d e a ,自 组织映 使用d e a ,白组织 可开发更简单有效实用 射神经 l e ea n dp a r k ( 2 0 0 5 ) 映射神经网络和决 的系统,用于顾客满意 网络和 策树划分公司顾客 度分析 类别 决策树 综合运用d e a 和机器学习模型是一个方兴未艾的领域,d e a 和机器学 习数据挖掘的综合运用形式也是多样的:可以以一种方法为主,另一种方法 作为数据前后处理的辅助工具;也可以并行使用。从实现的形式上看,d e a 可以看作对被评估对象进行分类( 划分为有效和无效) 的过程,而分类正是 机器学习数据挖掘最主要的模式之一。机器学习数据挖掘模型的优势之一在 于适于处理不确定性信息、缺失信息等,采用机器学习数据挖掘模型估计出 来的前沿面具有很强的稳健性。 作者自入学以来,即参与多个关于评估方法研究的国家自然科学项目, 对评估领域的理论方法有了较为全面的了解。受中科院出国基金资助到多伦 多大学后,更是多次与该领域的权威专家d a v i do l s o n ,j o ep a r a d i ,z h i m i n h u a n g ,w a d ec o o k 等进行学习交流;并与2 0 0 5 年1 0 月至1 2 月间先后访问 了美国n e b r a s k a 大学,纽约长岛大学,就博弈论、模糊集理论、数据挖掘、 决策分析及数据包络分析等领域展开了有效的合作研究,也进步强化了本 第一章引言 人对这些领域基础知识的理解。基于此,作者选择综合运用了博弈论、模糊 集理论、机器学习和数据挖掘多个领域的知识来研究数据包络分析领域中的 问题,并作为博士论文的写作内容,希望能够对数据包络分析这一领域的研 究有所裨益,将该理论分析推向深入,将该方法应用进行扩展。 1 2 研究内容 基于上述的背景分析,本文将主要在以下四个方面展开研究: 1 2 1 数据包络分析博弈论理论与方法 本章建立了m a x m i nd e an a s h 讨价还价模型。 m a x m i nd e a 模型考虑了d m u 之间竞争的公平性,结合自评与互评的思 路,在一定程度上克服了仅仅采用自评思想的经典d e a 模型的缺陷。m a x r a i n 均衡模型存在的问题是在保护“弱小”单元的同时,有可能损害其它单元的 效率。文中通过n a s h 讨价还价模型从合作博弈的角度求解m a x m i n 均衡模 型与c c r 模型的讨价均衡解。演示算例进一步证明了文中方法的可行性,与 经典的c c r 模型相比,文中方法具有易操作、判别性强等优点。 1 2 2d e a 中的集成比例分析模型研究 该章建立了与c c r 数据包络分析等价的集成比率分析模型,探讨了集成 比率分析模型的性质定理、基本形式和拓展形式。从集成比率分析模型出发, 给出了判定前沿面单元的定理,该方法不需要求解d e a 模型就可以识别出在 前沿面上的d m u 。该章研究并论证了关于集成比例分析( a r a ) 模型中有效 决策单元的恒等式,理论上考察了决策单元的增减对决策单元a r a 有效性的 影响。 关于前沿面单元的判定推论使得在e x c e l 中实现d e a m o n t ec a r l o 模拟 变得相当简便。文中研究了在e x c e l 中实施d e a m o n t ec a r l o 模拟的步骤,采 用具体算例分别实施了5 0 0 0 次和1 0 0 0 0 次的d e am o n t ec a r l o 模拟仿真。 1 2 3 处理带多子系统评估问题的d e a 模型与实证研究 现实的经济体常常包涵多个子系统,对经济体的效率分析问题也就成为 第一章引言 处理带多子系统单元的评估问题,带子系统的评估问题给经典的d e a 方法提 出了挑战。 该章阐述了人寿保险公司的绩效问题以及银行产业中效率系统评估问 题。针对人寿保险公司的绩效问题,提出了基于多个不同子系统同时评估的 数据包络分析模型。针对银行的效率系统评估问题,结合模糊集合理论,提 出了模糊数据包络分析模型对加拿大银行产业的效率进行了系统分析,这些 模型可广泛应用于其他行业的系统评估中。 1 2 4 数据包络分析与数据挖掘机器学习u 集成模型与实证研究 综合运用d e a 和数据挖掘机器学习模型是一个方兴未艾的领域。机器 学习数据挖掘模型的优势之一在于适于处理不确定性信息、缺失信息等,采 用机器学习数据挖掘模型估计出来的前沿面具有很强的稳健性。将数据挖掘 机器学习模型引入数据包络分析领
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 仿古木材油漆施工方案
- 组件支架水上施工方案
- 《传递积极力量》课件
- 2025智能解决方案开发合同(标准模板)
- 2025至2031年中国人造牡丹花枝行业投资前景及策略咨询研究报告
- 2025国际货物贸易合同范本下载
- 2025至2030年中国银包五金配件数据监测研究报告
- 2025至2030年中国足球运动急救套装数据监测研究报告
- 2025至2030年中国水曲柳贴面板数据监测研究报告
- 施工方案的计算软件
- 中国地质大学(北京)《GNSS测量原理及其应用》2022-2023学年第一学期期末试卷
- 护理专业实践报告5000字范文
- 2024年度昌平区养老院食堂餐饮服务承包合同
- 矿业权评估师岗前培训课件
- 二年级家庭教育讲座省公开课获奖课件市赛课比赛一等奖课件
- 矿山生态修复施工方案及技术措施
- GB/T 24008-2024环境影响及相关环境因素的货币价值评估
- 化学计量学与化学分析技术考核试卷
- 2024关于深化产业工人队伍建设改革的建议全文解读课件
- 人教pep版小学英语三年级下册【全册】单元测试卷期中期末复习试卷
- 电梯维保工程施工组织设计方案
评论
0/150
提交评论