(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf_第1页
(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf_第2页
(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf_第3页
(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf_第4页
(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(技术经济及管理专业论文)基于粗糙集理论的我国能源消费影响因素分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一j 华北电力大学硕士学位论文 摘要 选择能源消费量为决策变量,投资、最终消费支出、出口总额、重工业比重、 城市人口为影响因素,以我国1 9 8 1 - 2 0 0 7 年实际数据( 扣除物价水平影响) 为样本, 利用粗糙集理论中的属性重要性、属性约简与规则可信度的概念,分阶段对我国 1 9 8 1 1 9 9 0 ,1 9 8 6 - 1 9 9 5 ,1 9 9 卜2 0 0 0 ,1 9 9 6 2 0 0 5 ,2 0 0 1 2 0 0 7 的各影响因素对能源 消费的影响程度进行了分析,揭示了我国能源消费各影响因素对能源消费影响程度 在近3 0 年来的变化以及影响因素的影响机理。根据分析结果提出我国降低能源消 费的政策建议。最后通过提出一种相关关系预测法。建立了我国能源消费的预测模 型,对能源消费量进行了预测。 关键词:粗糙集,属性重要性,规则可信度,能源消费 a b s t r a c t f i r s t l y , e n e r g yc o n s u m p t i o ni s c h o s e na st h ed e c i s i o nv a r i a b l e i n v e s t m e n t ,f i n a l c o n s u m p t i o n ,t o t a le x p o r ta n dh e a v yi n d u s t r yp r o p o r t i o na r ec h o s e na sc o n d i t i o n a lv a r i a b l e s t w e n t y s e v e ny e a r s ( f r o m19 81 t o2 0 0 7 ) r e a ld a t ao fe n e r g yc o n s u m p t i o n ( i n f l u e n c eo fp r i c e l e v e li sd e d u c t e d ) i nc h i n aa r et a k e na ss a m p l e s b a s e do nt h ea t t r i b u t ed e g r e e ,t h ea t t r i b u t e r e d u c t i o na n dt h er u l ec o n f i d e n c eo ft h er o u g hs e tt h e o r y , ap h a s ea n a l y s i s ( r e s p e c t i v e l y _ f r o m 1 9 8 lt o1 9 9 0 ,f r o m1 9 8 6t o1 9 9 5 ,f r o m1 9 9 1t o2 0 0 0 ,f r o m1 9 9 6t o2 0 0 5 ,f r o m2 0 0 1t o2 0 0 7 ) i sm a d et or e f l e c tt h ed e p e n d e n td e g r e eo fe n e r g yc o n s u m p t i o no nt h ef i v ev a r i a b l e s t h e m o d e ln o to n l yr e p r e s e n t st h ee q u i l i b r i u mr e l a t i o nb e t w e e ne n e r g yc o n s u m p t i o na n di t sm a i n i n f l u e n c ef a c t o r s ,b u ta l s oc a ns h o wu st h en e a r l y3 0y e a r sc h a n g e so ft h ei n f l u e n c ed e g r e e b e t w e e nt h e m t h ea n a l y s i sr e s u l t so ft h em o d e la f f o r dan e wi d e af o rp o l i c ym a k i n g 。f i n a l l y , a p r e d i c t i o nm o d e lb a s e do n ar e l a t e dr e l a t i o np r e d i c t i o nm e t h o di se s t a b l i s h e dt op r e d i c tt h e e n e r g yc o n s u m p t i o n w a n gc h e n g j i e ( t e c h n i c a le c o n o m i c sa n dm a n a g e m e n t ) d i r e c t e db ya s s o c i a t ep r o f z h a n gx i n g p i n g k e y w o r d s :r o u g hs e t ,a t t r i b u t ed e g r e e ,r u l ec o n f i d e n c e ,e n e r g yc o n s u m p t i o n _ 一 华北电力大学硕士学位论文 目录 1 景及其意义1 1 1 1 我国能源消费状况分析1 1 1 2 我国经济增长对能源消费具有重要的影响3 1 2 国内外研究动态:4 1 2 1 能源消费和经济增长之间的关系研究4 1 2 2 粗糙集理论6 1 3 论文研究的主要思路和结构8 第二章f c m 算法与粗糙集理论9 2 1 模糊c 一均值聚类( f c m ) 算法9 2 1 1 隶属度函数的概念9 2 1 2 模糊c 一均值聚类f c m 1 0 2 1 3m a t l a b 实现模糊聚类11 2 2 粗糙集理论1 2 2 2 1 知识与知识库1 2 2 2 2 近似与粗糙集1 3 2 2 3 知识约简1 5 2 2 4 属性的重要性1 7 2 2 5 信息系统和决策表1 8 第三章我国能源消费影响因素分析2 0 、3 1 模型变量的选择及样本数据预处理2 0 3 1 1 能源影响因素的选择2 0 3 1 2 样本数据预处理2 4 3 2 数据处理2 4 3 2 1 建立决策表并计算属性重要度2 4 3 2 2 计算因素的权系数3 1 3 3 结果分析3 2 3 4 1 横向分析3 2 华北电力人学硕十学位论文 3 4 2 纵向分析3 5 3 4 相关政策建议3 7 第四章基于粗糙集相关关系的能源需求预测4 1 4 1 模型的建立4 l 4 1 1 提取相关关系规则4 l 4 1 2 建立预测模型4 2 4 2 预测结果分析4 2 第五章结论与展望4 4 5 1 结论4 4 5 2 今后的工作4 4 参考文献4 5 致谢4 9 在学期间发表的学术论文和参加科研情况5 0 华北电力大学硕士学位论文 1 1 选题背景及其意义 1 1 1 我国能源消费状况分析 第一章引言帚一早,l 苗 能源是经济发展的一个保障因素,国民经济的持续和快速增长有赖于能源的供 给和消费。随着我国经济的持续快速增长,其能源消耗量也与同增加,我国能源消 耗量巨大,据资料显示2 0 0 6 年我国能源消费总量为2 4 6 2 7 亿吨标准煤,占世界能 源消费总量的1 5 4 4 ,我国现在己经成为世界上仅次于美国的第二大能源消耗国, 能源消耗总量约占世界能源消耗总量的1 0 左右。但是由于我国粗放的经济增长方 式,其能源强度( 单位g d p 的能耗) 远远高于发达国家和发展中国家的平均水平。 1 9 7 8 年改革开放以来,中国的经济经历了高速的发展,在“十五期间”g d p 年 均增长速度达到了9 5 。其中,1 9 7 8 年的g d p 总量为3 6 4 5 2 亿元,2 0 0 7 年的g d p 总量为2 5 1 4 8 3 2 亿元,平均增长率达到1 5 9 。与此同时,中国的能源消费也出现 了高速增长的局面。能源工业通过不断加大投资力度、改革管理体制和管理方式、改 变运行机制和加强国际合作,极大地促进了我国能源工业的发展。能源消费总量由1 9 7 8 年的5 7 1 亿吨标准煤增长到2 0 0 7 年的2 6 5 6 亿吨,年平均增长5 5 。从2 0 0 2 年 起,中国经济进入了新一轮的增长周期,固定资产投资迅速增长,钢铁、建材、电 解铝等高能耗产业迅速扩张,重工业的比重出现了增大的趋势,导致能源消费量增 长速度超过经济增长速度,2 0 0 2 2 0 0 4 年连续三年的能源需求弹性系数大于l 。我 国1 9 7 8 2 0 0 7 年能源消费和g d p 总量及其年增长率变化趋势分别如图卜1 、图1 - 2 所示。 3 0 0 0 0 0 2 5 0 0 0 0 2 0 0 0 0 0 1 5 0 0 0 0 1 0 0 0 0 0 5 0 0 0 0 o 7 88 08 28 48 68 89 09 29 49 69 80 0 0 20 40 6 图卜11 9 7 8 2 0 0 7 年我困能源消费与g d p 总量图 华北电力人学硕:卜学位论文 o 4 o 3 5 o 3 o 2 5 0 2 0 1 5 0 1 o 0 5 o o 0 5 0 1 , , + : ; 绺8 l 鼢鼢鼯豁7 魅g 霪鲶9 弋孵筋铡童孵筋畜 垃也蛆砬宅幢锰缸磕世;缸龇t ;蛾? 。啦毫拖。,稿i ; 锄x 。f 。t 锰巍撼j 矗盅蕊:”。童h j 。? 2 幺,自 图i - 21 9 7 8 - 2 0 0 7 年我国能源消费与g d p 总量年增长率变化趋势图 随着经济的快速增长,发展背后的环境质量问题同渐突出。由于中国能源结构以 煤为主,近几年煤炭消费量持续大量增加。虽然在新建燃煤电厂开始装备脱硫设备, 但是煤炭燃烧引起的各种污染问题,特别是大气污染问题不但没有得到缓解,反而 有所上升,其中特别是二氧化硫的排放量明显上升,而在可预见的未来及相当长的 时期内,煤炭仍将是中国的基础能源,煤炭的消费量还将继续上升,这样就会使中 国的大气污染治理面临着巨大的困难。2 0 0 7 年中国二氧化硫排放量为2 4 6 8 1 万吨, 比2 0 0 3 年增长了1 4 3 ,其中工业排放量为2 1 3 9 9 8 万吨,较之2 0 0 3 年增长了 1 9 4 ,占全国二氧化硫排放量的8 6 7 ,是主要的排放增长来源。由于能源消费总 量的迅速上升,特别是煤炭消费量大量增加,中国的温室气体排放量也有显著增加。 中国各种环境污染问题都处于相当严重的局面。环境问题已经越来越成为人们关注 的焦点并且已经被作为一项重要的考核指标。但是,在实行环保政策,进行节能减 排的同时会不会影响到国民经济的发展,以及采取的坏保政策的侧重点应该放在哪 里,这些问题同样需要对能源与经济的互相影响关系做深入的调查。 能源问题已经成为影响我国经济持续发展的关键因素,能源节约问题也已成为 我国国民经济的长期发展规划中普遍关注的一个焦点。我国政府虽然采取了一系列 措施来改善环境污染问题,例如:我国“十一五 规划纲要明确提出了万元g d p 能耗 降低2 0 的目标,其中2 0 0 6 年节能目标是4 ,但实际能源消费只降低了1 5 ;我 国“十一五 规划提出的能源节约目标远未完成。国家发改委制定的我国中长期能 源规划中提出,在2 0 0 2 年2 0 2 0 年,我国g d p 增长4 倍,能源增长2 倍的目标。然 而从“十一五期间汽车、钢铁的发展情况能看出,我国工业进入了高速发展时期。 这个时期大批量集中消耗是不可避免的。可见2 0 2 0 年的远景规划目标还任重道远。 因此如何根据我国经济社会发展的状况,选择合适的能源节约路径,制定合适的能 源节约政策是我国必须要分析和解决的实际问题。 2 华北电力大学硕士:学位论文 1 1 2 我国经济增长对能源消费具有重要的影响 能源作为关系国家经济发展和国家政治经济安全的重要物质基础,一直受到人 们的普遍关注。能源作为经济增长的重要投入要素之一,一方面能源的消费能够促 进经济的增长,另一方面经济增长会拉动能源的消费。当今世界各国都把本国能源 资源情况作为规划经济发展的重要因素。作为地球上人口最多的国家,中国在世界 经济中正r 趋扮演一个与其人口规模相应的角色。这意味着,中国将是能源需求的 大国。 从历史的角度来分析,能源与社会发展之问的联系密不可分,人类在演进的过 程中,能源的利用起了非常重要的作用。能源是社会发展的物质基础,是人类社会 生产生活的主要动力来源和重要原料来源。对人类而言,能源是生存的必备条件之 一。而对于一国的经济而言,其基础地位决定了其对整个社会经济影响的敏感性和 细微性,持续、稳定、健康的经济增长是一个国家或地区快速发展的直观表现,它 在一定程度上决定着一个国家或地区人民生活水平提高的速度,直接影响着一个国 家或地区在政治、经济活动中的地位。目前世界各国比较关注的问题就是如何实现 经济的快速、稳定增长。但是影响经济增长发展的因素纷繁复杂,要保证经济的持 续稳定的发展,必须处理好影响经济发展的相关因素之间的关系。纵观世界各国的 社会经济发展过程,不难发现,社会生产力的提升,与能源消费水平有着紧密的联 系。充分的能源供应也是中国持续发展所必不可少的条件之一。能源作为历史发展 和社会进步的物质基础,它直接关系到国民经济繁荣和人民生活的改善。 从经济学上来看,能源与经济发展的关系,主要体现在两个方面。首先,经济 发展对能源有依赖性,即经济发展离不开能源其次,能源的发展也要以经济的发展 为前提,经济发展可以促成能源的大规模丌发和利用。经济增长有双层含义,一方 面,经济增长意味着大量生产,而大量生产意味着大量资源的投入,随之而来的便 是更大量的废物、污染物的排出。另一方面,由于中国人均能源供应一直处于较低 的水平。中国目前还面临着能源丌发程度低、能源利用效率低、能源消费结构不合 理以及污染严重的问题。而经济增长则需要高附加值技术的引入,通过技术的引入, 可以提高能源的利用率,促进产业的升级转换,使产业向污染较少,技术集约程度 高的产业转变,进而缓解以至解决有限的不可再生能源与无限的人类需求之间的矛 盾,缓解以至解决生态环境问题。首先,经济增长促成了能源的大规模开发和利用。 经济的快速增长,对能源的开采、加工都提出了更高的要求。不可再生能源的逐渐 耗竭及能源生产、利用过程中带来的生态坏境问题,却也严重阻碍着经济的进一步 发展同时,其次经济的快速增长,也为发展能源提供了资金保证。因为经济增长促 成了能源的大规模开发与利用,能源作为经济动力因素的同时也是一种障碍,能源 的逐渐耗竭及能源带来的尘态、环境问题都将严重阻碍经济的发展。 华北电力人学硕十学位论文 “十一五 提出未来我国能源战略的任务,单位国内生产总值能源消耗比“十 五”期术降低2 0 9 6 左右。面对这一挑战,我国现行的能源开发与使用方式不适应社 会经济可持续发展需要的矛盾同益突出。目前这种“低”的能源生产与消费状况, 明显不利于社会经济的发展,给中国社会的可持续发展带来了极强的危机感。依据 能源消费与经济增长之间存在的相互依赖关系,j 下确处理和认识能源消费与经济增 长之间的关联关系,对于社会经济的长远规划、能源发展战略以及有关法规的制定 都是十分重要的。 1 2 国内外研究动态 1 2 1 能源消费和经济增长之间的关系研究 能源消费和经济增长之间的关系问题一直是能源经济领域研究的焦点。从2 0 世纪7 0 年代开始,学术界开始对能源消费和经济增长之间的关系展开大量的实证 研究。c h r i s t e n s e n 等( 1 9 7 3 ) 【l 】从c - d 生产函数演化得出能源消费的超对数模型, 首次将能源作为生产要素引入c - d 生产函数,对能源消费进行分析。k r a f t j 等人 ( 1 9 7 8 ) 【2 】对美国1 9 4 7 1 9 7 4 年问的样本数据进行分析,发现美国的国民收入与能源 消费量之间存在着显著的因果关系,并且如果实施不恰当的节能政策就会对经济增 长造成负面影响。a a q e e l 与m s b u t t 研究得出了巴基斯坦能源消费总量、石油、 天然气、电力消费量和经济增长( g d p ) 及其就业率之问的关系为:一方面,经济增 长导致了能源消费总量以及石油消费的增加。另一方面,经济增长与天然气消费之 间并无因果关系影响。最终政策建议为更有效的利用石油以及用天然气来替代石油 会成为一个比较理想的政策手段。并且石油保护政策对巴基斯坦的经济增长不会产 生任何负作用,反而会加速经济增长,进一步扩大国内就业机会。 随着计量分析工具发展创新,s t e r n ( 1 9 9 3 ) 运用多元变量的向量自回归模型和 能源加权指数分析法,采用燃料结构对美国最终能源消费进行测量,发现美国能源 消费和g d p 之间存在g r a n g e r 因果关系。s t e r n ( 2 0 0 0 ) 【3 j 引入协整理论,进一步扩展 对美国能源消费和g d p 之间关系的研究范围,研究表明不仅能源消费对促进经济增 长具有显著效果,并且美国的g d p 、资本、劳动投入和能源消费之问存在协整关系。 此后,a s a f u a d j a y e ( 2 0 0 0 ) 【4 】以及o y t a s 和s a r i ( 2 0 0 3 ) 分别采用了误差修j 下模型分 析亚洲四国和“七国集团韵能源消费与经济增长相互关系。他们的协整分析结果 表明,在这些工业化发达国家中能源消费对促进经济增长具有显著的影响。国外目 前所采用的研究方法是计量经济学中比较流行的方法,研究了能源消耗与经济增长 的关系。但是,能源消耗不仅促进了经济增长,同时也对环境产生一定的影响从 目前的文献中来看,仅研究了能源消耗与经济增长的关系,而没有考虑到对环境的 影响。 4 华北电力人学硕:卜学位论文 近年来,国外学者应用许多模型对能源消费和供给进行了预测。p a u l c r o m p t o n ( 2 0 0 5 ) p j 应用b v a r ( b a y e s i a nv e c t o ra u t o r e g r e s s i v em e t h o d o l o g y ) 方法 预测了中国的能源消费并讨论潜在问题。k e ii c 和l o t t e r m a n r b 曾对此方法的建 立做出许多贡献。s i l b e r g l i t tr i c h a r d ( 2 0 0 3 ) 【6 1 等利用情景分析法对美国的能源 需求进行了预测。p i y u s ht i w a r i ( 2 0 0 0 ) 【_ 7 】运用投入产出模型对印度国民经济各部门 一年能源强度的发展趋势进行了研究。v i c e n t a l c a n t a r a 和r o s a o u a r t e 运用一个 投入产出结构化分解分析模型对欧盟国家的能源强度进行了比较。h a a sr e i n h a r d 和l e es c h i p p e r b ( 1 9 9 8 ) 瞵j 等研究了技术效率因素对o e c d 国家居民能源需求的重要 影响作用。w e b e rc h r i s t o p h 和a d r i a a np e r r e l s ( 2 0 0 0 ) 【9 】运用投入产出模型、情景 分析法等研究了生活模式的变化对能源需求及相应气体排放的影响。 国内,许多学者对能源消费和经济增长的关系也进行了大量卓有成效的研究。 杨文霞( 2 0 0 2 ) o j 阐述我国经济增长一直保持高增长率的原因,经济增长质量低的表 现,以及通过科学技术发展来提高经济增长质量和克服能源的制约。林伯强 ( 2 0 0 3 ) l j 利用三要素的生产函数,应用协整分析和误差修j 下模型研究了中国电力消 费与经济增长的关系,结果表明g d p 、资本、人力资本以及电力消费之间存在着长 期的均衡关系。表明中国的电力消费与经济增长具有内生性,并且两个变量是互相 联系的。马超群( 2 0 0 4 ) 1 2 】通过研究中国1 9 5 4 - 2 0 0 3 年g d p 和能源总消费以及能源各 构成部分包括煤、石油、天然气和水电力等之问存在长期均衡关系。研究结果表明 g d p 分别与能源总消费、煤炭消费之间存在协整关系,而g d p 与石油、天然气和水 电之间不存在协整关系。何永秀等( 2 0 0 6 ) 1 3 】基于1 9 7 5 - 2 0 0 2 年中国全社会电量及装 机容量等统汁数据,利用g r a n g e r 因果关系检验及误差修正模型,分析认为中国电 力消费对促进经济增长存在的单向的g r a n g e r 因果关系,而且装机容量和用电量的 增长都将推动经济保持快速增长。石晓烽和王述英( 2 0 0 7 ) u 4 】在新古典经济学生产函 数框架下,运用向量误差修证模型及中国1 9 6 0 2 0 0 5 年的统计数据对中国石油消费 与经济增长关系进行了实证研究,结果表明中国石油消费、资本存量、劳动投入与 经济增长之间存在稳定的长期均衡关系,并且中国石油消费已经对促进经济增长具 有显著的影响效应。我国对于能源消费与经济增长研究起步比较晚,九十年代以后 国内学者才陆续丌始研究能源与经济增长之间的相关关系。对于已发表的国内国外 文献来看,学者仅在能源与经济增长的相关关系上进行系统分析,没有考虑能源消 耗的同时也会带来严重的代价一环境污染,能源;经济增长与环境之间是息息相关 的。 为了解决能源短缺、供需平衡等问题,最有效的措施当为大力推行绿色能源计 划并并对能源进行科学、精确的预测,我国学者在这些方面也做了大量研究。 王立杰( 2 0 0 2 ) u s 选取对煤炭生产消费有直接影响的指标:国内生产总值增长率增长 率( g d p 增长率) 、煤炭消费增长率和煤炭消费占能源消费总量的比例为变量,运用 与 华北电力人学硕十学位论文 灰色系统理论,建立煤炭需求量的灰色预测模型g m ( 1 ,3 ) 。从对我国煤炭需求的预 测结果来看,对历史实际值拟合的非常好,表明了模型具有较高的可靠性,并利用 该模型预测了我国2 0 0 0 2 0 1 0 年的煤炭需求量。郭云涛( 2 0 0 4 ) 1 6 j 分析了我国煤炭消 费状况、变化特点和当前煤炭需求迅猛增长、供应紧张的原因,用能源消费弹性系 数法和主要耗煤部门测算法预测了国内煤炭需求,并对全国现有和在建的煤矿供应 能力作了调查分析。在综合分析的基础上,做出2 0 0 4 2 0 2 0 年全国供需预测结论。 佟阿思根、侯俊芝( 2 0 0 8 ) 【 】从增长迅速的能源消费量、能源的消费结构以煤为主 和f l 趋严峻的中国能源进口依存度三个方面阐述了我国能源消费的现状,并用线性 回归模型对我国能源需求进行了预测。 1 ,2 2 粗糙集理论 粗糙集理论在波兰数学家z p a w l a k 1 8 】于1 9 8 2 年首先提出后的几年内,由于理 论还不成熟,因而并未受到国际计算机学界的重视。直至八十年代术,粗糙集理论 才引起了世界各国学者的注意。自1 9 9 2 年在波兰举行了理论的第一届国际研讨会 以来,每年一度的国际理论研讨会定期在世界各国召开。可以这样说,目前理论己 经成为国际上人工智能研究的热点。 目前,国外对粗糙集理论的研究和应用发展的都比较快,尤其是1 9 9 2 年 r s l o w i n s k i 1 9 】主编的关于粗糙集应用及其相关方法比较研究的论文集的出版,推 动了国际上对粗糙集理论和方法的深入研究。国外已建立了不少的数据库领域知识 发现系统,它们一般都由数据预处理、基于粗糙集或其扩展理论的数据约简、决策 算法等部分组成。其大概思想是先进行必要的数据预处理,为数据约简做准备,并 在此基础上根据值约简等减少属性和个体数目,最终提取规则并将之应用于新对象 的分类。比较有代表性的有美国k a n s a s 大学开发的基于粗糙集的实例学习系统 ( l e r s ) ,r o u g hs e td a t ae x p l o r e r ( r o s e ) ,r e g if l a 大学利用粗糙集理论开发的知 识发现系统k d d r ,该系统目前被广泛的应用于医疗诊断、电信业等领域1 2 ,该系 统被应用于医疗诊断、社区规划、全球气象等研究方面【2 。 国外目前在粗糙集领域的研究主要集中在约简的优化算法、粗糙集理论和模糊 理论,粗糙集理论同神经网络理论等其他人工智能技术的结合、粗糙逻辑等课题上。 在国内,对粗糙集理论的研究和应用还处在起步阶段。王珏、苗夺谦等( 1 9 9 6 ) 【2 2 】在模式识剐与人工智能发表了关于r s 理论与应用论述,介绍了粗糙集理论 的主要原理、基本算法和在知识发现、决策分析等方面的应用,开始了国内粗糙集 理论的研究和应用【2 3 】;曾黄麟( 1 9 9 5 ) 【2 4 1 翻译的粗集理论与应用是国内第一本 关于粗糙集理论的专著;常犁云【2 5 】等对属性值约简算法做出了改进,提高了样本分 类的正确率;韩祯祥,张琦【2 6 】等将粗糙集方法应用于电力系统故障诊断警报处理, 6 华北电力人学硕卜学位论文 效果良好。对粗糙集理论研究得比较深入和透彻的是苗夺谦、王珏等( 1 9 9 7 ) 2 7 】,他 们不但提出了基于粗糙集的多变量决策树的构造方法,而且还把粗糙集中的概念和 运算从代数角度提升到信息角度,对人们深刻理解、裉糙集理论的本质和寻找高效的 知识约简算法奠定了基础。粗糙集理论的生命力在于它的实用性,从诞生到现在不 过2 0 多年,就已经被广泛应用到许多领域。王国胤等( 2 0 0 2 ) 2 8 】从信息论观点出 发对r o u g h 集理论的基本概念和主要运算进行分析讨论,通过与r o u g h 集理论的代 数观点进行比较分析,得到这两种观点下的一些等价性质和不同的特性,并基于条 件信息熵提出决策表的约简算法钟波,肖智等( 2 0 0 2 ) 2 9 】给出了对象与规则可信 度的概念,提出了一种基于粗糙集理论的相关关系预测方法,并利用定量预测【3 0 l 建立了预测模型。孙士保、秦克云( 2 0 0 6 ) 3 1 】将粗糙集应用于股票数据分析,用粗糙 集方法分析了十年问的股票历史数据,研究了股票价格与经济指数之间的关系,获 得的预测规则得到了华尔街证券交易专家的认可。 基于粗糙集理论的属性约简是一个非常有研究价值,也是一个非常有挑战性的 研究课题,w o n gs k m 和z i a r k o w ( 1 9 8 5 ) 3 2 】己经证明属性约简和规则提取算法都 是n p h a r d 问题。因此需要研究更为有效的简化算法。有效地获取较优的属性约简, 降低算法的时间复杂性,成为粗糙集理论研究的重点之一。目前人们己经做了许多 工作,也提出了许多算法,现有的关于约简的文献大部分都是在基于属性重要性和 基于分辨矩阵两种算法的基础上提出的启发式属性约简的方法。文献【3 3 0 5 】介绍了利 用分辨矩阵进行属性约简方法,文献【3 6 】在文献【3 3 l 基础上利用分辨矩阵的特有性质! 直 接求取信息系统核,简化了文献【33 】的分辨矩阵属性约简方法,但并没有给出相应的 基于分辨矩阵的值约简算法;文献【3 7 】提出一种基于粗糙集的近似质量( 可以说是属 性重要性的一种形式) 求取属性约简的算法,文献【3 8 】结合了粗糙集理论和贪心的启 发性知识来有效进行特征选取( 属性约简) ,文献【3 9 1 给出了基于属性重要性的约简算 法,但都没有给出启发式的值约简算法。文献【2 5 】利用分辨矩阵和数学逻辑运算得到 属性约简,并给出了一般值约简算法,文献【4 0 】在文献【2 5 】的基础上给出了一种新的值 约简算法,但这些值约简为了得到最简规则集。周勇,杨兴江等( 2 0 0 4 ) 【4 1 】给出了 一种属性约简的依赖度算法,通过属性约简来确定各属性的依赖度。朱红( 2 0 0 5 ) h 2 j 发现了粗集中传统依赖度表示方法的局限性,提出一种改进的依赖度表示方法。 孟庆全,梅灿华( 2 0 0 7 ) 【4 3 j 提出了新的属性集依赖度的概念,给出了属性集依赖度 的求解步骤和算法。针对单一属性依赖度与属性集依赖度的差别,讨论了属性集依 赖度的意义,得出属性集依赖度更加可信的结论。 粗糙集理论除了在电力负荷预测和电力需求预测上有极少的应用外,在能源消 费中的应用方面的文献非常少。其中在电力符预测中的应用有:徐剑( 2 0 0 8 ) 4 4 】 利用举h 糙集理论来进行电力短期负荷预测分析,提出了基于粗糙集理论的遗传神经 网络短期负荷预测方法和基于扶色系统的相关因素敏感模型短期负荷预测方法。雷 7 华北电力人学硕+ 学何论文 绍兰,孙才新等4 5 1 采用粗糙集理论的不可分辨性关系约简可能影响小区用地决策的 距离和环境等相关属性,得出决定小区用地类型的决策推理规则库。张春雷4 6 】应用 粗糙集理论分别建立相应的负荷预测模型。采用某电网提供的数据进行了负荷预 测。在电力需求预测中的应用有:钟波,肖智等( 2 0 0 2 ) 2 9 】首先建立了粗糙集预测 模型,并以某地区1 9 5 5 - 1 9 8 4 的数据为样本进行了该地区用电量的预测。 1 3 论文研究的主要思路和结构 本论文将采用理论研究与实证分析相结合的方法,运用r o u g hs e t s 理论中的 属性重要性、属性约简与规则可信度理论对我国能源消费情况进行分析和预测。在 前述的文献中,得出了共同的结论是:g d p 总量和能源消费相关度很高。但直接利 用g d p 总量来研究其对能源消费的关系,就掩盖了g d p 各构成要素对能源消费的影 响。由于g d p 构成要素中的投资、最终消费支出、出口总额等对能源消费有不同的 影响机理和影响程度,因此直接根据g d p 总量和能源消费之间的弹性系数来进行能 源消费分析和预测存在一定的问题。因此,考虑到近几年中国经济发展的实际情况, 本文在上述文献结论的基础上,研究中国能源消费的增长情况及其与经济增长内部 ( 投资、最终消费支出、出口总额等) 之间的关系,同时增加了重工业比重、城市 人口因素,对影响我国能源消费的因素进行分析,并在文章的最后进行能源消费的 预测。论文将选取1 9 8 1 2 0 0 7 年2 7 年的统计数据【4 。7 1 ,这对于论文解释变量的数量 ( n = 5 ) 考虑也是能真实反映分析和预测结果的【4 8 4 9 5 0 1 。 论文的整体结构将包括如下几个部分: ( 1 ) 选择离散化方法。在运用粗糙集理论的基础上需要先对连续性数据进行 离散化,本文选用模糊c 一均值聚类( f c m ) 算法对原有数据进行离散化。建立特征 化数据决策表。 ( 2 ) 利用粗糙集属性约简和属性重要性理论分阶段对我国1 9 8 卜1 9 9 0 , 1 9 8 6 - 1 9 9 5 ,1 9 9 1 - 2 0 0 0 ,1 9 9 6 - 2 0 0 5 ,2 0 0 1 - 2 0 0 7 的各影响因素对能源消费的影响程 度进行了分析,揭示了我国能源消费各影响因素对能源消费影响程度在近3 0 年来 的变化以及影响因素的影响机理。 ( 3 ) 通过提出一种相关关系预测法建立了我国能源消费的预测模型,对能源 消费量进行了预测分析。 ( 4 ) 根据分析结果对能源政策的实施与制定提供意见和建议。 华北电力人学硕十学位论文 第二章f c m 算法与粗糙集理论 粗糙集理论是一种用于处理不确定性和含糊性知识的数学工具,其基本思想是 在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供 相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,即 知识,找出其内部数据的关联关系和特征。 粗糙集理论易于处理离散数据,要实现连续数据的粗糙集约简处理,需将连续 数据离散成有限的语义变量或符号将连续数据进行离散化的方法有多种:如等距 离划分、等频率划分等1 5 n ,使用这些方法需用户对数据特征有较清楚的认识。苗夺 谦p z j 提出了一种基于粗糙集理论的离散化方法,但是如果新数据来自于训练样本数 据没有的覆盖空间时,就难以给出准确的类别预测。f c m ( 模糊c 一均值聚类) 是一 种广泛适应于机器学习与数据挖掘的方法,它依据对象之间的相似程度,将对象聚 合成有限的几个类别。该方法与其它方法相比较仅需用户提供最终的聚类数目,经 f c m 处理后可得到数据隶属于各聚类中心的隶属度值。当新数据来自于训练样本外 时,可通过模糊判掘来计算其离散值,因此本文采用f c m 对连续数据进行离散化处 理。 2 1 模糊c 一均值聚类( f c m ) 算法 2 1 1 隶属度函数的概念 关于模糊理论,我们首先介绍隶属度函数。隶属度函数是表示一个对象x 隶属 于集合彳的程度的函数,通常记做, u a ( x ) ,其中自变量范围是所有可能属于集合彳的 对象( 即集合a 所在空间中的所有点) ,取值范围是 0 ,1 ,即0 - , u a ( x ) = l 。 彳( 石) = 1 表示x 完全隶属于集合彳,相当于传统集合概念上的x a 。一个定义在 空间x = x ) 上的隶属度函数就定义了一个模糊集合彳,或者叫定义在论域x = x ) 上的模糊子集么,对于有限个对象五,屯,吒模糊集合a 可以表示为: a = ( 彳( 誓) ,t ) it x ) 模糊集合与非模糊集合的区别如表2 1 。 表2 1 模糊集合与非模糊集合的区别 非模糊集合( h a r ds e t ) 模糊结合( f u z z ys e t ) 元素属于或不属丁集合用隶属度值表示元素属丁集合的程度 隶属函数二值函数,取值0 或1o 函数值 = 舌c = 刍c 等n “嬲 ( 2 2 ) 这里介于0 ,1 间;c f 为模糊组i 尉聚类前厶,吒= iq 一工,i i 为第1 个聚类 中心与第j 个数据点间的欧几里德距离;m 【l ,0 0 ) 是加权指数。 为了得到数据集合的最佳的模糊划分,需要求m i n j ( u ,c ,q ) ) 。构造如下新 的目标函数,可求得使上式达到最小值的必要条件: j ( u ,c l ,c c ,锄) = j ( u c 1 ,) + 户ni 勺( 毛“i y 一1 ) =量弦d孑iii=l+ 差。o ( 蓟_ 1 ) ( 2 3 ) = “;y+ a ,( 甜f ,一1 ) ( 2 3 ) , 7 ,= 1 ,f = l 这里乃,j = l 到n ,是( 2 1 ) 式的n 个约束式的啦格朗同乘子。对所有输入 参量求导,使式( 2 2 ) 达到最小的必要条件为: q = f n m 歪1 甜 ,x j : = 1 r nm “耖j = l ( 2 4 ) 2 矿 q 5 1 0 华北电力大学硕+ 学位论文 4 ) 计算c 个聚类中心q ,i = l ,c 。 2 2 ) 计算价值函数。如果它小于某个确定的阀值,或它相对上 量小于某个阀值,则算法停止。 计算新的u 矩阵。返回步骤2 。 算法也可以先初始化聚类中心,然后再执行迭代过程。 2 1 3m a t l a b 实现模糊聚类 m a t l a b 作为一种强大的数学分析工具,已被广泛用于科学计算,数据分析中。 它自身带有模糊逻辑工具箱。具有强大的矩阵运算能力。利用m a t l a b 可以很方便 的实现数据模糊聚类分析。基于f c m 的数据聚类分析流程如下: ( 1 ) 标准化数据,计算标准化的度量值( z - s c o r e ) 。用极差标准化法,调用函数 z s c o r e0 ,标准化数据矩阵。 ( 2 ) 建立模糊相似矩阵。根据确定的聚类数,用一组满足( 2 1 ) 式的随机数初始 化隶属矩阵u 。 ( 3 ) 算法丌始迭代。直到目标函数收敛到极小值。 ( 4 ) 根据迭代结果,由最后的隶属矩阵确定数据的所属的类。以不同的标记显 示最后的聚类结果。 在f c m 算法的命令 c e n t e r ,u ,o b j f c m = f c m ( d a t a ,r 1 ) 中,需要根据数据d a t a 确定分类数n ,算法的最后输出的为一个n k 的一个模糊划分矩阵,这个矩阵表示 的是每个样本点属于每个类的隶属度。根据隶属度最大原则,从该矩阵的每列数据 中选取隶属度最大的样本点,再进行归类。 m a t l a b 自带的f c m ( ) 聚类函数本身就可以实现模糊聚类,并且返回聚类中心 c e n t e r 和最后的隶属矩阵u 。下图2 - 1 是对一组二维随机数据用f c m 模糊聚类的结 果。可以看到f c m 聚类算法有很好的聚类表现,对孤立点也比较敏感。数据按照要 求,分割为三类,并且看到三类之间界限很清晰。 华北电力人学硕:卜学位论文 f c m 聚类实例匿 2 。2 粗糙集理论 2 2 1 知识与知识库 图2 - 1f c m 聚类图 在粗糙集理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力。 假定有关于论域( u n i v e r s e r ) 的某种知识,并使用属性( a t t r i b u t e ) 及其值( v a l u e ) 来描述论域中的对象,例如:空间物体集合【,具有“颜色”、“形状”这两种属性, “颜色 的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形。从离 散数学的观点看,“颜色 、“形状 构成了u 上的一族等价关系( e q u i v a l e n t r e l a t i o n ) 。u 中的物体,按照“颜色”这一等价关系,可以划分为“红色的物体”、 “黄色的物体”、“绿色的物体等集合;按照“形状 这一等价关系,可以划分为 “方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+ 形状 这一合 成等价关系,又可以划分为“红色的圆物体 、“黄色的方物体 、“绿色的三角形物 体”等集合。如果两个物体同属于“红色的圆物体 这一集合,它们之间是不可分 辨关系( i n d i s c e r n i b i l i t yr e l a t i o n ) ,因为描述它们的属性都是“红 和“圆”。 不可分辨关系的概念是粗糙集理论的基石,它揭示出论域知识的颗粒状结构。 设u 矽是我们感兴趣的对象组成的有限集合,称为论域。任何子集x u 称为 u 中的一个概念或范畴( 认为空集也是一个概念) 。u 中的任何概念族称为关于u 的抽象知识,简称知识。本文主要是对在u 上能形成划分的那些知识感兴趣。对于 论域u 上的一族子集 五,五,置, ,如果( ) x i = u 且x in xr ,x i 矽,对于 i = l 。 1 2 华北电力人学硕十学位论文 i j , i ,= l ,2 ,l ,则称 五,x 29 oo , 以) 为u 的一个划分。 定义lu 上的一族划分称为关于u 的一个知识库【5 3 】( k n o w l e d g eb a s e ) 。一个 知识库就是一个关系系统k = ( u ,r ) ,其中u 是非空有限集,尺为u 上等价关系的 个族集。 u 尺表示尺的所有等价类( 或者u 上的分类) 构成的集合, x k 表示的是包 含元素x u 的穴等价类。 定义2p 震且p 9 i i ,则尸中所有等价关系的交集也是一个等价关系,称为 户上的不可分辨关系,记为i n d ( p ) ,且有【x k 捌= g 【x k 这样,u i n d ( p ) ( 即等价关系i n d ( p ) 的所有等价类) 表示与等价关系族p 相 关的知识,称为k 中关于u 的p 基本知识( 尸基本集) 。为简单起见,用u p 代替 u i n d ( p ) ,i n d ( p ) 的等价类称为知识p 的基本概念或基本范畴,特别地,如果 q r ,则称q 为k 中关于u 的q 初等知识,q 的等价类知识尺的q 初等概念或 q 初等范畴。 同样,当k = ( u ,r ) 为一个知识库,i n d ( k ) 定义为k 中所有等价关系的族【5 4 1 。 2 2 2 近似与粗糙集 粗糙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论