熵值法原理及应用实践幻灯片_第1页
熵值法原理及应用实践幻灯片_第2页
熵值法原理及应用实践幻灯片_第3页
熵值法原理及应用实践幻灯片_第4页
熵值法原理及应用实践幻灯片_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、美商天睿信息系统(北京)有限公司 2013年3月,熵值法原理及应用实践,培训目标,熵值法原理及应用实践,2,熵值法如何计算权重?,3,怎样合理应用熵值法?,熵值法是做什么用的?,1,日常工作中常常需要计算指标权重,专家打分法(德尔菲法) 层次分析法(AHP) ,主成份分析法 因子分析法 ,多元回归赋权法 线性回归 逻辑回归 ,熵值法,请大家想一想,你知道的几种指标赋权方法?,赋权算法分类,对于权重的确定,目前已提出各种不同的方法,可以分为:,往往依靠专家打分和定性分析 精确性不够 主观性太强,一般采用数理统计方法和技术 过于依赖数据,缺乏业务指导 很多方法不能反映指标对目标的影响方向,主观赋权

2、,客观赋权,二者结合 使用最有效,“熵”是一种客观的赋权方法,“熵”原本是物理中热力学概念,后来发展为信息论的熵值法理论,在指标赋权方面的应用比较广泛。 “熵”是不确定性信息的度量(就好比人的身高、体重,可以用来衡量人的体格):信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。,指标赋权中熵值法的一般原理,根据熵的特性,我们可以用熵值来判断某个指标的离散程度:指标熵值越小,离散程度越大,该指标对综合评价的影响(即权重)也就越大。,熵值法原理及应用实践,2,熵值法如何计算权重?,3,怎样合理应用熵值法?,熵值法是做什么用的?,1,“熵”的一般计算公式,其中:,,n为总样

3、本数,,为指标值,一个规划求极值问题,“权”的一般计算公式,其中:,为第j个指标(维度)的熵,m为指标总数,利用样本数据上感受下熵的变化,请大家动一动手,用EXCEL计算出样本数据的熵! 感受下不同分布的指标数据算出来的熵值会怎样变化?,详见附录1,熵值法的一般步骤,熵值法的一般步骤之一:确立指标体系,案例解说,我们用手游认知客户挖掘模型实例来解说熵值法计算指标权重的全过程。下图是手游认知客户挖掘模型的二级指标评价体系,其中各个维度指标对应的权重系数均是通过熵值法计算出来的。 下面具体看下模型中 “手游认知能力”部分指标权重的计算过程。,一级,二级,熵值法的一般步骤之二:清洗指标极值,案例解说

4、,方法:即剔除各指标中极大或者极小的值,一般用比较合理的上下限值替换这些极值。目的是减少极值数据对该指标的熵的影响; 原则:剔除占样本总数不到1-2%但指标值贡献率超过20-30%以上的极值样本,去极值后,熵值法的一般步骤之三:归一化指标处理,案例解说,方法:指标归一化过程也称之为指标的无量纲化,即将指标实际值转化为不受量纲影响的指标平价值。方法比较多,具体见附录无纲量化方法一览; 原则:比较常用的是临界值法和Z-score法(更合理,保持了数据的连续性,减少数据信息丢失),最终将所有指标转化为正区间里面,二者具体处理如下:,分箱处理,逻辑处理,临界值法,Z-score法,1,2,3 ,100

5、,(0,1,熵值法的一般步骤之四:计算指标“熵”和“权”,案例解说,类似,按此公式还可以继续计算出,和,同理可以计算出,和,熵,权,熵值法的一般步骤之五:指标加权计算得分,案例解说,利用以上3个指标的权重和归一化指标值,计算上级指标的分数: 手游认知能力得分= 0.336*手游历史付费金额 +0.212*手游访问次数 +0.452*手游访问天数。 当然,模型其他部分的底层指标权重和一级指标权重均可以按以上步骤计算得到,并一层层由下往上进行加权,最终得到模型的综合得分。,方法:计算综合得分就是指标合成的过程,一般可以采用加法原理和乘法原理; 原则:最常用的是加法合成法,其具体处理如下:,加法合成

6、法,熵值法原理及应用实践,2,熵值法如何计算权重?,3,怎样合理应用熵值法?,熵值法是做什么用的?,1,熵值法的优点在于其客观、准确和简便,优点,熵值法能深刻反映出指标的区分能力,进而确定权重。这种思想和我们的得分评价模型指标选择的机理是一致的; 是一种客观赋权法,有理论依据,相对主观赋权具有较高的可信度和精确度; 算法简单,实践起来比较方便操作,无需借助其他分析软件实现。,熵值法不是万能赋权法,缺点,智能程度不够高。与多元回归和主成份等统计方法不同,它不能考虑指标与指标间横向的影响(如:相关性),更不能确定指标对目标/得分的影响方向(如:正相关或负相关); 同其他客观赋权法一样,若无业务经验的指导,权重可能失真; 对样本的依赖性比较大,随着建模样本变化,权重会有一定波动;,项目中合理应用熵值法的几点个人经验:,必须结合专家打分法才可以发挥熵值法的优势。事实上,指标评价体系建立的基础就是专家经验; 在确定权重前,需要完全确定指标对目标得分的影响方向。非线性的指标要么剔除,要么进行预处理; 熵值法对底层指标比较适用,而对上层指标权重需要重点借助专家经验; 不要怕麻烦,好好处理所有指标的极值问题,对权重的优化有好处;,个人经验,附录,1. 计算熵值的数据样本,附录,附录1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论