下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于粗糙集的人力资源评价的规则挖掘 摘 要 应用粗糙集理论和区分矩阵来挖掘各因素规则的方法对一个人力资源评价的例子进行分析和处理,挖掘评价规则,并从客观的数据中得出了各主要因素的客观权重。 关键词 粗糙集; 人力资源;
2、; 规则; 权重 1 前言 粗糙集(Rough sets)理论是一种处理模糊、不精确的分类问题的新型数学工具。粗糙集理论已成为当前数据挖掘的主要方法之一,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。该理论已被成功地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘领域。 人力资源是指社会所拥有的能为社会创造价值的人力或劳动力,其本质是人的能力而不是人本身,人力资源的价值在于人掌握的知识和技能,在于人为社会创造价值的能力。人力资源评价就是通过分析影响人力资源价值
3、的主要因素,结合一定的评价方法,进而得出一个综合评价值的过程。2 粗糙集处理的基本步骤及算法 收集和整理数据,组成信息表。 数据预处理。将数据库中的初始数据信息进行分类、聚类分析以及使某些属性的连续值离散化,转换为粗糙集形式,明确条件属性和决策属性。 属性约简,根据预处理后的数据信息表生成区分矩阵,利用区分矩阵法生成约简属性集。区分矩阵(Discernibility Matrix)是由波兰华沙大学的著名数学家skowron提出来的,是近年来在粗糙集约简上出现的一个有力工具。利
4、用这个工具,可以将存在于复杂的信息系统中的全部不可区分关系表达出来。 定义1:设有信息系统S,a(x)是记录x在属性a上的值cij表示区分矩阵中第i行,第j列的元素,这样区分矩阵的定义是:(cij) 其中i,j1,2,3,n,这里n 在获得区分矩阵的时候,还有一种情况没有列出来,就是a(xi)a(xj),D(xi)D(xj)的情况,在有些资料中,将这种情况下的cij赋了一个1;有些则不讨论这种情况,因为他们认为在数据表的预处理阶段会对数据表中冲突的记录做处理,使其不加入到数据中,并且将
5、冲突的记录数除以记录总数,得到一个粗糙度的量度,该量度可以作为数据表的一个特征。本文遵从后一种处理方法,对冲突的记录不予讨论,认为数据表中没有冲突的记录。 定义2:区分函数是从区分矩阵中构造的,方法是把cij的每个属性“或”起来,然后再“与”其所有的cij,其中i,j1, 区分矩阵是一个对称 根据区分矩阵的概念,有三点值得注意: 区分矩阵中条件属性组合数为1的元素项,即Card(cij)1,表明除该属性外其余条件属性无法将决策不同的两条记录区分开来,
6、即该属性必须保留,这个与决策表中核的概念一致。因此,矩阵中所有条件属性组合数为1的属性均为核属性。 区分矩阵中凡是条件属性组合中包含有核属性的矩阵元素都可以仅用核属性就把决策不同的记录区分开来,也就是说属性组合中凡是包含有核属性的区分矩阵项的其它条件属性都是多余的。 对于不包含核属性的属性组合必然每个组合都至少有一个元素成为约简后的一个条件属性,否则决策表中的某些记录将无法识别。 属性约简的基本过程如下: 第一步:生成区分矩阵,将矩阵中属性组
7、合数为1的属性列入最终的属性约简集合,即Red=Core= cijCard(cij)=1,i,j=1,2,3, 第二步:从区分矩阵中找出所有不包含核属性且cij0属性组合Q,即:Q cijcijCore=,且cij0,i,j1,2,3, 第三步:将所有不包含核属性的条件属性组合表示为合取范式的形式,即:P(cij),cijQ。 第四步:将P转换为析取范式的形式,并进行化简。 第五步:根据需要选择不同的属性组合作为约简。
8、0; 选取约简属性后的信息表,对每个规则求出其核属性,得到各规则的核值。 定义:具有相同条件属性而有不同决策属性的对象成为不可分辨的对象。 基本思想:考虑依次去掉各个属性,若存在不可分辨对象,则说明该属性为必要属性,即核值。若去掉该属性时,无不可分辨对象,则说明该属性为冗余属性,可省略。 根据核值表产生约简规则。 基本算法: 输入:信息系统S=(U,CD, V, f ) 输出:约简
9、后的决策规则集。 步骤: 计算区分矩阵;int i=1,j=0; int k=card(U); &
10、#160; M=; while(1ik)
11、0; for(i=0;i+;ik) for(j=i+1;j+;jk) if (D(xi) D(xj) mij=a C:a(xi) a
12、(xj) else M=M mij 得到CORE;i=1;CORED(C)=;从头取M中元素,若为单一属性组合则将该属性加入CORED(C), 进行属性约简从M中删除含有核属性的组合。Q cijcijCORED(C)=,且c
13、ij0P(cij)将P转换为析取范式的形式 P=(ci*)ci*为约简的属性集合 一约简的属性集合ci*,对每一个规则求核属性 for(j=1;j+;jm)(m 为每个规则的属性个数) 每次假设从规则中去掉一个属性aj if 不存在不可分辨的规则 then 去掉
14、该属性 else aj为该规则的属性核值 根据每一规则的核值,列出约简的规则集合。若对每一个对应的决策值该规则组合是既约的且在系统中为真时为约简规则。 求出各约简属性的权重。 通常情况下,决策者会拥有对各个条件属性的先验知识,权重用来衡量属性的相对重要性。在不同的决策环境下,相同的属性对决策输出会有不同的影响,即权重对环境敏感。粗集理论中的属性重要度表达
15、了当前数据环境下属性对决策的影响,但它不能反映决策者的先验知识。因此,将二者结合起来确定属性的权重可以得到比较理想的结果。这样我们将粗集理论同决策者的先验知识结合起来,即将由大量的历史数据确定出来的客观的属性重要度同由主观的先验知识确定的属性权重结合起来确定最终的综合权重,从而实现主观先验知识同客观情况的统一。 我们假设系统中的条件属性为C,决策属性为D。在C中有n个属性a1,a2,an。由决策者先验知识给定的权重分别为p(a1), p(a2), , p(an)。然后收集大量的评价样本,由这些样本数据来考察所有条件属性将样本划分为决策类的分类能力,并由决策属
16、性对条件属性的依赖度rC(D)=Card(posC(D)/Card(U),其中Card表示集合的基数。然后去掉条件属性i后,在重新考虑分类情况,求出rCi(D)=Card(posCi(D)/Card(U),则属性i的重要度为rC(D)rCi(D),以此类推。在此基础上将各个属性的重要度进行归一化处理并把处理后的结果q(ai)作为属性i的客观权重。即q(ai)3 应用实例 数据采集。在人力资源评价中,各属性值用3,2,1分别表示“优,中,差”。指标对象知识量a创新能力b交流能力c适应能力d毕业院校e健康状况f心理承受能力g进取欲望h评定结果i11122233322111211321323211212341212121115312223333622322333372211312228233312233 使用区分矩阵进行属性约简,建立
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家长会培训怎么做
- 《五苓散对水负荷大鼠利尿作用及与水通道蛋白-1相关性的初步研究》
- 小产权房合同范本
- 《基于改进收益法的ZD公司海域使用权价值评估案例研究》
- 物业代表业主签订合同范本
- 商场搭建合同范本
- 前端开发合同范本
- 《熊果苷、硒和血红素体外抗氧化作用的研究》
- 《跆拳道运动员临场应激评价与应付方式的研究》
- 《肠三叶因子对烧伤小鼠肠黏膜免疫功能影响的实验研究》
- 2020医用氧药典标准
- 七年级生物作业设计
- 2023年考研英语二真题(含答案及解析)【可编辑】
- 人教版九年级化学第一至四单元测试卷及答案
- 食堂员工规章制度
- 英文介绍中国饺子-PPT
- 软件工程(嵌入式培养)专业职业生涯规划书
- 精力管理-课件
- 提高工作效率有技巧(一)课件
- 1+X证书无人机练习题库含答案
- 违法发放贷款罪
评论
0/150
提交评论