人员素质测评与选拔1_第1页
人员素质测评与选拔1_第2页
人员素质测评与选拔1_第3页
人员素质测评与选拔1_第4页
人员素质测评与选拔1_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/11/281第一章人员素质测评导论教学内容:1-1人员素质测评的内涵1-1-1人员素质测评的定义1-1-2人员素质测评的相关概念1-1-3人员素质测评的内容1-2人员素质测评的历史1-2-1人员素质测评的起源1-2-2科学素质测评的兴起1-3人员素质测评的功能与种类1-3-1人员素质测评的基本功能1-3-2人员素质测评在HRM中的应用2024/11/282广义的测评广义的测评包括主观性测评和客观性测评主观性测评个人面试证明核查简历评价主要缺陷:表面性:以获取表面信息为主,难于获取深层信息;短期性:以评价现有水平为主,难于评价发展潜能;模糊性:以定性化描述为主,缺乏定量化的科学工具;主观性:依赖于主观经验,缺乏客观评价标准。

2024/11/283测量(Measurement)测量:是给对象赋值的过程,以便使对象的某种特性可以通过数值本身的特性准确地表达出来。心理测量的任务在于用系统科学的方法对个体赋值,用数字差异揭示个体差异性。测量的种类:直接测量:能够直接测得事物属性的测量。间接测量:不能测得事物属性,只能根据测量结果去推测事物属性的测量。心理测量测量的方法:观察法、测验法、实验法2024/11/284心理测量(PsychologicalMeasurement)心理测量∶是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。也就是通过对人们的有限的具有代表性的行为进行观察,依据预先确定的原则,对贯穿在行为活动中的心理特征进行推论和数量化分析,由外部行为推及内在特征的过程。心理测量与人事测评的关系:心理测量是人事测评的手段和基础,人事测评是以人为对象,是对人的测量,这正是以心理测量为基础的。2024/11/285测验(Testing)测验:是一种方法,是在标准的情况下取出个体行为来进行分析和描述,以准确把握个体差异的过程。心理测验就是运用测验这种方法来测量个体差异的工具。例如考试。心理测验:是心理测量的一种具体方法和手段,它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处水平的手段。测验与测量的区别:测量只注重数字系统与测量对象之间的可比性;测验则不仅注重可比性,更注重赋值的标准化过程,注重测验分数的参考体系。2024/11/286评价(Assessment)评价:是一个回答问题、解决问题的过程。通过收集事实或数据信息,整理、分析和解释数据以便作出对特定问题的回答。一般包括问题说明、数据收集、数据分析与解释三个步骤。测验与评价的区别:测验注重数量方面的测定,强调客观性和数量化;评价既注重数量分析又注重性质分析,强调主观估计与客观测量相统一;测验着重对现状的确定,评价着重“解释”和“判断”;测验是单一的活动,评价是综合的活动;测验的目的在于求得数量多寡和差异,类似“透视”和“化验”,评价类似“诊断”和“治疗”,即通过化验做出结论。2024/11/287人事测评PersonnelAssessment测评:测评是测量与评估的综和。“测”包括测评者的“望、闻、问、切”,即耳听、目睹、体察、访问与调等。包括测量、测验、测试、探测与观测。“评”即评论、评价、评定。人事测评:指测评主体采用科学的方法,收集被测评者在主要活动领域中的表征信息,针对某一素质测评目标体系作出量值或价值的判断过程。或者直接从表征信息中引发与推断某些素质特征的过程。简而言之,就是运用测验等手段测量个体素质的差异,以便对个体的使用、培养、发展和引导做出正确评价的过程。2024/11/2881-1-3人员素质测评的内容素质:个体完成一定活动与任务所具备的基本条件和基本特点。是个体完成任务、形成绩效及继续发展的前提。思考:素质对于个体行为发展与事业成就有何作用?人员素质测评内容的确定有无统一标准?是否每一次测评都意味着全面评价人的素质?2024/11/289素质的构成(德、才、学、识、体)

——萧鸣政素质身体素质心理素质体质体力精力文化素质品德素质智能素质其他个性素质(性格、气质、兴趣等)2024/11/2810现代人事测评的主要内容是个人稳定的素质特点:能力因素:科学智能和社会智能。前者来自于人与自然交往过程中的直接经验或者人通过书本学到的间接经验;后者则来自于社会实践,通过人与人之间的交往、联系、竞争与合作来获得。(智商与情商)。动力因素:价值观(理论型、经济型、审美型、社会型、政治型、宗教型)、动机、兴趣。

2024/11/2811资料:北京市人才素质测评中心的测评服务一般测评大约需要两个半小时,其中与测评师进行半小时的面谈,不超过二小时的时间填写调查问卷,然后测评师对问卷进行分析、总结,这需要等待一个星期。最后依据被测者的经历与学历、爱好等给出一个可操作的、在现实中易行的职业指导方案。例如:学管理的林先生5月进行了个人素质测评,报告显示,他的一般认知智慧商数为122(人才群体平均分为100),处于上等水平;情感和社会交往智慧商数为128(人才群体平均分为100),与同龄人相比,他的社会成熟程度和心理健康程度处于上等水平;从行为风格测评结果看,林先生做事细致、稳健、认真、精确,善于把复杂的事情条理化,是一个很好的任务执行者。外向、乐群、好友;喜欢制定工作计划,然后有计划地实施。适合作具体的和资料性的工作,如:事务管理、人事管理、统计、调查等。日前,根据此项测评结果,林先生已获取了一家外企公司的人力资源经理职位。2024/11/28121-2人事测评的历史中国是心理测评的故乡。

——吉尔伯特.萨克斯(美)2024/11/28131-2-1人员素质测评的起源性相近,习相远;上智与下愚;中人以上,可以语上也;中人以下,不可以语上也。——孔子权然后知轻重;度然后知长短。物皆然,心为甚。——孟子自两汉至魏晋,实行举贤推荐制,“贤、良、方、正”成为举荐的标准。三国刘劭《人物志》,奉行“中庸至德”的儒家教义,对人的形质、人性、才具及志业综合分类,属列甚详。主张用“考课核实”的方法判定其“心志”大小,归于“圣贤、豪志、傲荡、拘懦”等不同类别;用“八观与五视”减少“考课”的误差。成为察举用人和品鉴人才的工具书。科举取士:六艺(礼乐射御书数);五经(法律、军事、农业、税收、地理);八股文(儒学经典)周岁试儿、七巧板、九连环2024/11/2814中国古代测评思想与方法测评内容:德、性、识、绩、智测评指标:日常言行(特定情境下的言行)工作绩效(军功、考课制)生理因素及特征(面相)服饰外观五行阴阳测评技术:观、察、问、忖、论、试、访、听2024/11/28151-2-2科学素质测评的产生与发展18世纪末法国资产阶级学习中国考试制度建立文官考试制度;

近代科学测验始于19世纪,法国医生伊斯奎洛尔和舍加英,用心理测验诊断心理缺陷并确定护理的标准;(精神异常≠智力落后)19世纪80年代是高尔顿的10年;(人体测量学实验室)19世纪90年代是卡特尔的10年;20世纪前10年是以比奈为代表的时期:1905年世界上第一个智力测验量表产生比奈—西蒙智力测验量表(Binet-SimonScale)20世纪第二个10年是测验技术大发展时期;

30年代是因素分析的10年,是测验趋于成熟的时期;

40年代以来,心理测量处于稳定发展阶段,不断发展与推广,团体测验的产生与应用:陆军A式量表(文字测验);陆军B式量表(非文字测验)2024/11/2816卡特尔为了评量学生智力进行的心理测验:用握力测量肌肉的力量;意志力动作速度测量(静止状态下快速移动50厘米);触觉两点域限测量;引起痛觉最低点测量(将硬物压到被试前额,从指示器上获知被试忍受痛苦的最低点);神经系统辨别重量最小差别的能力的测量;耐心对声音反应时的测量;说出四种混杂在一起的颜色名称的速度测量;把一根50厘米的线平分为二,测量被试精确性;对10秒时间判断的测量;复述听过一次字母数目的测量。反应时2024/11/2817比奈在智力测量上的探索:研究儿童头盖骨的大小研究儿童脸型、面相研究儿童手形研究儿童字迹以自己两个女儿为被试,研究不同测验任务(词语填充、图片解释)的完成情况2024/11/28181-2-3我国人才测评的现状现代意义上的标准化素质测评在我国二、三十年代就已出现;建国后经历了一段空白;八十年代又兴起:我国于20世纪80年代中后期开始研制和启用飞行员选拔的心理素质检测系统,使招收飞行员的成功率有了显著的提高。美国1942年通过使用弗朗那根等编制的全套心理测验选拔程序,使飞行员的淘汰率由65%下降到36%;10年前,人才测评开始被广泛关注,人才测评师市场供不应求。2024/11/2819资料:人事测评日渐升温人才测评越来越受到用人单位和求职者的青睐。在上海,近年来市任职资格评价中心已先后接受了100多家大中型企业、三资企业的委托,运用人才测评手段来选拔中高级管理人才,同时还为上海的十多家急需招聘人才的银行等单位提供了人才测评服务;在北京,市组织部、人事局已连续两年在面向社会招考50多名局级干部中采用了人才测评工作;在深圳,华为集团在企业内聘有心理学研究生专门负责人才测评工作;在全国,1995年以来国家人事部有关单位先后举办多期人力素质测评班。在全国人才流动中心最近几年连续举办的“全国地市人才中心主任培训班”上,采用专题形式讲解人才素质测评理论,并与北京市东城区人才中心联合开展了人才测评试点。人才测评近年来也被越来越多的党政领导所认识,不少地方在公务员考试中都积极采用人才测评和面试技术,在测评面前人人平等,能力先行,减少了过去公务员录用过程中的人为因素。人才测评在我国迅速“升温”的另一个体现就是专业的人才测评机构纷纷成立。就拿网站来说,和过去单纯的职业介绍中介机构专业网站不同,现在的许多人力资源网站都把人才测评和职业介绍作为其主要服务内容。2024/11/2820资料:2005中国HRM调查从调查数据来看,仅有17.3%的企业用过专业测评工具进行人员选拔和招聘,46.6%的企业准备使用,三分之一的企业不打算用。可见,专业测评工具在企业中的应用并不理想,不过从近半数比例的企业准备使用专业测评工具来看,已有大量企业意识到需要借助于现代人才测评工具来更为客观准确地反映人才价值。2024/11/2821用过专业测评工具的企业比例依照资产规模的增大呈递增趋势,0.3亿元以下企业用过测评工具的比例最低;不打算用的企业比例则依照资产规模的减小而递增,资产规模越小的企业中不打算采用测评工具的比例越高。2024/11/28221-3-2人事测评在HRM中的应用领域目前,人才测评已经服务于企业人力资源管理的多个环节:诸如招聘、选拔、培养与晋升、岗位胜任力考察、企业管理风格与能力考察、企业文化考察、人力资源普查、培训诊断与辅导、员工职业生涯规划、组织诊断等等方面。国家公务员的录用、党政机关领导干部的选拔、考核及评价;企业高级管理人员的选拔、考核及培训,特种职业人员的选拔、培训以及整个领导班子的选拔、考核等。它既可以全面测试、评价一个人,也可以针对人的某个单项能力进行测评。2024/11/28231、招聘甄选“尽管可以教一只火鸡爬上树,但最好还是找一只松鼠。”人事甄选的一个关键技术问题,是如何预测候选人未来工作的绩效,人事测评可以为预测应聘者将来的工作行为与绩效提供科学依据:通过各种能力测验我们可以预测个体在将来胜任工作的可能性(司机、厨师、飞行员);通过对个体的人格测量,我们可以预测个体将来工作的方式和风格,以及其融合于团队的可能性。2024/11/2824资料:一家国营大企业在进行CFO招聘时,选择了通过测评考察候选人的文化适应性。这家国营企业有许多涉外业务,需要一个具有很强文化适应性的国际化的CFO,但文化适应性是不可能从简历或笔试、面试中考出来的,只有通过测评才能保证对公司CFO最终选择的准确有效。经美国管理协会(AMA)的研究成果表明:“错误的选拔一个岗位的雇员给组织带来的直接经济损失是该岗位年薪的5%”;专家的对比研究发现“选拔一个适合该岗位的员工,比雇用一个一般性的员工要多创造20%-120%的效益”。

2024/11/28252、安置“垃圾放是放错了地方的宝贝。”分工的精细化对人们的素质提出了不同要求,人—岗之间的最佳匹配如何实现,成为人力资源管理的重大课题。通过人事测评,可以对个体的兴趣、人格、能力、技能等多方面进行分析,为人力资源的合理安置提供信息。通过职业兴趣测验可以确定个体最适合的职业方向,通过一般能力测验可以帮助个体确定其最佳能力,为个体的职业选择提供参考。通过人事测评,我们可以得知个体的内—外向特点,各具测评结果可以将外向个体安置于需要大量社会交往的岗位上。2024/11/28263、考核在人力资源管理领域,对员工(特别是管理人员)的能力水平、工作满意度水平以及工作表现(胜任力、态度、行为)的方面进行评价,是对员工进行考核、激励、晋升、降职等做出决策时需要掌握的信息,这些内容的考核不同于传统的对工作结果的考核,很难由直接的工作产出(数量、质量、金额)表示,这就需要专门针对行为及其内在品质进行量化描述、分析的心理测量技术,借助人事测评可以快速、准确、科学的获取。资料:早在1956年,美国电话电报公司就利用测评技术(当时称为“管理发展研究项目”),对几百名初级管理人员进行了评价,然后将评价结果封存起来,8年以后,将当时的情况与这8年里的实际升迁情况进行核对。结果证明,在被提升到中级管理职位的人员中,80%的评选鉴定是正确的;在未被提升的人中,有90%的人员就预测到了。2024/11/2827资料:在某家IT公司里,凡是做技术的员工都被安排去参加微软资格工程师认证,其他做管理甚至进行文书工作的员工则被要求去学习MBA课程,很多员工根本不明确培训目的,不知道自己为什么要学这些东西,结果本来培训员工的好事情做得吃力不讨好。

2024/11/2828结论:人事测评是HRM决策的信息来源之一,是通过科学方法对个体行为和内在素质进行分析的手段,其最主要的作用在于为人事决策提供可靠、客观的依据,为人事决策提供参考性建议,是HRM的基本工具。思考:为什么要使用人员素质测评?人具有共性但更具有个性(差异性、独特性)个体差异的隐蔽性、复杂性、重要性人事测评工具的客观性、科学性、公平性2024/11/2829人员招聘与配置:应聘人员基本素质评价;岗位胜任力评价;应征者选择性排序;聘用人员的使用建议。考核评估:在岗人员岗位胜任力考察;基本素质与发展潜能评价。员工培训:培训需求分析;培训计划建议。职业发展:能力与心理认知状况;人才基本素质与发展潜能评估;培训诊断与辅导;人才使用发展建议。晋升选拔:管理潜能评估;识别潜在人才(发展潜能);人才晋升的选择性排序。团队建设:个体与团队的协调性;团队现状分析诊断;团队发展建议;人-组织匹配度调查。HRP:HR普查与整体状况评价;员工满意度调查。2024/11/2830本章小结:本章主要介绍人事心理测评的基本概念和发展简史,通过比较测量、测验与测评的区别与联系,详细说明了人员素质测评的内涵与主要功能。2024/11/2831第二章人员素质测评原理

主讲:晁伟鹏2024/11/2832第二章人员素质测评原理教学内容:2-1人员素质测评的前提2-1-1个体与工作的差异性2-1-2人—岗匹配理论2-2人员素质测评基础2-2-1素质测评基本假设2-2-2素质测评理论基础2-3人员素质测评的基本模式2-3-1人事心理测评的基本模式2-3-2人事心理测评三要素2024/11/28332-1人员素质测评的前提2-1-1个体差异的客观性与普遍性生理差异(生理指标)心理差异(心理指标)社会差异(社会指标)认识心理差异的困难性:目前心理学对于个体心理现象的认识与研究,许多还处于相对较低的水平,还无法用精确的数学语言解释其规律性。2024/11/2834心理差异的表现有的人感知敏锐、思维深刻、想像丰富,有的人则相反;有的人记忆快且保持长久,有的人则记得慢且易遗忘;有的人长于形象思维,有的人则长于抽象思维等。有的人性情温和、不易发脾气,有的人反应迅速、情感外向,有的人则反应迟缓、情感内向。有的人经常活泼愉快,有的人却多愁善感;有的人怯懦软弱,有的人机智果断,有的人优柔不决等。2024/11/28352-2人事测评基础2-2-1人事测评基本假设假设1:个体每一个行为表现(先天性条件反射除外),都是其相应的心理素质在特定环境刺激下的特定反应。简言之,行为表现与心理素质之间存在相关关系。用公式表示:B=f(Q.E)B——行为表现f——反应机制/模式Q——心理素质E——环境刺激2024/11/2836例如:一个人喜欢阅读机械杂志,喜欢看各种机器运转,热心为别人修理钟表和自行车,我们就此推断他具有机械兴趣。有人爱上网,有人爱唱歌,有人爱跳舞,有人爱阅读小说,有人爱赚钱,有人爱漂亮,我们说他们兴趣不同。有的人感知敏锐、思维深刻、想像丰富,有的人则相反;有的人记忆快且保持长久,有的人则记得慢且易遗忘;有的人长于形象思维,有的人则长于抽象思维等,这些方面表现了人们在能力和智力方面的差异。有的人性情温和、不易发脾气,有的人反应迅速、情感外向,有的人则反应迟缓、情感内向,这些方面表现气质方面差异。有的人经常活泼愉快,有的人却多愁善感,有的人怯懦软弱,有的人机智果断,有的人优柔不决等,这些构成了性格方面的差异。2024/11/2837假设2:特定的心理素质具有稳定性素质是一种相对稳定的组织系统,各个个体不尽相同,它可以综合不同环境下的刺激,使个体对这些不同的刺激做出一致的反应行为。用公式表示:Q=fB.dE

心理素质具有稳定性。(不同情境、时间、活动Q——心理素质f——积分符号,即总和运算符B——典型行为dE——不同环境下的环境刺激变量2024/11/2838例如:具有机械兴趣的人,喜欢阅读机械杂志,喜欢看各种机器运转,热心为别人修理钟表和自行车。喜爱音乐的人,不但爱听歌,还爱唱歌,玩乐器,还会关心音乐动向等等。个性外向开朗的人,不但善于与人交往,热情奔放,活泼健谈,有时显得轻率,而且遇到挫折不会悲观失望,能够快速调整状态,恢复自信。个性内向的人,关注自身,行事谨慎,深思熟虑,不善交际。价值观崇尚真、善、美的人,表现为对美好事物的追求、欣赏、维护,以及自觉抵制和拒绝那些丑恶、虚伪的事物。2024/11/2839测量是区分事物差异的过程任何现象,只要客观存在,就总有数量性质。

——桑代克(美)凡有数量的东西都可以测量。——麦柯尔(美)数学的对象是现实世界的空间形式和数学关系。

——恩格斯(英)人的智力有高低之分,学生的成绩有优劣之别。高低优劣体现着程度不同,而程度的不同也就是数量的差异。结论:由于人的行为表现与稳定的心理素质存在着相关关系,表现出较为明显的一致性,因此,心理素质可以通过行为表现进行测量!2024/11/28402-2-2人员素质测评理论基础心理学理论:测量学理论:统计学理论:2024/11/28412-3人员素质测评模式及特点简单的说,心理测评就是用测量语言(通常是数字)去描述、评价人们无法用直接观察和精确测量的手段去把握和认识的人类心理素质的过程。通过这一过程,以便对人的行为和心理属性确定出一种数量化的价值。用测量学的语言来概括,就是依据一定的心理学理论,使用一定的操作程序,根据一定的测量法则用数字对人的行为进行区分鉴别,借以推测潜在的个体心理素质差异的过程。2024/11/28421、测量对象的抽象性测量对象—抽象的心理素质(属性或特征)人类心理素质具有抽象性、模糊性的特点,如“智力、个性、品德、态度”等概念,都是心理学家们理论上构造出来的,现实中并不真实存在,无法直接测量。比较(哪一个测量对象更具体?):对班上5位同学的性别进行测量对班上5位学生的学习成绩进行测量对班上5位同学的态度进行测量对班上5位同学的性格进行测量对班上5位同学的兴趣进行测量2024/11/28432、测量法则的多样性测量法则—给测量对象赋值的依据和程序测量法则或程序用公式表示:

f={(X,Y)X——任何事物,Y——一个数字}

可以读作函数f等于有序配对(X,Y)的集合,而X为一种事物属性,其所对应的Y是一个数字。同样的测量对象会因测量法则的不同而导致不同的测量结果。法则的好坏,一方面取决于制定规则的程序;另一方面取决于欲测量的事物属性本身是否易于建立规则以及规则是否便于操作。2024/11/2844集合A的每个成员只能分派在集合B的某一对象上,即集合A的所有对象对应着集合B的所有对象,测量法则相当于对应的依据。A1A2A3A4A5012024/11/28453、测量结果的相对性测量结果一般是以分数值的形式呈现出来,但是,人事心理测量的得分本身无法单独作为评价的依据,不但因为在不同测量量表或量尺(测量工具)上分数有不同意义,而且由于分数的参照系(测量常模)不同,同样的分数可能说明不同问题,分数的解释和评价自然也不一样。试比较:自学考试的分数与高考分数在解释和评价时有何不同?2024/11/2846结论:人事测评的特点人事测评侧重心理测量:影响心理测量结果的大部分因素具有内在性、隐蔽性和无形性等特点,其测量结果是对测评对象的心理特性在一定程度的反映。人事测评是抽样测量:任何一项测评实施者,在有限时间内不可能掌握受测者素质的全部表征信息,只能本着“部分能够反映总体”的原理,对测评要素进行抽样,从样本的测量结果来推断全部待测评内容的特征。人事测评是间接测量2024/11/2847

本章小结:从整体上看,现代测评理论主要是建立在差异理论之上:一方面,职位类别的差异对人才测评提出了客观要求,职业与职位,其差异是客观存在的,人职匹配以便提高工作绩效;另一方面,个体差异是人才素质测评的前提条件。比如心理差异中的个性倾向差异、个性心理特征差异等。小结:测评主体采用科学的方法,收集被测评者在主要活动领域中的表征信息,针对某一素质测评目标系作出量值或价值的判断的过程。或者直接从表征信息中引发与推断某些素质特性的过程。2024/11/2848第三章人员素质测评体系主讲:晁伟鹏2024/11/2849本章教学内容:3-1人事心理测评的类型3-1-1测评的基本类型3-1-2测评的主要技术3-2人事心理测评的基本程序2024/11/28503-1人事测评的基本类型现实中的人是复杂的人,是由许多不同的层面整合构成的人,同时又在不同环境条件中有相应地丰富变化,这就使得对人的测量十分困难。另一方面,现实社会中的职业、工作也是千差万别,对任职者的要求也不尽相同,这就给人事测量提出了很高的要求。在过去的一百年里,心理学家们做出了巨大努力,既要应付复杂的人,又要应付复杂的社会职业要求,心理学家想出许多办法、采用各种形式的测验工具去揭示人类外在行为与内在素质的奥妙。注:测评方法可以依据测评对象(技术人员、管理人员、领导者);也可以依据测评内容(能力、兴趣、人格),还可以根据测评的用途(开发性测评、选拔性测评、诊断性测评)。本课程主要了解依据测评形式有怎样的类型。2024/11/2851根据测评的用途:招聘筛选——选拔性测评管理层选拔员工培训——开发性测评员工综合评估——诊断性测评考核性测评考核性测评的内容一般范围越广泛越好;诊断性测评的内容一般要求精细和具有针对性;区分性测评则要求选择那些变异较大的问题作为测评内容。

2024/11/2852人员素质测评的种类心理测评模块:心理测评模块包括企业管理能力倾向、创造能力、管理动机、职业兴趣、认知风格、气质特征、典型人格特征七个方面的测试,用于测试管理者的多方面的心理特征和素质。每个部分可以单独使用,也可多个部分结合使用。

能力测验一般能力测验(智力测验)特殊能力测验行政职业能力倾向测验人格测验评价中心技术面试绩效考核2024/11/28533-2-1标准化纸笔测验(Paper-pencilTest)定义:就是借助纸和笔进行的测验。这类测验在实施过程中一般无需借助其他工具和手段。标准化的纸笔测验一般在有事先确定好的测验题目和答卷以及详细的答题说明,测验题目往往以客观题居多,但也有不少属于主观自陈式的评价题。有的测验限定时间,有的则不限定时间。被试的任务一般很简单,只需按照测验的指示语回答问题即可。大多数智力测验、人格测验、学业成就测验和能力倾向测验都属于这种类型的测验。构成:一个标准的纸笔测验系统还包括客观的计分系统、解释系统、良好的常模以及值得信赖的信度、效度和项目分析数据。2024/11/2854例如:笔试测验,如学校考试(学业成就)兴趣测验(个性差异)意志力测验(个性差异)看似截然不同的测验,其实有其内在的相似性:都是对行为活动的取样(行为样本)都需要客观的标准化形式(一致性)2024/11/2855测试1、我每天都坚持跑步、打太极拳、做气功或散步等。2、我给自己订的计划,常常因为主观原因不能如期完成。3、如没有特殊原因,我每天都按时起床,从不睡懒觉。4、我的作息没有什么规律性,经常随自己的情绪和兴致而变化。5、我信奉“凡事不干则已,干必成”的格言,并身体力行。6、我认为做事情不必太认真,做得成就做,做不成拉倒。7、我做一件事的积极性,主要取决于这件事的重要性,即该不该做,而不在于对这件事的兴趣,即不在于想不想做。8、晚间我躺在床上,有时下决心第二天要干一件重要事情,但到第二天这种劲头又消失了。9、当学习和娱乐发生冲突时,即使这种娱乐很有吸引力,我也会马上决定去学习。10、我常因读一本引人入胜的小说或看一部精彩的电视而不能按时入睡。11、我下决心办成的事情,不论遇到什么困难,都坚持下去。12、我在学习和工作中遇到困难,首先想到的就是问问别人有什么办法。2024/11/285613、我能长时间做一件很需要而枯燥无味的工作。14、我的兴趣多变,做事情常常是“这山望着那山高”。15、我决定做一件事时,常常说干就干,绝不拖拉或让它落空。16、我办事喜易怕难,爱拣容易的做,难的能拖就拖,能推则推。17、对于别人的意见,我从不盲从,总喜欢分析、鉴别一下。18、凡是比我能干的人,我不太怀疑他的看法。19、遇事我喜欢自己拿主意,当然也不排斥听取别人的建议。20、遇到复杂的情况,我常常举棋不定,许久不能做出决断。21、我喜欢做我从来没有做过的事情,不怕一个人独立负责重要的工作。22、我生性胆怯,没有十二分把握的事情,我从来不敢去做。23、我和同事、朋友、家人相处很有克制力,从不无故乱发脾气。24、在和别人争吵时,总爱说一些过头话,甚至大吵大闹;尽管事后感到后悔,但事头上总也忍不住。25、我深信“有志者事竟成”的信条。26、我相信机遇,我认为机遇的作用超过个人的努力。2024/11/2857对投射类测验的评价:优势及展望优势:通过投射技术可以使被试不愿表现出来的个性特征、内在冲突和态度更容易地表达出来,因而在对人格结构、内容的深度分析上有独特的功能。在临床领域有一定的应用前景。展望:心理学家们一致致力于使投射测验更加客观化和标准化。例如:经过改进的主题统觉测验利用内容分析的方法评分,对个体的成就动机、亲和动机、权力动机进行评估,使该测验具备了一定的客观性。

2024/11/28583-3人事测评的基本程序人事测评的程序依据其测量目的的不同而有所区别。例如:在人才选拔过程中运用人事测量需要涉及到确定测量内容、方式和录用标准等方面;但对于以诊断、评价为目的的人事测评,其测量内容往往不是事先确定的,对测量结果也不一定要设定能否接受的标准。一般而言,人事测评的基本程序涉及以下六个步骤:2024/11/28593-3-1确定测量目的和内容这个过程就是明确测评信息主要用于什么决策,测评的理由不同,测评内容的选择也就有差别。以选拔或安置为目的的测量,应该确定测验能够预测未来工作表现,并且比其他方式作出的预测更公平;以评价或考核为目的的测量,应该确定是为了对员工提供更为可观的资料以及检测员工整体工作表现;以诊断或咨询为目的的测量,应该确定通过测验进行的评估可以得到对受测者和咨询顾问都有帮助的信息。例如:选拔性测评中要考虑,影响未来工作绩效的主要因素是什么(性格、态度、能力),如果是能力,还要进一步思考,是一般能力还是特殊技能?2024/11/28603-3-2确定测量的基本形式和测量工具不同的测评目的会影响受测者的心理感受,例如选拔性测评常常引发焦虑,导致测验成绩不稳定。因此,在了解测评目的的基础上选择和设计恰当的测评形式是很重要的。测量形式和工具会因测量内容的不同而不同。测验形式的选择很大程度上由测评目的决定,在评价性测评中一般使用最好成绩测量;在促进自我了解测评中一般使用典型反映测量;在选拔性测评中一般使用难度测验或速度测验等。测量人数:个别测验/团体测验是否使用时间限制:速度测验/难度测验2024/11/2861不同测评内容适用的测评形式对应聘销售人员的口头表达、情绪控制进行测查,应采用情境模拟(小组讨论),而不应采用一般的纸笔测试。如果应聘者动机对工作绩效的高低有决定性的影响,考虑到一般自陈式量表(即基于自我评价的问卷)的动机测验题目表面效度(即从题目表面是否容易看出出题人的意向和答案倾向)过高,或应聘者容易表现出较高的社会称许性(即题目本身的答案反映了一般社会价值倾向),应答者就很容易产生反应偏差或投其所好,就应采用隐蔽性比较高的投射测验对应聘者动机进行评定。例如:如果你是银行职员,你会怎样回答“我结算时核对两遍。(总是、有时、从不)”这样的问题?2024/11/28623-3-3测量的实施和数据采集施测过程:要保证测评的客观性和标准化,就要严格按照测验的实施要求进行测量,防止个人主观情感对测量结果的“污染”。要保证足够的空间以避免多个被试应试时的相互影响和干扰,同时尽量排除无关因素的干扰以保证被试正常发挥。在收集测量信息时要注意将实施过程中的相关信息及可能对决策产生影响的细节记录下来,作为决策的辅助材料。还要记录对测量结果造成影响的特殊因素,如考场的干扰、应试者身体不适等。2024/11/2863数据采集过程:大多数复杂的测验或者大量的测验都是通过计算机进行计分的,而且大多数人格测验也是通过计算机计分的,这是因为计算机准确、快速并且在计分的同时可以迅速完成分数的解释报告。一般性的个别测验可以通过手工计分,这些测验都会有可重复使用的问卷以及单独的答卷纸,或者将答案直接记录在问卷上,重要的是要准确计分,确保测验计分误差得到有效的控制。2024/11/28643-3-4分析测量结果对测量结果的分析通常包括对测量结果的计分、统计和解释。对于心理测验来说,它的计分和统计方法往往是预先建立的,使用者只需按照测验说明进行操作即可。对于已经计算机化操作的测量就更为简单了,在测验完成后统计结果也就立即完成并可打印出报告。对结果的解释相对较复杂,对单一结果的解释可以参照常模或效标进行解释,但很多情况下,人事测评包括多个一同实施的测量,需要将多个不同的测量结果进行结合作出整体解释,这就要求分析者对各项测量有充分的了解和足够的经验。(该内容将在测量结果的解释一章中详细介绍)2024/11/2865本章小结:心理测量的误差和局限性比其他测量大得多,要合理使用心理测量就必须了解和控制这些误差与局限性,就必须在使用过程中严格按照标准实施测量。测验使用的方式比测验本身的质量要重要的多。缺乏测验的信息可能限制测验的使用,而不了解如何正确使用测验,特别是如何解释测验分数以及有意义的传达测验结果,则是对测验更为重要的威胁。2024/11/28664人事测量结果的解释测量分数有何意义?2024/11/2867本章教学内容:4-1原始分数与导出分数4-1-1原始分数4-1-2导出分数4-2常模参照分数4-2-1常模及其意义4-2-2常模的类型4-3效标参照分数4-3-1内容参照效标4-3-2结果参照效标2024/11/28684-1原始分数与导出分数测验分数的获取与测验分数的解释:人事测量的解释不同于测量的实施与计分,测量过程与结果评价是相对分离的,测量实施的主要目的是获得应试者的各种反应信息,而分数的解释是利用这些反应信息对个体素质或特点作出评价的过程。测量的解释是一个相当复杂的系统程序,它是以一系列复杂的统计工作为基础的,并在很大程度上依赖于专业人士的脑力劳动。2024/11/28694-1-1原始分数原始分数(rawscore):通过实施测量和对测量结果计分(将应试者的反应与标准答案相比较)可以直接获得测量原始分数。没有附加的可解释的资料,任何心理测验的原始分数(即使经过矫正)都是没有太大意义的。因为,原始分数量表是任意的和独特的,也就是说它不是通用量表。这个分数本身并不具有多大的实用意义,而只是一个理论上的过渡值。原始分数并不能为我们提供一个易于理解、可直接使用的评价,而需要针对一定的标准进行比较,才能得到有用的评价。2024/11/2870为什么?单说某人正确解决了15道数学推理测验题,在词汇测验中能够再认34个单词或者在57秒之内成功组装了一个机械物体,并不能给我们提供关于他在这方面能力的精确信息。例如:通过逻辑推理能力测验,我们得到某位应试者的原始成绩是25分。但是,这个成绩并不能使人事经理确定这名应试者的能力优秀与否,到底是高还是低?25分与28分的能力相差到底有多大?25分究竟是高于还是低于平均水平?25分是否是50分的1/2?我们并不了解原始分数的实际含义,它们之间也不能直接比较。2024/11/2871例如:我们熟悉的百分制分数,并不能提供一个满意的关于分数解释的方案。如:一份词汇测验上的65%可能等于另一份测验的30%的正确性(TOEFL与GRE),或者等于另一份测验的85%的正确性。也就是说,测验的难度决定着分数的意义。假设A与B同时参加应聘考试,做一份由100道多项选择题构成的测验。A知道其中60道题的正确答案,对剩余40道没把握,于是空出来没有做;B同样只知道其中60道的答案,但是对剩余40题作了猜测,如果每道题有4个选项,B有可能碰对其中10道。按照传统记分方法,A将得到60分,B却能得到70分。那么,分数的差异能够反映他们在所测量的对象上的差异吗?(信心加权、回答到对、选项加权)2024/11/2872解决途径人事测量的目的在于根据特定标准评价和比较被测者各方面素质和特点,只有通过与一定的标准进行比较,原始分数才能获得有意义的解释,因此,不同的评价标准和比较标准将决定测量分数的意义。评价标准分为两种:绝对标准——通常是希望达到的外在目标,相对稳定,不会因测量对象的改变而改变。相对标准——通常代表某一群体内部真正的成绩,不稳定,会随着测量对象(测量对象所属群体不同)的改变而改变。2024/11/28734-1-2导出分数为了更精确的理解个体原始测量分数的确切意义,通常需要将原始分数转化为一些导出分数(根据测验的性质、用途以及所要达到的测验量表的水平,按照统计学的原理,从原始分数转换而来的具有一定参照点和单位的测验量表或量尺上的数值,也就是与原始分数等值的量表分数)。常模参照分数效标参照分数2024/11/2874根据相对标准进行分数的解释称为常模参照解释,指测量的原始分数通过与某个参照团体的分数进行比较,并以该分数在这个团体中的相对等级或相对高低位置来描述应试者的素质或特点,以得到可供比较的导出分数的过程。根据绝对标准进行分数的解释称为效标参照解释,指依据外在标准对应试者分数进行解释的过程。二者的根本区别在于测量成绩所参照的标准:常模参照解释是将被测者的成绩与同类群体的其他人的成绩进行比较,而效标参照解释是将被测者成绩与外在效标进行比较。2024/11/2875例如:实施一项机械技术考试之后,如将应试者的成绩与其他人的成绩进行比较,可以知道该应试者的机械技术知识是优秀、一般还是较差,这就是参照常模的分数解释;如果将应试者的成绩与机械师分级的标准(外在标准)进行比较,就可以知道该应试者是否达到了某一级机械师的水平,这就是参照效标的分数解释。驾照考试的分数解释属于哪一种?英语过级考试的分数解释属于哪一种?2024/11/2876导出分数的作用:指出个体在标准化样组中的位置,以便参照他人对这一个体进行评价。提供一些可比较的量度,从而使对个体在不同测验中的作业情况的比较成为可能。导出分数能够以相同单位来表示测验成绩,能参照相同或近似的常模团体在不同的测验中的作业情况,于是个体在多种测验中的有关作业情况就可以比较了。例如:如果一个女孩在一份词汇测验中得40分,而在数学推理测验中得22分(原始分数),能说他词汇好于数学吗?由于不同测验以不同单位来表达,对这种分数的直接比较是不可能的。(需借助标准分数)2024/11/28774-2常模参照分数心理测验分数通常用参照常模的办法解释。测验编制者为了说明和解释测验的结果,就根据测验的性质、用途以及所要达到的测验量表的水平,按照统计学的原理,把某一标准化样组的原始分数或测验分数转化为具有一定单位、参照点和连续体的导出分数,这就是我们所说的测验量表。2024/11/28784-2-1常模及其意义常模(norm):指标准化样本的测验作业情况,一般把用作比较的团体叫做常模团体,常模团体的一般平均分数叫做常模。常模作为比较的标准,其有效、可靠与否取决于常模所依据的样本群体(标准化样组)是怎样被选出来的。例如:要为某种测验建立18岁的常模,最可靠的方法是将具有这一测量对象(心理特征)的18岁个体个个加以测量。但是由于时间、人数、经济的限制,这是不可能做到的,所以通常只能抽取具有这个研究特征的人群总体的一部分以代表总体,这个代表总体的样本通常被称作标准化样组。2024/11/28791、发展性常模人的许多心理特点如智力、技能等,是随着时间以有系统的方式发展的,所以可以将个人的成绩与各种发展水平的人的成绩比较而制成发展量表。根据发展量表得出的导出分数可以通过对原始分数的变换揭示出:被测个体达到了怎样的程度,他的行为属于哪一个水平。例如:一个8岁的小孩在一份智力测验中如果做得和10岁小孩的平均水平一样,那么,我们可以说他达到10岁儿童的智龄;一个智力迟滞的成人如果也达到这一水平,我们说他的智龄达到10岁;另外,一个四年级学生可以被描述为达到了六年级阅读水平或三年级数学水平。2024/11/2880智龄儿童的智龄是基础年领与在较高年龄水平的题目上获得的附加月份之和。如果为每个年龄水平都编制一些适当的题目,便可以得到一个评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄,这种分数叫做智力年龄,简称智龄。如果没有将测题划分年龄组,可以编制年龄常模:首先确定被测者的原始分数(在一套测验中被试做对的项目总数、耗费时间、错误数等),标准化样组的每一年龄组所得到的平均原始分数便构成了该测验的年龄常模。例如:8岁儿童的平均原始分数代表8岁常模,如果某人原始分数等于8岁儿童的平均原始分数,那么他的智龄在这份测验上为8岁。2024/11/2881年级当量年纪量表选择题目于指定分数的方法步骤与年龄量表类似,所不同的使用年级水平代替了年龄水平。例如:教育成就测验上的分数通常可用年级当量来解释,某学生拼写相当于六年级,阅读相当于八年级,数学相当于五年级。年级常模可以从计算各年级学生在某份测验上的平均原始分数而得。例如:某标准化常模样组中四年级学生正确解答某一数学测验的问题数目平均为23,那么原始分数23便相当于四年级的年级当量。2024/11/2882顺序量表20世纪中期,瑞士儿童心理学家皮亚杰的理论引起了人们的关注。皮亚杰的研究集中在从婴儿到少年的认知过程的发展。他更关心的是一些特殊概念而非广阔的能力。例如:物体的永久性、物体的守恒性等的形成有一定的时间顺序,只有前一阶段完成后,才能进入下一阶段。后来,有人把皮亚杰在研究中所采用的一些作业和问题组织成了标准化量表,用来研究儿童在每一发展阶段的特性,以提供儿童实际能做什么的信息。在这种量表上,分数可以用相近的年龄水平来表示,同时还能对儿童的行为作质的描述。2024/11/2883比率智商计算公式:IQ=MA/CA×100IQ—智力商数MA—智龄CA—实际年龄可以看出,IQ是智龄与实际年龄的比率,是一个相对量数,表示一个儿童智力发展速度或者聪明程度。如果一个儿童智力发展一般,智力随年龄增长而增长,直到停止,则其商数等于100,而心智发展慢于或快于年龄增长者,则其商数小于或大于100。现在,你能了解阿甘的智商分数75意味着什么了吗?2024/11/2884发展性常模的评价优点:以年龄或年级当量作为单位报告分数易于被人们理解;可以与同等团体做直接比较;为个人内比较与纵向比较提供了基础。缺点:只适用于所测特质随年龄或年级发生系统变化的情况,换句话说,仅适用于年纪小的儿童,对成人不适用;由于人的行为发展受教育与经验的影响,因此发展量表只适用于典型环境下成长的儿童;发展量表的单位不相等;获得同样的年龄或年级当量分数,并不一定具有相同的智力或学业水平(两个不同年龄的小孩同得智龄8岁)。2024/11/28852、组内常模组内常模可以提供有关个体的作业情况的相对评价,通过与其最可比较的标准化团体的作业情况比较而得到个体作业情况的评价。类似于拿一个学生的原始分数与其同龄或同班级的同学做比较一样。几乎所有的标准化测验都提供某种形式的组内常模。组内常模可以很好地说明被测者的测验分数在所属团体中的相对位置,便于进一步的分类、甄选与安置。常见的许多选拔性测验都会运用组内常模进行分数解释(高考、司法考试、注册会计师考试、证券从业人员考试)。组内分数能够获得统一、清楚、定义好的数量意义,能够运用大多数统计方法进行分析。2024/11/2886百分位常模对人们进行比较,最简单的方法就是排序,因此,可以通过问“有多少人比你差?”或“测验中有多少百分比的人比你差?”的方式评估个体测验原始分数的意义。百分等级:用于计算低于某一测验分数的人数比例或者位于某一比例的分数。某一原始分数的百分等级可以解释为常模团体中得分在该原始分数以下的被试的百分数。百分等级经常作为用来给学生、家长或顾客交流常模参照测验的结果。假设某一被试与常模团体同时被测,而且测验指导语和时限也被很好的控制时,适当的解释可为:这份测验中某某的得分比常模团体中75%的人要高。2024/11/2887某单位组织400位员工考试,某人得分为73分,这是什么意思?当满分为100分和满分为80分时,含义不同;员工中最高分为99分和最高分为79分时,含义不同;即使最高分为79分,73-79之间有200人和20人时。含义也会不同。只有了解73分相对于其他分数的位置,才能对这个员工做出有意义的解释和评价。百分等级的计算关键在于确定在常模样本中分数低于某一特别分数的人数比例,如果求出个体分数对应的百分等级,就可以直接明了每一个分数相对于其他分数的位置。2024/11/2888百分位原始分数—男孩原始分数—女孩原始分数—总体

9963分以上73分以上66分以上

9558-6262-6960-659053-5757-6155-598548-5252-5650-548043-4747-6145-497538-4242-4640-4470…

…15分或5分以下10分或10分以下8分或8分以下

示例:百分位数通常以表格形式呈现,百分位数与与之对应的原始分数并列列出,下表可以方便的读出于某一原始分数相对应的百分位数。可以看出,这个例子中女孩的分数均高于男孩。2024/11/2889在上例中,原始分数为41的孩子,相对于整个人群位于第60百分位,意思是在此常模团体中60%的孩子测验分数比他低。如果那个孩子是男孩,与其他男孩相比,它位于第70百分位;如果她是女孩,与其他女孩相比,她位于第30百分位。据此类推,原始分数58或原始分数为44,对于总体、男孩、女孩分别意味着什么?从表中可以看到位于分布在中间的人们其原始分数集中与很窄的范围,而两端的人们原始分数范围更宽。这个例子表示在分数的中间范围,小小的差异会导致百分位分数的巨大变化。2024/11/2890姓名:约翰年级:5年级学校:琼斯小学时间:01年春测验结果:约翰得分63分,最高分是80分,这表示他答对了79%的问题。测验分数的解释:约翰的成绩可以与本地区其他5年级的孩子进行比较。数学成就测验有80道题,本地区中等的孩子得分为55分,即答对69%的题目;约翰在测验中得到63分,比本地区72%的同龄人分数更好。本测验成绩的可信度:测验成绩会变化,约翰在不同场合对这个测验可能做的稍微好一点或差一点。这一测验的误差分数范围在正负3分,有95%的肯定性是约翰的分数范围在60-66分。测验分数的使用:这一测验结果将在约翰的教育决策中加以考虑,还要考虑包括他的老师的报告在内的其他资料。测验内容的描述:这一测验测量这一水平孩子的主要数学技能。包括简单数学计算(加、减、乘、除)、对乘法表的运用、对小数和分数的运用以及对钱的处理(算出要找的钱的正确数量)、使用时间的计算(计算火车旅行时开车与到达之间的时间长度)。如果需要进一步了解本测验以及测验结果如何使用或者讨论孩子的测验成绩,可以联系:琼斯小学校长示例:数学成就测验的书面报告2024/11/2891标准分数(standardscore)标准分数又称为基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。离平均数有多远,表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。标准分数系统的平均数定为0,个人的分数以在平均数之上或之下的标准差来表示。为了不处理负数或带小数点的分数,心理学家制定了许多其它常用的标准分数系统,在这些系统中,平均数和标准差的设置是为了消除负数或小数点(Z分数、T分数、离差智商、标准九分、标准十分)。2024/11/2892原始分数量表是任意的(测量单位)和独特的(测量对象),也就是说它不是通用量表。正因为如此,要把它转换成某种通用量表,前面讲的百分量表就是其中一种。但是百分量表是等级(顺序)量表,无法对它进行加减乘除运算,大多数统计分析也无法进行。因此,如果想对测验分数做进一步统计分析时,需要将测验分数表示为等距量表,即有相等单位的量表,标准分数就具有这种性质。标准分数是根据这样的事实:人类许多属性的分布呈常态分布或近似常态分布(常态分布是对成的钟型曲线,是从一系列的概率事件中得来的频数分布。)。如果测验分数呈常态分布,那么根据正态分布规律,68%的受测者得分将处于平均数的一个标准差范围内,95%的受测者将处于平均数的两个标准差范围内。通过把原始分数转化为标准差的比率或倍数,标准分数可以表示个体的原始分数与相比较的团体平均分数的偏差有多远。2024/11/2893Z分数标准分数Z是原始分数与平均分数的离差以标准差为单位的分数,用公式表示:Z=(X-X’)/S,由于该通用量表的单位为标准差,所以这种量表叫做标准分数量表。X—原始分数;X’—一组数据的平均数;S—该组数据标准差。2024/11/2894示例:有一人身高为170厘米,体重为65千克,究竟是身高还是体重在各自的分布中较高?(属于不同性质的比较,不能直接比较)如果知道各自数据分布的平均数和标准差,就可以求出Z分数(标准分数)进行比较。假设Z身高=0.5,Z体重=1.2,可知该人的体重离平均数的距离要比身高离平均数的距离远。2024/11/2895T分数T分数是Z分数的转化形式,表示任何正态化与非正态化的转化标准系统,当其以平均数为50,标准差为10来表示时即称为T分数。T分数与Z分数的准化公式:T=50+10Z与Z量表一样,T量表不能为未学过统计学的人掌握,但是可以根据常态曲线将T量表转化为百分位数(百分等级)。如果T分数是60,与他相应的百分位是84,而T分数是35时,相应的百分位是7。不论测验的性质和内容是什么,这些T分数与百分位的关系都成立。2024/11/2896离差智商离差智商的基本原理是把每个年龄阶段的儿童的智力分布看作常态分布,某个儿童的智力高低由其与同龄伙伴智力分布的离差大小而定。就求年龄常模而言,离差智商与比率智商是一致的。二者的区别在于,离差智商把某个儿童的智力与同龄伙伴相比较后,算出他们的离差[IQ=15(X-X’)/S+100];而比率智商把某个儿童的智力与同龄伙伴比较后,算出他们的比率(IQ=MA智龄/CA实龄×100%)。X—原始分数,X’—某团体或年龄组的平均数,S—该年龄组的标准差。2024/11/28974-3效标参照分数校标参照分数是另一种解释测验原始分数的方法,用于代替比较或同时比较一个人与其他参加测验的人所处的位置。它关心的是被测者是否达到了某种标准或效标,这种标准是外在的,与被测者所在群体无关。这类测验把原始分数转化为一种陈述,说明对得到某一分数的个体可以期待什么表现。例如:数学测验的结果可能用来证明某个学生比80%以上的同龄人要好,并表示这个学生能够很好地进行某些具体的数学运算。2024/11/2898在教学或培训情境当中,这一计分和解释方法非常有效,因为这些情境中,关注的是成绩的水平,而不是使用有时看来具有竞争性或比较性的评价成绩的标准。例如:大学四六级考试、自学考试、TOEFL、GRE、驾照考试等。校标参照测验(如成就测验)的分数解释过程不同于常模参照测验,分为两种类型:内容参照分数的解释结果参照分数的解释2024/11/28994-3-1内容参照分数的解释内容参照分数(contentreferencedscore)的测量目的是确定应试者对某个确定材料内容或技能的掌握和熟悉程度的分数。由于比较对象不是其他人,而是掌握的内容有多少,所以称为内容参照测验。例如:为了了解新员工是否掌握培训班所讲授的知识或者岗前培训是否达到预定要求而进行的测验,就是内容参照测验。在编制内容参照测验时,首先要确定需要考察的内容或技能,然后再编制确定受测者掌握程度的测验量表。2024/11/28100编制内容参照测验量表的关键是预先制定一个判断受测者是否已经掌握某种内容或技能的数量程度的标准。通常可以通过掌握分数和正确分数来表示。掌握分数:就是确定一个判别受测者是否通过或掌握的最低分数。正确百分数:就是确定受测者应该达到掌握或熟练标准的百分数(受测者在测验中答对题目的比例)。2024/11/281014-3-2结果参照分数的解释结果参照分数(outcomereferencedscore)是将效标材料直接结合到测验结果的解释过程而进行评价的分数。结果参照分数可以表示获得某个分数的应试者达到某种效标水平的可能性。预测性测验往往适合用结果参照分数进行解释。例如:造高级管理技能测量中,结果的解释可以依据一定管理业绩或管理成效为标准。对于测验所得到的某个分数,可以判定他达到某一水平绩效的可能性有多大。2024/11/28102第五章人事心理测评的质量主讲:晁伟鹏2024/11/28103第五章人事测评质量分析一项测评是否可靠、可信?一项测评是否准确、有用?一项测评是否公正、公平?一项测评是否经济、合理?2024/11/28104本章教学内容:5-1测量的信度5-1-1信度及其影响因素5-2-2信度的评估方法5-2测量的效度5-2-1效度及其影响因素5-2-2效度的评估方法5-3项目分析5-3-1测量的难度分析5-3-2测量的鉴别度分析5-3-3测量的诱答分析2024/11/281051、信度的概念信度(reliability)信度是标示测验一致性高低的统计指标。主要指测量结果的可靠性或一致性,可以定义为测验结果不受测验情境或测验过程中无关变量影响的程度。实际上就是指测验分数不受测量误差影响的程度。可以指出测验出的个体差异在多大程度上是真正的差异,又在多大程度上是由于随机误差造成的。由于接受测量时应试者的行为可能会由于各种原因而产生变动,偏离了其真实行为,这就会使测量结果产生随机误差。测量结果的可靠性与测量结果受随机误差影响的程度密切相关。误差大,分数的可靠性就降低,那么根据测量结果作任何决策都会受到限制。2024/11/28106通常任何测验都存在某种程度的不一致性(同一受试者在不同时间或在不同的测验条件下做同一测验)所有测验都有误差,心理测验分数也不例外。如果一个人连续两天接受同一测验,或者完成同一测验被认为是等值的两个版本,如果分数有相当大的变化可能让人吃惊,但是有一点可以肯定,这是由于偶然或随机因素影响了每次测验的成绩。然而,对于儿童,如果同一测验在半年或一年之后测第二遍,分数有很大的差异是不足为奇的,因为他们的成长导致测验成绩的变化非常自然。问题将是确定有多少变化是由于成绩的随机变化引起的,又有多少可以归因于个人在这段时间内所发生的变化。2024/11/28107在研究信度时,主要应考虑两方面的问题:测量结果的稳定性:测验分数一致性的程度(不同时间、测验条件下所得分数之间的一致性)一个人获得分数与“真实分数”之间的接近程度测量结果的一致性是否达到实际应用的程度影响稳定性的原因:什么因素造成了这种差异(误差的来源)这些效应的相对作用如何(分数的实际含意)2024/11/28108信度的计算:信度系数信度指标的一般公式:测验分数=真实分数+测量误差或者:X=T+e信度的高低通常以相关系数表示,称为信度系数(reliabilitycoefficient)。信度系数一般是同一样本所得的两组资料的相关,因此有:测验分数方差=真实分数方差+误差分数方差

X2=

T2+

e2信度系数:rxx=

T2/

X2

=

T2/(

T2+

e2)信度系数即是真实分数方差(变异数)与测验分数总方差(变异数)之比。2024/11/281092、信度的作用测验信度要能够区分出:导致一致性的因素:个体稳定的特性(测量对象)导致不一致性的因素:可能影响测验,但又与测验对象没有关系的个体和环境的特性在人事测量中,对信度系数进行确定通常有以下作用:解释真实分数与实得分数之间的相关说明可以接受的信度水平2024/11/28110解释真实分数与实得分数之间的相关信度可以解释为总的方差(标准差的平方的缩略语)中有多少比例是由真实分数的方差决定的,即测量分数的变化中有多少是真正反映了被测者分数的变化。例如:当rxx=0.90时,我们可以说,实得分数中有90%的方差是来自真实分数的变化,仅有10%是来自测量的误差。信度系数的分布是从0.00-1.00的正数范围,代表了从缺乏信度到完全可信的所有状况。思考:如果rxx=1.00表示什么?rxx=0.00表示什么?2024/11/28111说明可以接受的信度水平信度的理想水平是1.00,但是实际上是达不到的。一般能力与成就测验的信度系数在0.90以上;人格、兴趣等测验的信度通常在0.80-0.85之间。一般来说,当rxx

<0.70时,不能用测验对个人进行评价,也不能在团体间作比较;当rxx

>0.70时,可用于团体间比较;当rxx

>0.85时,可用于鉴别个人。2024/11/28112几种心理测验的信度系数测验类型信度低中高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向性测验0.260.880.96客观人格测验0.460.850.97兴趣问卷0.420.840.93态度量表0.470.790.982024/11/281131、重测信度(test-retestreliability)又称为稳定性系数,是采用重测法计算信度的方法,即用同一测验在不同时间对同一对象施测两次,两次测量分数的相关系数即为重测系数。人事测量所测查的特质中,有相当多的内容具有一定的稳定性,如人格、能力倾向等,因此,对于这些内容而言,重测信度对于衡量测量工具的质量是很重要的指标。例如:如果用一个智力测验测量某人的智力,第一天测量得到100分,表示智力中等;第二天测量却变成了150分,这个分数意味着这个人在一夜之间变成了天才,如果没有特殊原因,这种事绝对是小概率事件,不太可能发生,可信度极低。不能用这个结果帮助决策。2024/11/28114在日常生活中,你也许常常到市场上去买东西。如果你买了5斤瘦肉后觉得比上次少了点,没有那么重,那么你可以自己再用称称一下。如果也是5斤,那么你可能就会觉得确实有5斤。这是因为两次称得的结果完全一致,变异度为0。人的素质测评没有这么简单,因为素质本身又是无法精确定义,因而我们常常把对个体测评结果的准确性检验,置于群体测评结果的相互关系之中,转化为两次位置关系的一致性分析。当同一对象的测评结果以同样的测评方式再次获得后,其顺序位置关系变异很小时,则说明测评结果比较准确。例如:在技能测评中A分数88,在全体被测者中排名第一。这是否可靠可信?我们可以再测一次,结果A分数95,还是排名第一,而且其他被测的位置顺序变化很小。这时我们可以说第一次的技能测评结果是可靠的(信度高)。2024/11/28115重测信度的考察对象重测信度所考察的误差来源是时间的变化所带来的随机影响(气候、噪音的干扰、疾病、疲劳、情绪的影响等),根据重测相关系数的高低,可以得知测量结果在经过一段时间之后的稳定程度。重测信度表示测量能够应用于不同时间的程度,信度越高说明测量结果受环境中日常的随机因素影响越小,测量结果越稳定、可靠。评估重测信度时,要注意重测间隔的时间,时间太短被试对测试题记忆犹新,必然会造成假性相关;时间太长,测验结果又会受应试者的身心特质改变的影响,使相关系数降低。间隔时间的长短必须根据测验的性质和目的来确定。如果希望测量结果能预测较长时间的变化,则重测间隔时间应该长一些。例如人格测验一般间隔2-6个月比较合适。2024/11/28116应用重测信度应注意:重测信度一般只反映由随机因素导致的变化,而不反映被测者行为的长久变化。例如被测者智力的发展与能力的提高,不是重测信度考察的因素。这些因素导致的重测相关系数的降低,不能说明测验的重测信度低。不同行为受随即误差影响不同。例如手指敏捷性就比言语理解力更容易受疲劳、环境等因素的影响。因此必须分析测量目的和了解所预测的行为。当测量的行为或特质较为稳定时,重测信度的解释才有效。只有不大容易受重复影响的测验,如感觉-运动测验或人格测验,才比较适合用重测法计算信度系数。因为被测者一旦知道答案就不容易忘记,从而造成假性相关。2024/11/281172、复本信度(alternative-formreliability)又称为等值性系数,它是以两个测验复本(功能等值但题目内容不同)来测量同一对象,然

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论