四川师范大学2020-2021学年《心理测量学》期末考试试卷(B卷)含参考答案_第1页
四川师范大学2020-2021学年《心理测量学》期末考试试卷(B卷)含参考答案_第2页
四川师范大学2020-2021学年《心理测量学》期末考试试卷(B卷)含参考答案_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE11PAGE四川师范大学2020—2021学年期末测试《心理测量学》考试试卷(B卷)考试范围:《心理测量学》;满分:100分;考试时间:120分钟院/系:__________专业:__________姓名:__________考号:__________题号一二三四五总分得分注意事项:1.答题前填写好自己的姓名、专业、考号等信息2.请将答案正确填写在答题卡上第I卷(选择题)评卷人得分一、单项选择题:1~20小题。下列每题给出的选项中,只有一个选项是符合题目要求的。1.下面是某定向能力测验中五道选择题的项目分析数据,根据项目筛选的一般要求,最佳的项目是()。A.P=0.15,D=0.30B.P=0.75,D=0.85C.P=0.45,D=0.75D.P=0.50,D=0.152.在编排是非题时,“是”、“否”题大致相等或答“否”题掠夺,是控制()的有效方法。A.求“快”与求“精确”B.肯定定势C.喜好较长选项D.喜好特殊位置3.王红在30名同学中物理成绩是80分,排列第五名,则其百分等级为()。A.65B.75C.85D.954.()指的是一个测验实际测到所要测量的理论和特质的程度。A.内容效度B.构想效度C.逻辑效度D.实证效度5.对于某些特殊的群体来说,情况很具体而特殊。我们就需要制订()。A.普通常模

B.特殊常模

C.一般常模

D.剖面图6.关于选择常模团体时要注意的事项,下列表述不正确的是()。A.必须明确所要测量的群体的性质与特征B.常模团体必须是所测群体的一个代表性的样本C.必须明确、详尽地描述取样的过程D.不需要考虑总体的情况,样本量越大越好7.从测量内容来看,SCL-90属于()。A.智力测验

B.人格测验C.兴趣测验

D.心理健康测验8.信度系数(r)()。A.当r>0.85时,可用于团体,不可用于个人比较B.当r>0.85时,可用于团体和个人比较C.当r>0.85时,不可用于团体和个人D.当r>0.85时,不可用于团体,可用于个人9.下面各选项都是心理测验的简写,其中不属于人格测验的是()。A.EPQ

B.16PF

C.CRT

D.MMPI10.在测量的概化理论中,G系数一般是指()。A.测量目标效应方差与相对B.测量目标效应方差与它加上相对误差方差之比C.测量目标效应方差与总效D.相对误差方差与总效应方差之比差之比11.如果要用实验确定20世纪末我国高考扩招对大学生整体素质的影响,应该使用()。A.非等组设计B.单被试设计C.含有控制组的时间序列设计D.时间序列设计12.下列说法中,()不是对测验环境条件的要求。A.完全遵从测验手册对环境的要求B.安排测验材料C.记录下任何意外的测验环境因素D.在解释测验结果试也必须考虑环境因素13.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了()内容取样的一致程度。A.原测验

B.所有条目之间

C.题目与分测验之间

D.两半测验14.全国性常模,样本量要在()之间。A.1000-2000B.2000-3000C.3000-4000D.4000-500015.()量表中最早使用智力年龄的概念。A.比内-西蒙B.斯坦福-比内C.韦克斯勒D.瑞文16.效标测量本身的可靠性如何使值得考虑的一个问题。效标测量的可靠性即效标测量的()。A.区分度B.常模C.信度D.效度17.某研究选取容量均为5的三个独立样本进行方差分析,其总自由度为()。A.15B.12C.2D.1418.I类错误的概率α和Ⅱ类错误的概率β的关系有()。A.α+β=1B.随着α的增加,β也会增加C.α/β=常数D.如果α非零,那么β也非零19.实验研究假设和测量指标的理论构思及其操作化问题,即理论构思及其转换的有效性,通常指实验的()。A.内容效度B.内部效度C.构想效度D.实证效度20.测题编排的一般原则不包括()。A.尽可能将同类型的测题组合在一起B.测题的难度排列宜逐步上升C.根据各种类型测题本身的特点排列题目D.测题的难度排列可随意编排评卷人得分二、多项选择题:21~28小题。请将答案写在答题纸指定位置上。21.外部效度的影响因素有()。A.实验环境的人为性B.无预备实验C.测量工具的局限性D.样本缺乏代表性22.区分度的计算方法有()。A.项目鉴别指数法B.相关法C.难度推算法D.Z检验法23.测量过程中()。A.两次测量之间的时距相距3个月以上,练习效应可忽略不计B.被试者的应试动机很重要C.一般的平均练习效应,约在1/5个标准差以下,且仅限于第一次及第二次重测D.一般的平均练习效应,约在1/3个标准差以下,且仅限于第一次及第二次重测24.属于投射测验的人格测验有()。A.情境模拟测验B.主题统觉测验C.MMPID.罗夏墨迹测验25.对于一个测量来说,下列哪几句是正确的?()A.信度高,效度一定高B.信度低,效度一定低C.效度高,信度一定高D.效度低,信度就一定低26.20世纪在智力测验方面的新发展是研发了()。A.罗夏测验

B.团体测验

C.操作测验

D.投射测验27.多重能力倾向测验的特点包括()。A.一般包含4-9种分测验,各分测验分别测不同的能力。测验结果除总分外,还有各个分测验的分数,对一个人的能力可提供多方面的说明。B.常模通常根据一个标准化的团体建立,因此测验结果的各分测验得分可以直接相互比较,以判定每个人在能力上的所长和所短。C.在测验时间及材料上,都比特殊能力倾向测验经济。D.测验所使用的刺激材料没有明确结构和固定意义,被试有广泛自由的反应方式。28.在经典测量理论中,表示测验结果精确程度的指标有()。A.测验信度

B.测验效度C.测验标准误

D.测验正确率第II卷(非选择题)评卷人得分三、名词解释:29~32小题。请将答案写在答题纸指定位置上。29.学习障碍30.瑞文测验31.测量误差32.效度评卷人得分四、简答题:33~37小题。请将答案写在答题纸指定位置上。33.简述智力测验的局限性。34.简述职业兴趣测验在职业选择中的作用。35.成就测验按不同标准划分,可分为哪几类?36.已知rxx=0.31,rxy=0.42,若希望把效度系数提高到0.65和0.70,则测验长度要增加几倍?37.心理学研究中信度与效度的关系。评卷人得分五、论述题:38~39小题。请将答案写在答题纸指定位置上。38.试述经典测量理论的优点与局限性。39.现在流行的创造力测验依据的理论基础是什么?

【标准答案】第I卷(选择题)一、单项选择题:1~20小题。下列每题给出的选项中,只有一个选项是符合题目要求的。1.C2.B3.C4.B5.B6.D7.D8.B9.C10.B11.D12.B13.D14.B15.A16.C17.D18.D19.B20.D二、多项选择题:21~28小题。请将答案写在答题纸指定位置上。21.ACD22.AB23.ABC24.BD25.BC26.ABCD27.ABC28.AC第II卷(非选择题)三、名词解释:29~32小题。请将答案写在答题纸指定位置上。29.学习障碍是指儿童在理解和使用口头语言或书面言语,有一种或一种以上基本心理历程的异常,以致在听讲、思考、说话、阅读、书写、拼字或数学演算方面,可能显现能力不足的现象。这种异常状态包括诸如知觉障碍、脑伤、轻微脑功能失常、阅读缺陷以及发展性失语症的情形,并不包括儿童因视觉、听觉、运动障碍、智能迟滞、情绪失调或环境匮乏等因素而造成的学习困难。学习障碍有很多表现,但专家们强调对其原因的探讨,因为学习障碍表现的个别差异很大,这些差异也反映在他们对测验工具的选择和康复计划的制定上。30.瑞文测验是英国人瑞文在1983年设计的一个智力量表。由于该测验是非文字的,测试不受文化、种族和语言的限制,特别适用于测量个体的观察、思考与推理的能力,而不考虑他们的文化、种族与体质。整个测验一共由60张图案组成,按逐步增加难度的顺序分成A、B、C、D、E五组,每组都有一定的主题,题目的类型略有不同。瑞文测验施测很简单,每个被试发一个量表和一张答卷纸即可。31.测量误差是指实测值与真值之差。实测值是实际测量某种事物或现象时所获得的测定值,也称实测分数X。真值是被测量的事物或现象的真实规模的取值,也称真分数T。两者之差即称为测量误差或误差分数E。测量误差可分随机误差和系统误差两类。前者受各种偶然因素影响,使多种测量结果不一致,它对测量的信度、效度都有影响;后者又称恒定误差,由稳定因素引起的方向和大小有规律可循的误差,只影响测量的效度,不影响信度。32.效度是测量的有效性或正确性,是指一个测验或量表实际能测出其所要测的心理特质的程度,包括内容效度、结构效度和实证效度。其测量定义为,在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率。效度是对测量工具的最基本的要求。效度系数愈高即表示该测验测验能测量到所需要测的东西,测验越有效。四、简答题:33~37小题。请将答案写在答题纸指定位置上。33.智力测验,是经过专门设计的一种心理测量工具,用来评估一个个体相对于人群中其他人而言认知能力的高低。智力测验能很好地预测学术成就,它们也能预测职业上的成功。但是,智力测验有不少局限性:(1)智商分数的预测效度不高。智力包括人各个方面的能力。个体是一个变化发展的过程,因此很难预测智力的发展趋势。(2)它缺乏理论基础。目前普遍认为智力是一个人心理能量的综合,包括很多方面,对智力的构成因素还缺乏全面的认识。(3)存在文化偏见。现有的比较权威的智力测验是建立在西方文化背景下的,而且反映的是中上层阶层的意志,不具有普遍的代表性。(4)不能包容其他类型的智力。很多智力测验都只是测查智力的一些方面,而目前多元智能、情商概念等都反对将智力等同于语文和数学能力。34.职业兴趣测验在教育、培训、人事组织管理等领域应用得越来越多。同时,兴趣测验本身因为得到了逐步地完善。职业测验在职业决策中的应用大体可分为三个方面:(1)用于为人择事的职业指导为人择事的职业指导是一种发展性的指导,主要用于针对不同人的特点,给以选择何种职业或专业的建议。在职业指导中,对个人能力倾向的区分并不是唯一重要的,兴趣、价值观和经历等因素在指导中也很受重视,因为大多数心理学家认为,职业的成功是一种综合效应,很难判断是能力的作用还是其他人格因素的作用。(2)用于为事择人的职业选拔和安置为事择人的职业选拔和安置,主要用来挑选合适的人从事某一工作。这种测验对人的能力有严格的要求,应用于工业和军事的各种人员选拔与安置测验、各类机关团体的人员选拔测验等都属于这一种情况。其中,对管理者的选拔和评价还强调对人格特质的测量。(3)用于各种专业资格的鉴定各种专业资格的鉴定,主要是用来确定个人是否具有从事某专业所需要的知识和能力,以鉴定他从事该专业的资格,并发给证书或执照,如用于不同行业的各种资格考试等。35.(1)成就测验从反应方式上,可分为实作测验和纸笔测验。①实作测验需要具体操作,如表演体操、调整机器等。②纸笔测验又可分为再认式和回忆式两类。再认式题目是把若干学习过的内容,重新呈现在被试面前,让被试辨认或排列组合,如是非题、多选题、匹配题、顺序题等。回忆式题目是所学过的内容不在眼前,要被试回忆,写出一个答案来,如填空题、简答题、论文题等。(2)从编制方法上可分为标准化成就测验和教师自编测验。①标准化成就测验是由专门机构编制的,测验内容和常模样本较为普遍。②教师自编测验通常因教师、课程、班级或教学单元的不同而有所更换,其内容范围和常模样本较为狭窄。(3)从总的用途上看可分为总结性测验和形成性测验。①总结性测验:成就测验的传统用途是在学习单元或全部课程结束后实施测验,以测量学生是否已达到教学目标。从技术上讲,这种用途称为总结性评估,它以测验成绩作为最终产物,目的是对学生的学习作一终结性的评价,如好坏、过关还是不过关。②形成性测验:这种评估是把教育过程和评估结合起来,在教学进行过程中测量学生的进步情况。形成性测验是教学活动中的一个有机部分,通过对学习者在学习过程中的表现进行评估,可以指导学生决定是复习还是继续学习下一个单元。‘(4)根据解释分数的方法的不同,可分为标准参照测验和常模参照测验。在实际应用中,许多成就测验既可以是常模参照测验,也可以是标准参照测验,了解一个人已经学了多少(标准参照测验的功能)和把一个人的成绩与其他人作比较(常模参照测验的功能),有时可以由同一个测验来完成。(5)从测验的功能上可分为检查测验、水平测验、预测性测验、诊断性测验和准备性测验。①检查测验主要用来考察被试对某种知识、技能总的掌握情况,而不是被试所具有的长处和不足。②水平测验是一种标准参照测验,是用来考察学生是否达到某种要求的能力水平的一种测试。它不是用来确定被试在人群中的位置,而是用来对被试达标情况进行判断。这种测验又可称为基本技能最低限度测验。③预测性测验通常用来预测被试未来的学习成就。一般它所包含的题目比相同学科的一般成就测验复杂,在预测今后是否成功方面,其作用与性向测验相类似。预测性测验有阅读测验、算术测验和外语测验等等。④诊断性测验能鉴别被试在学习功课方面的困难。编制这种测验必须把被试在各个学科上的成绩分解成在各种技能上的成绩,再分别设计出测量这些技能的题目。一般成就测验只可用于比较被试在人群中的相对位置,却不知道对具体技能的掌握情况,而诊断性测验可以了解被试在几个基本技能上的优劣,从而提供改进的依据。诊断性测验包括的题目差别很大,施测时间比相同学科检查测验长,有时还要用到特殊仪器,如眼动仪等。在使用时,一般成就测验通常是第一步,它给出被试在各个课程中表现的具体情况,如需要评估被试在特定领域的成就,可以实施单科检查测验,最后如果需要仔细分析个体在阅读、算术等方面的困难及其原因时,可以实施诊断性测验。⑤准备性测验主要考查学生在一个特定的教育任务上是否做好了准备,其效度由对有关领域的教学做好准备的学生同没有做好准备的学生之间的有效区分决定。(6)从测验的内容范围上,可分为成套成就测验和单科测验。①成套成就测验是包括不同内容范围的一套测验,每个分测验包括某种学科的知识,各分测验得分可互相比较。分测验也可以单独使用,但这样做比单科测验的信度和效度低。

②单科测验包括特殊领域的知识,适合于确定被试在该领域的成就大小。36.测验长度与效度的公式如下:整理得:K=当r(kx)y=0.65时,K===6.42当r(kx)y=0.70时,K===13.80所以,要想把效度系数提高到0.65,测验长度需要增加6.42倍;要提高到0.70,测验长度需要增加13.80倍。37.(1)信度与效度的含义信度是测量结果的稳定性程度。效度是指一个测验或量表实际能测出其所要测的心理特质的程度。(2)信度与效度的关系①信度高是效度高的必要而非充分条件当随机误差的变异数(S2e)减小时,真实分数的变异数(S2v)增加,测验信度(rxx=S2t/S2x)随之提高。信度的提高只给有效变异数(S2v)的增加提供了可能,至于是否能提高效度,还要看系统误差变异数(S2v)的大小。可见,信度高不一定效度高。但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。即一个测量工具具有一定的信度,但对于某一个目的并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。②测验的效度受信度制约,信度系数的平方根是效度系数的最高限度。五、论述题:38~39小题。请将答案写在答题纸指定位置上。38.(1)经典测量理论的优点真分数模型是以弱假设为基础的,因而容易验证并易于被绝大多数测验数据资料满足,并在此基础上建立了一整套理论及统计分析方法。此外,经典测量理论浅显易懂,便于在实际测验情境(尤其是小规模资料)实施,是目前测量学界使用与流传最广的理论依据。(2)经典测量理论的局限性①未能区分测验情境中的各类测量误差,而是把所有的测量误差都归为一类。②样本依赖性。经典测量理论的得到的各项指标,如难度、区分度和信度等依赖来自的特定被试样本,会因接受测验的被试样本的不同而不同。③无法比较两组测验的得分。在真分数模型中,实测分数X(以及真分数T)并不位于等距量表上。④以一个相同的测量标准误作为每位被试的测量误差受到怀疑。⑤测验结果的精确程度以测验信度和测量误差的方差来表示,忽略了单个被试在项目上的得分。⑥结果应用的局限性。经典测量理论的测验信度是建立在严格平行测验假设基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论