教育统计与测量评价_第1页
教育统计与测量评价_第2页
教育统计与测量评价_第3页
教育统计与测量评价_第4页
教育统计与测量评价_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教育统计与测量评价复习资料一、单项选择题1、观测数据为 98、 90、70、75、83、80,这组数据的全距是( C、28)。2、两个行为变量的观测值皆为顺序变量, 则研究这两个变量之间的相关系数时, 宜用( B、 等级相关系数 )。3、在一批考试分数中,百分等级为 76的分数是 37 分,这意味着比 37分高的考生人数占 全部考生总数比例是(A 、24% )。4、在正态分布中,已知概率P(XZ 0.15866 )。5、 投掷一粒骰子,出现“ 4”点的概率是( A、1/6)。&测验蓝图设计是关于(B、测验内容和考查目标的抽样方案)7、 面试共有6题并采用放回抽取原则,问两个考生抽取同为B题的概

2、率为(D、1/36 )。8、每项评价指标在指标体系中所占的重要性程度,经量化后的值叫(A、权重 )9、教育测量专家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是(C、评价=测量+非测量+价值判断)10、 复本信度和重测信度这两种方法的最大差别是(C、不是同一份测验)o412、 已知 X,=5,X2=6, X3=7, X4=3,X5=4 贝UXi 等于( A、16)。i213、在一批考试分数中,百分等级为 56的分数是 65分,这意味着比 65分高的考生人数占全部考生总数比例是( B、 44%)。14、 下列分类属于按照测量与评价的内容划分的是(B、智力与成就测量与评价)1

3、5、 某班 50名学生中有 30名女生,问抽取一个学生恰好为男生的比例是( C、 2/5 )。16、测验蓝图设计是关于( B、测验内容和考查目标的抽样方案)。17、 Z分数量表是(B、测验内容和考查目标的抽样方案)。18、已知 P (Ov Z V 1.96) =0.475, J贝 P (|Z| 1.96)概率值为(B、0.05)19、 重测信度的用途有时也在于评估所测特质在短期内的(C、稳定性)。20、教育测量专家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是(C、评价=测量+非测量+价值判断)21、有一组数据是测量身高的, 一组是测量体重的, 若比较两组数据的离散程度,

4、 贝用( D、 差异系数 )。22、 某次考试之后对数据进行统计分析,求得第56 百分位数是 65 分,这意味着考分高于65分的考生人数比例为(B、 44 )。23、下列分类属于按照测量的内容划分的是(B、智力与成就测量与评价)B、A.24、标准正态分布的平均数和标准差分别是( A、 0 和 1 )25、 在正态分布中,已知概率 P(X Z 1)= 0.34134试问:概率P (ZV-1)的值为( 0.65866 )。26、 测验蓝图设计是关于(B、测验内容和考查目标的抽样方案)27、 同时掷两个骰子,出现 12个点的概率为(D、 1/36 )28、每项评价指标在指标体系中所占的重要性程度,经

5、量化后的值叫(A、权重29、教育测量专家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是(C、评价=测量+非测量+价值判断)30、重测信度的用途有时也在于评估所测特质在短期内的( C、稳定性 )。31 .学习教育统计与测量对教育工作者十分重要,它是(A.教育研究的重要方法与工具32. 假如我们希望通过一个统计表就能较方便地了解处于某个分数以下的人数,这时可编制一个(C.累积次数分布表)33. 下列数据中,不能进行加、减、乘、除运算,只可对每一类别计算次数或个数的是 称名变量 )34适合显示各统计事项占总体比例的图形是(C.圆形图 )35.下面属于地位量数的是 ( B.PR

6、)36提出等级相关法的统计学家是(D.斯皮尔曼)37百分等级数值是(D.比率变量)38下列布鲁姆认知领域教育目标分类中,层次最低的是 (A.知识 )39.利用韦克斯勒智力测验量表测查某校小学二年级学生,平均数为102,标准差为 18,某学生得分为 120,那么他的离差智商为 ( C.120)40是非题的特点是(C.适用范围有限)41标准参照测验的用途(D.用于评价课堂教育与课程编制的有效性)42吉尔福特根据研究得出,发散性思维在行为上表现出的特征有流畅性、变通性和(C独特性 )43. 平均数的抽样分布近似服从正态分布所需的样本容量至少为 ( C.30 )44. 统计假设检验中,虚无假设又称为(

7、A.零假设 )45. 统计假设检验中关于单侧检验描述不正确的是 (A.显着性水平值平分在抽样分布两尾 )46. 学习教育统计与测量对教育工作者十分重要,它是 ( A. 教育研究的重要方法与工具)47. 假如我们希望通过一个统计表就能较方便地了解处于某个分数以下的人数,这时可编制一个(C累积次数分布表)48. 下列数据中,不能进行加、减、乘、除运算,只可对每一类别计算次数或个数的是 (A.称名变量 )49. 适合显示各统计事项占总体比例的图形是(C.圆形图)50. 提出等级相关法的统计学家是(D.斯皮尔曼)51. 百分等级数值是(D.比率变量)52. 下列布鲁姆认知领域教育目标分类中,层次最低的

8、是(A.知识)53. 利用韦克斯勒智力测验量表测查某校小学二年级学生,平均数为102,标准差为18,某学生得分为120,那么他的离差智商为(C.120 )454. 是非题的特点是(C适用范围有限)55. 标准参照测验的用途(D.用于评价课堂教育与课程编制的有效性)56. 吉尔福特根据研究得出,发散性思维在行为上表现出的特征有流畅性、变通性和(C.独特性)57. 平均数的抽样分布近似服从正态分布所需的样本容量至少为(C.30)58. 统计假设检验中,虚无假设又称为(A.零假设)59. 统计假设检验中关于单侧检验描述不正确的是(A、显着性水平值平分在抽样分布两尾)60. 1、一批数据离差之和是(

9、A、0)61.我们常说的考试分数属于(C、等距)63. 按教学中运用的参照点分类, 教育测量与评价可分成 ( A 形成性、诊断性和终结性参 照测量与评价 )。64. 某次考试之后对数据进行统计分析,求得第 66 百分位数是 44 分,这意味着考分高于 66 分的考生人数比例为(A、 34 )。65. 在正态分布中,已知概率 P(OvZ 1.5)= 0.3749试问:概率P (Z V 1.5的值为(D、 0.8749 )。66. 复本信度和重测信度这两种方法的最大差别是( C、不是同一份测验)o67. 每项评价指标在指标体系中所占的重要性程度,经量化后的值叫(A、权重 )o68. 之所以不能用原

10、始分数评价各科的成绩在于(C、原始分可比性差)o69. 格朗兰德认为评价可以用下列哪个公式表示? (B评价=测量+非测量+价值判断)二、 概念解释1. 教育测量 :就是给所考察研究的教育现象, 按一定规则在某种性质的量尺上指定值。2. 结构效度 :结构效度指的是测验测得心理学理论所定义的某一心理结构或特质的程 度。3. 心理测验:理测验是通过对一组标准刺激所引起的行为样组的客观分析,对人们的心理特征及个别差异进行估测、描述和诊断的一种方法4. U型错误:在统计假设检验作决策时可能犯的错误有两种类型:一种是虚无假设属真而被拒绝的错误,这种错误统计上称为 I 型错误,又称为“拒真”错误;另一种是虚

11、无 假设实伪而未被拒绝的错误,统计上称为U型错误,又称为“纳伪”错误。5. 标准分数常模:标准分数常模,就是用被试所得测验分数转换成的标准分数来揭示其 在常模团体中的相对地位的组内常模。6. 测验效度:测验效度,就是测验实际上测到它打算要测的东西的程度。7. 统计量:应用样本数据计算的各种特征量数我们称其为统计量。8. 单侧检验:单侧检验只在抽样分布的一个尾侧设有临界值,危机域也只有一块,而这一块危机域的概率面积就等于显着性水平 a的值。9. 散点图:画在平面直角坐标系中表示两种事物之间相互关系及联系模式的一种图示方法。10. 标准参照测量与评价:标准参照测量与评价是将被试的表现与既定的教育目

12、标和行为 标准相比较,以评价被试在多大程度上达到该标准的一种测量与评价。11. 教育评价:是按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地 收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和 价值判断,并为教育决策提供依据的过程。12. 教育测量:是针对学校教育影响下学生各方面的发展,侧重于量的规定性予以确定和 描述的过程。13. 测验的效度:测验能测出所欲测特质的程度,相对于某种测量目标而言。14. 等距变量:除了能表明量的大小外还具有相等的单位,而且其零点是相对的15. 标准化测验 :如果测量工具、施测与评分程序、解释分数的参照系(或标准)都已科 学

13、地实现标准化,也就是说,这种代表性行为样本的客观而标准化的测量,就称之为 标准化测验。16. 组内常模 :组内常模是解释被试原始分数的参照体系,即被试所属那类群体的人(实 际上即常模组被试)在所测特性上测验取值(也就是分数)的分布状况;拿被试分数 跟这种分数分布状况作对比,就能揭示出被试在其所属那类群体(即常模组)中的相 对地位。17. 学习能力倾向测验 :学习能力倾向测验旨在测量一般的学习能力和潜力,即是否具备 较好的进一步学习与研究的潜在能力,而不是已在学校中学到了多少知识。18. 显着性水平 :在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的 显着性水平。三、问答题1试述算

14、术平均数的运算性质及优缺点。答:算术平均教具有以下几条运算性质:( 1)数据组全部观测值与其平均数的离差之和必定为 0。(2)每一观测值都加上一个相同常数 C 后,则计算变换后数据的平均数, 等于原有数据的平均数加上这个常数 C。(3)每一观测值都乘以一个相同常数 C 后,这样所得新数据的平均数, 其值等于原数据的 平均数同样乘以这个常数 C。(4)对每个观测值作线性变换,即乘上相同的常数 C,再加上另一常数d,则计算变换数据的平均数,其值等于原数据的平均数作相同线性变换后的结果。优缺点: 算术平均数具有反应灵敏、确定严密、简明易懂、概括直观、计算简便,并能作进一步的代数运算等优点,是应用最普

15、遍的一种集中量数。但是,算术平均数需要每一个数据都加入运算,因此,在数据有个别缺失的情况下,则无 法准确计算。特别是,算术平均数易受极端数据的影响,一旦在数据分布中出现个别极端 数据,就会对平均数产生较大影响,从而使人对平均数产生怀疑。此外,在一些特别情况 下,由于各个数据的重要性不同,因此,直接把数据简单相加以确定算术平均数的方法,不能充分考虑到各个数据的重要性程度。2简述实验技能考核需要遵循的原则。答:实验技能考核需要遵循如下三条基本原则:(1)实践性为主的原则即应以动手操作为主,不能停留在笔试形式下考察实验操作知识的方式上。(2)全面性原则要尽力考核到实验设计与设计、实验的实施与操作、实

16、验的分析与解释、实验报告撰写等环节。(3)客观化原则要建立在行为观察的基础上,客观地评价学生的实验技能。3简述统计量与参数的区别与联系。答:(1)统计量和参数都是反映数据特征的数量,分别相对于样本和总体而言。在总体数 据基础上求取的各种特征量数称其为参数,应用样本数据计算的各种特征量数称其为统计 量。(2)总体只有一个,因此总体参数也只有一个,总体参数是常数。样本来自于总体,但样本可有许多个,相应于总体参数,每抽取一个样本就可以求得一个样本统计量,而每一个样本统计量的值都在总体参数的上下波动,都存在一定的差异。每个不同样本的统计量之间也都是不相同的,相对于总体参数而言,有的样本的统计量离总体参

17、数更近,而有的样本统计量会离得更远些。由此我们看到,样本统计量是一个变量,它随样本抽取的变化 而变化,又由于样本的随机性,样本统计量也是一个随机变量。4简述统计假设检验的反证法与一般的数学反证法的差异。答:(1)差异之一是,数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假设的决策无论是从决策逻辑还是从决策内容看都是百分之百正确的。而统计假设 检验的反证法最终推翻虚无假设的依据是一个小概率事件,从决策逻辑角度看是百分之百 的正确的,但其决策的内容却是有可能出错的。(2)差异之二是,数学中使用反证法,其最终结果一定是推翻原假设,而统计假设检验这 种反证法的最终结果却有可能无充分理

18、由推翻原虚无假设,因为很可能我们依据样本数据 计算的检验统计量的取值概率并不是一个小概率, 因此也就无理由怀疑虚无假设的正确性。5. 客观题的主要优缺点是什么?答案要点 优:客观;信息量大,覆盖面广;误差小信度高;适合测量明确的知识点缺点:难测高层次的心智技能;不易测文字表达和创新思维能力。6. 试述教育测量与教育评价之间的关系。教育测量与教育评价之间有联系有区别;教育测量侧重于量的规定性方面去把握事物;教 育评价关注价值判断,包括优缺点分析;教育测量是教育评价的基础;评价又是教育测量 的延伸和功能释能;有些情况下教育测量本身就是系统的教育评价过程。7. 为什么说教育测量与评价在教育中有着重要

19、作用?在教育系统中对实现教育目标起重要的作用;是课程改革的重要组成部分;教育改革常常 把测量与评价的改革或反思作为突破口。8. 请以你熟悉的一门课程试卷为例谈一下怎样制作命题双向细目表?以教学内容和目标分类为维度并结合某门课程列出命题双项细目表,举例略9. 当前学校的学生课业考评存在哪些主要问题?过于强调选拔、方法单一、考评抽象和表征化。10. 为什么说教育测量与评价是教师必备的知识技能正确评价学生是教师的一种职业能力;教师需要测量与评价的方法弥补非正式观察和书面 考试的不足;实践证明评价是所有成功教学的基础;发达国家教师教育普遍学习教育测量 与评价之类的课程。11. 怎样分析一份试卷的内容效

20、度?是根据教育教学特性编制的 ,由评价指标、指标权重和评价标准等构成的工具。12. 什么是教育测量?什么是教育评价?教育测量是针对学校教育影响下学生各方面的发展,侧重于量的规定性予以确定和描述的 过程;教育评价是按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收 集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判 断,并为教育决策提供依据的过程。13. 按解释结果的参照点分类,教育测量与评价可分为哪几类?并具体解释一下。常模参照测量与评价、标准参照测量与评价和潜力参照测量与评价。常模参照测量与评价是将被试的水平与测验常模相比较,以评价被试在团体中的相对

21、位置 的一种测量与评价类型;标准参照测量与评价是将被试的表现与既定的教育目标和行为标 准相比较,以评价被试在多大程度上达到该标准的一种测量与评价;潜力参照测量与评价 是将被试实际水平与其自身潜在水平相比较,以评价其有无充分发挥自身潜力为目的。14. 简述深刻理解教育测量必须抓住的三个要点。答:( 1)测量的结果就是给所测对象在一定性质的量尺上指定值;(2)要达到这个目的就要按一定规则来进行一系列工作;(3)工作如何进行和能在什么性质量尺上指定值,归根到底取决于所测对象本身的性质。15 举例说明什么是绝对评分分数答:教育工作是一种有组织有目的的活动,要努力追求教育目标的达成。所以,在学校里拿被试

22、在测试上的测值,去跟所测特性的应有标准作比较的事是很多的。很显然,这时测验分数的意义,就完全取决于实得测值与应有标准的关系了。如果达到了要求,就是“合格”的或“已达标”的;如果未达到要求,就是“不合格”或“未达标”的。这里,全然不管其他被试在同一测验上所得测值如何,他们达标与否丝毫不影响被试测验分数意义的确定。这种通过拿被试测值跟应有标准作比较来确定其意义的分数,就叫绝对评分分数。16简述影响U型错误的主要因素。答:影响U型错误概率大小的因素有三个,(1)第一个因素是客观的真值与假设的伪值两者之间的差异。(2) 影响U型错误概率大小的第二个因素是 a值的大小。(3) 影响U型错误概率大小的第三

23、个因素是样本容量。四、计算题(需写出详细计算过程)1. 已知一组数据为 20,12,15,18,1;0求这组数据的平均数、方差和标准差。(保留 2位小数)2-40答:平均数: X=(20+12+15+18+10) /5=15方差:於=(20-15)2+(12-15)2+(15-15)2+(18-15)2+ (10-15)2/5=13.60标准差: SD=3.692. 设参加某次考试人数为 10657人,其中有 6995人的成绩低于 90分,试确定卷面 90分这个成绩的百分等级PR(保留2位小数)答:百分等级 PR=6995/10657X 100=65.643某数学测验中,甲、乙、丙三位学生的原

24、始分数分别为110分、100分、70分,试求(1) 当该测验平均数为95.1,标准差为10.8时,三位学生的标准分。(2) 按 T=10Z+50,三位学生的T分数分别是多少?标准分数Z=(X-X)/S(1) 答:甲:Z1=(110-95.1)/10.8=1.38乙:Z2=(100-95.1)/10.8=0.45丙:Z3=(70-95.1)/10.8=-2.32(2) 答:甲:T1=10Z1+50=63.8乙:T2=10Z1+50=54.5丙:T3=10Z1+50=26.81204.某组成年人身高分别为175 180、177、173 175厘米;某组幼儿园学生身高分别为110、115 114 1

25、16厘米;问哪一组离散程度大?SCV 100%X( )解:成年人身高平均值为176厘米,标准差为2.37, CV=1%幼儿组身高平均值为115厘米,标准差为3.22, CV=2%所以幼儿组离散程度大5、某考试参加人数为2000人,已知成绩呈正态分布,平均分为 80,标准差为5问85分以上有多少人? 70分以上多少人?若只能有200人能进入下一轮考试,问能进下一轮考试的分数定多少合适?X解:根据标准分数公式Z Z=1,查表 P=0.3413450%-34.134%=15.866% 85分以上 317人;Z=-2,查表 P=0.4772550%+47.725%=97.725% 70分以上 1955

26、人;P=0.4, Z=1.28,带入公式则进入第二轮考试的分数线为 86.4&采用两端组法确定考试题目的区分度和难度,假定 44名学生参加考试,其中12名(占 总人数44名的27%)高分组学生和12名低分组学生在最后一道论述题(满分值 W=15分) 上的得分如附表所示,试计算该题目的区分度和难度。区分度D=Ph Pl;难度D=( Ph+Pl)/2高分组(12 人)14969896148879低分组(12 人)762351083207答:区分度 D=Ph Pl=0.594-0.244=0.35 难度 D= ( Ph+Pl)/2= (0.594+0.244 /2=0.4197、采用两端组法确定考试

27、题目的区分度和难度,假定37名学生参加考试,其中10名(占总人数37名的27%)高分组学生和10名低分组学生在最后一道论述题(满分值W=12分) 上的得分如附表所示,试计算该题目的区分度和难度。区分度D=Ph Pl;难度D=( Ph+Pl)/2表2:高分组与低分组论述题得分统计表高分组1079989610910低分组4623510476区分度 D=Ph Pl=0.725-0.32=0.405 难度 D=( Ph+Pl)/2= (0.725+0.32)/2=0.528、已知某选拔考试参加人数为1000人,成绩呈正态分布,平均分为 75,标准差为10。若只能有100人进入面试,问面试分数线定多少合

28、适?若有人考了 65分,问该人在团体中处于什么位置(百分等级是多少)?解:由题意可知求点双列相关n=10,p=6/10,q=4/10, x p=(75+57+73+65+63+67)/6=66.67,xq =(67+56+61+65)/4=62.25Sx=5.8rpb=( x p -Xq)/Sx . pq =(66.67-62.25)/5.8x20.6X 0.4=0.372所以区分度不明显9、9采用两端组法确定考试题目的区分度和难度, 假定52名学生参加考试,其中14名(占 总人数52名的27%)高分组学生和14名低分组学生在最后一道论述题(满分值 W=10分) 上的得分如附表所示,试计算该题

29、目的区分度和难度。区分度D=Ph Pl;难度D=( Ph+Pl)/2高分组(14 人)10799896108889108低分组(14 人)46235104320763区分度 D=Ph Pl=0.85-0.33=0.52 难度 D= (Ph+Pl)/2= (0.85+0.33) /2=0.5910、某次考试中选择题与总考试成绩如下表,求该选择题的区分度。(教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示)考生ABCDEFGHIJ选择题得分1111001001总成绩75577365675663616567(公式“宁炳)解:由题意可知求点双列相关n=10,p=6/10,q=4/10, x

30、p=(75+57+73+65+63+67)/6=66.67.xq =(67+56+61+65)/4=62.25Sx=5.8rpb=( x p -Xq)/Sx . pq =(66.67-62.25)/5.8x20.6X 0.4=0.372所以选择题区分度0.37211某次高考模拟试卷高一的5名学生做所用时间分别为170 120、110 160、130分钟;高 三的5名学生做所用时间分别为50、70、90、55、45分钟;问高一和高三哪一组离散程度 大?解:所以高三学生离散程度大。12、教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示,下表是一次测验 的有关数据:考生ABCDEFGHIJ

31、第一题1111001001被试得分75577365675663616567已知第一题为选择题,试求其区分度(公式:rpb XpSZ/pq)解:由题意可知求点双列相关n=10,p=6/10,q=4/10, x p=(75+57+73+65+63+67)/6=66.67,xq =(67+56+61+65)/4=62.25Sx=5.8rpb=(Xp -Xq)/Sx . pq =(66.67-62.25)/5.8x20.6X 0.4=0.372所以区分度不明显。13、某市举行选拔考试,共1000人参加,已知此次考试平均分为 60分,标准差为10,问(1) 如果只录取100人,那么录取分数线定为多少合适?(2) 如果某人考了 70分,但只能有150人参加面试,问该人是否能进入面试?解:根据标准分数公式Z XZ口5 1.28面试分数线为72.810Z=1,P=0.34134面试人比例为 50%-34.134%=15.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论