现代教育测量与评价_第1页
现代教育测量与评价_第2页
现代教育测量与评价_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1、测量:从广义上 来讲,测量是根据法 则给事物分派数字。 此定义包含了三个 方面特性:法则、事 物、数字。法则是测 量的标准,也就是测 量的依据和准则,即 我们根据什么来进 行测量;事物是测量 的对象,也就是对什 么进行测量;数字是 测量结果的表现形 式。2、测量的三要素: 单位(如米、克,教 育测量的单位不能 直接加减乘除);参 照点(计算的起点, 有绝对零点和相零 点);量表(测量工 具)。3、将量表从低级到 高级排列主要有四 种量表水平:类别量 表水平、顺序量表水 平、等距量表水平、 比率量表水平。4、教育测量是根据 测量学的原理和方 法对教育现象及其 属性进行数量化研 究的过程。它主

2、要包 括对学生的内在精 神属性的测量,教育 测量主要是一种间 接的测量。5、教育测量对象的 复杂性:首先它是内 在的,不能直接测 量;其次它是多变 的;另外有些主客观 因素也会影响测量 的结果。6、哲学史上三种价 值观:客观主义价值 观;主观主义价值 观;辩证唯物主义价 值观。7、信度:是测量结 果的稳定性或可靠 的程度,即测量的结 果是否真实、客观地 反映了考生的实际 水平。可从三方面理 解:实测值与真值相 差程度;统计量与参 数之间接近程度;两 次重复测量或等值 测量之间的关联程 度。信度系数以多大 为宜:对于学科测 验,信度系数要达到 0.9以上,智力测验 要达到0.8以上,品 德测验要

3、达到0.6以 上。8、校标关联效度: 又叫经验效度和统 计效度,是以测验分 数和校标之间的相 关系数来表示测验 的效度的高低的。9、教育测量的历史 知识:学记记 载中国在西周实行 了教育考评;1702 年英国剑桥大学首 先用笔试代替口试; 1845年美国在初 等教育中以笔试代 替口试;1864年 英国费舍收集学生 成绩样本汇成量表 集开启了标准化测 量的萌芽;1897 年莱斯的拼字测验 推动教育测验的发 展;冯特的测量方 法和高尔顿的统计 方法对教育测量产 生重大影响;1905 年法国比纳-西蒙智 力量表具有经典型; 1904年美国的桑 代克为教育测量之 父,其名言:“凡是 存在的东西都有数

4、量,凡是有数量的东 西都可以测量”。 1904桑代克发表的精神与社会测验 学导论,标志着教 育测验运动的开始; 美国的教育测验 运动分为三个时期: 1904-1915 开拓期, 1915-1930 兴盛期, 1930-1940 批判期。 1931年塞蒙兹主 张人格测量应用评 定法、问卷法、交谈 法、轶事记录法等。 泰勒主持了课程 设置和成绩测试的“八年研究” (1933-1940),首次 提出“教育评价”的 概念,并发表了史 密斯-泰勒报告,此 报告誉为“划时代的 教育评价宣言”,泰 勒被称为“教育评价 之父”。1963年克 龙巴赫发表了通过 评价改革课程; 1967年斯克里芬发 表了评价方法

5、论 第一次对形成性和 终结性评价等不同 类型的评价之间做 了区分。10、难度:是测验试 题的难易程度,是试 题对学生知识和能 力水平的适合程度 的指标。公式: P=R/N ; P表示难度 指标,N表示参加考 试的总人数,R表示 答对某道客观题的 人数。在常模参照性 测验中要求试题难度适中,即大多数题 目的难度在 0.3-0.7 之间,整个试卷平均 难度在0.5左右。11、区分度:指测验 对考生实际水平的 区分程度。公式:D=PH-PL ; D代表区 分度,Ph代表高分 组的难度;Pl表示低 分组的难度,D>0为 正区分,D<0为负区 分,D=0为零区。12、提高区分度的方 法:使题

6、目的难度适 中,使整个考试的难 度适中;着重考察复 杂的学习效果。13、测验目标:测验 所要达到的某种具 体目的,它明确规定 测验所要达到的预 期结果或标准。是编 制测验的出发点和 依据。14、布鲁姆把教育目 标分为认知领域、情 感领域、动作技能领 域的目标。他把认知 领域的教育目标分 为知识、应用、理解、 分析、综合、评价。1964年,布鲁姆等 人发表了教育目标 分类学:第二分册: 情感学习领域。15、1977年,加涅 在学习的条件的 第三版中将认知领域分为言语信息、智 力技能、认知策略三 种。智力技能分为辨 别、概念、规则、咼 级规则四类。学习的 结果分为智力技能、 认知策略、言语信息、运

7、动技能、态度 五种。日本的梶田叡 一在他的教育评 价分为三大目标: 基础目标、提高目 标、体验目标。16、测验题型可分为 封闭式、开放式。仃、测验编制中,设 计试卷的蓝图是命 题双向细目表。进行 教育测验的编制时, 一套试题中的客观 题约60%,主观题约 40%,测验试题难度 的掌握一般情况下, 较容易的试题占 20%左右。18、教育评价指标从 达标水平去考察,可 分为必达指标和期 望指标。教育评价指 标从精确度去考察, 可分为硬指标和软 指标两种。硬指标指 “硬件”,是固定的 精确的指标。软指标 指“软件”,是伸缩 性较大,不精确的指 标。佃、社会标准:以社 会对教育的现象要 求为依据,要求

8、达标 过程社会化规范化。20、科学标准:根据 客观规定和原则为 依据,要求符合教育 的客观规律。21、行为目标评价 法:指采用可观测的 行为目标作为评价 的依据的一种评价 方法。行为目标的表 达要注意两点:应设 立可能观察行为的场合;应容易表示出 行动的程度或阶段。22、加权平均法:是 通过自评、专家组 评、社会群众等不同 方面的评价,或者学 生、教师、领导等不 同阶层的评价者的 评价来综合评定被 评者的分数。23、评价信息收集的 标准主要有准确性、 可靠性、时限性。准 确性指收集到的信 息与评价目标的一 致性,只采集到的材 料是评价目标真正 需要的资料。可靠性 指收集到的资料的 真实可靠,是

9、信得过 的资料,这些资料所 反映的情况完全符 合客观实际。时限性 指严格按照评价工 作所规定的时限去 米集评价信息。24、处理评价信息的 方法:定性分析描述 法(包括等级评定、 评语鉴定、写实分析 法),定量评定法(包 括统计分析评判法、 模糊综合评判法)。25、教育评价中应用 较多的统计分析是 平均数、标准差、标 准分数、T分数、参 数估计、统计检验。26、教育评价过程是 评价者依据某种标 准对被评价者有关 方面情况进行评判 的过程。27、评价心理指评价 者和被评价者对评价过程的实践活动 和评价过程的各种 关系、交往等现实活 动的反应。28、评价准备过程中 的心理现象包括角 色心理、心理定势

10、、 新情感、时尚效应、 期望效应。角色心理 指身份的自我意识 及潜意识的表现的 一种心理学现象,是 特定的职业责任、道 德规范、行为习惯、 职业利益等的反应。 心理定势是指有一 定的心理活动所形 成的准备状态,影响 或决定同类后继心 理活动趋势的一种 心理现象。时尚效应 指对新颖、时髦事物 的向往和崇拜的一 种心理现象。29、标准分数是将原 始分数与其平均数 之差除以标准差所 得的商数,标准分数 又叫Z分数。30、评价实施前,对 评价的期望主要表 现有三种形式:积极 期望、消极期望、中 性期望。31、施评过程心理包 括自尊心理、首因效 应、近因效应、晕轮 效应、参照效应、理 想效应、顺序效应、

11、 趋中心里、成见效 应、宽大效应、附和 权威心理。32、被评价者过程心 理现象包括自卫心 理、迎合心理、应付 心理。被评价者结果 反馈中的心理现象 有:敏感心理(表现 在分数敏感、利害因 素敏感、公正敏感), 护短心理,嫉妒心 理,对评价进行评价 心理。33、单字测验 的三种类型:回忆、 自由联想、随机取 样。34、语文成绩测验的 种类:听说测验,单 字测验,词语测验, 阅读测验,作文测 验,语文综合测验。35、作文测验的五种 方法:分析法、多段 短文测量法、评定量 表法、预料后果法, 确定要旨法、作文测 验举例。36、影响作文评分的 三个因素:作文题目 类型及评分标准、被 试者主观方面的因

12、素、评分者方面的因 素。37、常用的作文评分 误差控制方法:2人 评分法、表格评分 法、正态分布评分 法、电脑控制评分 法。38、西周有数学教 育,隋唐出现数学考 试,科举制有“算 学”。现阶段,中学 数学教学目的包括 数学基础知识,基本 技能和数学能力。中 学数学教学大纲对 数学能力的规定:运 算能力目标、空间想 象能力目标、逻辑思 维能力目标、分析问 题解决实际问题能力目标。数学竞赛题 的三个特点:命题背 景;对已知结果的逻 辑改造;着眼于解题 的数学思想方法。39、标准化考试中的 四种常模:年级、年 龄、百分、标准分数。40、瑟斯顿智力群因 素论中七因素:空 间、数量、知觉、言 语、言语

13、流畅性、记 忆、推理。41、智力结构论: 1967年美国心理学 家吉尔福特提出了 智力的三维结构论, 他用内容、操作、成 果三个变项构成的 立体模型来描述智力结构。42、多维智力论:受(吉尔福特)的智力 结构论的影响,美国 哈佛大学心理学教 授(嘉德纳)提出多 维智力论。他强调人 类的智力至少包括 以下7种:言语智 力、数理逻辑智力、 空间智力、音乐智 力、体能智力、人际 智力、自知智力。与调查、作品选 集、完成研究项 目。52、品德测评的 类型:诊断性测 评、形成性测评、 总结性测评。品 法、跟踪观测法、 时间样本法。54、教师评价的 主体:教育行 政部门、学校、43、三重智力理论: 美国耶

14、鲁大学心理 学教授(斯滕伯格) 提出,这一理论从主 体的内部世界、现实 的外部世界以及联 系内外经验世界这 三个角度着手来分 析智力,并与之对应 提出了三类不同的 智力:成分智力、情 境智力、经验智力。44、智力测验的先驱 者是英国的遗传学 家高尔顿和美国心 理学家卡特尔。高尔 顿首先使用等地评 定量表和问卷法作 为测验的辅助工具。卡特尔于1890年发 表论文心理测验与 测量,首先使用了“心理测验”这个术 语。45、韦克斯勒智力量 表包括语言、操作两 部分,语言分常识、 理解、算术、类似、 词汇、数字广度;操 作由数字符号、图像 完成、积木设计、图 像列、拼图、迷津组 成。其测验结果有言 语智

15、商、操作智商、 德测评指标体系 确立的依据:依 据社会的需要; 依据德育大纲; 依据品德结构; 依据学生年龄特 征。教师参评;学 生参评;家长 参评,教师自 评。55、教师评价的全量表智商三种 46、德国心理学家斯 腾于1913年提出了 心智商数的概念;推 孟将心智商数乘以 100,提出了智商的 概念,也称为比率智 商。智商公式:比率 智商(IQ)=智龄(MA)/实龄(CA) *100%。泰勒在“八 年研究”期间正式提 出了课程评价的概 念。认为“评价过程 本质上是一个确定 课程与教学计划实 际达到教育目标程 度的过程”。47、学生评价的类 型:定位性评价(安置性),在特定 的教学活动之前判

16、定学生的前期准备; 形成性评价,是评 价的结果能够指导 以后的教学与学习 的评价;诊断性评 价,是为了使教学适 合与学习者的需要 和背景而在一门课 程和一个学习单元 开始之前对学习者 所具有的认知、情感 和技能方面的条件 进行的评价。53、语意分析法: 由奥古斯丁和同 事创立的,目的 是测量和比较概 念的意义。行为 测验法:是一种 有目的有计划地 考察学生思想行 三种指标体系: 教师素质指标; 教师职责指标; 教师绩效指标。48、学生评价的原 则:发展性、多元化、 全息性、差异性原 则。根据评价主体的 不同,学生评价可以 分为学生自我评价、 学生小组评价、教师 对学生的评价。49、教师评价学生

17、的 一般方法:学业成绩 测验、观察与调查 法、评语评价法、表 现性评价法、档案袋 评价法。档案评价 法:根据学生的反 映,以及教师的评 价、观察、考查、成 绩测验等,得出有关 学生进步和发展的 系统而持续的记录。50、表现性评价方法 的构成:有一个表现 性任务、有一个评价 标准、有一个或几个 好的评价者。51、表现性评价的主 要形式:演示、口头 表述、模拟表现任 务、实验为的方法。有自 然观察法、实验 观察法、情景观 察56、备课评价的 内容:评价教师 课前所做的思想 备课工作和三种 备课形式。对四 项备课工作评价的内容:钻研教 材的评价内容; 了解学生的评价 内容;选择教法 的评价内容;准

18、备教具的评价内 容。对三项备课 形式的评价内 容:对学期备课 评价的内容;对 单元备课评价的 内容;对课时备 课评价的内容。57、上课评价的 内容:教学目 的明确,完成任 务好;教学内 容正确、充实, 抓住重点、难点、 关键;教学方 法适合,教师善“宀 ”“ i=rL ”启 善 导 上课组织得 好,具有教学机 智性;教学基 本功扎实;教 学效果好。58、学生学业成 绩考评的种类: 诊断性评价(指在教育、教 学活动开始之 前,为使计划更 有效地实施而进 行的预测性、摸 底性评价)形 成性评价(指在 教育、教学活动 计划实施的过程 中,对计划、方 案执行情况进行 的评价)终结 性评价。59、目标评

19、价模 式的提出者是泰 勒(教育评价之 父),他将课程评 价分为四阶段: 确定教育目标, 选择学习经验, 组织学习经验, 评价学习效果。CIIP模式:即背 景评价、输入评 价、过程评价、 结果评价。最早 由斯塔弗毕姆、 格林、古巴提出。 外观评价模式: 最早由斯太克提 出,1967年发表 教育评价的全 貌,文中提出了 外观评价模式, 强调两方面的操 作过程:描述和 判断。回应模式: 1973年斯太克在方案的评价: 特别是回应性评 价中提出的。60、中小学校评 价的指标:基础 性指标、发展性 指标、学校特色 发展指标、教育 效益指标。61、中小学师资 水平评价六项内 容:教师队伍建 设;教学质量评

20、 价;教师品德修 养的评价;教育 科研能力的评 价;教师身体素 质的评价;教师 心理素质的评 价。62、发展性的中 小学学校评价的 方法:内部评 价和外部评价相 结合;形成性 评价和终结性评 价相结合;定 性评价和定量评 价相结合。63、教育评价中 应用较多的统计 分析是平均数、 标准差、标准分 数、T分数、参 数估计和统计检 验。64、标准分数是 将原始分数与其 平均数之差除以 标准差所得的商 数。标准分数又 叫Z分数。名词解释 1、相对评价法只 在评级对象的集 合中选取一个或 若干个作为基 准,然后把各个 与基准进行比 较。绝对评价法 只在评价对象的 集合之外确定一 个标准,评价时 候把评

21、价对象与 客观标准进行比 较。个体内差异 评价法指把评价 者的过程和现在 比较,或将评级 对象的不同方面 进行比较。2、临床督导评价 法:就是对评价 者的实际行动进 行直接的现场观 察和记录,然后 把观察结果和评 估意见反馈给被 凭者,并和被评 者一起商讨改进 措施的一种评价 方法。3、智力测验是对 人的智力的一种 客观的标准化的 测量。他一一组 标准刺激无一起 被试反应根据这 些客观反应来度 量被试的智力高 低。智力测验的先驱 者是英国的遗传 学家高尔顿和美 国心理学家卡特 尔。高尔顿首先 使用等地评定表 和问卷法作为测 验的辅助工具。卡特尔于1980年 发表论文心理 测验与测量首 先使用心

22、理测验 这个术语4、常模:指的是 标准化考试的大 样本团体的成绩 的平均数,极大 样本团体分数的 一般水平。5、教师评级是对 教师活动进行描 述和价值判断的 过程。6、学生评价是以 学生为对象的教 育评价,它是以 依据一定的教育 评价标准对学生 的学业成就。个 性发展,品的状 况,体制能力等 方面做出价值判 断结果反馈与教 育实践以改进教 学,是对学生学 习进展与行为变 化的评价。简答 1、教育评价的种 类:根据评价的 对象和范围的不 同,可以分为宏 观、中观、微观 教育评价;根据 评价的时间和作 用不同,可以分 为诊断性、形成 性和总结性评 价;根据评价的 基准不同,可以 分为相对评价和 绝

23、对评价;根据 评价的性质不 同,可以分为需 要性、可行性和 配置性评价;根 据评价的主客体 不同,可以分为 自我评价和他人 评价。2、提高测验信度 的方法:适当增 加测验题目的数 量;测验的难度 要适中;测验的 内容应尽量同 质;测验的程序 要统一;测验的 时间要充分;评 分要尽量做到客 观化、减少评分 误差。3、教育评价的基 本原则:方向 性原则;公平 性原则;客观 性原则;科学 性原则;可行 性原则;指导 性原则。4、构建教育评价 指标体系的主要 依据有:教育 方针、政策、法 规;教育理论 和知识;教育 规律;教育工 作实际。5、教育测量数据 的特点包括: 绝大部分属于等 级变量,可以比

24、较大小不能加减 更不能乘除; 大多数数据从本 质上说是主观 的;教育测量 的数据具有随机 性;教育测量 的数据具有模糊 性。6、评价者对被评 价者的一般心理 影响表现在哪些 方面:对自信 心和自我概念、 自我知觉的影 响;对情绪稳 定和不安的影 响;对意志和 动机的影响; 对要求水平和达 到目标的影响; 对评价者和被 评价者之间关系 的影响。7、评价者心理对 评价过程的影响 表现:对制订评 价方案的影响; 对收集和分析评 价信息的影响;对评价结果解释 的影响。8、作文测验的五 种方法:分析法; 多段短文测量 法;评定测量法; 作文量表法;作 文测验举例。9、阅读测验的七 种方法:问题 回答法,

25、是在每 段短文的下面列 出几个问题,要 求被试者根据短 文内容进行回 答。次序排列 法。正误分辨 法,列举几句话, 有正确的有错误 的,要求被试者 根据自己的理解 作出辨别。预 料后果法。确 定要旨法。情 感体察法。体 味含意法。10、标准化考试 的特点:试题 编制过程的标准 化;考试实施 过程的标准化; 标准化考试的 评分、计分方法 要标准化;标 准化考试必须编 制常模。11、标准化考试 的基本程序: 编制考试计划, 编制考试初 稿,预测, 修改考试原稿,制定常模, 收集考试的信 息、效度资料,编制考试指导 手册。12、与智商相关 的六个因素: 遗传与环境; 种族;性别; 学习成绩; 参加测

26、试的动 机、情绪和努力 程度;被试的 人格特征。13、教学工作评 价与教学评价的 区别:教学评 价的主要对象是 教师的教学工作 和学生的学习过 程,教与学的双 边活动的沟通对 象是教学内容, 是在一定的环境 中进行的,然而, 教师的活动是起 主导作用的,学 生的学是主体。教学评价应包 括教学过程中教 师、学生、教学 内容、教学方法 手段、教学环境、 教学管理诸因素 的全面的评价, 而教学工作则是 教学评价中特别 主要的一个方面 的评价,这里仅 指对教师的备 课、上课、批改 作业、课外辅导、 命题考试等教师 教学工作的基本 环节的评价。14、教学工作评 定的依据:教 育方针和政策法 规,教学大纲

27、 和教科书,教 学规律和教学原 则,学生的身 心发展规律, 参考新的思想观 念(新的人才观、 新的知识观、新 的学生观、新的 学生素质观、新 的教师素质观)。15、教学工作评 价的功能:检 查(通过教学工 作评价,可以进 行有效的检查, 从而发现问题, 总结经验和教 训);反馈(教 学工作评价可以 给教学工作提供 科学的反馈信 息,从而有利于 教学工作的改 进);激励(加 强教学工作评 价,有利于激发 教师的活动动 机);研究(教 学工作评价有利 于开展教育研究 活动,教学工作 评价具有教育研 究上的价值); 定向(教学工作 评价的指标对教 学工作具有指挥 定向作用);管 理(对教师的教 学工

28、作给予鉴定 或评分,使教学 管理部门更好地 了解教师的教学 质量和水平)。16、现代中小学 学校评价的要 素:学校管理 评价。中小学 师资水平的评 价。学校文化 评价。办学条 件评价。仃、确定办学评 价内容的依据: 教育理论、办 学规定;现代 化建设的实际需 要;教育目的、 方针;教育政 策、法规和当地 政府的要求; 学校教育教学实 际状况。18、中小学教育 评价的基本内 容:办学条件; 办学水平;社会 评价;获奖情况。论述 1、教育评价与教 育与测量的关 系:教育测量不 是教育评价,但 是两者有密切的 联系。教育测量 师教育评价获得 数据资料的重要 手段。测量师评 价的依据,评价 是测量的具

29、体表 现。两者又是有 区别的,测量关 心的是数量的多 少,评价关心的 是价值的高低, 测量时一种纯客 观的过程,评价 带有主观性,是 主观估计和客观 统一,测量是一 种单一的活动,评价是一种综合 的活动。2、试卷编制的质 量要求:明确测 验的目标;题量 尽可能的大,试 题覆盖面尽量 宽;掌握好试题 的区分度和难 度;注意改进题 型;每道试题的 编写要讲究科学 性;制定好标准 答案,评分标准 和和评卷的具体 要求;拼卷和检 核。3、评价信息收集 的方法:观察法(是根据评价指 标的要求,在全 自然状态下,通 过参观去获取评 价信息的一种方 法)、听汇报(听 汇报的目的是通 过听取被评者的 工作汇报和情况 反映来收集评价 信息)、(是指以 调查的方式出去 访问有关人员或 找有关人员谈 话,了解情况, 从而收集评价信 息)、座谈会(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论