师范大学网络继续教育函数本科2016教育统计与测量评价第一次和第二次作业_第1页
师范大学网络继续教育函数本科2016教育统计与测量评价第一次和第二次作业_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、什么是教育测量?什么是教育评价?并阐述一下两者的关系。答:1教育测量: 教育测量, 就是针对学校教育影响下学生各方面的发展, 侧重从量的规定性 上予以确定和描述的过程。学校教育实践活动的客观需要,促进了教育测量科学研究及学 科发展。教育测量学是一门发展较早、应用较多、内容较丰富的教育科学分支。2教育评价:所谓教育评价(educational evaluation),是指按照一定的价值标准和教育目标, 利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展 变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。3教学测量与教育评价的关系:教学测量与评价两者

2、既有区别,又有密切的联系。一方面, 教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),并不考虑结果的实际意义,而教学评价则是对学绩测验所得结果的主观判断(对结果进行分析解释),以了解结果的实际意义。另一方面,虽然教学评价是一种主观判断,但是这种主观判断必须以教 学测量所得的客观描述为依据。否则,就是主观主义的判断。同样,教学测量也不能脱离 教学评价,因为教学测量只是对学绩测验结果的客观描述,只有通过教学评价,才能判断 这种客观描述的实际意义。不通过评价,测量所获得的结果也就毫无实际价值。因此,教 育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教 育评价往

3、往是教育测量过程的延续,是对测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。二、请以你熟悉的一门课程为例谈一下怎样制作命题双向细目表。答:考试命题双向细目表是一种考查目标(能力)和考查内容之间的列联表。制作考 试命题双向细目表,是命题工作的一个重要环节。一般双向细目表纵向为要考查的内容即 知识点,横向列出的各项是要考查的能力,通常采用识记、理解、应用、分析、综合、评 价六个等级。这是按美国教育家布鲁姆(b.bloom)目标分类划分的,是从最简单的、基本的到复杂的、高级的认知能力。以下是我根据人教版小学六年级语文期末试卷制定的双向细 目表。积累与运用共20序号内容能级题型取材分值难

4、度ABCDE范围汉字词吾区分度汉吾拼音古 诗文 积累9体味诗句的内容VV客观课标附录110体味诗句的含义VVV客观课标附录111体味诗句的情感VVV客观课标附录112在语境中运用古诗句VVV客观生活3阅 读共40分说 明性 文早13提取信息并做岀判断VV客观报刊114提取信息并做岀判断VV客观115提取信息并进行甄别VV客观116提取信息并进行概括VV客观117提取信息并做岀判断VV客观118理解词语在语言环境中的恰当意义V主观219词语运用V主观320在语境中选择并运用词语VV主观321抓住要点、提炼概括VV主观622揣摩表达顺序、提炼观点VV主观423根据需要搜集信息、整理信息,尝试进行

5、探究性阅读(联系生 活常识)VVV主观624推想关键词的含义VV客观1叙 事性 作品25推理词语的隐含意V客观课外126了解事件梗概、整体把握主要内容V客观127整体把握主要内容V主观228尝试多角度阅读、敢于提岀自己的看法、作岀判断VVV主观5习 作40分小练笔29表达个人的独特感受、积累习作素材VVV主观课外10习作30提供范围习作VV主观课外30能级:A知识、B领会(理解)、C运用、D分析或综合、E评价。说明:1、能级。“能级”是以布卢姆的教育目标分类理论划分的。布卢姆等人把教育目标分 为认知、情感和动作技能三个领域,其中认知领域目标按照由低级到高级分为六个类别, 即知识、领会、运用、分

6、析、综合、评价。知识:是最低等级的,是指对具体事物和普遍原理的回忆,对方法和过程的回忆,或 者对一种模式、结构或横加的回忆。知识目标强调记忆的心理过程。领会:是最低层次的理解,指个人把某种材料与其他材料联系起来,也不必弄清它的 最充分的含义,便知道正在交流什么,并能够运用正在交流的这种材料和观点。它包括转 化、解释和推理三种(亚目标)。领会的标志在于,当说明抽象概念的用途时,学生能使 用该抽象概念。运用:是指将抽象的概念用于特定的和具体的情境。运用的标志在于,在没有说明问 题解决模式的情况下,学生便会正确地把该抽象概念运用于适当的情境。分析:是指导把材料分解成各个组成部分,弄清各部分之间的相互

7、关系及其构成的方 式,以指出那些用来传递意义或确定交流结果的技术和手段。包括要素分析、关系分析和 组织整理分析三个亚目标。综合:是指将各种要素和组成部分组合起来,以形成一个整体。包括进行独特的交流、制定计划或操作步骤和推导出一套抽象概念三个亚目标。评价:是指为了某种目的,对观念、作品、答案、方法和资料的价值及符合准则的程 度作定量和定性的判断。2、 难度。通俗地说,就是得分率(P),即用被试在某题目上的平均分得除以该题目 的满分,也可以用被试高分组在特定题目上的得分率和低分组在相同题目上的得分率之和除以二作为题难度(高分组、低分组人数比例各占总人数的27%,其得分率分别为H、L表示),即P=(

8、H+ L)/2整个测验所有题目的难度第数分布在0.30至0.70之间,并且整个测验的难度系数在0.5左右时,可使测验对被试有较大的鉴别力,而且可以使测验分数接近正态分布。3、 区分度。是题目区别被试水平能力的程度(D)。通俗地说,区分度就是高水平被 试在测验题目上能得高分,而低水平被试只能得低分,那么测验题目区分被试水平的能力就强,如果没有什么差别,区分能力就弱。区分度的值域范围在-1.00至+1.00之间。通常D为正值,称作积极区分;D为负值, 称作消极区分;D为0,称作无区分作用。具有积极区分作用的基础上,其D直越大,区分的效果越好。三、几位评委对同一位歌手打分,问评委意见是否一致用什么统

9、计量?并阐述一下该公式 中的具体符号意义。答:要知道评委对同一位歌手的评分意见是否一致时,即计算评委所评的分数差异程度的 大小,因而,用标准差来衡量。公式:(2-6)式中:S代表标准差,Xi代表分数,n代表评委人数,IXin实际上是平均数的平方。1、已知某选拔考试参加人数为500人,成绩呈正态分布,平均分为70, 标准差为10。若只能有150人进入面试, 问面试分数线定多少合适? 90分以上多少人?不及格多少人?答:(1)已知平均分X=70,? (Z)=? (x-X)/n=? (x-70)/10=1-150/ 500=0.7查一下标准正态分布表,得Z=0.53即(x-70)/10=0.53故x

10、=75.3若只能有150人进入面试,确定面试分数线为75.3分。(2)? (Z)=? (x-X)/n= ? (90-70)/10= ? (2)查一下标准正态分布表,得? (2)=0.9772故考90分以上的概率为1-0.9772=0.0228,90分以上的人数为500*0.0228=11人。? (Z)=? (60-70)/10= ? (-1)=1-? (1)查表得? (1)=0.84,故? (Z)=0.16故考不及格的概率为0.16,不及格人数为500*0.16=80人2、某次考试中选择题与总考试成绩如下表,求该选择题的区分度。 (教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示)

11、考生AB C D E F G H I J选择题分数1 0 0 1 1 0 0 1 1 1总成绩75 65 67 65 67 5661 63 58 73(公式:)答:(1)求答对第一题的比率P和打错的比率q:P=6/10=0.6,q=1-p=0.4(2)求X1和X2分别为答对和打错选择题学生成绩的平均数。X1=(75+65+67+63+58+73)/6=66.83X2=(65+67+56+61)/4=62.25(3)求答对选择题考生X1的标准差平均分X=65标准差=开根号(X1-X)2+(X2-X)2+(Xn-X)2/10=5.67(4)求点二列相关系数rr =开根号0.6*0.4*(66.83-62.25)/5.67=0.3963、阐述一下假设检验的基本步骤。答:我们可以将统计假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论