研究生教育统计与测量授课讲义_第1页
研究生教育统计与测量授课讲义_第2页
研究生教育统计与测量授课讲义_第3页
研究生教育统计与测量授课讲义_第4页
研究生教育统计与测量授课讲义_第5页
已阅读5页,还剩346页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本讲义教材

1.王孝玲、赵必华:《教育统计学》,北师大出版社,2008年版。2.王孝玲:《教育测量》,华东师大出版社,2005年修订版。3.黄光扬:《教育测量与评价》,华东师大出版社,2002年版。1第一页,共351页。本讲义主要参考书目:1.扈涛:《教育统计学》,河南大学出版社,2004年版。2.张奇:《SPSSforWindows在心理学与教育学中的应用》,北京大学出版社,2009年版。3.戴海崎、黄光扬:《教育统计与测量自学辅导》,广东高等教育出版社,2000年版。4.黄光扬:《教育统计与测量评价综合教程》,福建科技出版社,2003年版。5.张厚粲、徐建平:《现代心理与教育统计学》,北师大出版社,2003年版。6.胡中锋、李方,《教育测量与评价》,广东高等教育出版社,1999;7.王汉澜主编,《教育测量学》,河南大学出版社,1987;8.漆书清:《教育统计与测量》,广东高等教育出版社,1999年版。9.金娣、王刚:《教育评价与测量》,教育科学出版社,2002年版。10.王景英:《小学教育统计与测量》,人民教育出版社,2002年版。11.周谦、李国岚:《教育评价与统计》,科学出版社,1997年版。12.雷新勇:《大规模教育考试:命题与评价》,华东师范大学出版社,2006年版。13.皮连生:《学与教的心理学》,华东师范大学出版社,1997年版。14.广东省考试中心:《2004年广东高考年报》,广东高等教育出版社,2005年版。15.广东省考试中心:《2005年广东高考年报》,广东高等教育出版社,2005年版。16.魏华忠、周仁来、马健生:《教育统计与测量》,辽宁师范大学出版社,2003年版。17.宋志刚、谢蕾蕾、何旭洪:《21世纪高等学校计算机规划教材•SPSS16实用教程》,人民邮电出版社,2008年版。18.张文彤等:《SPSS统计分析基础教程》,高等教育出版社,2004年版。19.郑日昌等:《心理测量学》,人民教育出版社,1999年版。20.RobertL.Linn&NormanE.Gronlund著,国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组译,《教学中的测验与评价》,中国轻工业出版社,2003年版。2第二页,共351页。引用案例中的主要文献:1.希建华、赵国庆:“概念图”解读:背景、理论、实践及发展,《开放教育研究》,2006年1期。2.张丽萍、王嫣:用概念图解读合作学习,《比较教育研究》,2008年1期。3.陶美重:高等教育消费市场发展趋势,《大学教育科学》,2008年3期。4.石欧、周本回:我国研究生教育快速发展背景下的结构缺陷及其对策,《现代大学教育》,2008年4期。5.王芳、杨培:寄宿制与非寄宿制高中生社会适应性的比较,《现代中小学教育》,2008年2期。6.吴根洲:高考综合科目考试科学性之实证研究,《上海教育科研》,2008年8期。7.王晓华:论高等教育自学考试试题难度的控制,《中国考试》,2008年1期。8.张晋军:国家职业汉语能力测试题材型效度分析研究,《中国考试》,2008年2期。9.廖平胜:论考试的本质与功能,《考试研究》,2002年1期。3第三页,共351页。

本讲义引用案例中的主要参考文献:1.西南大学周玲老师的讲义《教育统计学》。2.福建师大黄光扬老师的讲义《教育统计与测量评价》。3.人大经济论坛调查问卷专版,详细出处参考:本讲义的部分内容及PPT版面引自网络相关内容及PPT等。4第四页,共351页。第一讲描述统计一、什么是教育统计学统计学是研究统计原理和统计方法的一门科学,它包括数理统计学和应用统计学两大分支。教育统计学是应用统计学的一个分支,是应用数理统计学的原理和方法来研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工作中的数字资料,并以此为依据进行科学推断,揭示教育现象所蕴涵的客观规律。5第五页,共351页。第一讲描述统计(一)描述统计(教育统计图表及四个基本量:、S、Z、r)描述统计是通过制表、绘图和计算特征量等,对已经搜集到的数据进行整理、归纳、简缩、概括,使数据分布的特征清晰、直观、明确地显现出来的统计方法。

6第六页,共351页。第一讲描述统计(二)推断统计(Z、t、F及检验)推断统计是根据样本提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上估计或推测总体的分布特征的统计方法。它是由部分推断全体、由已知推断未知的统计方法。推断统计的内容包括总体参数估计和假设检验。7第七页,共351页。第一讲描述统计(三)实验设计实验设计是为指导实验而预先制定的计划。它的目的在于研究如何科学、有效和经济地进行实验。为了使实验研究获得成功,在实验以前就要对研究的步骤、抽样的方法、实验条件的控制、实验结果的统计分析方法等作出严格的设计。8第八页,共351页。第一讲描述统计二、几个基本概念(一)变量、观测值、随机变量(X、Y……)所谓变量,就是指教育实验、观察、调查中想要获得的数据。一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据。统计学上,把取值之前不能预料取到什么值的变量,就称为随机变量。

9第九页,共351页。第一讲描述统计(二)总体(N)、个体和样本(n)总体是指具有某种共同特性的一类事物的全体。总体中的每个基本单元称为个体。从总体中抽取的一部分个体构成的集合称为总体的一个样本。抽取样本的过程和方法就简称为抽样。10第十页,共351页。第一讲描述统计(三)统计量与参数统计量是表示样本的数字特征的量。如样本的平均数()、标准差(S)、相关系数(r)等。它是根据从样本搜集到的数据直接计算出来的。参数是表示总体的数字特征的量。如总体的平均数()、标准差()、相关系数()等。它一般是由样本的统计量估计、推断出来的。11第十一页,共351页。第一讲描述统计(四)次数(频数)(f)次数是指某一事件在某一类别中出现的数目,又称频数。12第十二页,共351页。第一讲描述统计(五)误差误差泛指测定的观测值与真实值之差。误差一般可以分为系统误差、随机误差和抽样误差。系统误差是持续地使观测结果向某一方向(偏大或偏小)产生偏差倾向的误差。随机误差是由一些不易发现或难以控制的偶然因素所产生的误差。抽样误差是由于抽样而产生的误差。

13第十三页,共351页。第一讲描述统计三、教育统计表统计表是描述统计资料数量关系的表格。它可以简化统计资料,明显地反映事物的全貌及其蕴涵的特性,便于分析、比较、计算和记忆。(一)统计表的结构(表1)序号、名称、标目、数字、表线、表注。14第十四页,共351页。第一讲描述统计表1统计表的基本格式总横标目(亦可空白)

纵标目

横标目

数字15第十五页,共351页。第一讲描述统计(二)统计表的种类1.简单表:只列出观察对象的名称、地点、时序或统计指标的统计表为简单表。16第十六页,共351页。第一讲描述统计

表2某高中2008—2012年中考录取人数统计表

年度

录取人数2008年4122009年4342010年4282011年4362012年426

合计213617第十七页,共351页。第一讲描述统计2.分组表:在标目中只有一个标志分组的统计表。18第十八页,共351页。第一讲描述统计表3某校6年级3班54名学生的数学和英语成绩统计表

优秀良好

中及格不及格合计数学

69297354英语

51028925419第十九页,共351页。第一讲描述统计3.复合表:在标目中按两个或两个以上标志分组的统计表。20第二十页,共351页。第一讲描述统计表4某校6年级学生操行评定结果统计表

优秀

良好

合格

需努力合计

女一班761315641052二班681214751154三班671415551154四班561315642152合计2427525924185321221第二十一页,共351页。第一讲描述统计4.三线表:三线表通常只有3条线,即顶线、底线和栏目线。22第二十二页,共351页。第一讲描述统计5.频数分布表(次数分布表)(1)简单频数分布表(表5中1-3列)步骤:①求全距R:求出一批数据中最大值和最小值之间的差距。②确定组数(k)和组距(i):

组数k:表示分组的个数。根据数据多少确定,适中为宜。

组距i:各分组的间距。一般取奇数或5的倍数。23第二十三页,共351页。第一讲描述统计③确定组限:

组限:每组的起止范围。如:65-70,70-75,75-80,80-85,85-90,90-95。④登记频数:分好组之后,可以将每个数据按所属的组逐个登记在表内,第3列,可用划正等符号统计计算个数。最后将每组个数登记到第2列。⑤在具体编制一个次数分布表过程,若需要利用它进行计算分析时,表中应有组中值的项目。组中值就是每组上、下限的中点。即上、下限的平均数。24第二十四页,共351页。第一讲描述统计(2)累积频数和累积百分比分布表(表5中1-5列):

累积频数分布表:用累积频数表示的频数分布表。

累积百分比分布表:在累积频数分布表的基础上,将各组的累积频数除以总频数再乘以100,登入第5列,构成累积百分比分布表。25第二十五页,共351页。表5110名20岁健康男大学生身高(cm)简单频数、累积频数和累积百分比分布表

身高分组(1)频数(2)登记频数(3)(略)累积频数(4)累积百分比(%)(5)162-1

10.9164-4

54.5166-9

1412.7168-13

2724.5170-19

4621.8172-27

7366.4174-16

8980.9176-8

9788.2178-8

10595.5180-3

10898.2182-2

110100总计110

26第二十六页,共351页。第一讲描述统计四、教育统计图统计图是表达统计资料数量关系的几何图形。它能使事物的数量关系表达得形象、直观、容易理解和记忆。(一)统计图的结构标题、图号、标目、图形、图注。27第二十七页,共351页。第一讲描述统计(二)种类1.表示间断变量的统计图:直条图(图1、图2)圆形图(图4)

2.表示连续变量的统计图:直方图(图5)多边图(图6)曲线图(图7)累积频数分布图(图8)28第二十八页,共351页。第一讲描述统计

图1某中学毕业生实验能力次数分布图(直条图)29第二十九页,共351页。第一讲描述统计图2某校6年级四个班级学生操行评定结果比较图(直条图)30第三十页,共351页。第一讲描述统计31第三十一页,共351页。第一讲描述统计图5100名男青年身高分布直方图32第三十二页,共351页。第一讲描述统计

图6100名男青年身高分布多边图33第三十三页,共351页。第一讲描述统计图7100名男青年身高分布曲线图34第三十四页,共351页。第一讲描述统计图8100名男青年身高累积频数分布图35第三十五页,共351页。第一讲描述统计概念图36第三十六页,共351页。第一讲描述统计概念图37第三十七页,共351页。用概念图解读合作学习

一、合作学习的界定(图1)二、合作学习的发端与发展(图2)三、用概念图解读合作学习的主要教学模式1.小组成绩分工法STAD(图3);2.小组-游戏-竞赛法TGT(图4);3.切块拼接法Jigsaw(图5);4.共学式LT(图6);5.小组调查法GI(图7).四、结语38第三十八页,共351页。39第三十九页,共351页。40第四十页,共351页。41第四十一页,共351页。42第四十二页,共351页。43第四十三页,共351页。44第四十四页,共351页。45第四十五页,共351页。高等教育消费市场发展趋势

一、学生(或家庭)高等教育消费趋于理性二、适龄人口下降意味着生源市场在缩小(表1)三、大学学费的不断樊升使得居民家庭支付能力相对减弱(表2、表3应为图、表4)四、非传统教育机构的不断涌现46第四十六页,共351页。47第四十七页,共351页。48第四十八页,共351页。49第四十九页,共351页。50第五十页,共351页。我国研究生教育快速发展背景下的结构缺陷及其对策

前言(表1)一、我国研究生教育之结构缺陷(一)在学位层次上,硕士研究生教育发展不够(表2);(二)在学位类型上,存在一定程度的重科学学位,轻专业学位;(三)在培养方式上,在职研究生教育发展不够;(四)在学位专业上,存在一定程度的与社会发展脱节(图1、图2);(五)在区域布局上,学位点分布和研究生培养不平衡(表3、表4);51第五十一页,共351页。我国研究生教育快速发展背景下的结构缺陷及其对策二、克服我国研究生教育结构缺陷的几点对策(一)大力发展硕士教育,适度发展博士教育(表5、表6);(二)大力发展专业学位和非全日制研究生教育;(三)积极调整区域布局,加强西部地区研究生教育。52第五十二页,共351页。53第五十三页,共351页。54第五十四页,共351页。55第五十五页,共351页。56第五十六页,共351页。57第五十七页,共351页。58第五十八页,共351页。59第五十九页,共351页。60第六十页,共351页。第一讲描述统计五、集中量数(一)集中量数定义表示一组数据典型水平或集中趋势的量。它反映频数分布中大量数据向某一个量集中的情况。61第六十一页,共351页。第一讲描述统计

上图中,A、C两曲线的中心位置一致,而B曲线的中心位置位于A、C曲线右侧。描述曲线中心位置的量即集中量。62第六十二页,共351页。第一讲描述统计(二)算术平均数定义所有观察值的总和除以总频数所得之商。63第六十三页,共351页。第一讲描述统计(三)加权平均数定义是不同比重数据(或平均数)的平均数。或:64第六十四页,共351页。第一讲描述统计练习1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期中考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?练习2:某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩?65第六十五页,共351页。第一讲描述统计练习1解:练习2解:66第六十六页,共351页。第一讲描述统计六、差异量数(一)差异量数定义差异量就是表示离散趋势的量。可用于表示一组数据的离散或变异的程度,反映数据分布范围的情况。

67第六十七页,共351页。第一讲描述统计(二)方差和标准差方差:是一组数据离差平方的算术平均数,即方差可由离差的平方和除以数据个数所得。标准差:是方差的算术平方根。68第六十八页,共351页。第一讲描述统计69第六十九页,共351页。第一讲描述统计例:某班甲组在一次测验中的成绩分别为65,68,71,72,74。求其标准差。70第七十页,共351页。第一讲描述统计解:71第七十一页,共351页。第一讲描述统计(三)差异系数差异系数是一个相对差异量,当平均数相差较大时,要使用相对差异量比较数据的差异程度。差异系数:是指一组数据的标准差与算术平均数的百分比。它是没有单位的相对数。用CV表示差异系数。

72第七十二页,共351页。第一讲描述统计(四)平均数与标准差、差异系数的应用(1)平均数之间可以进行横向(班与班、班与年级等)

或纵向比较。但需要注意在进行纵向比较时测验的难度要相同或相近,否则不宜直接比较。(2)平均数相同时,可以用标准差比较数据的差异程度;平均数相差较大时,可以用差异系数比较数据的差异程度。(3)合理解释、运用差异系数,结合优秀率、良好率、合格率(优率+良率+合格率=及格率)、不及格率等指标,对改进教学提出建议。73第七十三页,共351页。第一讲描述统计例如:假设有A、B两班,每班各50人,两班的平均分相同,差异系数B班大于A班。如何解读(教学建议)?优秀良好合格不及格人数比率人数比率人数比率人数比率A班36%1530%1938%1326%B班816%1020%1326%1938%74第七十四页,共351页。第一讲描述统计B班减小差异系数的做法:提高及格率。A班:提高优秀率。(思考:是为了保持小的差异系数而保持现状,还是宁愿差异系数大些,也要提高优秀率?)75第七十五页,共351页。76第七十六页,共351页。第一讲描述统计对箱体图的说明:1.成绩分布非正态时,考查数据的离散程度。2.还可以了解不同题型或不同大题学生成绩的离散情况,有针对性地指导。3.平均数不同时,差异是否显著要进行统计检验(常用t检验、方差分析),但需要满足抽样分布的条件,并注意样本容量的选择。比如,可以比较两个班级某科平均成绩的差异,比较某班与年级某科平均成绩的差异,抽样比较两校或多校某科平均成绩的差异,等等。77第七十七页,共351页。第一讲描述统计七、地位量数(一)地位量数的意义描述或确定某一观测值在全体数据中所处的位置的量数,就叫地位量数。78第七十八页,共351页。第一讲描述统计(二)正态分布的意义一种连续型随机变量的概率分布。

79第七十九页,共351页。80第八十页,共351页。标准正态分布曲线的特征(1)正态曲线在横轴上方(Z=0)均数处最高,Y值最大;(2)正态分布以Z=0为中心,左右对称。(3)正态曲线从Y最高点向左右缓慢下降,并无限伸延,但永不与基线相交。Y值永远不为0。(4)曲线的平均数Z=0,标准差σ=1时,基线上曲线包含从Z=-3到Z=3之间几乎有6个标准差的距离;(5)曲线在±1σ处各有一个拐点,在该点内向下向内弯;在该点外向下向外弯。(6)正态曲线下的面积分布有一定的规律。81第八十一页,共351页。

采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计算总体单位分布及其标志值变异范围的主要依据,下图说明了这一点。(1)变量值在【μ-σ,

μ+σ】之间的概率为0.6826。(2)变量值在【μ-2σ,

μ+2σ】之间的概率为0.9546。(3)变量值在【μ-3σ,

μ+3σ】之间的概率为0.9973。82第八十二页,共351页。第一讲描述统计(三)标准分数的定义以标准差为单位标准,某一分数离开团体均数的距离。

Z=或Z=

83第八十三页,共351页。第一讲描述统计对标准分数的理解:Z分数大于零,表示分数X在平均数以上;Z分数小于零,表示分数X在平均数以下;Z分数等于零,表示分数X与平均数相等;Z分数的绝对值表示某分数与在此分布上的平均数的距离,绝对值越大,表示某分数离开均数的位置越远。84第八十四页,共351页。第一讲描述统计练习:东东和西西在语文和数学的测试中所得分数如下表,已知样本的平均数和标准差,试求东东和西西语文和数学成绩的标准分数。东东西西平均数标准差S语文6880708数学72606210总分140140总平均分707085第八十五页,共351页。第一讲描述统计东东西西平均数标准差S语文6880708-0.251.25数学726062101.00-0.2总分1401400.751.05总平均分70700.3750.52586第八十六页,共351页。第一讲描述统计东东和西西谁学习好呢?继续:东东数学80分,语文80分,西西数学90分,语文70分。已知样本平均分数学80分,语文60分,数学标准差5分,语文标准差10分。谁学习好呢?思考1:不同学科的原始分数可比吗?思考2:不同学科的标准分数可比吗?思考3:不同学科的原始分数直接相加在什么情况下会与标准分数的评价结果趋于一致呢?

87第八十七页,共351页。第一讲描述统计(四)标准分数的应用1.可将原始分数转换成标准分数(如上例)2.可用于确定分数线练习:某一考区考生为20万人,决定录取4万人,考试成绩平均分为450分,标准差为59.52分,问录取分数线应该定为多少?569分以上的有多少人?88第八十八页,共351页。第一讲描述统计解:p=4/20=0.2,要录取20%的考生。查表,p=0.3时,Z=0.84,450+0.84×59.52=500(分),录取线为500分。Z=(569-450)÷59.52=2,p=0.47725(0.5-0.47725)×200000=4550(人)89第八十九页,共351页。3.学习能力平面图

90第九十页,共351页。91第九十一页,共351页。第一讲描述统计讨论:原始分与标准分孰优孰劣?92第九十二页,共351页。第一讲描述统计原始分较适合目标参照性测验,表示目标达成程度。不足之处:不能准确地表达某一成绩在全体考生中所处的相对地位,不同课程的考分、不同次的考分不能直接比较。标准分的优点在于可以精确地表示某一考生的考试成绩在全体考生中所处的相对位置,原始分转化为标准分,学生可以根据标准分对自己的考试成绩进行横向和纵向比较,而比较时无需考虑考试的难易程度及考分的离散程度。标准分更适合于选拔性考试的记分。不足之处:标准分存在负数和小数;标准分是相对分数,不能用于表示教学目标达成程度,一般的水平测试也不一定需用标准分来表示。93第九十三页,共351页。第一讲描述统计八、相关量数(一)相关量数的概念反映两列变量相互变化一致性程度的量数叫相关量数。(二)相关关系的概念两个变量之间不精确、不稳定的变化关系称为相关关系。94第九十四页,共351页。第一讲描述统计(三)相关关系的分类1.按变化方向分正相关、负相关、零相关2.按变化的密切程度分高度相关、中度相关、低度相关(四)相关系数1.定义:用来描述两个变量相互之间变化方向及密切程度的数字特征量,用r来表示。2.数值范围:-1≤r≤+1

最常用的是积差相关系数。95第九十五页,共351页。第一讲描述统计(五)积差相关1.积差相关的概念

当两个变量都是正态连续变量,而且两者之间呈线性相关时,表示这两个变量之间的相关称为积差相关。2.积差相关的使用条件(1)连续性数据——两列变量都是由测量获得的连续变量;

(2)呈正态分布——两列变量的总体呈正态分布,或接近正态分布;

(3)数据必须成对,数据与数据间独立;

(4)呈线性关系;

(5)样本容量要大于等于30。96第九十六页,共351页。第一讲描述统计3.积差相关系数的计算(1)定义公式:

r=

97第九十七页,共351页。

高数X化学Yxyx2y2xy李明7177李杰6888赵明7882何其兵6276郭宇6478成小亮6675露思7184玛丽7380汤姆7783杰克7087∑70081098第九十八页,共351页。

高数X化学Yxyx2y2xy李明7177+1-4116-4李杰6888-2+7449-14赵明7882+8+16418何其兵6276-8-5642540郭宇6478-6-336918成小亮6675-4-6163624露思7184+1+3193玛丽7380+3-191-3汤姆7783+7+249414杰克70870+60360∑700810002441868699第九十九页,共351页。第一讲描述统计(2)原始分数公式100第一百页,共351页。第一讲描述统计(六)等级相关1.等级相关的概念等级相关是指以等级次序排列或以等级次序表示的变量之间的相关,这种相关方法对变量的总体分布不作要求,因此又称这种相关为非参数相关。其主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。101第一百零一页,共351页。第一讲描述统计

2.斯皮尔曼等级相关的概念及使用条件当两列变量值是以等级次序排列或以等级次序表示时,且两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。由于这种相关是英国心理学家、统计学家斯皮尔曼根据积差相关推导出来,因此人们把这种等级相关称为斯皮尔曼等级相关,故有人认为斯皮尔曼等级相关是积差相关的一种特殊形式。102第一百零二页,共351页。第一讲描述统计3.斯皮尔曼等级相关系数的计算方法103第一百零三页,共351页。例:对8名教师进行了两项测验,两项测验的成绩分别记为X、Y,这是8名教师在两项测验上的名次(见表11-1),他们两项测验成绩的等级相关系数是多少?

解:104第一百零四页,共351页。第二讲推断统计一、假设检验(一)假设检验的基本思想1.小概率原理(实际推断原理):认为概率很小的事件在一次试验中实际上不会出现,如果小概率事件在一次试验中出现了,就被认为是不合理的。105第一百零五页,共351页。第二讲推断统计2.基本思想:先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件)小概率事件。如果试验或抽样的结果使该小概率事件出现了,这与小概率原理相违背,表明原来的假设有问题,应予以否定,即拒绝这个假设。若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个假设,表明试验或抽样结果支持这个假设,这时称假设与实验结果是相容的,或者说可以接受原来的假设。106第一百零六页,共351页。第二讲推断统计3.显著性水平与否定域小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取α=0.05,0.01等。α为检验的显著性水平(检验水平)。在假设检验过程中,描写小概率事件的统计量的取值范围称为该原假设的否定域(拒绝域),否定域的边界称为该假设检验的临界值。否定域的大小,依赖于显著性水平的取值,一般说来,α越小,否定域也越小,这时原假设就越难否定。107第一百零七页,共351页。双侧检验的P值/

2

/

2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值双侧检验的P值108第一百零八页,共351页。第二讲推断统计(二)假设检验的步骤1.提出待检验的原假设和备择假设H0:某一数值H1:某一数值2.选择检验统计量,并找出在假设成立条件下,该统计量所服从的分布,形如:3.根据所要求的显著性水平α和所选取的统计量,确定一个合理的拒绝H0的条件(常用的值有0.01,0.05)4.由样本观察值计算出统计检验量的值,若该值落入否定域,则拒绝原假设,否则接受原假设5.结论。回应检验结果,说明把握率及失误率109第一百零九页,共351页。第二讲推断统计(三)总体平均数的显著性检验(一个总体均值的显著性检验)1.已知时,Z检验统计值公式:110第一百一十页,共351页。第二讲推断统计

练习1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7分。现以同样的试题测验应届毕业生,并从中随机抽18份试卷,算得平均分数为69分。问该校应届与历届毕业生汉语拼音测验成绩是否一样?111第一百一十一页,共351页。第二讲推断统计112第一百一十二页,共351页。第二讲推断统计练习2:一名英语教师在其任教的二年级随机抽取一个班进行新教学方法改革实验,该班48名学生用新教学方法教学,其他各班用原教学方法教学。学期结束,全年级考试平均成绩为74分,标准差为12分。该实验班平均成绩为78分。试检验该教师用新教学方法教学的效果。113第一百一十三页,共351页。第二讲推断统计114第一百一十四页,共351页。第二讲推断统计练习3:某区进行一次外语考试,全区平均成绩为73分,标准差为13分。对参加考试的一所重点学校随机抽查81名参加考试学生的成绩,平均成绩为77分。请检验该重点中学的平均成绩与全区平均水平差异是否显著?115第一百一十五页,共351页。第二讲推断统计2.未知时,t检验(单一样本t检验,实践中多为t检验

)统计值公式:116第一百一十六页,共351页。第二讲推断统计例:已知4岁正常男童平均体重为15.6千克,从某幼儿园中随机抽取20名4岁男童,其平均体重为16千克,标准差为1.76千克,试问该幼儿园4岁男童的体重与4岁正常男童平均体重有无显著性差异?117第一百一十七页,共351页。第二讲推断统计118第一百一十八页,共351页。119第一百一十九页,共351页。第二讲推断统计(四)平均数差异的显著性检验(两个总体均值的显著性检验)1.两个独立样本平均数差异的显著性检验独立样本:指随机抽取的两个样本之间没有关系。120第一百二十页,共351页。第二讲推断统计(1)已知时,Z检验统计值公式:121第一百二十一页,共351页。第二讲推断统计例:高考结束后,从A省抽取80名考生,数学平均成绩84分,从B省抽取100名考生,数学平均成绩79分,已知A省标准差12分,B省标准差11分。试问两省数学高考成绩有无显著差异?122第一百二十二页,共351页。第二讲推断统计123第一百二十三页,共351页。第二讲推断统计(2)未知时,t检验(两个总体方差一致或相等,否则不行。是否齐性是需要先行检验的。)(独立样本t检验)统计值公式:

124第一百二十四页,共351页。第二讲推断统计例:某校进行一次速度测验,选择男生22人、女生18人参加。男生测验平均分为72分,标准差为8分,女生测验平均分为70分,标准差为7.6分。试问男女生速度测验的平均结果有无显著性差异?125第一百二十五页,共351页。第二讲推断统计126第一百二十六页,共351页。127第一百二十七页,共351页。第二讲推断统计2.两个相关样本平均数差异的显著性检验(n是成对个数)1.已知时,Z检验统计值公式:128第一百二十八页,共351页。第二讲推断统计例:某地两年内进行了两次物理竞赛,两次竞赛的标准差分别为12分和14分,某校有10名学生先后两次都参加了竞赛,成绩分别为74分和70分,这10名学生竞赛成绩的相关系数为0.76,试问该地两次物理竞赛成绩有无显著性差异?129第一百二十九页,共351页。第二讲推断统计130第一百三十页,共351页。第二讲推断统计2.未知时,t检验(相关系数已知)(相关样本t检验)统计值公式:131第一百三十一页,共351页。第二讲推断统计例:某实验小组进行一项学习方法实验,在实验前,经过精心匹配,分成两个组,一为实验组,一为对照组,各组均为20人。实验结束后,对两组均进行了智力测验,经计算,其智商成绩分别为,实验组平均智商为109,标准差为16;对照组平均智商为104,标准差为15,两组测验的相关系数为0.75,试问该学习方法对提高智力是否有显著影响?132第一百三十二页,共351页。第二讲推断统计133第一百三十三页,共351页。134第一百三十四页,共351页。第二讲推断统计二、方差分析(一)方差分析的基本原理方差分析依据的基本原理是变异的可加性,即把实验数据之间的总的差异分解为若干个不同来源的分量。具体地说,它是将总的离差平方和分解为n个不同来源的离差平方和,然后根据每个离差平方和的大小来确定它们对总的离差平方和的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。

方差分析主要用于推断多个总体均数之间有无显著差异。135第一百三十五页,共351页。第二讲推断统计(二)单因素完全随机设计方差分析举例例:研究者从某年级四个平行班中各随机抽取若干名被试进行英语课外辅导训练(每班用一种训练方法)。训练后期进行统一测试,结果如下,问四种训练方法的效果是否有显著性差异?136第一百三十六页,共351页。序号X1X2X3X4

1

88

89

84

86

2

83

91

87

82

3

9290

85

83

4

87

92

89

89

5

84

88

91

85

6

77

9383

80

7

86

85

76

8

75

137第一百三十七页,共351页。第二讲推断统计138第一百三十八页,共351页。139第一百三十九页,共351页。第二讲推断统计140第一百四十页,共351页。第二讲推断统计141第一百四十一页,共351页。142第一百四十二页,共351页。第二讲推断统计三、2检验(一)2检验的意义1.2检验的定义

2检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。2.2检验的基本公式143第一百四十三页,共351页。第二讲推断统计3.2检验的类型(1)配合度检验(2)独立性检验(二)配合度检验1.配合度检验的意义主要用于实际观测次数与某理论观察次数是否存在显著性差异的分析。它适用于一个因素分为多个水平(分类)的计数数据。144第一百四十四页,共351页。第二讲推断统计2.配合度检验的基本步骤(1)建立假设:H0:f0-fe=0或f0=feH1:f0-fe0或f0fe(2)理论次数的计算:根据概率和经验计算(3)确定自由度:k为分类数或组数df=k-1(4)计算2值(5)作出推断145第一百四十五页,共351页。第二讲推断统计举例:经民意调查,得到市民对某措施的意见呈赞成、不置可否和反对三种,其抽样情况分别如表:市民对政府意见的情况表态度赞成不置可否反对实际人数fo30085215理论人数fe200200200146第一百四十六页,共351页。解:(1)提出假设Ho:持三种态度人数相等;H1:持三种态度人数不相等.(2)由于按态度分成三类,总人数为600人,所以,各类人数平均为:600/3=200。(3)df=3-1=2(4)2=117.25(怎样计算出来的?)(5)统计决断

由df=3-1=2,查2分布值表:2(2)0.01=9.21,

2=117.25﹥9.21=2(2)0.01;

∴P﹤0.01,拒绝零假设,接受备择假设。147第一百四十七页,共351页。148第一百四十八页,共351页。第二讲推断统计(三)独立性检验1.独立性检验的意义主要是检验两个或两个以上因素多项分类的计数资料是独立还是相关的问题。2.独立性检验的步骤149第一百四十九页,共351页。150第一百五十页,共351页。第二讲推断统计举例:某班45名男女生全部参加大学英语四级水平考试,其结果如表所示,问男女生在英语学习水平上有无显著性差异?男女生四级英语考试成绩比较表性别/成绩优秀合格不合格小计男生215320女生321125小计536445151第一百五十一页,共351页。解:(1)提出零假设Ho和备择假设H1;

Ho:男女生在英语学习水平上没有显著性差异;

H1:男女生在英语学习水平上有显著性差异;

(2)根据计算理论频数的公式,计算出各个实际频数相对应的理论频数,在表中小括号内;男女生四级英语考试成绩比较表性别/成绩优秀合格不合格小计男生2(2.22)15(16)3(1.78)20女生3(2.78)21(20)1(2.22)25小计536445152第一百五十二页,共351页。(3)df=(3-1)x(2-1)=2(4)选择检验统计量公式,并计算其值:

=1.658

(5)结果与解释由df=(3-1)x(2-1)=2,查2分布值表:2(2)0.05=5.99,

2=1.658﹤5.99=2(2)0.05;

∴P﹥0.05,拒绝备择假设,接受零假设。男女生在英语学习水平上没有显著性差异.2==153第一百五十三页,共351页。154第一百五十四页,共351页。155第一百五十五页,共351页。156第一百五十六页,共351页。157第一百五十七页,共351页。158第一百五十八页,共351页。159第一百五十九页,共351页。160第一百六十页,共351页。161第一百六十一页,共351页。162第一百六十二页,共351页。163第一百六十三页,共351页。164第一百六十四页,共351页。165第一百六十五页,共351页。166第一百六十六页,共351页。167第一百六十七页,共351页。168第一百六十八页,共351页。169第一百六十九页,共351页。170第一百七十页,共351页。171第一百七十一页,共351页。172第一百七十二页,共351页。173第一百七十三页,共351页。寄宿制与非寄宿制高中生社会适应性的比较

一、引言二、研究方法1.研究对象(表1)2.研究工具(1)青少年社会适应性问卷(SAQ)(2)SPSS11.5统计软件包三、结果1.寄宿制学生和非寄宿制学生社会适应性的差异比较(表2、表3)2.年级间的差异比较(表4、表5)3.男女生的差异比较(表6、表7)四、讨论174第一百七十四页,共351页。175第一百七十五页,共351页。176第一百七十六页,共351页。177第一百七十七页,共351页。178第一百七十八页,共351页。179第一百七十九页,共351页。180第一百八十页,共351页。181第一百八十一页,共351页。第三讲教育测量基本问题一、教育测量(一)测量的定义测量是根据法则给事物分派数字。(史蒂文斯)测量这一定义包含了三个要素:1.法则——给事物的属性分派数字的依据2.事物属性——测量的对象或目标3.数字——描述事物属性的符号182第一百八十二页,共351页。第三讲教育测量基本问题

例:对学生的数学运算能力进行测量对象规则数字学生1--实施数学运算能力测验,共50道题目,做对1题得2分50学生2--80学生3--76学生4--92学生5--86183第一百八十三页,共351页。第三讲教育测量基本问题(二)测量量表1.测量三要素(1)参照点:为测定事物的量,事先确定的计量起点参照点有两种:绝对零点和相对零点(2)单位:单位是我们用于计算的标准(3)量表:量表一般称为测量的工具,它是具有一定单位和参照点的连续体184第一百八十四页,共351页。第三讲教育测量基本问题2.四种测量量表(1)名称量表(类别量表)——最低水平的一种量表(2)等级量表(顺序量表)(3)等距量表(4)比率量表——最高水平的一种量表185第一百八十五页,共351页。第三讲教育测量基本问题讨论:(1)五级记分表示的操行评定属于何种测量量表?允许哪些算术运算?(2)百分制分数表示的学科成绩从理论上来说属于何种测量量表?允许哪些算术运算?

(3)教育测量的结果属于哪一种测量量表?186第一百八十六页,共351页。第三讲教育测量基本问题(三)教育测量的定义1.教育测量的概念广义概念:测量的对象包括教育领域内的所有现象或问题。狭义概念:测量的对象仅仅局限于学科知识或技能。

教育测量,就是针对学校教育影响下的学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。187第一百八十七页,共351页。第三讲教育测量基本问题2.教育测量的特点(1)测量的间接性和推断性(2)测量对象的模糊性和测量误差的不可避免性(3)教育测量具有明确的目的性188第一百八十八页,共351页。第三讲教育测量基本问题二、教育测量的质量指标衡量教育测量的质量,可采用四个指标:信度主要对整个测量而言效度难度主要对测量的项目而言区分度189第一百八十九页,共351页。第三讲教育测量基本问题(一)信度1.信度的定义所谓测验的信度就是同一个测验(或相等的两个、多个测验)对同一组被试施测两次或多次,所得结果的一致性程度。也即测验的可靠性。一个测验的信度一般是以两次测验结果的相关系数来表示。190第一百九十页,共351页。第三讲教育测量基本问题2.信度的估计方法(1)再测信度以同一个测验对同一组被试先后施测两次,所得结果的相关系数就是再测信度。计算再测信度的基本模式为:测验A1------适当时距-------测验A2191第一百九十一页,共351页。第三讲教育测量基本问题练习:用一个算术四则的速度测验12个小学生,得分记为X1,为了考察测量结果的可靠性,于3个月后再测一次,得分记为X2,问测验结果是否可靠?学生123456789101112X1202021222323232425262627X2202121202323252526262729192第一百九十二页,共351页。193第一百九十三页,共351页。194第一百九十四页,共351页。195第一百九十五页,共351页。第三讲教育测量基本问题注意:①信度的取值范围为[0,1],当信度值较大时,说明前后两次测量结果比较一致;②两次测验之间的时间间隔要适宜。应由测验的性质、测题类型、测题数量和被试特点所决定;③再测法适用于速度测验而不适用于难度测验;④应注意提高被试者的积极性。196第一百九十六页,共351页。第三讲教育测量基本问题再测信度的优点:①它最符合重复测验的涵义,是重复测验最简单最明确的方式。②首测和再测只需要一套测验题目,比编制两套等值测验题目要省力、省时。③同一套题目无论施测几次,所测量的属性完全相同。197第一百九十七页,共351页。第三讲教育测量基本问题再测信度的缺点;①同一组被试对同一个测验先后两次作答相互之间是不独立的。②如果两次施测的时间间隔较长,在此期间被试身心的发展,新知识的获得,都会使两次测验结果不相同。③同一个被试对同一个测验先后作答两次,一般来说,在第一次作答时,测验对被试的吸引力较大,而第二次作答时,往往由于被试对测验失去了兴趣而造成两次测验结果的不相一致。198第一百九十八页,共351页。第三讲教育测量基本问题④被试在两次施测时的主观状态,如身体健康、疲劳、睡眠、测验焦虑、态度、情绪等,不可能完全相同。⑤两次施测的环境,如温度、湿度、光线、通风等条件不同,也都是产生测量误差的因素。199第一百九十九页,共351页。第三讲教育测量基本问题再测信度的适用范围:①再测信度适用于异质性测验;②再测信度适用于速度测验;③再测信度适用于运动技能测验200第二百页,共351页。第三讲教育测量基本问题(2)复本信度同一组被试在复本测验上所得结果的相关系数就是复本信度。所谓复本测验是指在性质、内容、题型、题数、难度等方面都一致(相等)的两份或多份测验。计算复本信度的基本模式为:测验A1---------最短时距----------测验A2201第二百零一页,共351页。第三讲教育测量基本问题练习:以A、B两型英语复本测验对初中三年级10个学生施测,为避免由测验施测顺序所造成误差,其中5个学生先做A型测验,休息15分钟后,再做B型测验;而另5个学生先做B型测验,休息15分钟后,再做A型测验。10个学生A型测验结果记为X1,B型测验结果记为X2

,其测验的复本信度如何?学生12345678910X119191817161515141312X220171818171513151212202第二百零二页,共351页。203第二百零三页,共351页。根据公式(3.l),计算表3.2的第4、5、6列,并将有关数据代入公式(3.1),则初三英语复本信度(即等值系数)为:204第二百零四页,共351页。第三讲教育测量基本问题注意:复本信度使用前提条件①要有两份或以上真正平行的测验,即在题目内容、数量、形式、难度、区分度、指导语、时限以及所用例题、公式和测验等其他方面都相同或相似;②被试有条件接受两个测验。205第二百零五页,共351页。第三讲教育测量基本问题复本信度的优点:①由于测题数目的增加,对于与所欲测量的属性相联系的行为总体的代表性增强。②测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一致性。它反映了两个层面的信度。③两个复本在同时使用时,可以避免再测信度的一些缺点。206第二百零六页,共351页。第三讲教育测量基本问题复本信度的缺点;①编制两个完全相等的测验是很困难的。②被试同时接受性质相似的两个测验,可能减少完成测验的积极性。③虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。207第二百零七页,共351页。第三讲教育测量基本问题复本信度的适用范围:①复本信度适用于难度测验;②复本信度适用于速度测验。208第二百零八页,共351页。第三讲教育测量基本问题(3)内在一致性信度测验内部(即测题之间)的一致性信度,也称为内在一致性系数。①分半信度

分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则,将试题分成两半,或者将从易到难排列的测题,按照测题序号,奇数测题为一组,偶数测题为一组,分成两半;然后计算每个被试在两个分半测验分数的积差相关系数;再用斯皮尔曼—布朗公式加以校正。斯皮尔曼—布朗公式为

209第二百零九页,共351页。例:一个测验向15名被试施测,被试在奇偶分半测验上的得分如下表所示,计算该测验的分半信度系数。15名被试在奇偶分半测验上的得分210第二百一十页,共351页。第三讲教育测量基本问题解:计算两个“半测验”得分的积差相关系数为0.86。代入公式得:

所以,该测验的分半信度系数为0.92。211第二百一十一页,共351页。第三讲教育测量基本问题212第二百一十二页,共351页。第三讲教育测量基本问题③克龙巴赫(cronbach)α系数当测验题型较多、并非都是二分记分题时,估计测验信度可采用克龙巴赫α系数。其计算公式为:

式中,表示所有被试在第i题上得分的方差,表示所有被试各自总分的方差,为题目数。

213第二百一十三页,共351页。第三讲教育测量基本问题注意:分半信度使用前提①在施测一次或没有复本的情况下使用;②一个测验分半方法多,所以会有多个分半信度。214第二百一十四页,共351页。第三讲教育测量基本问题内在一致性信度的优点:①对同一组被试只要施测一次就可以求出信度系数,应用时既方便又可以避免再测信度的缺点。②折半测验的两个部分,相当于一个测验的两个复本。所以折半信度具有同时性复本信度的优点,只不过是测题经过折半后,数量减少了。215第二百一十五页,共351页。第三讲教育测量基本问题内在一致性信度的缺点;①将一个测验分成内容、形式、题数、平均数、标准差、测题间相关、分布形态都相等的两部分,实际上是很困难的。②分半的方法不同,估计出的信度系数也有所不同。③若用斯皮尔曼一布朗公式对折半信度进行校正,会高估了测验的信度。216第二百一十六页,共351页。第三讲教育测量基本问题内在一致性信度的适用范围:①内在一致性信度适用于同质性测验;②内在一致性信度适用于难度测验。217第二百一十七页,共351页。第十一章教育测量与评价的质量特性(4)评分者的信度以评分者所评分数之间的相关系数来表示的信度,故称为评分者的信度。评分者之间的信度有三种估计方法。①积差相关或等级相关估计法218第二百一十八页,共351页。第十一章教育测量与评价的质量特性如果每一份测验结果都是由两位评分者按照各自的评分标准记分,其评分者的信度,可以用每份测验结果两个分数之间的相关系数来表示。若两位评分者都是以连续性分数记分,则可以用积差相关系数来计算。219第二百一十九页,共351页。第十一章教育测量与评价的质量特性如果每一份测验结果,是由两位评分者以等级进行评定,其评分者之间的信度,可以用每份测验结果的两个等级之间的等级相关系数来表示。其计算公式为(斯皮尔曼等级相关系数):220第二百二十页,共351页。第十一章教育测量与评价的质量特性②肯德尔和谐系数当K个评分者对n个测验结果进行评定时,可以用肯德尔和谐系数(多列等级相关)表示K个评分者信度。计算公式为:221第二百二十一页,共351页。第十一章教育测量与评价的质量特性③α系数估计法当两个以上评分者用连续性记分法对一组被试的测验结果评定时,评分者的信度可用α系数来估计。222第二百二十二页,共351页。第十一章教育测量与评价的质量特性评分者的信度与其它几种信度的区别①评分者的信度是两个或几个评分者之间对于同一组测验结果评定的一致性程度。②再测信度是被试对同一个测验先后两次测验成绩的一致性程度。它反映的是被试的信度。③复本信度是被试在两个等值测验上成绩的一致性程度。它反映的是测验的信度。④内在一致性信度与复本信度相似,反映的也是测验的信度。223第二百二十三页,共351页。第三讲教育测量基本问题3.提高信度的方法(1)影响测量信度的主要因素①被试方面②主试方面③施测情境方面④测量工具方面⑤两次施测的间隔时间方面224第二百二十四页,共351页。第三讲教育测量基本问题(2)提高测量信度的常用方法①测验应保持具有一定的长度;②测验的难度适当;③测验具有较好的区分度;④测验的评分要客观;⑤测验程序统一;⑥增加被试之间的差异。225第二百二十五页,共351页。第三讲教育测量基本问题(3)信度系数达到多少才可接受①一个测验只有在很多情况下被证实有较高的信度时,才可以说该测验是可靠的;②一般能力和学业测验要到达0.9以上;③兴趣、人格等要达到0.80-0.85。226第二百二十六页,共351页。第三讲教育测量基本问题(二)效度1.效度的定义效度指的是测量的有效性,即一个测验或量具能够测量出其所要测量的东西的程度。在教育测量过程中,效度问题尤为重要。这是因为:①效度始终是针对一定测量目的而言的;②效度只有程度上的差异;③效度是针对测量结果而言的;④评价一个测量是否有效要多角度、多方面地收集证据。227第二百二十七页,共351页。第三讲教育测量基本问题2.效度的估计方法(1)内容效度内容效度是指测验对所要测量的内容的代表性程度。内容效度的分析方法主要有:①逻辑分析法其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。

228第二百二十八页,共351页。第三讲教育测量基本问题反映测验内容与测验目标关系的双向细目表②统计分析法对同一组被试用一个测验的两个复本在某一学科教学或训练前后实施测验,该测验内容的有效性可以由两次测验成绩差异的显著性来加以判断。

测验内容测验目标合计识记理解应用分析与综合创造合计229第二百二十九页,共351页。第三讲教育测量基本问题

表面效度与内容效度表面效度指的是在被试或非专业人士看来,测验表面上是否在有效地测量着应测特质的程度。230第二百三十页,共351页。命题双向细目表示例1231第二百三十一页,共351页。考试内容(内容块)选择题简答题证明题应用题分析题合计识记理解...识记....分析综合..应用..应用分析综合创造内容12305050015内容20334030215内容308213900335内容404215900535合计218737188010100命题双向细目表示例2232第二百三十二页,共351页。第三讲教育测量基本问题(2)结构效度结构效度是指测验对于人的心理特性或理论概念测量到的程度。233第二百三十三页,共351页。第三讲教育测量基本问题

建立结构效度的步骤:A.提出理论假设;B.根据假定结构拟定测题,编制测验;C.以测验结果为根据来验证假设结构中的各种因素是否成立。234第二百三十四页,共351页。第三讲教育测量基本问题结构效度的验证方法——实验法通过控制某些实验条件,观察其对测验分数的影响,从而获得结构效度的信息。235第二百三十五页,共351页。第三讲教育测量基本问题举例构想:考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”。有一个焦虑测验,考察这测验是否有构想效度。设计几种试验情境:236第二百三十六页,共351页。第三讲教育测量基本问题设计1:比较不同重要性考试时该测验的分数:按照构想,重要考试时焦虑分数高平时考试中实施此焦虑测验重要考试之前实施该焦虑测验比较两次分数,如重要考试前的焦虑分数显著提高,就说明这个测验对测量考试焦虑是有效的。237第二百三十七页,共351页。第三讲教育测量基本问题设计2:举行两场考试,使被试相信一场考试关系重大,一场考试无关要紧;挑选两组被试,高焦虑组和低焦虑组;比较考试成绩,出现下述情况,说明测验有构想效度:焦虑分数高组学生,如在第一场考试中成绩比平时有所下降,在第二场考试中却能正常发挥。焦虑分数低组学生,无论在哪场考试都发挥正常。238第二百三十八页,共351页。第三讲教育测量基本问题设计3:收集被试在经历一场重大考试时的生理心理参数作为焦虑的指标;将其同焦虑测验分数比较;相关高证明焦虑测验测量了焦虑这个特质。239第二百三十九页,共351页。第三讲教育测量基本问题(3)效标关联效度效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致程度。

这里所说的“另一独立测验结果”是用以估计本测验的效度的标准,故称效标。效标关联效度分为两种:效标与本测验分数同时获得的,称为同时效度或并存效度;效标在本测验之后相当时间获得的,称为预测效度。

240第二百四十页,共351页。第三讲教育测量基本问题效标关联效度的估计方法主要有:①积差相关法②二列相关法③点二列相关法④等级相关法⑤列联相关法⑥命中率241第二百四十一页,共351页。第三讲教育测量基本问题3.提高效度的方法(1)影响测量效度的因素①测验的构成(要素)②测验实施方面(过程)③被试主观状态方面④估计效度所依循的效标⑤样本方面242第二百四十二页,共351页。第三讲教育测量基本问题(2)提高测量效度的方法①控制系统误差;②精心编制量表;③妥善组织测验;④扩大样本容量;⑤合理处理信度与效度的关系;⑥适当增加测验的长度。243第二百四十三页,共351页。第三讲教育测量基本问题(3)效度系数达到多少才可接受①两种不同的标准测验之间的效度系数或者两种不同的智力测验之间的效度系数应达到0.60--0.80之间;②智力测验分数与教师对学生智力等级评定之间的效度系数应在0.30--0.50范围内;③相同科目的标准测验成绩与教师对学生名次排列之间的效度系数应达到0.60--0.70之间。244第二百四十四页,共351页。4.信度与效度的关系

信度是对测量的一致性程度的估计,效度是对测量的准确性程度的估计。一致性与准确性的关系可以用射击靶环来说明。假设有A、B、C三支枪,对准靶面中心固定位置后各射9次,所得结果如图:245第二百四十五页,共351页。第三讲教育测量基本问题A枪弹着点十分分散,说明一致性和准确性都不好;B枪弹着点虽然比较集中,但偏离靶心,说明一致性好,准确性差;C枪弹着点全部集中在靶心,说明一致性和准确性都好。①信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。②信度低,效度不可能高。③信度高,效度未必高。④效度低,信度很可能高。⑤效度高,信度也必然高。246第二百四十六页,共351页。第三讲教育测量基本问题(三)难度1.难度的定义难度是指测题的难易程度。表示测题难易程度的数量,称为测题的难度指数,一般用P来表示。2.难度的计算(1)客观题难度的计算P=247第二百四十七页,共351页。第三讲教育测量基本问题(2)主观题难度的计算

P=(3)高低分组法(包含0、1记分及非0、1记分)(4)整卷难度①P=平均分/整卷满分②P=各题难度指数的加权平均数(权数:各题满分值)

248第二百四十八页,共351页。第三讲教育测量基本问题练习:某区域1000人参加考试,试卷第一题高分组180人答对,低分组60人答对,求该题难度?如果该题满分为10分,高分组得分总数为2100分,低分组得分总数为830分,求该题难度?249第二百四十九页,共351页。第三讲教育测量基本问题3.试题难度的一般评价标准P≥0.9,非常容易;0.7<P<0.9,偏易;0.3≤P≤0.7,适中;0.1<P<0.3,偏难;P≤0.1,非常难。250第二百五十页,共351页。第三讲教育测量基本问题

4.难度对测验的影响(1)测验难度影响测验分数的分布形态;251第二百五十一页,共351页。第三讲教育测量基本问题(2)测验难度影响测验分数的离散程度;(3)测验难度影响测验的鉴别能力;(4)难度多大为宜;(5)合理分布试题的难度结构。252第二百五十二页,共351页。第三讲教育测量基本问题5.影响题目难度的主要因素(1)考查知识点的多少;(2)考查能力的复杂程度或层次的高低;(3)考生对题目的熟悉程度;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论