版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育研究方法基础---第七章《教育统计与教育测验》
教育统计是运用数理统计原理和方法,研究教育问题的一门应用科学。主要包括:描述统计、推断统计、实验设计。教育测量就是对教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依一定的规则将考核的结果予以数量描述。如对学生的思想品德、健康状况、学业成绩等的测量。什么是教育统计与测量?
第一节变量与变量种类
一、总体与样本
一般来说,统计中研究对象的全体称为总体,组成总体的基本单位称为个体。从总体总抽出一部分个体进行研究,被抽到的个体称为样品,样品的全称称为样本,样品的个体称为样本容量,通常用N(n)表示。
二、变量
所谓变量是指研究对象的个体之间在性质和数量上可以变化并可以测量的条件、现象或特征。许多时候,变量是描述个体某方面特征的名称,
三、变量类型
1、定类变量
也称类别变量,根据定性的原则区分总体各个案类别的变量。定类变量的值只能把研究对象分类,也即只能决定研究对象是同类抑或不同类,具有=与≠的数学性质,是一种虚拟变量。此变量没有绝对零点,没有测量单位,变量之间有“相等”和“不等”的关系,但不能比较大小,也不能进行加减乘除四则运算。
例如:
性别区分为男性和女性两类出生地区分为农村、城市、城镇三类民族背景区分为汉、蒙、回、
苗、壮、藏、维吾尔等婚姻状况区分为未婚、已婚、分居、离婚、丧偶等
2、定序变量
定序变量称为等级变量,是区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。
定序变量既无零点又无测量单位,但变量之间的值具有“等于”或“不等于”的关系、四则运算没有意义。
例如:
文化程度可以分为大学、高中、初中、小学、文盲工厂规模可以分为大、中、小;年龄可以分为老、中、青
这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。但是,各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定序变量在各个案上所取的变量值只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。
3、定距变量
区别同一类别个案中等级次序及其距离的变量。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而具有加与减的数学特质。
摄氏温度这一定距变量说明,摄氏40度比30度高10度,摄氏30度比20度又高10度,它们之间高出的距离相等,而摄氏零度并不是没有温度。又比如调查数个地区的工人占全部劳动人口的比率时,发现甲、乙,丙、丁、戊五个地区的比率分别是2%、10%、35%、20%、10%。甲区与丙区相差33%,丙区与丁区相差15%。这也是一个定距变量。定距变量各类别之间的距离,只能用加减而不能用乘除或倍数的形式来说明它们之间的关系。
例如:
4、定比变量
是区别同一类别个案中等级次序及其距离的变量。这是一种既有测量单位,又有绝对零点的变量,由于有绝对零点,故可以构成有意义的比率。定比变量为最高级别的变量。除在运算在具有上述三种变量的特征外,还可以进行乘除运算,派生出比率、速度、效率、效益等指标。
例如:
年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;同时,由于其零点是不固定的,即使A是140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相差70分。因为0值是不固定的,如果将其向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。摄氏温度这一变量也如此。定比变量是最高测量层次的变量。变量定类变量:不能排序、不能加减、不能乘除定序变量:能排序、不能加减、不能乘除定距变量:能排序、能加减、不能乘除定比变量:能排序、能加减、能乘除第二节描述统计
一、统计表
统计表是用表格的形式将数据进行分类的计算,具有简明清晰、条理清楚、便于比较等优点,根据分类变量的个数,统计表可以分为单项表和多项表。
1、单项表(重庆2中各年高考录取人数)年份19931994199519961997合计高考录取人数101109110150190560
2、多项表(双项表)
初三(1)班男女生数学成绩分布统计表
性别成绩合计优良中差男9137433女489223合计1321166561996年—2004年我国普通公立高校学杂费总额、招生人数以及增长比例(多项表)年份招生人数(万人)国家财政性教育经费(亿元)财政性教育经费占教育经费总额的比例%学杂费总额(亿元)学杂费占教育经费总额的比例(%)199696.58262.680.644.616.91997100.04305.778.357.914.81998108.36356.864.973.113.31999159.68443.262.5120.817.12000220.61531.258.2192.621.12001268.28632.854.2282.424.22002340.76752.150.5390.630.42003382.17840.547.9505.728.82004447.34969.745.5647.630.4
3、次数分布表
次数分布表编写步骤:(1)求全距:最大数-最小数(2)定组数:如果样本个数在100以上,一般10-20组为宜,常取12-16组(3)定组距:组距=全距/组数(常用2、3、5、10、20等数值表示)(4)定组限:每组的起止范围(5)归类:把原始数据,分别归到相关组中组别组中值次数累计次数频率%累计频率%95-9997250410090-9492548109685-89871043208680-8482733146675-7977626125270-7472520104065-6967615123060-64624981855-59573561050-54522244合计50100三、样本的数字特征
平均数(M)
2、中位数(Md)
将变量的取值从小到大排列,如果样品数是奇数,则位于正中的那个称为中位数;如果样品数是偶数,则位于正中的两个取值的平均数为中位数。
3、众数(M0)
是指样本中出现次数最多的那个数值。
4、方差(σ2或S2)
5、标准差(σ或S)
某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分为70分)和30,50,86,90,94(均分为70分)。如何评价两组的学习情况?
例1:
请计算下列数据的平均数和标准差。
9,3,7,5,6,8,7,5,8,9,4,6,5,6,8,7,4,10
例2:
2.请计算下列数据的中位数和标准差
11,11,11,15,14,13,13,9,17,10,10,10,12,12,12,8,8,9。解:根据中位数的计算方法,先对数据进行从小到大排序:
8,8,9,9,10,10,10,11,11,11,12,12,12,13,13,14,15,17。
Md=(11+11)/2=11
根据标准差的计算公式,得
四、相关系数相关系数的取值范围在-1~1之间,其绝对值越大,表明两变量间的线性关联越强。高数Xi化学YiX
Yx2y2xy李安7177+1-4116-4李连杰6888-2+7449-14赵明7882+8+16418何其兵6276-8-5642540郭宇6478-6-336918成小亮6675-4-6163624露思7184+1+3193玛丽7380+3-191-3汤姆7783+7+249414杰克70870+60360平均数70810024418686
一、原始分数及其局限
根据测验的记分标准,对照被试的作答(或反应)计算出的测验分数称为原始分数。
第四节:分数的转换与解释优点:直观性强、操作简便缺点:不可比性不可加性不能反映学生在团体中的位置
二、几种常用的导出分数
1、百分等级分数
一个原始的百分等级分数是指一个团体的原始分数中,得分低于这个分数人数的百分比。计算公式为:
pr=100-100R-50N
例:小东期末考试在30名同学中排列第五,其语文成绩为85分,请计算小东语文成绩的百分等级分数?
解:
pr=100-100R-50N=100-(100*5-50/30)
=91
2、标准分数
概念:标准分是将原始分数(测验分数)与平均分数相减,再除以总体标准差所得的商。
标准分特点
(1)原始分数转化成标准分数是线性转换,不改变原始分数的分布形态,也不改变原始分数的排列顺序(2)无论各科的平均分、标准差怎样不同,Z分数的平均数为0,标准差为1
(3)标准分数以原始分数的平均分为参照点,以标准差为参照单位。(4)如果测验分数是正态分布或近似正态分布,从标准分数中可以知道其在团体中的位置。
例:对某校高二学生进行期中学习质量检测,语文、数学和英语成绩的平均数分别是80分、70分和85分,这三种成绩的标准差分别是10分、15分和12分。某学生的三科成绩分别是85分、82分和90分,问:该生这三科成绩哪一科最好?
3、T分数
T=a+bZ
上式中,a和b为选定的两个常数,Z为标准分数,T为线性变换的标准分数。常见的有如下几种:①教育与心理测验中的T分数:T=10Z+50②韦氏智力量表中各分测验的量表分:
T=10Z+100③我国部分省份的高考标准化考试的公布分数:T=500+100Z
第五节:测验信度
一、信度的定义
测验信度是指测验结果的一致性或稳定性程度,即测验的可靠性。因而,信度实际上就是对测验误差大小的一种描述。一般来说,误差越小,信度越大;误差越大,信度越小。信度通常介于0—1之间,一般来说,信度在0.9以上,信度很高;在0.75-0.9时,信度较高;在0.65-0.75时,信度中等;在0.55-0.65时,处于临界状态;而0.5以下则是低信度。
二、信度的计算
重测信度:是指同一组被试使用同一分试题,前后两次测验分数的相关系数。需注意以下几点:(1)两次测验的时间间隔要适宜,通常时间间隔为1-3周为宜,间隔不要超过半年。(2)比较适合于速度测验、问卷调查等分难度测验。(3)在第二次测验时,应注意提高被的积极性,使他们如同第一次测验那样认真对待。
复本测验:是用两份等值但具体题目又不同的两份试题,相继对同一组被试进行两次测验所得分数的相关系数。需要注意以下几点:
(1)A和B两分试题的具体内容不重复,否则会高估信度。(2)两次测验的时间间隔要短些,如(1-2天),但是如果两次测验连续进行,容易使被试产生一定的厌倦情绪。
分半信度:是把一个测验中的题目按编号分成两半,例如一半为奇数题一半为偶数题,分别计算出每个被试两部分的得分。然后计算这两个部分的相关系数r.计算公式为:
Rxx=2r/(1+r)
(一)测验的长度
一般来说,测验越长,信度值越高,这是因为:①测验加长,可能改进项目取样的代表性,从而能更好地反映受测者的真实水平;②测验的项目越多,在每个项目上的随机误差就可以互相抵消。(二)测验的难度
测验的难度与信度没有直接对应关系,但是当测验太难或太易时,则分数的范围就会缩小,从而降低信度。显然只有当测验难度水平可以使测验分数的分布范围最大时,测验的信度才会最高,通常这个难度水平为0.50。(三)测验的评分和实施方法三、提高测验信度的方法第六节:测验效度
测验效度是指测验实际能测出所要测的特质或能力的程度,即测验的有效性。
二、内容效度
内容效度是指一个测验实际测到的内容代表了所要测量内容的程度,对于学科测验而言,所要测量的内容就是教学大纲或课程标准所规定的教学内容和教学目标,包括广度和深度两方面,广度解决测什么的问题,通常列出要测的知识内容;深度解决测何种认知层次的问题,包括记忆、理解和应用等。这可以通过编制测验的双向细目表(命题蓝图)来解决。三、效标关联效度
效标关联效度是指一个测验与选定的效标的相关系数。所谓效标,可以是特定的行为标准,也可以是一个已知的效度较高的测验成绩。四、影响效度的因素
一、测验本身的因素:
1、测验取材必须对对整个内容具有的代表性
2、测题设计时应尽量避免容易引起误差的题型(如是非题)
3、测题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论