教育学]体育测量与评价PPT课件-第二章 体育测量与评价的基础理论.ppt_第1页
教育学]体育测量与评价PPT课件-第二章 体育测量与评价的基础理论.ppt_第2页
教育学]体育测量与评价PPT课件-第二章 体育测量与评价的基础理论.ppt_第3页
教育学]体育测量与评价PPT课件-第二章 体育测量与评价的基础理论.ppt_第4页
教育学]体育测量与评价PPT课件-第二章 体育测量与评价的基础理论.ppt_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 体育测量与评价的基础理论 第一节 体育测量的基础理论 体育测量是体育教学、运动训练和体育科 研的重要基础。只有实施科学的测量,才能获得 准确而可靠的数据,并通过分析和研究,得出科 学的结论。 为了收集准确的资料,获得可靠的信息, 达到测量的目的,必须在体育测量的理论指导下 实施测量。 一、体育测量的基本概念 (一)测量 测量(史蒂文斯):是根据法则给事物赋予数量 。即用一定的法则给事物属性指派数字或符号的 过程。 体育测量:是指依照一定的法则,对体育领域中 事物的属性或特征赋予数量的过程。包括物理量 测量和非物理量测量。(内容和形式多样) A:物理量测量:身高、体重、跳高高度、跳远 远度、血压等; B:非物理量测量:有氧工作能力、技战术水平 、疲劳程度、心理素质、身体素质等。 测验:为了某种测量目的所进行的一系列测量构 成的系统。 (二)测量的要素 测量的要素:待测属性或特征、法则和数字符号。 A .待测属性或特征:由于测量的目的就是反映 事物的属性或特征,它是测量的第一要素。举例: 100米、立定跳远、灵敏性、心理素质、技战术水 平、意志品质等。 B.法则:能有效衡量事物属性的规则和尺度, 或是能显示事物属性的程序。 举例:身高的测量、心理素质的测量 心理素质的测量(包含认识能力、情绪和情感品 质、意志品质、气质和性格等。 如测量智力量 表:比奈西蒙智力量表,韦克斯勒成人智力量 表,瑞文智力量表等)。 C.数字符号:数字的含义与测量内容相关。 (三)测量量表 测量量表:是指测量所获得数据属性的表述规 则(反映表示测量结果的数字符号的性质和类型 )。这种规则由实数列的诸特性所决定的,这些 特性包括: A.顺序:两个或两个以上的实数有次序之分 、大小之分; B.距离:两个实数之间的差距可以描述; C.原点:对应于零位数的那一点(绝对零点 和相对零点)。 测量量表的分类 1、名称量表 不含实数列的任一特性,即无顺序、无距 离、无原点。是各种测量尺度中含信息量最少、 最低级的一种测量尺度。(如运动员的号码) 2、有序量表 有序量表含有实数列的顺序特性,但无距 离、无原点。其信息量比名称量表要丰富,属于 低等级的测量尺度。(比赛名次) 3、等距量表 等距量表含有实数列的顺序、距离特性 ,但无原点。等距量表又较有序量表含信息量多 ,属高等级的测量尺度。(角度、高度) 4、比例量表 比例量表具有实数列顺序、距离、原点 的全部特性。其含信息量最多,属于最高级量表 。(运动水平、进步率、进步度) 四种测量尺度的特征、功能和适用的统计分析方法 表: 特点基本功能数字特征适用的统计 方法 名称量表分类、标记 百分比,卡方检验 ,列联相关系 数 有序量表顺序可按照次序 排列 中位数,百分位数,等级相关,非 参数检验 等距量表距离差距的确定 与比较 算术平均数,标准差,积差相关 ,参数检验 比例量表原点比值的确定 与比较 几何均数 (五)测量的类型:不同的分类标准 A.按测量方法分类:直接测量和间接测量。 B.按测量属性分类:物理量测量和非物理量测 量。 C.按测量的组织形式分类:连续性测量和横断 面测量。 (六)体育测验的类型 1、按测试者人数分类 (1)单个测试者的测验:以一个测试者的测量 值作为受试者的测验值。如身高、体重等测验。 (2)多个测试者的测验:多个测试者同时对某 个受试者进行测量,以多个测试者测量结果的综 合值作为受试者的测验值 。 2、按重复测量次数分类 在体育测量中,测量次数的确定和测量结果取值 方式有以下几种情况: (1)测一次 受试者需要承受极限生理负荷完成的测验。如一 般耐力测验,一般只测一次。 对于瞬时性、损伤性和操作难度大的测验,如 运动后即刻脉搏、血压、血乳酸、肌肉活检及其 它生理生化指标的测验。一般只测一次。 对于测量误差很小,可靠性较高的测验,如形 态测量中的身高、体重等,一般只测一次。 (2)可以测2-3次或多次。 持续时间短的大强度非极限负荷的最大能 力测验,如立定跳远、投掷和灵敏性等测验。 (3)重复次数较多的测验 对于负荷小,但测量结果波动大,敏感和 易受干扰的测量验,如反应时或感知觉测验,为 减少随机误差,重复测量的最佳次数为30次。观 测值可取测验的平均值或总和,如果除去测验中 的最高和最低的成绩,取其余测验成绩的平均值 作为观测值则更好。 (七)测量误差 定义:是指与测量目的无关的变因产生效应, 所引起的观测值与真值之间的差异。 误差的分类: 1.随机误差 2.系统误差 3.过失误差 4.抽样误差 1 随机误差 随机误差又称为偶然误差,指在测量中由一些主 观或客观偶然因素引起,又不易控制的测量误差 。 随机误差随着测量次数的增加,其变化会呈现一 定规律性。它总是围绕被测量的真值波动(真值 以重复测试的均值为代表)。 推论:除标准化测试外,增加测量次数也是减少 随机误差的有效办法。 2 系统误差 系统误差,是指在测量中,由于仪器未校正至测 试要求,或对测量条件掌握过宽或过严,而使测量 结果出现规律性的偏大或偏小。后果:使数据统计 结果偏离方向。 消除办法:严格执行标准化测量,随时检查,及 时发现并纠正错误。 另外,通过增加测量次数,也可以将由于测量方 法掌握过宽或过严而产生的系统误差转化为随机误 差,使其降低到最低程度。 3 过失误差 过失误差,指在测量中由于测试者过失所造成的 误差,如测错、读错、记错。 这类误差只要认真负责,加强测试者的责任心, 并加强测试现场的监督检查,严格管理并执行验 收制度。 在最后资料整理过程中再进一步检查、鉴别、舍 弃,就会避免或减少由于过失误差而得出错误统 计结论。 4 抽样误差 抽样误差是由于抽样的原因而引起样本统计量与 总体参数之间的差异。 测量中虽严格遵守抽样原则,但不论用何种方法 抽样,从总体中抽取样本进行研究,样本统计量 与总体参数都不会完全一致,这是因为个体之间 差异是客观存在的,即使采取随机抽样仍然无法 避免样本统计量与总体参数之间的差异。 经典测量理论的基本假设: 真值的含义: “实测值”(简称X):测量对象的某种测量 内容(或特征)经测量后表现为一个数值。也称“ 观测值”、“观测数”、“测量所得的值”、“实 测分数”、“观察分数”、“原始观测数”等。 “真值”,也称“真分数”(简称T):反 映测量对象(或受试者)某种特征的真正水平(或 能力)的那个数据。 T和X的关系怎样? 测量误差可以使用下式表示: EXT (21) 式中:E表示误差;X表示测量结果;T 表示真值。 所有的被测事物或现象在特定的条件下,理 论上都有一个对应的客观、实际值存在,我们称之为 “理论真值”。它只是个理想的概念,这在误差理论 研究中非常重要。为了进一步理解体育测量的误差, 可人为地把体育测量过程分为三个子过程。 1.测量过程的分解 测量的目的在于了解被测事物或现象的真值。根 据测量真值的近似可知性和体育测量的推测过程的基 本特点,可把测量过程分解位以下过程: 式中:X指标测量值;T1现象真值;T2指标 真值;T待测真值。 (1)第I过程:由测量值推测现象真值的过程。 (2)第II过程:由现象真值推测指标真值的测量过 程。 (3)第III过程:由指标真值推测属性的过程。 2.测量误差的分解 公式(21)给出了总测量误差, 即由测量值推测真值存在的误差。依据测 量过程的分解,可以将总误差分解为测试 者误差、受试者误差和指标误差三部分。 误差的来源 1.测试者 2.受试者 3.指标误差 测试者误差 在第I过程中,现象真值(T)是确定的,而测 量值(X)与之有差异,很明显,误差来源是 测试者。第I过程中的测量误差称为测试者的 误差。 误差来源于测试者,(包括测试者测量方法的 正确,对测量的重视程度,测量条件等。), 这类误差称为测试者误差。 受试者误差: 在第II过程中,相对于T1来说,T2是确定的。该 过程的误差表现为现象真值与指标真值之间的差 异。 造成这种误差的原因有受试者本身、测量方法 以及测试条件等多方面,但该误差最终是通过受 试者表现出来的,所以该过程的误差称为受试者 误差。 指标误差: 第III过程是通过指标真值去推测属性的过程 ,其误差大小主要决定于指标能否真实地反映 测试属性。 如果测量指标中含有非待测属性的因素较多, 那么该过程的测量误差较大。所以,这一过程 的误差主要来源于测量指标,又被称为指标误 差。 以上所述为一般性的测量过程和测量误差的分 解,在实际应用中,具体到某一次测验,可能 没有三个过程,测量误差也可能不需要考虑三 部分。 例如,标枪我们一般不考虑测试者误差,而主 要考虑受试者误差;而体操、武术等主管评分 项目的比赛中,人们往往关心的是测试者的误 差。 产生误差的原因:主观原因是造成误差的主要原因 受试者的具体情况:生理、心理状态和配合程度 ; 测试人员状态:熟练程度、知识水平、责任心; 测量方法:测量方法自身所产生的误差; 测试环境:温度、海拔、天气等; 测试工具和仪器精度或不正确使用; 抽样误差中样本含量、抽样方法、样本量的代表 性。 数学模型及其假设 经典测量理论假定,实测值(X)与真值(T) 之间是一种线性关系,并只相差一个随机误差( E): X = T + E 1.测试者误差客观性 2.受试者误差可靠性 3.指标误差 有效性 二、体育测量的客观性 一、客观性概述 测量的客观性(又称评价的可靠性):是指同一 测试者或两个以上(含两个)的测试者对同一受试 者测量结果的一致性程度。 客观性是间接衡量第I过程中测量误差(测试者 误差)大小的一种量度。 所谓间接衡量是指不同测试者对同一受试对象同 时测量,通过测量结果的一致程度来衡量测试者 误差大小。 直观上看,如果测试者误差小,那么由不 同的测试者对同一受试者实施测量时,会得出极为 接近的测量结果,即所有测量值应具有较高的一致 性;反之,如果不同测试者测量结果的一致程度低 ,则说明测试者的测量误差大。如果某一项测验的 测试者误差小,则该测验的客观性高;反之,测验 的客观性低。 体育中主要用于主观评分类的运动项目。 例如体操或武术等测试中,数个裁判员对同一运动 员进行评分,若他们所评的分数很接近,说明评分 的客观性较高,反之则低。 测验的客观性定义 设从测验总体中随机抽取一名测试者(或 若干名测试者)和一个受试对象,测验值为X, 根据误差理论和测量过程的分解,测验的第I过 程误差模型为: XT1e1 (23) 式中,T1受试对象表现的现象值;e1 测试者造成的误差;e1和T1相互独立。从而: (24) 可见,客观系数是一个相对数,反映测试者的测量 误差相对于个体差异的大小,若测量误差相对较大,则 客观系数较小,反之亦反。客观性系数介于0和1之间。 公式(25)定义的客观性系数是测验关于全体测试者 和受试对象的客观性系数,即关于测验总体的客观性系 数,称之为测验的总体客观性,也称测验的客观性,一 般总是未知的,实际应用中需要通过样本进行检验。 测验的总体 在体育测量中,测验本身对测试者和测试 对象都有一定的要求,我们称满足测验要求的所 有测试者和测试对象构成的全体称为测验的总体 ,记为(A、B),其中A代表测试者,B代表测试 对象。明确了测验的总体,也就明确了测验的适 用范围。 二、客观性的分类 1、多人测量客观性:两名或两名以上的测试者 对同一受试者测量结果的一致性程度。 原因:对测量尺度掌握不一样。 提高方法:提高测试者测试水平、规定测试细 则及严格控制测试条件等方法。 2、一人测量客观性 同一测试者对同样事物多次重复测量 结果的一致性程度。 对同一项包含主观因素较多的测量来说,难以 在每次测量时,都保证尺度一致。如对同一人的 技术录像多次评分时 另外,同一人对不同受试者实施同样测量时, 也存在客观问题。 三、客观性的检验方法 单个测试者的测验 抽取若干名测试者对同一受试者进行测量, 以便对测试者的误差做出估计。常用检验方法有两 种: (1)一致性系数(W系数)法:测量值为受试者的 成绩等级(名次)。 W=12S/m2 (n3-n) W:为客观性系数;m:为测试者人数;n:为受试 者人数;S:为受试者名次之和的离均差平方和。 (2)方差分析法 R=1-MS内/MS总 多个测试者的测验(主观评分项目比赛) (1)裂半相关法 (2)方差分析法 R=1-MS内/MS间 客观性常用于一些主观评分类项目,如体操、跳 水、花样滑冰等体育比赛中。 四、影响客观性的因素 1、测试者水平 2、测试者的人数级 3、测试尺度:应尽可能明确规定测试细 节并且将其具体化,尽量减少测量中的主 观因素,实施标准化测量以提高测量的客 观性。 4、测验的规范性、标准化程度 5、测量的指标特征:在条件允许的情况 下,应尽量选择可以定量测量的指标。 三、体育测量的可靠性 (一)可靠性概述 测量的可靠性(信度)在相同测量条件下, 对同一批受试者使用相同测量手段,重复测量结 果的一致性程度。(狭义的操作定义)。一般定义 :测验结果的一贯性、一致性、再现性、稳定性 。 间接衡量第过程中测量误差(受试者误 差)大小的一种量度。 测量中常用R表示可靠性系数。 例:某同学的身高为178cm(真实值-以 重复测量的均值为代表),第一次测量所得身高为 177cm,第二次测量所得身高为179cm,测量值与真 实值中间的差值即为误差值。X=T+E;其中(X实 测值;T测量的真值;E测量误差值) 可靠性系数的范围(0,1)越接近1则可靠性越高 有些可靠性高的测量,如身高、体重等,这类指 标只要保持与原测量条件一致,多次重复测量结果 一致性程度较高。 然而,有些指标,如VO2max,即使进行最严格的标准化 和规范化测量,使用最精密的量具和仪器,由最有经验的 测试人员进行测试,其测量结果还会存在定的误差。这 种误差的大小,在很大程度上决定了测量的可靠性。 从“最严格的标准化和规范化测量,使用最精密的量具和 仪器,由最有经验的测试人员进行测试,其测量结果还会 存在定的误差。” 可以判断出:与测试人员无关,如果 存在误差,那么就应当是受试者自身造成的。 因此,可靠性就是衡量第II过程的测量误差(受试者误差 )大小的一个客观性指标,有严格的统计学定义。 根据可靠性数学理论,对一名受试者进行任何一 次测量的结果(实测值),都是两个量的和,即被测量 的真值与由于不能被控制的受试者状态变化和随机误差 而引起的误差之和,这就是可靠性的理论依据,可用下 面公式表示: xi (x)x(T)x (e) 式中xi为某次测量的实测值;x为被测量的真值; x为由不能被控制的受试者状态变化和随机误差而引起 的误差。 可靠性高低,是用可靠性系数(或称信度系数)进行描述的 。 可靠件系数(ii),即真值方差与实测值方差之比。可靠性 系数可用下面公式表示: 从上式可以看出,假如没有测量误差,即 0,则可靠性 系数ii就等于1。随着测量误差的增大,可靠性系数值也就越小。因 此,可以认为,测量的可靠性在很大程度上取决于测量误差的大小 。测量误差越小,可靠性越高。 (二)体育测验的可靠性检验 1、频数等于1的测验 (1)两次重复测验 (2)多次重复测验:方差分析法 R=1-MS内/MS总 2、频数大于1的测验:方差分析法 R=1-MS内/MS间 (三)可靠性的分类 测量的可靠性,人们习惯于将它分为3 类:即 一致可靠性 稳定可靠性 等价可靠性。 1、一致性可靠性 一致可靠性指同一天内,测试者对同一批受试者重复 测量结果的一致程度。 受试者人数较少时,在相同条件下进行重复测量。用 测量再测量结果的相关系数估价其内部一致性程度 。 大群体测量时,采用按人数比例随机抽样的方法,实 施重复测量检验其可靠性。 2、稳定可靠性 稳定可靠性指两天或数天内,测试者对同一批受试者重 复测量结果的一致程度。 如果被测事物属性相对稳定,即使间隔一定时间再测, 结果应当也一致的;若测量结果差异很大,说明这些指 标信度不高,不可靠。 在估价测量的稳定可靠性时,应注意根据不同测量指标 ,确定适宜的不同测量间隔时间,以避免因过长或过短 的测量间隔时间而高估或低估测量稳定可靠性。 如运动即刻的血乳酸值和几天之后的值。 3、等价可靠性 等价可靠性指在不同的测量时间,对受试者实施难度 相同,而方式或题目不同的同质测量结果的一致程度 。 等价可靠性常用于对受试者的理论知识测验。 另外在教学训练中也常用于检查学员技术掌握程度, 或进行性格、智力等心理方面的测量。 (四)影响可靠性的因素 影响可靠性的因素主要来自测量的随机误差和抽 样误差。 1、测量误差 影响可靠性的因素较多,但测量误差是影 响可靠性的直接因素。测量误差越大则可靠性越 低;反之,则可靠性越高。 测试者;受试者;测试仪器;测 试方法;测试环境;抽样误差:抽样方法、 样本量、样本代表性。 2、受试者个体差异和受试群体的能力水平 同一种测量手段,用于个体差异不同的 群体时,个体差异较大的群体,估价出的信度系 数较高,个体差异较小的群体信度系数较低。 在某种能力水平上信度高的测验,对于 其它能力水平的群体信度未必就高。 例如:适应能力问卷在本科文化程度人 群中使用重测信度可以,但用于小学文化程度的 人群信度未必够。 3、重复测量的间隔时间 重测信度、复本信度中,重复测量间隔时 间越长,估价出的信度系数越低 4、测量的长度 (组数、次数) 重测信度、复本信度中重复测量的次数, 评分者信度中的评分者人数,内部一致性信度中 的题目数统称为测验的长度,长度越长信度越高 ,但长度增加的同时测量工作量增加,其它影响 影响测量结果的因素也增加。 5、测量指标的类型 稳定性高、不易变化的指标重测信度高; 定性评分项目中,受主观因素影响小的指标评分 者信度高; 6、测试细则 测试细则详细准确的测量重测信度高; 评分规则详细准确的评分者信度高 7、估价可靠性时使用的方法 如果同时可以使用几种方法估价信度系 数,可能计算结果会稍有不同。 8、测试人员的人数、水平、责任心等对评分者 信度影响较大 可靠性程度的一般判断标准: (五)提高可靠性的方法 严格实施标准化的测量程序。包括测量仪器 设备的标准化,测量方法的标准化,测量实施的 标准化。这样可以减少随机误差和系统误差。 适当增加测量的长度。在运动技术测量当中 ,增加测量或测验的次数,在体育社会、教育心 理测量中,适当增加题目的数量。 适当地增加平行测验项目,可以增加对信度 的检验,获得更丰富的信息。 适当增加样本含量,并提高抽样的科学性( 使样本具有代表性),这样可以减少抽样误差。 测验的难度要适中,使受试者表现出应有的成 绩差异。 在选取受试者群体时,要兼顾他们的水平差异 (最好接近正态)。 提高测试人员的责任心、业务素质和测量技巧 ,以减少过失误差、系统误差和随机误差。 在有些测量中,要对受试者进行必要的宣传鼓 动,诱发其正确的动机和兴趣,使之事先对测量方 法、要求有所了解,更好地配合测试。尤其在机能 测验和运动能力测验中,以及在量表测试过程中, 正确的动机、认真的态度、全力以赴的作风将直接 关系到测量结果的准确与可靠。 重复测量时要考虑间隔时间的长短,以及要 保证两次测验的独立性(完整性)。 要注意测量时间和环境的选择。如不要在大 型赛事(如校运会)和重大节日(如国庆节)前 后安排测试;测试要求适当充裕的时间;要注意 考试环境的选择和控制(如噪音太大、考场纪律 混乱等)。 除了对可靠性进行定量的检验外,还可以通过 其它途径对信度检验进行补充和修正,例如:受 试者的平时表现、出勤、作业、回答问题等是否 与测试结果有特别大的出入等等。 四、体育测量的有效性 (一)有效性概述 测量的有效性(又称效度):是指所选 择的测量手段在测量欲测量属性时的准确性程度 ,即为所测量的属性与欲测属性之间的一致性程 度。 欲测属性:常是一个模糊不可直接测量而得到 的。 有效性的两层含义: 1、测量结果与测量目的的一致性(测量是否能测出 原打算要量的属性) 2、测量的准确度(测量结果的可靠性)现在测量与 原打算测量之间的相关性和可靠性; 效度系数 r ,-1r1 如30m绕杆跑,多次重复测量成绩非常接近,作为一项灵 敏性测量指标,可靠性高,有效性亦高,但如果作为速度指 标,虽可靠性高,但有效性不及30m跑。 有效性与可靠性的关系 可靠性是有效性的必要条件,即要想有效性 高,可靠性必需高;有效性是可靠性的充分条件, 即有效性高,可靠性一定高。同一测验的信度系数 高于其效度系数。 (二)有效性的分类 1、内容有效性 所选择的测量内容反映总体属性的准确程度。 常用于理论知识的测验。 考察内容效度的前提是:要有定义较完整的总 体属性的内容范围。 确定内容效度的方法 : A .专家调查:一定数量专家逻辑分析的 结果,也称逻辑效度。 B. 统计分析相关计算:一项测验与公 认有较好内容效度的测验的相关越高,说明内容 效度越好。如高中毕业前的摸底测验,其内容效 度可与高考成绩比较 。 内容有效性,是指测验项目和指标的内容能有 效地代表总体属性的准确程度,即测验的内容与 拟测属性的一致性程度。 用有限的几个测量中代表总体内容是比较困难 的,特别是一些心理测量,有时很难判断其内容 是否能反映总体属性。 韦克斯勒成人智力量表中国修订本(WAIS-RC) 2、结构有效性 一组测量所包含的各种属性与总体属性的各 种拟测成分在结构上的一致性程度。即可以实际 操作的测验与理论上的构想的符合程度。常用于 心理与运动能力的成套测验。 确定构想效度的方法 A 因素分析:探索性和实证性因素分 析 B 相关计算:与已有的构想效度较好 的测验的相关 C 聚合效度和区分效度 结构有效性,指一组测量所包含的各种属性与总 体属性各种拟测成分在结构上的一致性程度。如篮 球运动技能由投篮、传球、运球组成。 结构有效性的拟测属性是一种综合的、整体的属 性,而实际测量出来的只是构成总体属性的各个成 分或特征。 结构有效性与内容有效性有时很容易混淆,它 们在要求达到测量目的的这一点上是相同的,但 在使用时有区别。 结构有效性常用于心理测量与运动能力成套测 验,特别是编制运动技术测验时经常使用,而内 容有效性则常常用于理论知识测验(如文化考试 )。 3、效标有效性(criterion related validity) 。 所选择的测量与效标之间的关联一致性程度 。 效标:即检验效度的标准,是指已被证明具 有高有效性,可以作为参照标准的指标。效标有 定量和定性两类。 体育测量中常用的效标: A、可定量测量的专项成绩:如100米、跳远的成 绩; B、比赛的名次或运动等级; C、具有数量特征的量:100米跑的步频和步幅, 跳远的助跑速度; D、合成效标:如体质评价总分、成套测验总分 。 E、标准的实验室结果:如水下称重法测得的身 体成分、用气体分析仪和电动跑台测得的最大吸 氧量。 效标有效性指所选择的测量与效标之间的关联一 致性程度。 效标:指已被检验证明能够作为参考标准,并被 证明是一项有效性高的测量。如果两者之间的相 关程度高,说明所选择的测量的效标有效性高。 许多测量指标在使用之前不知其是否有效,或从逻辑分 析推断其有效,却不知道其有效性高低,此时就要选择 适宜效标,经测量后计算与效标之间的相关程度如何, 如果相关程度高,说明效标有效性高,反之则低。 往往用一些指标价格昂贵,条件限制挺大,尽量寻找一 些经济、适用、可行的指标来代替,选来作为大面积群 体测量适用。这就需要先验证该指标的效标有效性。 (三)有效性的检验 1、逻辑分析法:-专家调查法 逻辑分析法对估价内容有效性和结构有 效性是最为适宜的。 2、相关法常用于效标有效性的计算: 等级相关法、积差相关法 (四)影响有效性的因素 1、受试群体特征:年龄、性别、能力的个体差异等 ; 2、样本含量及其代表性:扩大样本含量,测量的可 靠性提高,有效性也随之提高。应坚持随机抽样原则 ,以提高样本的代表性; 3、测量的可靠性:可靠性是有效性的必要前提,即 有效性的测量必须是可靠的,所以要想提高测量的有 效性,首先要保证测量的可靠性。 4、效标的选择:对于同一项测量手段,选择不 同的效标,计算出来的效标有效性就不相同:例 某一测试所选择的效标缺乏有效性和可靠性,这 样所选择的这种测试方法就不能很好的评价实测 项目的指标。 5、测量的难度与区分度:测量难度适中时,区 分度最高,有效性也会提高。例:某种测验能把 不同能力水平的受试者区分出来,那么这种测验 的有效性就高;反之则有效性就低。 六、体育测验的编制与实施 (一)、体育测验编制的基本原则 1.科学性原则 科学性原则是指所编制的测验或所选择的 测验手段必须符合测量的有效性、可靠性和客观 性。 2.可比性原则 可比性原则是要求编制者按测量与评价的 理论和测量的有关规定来编制规范化的测验。 尽量采用已有的、国际或国内通用的标准化 测量。 3.适用性原则 测验的编制必须符合受试对象的实际情况, 全面地考虑受试者的年龄、性别、形态、机能和运 动能力、普通人或运动员等方面的特点。还要考虑 客观条件和实际情况,如当地的地理环境、文化传 统、教育水平、经济状况、场地设备以及测试者的 具体情况。 一般来说,难度适中的测验具有较大的鉴别性 。 4、相关、独立性原则 条件:编制成套测试。 相关性:各个测验与总体属性的相关关系; 独立性:各个测验指标应具有的单一属性和独 立性。 (二)体育测验编制的基本程序 1、确定测验目的和拟测属性 编制测验,首先要考虑的是测验的目的,亦 即测验编制者要解决什么问题。它是整个编制的核 心,必须首先确立。它将决定测验对象和测验指标 的选择、组织工作安排、仪器和经费等一系列问题 。目的一般不宜定得过多,以解决一两个具体问题 为宜。 2、选择有效的测验手段 A、分析拟测属性及其结构成分 测验目的确定后,则要分析拟测属性的概 念、内容、结构、内在联系和外部特征等,然后 用定性和定量的方法去选择相应的测验指标。 B、选择有效的测验手段:定性分析;定量 分析 定性分析选择测量指标,是基于理论和经验,运用逻 辑判断、分析、比较的方法选择测验指标。 定量分析选择测量指标,是在定性分析的基础上,运 用数理统计的方法和手段,对待定的测验指标做定量 分析后进行选择的。常用的数理统计方法有回归分析 、聚类分析、主成分分析等。 3、预备测验 为使所确立的测验更能体现科学性及符合测 量的实际情况,我们可以在小范围内或抽取小样本 对测验进行试验。这种试验的目的是: A、检验测验的有效性、可靠性和客观性,并确立 其系数; B、检查所编制或选择测验的可行性和实用性; C、根据试验情况和出现的问题,对测验做进一步 的修改使之趋于完善。 经过预备试验后,精选测验指标,剔除测量 值不稳定、有效性和可靠性低或测验结果呈极度偏 态的指标。 4、科学性检验:“三性”检验 科学性检验是指对测量进行“三性” 检验。 如待定测验指标的“三性”达到了使用标准便可选 用,否则要另行选择。 另外,还应对筛选出来的各个指标进行相关程度的 检验,如某两项指标的相关程度高且效标的相关程 度又很接近,说明这两项指标属同质测验,要剔除 其中一项。 总之,最后确定的指标,互相之间的相关程度要低 (独立性),与属性的相关程度要高(相关性)。 5、编写测验实施细则 A、测验目的; B、受试者的年龄与性别; C、测验的“三性”; D、测验场地和设备; E、测验的方法和要求; F、记录、评分的方法和要求; G、测验的安全措施。 I、测验的注意事项 (三)测验编制的程序 在实行多项测验或群体测验时,要考虑测验 程序的编排问题。 测验程序是指实施测验的先后次序,它是 根据测验时间、测验项目、测验内容、测验人数 、测验难易度和强度、测验条件(场地、设备) 和测试人员等方面的情况而进行编排的。 编排测验程序的原则是:第一,省时,便于组 织实施;第二,保证前后测验之间不会产生不良 影响。 在体育测验实践中,测验程序的编排通 常采用以下三种方法: 1.逐一测验编排法 2.连续测验编排法 3.循环测验编排法 (四)有关体育测验编制的几个问题 1、测验对象:用于评价的测验样本数,全国性标 准应1000,地区性标准应200;用于诊断的测 验样本数,通常应30;用于测量三性测验的样 本数,通常应 100,但在严格控制测量条件的 情况下,也可采用小样本数(20-30)方案进行。 2、测验形式: A、从测量目的来分:教学性测验是为教学训练提 供有效依据的简单、具体的测验;研究性测验是 为科研专门设计的详细、周密、完整的测验。 B、从测验项目来分:单项测验、成套测验 C、从测验手段来分:计时型测验、计数型测验、 丈量型测验、专家评分测验、操作仪器测验、理 论测验、临场观测 D、从时间延续长短来分:横向测验、纵向测验 有一些机能领域的测验项目(指标),不只 是一项而是有多项组成。这样由多项指标来测定某 个同一机能领域的测验,称成套测验,又称组合测 验或系列测验等,它主要用于测量体育范畴中某一 方面或某些行为(或现象)的综合属性,并同样具 有诊断、评价和预测等功能。 成套测验:是指由若干单项测验组成的一种有特 征的、具有完整属性的测验,通常又称“组合测验 ”或“系列测验”。 (五)成套测验 1、成套测验的特点: 成套测验的总体属性常常难以直接测量获 得,一般只是测量构成其总体属性的各个测验项 目(各个指标),把它们的测量观测值综合起来 以对总体属性进行估价。特点: A、总体属性与其结构成分(各单项测验)间具有 高相关性。 B、各结构成分间具有高独立性。 C、评价具有高综合性,是在确定各结构成分权重 、分值转换及评价法基础上的综合评价。 2、成套测验的编制 “测验编制的基本程序”一致,注意各组 测验之间的关联先后。成套测验的有效性、可靠 性和客观性检验包括项目的难易度检验、项目的 区分度检验、项目间的相关分析。 (1)项目的难易度检验:受试者在测验中的成 功率表示; 项目的难易度,可用受试者在该项测验中的 成功率表示,成功率愈高,难度愈小,当然亦可 用失败率表示,失败率愈高,难度愈大。 例2.10: (2)项目区分度检验:所谓项目的区分度,是指该 项目的测验成绩,能够区分受试者不同能力水平的 程度。 设成套测验总分的上位25与下位25的人为“上位群 ”及“下位群”,而且“上位群”在某项测验中的失败者(不 合格者)为W上,“下位群”在同一个测验中的失败者为W下, 则W上W下的值越大,该项目的区分度越好。 若受试者人数为N,则上、下位群的人数为:N上N下 =0.25N 则W上与W下的最大值分别为:W上N上,W下N下,而最小值 均为0。 显然,区分度的最大值,只有当“上位群”全部成功,而 “下位群”全部失败时才会得到。 从而,可得到计算区分度指数的公式: dW上W下/0.25N (课本50例2.11) 一般认为,区分度指数至少应达到0.20。 (3)项目间的相关分析: 理想的成套测验,要求各项目之间的相关程 度要低,若项目间呈高度相关,则意味着这些项目 所代表的是共同属性,因而只采用其中的一项也不 影响测量的效果。 项目之间的相关程度可计算每两项目间的积 差相关系数或等级相关系数。 3、成套测验编制的注意事项 (1)成套测验编制必须遵循前面所谈到的测验 编制基本原则和程序,并着重对成套测验的有效 性、可靠性和客观性进行分析和研究。 (2)成套测验以3-5个项目组合为宜; (3)编制成套测验时,必须要考虑综合评价的 问题。 (五)体育测试的 实施 按照测验的 实施过程,体 育测验的组织 实施过程分为 三个阶段。 1.测验前的准备工作 在测验计划确立后及测验实施前,应作如 下准备工作: I组建测试队伍; II组织测试者认真学习测验计划、测 试细则,明确分工; III测试实习; IV准备测验场地、设备和仪器; V准备成绩记录的表格或测试卡片及其 用具。 2.测试工作的进行 I向受试者说明有关事项; II准备活动; III测验前的练习; IV必要的提示; V思想鼓动。 3.测试后的工作 I 放松活动; II整理测验场地、设备及仪器; III检查所记录的测验成绩; V按原计划及时分析处理测量资料。 第二节 体育评价的基础理论 体育测量是将一些可以测得的物理量和 非物理量转换为数值或符号,进行资料汇集、 信息收集的过程。评价则是对所获得信息进行 加工处理,通过科学地分析进而作出价值判断 ,且赋予被测量事物或现象某种意义。所以说 ,测量是基础,是前提;评价是结果,是目的 。二者紧密联系,不可分割。 一、体育评价的基础知识 (一)体育评价的概念 评价是指评定事物的属性或特征的价值。目的 是在正确地解释事物现状的基础上,为改善现 状和实现理想的目标而制定决策提供判断依据 。 体育评价是指依据一定的标准,判断体育测量 结果,并赋予其价值或意义的过程。 1、比较标准:是借助于标准化测量程序和统计方 法,以及一定的评价量表而制订的规范化的评价标 准。现状、大样本测试。 2、理想标准:(优化标准)是指个体或群体经过 努力可能达到的标准。可用于个体或群体已具备的 能力水平与应达到的能力水平进行比较。例:父母 身高推测子女未来身高。 3、个体标准:(特色标准)根据个体在不同时期 、不同状态下的测量结果制订的标准。 体育评价的标准 比较标准是用于个体与个体之间,群体与群体之 间现实水平进行比较的评价标准, 理想标准是用于个体或群体己具备的能力和水 平与可能达到的能力和水平进行比较的评价标准 ; 个体标准则用于对同一个人不同时期,不同状 态之下的指标进行比较的评价标准。 所以说,评价的目的任务不同,所使用的评价标 准也不同。 在实际应用中,有时根据需要还可把以上三种标 准结合使用。 (二)体育评价的基本形式 在体育实践中,根据诊断目的,体育评价有三 种基本形式: 1.诊断性评价 诊断性评价,又称初始评价,是指在教 学和训练开始前的评价。其主要目的是为了解学 生的身体、能力、技能等状况及初始水平,做到 心中有数,并且可根据初始状况、水平进行分组 教学与训练,以达到因材施教、获得最佳效果的 目的。 2.形成性评价 形成性评价,又称阶段性评价。教学和训练是 分阶段进行的,在确定整个教学和训练总目标的同时, 也要确定若干个阶段性目标。 形成性评价,就是把某一教学或训练的总目标 分解称若干个阶段目标,并在教学和训练过程中随时检 查评定阶段目标完成的情况,以便及时反馈有关计划的 完成情况,并为最终达到教学和训练总目标而不断地调 整、改善、控制整个教学和训练过程。 故形成性评价是科学地控制、调整、改进教学 与训练的中心环节。 3.终结性评价 终结性评价,又称终末性评价。是指在教学 、训练过程的最后(如学期、学年末或训练周期末) 进行的评价。 它主要对学生体能、机能、成绩和身体能力 的提高及体质的增强、个体的进步等方面进行评价, 确定个体在集体中的位置以及进行不同群体间的相互 比较。 通过终结性评价可以获得全面的反馈信息, 以检查教学或训练方法、手段的效果,总结经验,发 现问题,为确定下一阶段教学和训练的目标提供科学 的依据。 二、体育评价量表及常用评价方法 有了评价标准以后,如何对个体或群体进行评价 ,则需要制定一种标尺,即制定评价量表。 评价量表是指能辨别事物属性、特征价值的一种 标尺,它是用统计方法把测量获得的实测值转换 为一组导出数据所组成的参照标准。 在体育测量中,常见的评价量表主要有两种:分 值量表和等级量表。 (一)分值量表 是以分值对事物的属性或特征进行评价的量表 。 1、标准分评分量表 2、百分位评分量表 3、累进评分量表 1、标准分量表 标准分量表是以标准差为单位划分评价等级或 分数区间值的一种评价量表。三个特点: 以标准差为单位划分评价等级的间距,成绩的 递增或递减的间距是相等的。 适用方便、广泛,在正态分布表上容易查出某 个成绩范围内的人数占总人数的百分比。 在多指标、计量单位不一的综合评价中,它可 以把原始测量值全部换成标准分(是相对分值), 可以相互比较,并能进行算术运算,这就更加显示 其优越性。 (1)Z分量表 Z分量表是一种最基本的标准分量表, 它把平均数定为0分,相差1个标准差为1分。Z 分的计算公式为: 田赛: 径赛: 式中:X实测值(成绩); 平均 值;S标准差 由于原始数据服从正态分布,故X分一 般在3+3之间。一般转化为T分量表。 (2)T分量表 为了是Z分全变为正数,可将Z分的计算公 式做简单变换,便得到T分计算公式: 田赛: 径赛: 即有:T10Z+50 (3)标准分量表 标准分量表:T分的满分为100分,如果 满分取值一般化的值,如20分、25分、50分等 ,则应该制定一般化的量表。 设满分为A,考虑到原始成绩的范围为( , ),则相差1个单位,标准分相差为: 显然的,分数相差1分,则该项成绩应该相 差: 例:测得某市10岁男生立定跳远成绩,经计算 , 149.7cm,S15.3cm,试制定该市10岁男 生的立定跳远成绩的标准分评分表(满分为20 分和100分) A:20分制标准量表制定方法 解:当A20时 根据 将 149.7cm定在10分位置上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论