版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 教育统计与测量学原理 Z=(x-x)/s 人数 70 60 50 40 30 20 10 1980年 1985年 1991年 男 女 年份 教育统计与测量学原理教育统计与测量学原理 学习教育统计与教育测量的重要意义学习教育统计与教育测量的重要意义 1、教育统计和测量是认识教育本质的有力武器;、教育统计和测量是认识教育本质的有力武器; 2、是分析处理教育工作中各种数据资料、进行、是分析处理教育工作中各种数据资料、进行 教育督导与评价的有效工具;教育督导与评价的有效工具; 3、对教育管理科学化具有重要意义、对教育管理科学化具有重要意义 ; 4、是教育科学研究中,发现探索教育教学规律、是教育科学研
2、究中,发现探索教育教学规律、 指导教育教学实践、为教育行政部门决策提供指导教育教学实践、为教育行政部门决策提供 依据的重要思想方法;依据的重要思想方法; 5、是党和政府制定教育方针、政策以及认清教育、是党和政府制定教育方针、政策以及认清教育 事业和整个国民经济发展关系的重要工具。事业和整个国民经济发展关系的重要工具。 第一部分:教育统计学 一、概述 1、什么是教育统计学、什么是教育统计学 2、教育统计学的历史、教育统计学的历史 3、教育统计学的内容、教育统计学的内容 二、描述统计 1、常用的统计表、图与统计量、常用的统计表、图与统计量 2、相关分析、相关分析 3、正态分布、正态分布 三、推断统
3、计 1、相关概念、相关概念 2、总体平均数估计、总体平均数估计 3、平均数差异的显著性检验、平均数差异的显著性检验 四、实验设计简介四、实验设计简介 一、概述一、概述 教育统计学概念、发展历史、内容教育统计学概念、发展历史、内容 1 1、概念:、概念:教育统计学就是运用数理统计的原理和方教育统计学就是运用数理统计的原理和方 法研究教育问题的一门应用科学。它是研究如何收集、法研究教育问题的一门应用科学。它是研究如何收集、 整理、分析和解释教育方面的数据,从而表明教育上某整理、分析和解释教育方面的数据,从而表明教育上某 些现象的特征及规律的一门科学,它是处理教育实际工些现象的特征及规律的一门科学,
4、它是处理教育实际工 作和进行教育研究以及提高管理质量的科学水平、提高作和进行教育研究以及提高管理质量的科学水平、提高 教育质量的重要工具。教育质量的重要工具。 教育统计学的主要任务:对教育现象进行调查和实教育统计学的主要任务:对教育现象进行调查和实 验,在占有充分数据资料的基础上,经过对数据的整验,在占有充分数据资料的基础上,经过对数据的整 理计算、统计分析和统计检验等方法,对研究结果予理计算、统计分析和统计检验等方法,对研究结果予 以科学说明。即从数量方面的研究,来探索教育和心以科学说明。即从数量方面的研究,来探索教育和心 理现象的发展变化的特征和规律,或根据研究结果的理现象的发展变化的特征
5、和规律,或根据研究结果的 数据处理、统计推断,做出正确决策。数据处理、统计推断,做出正确决策。 教育统计学概念、发展历史、内容教育统计学概念、发展历史、内容 2 2、教育统计学发展史:教育统计学发展史:教育统计学产生于上个世纪初,发展于五、六十年代,教育统计学产生于上个世纪初,发展于五、六十年代, 广泛应用于八十年代以后。广泛应用于八十年代以后。 (1)国外:)国外:20世纪初统计学传入美国,桑代克(世纪初统计学传入美国,桑代克(E.L.Thorndike)为了达到)为了达到“极力以心极力以心 理学与统计学为工具研究教育学,使教育科学化理学与统计学为工具研究教育学,使教育科学化”的目的,的目的
6、,1904年出版世界上第一本有年出版世界上第一本有 关教育统计学的专著关教育统计学的专著心理与社会测量导论心理与社会测量导论。 (2)国内:我国的教育统计学是在辛亥革命以后,随着西方科学技术成就一起被引入。)国内:我国的教育统计学是在辛亥革命以后,随着西方科学技术成就一起被引入。 当时的大学教育系和中等师范学校,都把教育统计学作为必修课程,很多学者撰写专著,当时的大学教育系和中等师范学校,都把教育统计学作为必修课程,很多学者撰写专著, 如薛鸿志如薛鸿志教育统计方法教育统计方法(1925)、王书林)、王书林教育测验与统计教育测验与统计(1935)等。)等。1979 年随着全国教育科学规划会议的召
7、开,教育统计学恢复了新生,各师范大学又都开设了教年随着全国教育科学规划会议的召开,教育统计学恢复了新生,各师范大学又都开设了教 育统计学课程。教育部组织叶佩华、万梅亭、郝德元、陈一百等教授编写育统计学课程。教育部组织叶佩华、万梅亭、郝德元、陈一百等教授编写教育统计学教育统计学 作为全国通用教材。作为全国通用教材。 经过经过100多年的发展,各种教育统计方法已相当丰富。但每一种方法的运用多年的发展,各种教育统计方法已相当丰富。但每一种方法的运用 在我国还处于推广和适用阶段,因此不少人对它的作用缺乏足够的认识,特别在我国还处于推广和适用阶段,因此不少人对它的作用缺乏足够的认识,特别 是对复杂的教育
8、问题,由于统计方法本身的限制,还有十分重要的实验设计和是对复杂的教育问题,由于统计方法本身的限制,还有十分重要的实验设计和 统计推断的问题不能在理论上得到有力解决,还有待于教育学家亲自动手来推统计推断的问题不能在理论上得到有力解决,还有待于教育学家亲自动手来推 进统计理论和改进统计工具。进统计理论和改进统计工具。 教育统计学概念、发展历史、内容教育统计学概念、发展历史、内容 3 3、教育统计学的内容:、教育统计学的内容: 教育统计学按应用教育统计学按应用 分为描述统计、推断统计、实验设计(多元统计)三分为描述统计、推断统计、实验设计(多元统计)三 部分内容。部分内容。 (1)描述统计的主要作用
9、就在于就所关心的教育现象进行全面调查和观测,然后将所)描述统计的主要作用就在于就所关心的教育现象进行全面调查和观测,然后将所 得的大量数据加以整理、简缩、制成图表;或就这些数据的分布特征(如集中趋势、离散得的大量数据加以整理、简缩、制成图表;或就这些数据的分布特征(如集中趋势、离散 趋势、相关度等等)计算出具有概括性的数字作为标志。借助这些概括性的数字,我们就趋势、相关度等等)计算出具有概括性的数字作为标志。借助这些概括性的数字,我们就 可以从杂乱无章的数据中取得有意义的信息。可以从杂乱无章的数据中取得有意义的信息。 (2)推断统计也叫抽样统计,它是在描述统计的基础上发展起来的。是用抽样的方)
10、推断统计也叫抽样统计,它是在描述统计的基础上发展起来的。是用抽样的方 法,根据部分数据来推断一般情况,即通过局部对全局的情况加以推断的一种方法。它法,根据部分数据来推断一般情况,即通过局部对全局的情况加以推断的一种方法。它 可以帮我们透过现象看到本质,对客观现象作出本质性的判断可以帮我们透过现象看到本质,对客观现象作出本质性的判断 ,它是从样本的研究中得,它是从样本的研究中得 出统计量。来推断总体的有关特征,以便作出具体的措施和决策。常用的方法有:出统计量。来推断总体的有关特征,以便作出具体的措施和决策。常用的方法有:u检检 验、验、t检验、卡方检验和非参数检验,还有多元分析中的主成份分析和因
11、素分析等。检验、卡方检验和非参数检验,还有多元分析中的主成份分析和因素分析等。 (3)实验设计通常指实验程序的计划和安排。而实验程序的计划和安排离不开统计)实验设计通常指实验程序的计划和安排。而实验程序的计划和安排离不开统计 和检验。和检验。 二、描述统计二、描述统计 第一章第一章 常用统计表、统计图及统计量常用统计表、统计图及统计量 (一)常用统计表 1、统计表的结构:由标题、项目(标目)、数据、线条、表注(数据来源)组成 1983年我国普通中学教师学历统计表 学 历 人 数 百分比(%) 大学本科以上 300887 11.6 大专毕业 566863 21.8 中专毕业以下 1729750
12、66.6 合 计 2596900 100.0 注:引自中国教育成就统计资料,1984年人民教育出版社 标 题 项 目 线 条 数 据 表 注 二、描述统计二、描述统计 第一章第一章 常用统计表、图及统计量数常用统计表、图及统计量数 2、制表的一般要求 A、统计表的内容要简要,最好一个表说明一个中心内容。标 题的措词要简明扼要,正确说明内容,使人一望便知。 B、分项要准确,以能说明问题为主,分项的好坏是决定统计 表质量的关键,切忌分项太细。 C、数据是统计表的语言,说明内容,要求准确,书写整齐, 一律用阿拉伯数字,单位要统一,位数对齐,有效数字要一 致,表格内不能有空白。 D、线条不要太多,表的
13、上下端有顶线与底线,左右两边不要 用线封死,纵项目用细线格开,横项目一律不画线条,合计 项目用粗线条或双线与其它项目分开。 (二)常用统计图(二)常用统计图 1、统计图结构:图题、图目、图尺、图例、图形、图注、统计图结构:图题、图目、图尺、图例、图形、图注 人数 70 60 50 40 30 20 10 1980年 1985年 1991年 某校近十年教师人数及性别变化图示 男 女 年份 图图 例例 图图 形形 第一章第一章 常用统计表、统计图及统计量常用统计表、统计图及统计量 图图 目目 图图 尺尺 ( 制制 图图 的的 尺尺 度度 线。线。 点、点、 单单 位位 的的 总总 称)称) 图图
14、题题 2、统计图的类型及绘制要求、统计图的类型及绘制要求 绘制统计图的要求绘制统计图的要求 A、根据数据和目的选择合适的图形、根据数据和目的选择合适的图形 B、图形所表示的面积或距离要比例适当、图形所表示的面积或距离要比例适当 C、表示不同的事物要用不同的颜色与线条、表示不同的事物要用不同的颜色与线条 类型:类型:1 直条图直条图 2 圆形图圆形图 3 曲线图曲线图 4直方图直方图 讲师 42.9% 助教 28.8% 教授0.4% 某大学教师职称图 副教授 21.9% 某市7至18岁男女生身高比较图 1.75 1.70 1.65 1.60 1.55 1.50 1.45 1.40 岁 7 8 9
15、 10 11 12 13 14 15 16 17 18 米 某校某班某校某班50名学生家庭背景情况比较名学生家庭背景情况比较 20 15 10 5 人数 其他农工 商企 业 职员 公务 与科 教人 员 14 16 15 5 20 15 10 5 人数 其他农工 商企 业 职员 公务 与科 教人 员 14 16 15 5 (二)常用统计图(二)常用统计图 3、次数分布表与直方图、次数分布表与直方图 对一批数据按一定次序排列并加以分组、编成反映这群数据对一批数据按一定次序排列并加以分组、编成反映这群数据 在各组上出现次数的统计表和图,就是次数分布表和直方图。在各组上出现次数的统计表和图,就是次数分
16、布表和直方图。 例:一次考试之后,某班48名学生的成绩如下: 86,77,63,78,92,72,66,87,75,83,74, 47,83,81,76,82,97,69,82,88,71,67,65, 75,70,82,77,86,60,93,71,80,76,78,57, 95,78,64,79,82,68,74,73,84,76,79,86, 68 将该组数据整理成次数分布表与直方图 (二)常用统计图(二)常用统计图 1求全距:求全距:R=maxxi-minxi用该组数据最大数减最小数用该组数据最大数减最小数 2定组数和组距定组数和组距 :数据划分组数、每组上下限之间距离(全距除以组数)
17、:数据划分组数、每组上下限之间距离(全距除以组数) 3列组限:从最高分至最低分以组距为单位依次分组列组限:从最高分至最低分以组距为单位依次分组 4归组划记:计算数据出现次数,并计算累积次数及相对次数归组划记:计算数据出现次数,并计算累积次数及相对次数 步骤:步骤: 例:一次考试之 后,某班48名学 生的成绩如下: 86,77,63,78, 92,72,66,87, 75,83,74,47, 83,81,76,82, 97,69,82,88, 71,67,65,75, 70,82,77,86, 60,93,71,80, 76,78,57,95, 78,64,79,82, 68,74,73,84,
18、 76,79,86,68 组限 组中值 划记 次数 f 累积次数f 相对次数Rf 累积相对次数Rf 95 90 85 80 75 70 65 60 55 50 45 99 94 89 84 79 74 69 64 59 54 49 2 2 5 9 12 7 6 3 1 0 1 2 4 9 18 30 37 43 46 47 47 48 0.04 0.04 0.10 0.19 0.25 0.15 0.13 0.06 0.02 0 0.02 0.04 0.08 0.18 0.37 0.62 0.77 0.90 0.96 0.98 0.98 1.00 正 正 正 正 正 正 合计 48 48 1.0
19、0 次次 数数 分分 布布 表表 97 92 87 82 77 72 67 62 57 52 47 K=1.87(n-1) 2/5 14 12 10 8 6 4 2 45 50 55 60 65 70 75 80 85 90 95 100 次数 分数 直方图 (三)常用统计量集中量数(三)常用统计量集中量数 1、集中量数 :代表一组数据的集中趋势和典型特征 常用的有:平均数 中数 众数 第一章第一章 常用统计表、统计图及统计量常用统计表、统计图及统计量 (1) 平均数(算数平均数) X 1、X=(X1+X2+-+Xn)/n=(1/n)Xi (原始数据公式) 2、X=fxc/n (分组数据公式)
20、 xc:组中值 f:次数 3、X=(n1 x1+n2x2+-+nkxk)/(n1+n2+-nk) (加权平均数公式)加权平均数公式) (2)中数(中位数中数(中位数):用用 Md表示,是在一组按大小顺序排列的数据表示,是在一组按大小顺序排列的数据 中位置居中的那个数。数据是奇数个时,正好是中间位置的数,中位置居中的那个数。数据是奇数个时,正好是中间位置的数, 即第(即第(N+1)/2 个那个数;数据是偶数个时,求中间位置两个个那个数;数据是偶数个时,求中间位置两个 数的平均数。如:数的平均数。如:1 3 6 7 9 Md6; 3 6 7 9 20 21 Md(7+9)/2=8 (3)众数众数:
21、用用 M0表示,是一组数据中次数出现最多的那个数。表示,是一组数据中次数出现最多的那个数。 在众数不明显的情况下,一般可看众数段,即哪个分数段的次数多,在众数不明显的情况下,一般可看众数段,即哪个分数段的次数多, 就以该段中点值作众数。就以该段中点值作众数。一般用观察法求得。一般用观察法求得。 众中平 众中平 平中众 正态分布正态分布 正偏态分布正偏态分布 负偏态分布负偏态分布 平均数、中数、众数在数据常态分布中的相对位置平均数、中数、众数在数据常态分布中的相对位置 2、差异量数:全距、差异量数:全距 平均差平均差 标准差标准差 差异量数是描述次数分布中差异量数是描述次数分布中“离中趋势离中趋
22、势”这一特征的统计量,简这一特征的统计量,简 称称“差异量差异量”。一组数据,若离中趋势小,则集中量的代表性就。一组数据,若离中趋势小,则集中量的代表性就 大;反之,若离中趋势大,则集中量的代表性就小。但是,仅考大;反之,若离中趋势大,则集中量的代表性就小。但是,仅考 虑集中量数是不够的。要了解两组学生成绩分布的全貌,还必须虑集中量数是不够的。要了解两组学生成绩分布的全貌,还必须 研究两个组的差异量数。最常用的差异量有全距、平均差和标准研究两个组的差异量数。最常用的差异量有全距、平均差和标准 差。差。 (1)全距全距(符号为符号为“R”),指一组数据中由最大量数到最小量数,指一组数据中由最大量
23、数到最小量数 的距离。的距离。R小说明离散程度小,比较整齐。小说明离散程度小,比较整齐。 (2)平均差,指一组数据内的每个数与均数差的绝对值的算术平均差,指一组数据内的每个数与均数差的绝对值的算术 平均数,通常用平均数,通常用AD表示。平均差的计算公式为:表示。平均差的计算公式为: 常用统计量差异量数常用统计量差异量数 AD=(1/n) Xi-X 或 AD=(1/n) Xi-Md 差异量数方差与标准差异量数方差与标准 差差 (3)、标准差标准差:指一组数据中每一个数值与它们的平均数之差的指一组数据中每一个数值与它们的平均数之差的 平方的算术平均数的平方根,其符号为平方的算术平均数的平方根,其符
24、号为S(样本标准差样本标准差)、总体标准、总体标准 差用差用表示。表示。 S的计算公式为:的计算公式为: S 越大表明离散程度越大,数据不均匀,集中量的代表性小。越大表明离散程度越大,数据不均匀,集中量的代表性小。 方差与标准差除具有平均差的优点之外,还具有受抽样方差与标准差除具有平均差的优点之外,还具有受抽样 影响小和适于代数运算等优点,是最优良的差异量数。影响小和适于代数运算等优点,是最优良的差异量数。 ( ) ( ) ( )( ) n xxxxxxxx S n 22 3 2 2 2 1 -+-+-+- = X X1 X2 2 S 2 表示样本方差表示样本方差 表示总体方差表示总体方差 标
25、准差的应用:变异系数、标准分数 标准差的应用变异系数标准差的应用变异系数 变异系数计算公式:变异系数计算公式: 主要用于主要用于:同一团体不同观测值离散程度的比较;对于水平相差较:同一团体不同观测值离散程度的比较;对于水平相差较 大,但进行的是同一种观测的各种团体离散程度的比较。大,但进行的是同一种观测的各种团体离散程度的比较。 例:已知某小学一年级学生的平均体重为例:已知某小学一年级学生的平均体重为25千克,标准差是千克,标准差是3.7千克,平均千克,平均 身高身高110厘米,标准差为厘米,标准差为6.2厘米,问体重与身高的离散程度那个大?厘米,问体重与身高的离散程度那个大? 解:解:CV体
26、重体重3.7/2514.8 CV身高身高6.2/110=5.64 答:通过比较差异系数可知,体重的分散程度比身高的分散程度大答:通过比较差异系数可知,体重的分散程度比身高的分散程度大 (14.85.64)。 变异系数是一种相对差异量,常用变异系数是一种相对差异量,常用cv表示表示 %100= X CV 标准差的应用标准分标准差的应用标准分 标准分数标准分数(又称又称Z分数分数)。它是一种以平均数为参它是一种以平均数为参 照点,以标准差为单位的,表示一个分数在团照点,以标准差为单位的,表示一个分数在团 体分数中所处位置的量数,其计算方法为:由体分数中所处位置的量数,其计算方法为:由 原始分数与平
27、均分数的差除以标准差所得的量原始分数与平均分数的差除以标准差所得的量 数,其符号为数,其符号为“Z Z”,计算公式是:,计算公式是: s xx Z - = 标准分是以标准差为单位的,故称为标准分。它是一种相对地位分。标准分是以标准差为单位的,故称为标准分。它是一种相对地位分。 标准分有正负之分,一般在标准分有正负之分,一般在-3,3中(几率为中(几率为99.74%) ,平均值为零。,平均值为零。 标准分可比性根据在于标准正态分布。标准分可比性根据在于标准正态分布。 T分数:分数:T=10Z+50 (一般一般20T80) E分数:分数:E=20Z+90 (一般一般30E150) 例:有某生三次数
28、学考试的成绩分别为例:有某生三次数学考试的成绩分别为70、57、45,三次考,三次考 试的班平均分为试的班平均分为70、55、42,标准差分别为,标准差分别为8、4、5。如。如 何看待该生的三次考试成绩何看待该生的三次考试成绩? 答:如果仅从原始分数看,肯定认为第一次最好,其实答:如果仅从原始分数看,肯定认为第一次最好,其实 不然,要计算出各次的标准分数,才能说明问题。不然,要计算出各次的标准分数,才能说明问题。 根据公式得出:根据公式得出: Z1=(7070)/8=0 Z2=(5755)/4=0.5 Z3=(4542)/5=0.6 这说明,原始分数为这说明,原始分数为70,其位置正在平均线上
29、,而原,其位置正在平均线上,而原 始分数为始分数为57的,其位置在平均线上的,其位置在平均线上0.5处,而原始分数为处,而原始分数为45 的,其位置在平均线上的,其位置在平均线上0.6处。很显然第三次成绩最好,第处。很显然第三次成绩最好,第 一次最差。一次最差。 标准差的应用标准分标准差的应用标准分 标准分数: 运用标准分比较不运用标准分比较不 同教育测验成绩总分的同教育测验成绩总分的 优劣,更为合理。优劣,更为合理。 例:甲乙两学生五科考试成绩如例:甲乙两学生五科考试成绩如 下,试分析哪名学生成绩好些?下,试分析哪名学生成绩好些? 语文语文 数学数学 地理地理 历史历史 政治政治 合计合计
30、70.0 14.0 80 85 0.71 1.07 85.0 3.5 90 88 1.43 0.86 55.0 4.0 57 51 0.50 1.00 42.0 5.0 45 40 0.60 0.40 70.0 8.0 70 90 0 2.50 342 354 3.24 3.03 两考生总成绩标准分数计算表 甲生甲生 乙生乙生 甲生甲生 乙生乙生 科科 目目 X S X Z 如果按原始分数乙如果按原始分数乙 生总分是生总分是354分优于甲生分优于甲生 的的342分总分,但按标准分总分,但按标准 分数则甲生的分数则甲生的3.24分优分优 于乙生的于乙生的3.03分。分。 s xx Z - = 标
31、准差的应用标准分标准差的应用标准分 二、描述统计 相关分析:相关分析:研究两自变量之间的关系紧密程度的过程,统计学上称为相研究两自变量之间的关系紧密程度的过程,统计学上称为相 关分析。事物的变化总是伴随着一定的量的变化,有些是单变量,有些是关分析。事物的变化总是伴随着一定的量的变化,有些是单变量,有些是 双变量或多变量,也有些是复变量。集中量数和差异量数反映的是单变量双变量或多变量,也有些是复变量。集中量数和差异量数反映的是单变量 数据特征,相关分析主要研究双变量数据特征。数据特征,相关分析主要研究双变量数据特征。 我们都知道事物现象间的相互关系,如果从数量关系的角度考察,我们都知道事物现象间
32、的相互关系,如果从数量关系的角度考察, 可分为可分为函数关系函数关系和和相关关系相关关系两种类型。相关关系可分为两种类型。相关关系可分为正相关、负相关、正相关、负相关、 直线相关、曲线相关、完全相关(函数关系)、高度相关、低相关和零相直线相关、曲线相关、完全相关(函数关系)、高度相关、低相关和零相 关关。 如:教育经费的投入与教育事业发展规模和速度之间的关系是正相关;如:教育经费的投入与教育事业发展规模和速度之间的关系是正相关; 复习次数与遗忘量之间的关系是负相关。复习次数与遗忘量之间的关系是负相关。 相关分析的方法有二:相关分析的方法有二:一是图示法,一为计算法。一是图示法,一为计算法。 第
33、二章第二章 相关分析相关分析 图示法: 将两组观 测值标在 坐标系中 曲线相关 直线相关 二、描述统计 相关系数相关系数:是描述两组数据之间相关程度的量数 种类种类:积差相关系数、等级相关、点二列相关和 相关 积差相关系数(皮尔逊系数):是描述来自正态总体两个连续变量 之间线性相关程度的一种相关量数 r=nxy-(x)(y)/ nX 2-(X)2ny2-(y)2 相关系数的范围: -1 r1 当r是正值时为正相关; 当r是负值时为负相关;r=0为零相关。 通常1 r 0.70 为高度相关;0.70 r 0.40为较显著相关 0.40 r 0 为低相关。当然在下结论时还要进行显著性检验 第二章第
34、二章 相关分析相关分析 对相关系数的解释注意以下问题:对相关系数的解释注意以下问题: A在小样本中要做显著性检验;在小样本中要做显著性检验; B相关系数大小差异不是绝对的;相关系数大小差异不是绝对的; C相关系数不是等距的不能进行大小比较;相关系数不是等距的不能进行大小比较; D相关关系不一定是因果关系相关关系不一定是因果关系 第二章第二章 相关分析相关分析 N ZZ N YYXX r yx yx xy = - = )( 数学数学物理物理英语英语物理物理 7070757576767575 6060636360606363 8282757565657575 4444606056566060 52
35、52555570705555 9090979785859797 8080898948488989 r r 0.91 0.91 r r 0.26 0.26 例:数学与物理、物理与英语相关性比较例:数学与物理、物理与英语相关性比较 第三章第三章 正态分布正态分布 在社会、教育现象中大多数随机变量都呈现是或近似正态分布的情形。正态 分布是统计理论与统计应用中最重要应用最广泛的一种分布。 正 态 曲 线 的 特 点 1 1.5 2.5 3 4.5 6 X Y 0.8 0.6 0.4 0.2 0 =0.8, =1.5、2.5、4.5 二、描述统计 一个正态分布是由总体的平均数和总体的方差所决定的。 1、
36、 正态曲线及其特点正态曲线及其特点 正态分布 x(, )的密度函数曲线 2 正态曲线位于正态曲线位于x轴上方,以轴上方,以x= 为对称轴,以为对称轴,以x轴为渐近线轴为渐近线 曲线的位置和形状取决于曲线的位置和形状取决于 值和值和值值 , 决定位置,决定位置,决定决定 形状。形状。越大曲线越矮胖,越大曲线越矮胖, 越小曲线越陡峭越小曲线越陡峭 x= 时曲线时曲线 处于最高点,即当处于最高点,即当x= 时时f()1/ 2 为最大值为最大值 ,曲线呈曲线呈 中间高两边低的形态。中间高两边低的形态。 p 正态曲线方程:正态曲线方程:f(x)=【1/(2 ) 】e -(x- ) /2 2 2 其中:
37、是园周率;e是自然对数的底;x为随机变量的取值; 为正态分布的均 值; 为正态分布的方差。 2 p p 第三章第三章 正态分布正态分布 2、正态分布曲线的重要性质:、正态分布曲线的重要性质: -3-2- 0 2 3 68.26% 95.46% 99.73% 从概率的角度而言:从概率的角度而言: 观测数据落在(观测数据落在(+1)内的概率)内的概率 为为68.26%;落在(;落在(+2 )内的概)内的概 率为率为95.46%;落在(;落在(+3 )内的)内的 概率为概率为99.73%。 z=(x-)/ 标准正态分布 x(0, 1 )z 、 P的意义 如如: z=1时时 P=0.3413 z=2时
38、时 P=0.4772 z=2.5时时 P=0.4938 z=3时时 P=0.4987 3、正态曲线理论的应用 (1)推求学生成绩中某些分数的人数 例:假定500个学生某科成绩近似正态分布,其X=70,=10, 试问(1)75分以下有多少人(2)85分以上有多少人(3)75-85分 之间有多少人。 解:(1)z=(75-70)/10=0.5,查正态分布表中值为0.6915,因此75分以下的学生 占69.15%,75分以下的人数是500X69.15%=346(人) (2) z=(85-70)/10=1.5,查正态分布表中值为0.93319, 85分以下的学生占 93.319%,因此85分以上的学生
39、占100%-93.319%=6.681%,所以85分以上的人 数是500X 6.681%=33(人) (3)75分至85分之间,实际上是75分以上至85分以下的范围,因此85分的 百分率减去75分以下的百分率即为所求 93.319%-69.15%=24.169% 500 x24.169%=121(人) -3-2- 0 23 正态曲线理论的应用 (2)推求某一特定百分率的成绩界限 例:某县对初一年级学生1000名学生进行能力测验,其结果 为X=75,=10,现拟根据此次结果选取25名学生作为“尖子 班”培养,假定测验成绩近似正态分布,问多少分以上才能被 选到“尖子班”学习。 97.5% 2.5%
40、 X 1.96 75 94.6 在正态分布表中查表中值0.975所对应的标准分数, z=1.96,既是说1000名学生中有97.5的人数在标准分 数1.96以下,因此有2.5的人数在标准分1.96以上, 再将标准分数1.96化为原始分数得: 1.96X1075=94.6(分) 答:分数在94.6分以上才能进“尖子班”。 分析:“尖子班”的人数占全年级的百分比为: 25/1000=2.5% 用标准分计算更容易理解: xx Z - = Z1.96(x-75)/10 X= 1.96X1075=94.6(分) 正态曲线理论的应用 (3)分析测验试题的难度 例:某校学生在一次测验中,第一题的答对率为15
41、%,第二题的答对率为 25%,第三题的答对率为35%,假设这三题所测量的能力近似正态分布, 问1、2、3题的难度值各为多少?各题之间的难度差异怎样? 解: 试题难度值比较表 题号 答对率 答错率 难度值 难度差异 1 15% 85% 1.04 2 25% 75% 0.67 0.37 3 35% 65% 0.39 0.28 在正态分布中,通常是根据答错率找出所对应的标准分数界限值,此值即为该题的难度比值。 由左表可知虽然 三题的答对率都 相差10,但第 二题与第三题的 难度差异却比第 一题与第二题的 难度差异要小。 x 0 )( x 0.65 0.75 0.85 0.39 0.67 1.04 三
42、、推断统计三、推断统计 教育现象和一切客观物质世界中的现象一样,教育现象和一切客观物质世界中的现象一样, 不仅存在质的方面,同时也存在量的方面,而且不仅存在质的方面,同时也存在量的方面,而且 这两方面是辩证统一的。教育统计学就是在教育这两方面是辩证统一的。教育统计学就是在教育 现象的质与量中,专门研究其数量方面特征的重现象的质与量中,专门研究其数量方面特征的重 要工具。在建立了以概率论和抽样方法为主要依要工具。在建立了以概率论和抽样方法为主要依 据后,教育统计学便具有了以局部推知全体,以据后,教育统计学便具有了以局部推知全体,以 样本资料推知总体性质的科学推断功能。样本资料推知总体性质的科学推
43、断功能。 根据样本信息对总体参数状况的推断有两种不根据样本信息对总体参数状况的推断有两种不 同形式,既同形式,既总体参数估计总体参数估计和和假设检验假设检验,二者既有,二者既有 区别也有联系。区别也有联系。 三、推断统计三、推断统计 1、总体和样本、总体和样本 所要研究对象的全体叫做总体。其中每一个研究对象叫做个体。从所要研究对象的全体叫做总体。其中每一个研究对象叫做个体。从 总体中抽取的一部分叫做总体的一个样本,样本中个体的数目叫做样总体中抽取的一部分叫做总体的一个样本,样本中个体的数目叫做样 本容量。本容量。 例例1:对家用电器质量抽查,确定次品率。不能采用全部检测的方法。:对家用电器质量
44、抽查,确定次品率。不能采用全部检测的方法。 例例2:全市要检查初中学生体育锻炼达标情况,对每名学生一一测试工:全市要检查初中学生体育锻炼达标情况,对每名学生一一测试工 作量很大,不仅耗费人力、物力和时间,而且没有必要。有没有一种科学作量很大,不仅耗费人力、物力和时间,而且没有必要。有没有一种科学 的方法只抽测一少部分学生,然后根据这部分学生的测试成绩去推知全市的方法只抽测一少部分学生,然后根据这部分学生的测试成绩去推知全市 中学生的体育达标情况?中学生的体育达标情况? 2、参数与统计量、参数与统计量 总体参数是指一切由观察测定总体的全部个体而得到的统计量数总体参数是指一切由观察测定总体的全部个
45、体而得到的统计量数(, ); 样本统计量是指为估计总体参数从样本所得的统计(样本统计量是指为估计总体参数从样本所得的统计( ,s )。)。X 第一章第一章 相关概念相关概念 推断统计推断统计 4、抽样方法、抽样方法 3、随机误差、随机误差 样本统计量与总体参数之间的差距。样本统计量与总体参数之间的差距。 从某市参加高考的从某市参加高考的1200名学生中抽取名学生中抽取200名试卷组成一个样本,名试卷组成一个样本, 计算这计算这200份试卷的平均分和标准差,这份试卷的平均分和标准差,这200份试卷的平均分和标准份试卷的平均分和标准 差与差与1200名考生的平均分和标准差是有差距的,不同的抽取带来
46、不名考生的平均分和标准差是有差距的,不同的抽取带来不 同的差距,这种差距称之为随机误差。同的差距,这种差距称之为随机误差。 A、随机抽样(抽签法、随机数字法)、随机抽样(抽签法、随机数字法) B、机械抽样、机械抽样 C、分层抽样、分层抽样 D、 整群抽样整群抽样 抽取样本应遵循的原则抽取样本应遵循的原则:第一总体中每一个个体被抽中的机会均等,即抽第一总体中每一个个体被抽中的机会均等,即抽 中与抽不中纯属偶然;第二任一个体与其它个体在抽取时无联带关系,即抽中与抽不中纯属偶然;第二任一个体与其它个体在抽取时无联带关系,即抽 中的个体与抽不中的个体无关;第三在条件允许的情况下,尽量使样本容量中的个体
47、与抽不中的个体无关;第三在条件允许的情况下,尽量使样本容量 大一些。大一些。 5. 小概率事小概率事 在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05 以下,即当以下,即当P(A) 5%时,则称时,则称A为小概率事件。在统计推断中认为,小概率为小概率事件。在统计推断中认为,小概率 事件在一次试验或观察中是不可能发生的。事件在一次试验或观察中是不可能发生的。 第二章第二章 总体平均数的区间估计总体平均数的区间估计 (总体平均数的置信区间)(总体平均数的置信区间) 推断统计的基本理论之一就是抽样理论,而推断统计的任务则是根
48、据样本资推断统计的基本理论之一就是抽样理论,而推断统计的任务则是根据样本资 料来推断总体的特征,从而揭示总体的本质和规律。料来推断总体的特征,从而揭示总体的本质和规律。 抽样分布的几个重要定理(统计推断的理论依据)抽样分布的几个重要定理(统计推断的理论依据) 1.从总体中随机抽出容量为从总体中随机抽出容量为n的一切可能样本的平均数的平均数等于总体的平的一切可能样本的平均数的平均数等于总体的平 均数。均数。E(x)= 2.容量为容量为n的平均数在抽样分布上的标准差,等于总体标准差除以的平均数在抽样分布上的标准差,等于总体标准差除以n的方根。的方根。 x= n 3、从正态总体中,随机抽取的容量为、
49、从正态总体中,随机抽取的容量为n的一切可能的样本平均数的分布也呈的一切可能的样本平均数的分布也呈 正态分布。正态分布。 4、虽然总体不呈正态分布,如果样本容量较大,反映总体、虽然总体不呈正态分布,如果样本容量较大,反映总体和和的样本平均的样本平均 数的抽样分布,也接近于正态分布。数的抽样分布,也接近于正态分布。 多个样本平均数呈正态分布 N(, )x n 第二章第二章 总体平均数的区间估计总体平均数的区间估计 (总体平均数的置信区间)(总体平均数的置信区间) (一)、原总体的方差已知 样本平均数的总体分布,在样本容量很大时其分布近似于正态分 布,样本平均数分布的标准差为/ n,根据正态分布的性
50、质U=(X- )/ X 服从正态分布。对于给定的 值(01),则称(1-) 为置信度,可求出满足P(UU)=1-。一般取=0.01或=0.05, 对应的U0.05=1.96 U0.01=2.58。 置信区间:=0.05 (x-1.96/ n, x+ 1.96/n )为总体平均 数95%的置信区间 =0.01 (x-2.58/ n, x+ 2.58/n )为总体平均数 99%的置信区间 根据样本平均数估计总体平均数的所在区间,称为总体平均数的区间估计。根据样本平均数估计总体平均数的所在区间,称为总体平均数的区间估计。 基本原理:按一定概率要求,根据样本平均数估计总体平均数的所在区间基本原理:按一
51、定概率要求,根据样本平均数估计总体平均数的所在区间。 0 1 /2 /2 区间估计示意图区间估计示意图 x-1.96/ nx+ 1.96/n x+ 1.96/n 0 1 /2 /2 区间估计示意图区间估计示意图 x-1.96/ nx+ 1.96/n 0 1 /2 /2 区间估计示意图区间估计示意图 x-1.96/ nx+ 1.96/n (二)、原总体的方差未知(二)、原总体的方差未知 对于总体方差未知且容量n30,则用S代 相应的有 置信区间为:=0.05 (x-1.96S/ n, x+ 1.96S/n )为总体平 均数95%的置信区间 =0.01 (x-2.58S/ n, x+ 2.58S/
52、n )为总体平均 数99%的置信区间 例:从某地区高考初试的数学试卷中,随机抽取40份,分析后得到如下数据,平均成 绩为51.2,标准差为3.8,问这一地区初试数学平均成绩在怎样的范围内? 答:已知 X=51.2 S=3.8 n=40, 本题属于总体方差未知且大样本n30, 因此: 置信区间的下限=51.2-1.96x3.8/40=50 置信区间的上限=51.2+1.96x3.8/40=52 这一地区初试数学平均成绩有95%的可能性在(50,52)范围内。 同理也可以计算出有99的可能性在(49.6,52.7)范围内。 三、推断统计三、推断统计 第三章第三章 显著性检验显著性检验 平均数差异的
53、显著性检验平均数差异的显著性检验( (Z检验与检验与t检验检验) 一、显著性检验的基本思想一、显著性检验的基本思想 显著性检验是统计推断的一种方法,它是确定一个具有已知统计量的样本是不是显著性检验是统计推断的一种方法,它是确定一个具有已知统计量的样本是不是 从已知对应参数的总体中抽出来的或是两样本的统计量是来自同一总体还是来自不同从已知对应参数的总体中抽出来的或是两样本的统计量是来自同一总体还是来自不同 的总体。或从另外的角度说,样本统计量与总体参数的差异或两个样本统计量的差异的总体。或从另外的角度说,样本统计量与总体参数的差异或两个样本统计量的差异 究竟是由于抽样所引起的随机误差,还是本质上
54、的误差,这需要检验才能加以确定。究竟是由于抽样所引起的随机误差,还是本质上的误差,这需要检验才能加以确定。 判断这种差异是否显著,要用概率来回答。如果差异是由于抽样误差而引起的可能性判断这种差异是否显著,要用概率来回答。如果差异是由于抽样误差而引起的可能性 大,那末两者的差异就不显著,反之两者的差异就显著。大,那末两者的差异就不显著,反之两者的差异就显著。 抽样误差的概率大小是由显著性水平来衡量的。通常采用的显著性水平为抽样误差的概率大小是由显著性水平来衡量的。通常采用的显著性水平为0.05或或 0.01,如果,如果 P0.05为差异不显著;如果为差异不显著;如果 0.05P0.01差异显著;
55、如果差异显著;如果Pt(df)0.05,从上表可知,概率,从上表可知,概率P0.05时,时,和和0之间的差异显著。之间的差异显著。 因此可下结论为:拒斥因此可下结论为:拒斥H0:=0,而肯定而肯定H1:0,又因,又因 0,故结论表明新教材,故结论表明新教材 实验有成效。实验有成效。 平均数差异的显著性检验(平均数差异的显著性检验(t检验)检验) 3、其它检验公式、其它检验公式 如果是按同一组样本不同情况的测试所得的平均值如果是按同一组样本不同情况的测试所得的平均值 1和和 2 来检验平均值的差异程度,其计算公式为:来检验平均值的差异程度,其计算公式为: XX )1( /)( 22 21 - -
56、 - = NN NDD XX t 式中,式中,D为两次测试中每对分数之差即为两次测试中每对分数之差即D=X2X1。 对于两个独立的正态总体,如果已知两总体方差相等但未知总体方对于两个独立的正态总体,如果已知两总体方差相等但未知总体方 差具体数值,从中各抽取一随机样本,两样本平均数之差将服从自由度差具体数值,从中各抽取一随机样本,两样本平均数之差将服从自由度 为为 的的t 分布。分布。 其检验统计量的计算公式其检验统计量的计算公式 实验设计简述实验设计简述 实验设计:实验者为了揭示实验中的自变量与因变量的实验设计:实验者为了揭示实验中的自变量与因变量的 关系,在实验之前所作的实验计划,通常指实验
57、程序的关系,在实验之前所作的实验计划,通常指实验程序的 计划和安排。而实验程序的计划和安排离不开统计、检计划和安排。而实验程序的计划和安排离不开统计、检 验。验。 实验设计的内容:包括怎样选择被试(实验对象),实验设计的内容:包括怎样选择被试(实验对象), 控制那些因素,指出什么假设,观察那些内容,如何控制那些因素,指出什么假设,观察那些内容,如何 安排实验步骤,采取何种统计方法来处理和分析实验安排实验步骤,采取何种统计方法来处理和分析实验 结果等等。结果等等。 例:控制变量例:控制变量 指示语指示语 (一)目的:通过把指示语作为自变量,观察被试对反应变量的不同影响,从而了解到不是以指(一)目
58、的:通过把指示语作为自变量,观察被试对反应变量的不同影响,从而了解到不是以指 示语为自变量的实验中控制指示语的重要性。示语为自变量的实验中控制指示语的重要性。 (二)材料:数学试卷一份,马表。(二)材料:数学试卷一份,马表。 (三)程序:(三)程序:1按全班被试的数学程度,分为数学能力相同的甲、乙两组。按全班被试的数学程度,分为数学能力相同的甲、乙两组。 2主试仅向甲组被试着重指出:你们在运算时必须注意试题主试仅向甲组被试着重指出:你们在运算时必须注意试题 中数字之间的关系,余内容两者相同。中数字之间的关系,余内容两者相同。 3主试说明实验要求,发给各被试试题一张,覆置桌上。主试发主试说明实验
59、要求,发给各被试试题一张,覆置桌上。主试发“预备预备”口令口令 时,被试把题纸翻转正面,写好姓名等项,主试发时,被试把题纸翻转正面,写好姓名等项,主试发“开始开始”口令时,同时开口令时,同时开 动马表,被试答题。动马表,被试答题。 4被试做完题目,立即停笔并问得答题时间,记录在试题纸上。被试做完题目,立即停笔并问得答题时间,记录在试题纸上。 5全组做完,主试宣布答案,被试加以核对,并记录成绩,以便整理全组结果。全组做完,主试宣布答案,被试加以核对,并记录成绩,以便整理全组结果。 (四)结果:(四)结果:1统计甲乙两组的平均成绩(做对题数和做题的时间)统计甲乙两组的平均成绩(做对题数和做题的时间
60、) 2检验两组时间(或成绩)差异的显著性检验两组时间(或成绩)差异的显著性 (五)讨论:(五)讨论:1在本实验中,你是怎样发现题目的规律的在本实验中,你是怎样发现题目的规律的 2指导语在解题中所起作用如何指导语在解题中所起作用如何 实验设计简述实验设计简述 附:数学试题如下附:数学试题如下 姓名姓名组别组别时间时间 在下列各数列后的横线上,填写你认为应该填写的数字在下列各数列后的横线上,填写你认为应该填写的数字 (1)2 6 10 14 18 (2)3 12 48 192 768 (3)8 4 2 1 (4)31/4 8 33/4 (5)4 5 5 6 6 7 (6)3 8 13 18 23
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44075-2024纳米技术表面增强拉曼固相基片均匀性测量拉曼成像分析法
- GB/T 30102-2024塑料废弃物的回收和再利用指南
- 开发商与物业公司间物业管理服务协议(3篇)
- 短期合同工劳动协议(2024年修订版)2篇
- 设备安装及技术咨询合同
- 诚信招聘承诺保证书
- 质优砂砾销售合同
- 质量稳定承诺保证书
- 购物无忧的品质保证
- 购销合同中的跨界合作与拓展
- 企业财务会计电子教案 10存货核算4
- 定期体检 预防常见病 课件 2024-2025学年人教版(2024)初中体育与健康七年级全一册
- 现代服务业课件
- 生活饮用水、公共场所卫生管理系列国家强制性标准解读答案-2024年全国疾控系统“大学习”活动
- 教师成长案例数字赋能 创新教学 启智未来
- 2024-2030年中国海洋工程行业市场发展分析及前景趋势与投资前景研究报告
- 消化内科五年发展规划
- 多水源联合调度技术
- 2024市场场地租赁保证金合同范本
- 中学生网络安全教育主题班会
- 大班绘本阅读《小老鼠的探险日记》教案含反思
评论
0/150
提交评论