版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教育统计学本学期主要内容第一章 绪论 第二章 数据的初步整理第三章 集中量第四章 差异量第五章 概率极概率分布第六章 抽样分布及总体平均数的推断第七章 平均数差异的显著性检验第十章 检验第十一章 相关分析主要内容:1.1 统计学的发展史简介1.2 教育统计学的主要内容1.3 统计学中的基本概念1.4 学习教育统计学的方法第一章 绪论1.1.1 统计学的起源 第一阶段称之为“城邦政情” 阶段STATISTICS(统计学)一词源于法语STATUS(状态)自中世纪以来逐渐演变为含有政治意味的STATE(国家)。因此,统计学包含有对国家状态作调查研究的意义。概率论的起源与发展。概率论的发展最早源于赌博
2、 1654年:德.梅勒,帕斯卡,费马 (法国)惠更斯(C.Huygens )著论赌博中的计算 1.1 统计学的发展史简介1.1.2 统计学的应用 当今信息时代,无论社会政治、军事、经济,还是生物医学、教育心理、工农业生产等各行各业都有大量的数据,需要我们进行分析,从中挖掘出有用的证据、消除虚假的信息,发现事物内部的规律性。 案例1 非典中的统计问题北京血液中心高XX主任介绍:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。 -摘自2003.5.28用康复病人血浆治疗非典病人真有效吗?案例2 离婚案件 1949年,
3、西方某国家曾有过一个真实的故事。丈夫到法院要求离婚,唯一的理由是他去海外服兵役50个星期后,回家发现妻子在家分娩。 法官怎么样判案? 这桩诉讼案的统计学问题是如何判定正常最长妊娠期的时间。正常妊娠期的统计分布图法官判决法官根据医学界的证词,认定怀孕50周,尽管不大可能,但仍可能是科学事实,因此判丈夫败诉。 在这桩诉讼案中,统计学依据和其它法庭证据一样,只能为法官判案提供参考,不能成为唯一的判决依据。 2000年,法国政府已将统计学列入二十一世纪影响法国社会发展的十个重大领域之一。2001年, 中国国家教育部为推进基础教育改革而推出新课程标准,将统计学纳入新的小学数学课程。要求小学生要“经历运用
4、数据描述信息、作出推理的过程,发展统计观念”。 教育调查研究流程提出问题确定调查内容确定调查范围进行调查收集、整理、分析数据资料得出结论。教育科学实验研究流程教育科学实验:提出问题界定确定研究范围假说实验收集、整理、分析数据资料得出结论。教育统计学的研究内容(1)提供各种统计方法的应用条件。(2)对统计计算的结果进行解释。1. 描述统计 对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。常用的描述统计方法:集中量、差异量、标准分数、相关量。 2. 推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证。在一定可靠程度上对总体分布特征进行估计、推测。这种统计方法成为推断
5、统计。3.实验设计 实验者为了揭示实验中自变量与因变量的关系,在实验前所制订的实验计划称为实验设计。 1.2.2 教育统计学的基本内容 资料收集描述统计推断统计概率论经常性资料调查数据实验数据历史资料测验数据统计图表集中量差异量相关量 Z 检验T 检验检验相关分析1.2.3 教育统计学的结构1.3 教育统计中几个基本概念。一 随即变量1 随机现象:具有以下三个特征:第一,一次实验有多种可能的结果,其所有可能的结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复实验。2 随即事件:随即现象的每一种结果叫做一个随即事件。3。随即变量:我们把能表示随现象各种结果的变量称
6、为随即变量。 三 统计量和参数参数:总体上的各种数字特征是参数 总体平均值总体标准差统计量:样本上的数字特征是统计量 样本平均值样本标准差x随机抽样 是根据随机原则来抽取样本单位 .简单随机抽样 方法:在抽样框中的每个单位都具有相同的被抽中的机会,每个容量相同的样本被抽中的机会也是相同的。 亦称为纯随机抽样抽取样本的方法:有放回抽样和无放回抽样。 适合:总体内部差异不是很大,规模也不大的情况 。四 抽样方法分层抽样 亦可称为类型抽样 方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。总体N样本n例如,对某校800个学生的品德情况进行了解,拟取40个学生作为样本
7、。800个学生学科成绩优(160人):良(320人):中(240人):差(80人):然后从各部分随机抽样。整群抽样 方法:首先把总体中的N个单位划分成为若干个群,并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查研究。 总体群数R=16 样本群数r=4 样本容量ABCDEFGHIJKLMNOPLHPD适合:比简单随机抽样的方法能节约更多的成本,特别当总体的分布地域非常辽阔 时。思想观念+学习方法1.4 学习教育统计学的方法1)思想观念教育统计学不神秘,不可怕,不难学好。教育统计学既很有用,也很有趣。中学教师专业成长过程中必须开展教学研究(论文)2)学习
8、方法 2) 重视典型案例的系统学习重点掌握 : 基本概念、各种方法使用条件、范围3) 重视理论与课后练习相结合第二章 数据的初步整理21 数据的来源及种类22 统计表 23 统计图21 数据的来源及种类1 经常性资料2 专题性资料 (1) 教育调查 : 现情调查、回顾调查和跟踪调查(2) 教育实验 : 单组实验 、等组实验二 数据的种类1.按数据的来源分: 点计数据和测量数据2.按随即变量的取值分:间断型随机变量和连续型随即变量 2.2.1 表的基本结构标题表号标目(横标目、纵标目)线条(三栏一竖)数字(表的主要内容)表注22 统计表1. 简单表只列出观察对象的名称、地点、时序或统计指标名称的
9、统计表为简单表。 表2.2 某年级各班学生人数 班别一班二班三班四班五班人数表2.3 某校高三学生各年高考录取人数 年份199819992000总和高考录取人数1441231253922.2.2 统计表的种类2. 分组表只按一个标志分组的统计表成为分组表。 表2.5 上海市区幼儿20米跑步用时 年龄组岁岁岁岁平均秒数().3. 复合表按两个或两个以上标志分组的统计表为复合表 。表2.6 本市市区、郊区4岁和6岁幼儿守恒能力测定成绩统计表 nS岁市区.郊区.岁市区.郊区.2.3.3.1 概念1. 频数某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。2. 频数分布将各种随机事件在n次试
10、验中出现的次数分布,称为频数分布。 3. 频数分布表 频数分布用表格形式表达出来,这种表格叫频数分布表。2.3.3 频数分布表列法例2.1 师大附小二年级80个学生的身高如下表,并用该数据做频数分布表。表2.9 师大附小二年级80个学生的身高13513412913313113113113412512813512712713313013213212912413212212412713113713213313412412813513313112311513213413812413212813612712012513113612712412912913213812513112012114412813
11、31281271301201211221271211251301401211261301221281271251271312.3.3.2 连续变量频数分布表的编制1. 求全距 全部数据的最大值与最小值之差例:R =最大值最小值 =144115=29(cm)2. 决定组数与组距 组数(k):分组的个数(一般1015为宜),具体根据样本大小来确定组数,组数的确定要与组距同时考虑。例题中决定组数为10。上例: i= 3. 决定组限每组的最低值为下限,最高值为上限,列出各组组限时,最低一组应包括最小的一个数据,最高一组应包括最大的一个数据。4. 登记频数并计算用划“正”字法。将数据列入相应的组距内,在
12、归组时如遇有的数据正好等于某组的组限时,可将它归入数据较大的一组。5. 计算频数 全部数据登记完后,把各组次数写在频数分布表内,用“f”表示。表2.10 二年级80个学生身高的频数身高(1)组中值(2)频数(3)115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.513810201912421总和801.区分几个概念组中值频数(绝对频数)(f)相对频数(比率)(rf)累积(绝对)频数(cf)累积相对频数(Rel cf)2.3.3.3 制作累积频数和累积百分比分布表表2.
13、10 二年级80个学生身高的频数、累积频数、累积百分比表身高组中值频数相对频数累积频数累积百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.513810201912421.0125.3750.1000.1250.2500.2375.1500.0500.0250.01251412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100总和802. 累积频数和累积百分比分布表2.3.1 表示间断变量的统
14、计图1. 直条图是利用条形的长短比较各种统计指标的大小。绘制手续简便、表现形式明确、图形效果良好。纵排柱形图横排带形图23 统计图图2.1 大学生和高中生对化学课程的不满意率(2001年)绘制直条图注意点:图形的尺度必须以零点为起点,同时尺度上的任何单位必须用相等距离表示。条形的长短表示数量的多少。各条形的宽度必须相等,各条形之间的间隔应一致,一般为条形宽度的一半至一倍比较合适。各条形的排列应有一定的顺序。直条的顶端和下端不要注写数字。在复合条形图和条形结构图中应采用不同的线纹或颜色加以区别并加制图说明。2圆形图圆形图的定义是一种经常用来说明总体结构的图形。一个圆形代表一个完整的总体,圆形内的
15、各个扇形相当于总体的各个组成部分。绘制步骤求各组成部分所占百分比求组成部分的中心角度数以圆的下半径(或上半径)为基线,按被比事物特定顺序,根据各部分的角度数,以顺时针方向,用量角器将图形分成几个扇形。用不同线条或不同颜色将各扇形加以区别,并在各扇形内用简要文字及百分比加以注明。例2.2 将下表11 的资料制成图2表2.11 某区幼儿园家长文化程度统计表文化程度百分比圆心角初中以下初中高中、中专大专以上40.2%40.8%15.9%3.1%144.72146.88 57.24 11.16 图2.2:某区幼儿园家长文化程度统计图1线形图定义表示两个变量之间的函数关系。一种事物随另一种事物变化的情况
16、;某种事物随时间推移的发展趋势等。绘制方法先画一条直角坐标系,横轴表示时间或自变量,纵轴表示频数或因变量。描点:用直线连接相邻两点。(按时间顺序连成线条即成)2.3.2 表示连续变量的统计图表2.12 建国以来某地区幼儿园人数统计表年份人数(万)解放前495153552.03.54.04.56.0图2.3:建国以来,某地区幼儿园人数发展统计图1.线形图注意点:绘折线,不画光滑曲线图中相比较的线一般不超过五条,图中不用文字或数字表示。常用的频数分布图有:直方图多边图累积多边图2. 频数分布图表2.13 二年级80个学生身高的频数、累积频数、累积百分比身高组中值频数累积频数累积百分比115-118
17、-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100总和80直方图用面积表示频数分布,用各组上下限的矩形面积表示各组的频数作横轴:把上表第(1)列的上、下限或第(2)列的组中值分置于横轴上。表上共有10个组,而作图时,须在横轴的两端至少各空出一个组距的位置。作纵轴:在纵轴上表明尺度及其单位,以指示频数。在纵轴上定出各组频数高度,
18、并在各组频数高度处划一横线与各组上、下限的两条纵线相交,形成一个矩形。由于横轴上各组距之间是连续的,故各矩形之间不能留空隙。甚至每个矩形的内侧垂线也可以不画图2.5: 二年级80个学生身高的频数分布直方图特点:以纵轴上的高度表示频数的多少。绘制:以各组的中点为横坐标,以各组的频数为纵坐标描点并用直线连接,即成。图形的两端应该引至外侧一组的中点与基线相接。图2.6:二年级80个学生身高的频数分布多边图多边图图2.7:二年级80个学生身高的频数分布多边图累积频数多边图的绘制:作横轴将学生身高各组的上、下限分置于横轴上。作纵轴在纵轴上标明尺度与单位,以指示累积频数。描点以各组上限为横坐标,各组累积频
19、数为纵坐标描点,用弧线连接每相邻的两点,即成累积频数多变图,图形左端应引至第一组的下限与基线相接。累积频数和累积百分比多边图表2.14 二年级80个学生身高的频数、累积频数、累积百分比表例图2.8:二年级80个学生身高的累积频数和累积百分比分布图身高组中值频数累积频数累积百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.259
20、8.75100总和80因为累积频数和累积百分比图形都成“S”形,所以统称为“S”型曲线。S型曲线特殊应用是:假如给出横轴上一个分值,我们可以找出其百分位置。成绩组中值甲组乙组2022.5312527.51143032.56203537.510194042.518214547.521215052.529145557.528136062.54056567.53147072.53227577.51908082.51408587.51009092.540总计266134练习:把下列甲乙两组学生化学成绩的分布制在同一直角坐标上,以资比较3.1 算术平均数3.2 中位数 3.3 众数第三章 集中量集中量是
21、代表一组数据典型水平或集中趋势的量。集中量的作用:利用集中量数可以对各个总体(或各个样本)进行比较。集中量的种类:平均数 ; 中位数(Md) ; 众数(Mo) 集中量的概念及作用1、概念算术平均数通常称平均数,统计上简称均值或均数,是最重要的集中量数,常用 代表总体平均数, 代表样本平均数。2公式:( 算术平均数= )其中: =总和 X=各观察值 N=观察值的个数3.1.1 算术平均数概念3.1 算术平均数1. 原始数据计算法例:某幼儿园大班幼儿10名,在某次计算练习中成绩分别为9,6,8,9,7,6,8,9,7,7。试计算这些幼儿的计算练习的平均成绩。3.1.2 算术平均数计算解:公式: 其
22、中: 表示各组组中值与频数乘积之和 表示频数总和( =N)2. 频数分布表计算法(组中值计算法) 例:表3.1 48个学生数学分数算术平均数组中值计算算术平均数是最好的集中量数,因为它具备一个良好的集中量所应具备的条件。(1)优点:反应灵敏:一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小。严密确定:由同一组数据计算出来的平均数是同一个值。计算简便:只需四则运算。受抽样变动的影响较小。是计算方差、标准差、相关系数以及推断统计的基础。(2) 缺点:易受两极端数值的影响(只要一个极低值, 就会下降,反之则上升)。一组数据中某个数值模糊或不确切,就无法计算其 。3.1
23、.2 算术平均数的应用及其特点中位数是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。中位数普遍用符号Md表示,在中位数前后所包含数据的次数各为50%,即50%的分数在它上面,50%的分数在它下面。3.2.1 中位数概念3.2中位数(Md)1. 原始数据计算方法将原始数据依大小顺序排列后,如总频数是奇数,就以位于中央的数据作为Md。例: 有以下7个数据,依次从小到大排列:3、5、7、8、9、11、14因为数据个数为奇数,则位于中间的数值8就是中位数即: Md=83.2.2 中位数计算方法2. 频数分布表计算法如总频数为偶数,则以最中间的的两个数据的算术平均
24、数为中位数例:有以下8个数据,依次从小到大排列 6,9,10,11,12,14,13,17 Md= 计算公式:Md=Lmd+( n1) (由小向大计算) 在这里 Lmd表示中位数所在组的下限N表示总额数n1表示小于中位数所在组下限的频数总和i表示额数分布表上的组距fmd表示中位数所在组的频数计算步骤:求 确定中位数所在组 由上往下(或由下往上)累积频数,直至略大于 为止,该组就是中位数所在组。确定由中位数所在组取多少个频数,就能使由上往下(或下往上的积累频数等于 ,即求 n1,n1为小于中位数所在组下限的频数总和)本例中 n1= -23=1计算中位数所在组所取频数的距离即求( n1) fmd是
25、中位数所在组的频数i=组距本例:( ) =0.71将以上求得的结果与中位数所在组的下限相加便是中位数Md=L+( n1) (由上往下数的频数)=80+( -23) =80.71另: Md=U-( - n2) (由下往上数的频数) U表示中位数所在组的上限 n2表示大于中位数所在组上限的频数总和本例 Md=85-( ) =85- =80.71注意点: 由上往下计算Md时,当小于某一组下限的累积频数正好等于总频数的一半,那么,该组的下限是中位数。 由下往上计算Md时,大于某一组上限的累积频数正好等于 ,那么,该组的上限就是中位数。 中位数是百分位数中的特例。在同一数据中按次序位于某一百分位置的数值
26、, 百分位数一般用(Pp)表示。例:第70百分位数,记作(P70),就是在依次从小到大排列的一组数据中小于 这个数值的有70个频数, 大于 这个数值有30个频数的那个数值。中位数(Md)就是第50百分位数, 小于它有50个频数, 大于它也有50个频数,它是百分位数中的特例。3.2.3.1百分位数概念3.2.3百分位数(Pp)在频数分布表上可以用内插法计算某个百分位数,其计算公式为:Pp = Lp + (p*N - n) 在这里: Pp表示百分位数 p表示与百分位数相对应的比数 N表示总频数 Lp表示百分位数所在组的下限 n表示小于百分位数所在组下限的频数总和 fp表示百分位数所在组的频数。 i
27、表示组距。3.2.3.2 百分位数的计算方法表17:48个学生数学分数百分位数计算表3.3.1 众数的概念是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。理论众数:是指与频数分布曲线最高点相对应的横坐标上的一 点。粗略众数:是指一组数据中频数出现最多的那个数。3.3. 众数(Mo)1、用观察法直接寻找粗略众数在一组原始数据中,频数出现最多的那个数值就是众数。在一组原始数据2、4、3、6、4、5、4其中频数出现最多的数值是4,4就是这组数据的众数。在频数分布表中,频数最多一组的组中值就是粗略众数3.3.2 众数的计算方法2、用公式求理论众数的近似值(p38)公式:Mo 3Md-2 返
28、回第四章 差异量4.1 差异量的概念4.2 全距R4.3 方差和标准差4.4 差异系数1、概念表示一组数据变异程度或离散程度的量称为差异量。现有A、B、C三组测验成绩如下:A组:8、8、9、10、11、12、12 ( 10 )B组:5、6、8、10、12、14、15 (10 )C组:1、2、5、10、15、18、19 (10 ) 4.1 差异量的概念差异量越大,表示数据分布的范围越广,越不整齐。差异量越小,表示数据分布越集中,变动范围越小。常用的差异量指标有全距、方差、标准差、差异系数等2、特点3、种类1概念:一组数据中最大值与最小值之差,又称极差。(用符号R表示。)2计算:(1) 原始 数据
29、求全距(R)最大值最小值例:两组学生某科测验分数分别为: 甲组:54、63、72、74、82、88、99、 乙组:67、71、73、76、79、82、84、4.2 全距3. 频数分布表求全距:最大一组与最小一组组中值之差(或)最大一组与最小一组下限之差。表: 小学两年级80个学生身高的全距计算表身高(1) 组中值(2)频数(3)累积频数(4)计算全距(5)115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.51381020191242114122242617377798
30、0R143.5116.5=27或者R=142115=27总和804全距的优缺点:优点:概念清楚,意义明确,计算简便。缺点:易受两个极端的数值影响。4.3.1方差:方差是指离差平方的算术平均数。样本方差用 表示。 表示总体方差4.3. 2 计算公式 在这里: X 表示离差即每个数据与平均数的差数 表示离差平方和 N表示总频数4.3 方差和标准差4.3.3标准差标准差就是离差平方和平均后的方根。样本标准差用 x 表示,总体标准差用表示4.3.4 计算公式1. 原始数据计算法: 实例:在某幼儿园大班中,随机抽取21名幼儿,分成甲、乙、丙三 组,每组7人,进行看图讲述比赛,他们的成绩分别为:甲组:9、
31、9、10、11、 12、13、13乙组:6、7、 9、 11、 13、15、16丙组:2、3、 6、 11、 16、19、20试求三组幼儿看图讲述成绩的标准差 三组幼儿成绩的标准差。 甲组: x =1.6 乙组: x =3.6 丙组: x =7.0 答:甲、乙、丙三组幼儿园看图讲故事成绩的标准差分别为1.6、3.6、和7.0解: 三组幼儿成绩的平均数: 11; 11; 11离散程度(S)说明甲组111.6集中(小)数据都集中在 附近代表性好乙组113.6(居中)一般丙组117.0最分散(大)各数据分布广代表性较差 2. 频数分布表计算法(用于数据较多的分组资料) 公式: 其中: X表示各组组中值 表示各组频数 N表示总人数 例:表20:48个学生数学分数方差、标准差的组中值计算表57.5分组(1)组中值X(2)频数f(3)fx(4)=(2 ) (3) (5)=(2) (4)利用公式计算方差、标准差 50-52.5252.52 2 =12.2555-57.5057.50 060-62.5262.52 265-67.5367.53 370-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育心理学能力提升试卷A卷附答案
- 2024年度山西省高校教师资格证之高等教育法规模拟考核试卷含答案
- 2024年度年福建省高校教师资格证之高等教育学测试卷(含答案)
- 2024年现场总线计算机通讯模板项目资金需求报告代可行性研究报告
- 四年级数学(简便运算)计算题专项练习与答案
- 终身教育视角下职业教育提质培优路径探析
- 2024年商品买卖协议模板2
- 2024年工程监理外部合作协议
- 2024年专业有机肥购销协议详细样本
- 2024年真石漆外墙施工协议
- 北京市道德与法治初一上学期期中试卷及答案指导(2024年)
- 高校实验室安全基础学习通超星期末考试答案章节答案2024年
- 四川省绵阳市高中2025届高三一诊考试物理试卷含解析
- 渣土车辆驾驶员管理制度
- 德力西系列变频器说明书
- 后疫情时代探索家校共育新模式维护学生心理健康
- 小学美术11-身边的伙伴ppt课件
- 铁合金生产工艺
- 焦化厂生产工序及工艺流程图
- 汽车排放控制系统的检修
- 《新能源》题库(试题及答案29个)
评论
0/150
提交评论