




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,教育统计学本学期主要内容,.,第一章绪论,第二章数据的初步整理,第三章集中量,第四章差异量,第五章概率极概率分布,第六章抽样分布及总体平均数的推断,.,第七章平均数差异的显著性检验,第十章检验,第十一章相关分析,.,主要内容:1.1统计学的发展史简介1.2教育统计学的主要内容1.3统计学中的基本概念1.4学习教育统计学的方法,第一章绪论,.,1.1.1统计学的起源第一阶段称之为“城邦政情”阶段STATISTICS(统计学)一词源于法语STATUS(状态)自中世纪以来逐渐演变为含有政治意味的STATE(国家)。因此,统计学包含有对国家状态作调查研究的意义。概率论的起源与发展。概率论的发展最早
2、源于赌博1654年:德.梅勒,帕斯卡,费马(法国)惠更斯(C.Huygens)著论赌博中的计算,1.1统计学的发展史简介,.,第二阶段称之为“政治算数”阶段十七世纪,政治算术统计学在英国兴起。1690年英国威廉配弟出版(政治算数)一书作为这个阶段的起始标志.K.Pearson(18571936),在前人的基础上发展出许多描述统计方法:频数分布、频数分布函数、标准差、相关等。第三阶段称之为“统计分析科学”阶段W.S.Gorsset(戈赛特)(Student)开始研究t分布R.A.Fisher(费希尔)统计推断学的创立F分布,.,1.1.2统计学的应用,当今信息时代,无论社会政治、军事、经济,还是
3、生物医学、教育心理、工农业生产等各行各业都有大量的数据,需要我们进行分析,从中挖掘出有用的证据、消除虚假的信息,发现事物内部的规律性。,.,案例1非典中的统计问题,北京血液中心高XX主任介绍:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。-摘自2003.5.28用康复病人血浆治疗非典病人真有效吗?,.,应用统计分析,进行卡方()检验,很快得出结论:P=0.23080.05.经过统计分析,认为两组差别无统计意义。现在实事也不支持原研究者的用康复病人血浆治疗非典病人结论。,.,案例2离婚案件,1949年,西方某国家
4、曾有过一个真实的故事。丈夫到法院要求离婚,唯一的理由是他去海外服兵役50个星期后,回家发现妻子在家分娩。,法官怎么样判案?,.,这桩诉讼案的统计学问题是如何判定正常最长妊娠期的时间。正常妊娠期的统计分布图,.,.,正常妊娠期超过48周的频率几乎为零。大部分人会觉得丈夫蒙受了不白之冤,如果当时法官仅通过正常妊娠期分布,会判丈夫胜诉。此时,妻子可能蒙冤,虽然其蒙冤的可能性很小。,.,法官判决,法官根据医学界的证词,认定怀孕50周,尽管不大可能,但仍可能是科学事实,因此判丈夫败诉。,在这桩诉讼案中,统计学依据和其它法庭证据一样,只能为法官判案提供参考,不能成为唯一的判决依据。,.,2000年,法国政
5、府已将统计学列入二十一世纪影响法国社会发展的十个重大领域之一。2001年,中国国家教育部为推进基础教育改革而推出新课程标准,将统计学纳入新的小学数学课程。要求小学生要“经历运用数据描述信息、作出推理的过程,发展统计观念”。,.,1.2.1统计学与教育统计学1.统计学统计学是研究统计原理和方法的科学。具体:是研究如何搜集、整理、分析反映事物总体的数字资料,并以此为依据,对总体特征进行推断的原理和方法。2.教育统计学教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。主要任务:研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在
6、教育现象中的客观规律。,1.2教育统计学的主要内容,.,教育调查研究流程,提出问题确定调查内容确定调查范围进行调查收集、整理、分析数据资料得出结论。,.,教育科学实验研究流程,教育科学实验:提出问题界定确定研究范围假说实验收集、整理、分析数据资料得出结论。,.,教育统计学的研究内容,(1)提供各种统计方法的应用条件。(2)对统计计算的结果进行解释。,.,1.描述统计对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。常用的描述统计方法:集中量、差异量、标准分数、相关量。2.推断统计根据样本所提供的信息,运用概率的理论进行分析、论证。在一定可靠程度上对总体分布特征进行估计、推测
7、。这种统计方法成为推断统计。3.实验设计实验者为了揭示实验中自变量与因变量的关系,在实验前所制订的实验计划称为实验设计。,1.2.2教育统计学的基本内容,.,资料收集,经常性资料调查数据实验数据历史资料测验数据,统计图表集中量差异量相关量,Z检验T检验检验相关分析,1.2.3教育统计学的结构,.,1.3教育统计中几个基本概念。,一随即变量1随机现象:具有以下三个特征:第一,一次实验有多种可能的结果,其所有可能的结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复实验。2随即事件:随即现象的每一种结果叫做一个随即事件。3。随即变量:我们把能表示随现象各种结果的变量称
8、为随即变量。,.,所研究的具有某些相同性质的全部单位或事件的整体。,总体,无限总体:含无限多个单位。,范围,有限总体:含有限个单位。,样本:亦可称为抽样总体,是从总体中抽取部分单位所组成的整体,用以分析总体。样本中包含个体的数目成为样本的容量,用n表示,二总体和样本,.,三统计量和参数,参数:总体上的各种数字特征是参数总体平均值总体标准差统计量:样本上的数字特征是统计量样本平均值样本标准差x,.,随机抽样,是根据随机原则来抽取样本单位.,简单随机抽样,方法:在抽样框中的每个单位都具有相同的被抽中的机会,每个容量相同的样本被抽中的机会也是相同的。,亦称为纯随机抽样,抽取样本的方法:有放回抽样和无
9、放回抽样。,适合:总体内部差异不是很大,规模也不大的情况。,四抽样方法,.,机械抽样,方法:抽样框中的N个单位被分成k个系统,k等于抽样框的容量N除以所需的样本容量n,在抽样框中前面的k个个体或单位中随机抽出第一个样本单位,然后,可在其后的每隔k个单位抽取样本中其余的部分。,亦可称为等距抽样,例如:从我校10级3000名新生中随机抽取300人了解其英语学习水平。,.,分层抽样,亦可称为类型抽样,方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。,总体N,样本n,.,例如,对某校800个学生的品德情况进行了解,拟取40个学生作为样本。800个学生学科成绩优(16
10、0人):良(320人):中(240人):差(80人):然后从各部分随机抽样。,.,整群抽样,方法:首先把总体中的N个单位划分成为若干个群,并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查研究。,总体群数R=16样本群数r=4样本容量,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,.,适合:比简单随机抽样的方法能节约更多的成本,特别当总体的分布地域非常辽阔时。,.,思想观念+学习方法,1.4学习教育统计学的方法,.,1)思想观念,教育统计学不神秘,不可怕,不难学好。教育统计学既很有用,也很有趣。中学教师专业成长过程中必
11、须开展教学研究(论文),.,2)学习方法,2)重视典型案例的系统学习,重点掌握:基本概念、各种方法使用条件、范围,3)重视理论与课后练习相结合,.,第二章数据的初步整理,21数据的来源及种类22统计表23统计图,.,21数据的来源及种类,1经常性资料2专题性资料(1)教育调查:现情调查、回顾调查和跟踪调查(2)教育实验:单组实验、等组实验二数据的种类1.按数据的来源分:点计数据和测量数据2.按随即变量的取值分:间断型随机变量和连续型随即变量,.,2.2.1表的基本结构标题表号标目(横标目、纵标目)线条(三栏一竖)数字(表的主要内容)表注,22统计表,.,1.简单表,只列出观察对象的名称、地点、
12、时序或统计指标名称的统计表为简单表。,表2.2某年级各班学生人数,表2.3某校高三学生各年高考录取人数,2.2.2统计表的种类,.,2.分组表,只按一个标志分组的统计表成为分组表。,表2.5上海市区幼儿20米跑步用时,3.复合表,按两个或两个以上标志分组的统计表为复合表。,表2.6本市市区、郊区4岁和6岁幼儿守恒能力测定成绩统计表,.,2.3.3.1概念1.频数某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。2.频数分布将各种随机事件在n次试验中出现的次数分布,称为频数分布。3.频数分布表频数分布用表格形式表达出来,这种表格叫频数分布表。,2.3.3频数分布表列法,.,例2.1师大
13、附小二年级80个学生的身高如下表,并用该数据做频数分布表。表2.9师大附小二年级80个学生的身高,2.3.3.2连续变量频数分布表的编制,.,1.求全距全部数据的最大值与最小值之差例:R=最大值最小值=144115=29(cm)2.决定组数与组距组数(k):分组的个数(一般1015为宜),具体根据样本大小来确定组数,组数的确定要与组距同时考虑。例题中决定组数为10。上例:i=3.决定组限每组的最低值为下限,最高值为上限,列出各组组限时,最低一组应包括最小的一个数据,最高一组应包括最大的一个数据。,.,4.登记频数并计算用划“正”字法。将数据列入相应的组距内,在归组时如遇有的数据正好等于某组的组
14、限时,可将它归入数据较大的一组。5.计算频数全部数据登记完后,把各组次数写在频数分布表内,用“f”表示。,.,表2.10二年级80个学生身高的频数,.,1.区分几个概念组中值频数(绝对频数)(f)相对频数(比率)(rf)累积(绝对)频数(cf)累积相对频数(Relcf),2.3.3.3制作累积频数和累积百分比分布表,.,表2.10二年级80个学生身高的频数、累积频数、累积百分比表,2.累积频数和累积百分比分布表,.,2.3.1表示间断变量的统计图1.直条图是利用条形的长短比较各种统计指标的大小。绘制手续简便、表现形式明确、图形效果良好。纵排柱形图横排带形图,23统计图,.,图2.1大学生和高中
15、生对化学课程的不满意率(2001年),.,绘制直条图注意点:图形的尺度必须以零点为起点,同时尺度上的任何单位必须用相等距离表示。条形的长短表示数量的多少。各条形的宽度必须相等,各条形之间的间隔应一致,一般为条形宽度的一半至一倍比较合适。各条形的排列应有一定的顺序。直条的顶端和下端不要注写数字。在复合条形图和条形结构图中应采用不同的线纹或颜色加以区别并加制图说明。,.,2圆形图圆形图的定义是一种经常用来说明总体结构的图形。一个圆形代表一个完整的总体,圆形内的各个扇形相当于总体的各个组成部分。绘制步骤求各组成部分所占百分比求组成部分的中心角度数以圆的下半径(或上半径)为基线,按被比事物特定顺序,根
16、据各部分的角度数,以顺时针方向,用量角器将图形分成几个扇形。用不同线条或不同颜色将各扇形加以区别,并在各扇形内用简要文字及百分比加以注明。,.,例2.2将下表11的资料制成图2,表2.11某区幼儿园家长文化程度统计表,图2.2:某区幼儿园家长文化程度统计图,.,1线形图,定义,表示两个变量之间的函数关系。一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。,绘制方法,先画一条直角坐标系,横轴表示时间或自变量,纵轴表示频数或因变量。描点:用直线连接相邻两点。(按时间顺序连成线条即成),2.3.2表示连续变量的统计图,.,表2.12建国以来某地区幼儿园人数统计表,图2.3:建国以来,某
17、地区幼儿园人数发展统计图,1.线形图,.,注意点:,绘折线,不画光滑曲线图中相比较的线一般不超过五条,图中不用文字或数字表示。,.,常用的频数分布图有:直方图多边图累积多边图,2.频数分布图,.,表2.13二年级80个学生身高的频数、累积频数、累积百分比,直方图用面积表示频数分布,用各组上下限的矩形面积表示各组的频数,.,作横轴:把上表第(1)列的上、下限或第(2)列的组中值分置于横轴上。表上共有10个组,而作图时,须在横轴的两端至少各空出一个组距的位置。作纵轴:在纵轴上表明尺度及其单位,以指示频数。在纵轴上定出各组频数高度,并在各组频数高度处划一横线与各组上、下限的两条纵线相交,形成一个矩形
18、。由于横轴上各组距之间是连续的,故各矩形之间不能留空隙。甚至每个矩形的内侧垂线也可以不画,.,.,图2.5:二年级80个学生身高的频数分布直方图,.,特点:以纵轴上的高度表示频数的多少。绘制:以各组的中点为横坐标,以各组的频数为纵坐标描点并用直线连接,即成。图形的两端应该引至外侧一组的中点与基线相接。,图2.6:二年级80个学生身高的频数分布多边图,多边图,.,图2.7:二年级80个学生身高的频数分布多边图,.,累积频数多边图的绘制:,作横轴将学生身高各组的上、下限分置于横轴上。作纵轴在纵轴上标明尺度与单位,以指示累积频数。描点以各组上限为横坐标,各组累积频数为纵坐标描点,用弧线连接每相邻的两
19、点,即成累积频数多变图,图形左端应引至第一组的下限与基线相接。,累积频数和累积百分比多边图,.,表2.14二年级80个学生身高的频数、累积频数、累积百分比表,例图2.8:二年级80个学生身高的累积频数和累积百分比分布图,.,.,因为累积频数和累积百分比图形都成“S”形,所以统称为“S”型曲线。,S型曲线特殊应用是:,假如给出横轴上一个分值,我们可以找出其百分位置。,.,练习:把下列甲乙两组学生化学成绩的分布制在同一直角坐标上,以资比较,.,3.1算术平均数3.2中位数3.3众数,第三章集中量,.,集中量是代表一组数据典型水平或集中趋势的量。,集中量的作用:,利用集中量数可以对各个总体(或各个样
20、本)进行比较。,集中量的种类:,平均数;中位数(Md);众数(Mo),集中量的概念及作用,.,1、概念,算术平均数通常称平均数,统计上简称均值或均数,是最重要的集中量数,常用代表总体平均数,代表样本平均数。,2公式:,(算术平均数=),其中:=总和X=各观察值N=观察值的个数,3.1.1算术平均数概念,3.1算术平均数,.,1.原始数据计算法,例:某幼儿园大班幼儿10名,在某次计算练习中成绩分别为9,6,8,9,7,6,8,9,7,7。试计算这些幼儿的计算练习的平均成绩。,3.1.2算术平均数计算,解:,.,公式:,其中:表示各组组中值与频数乘积之和表示频数总和(=N),2.频数分布表计算法(
21、组中值计算法),.,例:表3.148个学生数学分数算术平均数组中值计算,.,算术平均数是最好的集中量数,因为它具备一个良好的集中量所应具备的条件。,(1)优点:,反应灵敏:一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小。严密确定:由同一组数据计算出来的平均数是同一个值。计算简便:只需四则运算。受抽样变动的影响较小。是计算方差、标准差、相关系数以及推断统计的基础。,(2)缺点:,易受两极端数值的影响(只要一个极低值,就会下降,反之则上升)。一组数据中某个数值模糊或不确切,就无法计算其。,3.1.2算术平均数的应用及其特点,.,中位数是位于依一定大小顺序排列的一组
22、数据中央位置的数值,大于及小于这一数值各有一半数据分布着。,中位数普遍用符号Md表示,在中位数前后所包含数据的次数各为50%,即50%的分数在它上面,50%的分数在它下面。,3.2.1中位数概念,3.2中位数(Md),.,1.原始数据计算方法,将原始数据依大小顺序排列后,如总频数是奇数,就以位于中央的数据作为Md。,例:有以下7个数据,依次从小到大排列:3、5、7、8、9、11、14因为数据个数为奇数,则位于中间的数值8就是中位数即:Md=8,3.2.2中位数计算方法,.,2.频数分布表计算法,如总频数为偶数,则以最中间的的两个数据的算术平均数为中位数例:有以下8个数据,依次从小到大排列6,9
23、,10,11,12,14,13,17Md=,.,.,计算公式:Md=Lmd+(n1)(由小向大计算),在这里Lmd表示中位数所在组的下限N表示总额数n1表示小于中位数所在组下限的频数总和i表示额数分布表上的组距fmd表示中位数所在组的频数,.,计算步骤:求确定中位数所在组由上往下(或由下往上)累积频数,直至略大于为止,该组就是中位数所在组。确定由中位数所在组取多少个频数,就能使由上往下(或下往上的积累频数等于,即求n1,n1为小于中位数所在组下限的频数总和)本例中n1=-23=1,.,计算中位数所在组所取频数的距离即求(n1)fmd是中位数所在组的频数i=组距本例:()=0.71,.,将以上求
24、得的结果与中位数所在组的下限相加便是中位数Md=L+(n1)(由上往下数的频数)=80+(-23)=80.71另:Md=U-(-n2)(由下往上数的频数)U表示中位数所在组的上限n2表示大于中位数所在组上限的频数总和本例Md=85-()=85-=80.71,.,注意点:由上往下计算Md时,当小于某一组下限的累积频数正好等于总频数的一半,那么,该组的下限是中位数。由下往上计算Md时,大于某一组上限的累积频数正好等于,那么,该组的上限就是中位数。中位数是百分位数中的特例。,.,在同一数据中按次序位于某一百分位置的数值,百分位数一般用(Pp)表示。,例:第70百分位数,记作(P70),就是在依次从小
25、到大排列的一组数据中小于这个数值的有70个频数,大于这个数值有30个频数的那个数值。中位数(Md)就是第50百分位数,小于它有50个频数,大于它也有50个频数,它是百分位数中的特例。,3.2.3.1百分位数概念,3.2.3百分位数(Pp),.,在频数分布表上可以用内插法计算某个百分位数,其计算公式为:,Pp=Lp+(p*N-n),在这里:Pp表示百分位数p表示与百分位数相对应的比数N表示总频数Lp表示百分位数所在组的下限n表示小于百分位数所在组下限的频数总和fp表示百分位数所在组的频数。i表示组距。,3.2.3.2百分位数的计算方法,.,表17:48个学生数学分数百分位数计算表,.,3.3.1
26、众数的概念是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。,理论众数:是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数:是指一组数据中频数出现最多的那个数。,3.3.众数(Mo),.,1、用观察法直接寻找粗略众数在一组原始数据中,频数出现最多的那个数值就是众数。在一组原始数据2、4、3、6、4、5、4其中频数出现最多的数值是4,4就是这组数据的众数。在频数分布表中,频数最多一组的组中值就是粗略众数,3.3.2众数的计算方法,.,2、用公式求理论众数的近似值(p38)公式:Mo3Md-2,返回,.,.,第四章差异量,4.1差异量的概念4.2全距R4.3方差和标准差4.4差异系
27、数,.,1、概念表示一组数据变异程度或离散程度的量称为差异量。,现有A、B、C三组测验成绩如下:A组:8、8、9、10、11、12、12(10)B组:5、6、8、10、12、14、15(10)C组:1、2、5、10、15、18、19(10),4.1差异量的概念,.,差异量越大,表示数据分布的范围越广,越不整齐。差异量越小,表示数据分布越集中,变动范围越小。,常用的差异量指标有全距、方差、标准差、差异系数等,2、特点,3、种类,.,1概念:,一组数据中最大值与最小值之差,又称极差。(用符号R表示。),2计算:,(1)原始数据求全距(R)最大值最小值,例:两组学生某科测验分数分别为:甲组:54、6
28、3、72、74、82、88、99、乙组:67、71、73、76、79、82、84、,4.2全距,.,3.频数分布表求全距:,最大一组与最小一组组中值之差(或)最大一组与最小一组下限之差。,表:小学两年级80个学生身高的全距计算表,.,4全距的优缺点:,优点:概念清楚,意义明确,计算简便。缺点:易受两个极端的数值影响。,.,4.3.2计算公式,在这里:X表示离差即每个数据与平均数的差数表示离差平方和N表示总频数,4.3方差和标准差,.,4.3.3标准差,标准差就是离差平方和平均后的方根。,样本标准差用x表示,总体标准差用表示,4.3.4计算公式,1.原始数据计算法:,.,实例:在某幼儿园大班中,
29、随机抽取21名幼儿,分成甲、乙、丙三组,每组7人,进行看图讲述比赛,他们的成绩分别为:甲组:9、9、10、11、12、13、13乙组:6、7、9、11、13、15、16丙组:2、3、6、11、16、19、20试求三组幼儿看图讲述成绩的标准差,.,三组幼儿成绩的标准差。甲组:x=1.6乙组:x=3.6丙组:x=7.0答:甲、乙、丙三组幼儿园看图讲故事成绩的标准差分别为1.6、3.6、和7.0,解:三组幼儿成绩的平均数:11;11;11,.,.,2.频数分布表计算法(用于数据较多的分组资料),公式:,其中:X表示各组组中值表示各组频数N表示总人数,.,例:,表20:48个学生数学分数方差、标准差的组中值计算表,57.5,f,52.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 装修施工合同协议
- 合同免责协议范本
- 保安劳动合同协议书首页
- 退房合同解除协议
- 私企转让协议合同
- 地板合同协议
- 堕胎协议合同照片
- 农家饭店合伙合同协议
- 商铺地下室建房合同协议
- 租赁合同解除协议百度
- 华为C语言通用编程规范
- GB/T 915-2010铋
- GB/T 20399-2006自然保护区总体规划技术规程
- 初中数学人教九年级上册第二十一章 一元二次方程 解一元二次方程之配方法PPT
- XX医院医疗信息系统安全三级等保建设可行性方案
- 苏教版数学二年级下册《数学绘本:公主殿下来的那一天》区级展示课(定稿)
- 执行力、心态管理培训课件
- (最新)信贷资产风险分类管理办法
- 五年级下册书法教学课件第9课-上下结构(二)-西泠印社版(共18张)课件
- 英雄无敌5使用秘籍与英雄代码
- 少儿绘画之《挂在树上的树懒》
评论
0/150
提交评论