![教育统计学教案_第1页](http://file4.renrendoc.com/view11/M01/18/39/wKhkGWXyUOaAM2NEAAKbaxJSdD4070.jpg)
![教育统计学教案_第2页](http://file4.renrendoc.com/view11/M01/18/39/wKhkGWXyUOaAM2NEAAKbaxJSdD40702.jpg)
![教育统计学教案_第3页](http://file4.renrendoc.com/view11/M01/18/39/wKhkGWXyUOaAM2NEAAKbaxJSdD40703.jpg)
![教育统计学教案_第4页](http://file4.renrendoc.com/view11/M01/18/39/wKhkGWXyUOaAM2NEAAKbaxJSdD40704.jpg)
![教育统计学教案_第5页](http://file4.renrendoc.com/view11/M01/18/39/wKhkGWXyUOaAM2NEAAKbaxJSdD40705.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论【教学目标】明确教育统计学的学科性质与用途,了解教育统计学的根本内容,理解一些根本概念。明确学习和应用统计方法应该注意的一些问题。【学习方法】了解与理解。【重点难点】教育统计学的性质及内容【讲义内容】第一节教育统计学的性质与用途一、教育统计学的研究对象与性质教育统计学是统计学的一个分支。统计学是从数量方面研究随机现象总体特征的理论与方法学科。统计学大致可分为两局部:一局部为数理统计学,它主要以概率论为根底,对反映事物特征的数量关系进行抽象,概括出统计数据分析的模型、一般原理和方法,侧重统计理论与方法的数理证明;一局部为应用统计学,即数理统计的原理与方法在自然和社会各领域中的应用,侧重统计理论与方法在各个实践领域中的应用,着重阐述各种统计方法的使用条件及统计结果的解释。心理与教育统计学是把数理统计的理论和方法应用到教育或心理学领域,研究教育或心理现象的一门应用统计学,它是我们正确认识教育或心理现象数量特征的重要工具。本课程的内容主要讲述各种根本的数理统计学理论,以及这些理论在心理学与教育学方面的应用。人们研究自然和社会各种现象,是为了正确认识各种事物或现象的特征与联系,了解现状及其开展的客观规律等,从而更好地顺应规律,取得改造自然、改造社会的最正确途径、方法和效果。同样,我们研究教育或心理问题,也是为了探索各种教育或心理现象的特征及其开展变化的规律性,认识各种教育和心理现象间以及其他现象的相互联系等,以便更好地提高教育效果和质量,开展教育理论,促进教育事业开展。统计研究主要使用数据来说话,离开了数据就不能称之为统计研究。辩证唯物主义告诉我们,任何事物或现象的存在、开展、变化都是质和量的统一。教育统计学的研究对象是教育问题,它是在质和量的辩证统一中着重从数量的角度去研究教育现象的开展变化,从而到达对其质的属性和规律的认识。它的主要任务是研究如何整理,分析由教育调查和实验等手段获得的大量数据,并以此了解教育现象的特征,探索教育现象的变化规律。因此,教育统计学是专门研究如何搜集、整理、分析在教育方面由实验或调查所获得的数字资料,并如何根据这些数字资料所传递的信息,进行科学推论找出客观规律的一门科学。它是应用数理统计学的一个分支,是心理与教育科学研究的科学工具。二、统计方法在教育领域中的作用〔一〕、教育统计是教育科学研究的工具无论是教育实验研究,还是教育管理工作,都要经常接触大量的具有随机性质的数字资料,如何充分利用这些数字资料所提供的信息,如何通过这些资料找出规律性的东西,得出科学的结论,用以指导教育工作,是摆在教育研究工作及教育管理部门的实际工作者面前的一个很重要的问题。如何设计教育方面的实验或调查,使所搜集的资料最能反映所欲研究的问题,使数据最有意义;采用什么方法对搜集到的这些随机变量进行整理、分析,使其所反映的信息得以最大的显现,实现对实验或调查结果的科学解释,找出事物的客观规律等等,都是教育统计研究的内容。教育科学的开展,离不开教育方面的科学实验,因为科学实验是根本的实践活动。教育方面的科学实验或调查,尽管是科学的实践活动,但它总是在一定的局部范围内进行,因而教育方面搜集的一些数字资料,一般总是由局部获得的,如何通过从局部得来的数据资料推论全局的情形,得出符合规律的科学结论,只有借助教育统计学所提供的科学方法才能实现,仅凭少数人的经验是不行的。作为一个科学工作者及实际工作者,要经常研读国内外有关心理和教育方面的研究报告和文献资料。而这些研究报告中大都用科学的方法——统计方法来说明、解释研究成果,可见不懂得心理与教育统计,就会看不懂他人的研究报告。另外,自己的科学实验结果也只有用科学的工具——统计学来说明、解释,才能做到科学的总结。可见统计知识的匮乏会严重影响学术交流,会有碍于心理和教育科学水平的提高,以及学科理论的开展,特别是在社会科学出现数学化、模型化、精密化这一趋势的当代,心理和教育科学研究的实验手段会得到更大开展,因此对统计方法的要求会更迫切,心理与教育方面许多问题的解决会更依赖于实验手段,而但凡实验,无论从实验的设计、控制及最后对观测数据的分析,都离不开心理与教育统计这一科学工具。〔二〕、学习教育统计有利于教育行政和管理工作者正确掌握情况,进行科学决策现代教育管理,要做到科学化,就要及时吸取教育科学及其他有关学科的研究成果。要认真总结教育教学工作的情况,要经常进行调查研究等等,这一切,只有在科学的统计学的帮助下才能做好。例如,在调查时如何取样,如何通过局部调查的结果去估计全局的情况,以及如何解释等等。有了统计方面的协助,就可解决,有了科学的方法会使工作事半功倍,使教育管理工作效率及科学化的水平提高。〔三〕、教育统计是教育评价不可缺少的工具教育评价是教育管理过程的重要环节,是提高教育质量,促进教育开展的科学手段。在教育工作中,经常要对学校的办学水平、管理工作、教育质量、教师课堂教学效果、学生学业成绩、学生学习环境等进行评价,以便发扬优点,克服缺乏,提高教育质量和效益。教育评价要求在客观测量的根底上进行价值判断。为此,在测量中就要科学准确地获得评价对象的定量、定性信息资料,对这些定性、定量的资料进行科学地统计分析,才能为价值判断提供依据。教育评价资料的获取、整理、解释乃至评价结果的质量分析,都离不开统计方法。〔四〕、学习教育统计学有利于训练科学的推理和思维方法统计学所使用的推理及思考问题的方法是科学研究中常用的方法,统计方法的训练也是一种科学方法的训练,学会科学地推理与思考方法,对未来从事研究工作是非常必要的。对任何事物都不能停留在纸用生动的事例来说明问题,简单地作出定性结论。由于任何事物的存在都是质和量的统一,对事物的分析也应定向和定量相结合,定向分析是定量分析的根底,定量分析是定性分析更加准确可靠,使人们对事物质的规律性认识更加深入全面。同时,也不能对事物进行简单的肯定或否认,因为许多外表上相反的事物并不都是绝对对立的,大多数事物在肯定的同时也有否认的成分,在否认的同时也有肯定的成分,这是统计推断中经常遇到的问题。统计学中使用的推理及思考方法,是科学研究中常用到的方法。统计研究是以大量数据并通过严密的逻辑推理去说明事物的本质,而不是靠个别事实。上述这些都说明,学习教育统计学,可以训练我们科学地推理和思考问题,克服思想方法上的片面性和绝对化,帮助我们学会科学地认识事物本质,这对我们教育科学研究和实践工作都是极其有益的。【小结】教育统计学是统计学的一个分支,以教育研究中的问题为研究对象,从量化的角度去探讨教育现象的本质和规律。教育统计学是专门研究如何搜集、整理、分析在教育方面由实验或调查所获得的数字资料,并如何根据这些数字资料所传递的信息,进行科学推论找出客观规律的一门科学。它是应用数理统计学的一个分支,是心理与教育科学研究的科学工具。教育统计学在教育研究中有十分重要的作用,首先教育统计是教育科学研究的工具;其次,学习教育统计有利于教育行政和管理工作者正确掌握情况,进行科学决策;第三,教育统计是教育评价不可缺少的工具;最后,学习教育统计学有利于训练科学的推理和思维方法。第二节教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类划分为不同的类别。假设依研究的问题实质来划分,可将其内容划分为:一、描述一件事物的性质;二、比拟两件事物之间的差异;三、分析影响事物变化的因素;四、一件事物两种不同属性之间的相互关系;五、取样方法等等。 如果依统计方法的功能进行分类,那么统计学可分为下述两种类别,这是由于数理统计的开展历史所决定的,也是最常见的分类方法。一、描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,简缩数据,进一步显示与描述一组数据的全貌。例如表示数据集中情况的特征数的计算与表示方法,像算术平均数、中数、众数、几何平均数、调和平均数等的计算方法与应用。表示数据分散情况的各种特征数的计算与表示方法,像平均差、标准差、变异系数与标准分数的计算方法及如何应用等。表示一个事物两种或两种以上性质之间关系情况的各种相关系数的计算及应用条件,还有描述数据分布特征的峰度及偏度系数的计算方法等等。研究这些统计方法在心理与教育科学中的应用,都属于描述统计学的内容。上述这些描述统计的方法,可用于只表示局部情形的一组数据,也可以用于全面调查或实验中所获得的表示整体情形的数据,它可使杂乱无章的数宇更好地显示事物的某些特征,有助于说明问题的实质。二、推论统计主要研究如何通过局部数据所提供的信息,推论总体〔或称全局〕的情形。这个问题是统计学中较为重要的,也是应用较多的内容。心理和教育科学的实验研究,很难实现对所要研究的问题的全体逐一地进行实验观测,这里就存在如何从局部的数据估计全局的情况,如何对假设进行检验与估计,如何对影响事物变化的因素进行分析,如何对两件事物或多种事物之间的差异进行比拟等等。这是推论统计这一局部所要研究的问题。这一局部所要讲述的统计方法大致包括以下一局部内容:〔一〕计数资料假设检验方法。在心理和教育科学研究中,有许多事物的属性不能用一定的单位进行测量,例如,生死、男女、升学、就业、拥护、反对等等只能用具有相同属性的个体的计数来分析,这里包括常用的百分数检验方法,χ2检验等。〔二〕假设检验的各种方法。大样本的检验方法又称为u检验法,小样本的检验方法又称为t检验法,变异数分析的方法,回归分析方法等等。〔三〕总体参数特征值的估计方法一又称总体参数的估计方法。〔四〕各种非参数的统计方法等等。【小结】依照统计方法的功能进行划分,教育统计学可以划分为描述统计和推论统计两局部。描述统计主要是依据统计的方法对所搜集的数据资料进行加工整理,通过图示,列表,求典型统计量数等手段对数据资料进行分析和描述。推论统计主要是研究由局部去推论总体的理论和方法,即根据局部的信息,利用统计的原理和方法,分析论证在一定可靠度下总体的数量特征或分布特征。第三节学习与应用统计方法应注意的问题一、学习心理与教育统计学要注意以下几个问题首先,在学习心理与教育统计学时,必须要克服畏难情绪。很多人认为统计学是很深奥的一门课程,未学之前〔先〕有怯意,这会影响学习的积极性。心理与教育统计学主要偏重于应用,对公式的原理及推导一般不做或少做数学证明,因而在学习时,只需要简单的数学计算,加上严密的逻辑推理,所用数学计算知识并不复杂,通常是一般的代数运算。对于一些用到较复杂数学方法的内容,我们也尽量介绍一些由简单计算可以替代的方法。这样,不管是文科,还是理科的学生,只要有中学的数学知识就具备了学好心理与教育统计学的前提。当然,为了能更好地理解各种统计方法的原理,如果能有高等数学的训练显然会收到更好的效果。第二,在学习时要注意重点掌握各种统计方法使用的条件。心理与教育统计学中所介绍的各种统计方法,都是在一定的理论假设的条件下推导而来的,因此我们在学习时必须注意各种统计方法的原假设是什么。这个原假设就是统计方法应用的条件,比方t检验的公式,是在总体为正态分布,方差相等的假设下推导出来的,因此在应用时,我们必须注意所要处理的实验数据其总体分布及方差的情况要满足上述条件。另外,对同一个问题可以有不同的方法及计算公式去表示,究竟用哪个方法更贴切,这也是需要在学习时应予注意的问题。比方,同样是描述数据的集中情况,却可以用平均数、中数、众数等的公式或方法,究竟选哪一个更好,这就需要在学习时能注意到各种方法所适应的情况。第三,要进行一定的练习,在学习心理与教育统计时,理解所讲授的内容,记忆一些公式,并不困难,但假设能较好地运用这些知识,却并不容易。当然能做到较好地应用是一个较复杂的问题,但解决这个问题的第一步是要做适当的练习,完成一定的作业,这一点很重要。如果能直接应用所学的统计方法于研究的实际问题中去,那么效果会更好。二、在应用心理与教育统计的各种方法时要切记以下几点:〔一〕克服“统计无用”与“统计万能”的思想,要注意科研道德,应用统计方法于心理与教育科学研究时,必须以辩证唯物论为指导思想,以心理学与教育学的科学理论为根底,具有正确的观点与思想方法,才能使统计学发挥它应有的作用。有些人在心理和教育科学研究中只凭主观经验判断,仅凭数字的外表值就得出实验研究各组间的差异,例如5%大于4%等等,这种没有考虑到抽样误差问题的主观判断往往是错误的。但有时,当两个数字外表值相差很大时,这种主观经验判断也可能正确,但这只是一种偶然可能,并不是科学的方法。通常的情况是:凭外表值判断有差异,而经过统计处理后其差异并不明显。因此在应用中一定要克服“统计无用”的思想,如果能正确地使用统计方法,可以帮助我们正确地认识客观事物,说明事物的规律性,对于指导心理与教育实践有很大好处。但统计也不是万能的,它不能改变事物的本来面目,把“规律”创造出来。有的人在进行研究时,事先没有想到统计处理,而在实验研究之后,把不符合统计要求的杂乱无章的数据硬性用统计方法处理,想以此弥补实验研究的缺乏,这是不对的。更有甚者,只从主观愿望出发,滥用统计方法去凑合预定的结论,这是在玩弄统计游戏,是一种违背唯物辩证法,缺少科研道德,站污统计学声誉的不良行为,是每一个真正的科学工作者所反对的。心理与教育统计学只是心理与教育科学研究的科学工具,它本身并不决定一项科研实验的价值,一项科研实验水平的上下,一要看你所研究的问题本身是否有价值。二是在心理与教育科学研究领域是否具有理论与实践的意义,要看在实验中对实验控制得怎样,是否有无关变量混入。作为测量反响变量的指标是否准确、可靠,也就是说你所使用的数字是否有意义。如果这一点不能保证,再好的统计方法也无济于事。第三,才是看是否正确地应用了分析实验数据的统计方法,一项高水平的研究没有科学的方法,;就不能将其高水平显现出来。同样,低劣的实验研究,再好的统计方法也不能将其研究水平提高。因此,在实验研究时中,应把重点放在研究问题的提出与实验设计,应用统计方法只是为了更好地分析、总结实验研究的成果,而不能用一些统计术语装璜一下低劣的研究,更不能用统计方法去凑和自己的主观臆断,如不遵守统计学上处理数据的原那么,甚至编造一些数据,这完全违背实事求是的原那么,是缺乏起码科研道德的行为,是从事心理与教育科学研究的人最忌违的。〔二〕需认真分析要处理的实验数据,正确地选用统计方法,防止乱用统计。至于一项实验研究结果要用何种统计方法去分析,在确定统计方法之前,要对实验数据进行认真的分析。这里,首先要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的;二是分析实验数据的类型,一般地讲,实验数据按由什么观测方法得来,可划分为两大类,一类是计数数据,是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,如人口数、学校数、男、女数等等,一般都要取整数的形式。另一类数据是借助于一定的测量工具或一定的测量标准而获得的,如身高、体重、成绩分数、能力测验分数、各种感觉阈,等等,测量数据按其是否等距和有绝对零,又可细分为下述三种测量水平:①有相等单位又有绝对零的数据称为比率变量,如身高、体重、反响时、各种感觉阈值的物理量;②有相等单位,但无绝对零的数据,称为等距变量,如温度、各种能力分数、智商等;③既无相等单位,也无绝对零的数据称为顺序变量,如等级评定、喜爱程度、品质等级、能力等级等,只能排出一个顺序,不能指出其间的差异大小。数据的种类不同所使用的统计方法不同,也就是说各种统计方法各有其适宜的数据水平。例如,计数数据一般常用属性统计的方法如百分比率的检验方法、χ2检验等,测量数据中的比率及等距变量,常用t检验及方差分析等,顺序变量常用等级相关、等级变异数分析等,多属非参数的方法。实验数据按其是否具有连续性可划分为连续变量及离散变量,连续变量的变化也是可无限增加,它的单位可以划得很细微,细微的程度能到达只可想象而不能看见的程度,离散变量的数字形式一般是取整数,两个单位之间不能再划分细小单位。一般计数数据大都是离散变量。连续变量与离散变量其分布规律不同,各种表列及图示方法不同,所使用的其他统计方法也有区别。综上所述,对实验数据进行分类,了解其测量水平,对选用恰当的统计方法是至关重要的。三要分析数据的分布规律,总体方差的情况,这一点将要在各章中讲述。只有做到对数据分析正确,才能选用正确的统计方法或在统计计算中正确地选用统计方法。至于如何能做到这一点,在统计学的各章中要分别详细介绍。【小结】学习和应用统计方法应该注意以下几个问题:〔1〕要明确学习教育统计学的目标和任务;〔2〕要重点掌握各种统计方法的使用条件;〔3〕要学用结合。第二章教育统计资料的整理【教学目标】明确数据的概念与种类;明确统计资料整理的意义;明确统计表与图是对数据的初步、描述处理;掌握次数分布表的和次数分布图的制作方法。【学习方法】了解、理解与掌握。【重点难点】统计图表的种类及应用,次数分布表和次数分布图的制作。【讲义内容】在教育科学研究中,一般都是先获得大量的观测数据。这些数据虽然乍看起来纷乱无章,但经过整理可以提供大量规律性知识和有用的信息,成为开展科学与指导实践的重要依据。在整理数据的过程中,第一步是对数据的特点和种类加以分析,制定出简单明了的统计图表。统计表和统计图是在表示数据上非常有用的两种不同形式。它们的优点都在于一目了然,使它所欲表现的信息容易被人们理解和接受。本章主要介绍数据的有关概念、教育统计资料整理的意义和方法,以及如何对数据进行初步整理,以及各种统计图表的作用与制定方法。第一节数据的概念与种类数据的概念与特点统计是对大量的数量关系的总和与汇总,借此反响被研究对象的现状、特点、开展变化的趋势、相互间关系及其规律。数据作为数量关系的表现形式,是统计调查、统计整理和统计分析的根底材料,因此,首先应对数据的概念和种类有初步了解。所谓数据,即是带有单位的数,它是通过对具体事物进行技术或者测量所得到的描述事物特征的数量依据。由于客观事物始终处于运动变化和开展过程中,对其某一特征的观察或测量得到的数据总是变化的,这种标定统计事项某一特征的量成为变量。与变量相对应的恒定不变的量,成为常量。在教育科学领域中,大量研究工作是通过科学实验或调查进行的,研究工作者必须对所欲研究的事物进行观察或通过一定的手段进行测量,然后将观察和测量的结果用一定的数量化方式加以表示,如果观察和测量的结果可靠、准确,那么,这些数据就能够在一定程度上反映出研究对象的特征,但是这些数据所提供的信息,并不一目了然。在科学研究中搜集到的这些数据,都是以一个个分散的数字形式出现的。即便使用同一种测量工具,观测同一事物,只要是进行屡次,那么所获得的数据就不会完全相同。虽然可能有相同的数据,但数量很少。随着测量工具的完善和精确,数据的这种随机性变化就更明显。数据的这种特点,称为变异性。例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业成绩考试,或对同一个心理特点进行评量等等,只要观察多人或屡次,所得到的数据总不会全然相同,这些数据总是在一定的范围内变化的。造成数据上下波动的原因,出自观测过程中一些偶然的不可控制的因素——随机因素。随机因素使测量产生的误差称作随机误差或偶然误差。由于这种随机误差的存在,使得在相同条件下观测的结果常常不只一个,并且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。在教育科学的各类研究中,被观测的对象不是客观事物,而是人的各种心理现象,其随机误差更大,不仅包括由客观上一些偶然因素引起的测量误差,也包括由实验者和被试者主观上一些不可控制的偶然困素造成的测量误差,它们往往表现在主试、被试、实验情境、主观与客观相互作用的结果上,这些偶然因素十分复杂,远比单纯对物的观测中所造成的偶然误差复杂得多,因而也就使心理与教育科学研究中得到的数据具有更明显的变异性,数据的波动范围也更大。尽管如此,随着实验观测次数的增加,这些变异性很大的数据总会呈现出一定的规律性,它总是围绕着一定的值上下波动。就某一实验的某一次观测而言,其结果受随机误差的影响,数值是不能事先确定的,因此称它为一种变量。但通过大量的观测,可以揭示出这一随机现象的规律性。在心理与教育科学实验或调查中所获得的数据,具有随机变量的性质,即具有变异性与规律性的特点。如何通过这些纷繁的数据,找出其所反映的事物的特征,就成了教育科学实验中一个很重要的问题。另外,除心理和教育科学实验中经常遇到大量的数据要处理外,教育管理部门的每一位工作人员,学校的校长及其教育工作者,也会经常遇到各种各样的数据。为了更好地了解教学及教育工作的进展情况以指导工作,各级教育领导机构经常要向下级机关进行调查,接触数字资料,这些数据也有很多具有变异性与规律性的特点,因而也属于随机变易。综上所述,数据使人们在认识客观世界的过程中形成的概念,它具有变异性和规律性的特点。数据的种类教育研究中的数据可以按照研究对象的属性、范围、标准和角度有多种不同的分类方法,常见的分类方法有:按照测量的水平,可以划分为称名变量、等级变量、等距变量和等比变量。称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。如用数字“1”表示男性,数字“0”表示女性,这里数字0和1本身并没有狮子大小的意义;这类数码只起分类的标记作用,并无数量和序列的含义,职位技术和分类做准备,不能进行数量化分析,不能做加减乘除的运算。等级变量,又称为顺序变量,是指在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。如各种比赛的名次,成绩的等级描述,等级评定、喜爱程度、品质等级、能力等级等,这类变量只能排出一个顺序,不能指出其间的差异大小。等级变量既无相等单位,也无绝对零,不同组的等级变量个等级数量渐不能进行加减乘除的运算。使用等级变量的统计指标始终为数、百分位数、百分比、等级相关系数等。等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量,它不仅划分了事物的类别,编排了事物的顺序,度量时还具有相等的测量单位,如温度、各种能力分数、智商等;崎岖之可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反响时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。2.按照数据的获得方式分,可分成计数数据和测量数据按照数据的获得方式,一般可划分为两大类,一类是计数数据,是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,如人口数、学校数、男、女数等等,一般都要取整数的形式。另一类数据是借助于一定的测量工具或一定的测量标准而获得的,如身高、体重、成绩分数、能力测验分数、各种感觉阈等等。它的特点在于熟知的连续性,可以是整数的形式,也可以用小树或分数的形式。由于测量误差不可防止,因此测量数据实质上只是一种近似值。3.按照数据的分布形式,可以将数据分为离散变量和连续变量数据按其是否具有连续性又可划分为连续变量及离散变量,连续变量的单位是无限的,可以细微到只可想象而不能看见的程度,离散变量的数字形式一般是整数,两个单位之间不能再划分细小单位。一般计数数据大都是离散变量。连续变量与离散变量的分布规律不同,各种表列及图示方法不同,所使用的其他统计方法也有区别。作为连续的随机变量,所用的数值,只是表示该连续变量的中央点,是数轴上的一段距离,例如连续随机变量的1是表示0.5~1.499……,2是从1.5~2.499……,3是指2.5~3.499……,一个连续变量不管写成整数或小数,它实际是用一个单位的中央点表示在它以上和以下各有一段距离。例如:50秒,实际代表49.5秒~50.499……秒,50.5秒实际代表50.45~50.5499秒……,这也就是说,在观测时,但凡时间在50.45~50.5499秒之间的数,我们都记为50.5秒。在教育统计中也有特殊的情况,如年龄的表示,一般5岁是指5岁开始到5岁11个月又30天,年龄的数值不是代表中间点,而是指开始点。计数数据一般属于离散的随机变量,用以表示离散的随机变量的数值是表示数轴上的一点。【小结】所谓数据,即是带有单位的数,它是通过对具体事物进行技术或者测量所得到的描述事物特征的数量依据。数据是人们在认识客观世界的过程中形成的概念,它具有变异性和规律性的特点。教育研究中的数据可以按照不同的分类方法划分成不同的类型。按照测量的水平,可以划分为称名变量、等级变量、等距变量和等比变量。按照数据的获得方式分,可分成计数数据和测量数据。按照数据的分布形式,可以将数据分为离散变量和连续变量。第二节统计资料整理的意义与程序统计资料整理的意义统计调查的结果只说明各个统计事项单位个体的特征,统计整理就是要把反响各个单位特征的调查资料经过加工、汇总、借以揭示事物总体的状况、特点、联系以及开展变化的规律。统计资料的整理在统计工作中具有十分重要的意义。首先,统计资料的整理是对统计调查的进一步深化。统计调查的结果都是零散的,只反映事物的侧面、事物的表象和事物的外部联系。不经过科学的加工整理或整理方式方法不恰当,都会使有价值的信息隐匿或浪费。只有经过科学、认真地归类整理,并以适当的形式表达出来,才会使统计资料系统化、条理化,才能反映出事物的整体特征,为进一步研究其内在的联系提供必要的条件。其次,统计资料的整理时统计分析的前提。统计工作的任务是实现对统计事项总体特征、开展变化一般规律的认识,并非只关注总体中的个体;但对总体的认识还要通过总体中的个体,对其共性加以概括、提炼并进行一系列的统计分析与统计推断来实现。统计资料的整理可为统计分析、推断提供完整而系统的数量依据,同时为计算特征量数据提供方便。统计资料整理的程序统计资料的整理主要包括:统计资料的分组;统计资料的汇总;统计表与统计图的设计与编制。统计分组时统计资料整理的根底,统计汇总时统计资料整理的中心内容,而统计图示统计资料整理的表现形式。统计资料的分组即根据研究的任务及统计事项内在的特征,按一定的标志把数据资料进行归类,将性质相同的数据归为一类。分组应该注意以下两个问题:〔1〕要分类正确。必须查明被研究现象的本质,掌握被研究现象的本质是分类的根底。因此,只有选择与被研究现象的本质有关的特性作为分类的依据,才能确保分类正确。分类时如果误用了非本质的标志,会导致错误的结论。除了要了解被研究现象的本质外,对心理学及教育学方面专业知识的熟悉及其专业范围内分类的了解,也有助于分类的正确进行。例如在实验心理学中对刺激判断的类别:“大于”、“等于”、“小于”有较清楚的了解时,在实验过程中对反响进行分类就易于进行。〔2〕分类标志要明确,要能包括所有的数据。在对数据进行分类时,所依据的特性称为分类的标志。整理数据时,分类标志要前后一致,而且标志要明确,不能模糊不清。这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。另外,在分类时所依据的标志必须将全部数据包含进去,不能遗漏数据。例如,对一个班学生进行分类,依研究的需要,可以用性别为标志,将全班学生分为男生及女生两类。如果研究两个或两个以上的问题,分类标志也可以是两个或两个以上,分类标志的数目及分类的详细程度,都要看被研究对象的性质和研究任务而定。2.统计资料的汇总是指在统计分组的根底上,根据已经确定的分组标志和分组数目,把总体中各单位归纳到相应的各组中去,并计算出各组和总体的单位数或指标值。3.列统计表这是统计资料整理的最后一步,是把统计资料汇总的结果整理成表格,即统计表。统计表是统计资料的最主要的表现形式,它可使大量的统计数据系统化,不仅免于繁杂的文字表达,而且便于比拟分析和进一步计算统计量。【小结】统计资料的整理在统计工作中具有十分重要的意义。首先,统计资料的整理是对统计调查的进一步深化。其次,统计资料的整理时统计分析的前提。统计资料的整理主要包括:统计资料的分组;统计资料的汇总;统计表与统计图的设计与编制。统计分组时统计资料整理的根底,统计汇总时统计资料整理的中心内容,而统计图示统计资料整理的表现形式。第三节统计表统计表的作用、构造与种类〔一〕统计表的作用统计表是表示数字资料的一种重要方式,在对数据进行统计分类以后,一般都用统计表的方式加以表达。对数据进行分类以后,所得到的各种数量结果称为统计指标。把统计指标和被说明的事物用表格的形式加以表示就构成统计表。统计表可以给人以一目了然、简洁、清晰的印象,表中的数据易于比拟分析,是心理与教育科学研究报告和教育管理部门整理数据时普遍采用的方法。〔二〕统计表的构造和编制统计表的要求统计表的构造一般包括如下几个工程。现将各工程的名称及编制要求一并表达如下:序号 要写在表的左上方,序号一般以在文章中出现的先后顺序排列。名称 又称标题,是一个表的名称,应写在表的上方。标题的用语要简洁扼要,使人一望可知该表的内容。如果用语过简,可在下面附加说明,但这种情况不宜多用。标目 即分类的工程。标目的好坏决定统计表的质量,因而要认真酌定。标目一般在表的上面一行和左侧一列。如果分类的标志只有一个,写在表的左列或上行都可以。如果分类的标目有两个,且二者没有隶属关系,那么左列与上行各一个。如果两个分类标志有隶属关系,那么要都在一个方位〔或上面或左侧〕分两行分述。数字 数字是统计表的语言,又称统计指标。它占据统计表的大局部空间,书写一定要整齐划一,位数要上下对齐,小数点后缺位的要补零,缺数字的项要划“一”。表注 写于表的下面。它不是统计表的必要组成局部。如果需要可对标题补充说明。数据来源、附记等都可作为表注的内容,文字可长可短。另外,关于统计表的画法应注意以下几点:表的各纵行〔或称纵列〕之间要用线条隔开,表的两边纵线可以省去,上下两边须有横线,标目与数字间,数字与总计间,两个总标目之间都须用线条隔开。表的上下二横线线条要粗些等等。〔三〕统计表的种类统计表可按形式及内容不同的分类标志,将其划分成不同的类型。不同类型的统计表的具体功能不同。下面介绍几种常用的统计表的类型。简单表 只列出调查名称、地点时序或统计指标名称的统计表。例如表l、表2、表3。表1各校学生数一览表学校A校B校C校D校人数9857628931051表2某师范大学数学系1994~1999年毕业生人数统计表年份人数1994年901995年1201996年1281997年1061998年1931999年185合计822表3北京市四街道智力落后病患者分布街道检查人数病人数患病率〔%。〕1518411593.12760302633.53495081903.84517881703.3总体2291687823.4分组表 只有一个分类标志分组的统计表。如表4。表4不同年龄组脑电平均频率分布年龄组0~1月1月~1岁1岁~3岁~7岁~12岁~20岁~60岁~80岁~平均频率〔周/秒〕2.04.06.48.58.510.410.410.09.0这个表所列数据的分组标志,只有一个即“年龄”。在这个标志下,又分不同的年龄组别。不同年龄组的平均脑电频率可从这个表中一望而知,清楚明白。复合表 统计分组的标志有两个或两个以上的表、假设只有两个分组指标的称为两项表;假设分组指标有三个的称为三项表,如此类推。表5既是一个复合表,其分类标志有:学历,性别。表5两所中学的教师学历情况统计表性别人数学历研究生本科大专中专高中一中男323101351女1714921小计494142272二中男28381241女1725910小计455132151次数分布表次数分布表示数据在各个分组内散布的情况,在统计学中占有重要地位。编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用,是对连续随机变量进行初步整理的重要步骤。〔一〕次数分布表对于一组大小不同的数据划出等距的分组区间〔称为组距〕,然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表式。这种统计表称之为次数分布表。编制次数分布表的步骤1.求全距。全距指最大数与最小数之间的差距。从被分组的数据中找出具有最大值与最小值的两个数据,然后从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示。2.定组数。组数分组数目要看数据的多少,如果数据个数在100个以上,习惯上一般分10—20组,常取12—16组。如果数据的总体分布为正态,可用下面的经验公式计算组数〔K〕,这样可使分组满足渐近最优关系。表6就是利用这个公式计算的结果。K=1.87(N—1)〔N为数据个数,K取近似整数〕表6组数与数据次数的关系N10020050010002000K1216223039这个公式计算出的组数,只是一个近似约数,因为究竟能分多少组,与分组时最低组的下限是多少有关,还与组距i有关,因为i=全距/k,为了分组方便,常取上述的一些正整数,这势必影响分组多少。一般说来,分组数目或组距小有变化时,对次数分布表作用的显示和计算的准确性,不产生很大影响。因此对组数与组距并不要求严格界定。分组多少与哪些因素有关?我们应该如何掌握它的标准?一般说来,分组的数目多,那么组距小,计算精确。但它要求总的数据量大,否那么会出现有的组距内无次数分布的现象,那将使整个数据的分布规律显示不明显,也就不能发挥次数分布表的作用了。如果分组少,组距就大,计算简单,但引进计算误差较大。因此,要做到既不增加搜集数据的工作量,又能使分组后的计算精确到最大限度,那么,按上述公式分组,是一个较好的方法。SPSS那么用另外的公式综合考虑数据个数、极大值、极小值、离散程度等指标,计算组数与确定组距,因此其组距的大小,一般不为整数,分组的上限及下限也不为整数。3.求组距组距是指每一组的间距,用符号i表示。如果能先确定组数,就可以用全距除以组数后,取整数表示组距。组距经常用2、3、5、10、20等数值表示。之所以常用上述这些数值,是为便于计算分组区间,便于计算每一区间的中值。4.定组限即列出分组区间。分组区间又称为分组阶段,使各组数据变化范围的界限,也就是说是指各组数据在数值上的起点值和终点值。起点值称为组下限,终点值称为组上限。列分组区间要注意以下几点:最高组区间内应能包含最大值的数据,最低组区间应能含最小值的数据。最高组或最低组的下限最好是组距i的整数倍。这样便于确定各区间的下限与上限,减少计算。各分组区间的排列顺序,一般按纵坐标单位顺序排列,即数值大的分组区间排在上面。数值小的分组区间排在下面。例如,分组区间可写为35~39,40~44,95~99等,但我们必须明确,实际上各组的精确界限应是34.5~39.5,39.5~44.5,94.5~99.5,并规定在分组时,包含下限而不包含上限。在登记次数时,一定要按精确限划分数据的组别。5.求组中值组中值是各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。计算公式为:组中值=〔上限值+下限值〕÷2,或者:组中值=下限值+〔组距÷2〕,组中值=上限值-〔组距÷2〕。如组35~39,40~44,95~99的组中值分别为:37,42和97。6.归类划记。组限确定后,须将原始观测指按照一定的顺序逐一归组,用“正”字或一般的划线记数。为确保登记准确,第一次登记后需再核实登记一次。7.记录次数〔f〕。各组的次数计算好后,还要计算总和即总次数。一是为了以后计算的需要,二是为了核对各组总和与数据的总数〔N〕是否相等。8.核对,抄录新表。登记核实后,重新制表,这个新表应有以下栏目:一栏为分组区间、二栏为组中值,各分组区间组中值的计算是精确下限加上组距i的二分之一,或精确下限与精确上限之和的一半。三栏为次数〔f〕,四栏为相对次数,可用百分次数、或频数比率〔f/N〕,这一栏有时可不用列出。这样整理的统计表就是次数分布表。下面以90名学生的语文成绩为例,说明次数分布表的编制步骤。以便有助于进一步理解前述有关编制次数分布表的具体方法。90名学生的成绩是:587966767583567071738580737275785961746855767441619145718268635061846065717762788485929770476678386763706673777261736872767787614752696652767968666264636568686667717269785669887469从上述这一组数据中,除能看出这些学生的成绩分数在38~97之间外,很难说它还能提供别的什么信息。现在我们对这一组数据进行统计分组,因为它属于连续随机变量,就应划分数量类别,编制一个次数分布表。方法步骤如下:第一步,找出最大值与最小值,分别为97、38,求全距是97一38=59。第二步,确定组数,因为,一般说来测验成绩的总体分布为正态分布,故可用公式计算如下:K=1.87〔N—1〕将N=90代入,那么:K=1.87〔90—1〕=12第三步,确定组距。i=59/12约等于5,这里我们定组距为5。第四步,定组限。因为这组数据最小的值为38,分组的组距定为5,这样取最低组的下限为35,既可将38包含在最低组内,其值又是5的整数倍,这样比拟好。各组区间可写为:35~39,40~44,45~49,50~54,55~59,60~64,65~69,70~74,75~79,80~84,85~89,90~94,95~99,最高组95~99,亦可将最高分97包括进去。可见,分组区间的划定,符合要求。这里各分组区间用整数表示,是为书写方便,在对数据进行分组时,一定要按各组的精确限:34.5—39.5,39.5—44.5…以下类推。第五步,按照各组的精确下限和精确上限,计算每组的组中值,计算得到各组的组中值为:37,42,47,52,57,62,67,72,77,82,87,92,97。第六步,登记次数。按照划定组的实际上限和下限,归类划记每组的人数。一次登记后应再核实一次,确保无误。为了登记次数方便,我们将90个学生的顺序按照从大到小排序如下:384145474750525255565658596061616161616262636363646565666666666666676768686868686869696969707070717171717272727273737373747474757576767676777777787878787979808283848485858788919297第七步,计算次数,计算第五步的统计结果,登记次数,计算次数。表中Σf是指所有各组的次数和。第八步,具体编制一个完整的次数分布表,至少包含分组区间,组中值和次数,这样,一个简单次数分布表即告完成〔见表7〕。表7简单次数分布表组别组中值次数95~9997190~9492285~8987480~8482575~79771570~74721865~69672060~64621255~5957550~5452345~4947340~4442135~39371合计90〔二〕累加次数分布表在一般的次数分布表上,只标出各分组区间的数据次数,如果想知道某个数值以下或以上的数据的数目,就要用累加次数,累加次数的计算方法有两种,一种是从分布表的小数值端,逐区间的进行次数累加,这种累加次数可答复次数分布表某一分组区间上限以下的次数是多少。另一种是从分布表的大数端逐区间的次数累加,这种累加次数可答复某一分组区间下限以上的次数是多少。用累加次数表示的次数分布表称为累加次数分布表。在心理实验中对感知阈限的测定、各种心理量表的编制、心理测验对题目分析、教育管理及成绩比拟等都要常用到这种累加次数分布表。累加次数分布表中,累加次数可用实际次数,亦可用相对次数。表8可整理成如下表9的累加次数分布表:表9累加次数分布表组别次数〔f〕上限以下累加次数下限以上累加次数实际累加次数〔cf〕相对累加次数实际累加次数〔cf〕相对累加次数95~9919010011.190~9428998.933.385~8948796.777.880~8458392.21213.375~79157886.72730.070~74186370.04550.065~69204550.06572.260~64122527.87785.655~5951314.48291.150~54388.88594.445~49355.58897.840~44122.28998.935~39111.190100.0合计90表9所列的累加次数,有上限以下和下限以上累加,这两种方法,可根据需要任选一种,另外各种方法中,究竟用实际次数累加还是相对次数累加,就可比拟方便地了解到某一分组区间上限以下的数据个数,或下限以上的数据个数。编制次数分布表是对数据进行分类整理的一个很重要的步骤,它可将一堆杂乱无序的数据排列成序,这个表可告诉我们:大小数据的次数是多少,其分布的状况如何。如表7明显告诉我们65~69这一组人数最多,90分以上及70分以下的人数较少。同时次数分布表还可显示这一组数据的集中情况〔平均值大约在65~69之间〕及差异情况等。次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。这样,假设据这张表所提供的情况计算平均值〔具体方法见第三章〕,就要比用原数据计算的值有出入。因为每一组都用组中值为代表,而不管数据原来的情况。不过从另外的角度讲,将不规那么的数据按一定的规律加以调整,对以后进一步统计分析反倒无害而有利,因此,引进一点计算误差并无影响。三、编制统计表的一般规那么为使统计表能够清楚、准确地表现出统计事项的数量特征,发挥统计表的作用,在编制统计表时,应该注意:统计表的题目应能概括出表的根本内容,并说明资料所属时间,标题写在表的上方中央。统计表要力求简明,防止表内资料过于庞杂;行和列的标目内容要按照一定的顺序排列,如果栏目过多,应予以编号。统计表中要列出必要的总计数及每一标目下的小计,以便对数据进行检查和计算。数据资料应标明计量单位,可分别在总标题和横标题,列标题后面注明。统计表的上下端应画粗线,中间各标目内容用细线分开,标的左右两端一般不封闭。资料来源或其他必要的文字说明可写在表的下端。【小结】统计表是描述数据的一种重要方式,可以给人以一目了然、简洁、清晰的印象,表中的数据易于比拟分析,是心理与教育科学研究报告和教育管理部门整理数据时普遍采用的方法。按照分类标志多少可以将统计表分为:简单表,分组表和复合表。次数分布表示数据在各个分组内散布的情况,在统计学中占有重要地位。编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用,是对连续随机变量进行初步整理的重要步骤。编制次数分布表的主要步骤有:1.求全距,2.定组数,3.求组距,4.定组限,5.求组中值,6.归类划记,7.记录次数〔f〕,8.核对,抄录新表。第四节统计图一、统计图的用途与种类经过汇总整理与加工取得的统计资料,不仅可用统计表来表现,还可用统计图来表现。统计图是统计资料整理结果的根本表现形式,也是统计分析的重要工具。利用几何图形表示统计事项数量关系的图形,叫做统计图。用图形表示和分析统计资料的方法,称为统计图示法。利用统计图表现统计资料,比单纯地使用统计表更具显著特点。具有:表现具体、明确、便于比拟,有更强的说服力;并且表现得生动活泼,鲜明醒目,易于理解。统计图所具有的显著特点,使之在统计资料的表现和分析中具有重要的作用。用统计图表现统计事项的数量关系,主要有以下几方面的作用:标明同类统计事项指标的比照关系;揭示总体内部结构;反映统计事项的开展动态;分析统计事项之间的依存关系;说明总体单位的分配;检查方案的执行情况;观察统计事项在地域上的分布。按照图形表现形式,可以将统计图分为:几何图,象形图和统计地图三类。〔1〕几何图。几何图是利用几何的形和线来表示统计资料的图形,如:曲线图、条形图、平面图、圆形图、直方图和立体图等。曲线图是一曲线的升降来表示现象的变动,主要用于说明现象开展的动态、彼此之间的依存关系、总体单位的分配和方案的执行等。其他几种几何图是以图形的长短、大小来表现图示现象的数量关系,主要用于说明同类统计事项指标的比照和总体内部结构。〔2〕象形图。它是利用统计事项本身的形象画来表示统计资料的图形。这类图形实际上不过是几何图形的变形,也是以图形的长短、大小进行图示资料的比拟,用以说明所研究统计事项的比照关系。〔3〕统计地图。它是在地图上利用不同的色彩或线纹的图饰来表现不同的统计资料的图形。它专门用来说明统计事项的数量在地域上的分布状况。二、统计图的构成要素①图号及图题 统计图的名称为图题或标题。图号是图的序号,图题与图号一般写在图的下方。图题的字体是图中所用文字中最大的,但也要与整个图形的大小相称。②图目 图目是写在图形基线上的各种不同类别、名称,或时间、空间的统计数量,即横坐标上所用的各种单位名称。在统计图的横坐标及纵坐标上都要用一定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数单位,百分单位等等,这要根据资料的情况加以选用,图尺分点要清楚,整个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺或回尺法,减少图幅。③图形 图形是图的主要局部,图形曲线要清晰,一般除图形线外,防止书写文字。要表示不同的结果,用不同的图形线以示区别,各种图形线的含义用图例标明,图例可选图中或图外某一适当位置表示,这一切的总目的是为了使整个图和谐美观和均衡。④图注 凡图形或其局部或某一点,需要借助文字或数字加以补充说明的,均称为图注。图注局部的文字要少,印刷字型要小,它可以帮助读者理解图形所示资料,提高统计图的使用价值,又不破坏图的美观。例:百分数百分数图1:实验前后学生自觉纪律性情况比拟注:资料来源:《心理学报》1982年第1期第47页2统计图的绘制步骤绘制统计图一般要经过以下几个步骤:确定制图目的;根据制图目的,搜集和审核统计资料。选择图形;按照制图目的和统计资料的性质特点,选择适当的图形。加工计算图示资料;按所选定的图形,要对图示资料进行必要的加工计算,如计算百分比,角度,面积以及图形的比例尺度等。绘制图形;先画草图,在画出正式图。填写图名;加注数据、图例及文字说明,如绘制单位、日期及资料来源等。附加各种装饰。四、几种常见统计图的绘制方法统计图可按形状、数字性质、图的用途等标志分为多种类别。心理与教育统计中常用的统计图可按形状划分为直条图、直方图、曲线图、圆形图、散点图等等。〔一〕条形图 它主要用于表示离散型的数学资料,即计数资料。它是以条形长短或高度表示各事物间的数量大小与数量之间的差异情况。直条图又有单式〔图2〕与复式〔图3〕两种。人数人数图2:1956-1957年全国高校教师职称情况〔1956年全国高等教育统计资料简编26页表22〕图3:实验前后学生自觉纪律性情况比拟单式条形图是条形图中最简单的一种。它用假设干平行而等宽的矩形条来表示图示指标的比照关系。下面以表10的资料说明单式条形图的绘制方法。表101956-1957年全国高校教师职称情况统计表职称教授副教授讲师助教人数455833371557334878单式条图的制作:先画一直角坐标,确定基线和尺度线。如果是画纵式条形图,以坐标纵轴为尺度线,横轴为基线;如果是画横式条形图,以坐标纵轴为基线,横轴为尺度线;根据表中数据资料的大小,合理确定尺度线的比例长度;将基线上的工程均匀分布,绘制等宽条形的长度。标明尺度单位及基线工程名称;填写标题及文字说明。复式条形图和分段条形图是把两套以上条图画在一起,用以反映有联系的两种或两种以上的统计事项。这种统计图适合多个统计事项之间的比拟。复式条形图中,每套条形要用不同的条式和颜色区分,要协调鲜明,并在图内适当位置标出图例。绘制条形图要注意以下几点:①尺度须从零点开始。要等距分点,一般不能折断,否那么会使长条间的比例发生错误,不易显示资料的差异情形。在不得已而折断的时候,应将数值在折断处注明。②注意条宽与间隔比例。直条图是以条形的长短说明数量的多少,宽度与数量大小无关,但过宽或过窄与是否美观有关,因而宽窄要适度。各条形之间的间隔要一致,两条形之间的间隔为条宽的0.5一1倍之间比拟适宜,使画面显得美观大方。③各直条的宽度要一致,应有一条共同的直线为基线。④直条的排列顺序可按时间序列,数量多少,以及相比拟事物的固有序列,要根据具体情况来定。⑤图形上尽量回避注写数字,尤其是条形的顶端和下端。⑥过长条形的调节,可采用断裂法、折叠法、回转法、折断法。但这些方法能不用最好不用,因为这样调节后,容易削弱图形直观比拟的力量。⑦相比拟的数目不宜太多,一般以简明为要,最多不能超过20个。⑧复式条图有关各长条可拼在一起,不必留空隙。各组内直条排列次序必须一致,以便比拟。〔二〕圆形图 圆形图使用圆形内扇形面积的大小来说明总体结构的图形。整个圆形面积代表所统计事项的总体,把圆的面积分成假设干扇形,每一扇形面积的大小表示被研究总体的各个组成局部。用于间断性资料,主要目的为显示各局部在整体中所占的比重,以及在各局部之间的比拟。所要显示的资料多以相对数〔如百分数〕为主。圆形图的图尺局部为圆周,分度是将圆周等分为100份,每百分之一相当于3.6º,它的基线是在圆的上方或下方的半径。图4:1956-1957年全国高校教师职称情况注:图题及说明同图1圆形图的画法:〔1〕画一个圆形;〔2〕计算个组成局部占总体的比例;〔3〕计算各个局部在院中所占的圆形角的大小,可用360度乘以各个局部所占的比例得到;〔4〕按照个局部所占圆心角的度数,在圆内画出个局部扇形;〔5〕将各扇形用不同的图饰或颜色区分。〔6〕填写标题及文字说明。〔三〕曲线图 曲线图是用曲线的升降来表示统计资料书之变动的图形。人们常用曲线图来描述统计事项总体指标的动态、研究对象间的依存关系以及总体各单位分配情况等。用于连续性资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的开展趋势,或一种现象随另一种现象变化的情形,用曲线图表示是较好的方法。这是教育与心理学实验报告中最常用的图示结果的方法。分类:1.动态曲线图。动态曲线图是表现统计事项随着时间的变化,其总体指标数值开展变化趋势的图形〔如图5〕。画法:〔1〕画一个直角坐标系,横坐标表示时间,纵坐标表示数量坐标水平;〔2〕按照数值指标大小合理划分纵坐标的比度;〔3〕在坐标系内按照不同时间和对应指标数值画出坐标点;〔4〕将相邻坐标点用折线连接,便可画出动态曲线图。图5某公司1~12月份打印文稿数量动态统计图2.依存关系曲线图依存关系曲线图是描述统计事项之间相互依存关系的图形。以横轴表示一种统计事项的数量,纵轴表示另一种统计事项的数量,在坐标内描出相应的坐标点,并连接各点相承依存关系曲线图。图6是根据表11中的资料绘制的依存关系曲线图。表11某校教育经费与购置设备数目统计表时间教育事业费〔万元〕设备数〔件〕19907.23819918.03919928.340199311.659199416.463199519.167199622.370199723.871199827.880199932.790图6设备数与教育事业费依存关系曲线图3.次数分布曲线图次数分布曲线图是利用曲线描述总体各单位按照某一标志分组后,各组次数分布的图形。次数分布图是根据次数分布标画出来的,主要有次数分布多边图、次数分布直方图、累积次数曲线图等。〔1〕次数分布多边图绘制次数分布多边图的步骤是:首先画一直角坐标,在横轴上画出假设干等距的点,表示分数;纵轴标出假设干等距的点表示次数。横轴、纵轴的数据都有坐标零点开始,次数自下而上,分数自左向右标出。然后在坐标内画出个组的组中值与该组对应次数的坐标点,并在最低组以下和最高组以上分别增加一个假设的零次组,取其组中值描出坐标点。最后一次连接相邻各点,制成次数分布多边图。下面7是以表7的次数分布表制成的次数多边图。图790名学生语文成绩次数分布多边图〔2〕次数直方图直方图又名等距直方图,它是以矩形的面积来表示连续性随机变量次数分布的图形,是常用的统计图之一。它的横坐标上标出等距分组点,即各组区间的下限〔可用整数表示,亦可用精确线表示〕。纵坐标上标出次数。以组距为底边,以分组区间的精确上下限为底边二端点,以次数为高画矩形,各直条距形之间不留空隙〔见图8〕。也可以不画矩形,只要使直方图包围的面积成封闭的图形即可,这种图又叫组织图,是直方图之一种形式〔见图9〕。3540455055606570758085909510035404550556065707580859095100图8简单次数直方图3540455055606570758085909510035404550556065707580859095100图9简单次数直方图图8或图9要比表7显示数据分布的情况更生动、直观。对于各组次数的多少,分布是否对称,是峻峭还是低平,显示得更清楚。实际上图8和图9是根据表7的资料绘制的。〔3〕累积次数分布图累积次数分布图是根据累积次数〔向上或向下累积〕绘制的。累积次数分布图的绘制步骤:第一步,把各组次数进行累加,如表8中的由下向上累加。第二步,画一直角坐标,横轴以等距的标记表示分数段,纵轴以等距的标记表示各累加次数。第三步,划出各组上限分数与该组累计次数对应的坐标点。第四步,一次连接相邻各点,制成累积次数分布曲线。〔四〕散点图 又称点图,它是以圆点的大小,以及大小圆点的多少或疏密表示统计资料数量大小和变化趋势的图。它通过圆点分布的形态可以表示两种现象间的相关程度。图5:直线相关散点图〔示意图〕绘制统计图的一般原那么绘制统计图时应遵循的一般原那么是:图示的内容要简明扼要。一张统计图不宜过于繁琐,应力求简明易懂。图示的标题、数据单位以及文字说明,都应简明清晰,一目了然,便于掌握。图示的形式要生动鲜明。统计图有各种各样的表现形式,要根据图示资料的性质选择图形。再如实反映客观情况的前提下,尽量采用醒目的线条或美观的图饰,书写工整标准,以提高图示的表现力和效果。图形的设计要符合科学性。图形要根据准确的统计资料精密绘制,防止由于绘制粗燥而产生误导;防止在表现方法上造成的错觉。要做到图示准确、数据清楚、表现真实。【小结】统计图是描述数据的另一种重要方式,可以给人以一目了然、简洁、清晰的印象,统计图具有直观、形象、生动等特点,是心理与教育科学研究报告和教育管理部门整理数据时普遍采用的方法。用统计图表现统计事项的数量关系,主要有以下几方面的作用:标明同类统计事项指标的比照关系;揭示总体内部结构;反映统计事项的开展动态;分析统计事项之间的依存关系;说明总体单位的分配;检查方案的执行情况;观察统计事项在地域上的分布。按照图形表现形式,可以将统计图分为:几何图,象形图和统计地图三类。绘制统计图一般要经过以下几个步骤:确定制图目的;选择图形;加工计算图示资料;绘制图形;填写图名;附加各种装饰。统计图可按形状、数字性质、图的用途等标志分为多种类别。心理与教育统计中常用的统计图可按形状划分为直条图、直方图、曲线图、圆形图、散点图等等。第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。【学习方法】了解、理解、计算与应用。【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。因此说这一步还不是应用统计方法的步骤。为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。对于一组数据来讲,最常用的统计量有两类。一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。数据的集中情况指一组数据的中心位置。集中趋势的度量,即确定一组数据的代表值。描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。本章主要介绍几种常用的集中量数。集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。第一节算术平均数一、算术平均数的概念和适用条件〔一〕概念算术平均数一般简称为平均数或均数〔Mean〕。只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。如果平均数是由X变量计算的,就记为〔读作X杠〕,假设由Y变量求得,那么记为。由于任何平均数都是由特定的变量计算而来,因此或自然人便成为算术平均数的符号了。本书采用或表示平均数。算术平均数是一组同质数据值得总和除以数据总个数所得到的商,其计算公式为:公式中∑Xi表示所有数据的和,即∑Xi=X1+X2+……+Xi;N为数据的个数。为一组数据的算术平均数。〔二〕适用条件1.适用于同质数据。不同质的数据,不能计算算术平均数。2.要求一组数据中每个数据都比拟准确、可靠,假设数据模糊不清,或分组资料又不确定组限时,不能计算算术平均数。3.无极端值出现。因为算术平均数容易受极端数据的影响。4.需要得到一个相对精确可靠的集中量数或进一步参与其他运算时。二、算术平均数的计算方法〔一〕、简单算术平均数的计算方法直接用公式求算术平均数。算术平均数的计算公式很易理解,就是将所有的数据相加,再被数据的个数除。例1某班选八名同学参加年级数学竞赛,成绩分别为82,90,95,88,90,94,80,93。求其平均成绩。解:将=82,=90=95=88=90=94=80=93,N=8代入公式〔3.1〕,得〔二〕加权算术平均数的计算方法在实际的教育测量或教育评价中,经常会遇到这样的情况,在计算算术平均数时,每个数据在其整体中的地位并不一样,即各个数据代表的事物在其整体中所占权重〔重要程度〕不同。像这种考虑到权重的不同而求出的算术平均数,即为加权算术平均数。加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商,用符号表示。公式为:式中Wi为权数,所谓权数是指各变量在构成总体中的相对重要性,每个变量的权数大小,由观测者依据一定的理论或实践经验而定,虽然是可变的,但绝不是没有根据的。在教育工作中,我们时常遇到对测量数据进行加权的情况。例如,在考试时教师共出10道考题。由于各题的大小不同,难易程度不同.在总分值为100的要件下.绝不是每题都以10分为总分值,而是有的题5分,有的10分、20分,甚至30分。再如高校入学考试共包括语文、政治、外语、数学、物理、化学及生物7科,而计算总分时并不是各科平等,在语文、政治等科都以100为总分值的情况下,数学定120分,生物定50分,也是考虑到各门学科的相对重要性而进行加权的结果。加权的道理不难理解,但有时却容易被人忽略。由各小组平均数计算总平均数是应用加权平均数的一个特例。在心理与教育研究中,经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。在这个问题中,可以把各小组的平均分数,视为该小组每个个体的分数,而把每个小组的人数,视为权数。下面通过几个例子来说明家铨所属平均数的应用。例2某年级四个班的学生人数分别为50人,52人,48人,51人,期末数学考试各班的平均成绩分别为90分,85分,88分,92分,求年级的平均成绩。解:根据此题所给条件,应按公式〔3.2〕计算。将各数值代入上述公式,得例3某小学三年级数学期末总评成绩规定为平时占20%,期中考试占30%,期末考试占50%.某学生数学平时成绩为96分,期中考试成绩为80分,期末考试成绩为92分.求该生期末数学总评成绩为多少分?解:此题为求加权算术平均数的问题.题中的权数分别为0.2,0.3,0.5。将各数值代入公式〔3.2〕,得〔三〕次数分布表中算术平均数的计算对于已经列成次数分布表的数据,其算术平均数的计算公式为:式中,为各组的组中值,为各组的次数,N为总次数,即。某班50人外语期末考试成绩的次数分布表如下,求全班学生的平均成绩.组别组中值次数ff90∽9485∽8980∽8475∽7970∽7465∽6960∽6455∽59928782777267625731015853422768701230616360201248114503915解:将表中数据代入公式(3.3),得需要说明的是,利用次数分布表求出的算术平均数是一个近似值。原因在于计算算术平均数时,我们假设各组内的数值是均匀分布的,利用各组的组中值来分别代表各组数据,这显然与实际的情况不完全相符,因此求出的算术平均数与真实的算术平均数之间有一定的差异,也就是分组误差,但是这并不影响以后的统计分析。三、平均数的意义与应用算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最正确的估计值。在科研实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反响时间,用计时器进行测量,人们是想测到真正的反响时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值、算术平均数在大多数情况下,是真值的最好的估计值,对这一点概率统计有严密的数学证明。算术平均数具备一个良好的集中量数应具备的一些条件:①反响灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反响出来。②确定严密。计算平均数有确定的公式,不管何人,在何种场合,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。③简明易解。平均的概念简单明白,容易理解。较少数学抽象。④计算简单。计算公式只是用简单的四那么运算。⑤符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x,以及将要讲到的求方差等等。⑥较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:①易受极端数据的影响。由于平均数反响灵敏,因此数据中假设出现极端数据〔或大或小〕,就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时假设用平均数代表全班学生的知识水平,那么肯定偏低,并且不符合实际情况。为此,我们还需要学习,了解其他表示一组事物的典型情况的统计方法和统计值。在心理物理学实验、学习迁移实验和迷津学习实验等观测中,都常有出现极端数目的情况。②假设出现模糊不清的数据时,无法计算平均数,因为计算平均数时需要每一个数据都参加计算。在次数分布中只要有一个数据模糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。此外,必须注意,凡不同质的数据不能计算平均数。所谓同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。如果使用了不同质的数据计算平均数,那么该平均数,不能作为这一组数据的代表值。不仅如此,有时它反而会造成掩盖事物的本来面貌,使人产生误解等问题。例如在教育方面,计算平均成绩时,如果各科考试的难易水平和评分标准等各不相同,这时假设用总平均分数表示一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代眼科医院的网络与移动营销
- 电动汽车保养延长电池寿命的关键
- 生物信息学在现代医学研究中的作用
- 现代企业品牌建设与营销策略
- 新北师大版数学一年级下册《美丽的田园》听评课记录
- 【基础卷】同步分层练习:四年级下册语文第2课《乡下人家》(含答案)
- 湘教版数学七年级上册3.3《一元一次方程模型的应用》听评课记录5
- 【基础卷】同步分层练习:四年级下册语文第16课《海上日出》(含答案)
- 现代家居装饰艺术与心理舒适度研究
- 苏科版数学九年级上册4.2.3《等可能条件下的概率(一)》听评课记录
- 2024年泰州职业技术学院高职单招数学历年参考题库含答案解析
- 楼梯 栏杆 栏板(一)22J403-1
- 学生综合素质评定与职业规划的关联性分析
- 2025云南省贵金属新材料控股集团限公司面向高校毕业生专项招聘144人高频重点提升(共500题)附带答案详解
- 劳动法培训课件
- 湖北中烟工业限责任公司2025年招聘(技术类和业务类岗位)【43人】高频重点提升(共500题)附带答案详解
- 石家庄市长安区学年三年级数学第一学期期末检测试题含解析
- 2025年中国一汽招聘笔试参考题库含答案解析
- 特殊家长课后沟通技巧培训
- PEP人教版小学英语六年级下册单词表(含音标)
- 泰国主要城市中英泰文对照
评论
0/150
提交评论