版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
心理与教育统计演示文稿当前1页,总共89页。优选心理与教育统计当前2页,总共89页。第一讲绪论第一节统计方法在心理和教育科学研究中的作用第二节心理与教育统计学的内容第三节心理与教育统计学的发展第四节心理与教育统计基础概念当前3页,总共89页。第一节统计方法在心理和教育科学研究中的作用一、心理与教育统计的定义与性质二、心理与教育科学研究数据的特点三、学习心理与教育统计应注意的事项四、学习教育与心理统计学的意义当前4页,总共89页。一、心理与教育统计的定义与性质统计学大致可以分为两部分:理论统计学(theoreticalstatistics):侧重统计理论与方法的数理证明。应用统计学(appliedstatistics):侧重统计理论与方法在各个实践领域中的应用。数理统计与应用统计二者之间是理论与实践的关系,相辅相成,互相促进。当前5页,总共89页。一、心理与教育统计的定义与性质教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制定方案、检查效率的目的,为教育与心理的科学研究提供了一种科学的方法。当前6页,总共89页。一、心理与教育统计的定义与性质心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。即在心理和教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。当前7页,总共89页。二、心理与教育科学研究数据的特点(一)心理与教育科学研究数据和结果多用数字形式呈现(二)心理与教育科学研究数据具有随机性和变异性随机性:具有某一概率的事件集合中的各个事件表现出来的不确定性。变异性:由于实验条件与实验误差的影响,使各次测定值有所不同的性质(三)心理与教育科学研究数据具有规律性(四)心理与教育科学研究的目标是通过部分数据来推测总体特征当前8页,总共89页。随机性随机因素:观测过程中的一些偶然的、不可控制的因素。随机误差:随机因素使测量产生的误差。随机现象:由于随机误差的存在,使得在相同条件下观测的结果常常不止一个,并且事先无法确定,这是客观世界存在的一种普遍现象,人们称这种现象为随机现象。当前9页,总共89页。三、学习心理与教育统计应注意的事项(一)学习心理与教育统计学要注意的几个问题要克服畏难情绪重点掌握各种统计方法使用的条件要做一定的练习(二)应用心理与教育统计方法时要切记的要点克服“统计无用”与“统计万能”的思想,注意科研道德“统计无用”:不能根据数字的表面直接得出结论。“统计万能”:不能改变事物的本来面目,把“规律”创造出来。正确选用统计方法,防止误用和乱用统计当前10页,总共89页。一项研究的价值受制于多种因素研究问题本身是否有价值研究问题在心理与教育统计领域的理论与实践意义研究过程中对实验变量控制的程度反映变量观测的准确可靠程度分析实验数据的统计方法是否恰当等等注意:在研究中重点应该放在研究问题的提出和研究设计上面当前11页,总共89页。第二节心理与教育统计学的内容依据心理与教育统计研究的问题性质分类描述一件事物的性质比较两件事物之间的差异分析影响事物变化的规律一件事物两种不同属性之间的相互关系取样方法依据统计方法的功能分类:描述统计(descriptivestatistics)推论统计(inferentialstatistics)实验设计(experimental
design)当前12页,总共89页。一、描述统计描述统计主要研究如何整理心理与教育科学研究或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。(一)数据如何分组,如何使用各种统计图表描述一组数据的分布情况。(第二章)(二)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌。(第三、四章)(三)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数的计算方法等等。(第五章)当前13页,总共89页。二、推论统计推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。推论统计是统计学中较为重要、应用较多的内容。(六、七、八、九、十一、十二)(一)如何对假设进行检验。(第八、九、十二章)(二)总体参数特征值的估计方法。(第七章)(三)各种非参数统计方法。(第十、十一章)当前14页,总共89页。三、实验设计实验设计主要目的在于研究如何科学地、经济地以及更有效地进行实验,它是统计学近几十年发展起来的一部分内容。(九、十二、十三、十四)当前15页,总共89页。第三节心理与教育统计学的发展统计工作自古就有古埃及为建金字塔征税而对人口和财产进行调查统计中国古代大禹划全国为九州,分田赋为九等统计学作为一门科学始于19世纪统计学随社会发展和科技进步而应用范围不断扩大,由社会经济扩展到自然科技,形成了经济统计学和数理统计学两个系统,数理统计学又经历了描述统计学和推断统计学两个阶段。心理与教育统计作为统计学的分支随着数理统计的发展而发展。当前16页,总共89页。第三节心理与教育统计学的发展1904年美国人桑代克()写的《心理与社会测量导论》(AnIntroductiontotheTheoryofMentalandSocialMeasurements),竭力以心理学和统计学为工具研究教育学,使教育科学化,可以认为是世界上第一本有关教育与心理统计学的专著。当前17页,总共89页。第四节心理与教育统计基础概念一、数据类型二、变量、观测量、随机变量三、总体、样本与个体四、次数、比率、频率与概率五、参数和统计量当前18页,总共89页。一、数据类型(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据当前19页,总共89页。(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类计数数据(countdata):是指计算个数的数据。测量数据(measurementdata):是指借助于一定的测量工具或一定的测量标准而获得的数据。当前20页,总共89页。(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。称名数据(nominaldata):只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式。只计算个数,并不说明事物之间差异的大小。如大学生的专业类别、性别、学校、学号、房间号码、电话号码、邮政编码等。顺序数据(ordinaldata):是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学习成绩的优良中差;个子的高中低;名次、等级等。等距数据(intervaldata):是有相等的单位,但无绝对零的数据,只能使用加减运算,不能使用乘除运算。如温度、各种能力分数、智商等。
比率数据(ratiodata):既表明量的大小,也有相等的单位,同时还具有绝对零点。既能进行加减运算,又能进行乘除运算。如身高、体重、长度、时间、各种感觉阈值的物理量等。当前21页,总共89页。(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据离散数据(discretedata):又称不连续数据。由不同的、不可分割的类别组成。在两个相邻的类别之间不存在其他的值。如名次、人数。连续数据(continuousdata):指任意两个数据点之间都可以细分出无限多个大小不同的数值。如年龄、长度、重量、自信的分数等。离散数据在数轴上表示一点连续数据在数轴上表示一段距离当前22页,总共89页。二、变量、观测量、随机变量变量(variables):指心理与教育实验、观察、调查中想要获得的数据。数据获得前用“X”表示,即为一个可以取不同数值的物体的属性或事件,其数值具有不确定性,因而称它为变量。一旦确定了某个值,就称这个值为某一变量的观测值(observation),也就是具体数据(data)。随机变量:在统计学上,把取值之前不能预料取到什么值的变量称为随机变量。与变量相反的是常数,它在一定范围内其数值不会随意改变。随机变量一般用大写字母X、Y表示。X1,X2,……Xn表示一列随机变量。当前23页,总共89页。三、总体、样本与个体(一)总体(population):又称母全体、全域,指具有某种特征的一类事物的全体。总体大小随研究的问题而改变。(二)个体(individual):构成总体的每个基本单元。(三)样本(sample):从总体中抽取的一部分个体,称为总体的一个样本。样本是由总体的一部分构成的。(四)样本大小(samplesize)或样本容量(capacityofsample):实验中被试的数目,或一个观测重复的次数。通常用n表示。(即样本所包含的个体数)总体容量:总体所包含的个体数,用N表示。n>30(或50),大样本;n≤30(或50),小样本。总体所包含的个体有时是有限的,有时是无限的。当前24页,总共89页。四、次数、比率、频率与概率次数:指某一事件在某一类别中出现的数目,又称为频数(frequency),用f表示。比率:两个数的比。比例:当所比的两个数中,分子所表示的事物是做分母的那个数(基数)所表示事物的一部分时,比率又称为比例,百分数或百分率是比例的另一种表示形式。频率又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通常用比例或百分数表示。数学定义:若在相同条件下进行n次随机实验,事件A发生m次(0≤m≤n),则称m/n为事件A发生的频率。概率又称机率、或然率(probablity),用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率。数学定义:如果随着实验次数n的增加,A的频率m/n稳定于某一常数P,则称此常数P为事件A的概率。当前25页,总共89页。五、参数和统计量参数(parameter):又称总体参数,是描述一个总体情况的统计指标。统计量(statistics):又称特征值,描述样本的特征值。当前26页,总共89页。五、参数和统计量统计量(英文字母)参数(希腊字母)区别1.描述一组数据情况的特征的统计指标1.描述总体统计情况的指标2.统计量已知,并不能确切地知道总体的分布特征2.参数已知,总体的分布特征也就等于知道了3.总体无限时,统计量和参数是两个截然不同的数联系从数字计算上讲,如果总体个数已知,两者完全一样,把总体当样本时也相同。当前27页,总共89页。一些参数和统计量的表示方法参数(总体)统计量(样本)平均数M、标准差、方差相关系数r回归系数当前28页,总共89页。第二章统计图表第一节数据的初步整理第二节次数分布表(重点难点)第三节次数分布图(重点难点)第四节其他类型的统计图表本章主要介绍对数据进行初步整理的方法和各种统计图表的制作与应用。统计表和统计图是对数据进行初步整理,以简化的形式表现数据的两种最简单的方式。优点:简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点。当前29页,总共89页。第一节数据的初步整理一、数据排序二、统计分组三、统计表四、统计图当前30页,总共89页。一、数据排序数据排序就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。排列后会使数据之间的某种关系有所显示。数据排序是整理数据最简单的方法。排序方法:升序和降序。不同数据的排序字符型数据:汉字按拼音或笔画;英文按字母顺序数值型数据:排序后可以划分等级,确定名次。等级的划分要看数据及其所反映的事物本身的性质和研究目的而定。如智商、身高、跑步时间、错误次数等。当前31页,总共89页。使用spss进行数据排序方法一:使用右键功能方法二:Data-sortcases当前32页,总共89页。二、统计分组所谓统计分组,就是根据被研究对象的特征,将所得数据划分到各个组别中去。(一)统计分组前的准备(二)统计分组应注意的问题(三)分组的标志当前33页,总共89页。(一)统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。当前34页,总共89页。删除数据的原则1、在这个过程中,切忌随心所欲地删除那些不符合自己主观假设的数据。2、在心理与教育科学研究中,常常会收集到一些变异性较大的实验数据。在进行整理时,如果没有充足的理由证明某数据是由实验中的过失所造成,就不应轻易将其排除。如果要删除它们,也应遵循三个标准差准则。当前35页,总共89页。(二)统计分组应注意的问题1、分组要以被研究对象的本质特征为基础。(如性别,年级)2、分类标志要明确,要能包括所有的数据。这就需要遵循两个原则:周延原则和相斥原则。(1)周延:分类完整而不遗漏。周延原则:在某一标志下所分的各类能包含所有应包含的个体,任何一个个体必须有一类可归,绝不能有无类可归的个体。(2)相斥:对类别的安排不会混淆。相斥原则:凡能归入某一类的个体只能归入这一类,绝没有归入其他一类的可能。注意:可以采用二分法,或者采用“其他”选项当前36页,总共89页。(三)分组的标志分组标志按形式大致可分为性质类别与数量类别两种1、性质类别。主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。性质类别可根据事物的性质及研究的需要分成不同的层次,每个层次又可分为不同数量的细目。普通话考试等级一级甲等一级乙等;二级……2、数量类别。这是以数据取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来对原始数据排序和分类以后,数量小的就可以直接计算,数量大时再做进一步分组,编制统计表、统计图为以后的分析打下基础。当前37页,总共89页。使用spss进行数据分组Transform->Record->differentVariables先定义一个新的变量名,然后点击OldandNewValues指定分组的范围当前38页,总共89页。三、统计表1、定义:统计表是用来表达统计指标与被说明事物之间数量关系的表格。统计指标:在对数据进行统计分类以后,得到的各种数量结果称为统计指标。2、作用:简洁、清晰、准确、一目了然,明显地反映出事物的全貌及其蕴含的特征,省去冗长的文字叙述,便于分析、比较、计算和记忆。3、结构:表号、名称、标目、数字、表注。心理学研究中常常要求用三线表,不同于一般的制表当前39页,总共89页。二、描述统计学历人数百分比(%)本科以上30088711.6大专56686321.8中专以下172975066.6合计2596900100.0表11983年我国普通中学教师学历统计表注:引自《中国教育成就统计资料》,1984年人民教育出版社当前40页,总共89页。A、统计表的内容要简要,最好一个表说明一个中心内容。标题的措词要简明扼要,正确说明内容,使人一望便知。B、分项要准确,以能说明问题为主,分项的好坏是决定统计表质量的关键,切忌分项太细。C、数据是统计表的语言,说明内容,要求准确,书写整齐,一律用阿拉伯数字,单位要统一,位数对齐,有效数字要一致,表格内不能有空白。D、线条不要太多,表的上下端有顶线与底线,左右两边不要用线封死,纵项目用细线格开,横项目一律不画线条,合计项目用粗线条或双线与其它项目分开。制表的一般要求当前41页,总共89页。使用spss生成所需表格Analyze-Tables当前42页,总共89页。四、统计图1、定义:指利用几何的点、线、面、体和色彩的描述把所研究对象的特征、内部结构、相互关系和对比情况等方面的统计数据绘制成整齐、简明的图形。2、作用:直观、形象、简明扼要、清晰易懂、便于学习和记忆。缺点:不精确。弥补方法:统计图和统计表同时出现。3、形式:一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。4、结构:图号、图题、图目、图尺、图形、图例、图注。当前43页,总共89页。人数706050403020101980年1985年1991年某校近十年教师人数及性别变化图示男女年份图例图形图目图尺(制图的尺度线。点、单位的总称)图题当前44页,总共89页。使用spss制作统计图使用Graphs命令当前45页,总共89页。第二节次数分布表一、简单次数分布表二、分组次数分布表三、相对次数分布表四、累加(累积)次数分布表五、双列次数分布表六、不等距次数分布表当前46页,总共89页。一、简单次数分布表简单次数分布表就是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。次数分布由两个部分组成:第一个部分是分组。分组的标志可以是品质的,如性别;也可以是按照数量特征的具体值或数值的一定范围来分组(分组次数分布表)。第二个部分就是与各个组相对应的次数。如表2-2。例:将下列数据放入一个简单次数分布表中。2、3、1、2、5、4、5、5、1、4、2、2。当前47页,总共89页。使用spss生成频数分布表Analyzes-Descriptivestatistics-Frequencies当前48页,总共89页。其他常用的统计图表绘制统计图的要求A、根据数据和目的选择合适的图形B、图形所表示的面积或距离要比例适当C、表示不同的事物要用不同的颜色与线条类型:1直条图2圆形图3曲线图4直方图讲师42.9%助教28.8%
教授0.4%某大学教师职称图副教授21.9%某市7至18岁男女生身高比较图1.751.701.651.601.551.501.451.40岁789101112131415161718米某校某班50名学生家庭背景情况比较2015105人数其他农工商企业职员公务与科教人员14161552015105人数其他农工商企业职员公务与科教人员1416155当前49页,总共89页。第三章集中量数常见的集中量数:算术平均数中数众数加权平均数几何平均数调和平均数当前50页,总共89页。数据的特征集中趋势和离中趋势是数据的两个基本特征。一组变量的次数分布,一般至少要具有这两个特征,这两个特征又称为:1、中心位置:用来度量一组数据的集中趋势。描述它们的中心位于何处。对其数量化描述称为位置量数或集中量数。2、离散性:反映一组数据的分散程度,即次数分布的离散程度。对其数量化描述称为次数分布变异特性的度量或差异量数。当前51页,总共89页。几个基本概念集中趋势:数据取值向分布中心集中的趋势。离中趋势:数据取值从分布中心向外分散的趋势。集中量数:描述数据集中趋势或集中程度的统计量。差异量数:描述数据的离中趋势或离散程度的统计量。地位量数:一个特定的观察值在整个次数分布中占有一定的等级位置,描述这个位置的指标就是地位量数。当前52页,总共89页。算术平均数算术平均数简称平均数或均数、均值(mean),是用以度量连续变量次数分布集中趋势的最常用的集中量数。统计实践中常设计总体平均数和样本平均数平均数的特点离均差之和为0;每个数加上一个常数后的新数列的平均数为原平均数加这一常数;每个数乘以一个常数后的新数列的平均数为原平均数乘以该常数平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。当观测次数无限增加时,算术平均数趋近于真值。当前53页,总共89页。算术平均数平均数的优缺点优点:1、反应灵敏;2、计算严密;3、计算简单;4、简明易懂;5、适合进一步代数运算;6、较少受抽样变动的影响缺点1、易受极端数据的影响修剪平均数也称截尾平均数,是从一组数据中去除一定百分比(如5%)的最大值和最小值数据后,再次计算的算术平均数。2、若出现模糊不清的数据时,无法计算平均数。当前54页,总共89页。算术平均数计算和应用平均数的原则:1、同质性原则同质数据:使用同一观测手段、采用相同观测标准、能反映同一问题的同一方面特质的数据2、平均数与个体数值相结合的原则3、平均数与标准差、方差相结合的原则当前55页,总共89页。中数中数又称中点数、中位数、中值,符号为Md或Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数中,有一半的数据比它大,有一半的数据比它小。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据按大小顺序排列,中数恰好位于中间,它将数据的数目分成较大的一半和较小的一半。例,有下列9个数:13、14、9、8、7、4、10、11、12,求其中数。例,有下列8个数:13、14、9、8、7、4、10、11,求其中数。当前56页,总共89页。中数中数的优缺点1、优点:计算简单,容易理解,不受极端数值的影响2、缺点:(1)中数的计算不是每个数据都加入,其大小不受制于全体数据。(2)反应不够灵敏,极端值的变化对中数不产生影响。(3)中数受抽样影响较大,不如平均数稳定。(4)计算时需要对数据先排列大小。(5)中数乘以总数与数据的总和不相等(除非:中数=平均数)。(6)中数不能作进一步代数运算。3、使用条件:(1)当一组观测结果中出现两个极端数目时。(2)当次数分布的两端数据或个别数据不清楚时,可以取中数作为集中趋势的代表值。(3)当需要快速估计一组数据的代表值时,也常用中数。当前57页,总共89页。众数(mode)众数(Mo)又称为范数、密集数、通常数等,是指次数分布中出现次数最多的那个数的数值。它也是一种集中量数,也可用来代表一组数据的集中趋势。1、优点:简单明了,容易理解,不受极端数值的影响。2、缺点:(1)不稳定,受分组影响,也受样本变动影响。(2)计算时不需每一个数据都加入,反应不够灵敏。(3)用观察法得到的众数,不是经过严格计算而来的,用公式计算所得众数也只是一个估计值。同时,众数不能作进一步代数运算。(4)总数乘以众数,也与数据总和不相等。(除非众数=平均数)当前58页,总共89页。众数众数的意义与应用使用情况(1)当需要快速而粗略地寻求一组数据的代表值时。(2)当一组数据出现不同质的情况时,可用众数表示典型情况。(3)当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数。(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标。(5)当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。有时候还有多众数。当前59页,总共89页。平均数、中数、众数三者之间的关系正态分布中:M=Md=Mo正偏态(左偏):M>Md>Mo负偏态(右偏):M<Md<Mo皮尔逊研究发现,它们三者之间存在着这样的经验关系:Mo=3Md-2M。当前60页,总共89页。使用spss计算集中量数Analyze-report-casesumerieses当前61页,总共89页。第四章差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。常见差异量数有:全距、四分位差、百分位差、平均差、标准差和方差等等。当前62页,总共89页。全距和百分位差全距:全距又称两极差,用符号R表示。它是说明数据离散程度的最简单的统计量,也是最粗略的差异量。它是观测值中最大值与最小值之差。全距越大,表明观察值分布越分散,反之越集中,越整齐。甲组:0、81、83、85、87、89乙组:70、75、80、85、90、95它计算简单,但易受极端数值的影响,有时不能反映实际的差异程度。一般只在编制次数分布表时使用。当前63页,总共89页。全距和百分位差百分位差:以全距表示一组数据的离散程度时会受极端数据的影响,很不准确。因此有人提出取消两段10%的数据,即用P10和P90之间的距离作为差异量数四分位差:指在一次次数分配中,中间50%的次数的距离的一半。在一组数据中,它的值等于P25到P75距离的二分之一。这个差异量数能够反映出数据分布中中间50%数据的散布情况。四分位差通常与中数联系起来共同应用。与全距相比,用百分位差表述数据的离散情况稍微好一些。如在两极端数据不清楚时,可以计算四分位差。但是由于它没有把全部数据考虑在内,其稳定性会差一些。还有,不适合代数方法运算,反应也不够灵敏,所以用的不多。当前64页,总共89页。使用spss计算百分位差计算全距:Analyzes-Descriptivestatistics-Descriptives计算百分位差:方法一:Analyzes-Descriptivestatistics-explore-statistics-percentiles方法二:Analyzes-Descriptivestatistics-Frequencies当前65页,总共89页。平均差平均差:表示方法:A.D.或M.D.或AD平均差是次数分布中所有原始数据与平均数绝对离差的平均值。优点:反应灵敏。每个数据都参与了计算,所以能较好地反映次数分布的离散程度。意义明确。如果将一个观测值与平均数的离差看作误差,平均差就是误差平均的结果,离差有正有负,和为0,所以取绝对值。缺点:计算时用绝对值,不适合进一步代数运算,这大大限制了它的应用范围。当前66页,总共89页。使用spss计算平均差在相关软件中没有直接计算平均差的功能,需要调用函数实际工作中一般用到标准差和方差计算方法:1、先求平均数(report或Descriptive),2、Transform-compute-调用Arthmetic(算数函数)中的ABS(返回绝对值函数)进行计算当前67页,总共89页。方差与标准差方差是离差平方的算术平均数,是每个数据与该组数据平均数之差乘方后的均值。方差也称变异数、均方。标准差是方差的平方根,用s或SD表示。(1)具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化。②计算公式严密确定。③容易计算。④适合代数运算。⑤受抽样变动影响小。⑥简单明了。(2)表示一组数据离散程度的最好指标。值越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。它们是统计描述与统计推断分析中最常用的差异量数。当前68页,总共89页。方差与标准差性质方差作为一组数据中各种变异总和的测量,具有可加和可分解的特点,常用来分解和确定不同来源的变异性。标准差是方差平方根,不可以进行代数运算。但其优点是:观测值加上一个常数后的新数列的标准差为原标准差与该常数之和;观测值乘以某一常数后形成的新数列的标准差为原标准差的常数倍。当前69页,总共89页。使用spss计算方差和标准差Report、Descriptive、explore以及其他统计过程中都可以显示差异量数当前70页,总共89页。方差与标准差的应用1、同一团体不同观测值离散程度的比较。2、对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。当前71页,总共89页。不能直接比较标准差的情况:1、两个或两个以上样本所使用的观测工具不同,所测得的性质不同。2、两个或两个以上样本所使用的是同一种观测工具,所测得的特质相同,但样本间的水平相差极大。(通常这种情况下,平均数的值较大,其标准差的值一般也较大;平均数的值较小,其标准差的值也较小。)当前72页,总共89页。相对差异量数相对差异量数:绝对差异量数与其集中量数的比差异系数:例1:某校高考考生语文科平均分为63分,标准差为11分,数学科平均分为75分,标准差为12分,试比较该校考生哪一科离散程度大。同样是跳远,假定大学生平均成绩为4米,标准差为0.3米;小学生平均成绩为1米,标准差也是0.3米,这两组数据的离散程度一样吗?当前73页,总共89页。标准分数标准分数(standardscore),又称基分数或Z分数(Z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。计算公式:测验一个班级的数学成绩,平均数为80分,标准差为8分;又测验了该班的语文成绩,平均分为70分,标准差为5分。某生在数学测验中得81分,在语文测验中得78分,问该生各科的标准分数是多少?当前74页,总共89页。标准分数的性质1、Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。2、一组原始分数转换得到的Z分数可以是正值,也可以是负值。3、一组原始数据中,各个Z分数的标准差为1,即sZ=1。4、若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布。当前75页,总共89页。标准分数的优点1、可比性。标准分数以团体平均分作为比较的基准,以标准差为单位。因此,不同性质的成绩,一经转换为标准分数(平均数为0,标准差为1),相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性。2、可加性。Z分数是一个不受原始分数单位影响的抽象化数值,能使不同性质的原始分数具有相同的参照点,因而可以相加。3、明确性。知道了某一被试的标准分数,利用标准正态分布函数值表,可以知道该分数在全体分数中的位置,即百分等级,也就知道了该被试分数在全体被试分数中的地位。所以,标准分数较原始分数意义更为明确。4、稳定性。原始分数转换为标准分数后,规定标准差为1,保证了不同性质的分数在总分数中的权重一样。当前76页,总共89页。标准分数的应用1、用于比较几个分属性质不同观测值在各自数据分布中相对位置的高低。例,已知某班期末考试中语文的平均分为80,标准差为10;数学的平均分为70,标准差为15;英语的平均分为85,标准差为12。某生的语文成绩为85分,数学成绩为82分,英语成绩为90分,问该生这三科成绩哪一科最好?当前77页,总共89页。标准分数的应用2、计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。例,已知某班期末考试中数学、语文和外语的平均分和标准差分别为:数学:80,10;语文:75,5;外语:85,8。现有两位学生,成绩分别是:甲生:数学85,语文75,外语77;乙生:数学70,语文90,外语75。试判断哪一位学生总成绩更高些?当前78页,总共89页。标准分数的应用3、表示标准测验分数韦氏智力量表:IQ=15Z+100比奈-西蒙智力测验:Z'=16Z+100普通分类测验:Z'=10Z+100当前79页,总共89页。使用spss计算Z分数Analyzes-Descriptivestatistics-Descriptives,勾选“savestandardizedvaluesasvariables”复选框当前80页,总共89页。第五章相关关系第一节相关、相关系数与散点图第二节积差相关第三节等级相关第四节质与量的相关第五节品质相关(独立性检验)第六节相关系数的选用与解释当前81页,总共89页。第一节相关、相关系数与散点图集中量数和差异量数主要用来描述单变量数据资料的分布特征,相关系数则用于描述双变量数据(bivariatedata)相互之间的关系。所谓双变量,是指对于一个变量X的每一个观测值X1、X2、…,XN,同时有另一个变量Y的相应观测值Y1、Y2、……、YN与之对应。相对于“单变量总体”,这种成对变量所组成的集合,叫做双变量总体。当前82页,总共89页。第一节相关、相关系数与散点图事物之间的相互关系:1、因果关系:一种现象是另一种现象的原因,而另一种现象是果。数学上的函数关系都是因果关系。2、共变关系:表面上有联系的两种事物或现象都与第三种事物或现象有关,而这两种事物实际上没有关系,这时这两种事物之间的关系便是共变关系。(偏相关)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商业大楼管桩施工合同
- 员工离职补偿金协议书
- 学校扩建室外管网改造施工合同
- 电影院放映室安全门施工协议范文
- 郑州别墅买卖合同要点解析
- 飞行员劳动合同签订流程
- 仓储物流快递租赁合同
- 区块链产品技术协议管理办法
- 风力发电场防火门施工合同
- 生态公园绿化改造合同协议书
- 进入答辩环节的高职应用技术推广中心申报书(最终版)
- 高等数学(理工)Ι知到章节答案智慧树2023年重庆科技学院
- 2023学年完整公开课版瑶族
- 高考模拟作文“同舟共济渡难关团结合作创未来”导写及范文
- 翻译技术实践知到章节答案智慧树2023年山东师范大学
- 尾矿库基本知识
- 三年级体质健康数据
- 矿山企业新员工入职公司三级安全教育培训必备教材(全套)
- 感染性休克指南
- GB/T 32891.2-2019旋转电机效率分级(IE代码)第2部分:变速交流电动机
- 《煤炭企业发展的PEST分析报告(3500字)》
评论
0/150
提交评论