心理统计学课件详解_第1页
心理统计学课件详解_第2页
心理统计学课件详解_第3页
心理统计学课件详解_第4页
心理统计学课件详解_第5页
已阅读5页,还剩190页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计学课件详解演示文稿当前1页,总共195页。(优选)心理统计学课件当前2页,总共195页。统计学是一种思想方法从用事实说话到用概率说话当前3页,总共195页。心理统计学的发展(一)统计学的基础——概率论和正态分布的产生16世纪至17世纪中期。伽利略提出概率论基本理论,法国数学家帕斯卡和费马在讨论解决赌博难题中,创立了概率论,为统计学的发展奠定了重要理论基础。17世纪末18世纪。瑞士数学家贝努里提出概率论运用于社会及经济事务领域,为正态分布发现创造了条件。之后,数学家高斯等人独自发现了正态曲线方程,并首次提出正态分布曲线。19世纪初,法国数学家泊松提出“大数定理”,并导出了在概率论与数理方程中有重要应用的泊松积分。这些数学家为概率论的发展做出了很大贡献当前4页,总共195页。心理统计学的发展(二)数理统计学的发展——描述统计学与推论统计学19世纪末,英国数学家高尔顿,在生物学、优生学、心理学等研究中,努力探索简化数据的途径和方法,提出了中位数、百分位数等描述统计最为重要的概念;并与他的学生皮尔逊共同提出了相关和回归的概念。1900年,皮尔逊系统推导并阐明了配合度检验方法,将相关理论扩展到许多领域,为大样本理论奠定了基础。1908年,皮尔逊的学生格赛特有感于大样本理论的限制,开始建立小样本理论,提出t分布理论,开辟了在样本数目较小的情况下进行统计推论的新途径。1923年,经费舍数理论证,t检验得到承认并推广。然后,费舍还提出了F分布,使得方差分析系统化,是推论统计的真正创始者。当前5页,总共195页。心理统计学的内容心理统计描述统计实验设计推论统计统计图表差异量数集中量数相关分析统计估计参数检验参数估计非参数估计点估计区间估计假设检验非参数检验样本选择与分配实验误差分析方差分析协方差分析回归分析……当前6页,总共195页。描述统计(descriptive

statistics)主要研究如何整理心理科学实验领域调查得来的大量数据,描述一组数据的全貌。数据如何分组,如何使用各种统计图表描述一组数据的分布情况怎样计算一组数据的特征值,描述数据集中情况和分散情况的各种特征值计算与表示方法。如:平均数、中数、众数;平均差、标准差、变异系数等。表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件。通过描述统计,我们使杂乱无章的数字更好地显示出事物的某些特征,有助于说明问题的实质。当前7页,总共195页。推论统计(inferentialstatistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。如何对假设进行检验,大样本检验方法(Z检验),小样本检验方法(t检验)等。总体参数估计方法,估计理论主要是根据随机抽样的结果来估计总体分布的参数值。统计检验主要根据实际的抽样结果来推论有关总体特征的假设是否与具体的随机抽样所提供的信息相一致。实验设计(experimentaldesign)主要目的在于研究如何科学有效地进行实验。作为一个严谨的实验研究,在实验以前要对基本步骤、取样方法、条件控制、结果数据的统计分析方法等作出严格的规定。当前8页,总共195页。集中量数学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合学习内容众数中位数平均数

众数、中位数和平均数的比较当前9页,总共195页。集中趋势

(centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值当前10页,总共195页。众数

(mode)(1)经验公式法(皮尔逊)只能作为一个近似值当前11页,总共195页。众数

(mode)当前12页,总共195页。众数

(mode)例:当前13页,总共195页。众数

(原始数据)无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:252828

364242当前14页,总共195页。分类数据的众数

(次数最多的那个组)不同品牌饮料的次数分布

饮料品牌次数相对次数百分数(%)

可口可乐

旭日升冰茶

百事可乐

汇源果汁

露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即

Mo=可口可乐当前15页,总共195页。顺序数据的众数解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即

Mo=不满意甲城市家庭对住房状况评价的次数分布回答类别甲城市次数(户)百分数(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510合计300100.0当前16页,总共195页。众数的意义与应用

(1)当需要快速而粗略地寻求一组数据的代表值时(2)当一组数据出现不同质的情况时,可用众数表示典型情况。如工资收入、学生成绩等常以次数最多者为代表值(3)当次数分布中有两极端的数目,除了一般用中数外,有时也用众数(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标当前17页,总共195页。中位数

(median)按大小排序后处于中间位置上的值Mdn50%50%2、这个数可能是数据中的某一个,也可能根本不是原有的数。当前18页,总共195页。数值型数据的中位数

(奇数个数据的算例)【例】

9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234

5

6789中位数1080当前19页,总共195页。数值型数据的中位数

(偶数个数据的算例)【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

56

78910中数为居于中间位置两个数的平均数当前20页,总共195页。数值型数据的中位数

(重复数据的算例)【例】1、3、5、6、6、8、95.566.5Mdn=5.75【例】1、3、5、6、6、6、8、95.566.55.836.17Mdn=5.83当前21页,总共195页。顺序数据的中位数

(例题分析)解:中位数的位置为300/2=150从累计次数看,中位数在“一般”这一组别中中位数为

Mdn=一般甲城市家庭对住房状况评价的次数分布回答类别甲城市次数(户)累计次数

非常不满意

不满意

一般

满意

非常满意24108

93453024132225270300合计300—当前22页,总共195页。分组数据的中位数其中:

:中数所在组的实下限

:中数所在组以下各组次数之和(以下累积次数)

:中数所在组的次数

:组距当前23页,总共195页。例子:**中数组的寻找方法:由下往上找,第一个大于N/2的组。解:区组fF76-72-68-64-60-81225107625442177当前24页,总共195页。中数的优缺点与应用(1)当一组观测结果中出现两个极端数目时①当一组观测结果中出现两极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值(3)当需要快速估计一组数据的代表值时,也常用中数当前25页,总共195页。中数的优缺点与应用(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值区当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数而不能计算平均数。(3)当需要快速估计一组数据的代表值时,也常用中数当前26页,总共195页。平均数当前27页,总共195页。算术平均数(arithmeticmean)1定义:设一组数据为:x1,x2,…,xn

所有观测值的总和除以观测数值的个数所得的商数。2、计算方法(1)原始数据的计算方法例:某小组10个学生的数学测验分数为:79、62、84、90、71、76、83、98、77、78,其算术平均数为:简单均值当前28页,总共195页。(2)分组数据的计算方法

(组中值计算法)分组区间次数(f)组中值(Xc)95-90-85-80-75-70-65-60-55-50-45-657778320219792878277726762575247N=48方法:把组中值看成每一分组的平均数当前29页,总共195页。当前30页,总共195页。平均数的特点1、各变量值与均值的离差之和等于零

2、所有的观测值都加上常数C,则平均值也增加常数C3、所有观测值都乘以不等于0的常数C,则平均值也增大C倍当前31页,总共195页。平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。在科研实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反应时间,用计时器进行测量,人们是想测到真正的反应时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值。当前32页,总共195页。平均数的优缺点算术平均数具备一个良好的集中量数应具备的一些条件:①反应灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。②确定严密。计算平均数有确定的公式,不管何人,在何种场合,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。③简明易解。平均的概念简单明白,容易理解。较少数学抽象。④计算简单。计算公式只是用简单的四则运算。⑤符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x,以及将要讲到的求方差等等。⑥较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。当前33页,总共195页。平均数的优缺点但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:①易受极端数据的影响。由于平均数反应灵敏,因此数据中若出现极端数据(或大或小),就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低,并且不符合实际情况。②若出现模糊不清的数据时,无法计算平均数,因为计算平均数时需要每一个数据都加入计算。在次数分布中只要有一个数据含糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。此外,必须注意,凡不同质的数据不能计算平均数。当前34页,总共195页。加权平均数有些测量中所得数据,其单位权重并不相等。这时若要计算平均数,就不能用算术平均数,而应该使用加权平均数。例如:高校入学考试共包括语文、政治、外语、数学、物理、化学及生物?科,而计算总分时并不是各科平等,在语文、政治等科都以100为满分的情况下,数学定120分,生物定50分,也是考虑到各门学科的相对重要性而进行加权的结果。当前35页,总共195页。加权平均数当前36页,总共195页。分组数据:设一组数据为:x1,x2,…,xk各组的组中值为:XC1,XC2,…,XCk

相应的频数为:f1,f2,…,fk当前37页,总共195页。某电脑公司销售量数据分组表按销售量分组组中值(XC)次数(fi)Xcfi

140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—12022200当前38页,总共195页。几何平均数(geometricmean)

n个变量值乘积的

n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为5.可看作是均值的一种变形其中,n:数据的个数

X:变化的比例数据当前39页,总共195页。在心理和教育科学研究的数据处理过程中,应用几何平均数表示集中趋势,有两种情形。1.直接应用基本公式计算几何平均数。属于这种情况是:一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态。这时若计算算术平均数也会出现偏大或偏小,平均数就不能很好地反映一组数据的典型情况。而用几何平均数作为集中趋势的代表,就比算术平均数优越。在心理与教育实验中,有部分数据变异较大的情况经常出现,这种场合除应用中数或众数外,时常应用几何平均数。而在心理物理学的等距与等比量表实验中,只能用几何平均数。2.

应用几何平均数的变式计算。属于这种情况有:一组数据彼此间变异较大,几乎是按一定的比例关系变化。如教育经费的逐年增加数,学习、阅读的进步数,以及学生人数的增加数等等。在上述所举的几方面研究中,一般不求平均数,而是求平均增长的比率,如教育经费的平均年增长率,学校人数的年增长率,学习的平均进步率,阅读速度的平均增加率等等。这时都要用几何平均数计算平均比率,而不用算术平均数计算。当前40页,总共195页。【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。年平均增长率=114.91%-1=14.91%当前41页,总共195页。【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率比较:算术平均:

几何平均:当前42页,总共195页。调和平均数(harmonicmean)主要是用以描述学习速度方面的问题。调和平均数作为集中量数之一,在描述速度方面的集中趋势时,优于其他集中量数。在有关研究学习速度的实验设计中,一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。二是学习的时间一定。记录一定时间内务被试所完成的工作量。由于反应的指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。当前43页,总共195页。调和平均数(harmonicmean)计算公式为原来只是计算时使用了不同的数据!其中,N:数据个数

X:具体的变量值当前44页,总共195页。例:有一学生15分钟学会生词30个,后10分钟学会生词也是30个,问该生每分钟平均学会多少?解:由题可得:答:当前45页,总共195页。众数、中位数和平均数的比较当前46页,总共195页。众数、中位数、平均数的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响计算方便,反应灵敏数据对称分布或接近对称分布时应用当前47页,总共195页。众数、中位数和平均数的关系负偏分布均值

中位数

众数对称分布

均值=中位数=

众数正偏分布众数

中位数均值当前48页,总共195页。作业三:1、对于下列实验数据:1,100,11,9,5,6,9,9,7,11,9,描述其集中趋势用__________最为适宜,其值是__________。2、求下列次数分布的平均数、中数、众数。当前49页,总共195页。数据离散趋势当前50页,总共195页。离散趋势极差 R平均差 A.D.标准差 S.D.(σ)变异系数 Vσ当前51页,总共195页。在心理统计学中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。例如,在考察同一个年级中几个教学班的某科成绩时,通常会遇到有些班级平均成绩相同,但整齐程度不同,如果只比较平均成绩并不能真实地反应这些班级对课程学习的全貌;我们只有对班成绩分数的离散程度也进行度量,才能做到较全面的描述。因此,我们需要采用差异量数来反映数据的总体情况,除了必须求出集中量数外,还要使用差异量数。它是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。

当前52页,总共195页。标志变异指标的计算(一)极差(全距)R1.全距是总体中最大的观察值和最小观察值之差,

极差表明观察值在总体范围内变动的最大距离,极差大说明平均数的代表性小,极差小说明平均数的代表性大。当前53页,总共195页。2.全距的特点

优点:计算方便,易于理解。

缺点:只考虑数列两端数值差异,方法粗略。

未分组或单项式:极差(R)=观察值最大值-观察值最小值组距式分组:极差(R)=末组上限-首组下限只针对闭口组当前54页,总共195页。

在生活中,我们常常会和极差打交道.班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子.例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。当前55页,总共195页。实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?计算可得两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?当前56页,总共195页。45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)甲成绩比较分散,乙成绩相对集中看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的角度来考察这两组数据.当前57页,总共195页。甲的环数极差=10-4=6乙的环数极差=9-5=4.

极差对极端值非常敏感,在一定程度上表明样本数据的的波动情况.但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是A组还是B组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标反应一组数据稳定程度的其它量――平均差、方差、标准差.当前58页,总共195页。

平均差是各单位标志值与其平均数离差绝对值的算术平均数。

1.概念:(二)平均差A.D.2.计算:

当前59页,总共195页。(二)平均差A.D.例:有5名被试的错觉实验数据如下,求其平均差:被试12345错觉量1618202217当前60页,总共195页。①根据全部标志值与平均数离差而计算出来的变异指标,能全面反映标志值的差异程度;②计算有绝对值符号,不适合代数方法的演算使其应用受到限制。3.平均差的特点:当前61页,总共195页。方差(Variance)也称变异数、均方。作为样本统计量,常用符号S2表示,作为总体参数,常用符号σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差是度量数据分散程度的一个很重要的统计特征数。标准差(Standarddeviation)即方差的平方根,常用S或SD表示。若用σ表示,则是指总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。方差、标准差当前62页,总共195页。一、方差与标准差的计算(一)未分组的数据求方差与标准差基本公式是:当前63页,总共195页。一、方差与标准差的计算上述公式中,都要先求平均数,再求方差和标准差。若平均数不一定是一个整数或者有除不尽的情况,那么在计算过程中就会引入计算误差,计算就会很繁冗,此时可以直接运用原始分数计算方差与标准差

当前64页,总共195页。一、方差与标准差的计算例1:计算6、5、7、4、6、8这一组数据的方差和标准差用平均数的方法:用原始数据方法:当前65页,总共195页。一、方差与标准差的计算(二)分组的数据求方差与标准差基本公式是:式中d=(Xc-AM)/i,AM为估计平均数Xc为各分组区间的组中值f为各组区间的次数N=Σf

为总次数或各组次数和i为组距。当前66页,总共195页。一、方差与标准差的计算分组

区间Xcfdfdfd2计

算96-93-90-87-84-81-78-75-72-69-66-63-60-979491888582797673706764612348111719141073l16543210—1—2—3—4—5—61215162422170—14—20—21—12—5—67275647244170144063482536

S2=32*(570/100-(28/100)2)=50.5944

S=7.113

i=3

Σf=100

Σfd=28Σfd2=570

具体步骤:

①设估计平均数AM;

②求d

⑧用f乘d,并计算Σfd;

④用d与fd相乘得fd2,并求Σfd2;

⑤代入公式计算。当前67页,总共195页。

计算下面数据的平均数和方差,体会方差是怎样刻画数据的波动程度的。(1)6666666

(2)5566677(3)3346899(4)3336999解(1)X=62S=0(2)X=6S=(3)X=6S=(4)X=6S=75427442742

方差越大,说明数据的波动越大,越不稳定.

方差越小,说明数据的波动越小,越稳定当前68页,总共195页。现在你能说说两队参赛选手年龄的波动的情况吗?

方差用来衡量一批数据的波动大小

(即这批数据偏离平均数的大小).S甲2=[(26-26.9)2+(25-26.9)2++(29-26.9)2]=2.89…S乙2=[(28-26.9)2+(27-26.9)2++(26-26.9)2]=0.89…

方差越大,说明数据的波动越大,越不稳定.

方差越小,说明数据的波动越小,越稳定S甲2>S乙2

乙的波动小些,数据更稳定当前69页,总共195页。从甲乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm)问:(1)哪一种玉米长得高?(2)哪种玉米的苗长得齐?当前70页,总共195页。在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧《天鹅湖》,参加表演的女演员的身高(单位:cm)分别是甲团163164164165165166166167

乙团163165165166166167168168哪个芭蕾舞团女演员的身高更整齐?S甲2=1.5S乙2=2.5∵S甲2<S乙2∴甲芭蕾舞团女演员的身高更整齐解:165X=甲166X=乙当前71页,总共195页。某快餐公司的香辣鸡腿很受消费者欢迎,为了保持公司信誉,公司严把鸡腿的进货质量,现有甲、乙两家农副产品加工厂到快餐公司推销鸡腿,两家鸡腿的价格相同,品质相近,快餐公司决定通过检查鸡腿的重量来确定选购哪家公司的鸡腿,检查人员以两家的鸡腿中各抽取15个鸡腿,记录它们的质量如下(单位:g):甲747475747673767376757877747273乙757379727671737278747778807175根据上面的数据,你认为快餐公司应该选购哪家加工厂的鸡腿?因为,所以选择甲厂鸡腿加工。当前72页,总共195页。二、方差与标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。它基本具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。当前73页,总共195页。二、方差与标准差的意义1、每一个观测值都加一个相同常数C之后,计算得到的标准差等于原来标准差。2、每一个观测值都乘以一个相同的常数C,则所得的标准差等于原来标准差乘以这个常数。3、以上两点项结合,每一个观测值都乘以同一个常数C,再加上一个常数D,所得的标准差等于原标准差乘以这个常数C。当前74页,总共195页。三、总标准差的合成除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。当前75页,总共195页。三、总标准差的合成

计算公式为:

当前76页,总共195页。三、总标准差的合成例:在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差:班级Ns14210316236110123509817

当前77页,总共195页。一、差异系数标准差的应用当所观测的样本水平比较接近,而且是对同一个特质使用同一种测量工具进行测量时,要比较不同样本之间离散程度的大小,一般可直接比较标准差或方差的大小-标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。标准差的单位与原数据的单位相同,因而有时称它为绝对差异量。在对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:①两个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?②即使使用的是同种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?当前78页,总共195页。

当前79页,总共195页。例

已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?解:

CV体重=3.7/25*100%=14.8%

CV身高=6.2/110*100%=5.64%通过比较差异系数可知,体重的分散程度比身高的分散程度大(14.8%>5.64%)。

当前80页,总共195页。例

通过同一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(14岁)学生的平均分数为

80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?解:

CV一年级=4.02/60*100%=6.7%

CV五年级=6.04/80*100%=7.55%答;五年级的测验分数分散程度大。

当前81页,总共195页。应用差异系数的注意事项:1、测量的数据保持等距的尺度,这时的平均数和标准差才有意义;2、观测工具应该具备绝对零在,因此差异系数常用于重量、长度和时间等方面;3、只能用于对一般相对差异量的描述,至今尚无有效的假设检验方法,不能进行统计推论。当前82页,总共195页。标准分数计算公式标准差的应用

当前83页,总共195页。标准分数的性质1、Z分数无实际的单位,是以平均数为参照点,以标准差为单位的一个相对量。2、一组原始分数转换成标准分可以是正值,也可以是负值。它表明的是原分数在该组数据中分布中的位置,故称为相对位置量数。3、在一组数据中所有由原分数转换得出的Z分数之和为零,其Z分数的平均数亦为零。4、一组数据中各Z分数的标准差为1当前84页,总共195页。标准分数的应用1、用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。例如有一人的身高是170厘米,体重是65公斤(也可以是另一人的体重),究竟身高还是体重在各自的分布中较高?这是属于两种不同质的观测,不能直接比较。但若我们知道各自数据分布的平均数与标准差,这样我们可分别求出z分数进行比较。设Z身高1.70=0.5,Z体重65=1.2,则可得出该人的体重离平均数的距离要比身高离平均数的距离远,即该人在某团体中身高稍偏高,而体重更偏重些。当前85页,总共195页。标准分数的应用2、计算不同质的观测值总和或平均值,以表示在团体中的相对位置。在计算平均数时,要求数据必须同质,否则会使平均数没有意义,但有时需要将不同质的数据合成,这时可采用Z分数。例如已知高考的各科成绩分布是正态分布,但是由于各科的难易度不同,因此,各科成绩就属于不同质的数据。以前常采取总和分数或求平均分数的方法,这是不科学的。如果应用Z分数求总和或平均数则更有意义。当前86页,总共195页。

科目原始分数甲

乙全体考生平均数

标准差Z分数甲

乙语文政治外语数学理化85

8970

6268

7253

4072

8770

lO65

569

850

675

81.500

1.9001.000

-0.600-0.125

0.3750.500

-1.667-0.315

1.500总计348

350

2.500

1.505例:下表是高考中两名考生甲与乙的成绩分数,根据考试成绩录取谁?如果按总分录取则取乙生,若按标准分数录取则应取甲生;为何会出现如此悬殊的差别?这是由于不恰当地计算总和分数造成的,因为各科成绩难易度不同,分散程度也不同;各门学科的成绩分数是不等价的,亦即数据是不同质的,这时应用总和分数不够科学,故此出现这类问题,科学的方法应当用Z分数合成。从Z分数可知甲生多数成绩是在平均数以上,即使有两种成绩低于平均数,差别也小。总之成绩较稳定且在分布较高处,而乙生则不然。可见应用Z分数更趋合理。当前87页,总共195页。

统计图表当前88页,总共195页。一、次数分布表次数分布表是对杂乱无序的数据进行整理的重要手段,它能使我们对样本情况有个初步的了解,为今后进一步分析和研究问题提供很大方便。当前89页,总共195页。1、简单次数分布表员工对主管尽职情况的评定人数①非常不尽职②不尽职③不置可否④尽职⑤非常尽职93010256总计80表3-180名员工对部门主管尽职程度调查结果当前90页,总共195页。2、分组次数分布表成绩组中值频数累积频数95~97.52290~92.52485~87.53780~52.551275~77.582070~72.5113165~67.594060~62.554555~57.544950~52.525145~17.5152合计5252表3-2某班学生数学成绩次数分布表当前91页,总共195页。编制分组次数分布表的步骤求全距R=Xmax-Xmin决定组距i和组数k列出分组区间登记次数计算每组数据的次数f抄录新表当前92页,总共195页。3.相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N)或百分比()来表示次数,就可以制成相对次数分布表。当前93页,总共195页。4、累加次数分布表

表3-3某班学生数学成绩累加次数分布表

成绩组中值频数累加频数累加百分比95~97.5223.8590~92.5247.6985~87.53713.4680~82.551254.0575~77.582038.4670~72.5113159.6265~67.594076.9260~62.554586.5455~57.544994.2350~52.525198.0845~47.5152100.0合计5252当前94页,总共195页。5、双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。

当前95页,总共195页。表3-431名学生视、听反应时测验结果听视100~120~140~160~180~200~220~Y230~210~190~170~150~130~110~1111211322331112111112478451X159843131当前96页,总共195页。二、次数分布图在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。绘制次数分布图可以用已有的计算机程序,如EXCEL,也可以用专门的统计程序。当前97页,总共195页。1、频数分布直方图直方图(histogram)又称为等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。当前98页,总共195页。例:根据第二讲中52个学生的数学成绩所作直方图图3-152名学生数学成绩分布的频数直方图4550556065707580859095100当前99页,总共195页。还可以做成下面这种形式图3-252名学生数学成绩次数分布直方图当前100页,总共195页。2、次数分布多边图次数分布多边形图(frequencypolygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。当前101页,总共195页。图3-352名学生数学成绩分布图人数当前102页,总共195页。图3-452名学生数学成绩分布图人数成绩当前103页,总共195页。利用次数分布多边图还可以把几组资料放在一起进行比较。但需要注意的是,这时必须把数据的次数换算成百分比。当前104页,总共195页。图3-545页数据的次数分布图当前105页,总共195页。图3-6不正确的比较图当前106页,总共195页。3、累积次数分布图根据累积次数,可以绘制累积次数分布图。右图是累积次数分布直方图。当前107页,总共195页。累积次数分布曲线当数据的总数较多时,将累积次数分布图中的横坐标以每一分组区间的精确上限或精确下限表示,纵坐标以累积次数表示,则可绘制累积次数分布曲线,即累积曲线。图3-8累积次数分布曲线当前108页,总共195页。累积曲线可用于判断一组数据的大致分布形态。图3-9正态分布数据的累积曲线当前109页,总共195页。图3-10正偏态数据累积曲线图3-11负偏态数据累积曲线当前110页,总共195页。二、计算机制作统计图表在心理与教育研究中常用的基本统计程序主要有两个:SPSS和SAS。其中以SPSS应用最多。SPSS是专门用于社会科学研究的统计分析工具:StatisticsPackageforSocialScienceSAS的开发主要是商业用途,因此功能更强大,但SPSS包含一些特殊的社会科学应用程序。当前111页,总共195页。浏览网上资料,看看常用的有哪些统计图。请利用书上的数据或自己收集数据,试做几个漂亮的统计图。当前112页,总共195页。练习某大学四年级80名学生的毕业成绩如下:

5683766880926981627857817170596666756148845093827270498469669374706956746885539761525850739352746581685354956872948269606685905767758255466847895767755183685550试编制一个完整的次数分布表。当前113页,总共195页。第二章统计量表(四)其他类型的统计图表1.简单表2.分组表3.复合表4.条形图5.圆形图6.线形图7.散点图当前114页,总共195页。第二章统计量表1.简单表只列出名称、地点时序或统计指标名称的统计表。未做任何划分。年

份国内生产总值(亿元)20012002200320042005109655.2120332.7135822.8159878.3182320.6合

计708009.5

我国近年来国内生产总值

当前115页,总共195页。第二章统计量表2.分组表只有一个分类标志的统计表,也称单向表。按一个标志分组。按产业分组国内生产总值(亿元)比重(%)第一产业第二产业第三产业22718.486207.673394.612.847.340.2合

计182320.6100

2005年国内生产总值分布表

当前116页,总共195页。第二章统计量表3.复合表统计分组的标志有两个或两个以上的表。当前117页,总共195页。第二章统计量表4.条形图用条形的长度来表式各事物间的大小与数量之间的差异。适用资料:离散型数据资料,即计数资料。当前118页,总共195页。第二章统计量表数据统计表问题1:根据下列数据列出统计数表4,5,6,1,2,8,4,7,9,8,1,5,6,4,2,7,9,3,4,5,8,7,6,2,4,5,8,6,5,6,8,9,8,9,6,8数字123456789频数

231556374当前119页,总共195页。第二章统计量表数字当前120页,总共195页。第二章统计量表制作条形统计图的步骤:1、根据图纸大小,画出两条互相垂直的射线。(注意:水平射线的下方和竖直射线左边须留有一定的空白,注明直条数量和统计的内容)2、在横轴上确定直条的位置。3、在纵轴上根据数量的多少确定单位长度。4、根据数量的多少画出长短不同的直条。(注意:直条的宽窄要一致,长短要准确,条与条之间间隔要均等)当前121页,总共195页。第二章统计量表作业当前122页,总共195页。第二章统计量表条形图和直方图有什么区别?当前123页,总共195页。第二章统计量表条形图与直方图的区别(1)描述的数据不同。称名数据;连续性数据。(2)表示数据多少的方式不同。长短或高低表示数据的多少和大小;用面积表示。(3)坐标轴上标尺分点意义不同。分类轴;刻度值。(4)间隔有间隔,但无意义;无任何间隙。当前124页,总共195页。第二章统计量表5.圆形图显示各部分在整体中所占的比重大小,以及各部分之间的比较。当前125页,总共195页。第二章统计量表制作扇形统计图的步骤:1、画一个圆。2、按各组成部分所占比例算出各个扇形的圆心角度数。3、根据算出的各圆心角的度数画出各个扇形,并标明相应的百分比,各比例的名称可以注明在图上,也可以用图例标明。(注意:各扇形可以用不同颜色表示,也可以用斜线、网状等不同线形表示)当前126页,总共195页。第二章统计量表6.线形图数字频数当前127页,总共195页。第二章统计量表6.线形图

用一定单位长度表示一定的数量,并根据数量的多少描出各点,然后把各点用线段顺次连接起来,形成折线,用折线的升降来表示数量之间的关系及变化趋势,这样的统计图叫作线形图。特点:线形图能够清晰的反映数据的变化趋势或情况。注意:线形图是把条形统计图各个长方形上边的中点用线段连接起来得到的当前128页,总共195页。第二章统计量表7.散点图如果要研究两个变量间的关系,比如身高与体重的关系,智商与学业成绩的关系。用直角坐标系中的横轴和纵轴分别表示两个变量,将每一个被观察的个体在这两个变量上的观测值作为坐标画点即可。当前129页,总共195页。第二章统计量表当前130页,总共195页。第二章统计量表当前131页,总共195页。第二章统计量表茎叶图对于未分组的数据,可用茎叶图显示其分布特征,由“茎、叶”两部分构成,图形由数字组成,茎在左,叶在右,用小数点(直线)把茎叶隔开。当前132页,总共195页。第二章统计量表作业1当前133页,总共195页。第二章统计量表再绘制简单次数分布图和累加次数分布图作业2作业3当前134页,总共195页。第二章统计量表作业4当前135页,总共195页。相关分析当前136页,总共195页。相关分析相关的意义积差相关等级相关质与量的相关品质相关当前137页,总共195页。相关、相关关系与散点图1、相关的意义事物之间的相互关系

因果关系(两种事物)共变关系(三种事物)相关关系(两种事物)相关的含义——事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。——判断两个因素或变量之间是否有关系,定量地研究这些关系,称为相关分析。相关的类别:正相关:两个变量向相同的方向变化.即一个变量增加,另一个变量也增加.

负相关:两个变量向相反的方向变化.即一个变量增加,另一个变量反而减少.零相关:两列变量之间没有关系,即6一列变量变动时,另一列变量作无规律变动。当前138页,总共195页。简单的因果关系可以准确地预测:在一个大气压下,纯水在零摄氏度时会结冰;氢气在氧气中燃烧可以生成水已知某物体做匀速直线运动,根据其速度和运动时间,可以精确地计算出该物体在这段时间里面运动了多少距离等等。确定现象--对于这些现象的结果可以在一定的已知条件下做出确定的预测。当前139页,总共195页。复杂的因果关系在因果关系复杂的条件下无法根据已知的有限原因精确地预测结果因为即使在已知条件相同的情况下,每一次预测也都是有偏差的随机现象当前140页,总共195页。相关的意义相关(correlation)的概念两个变量之间不精确、不稳定的变化关系称为相关关系。相关系数(correlationcoefficient)用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。一般用r表示。当前141页,总共195页。正相关positivecorrelation当前142页,总共195页。负相关negativecorrelation当前143页,总共195页。零相关当前144页,总共195页。相关系数相关系数不等距,只能比较,不能直接作加、减、乘、除。相关不等于因果:相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示二者之间的内在本质联系。

当前145页,总共195页。积差相关积差相关(PearsonProductMomentCorrelationCoefficient,r)的概念当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关称为积差相关。当前146页,总共195页。相关、相关关系与散点图1、相关的意义事物之间的相互关系

因果关系(两种事物)共变关系(三种事物)相关关系(两种事物)相关的含义——事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。——判断两个因素或变量之间是否有关系,定量地研究这些关系,称为相关分析。相关的类别:正相关:两个变量向相同的方向变化.即一个变量增加,另一个变量也增加.

负相关:两个变量向相反的方向变化.即一个变量增加,另一个变量反而减少.零相关:两列变量之间没有关系,即6一列变量变动时,另一列变量作无规律变动。当前147页,总共195页。2、相关系数——两列变量间相关程度的数字表现形式,即用来表示相关系数强度的指标。P(总体)r(样本)不相关,相互独立正相关负相关完全正相关完全负相关越接近1,表示两个变量的相关程度越密切,称高相关。越接近0,表示两个变量的相关程度越疏松,称低相关。当前148页,总共195页。3、相关散点图直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程度当前149页,总共195页。几种相关散点图:线性

(如身高和体重)非线性(如年龄和身高)曲线相关线性正相关R=-1R=1线性负相关零相关当前150页,总共195页。二、积差相关英国Pearson1、定义公式若记则当前151页,总共195页。2、积差相关适用条件①

要求成对数据②

两列变量各自总体的分布都是正态③

两个相关的变量是连续变量,也即两列数据都是测量数据④

两列变量之间的关系是直线性的,如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否为直线式,可作相关散点图进行初步分析,也可查阅已有研究结果论证。当前152页,总共195页。例题为了研究儿童问题行为与母亲耐心程度的关系,抽取10个家庭,让儿童与其母亲一起完成一件需要相互配合才能完成的工作,观测并纪录他们的表现。下表为儿童问题程度分数(X)与母亲的不耐心程度分数(Y),分数值越大表明问题或不耐心程度越大。请计算两者之间相关系数?X156121851921497Y79625389819010827870当前153页,总共195页。答案0.72当前154页,总共195页。例题为研究某测验的预测效度,在被录取的高考考生中随机抽取10人,测得他们的能力测验得分(X),对他们进行跟踪研究,求得他们大学一、二年级有关科目平均分数(Y),求该测验的效度。X74718085767777687474756Y82758189828988848087837当前155页,总共195页。相关系数的等距转换及其合并将相关系数r转换成等距单位的Zr值,可用费舍的Zr转换法,其转换公式为:当前156页,总共195页。相关系数的等距转换及其合并Zr的平均数的计算公式为:通过r与Zr转换表,可以找到r的平均数。当前157页,总共195页。相关系数的等距转换及其合并市别nn-3rZr(n-3)Zr北京上海广州11355280110549770.5150.4980.5630.5700.5460.63762.700299.75449.049总和736411.503当前158页,总共195页。例题学生n=6评定者1234123456342615431526213645134526当前159页,总共195页。肯德尔和谐系数的计算无相同等级的情况当前160页,总共195页。答案0.693当前161页,总共195页。例题评定者学生1234561234342143132134656512425656当前162页,总共195页。肯德尔和谐系数的计算有相同等级的情况当前163页,总共195页。例题教师n=6评定者12345123456412.562.555125353.51.51.553.56522426412536当前164页,总共195页。答案0.91当前165页,总共195页。5、次数分布当前166页,总共195页。5、次数分布

统计图表当前167页,总共195页。思考:下列数据来自什么变量?实到学生有36人。某学生身高为1.61米。某学生做对14道是非题。某学生跑400米用了1分30秒。某学生在用五级记分的体操比赛中获3分。某学生数学成绩为85分。当前168页,总共195页。6、假设检验当前169页,总共195页。6、假设检验当前170页,总共195页。心理统计方法的内容框架统计方法描述统计推断统计参数估计假设检验当前171页,总共195页。参数估计

参数估计的一般问题一个总体参数的区间估计两个总体参数的区间估计样本容量的确定当前172页,总共195页。学习目标估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准一个总体参数的区间估计方法两个总体参数的区间估计方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论