方差分析原理及应用_第1页
方差分析原理及应用_第2页
方差分析原理及应用_第3页
方差分析原理及应用_第4页
方差分析原理及应用_第5页
已阅读5页,还剩158页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析原理及应用第一页,共一百六十三页,编辑于2023年,星期日导言方差分析是20世纪20年代英国统计学家R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验(C42=6,0.956=0.735)。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。单就因素型实验来说,我们可以按照三个维度将其进行如下的分类:自变量的个数和水平数、被试的选择和分组方法、实验的程序和安排。第二页,共一百六十三页,编辑于2023年,星期日心理实验设计的类型分析科学研究在根本上是对被研究的对象进行观察和在观察基础上的理论推断。心理学研究中的观察法、准实验方法、自然实验法和实验室实验法可以看作是一个维度上的不同区域,它们的区别就在于对研究对象存在条件的控制程度。第三页,共一百六十三页,编辑于2023年,星期日第四页,共一百六十三页,编辑于2023年,星期日第五页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理方差分析作为一种统计方法,所依据的基本原理就是变异的可加性。可以将总变异分解成不同来源的变异,并根据其在总变异中所占比重对造成数据变异的情况进行解释。第六页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理第七页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理第八页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理在方差分析中,比较组间差异和组内差异,不能直接比较各自的离差平方和,因为离差平方和的大小与求离差平方和的项数(k或n)的大小有关。为消除项数的影响,分别求其均方,即将离差平方和除以各自的自由度,并以MS表示。它是总体方差的无偏估计。第九页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理方差分析的基本条件1.总体服从正态分布(总体非正态时进行正态转换或采用非参数方法。教育心理研究资料大部分为正态)2.变异的可加性(变异可以分解)3.各处理内的方差一致(用哈特莱Hartley法进行方差齐性经验)第十页,共一百六十三页,编辑于2023年,星期日方差分析的基本原理方差分析的一些术语1.因素与处理(客观与人为)2.水平(因素的不同等级)3.单元Cell(因素水平间的每一个组合。如性别(0,1)与年级(1,2,3)共产生6个cell4.因素的主效应和因素的交叉效应(A,B,A×B)5.均值比较(比较个因素对因变量的效应的大小,如A,B效应之和是否等与于A×B)6.协方差(在一般方差分析中,要求除研究因素之外其他条件保持不变.如作身高体重关系研究时要消除性别和年级的影响)7.重复测验(同一文化的不同群体彼此不独立,采用重复测验的方差分析)第十一页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计实验设计模式1.当实验研究的自变量只有一个刺激变量(或由刺激条件引起的机体变量),且自变量的水平数为k时,就可以从同一个被试总体中随机抽取k个样本,每一样本完成一个自变量水平的实验处理。这样得到的各组因变量的观测值是互不关联的,因此也叫做独立组实验设计。其自变量对因变量是否产生显著影响,可以使用ONE-WAY方差分析来检验。第十二页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计实验设计模式2.当实验研究的自变量只有一个机体变量,且自变量的水平数为k时,就需要从k个被试总体中各自随机抽取一个被试样本,每一被试样本各自完成某一相同的测量。这样得到的各组因变量的观测值也是互不关联的,因此也属于独立组实验设计,其结果也可以使用ONEWAY方差分析来处理。第十三页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计基本原理研究问题:一个当要研究文章的生字密度对学生阅读理解的影响。研究者的假设是:阅读理解随生字密度的增加而下降。有1自变量—生字密度,4个水平:a1(5:1)a2(10:1)a3(15:1)a4(20:1);因变量是被试的阅读理解测验分数.32名被试随机分配到4个实验组.a1a2a3a434896698448832775451275613537122361135315680202第十四页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计第十五页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计第十六页,共一百六十三页,编辑于2023年,星期日1.单因素完全随机实验设计4.方差分析表及对结果的解释A因素的统计效应是非常显著的,进一步检验需要多重比较.统计还显示,生字密度的误差项是Mse=2.813.变异来源平方和自由度均方F组间(生字密度)190.125363.37522.53**组内78.750282.813总268.87531F.01(3,28)=4.57第十七页,共一百六十三页,编辑于2023年,星期日2.单因素完全随机区组实验设计基本原理研究问题:一个当要研究文章的生字密度对学生阅读理解的影响。考虑到学生智力会对阅读理解产生影响,研究者决定把智力作为无关变量分离出去.32名被试作了智力测验,按智力分为8个区组.每个区组内4个被试分别阅读一种生字密度的文章.a1a2a3a4组1组2组3组4组5组6组7组8348966984488327754512756135371223611242924192631272235315680202第十八页,共一百六十三页,编辑于2023年,星期日2.单因素完全随机区组实验设计第十九页,共一百六十三页,编辑于2023年,星期日2.单因素完全随机区组实验设计第二十页,共一百六十三页,编辑于2023年,星期日2.单因素完全随机区组实验设计4.方差分析表及对结果的解释A因素的统计效应是非常显著的;实验中的无关变量智力的效应是不显著的.说明智力不同的同一误差项Mse=2.518.假设自变量与无关变量之间没有交互作用.变异来源平方和自由度均方F处理间190.1253A(生字密度)190.125363.37522.53**处理内78.75028区组(智力)25.87573.661.47残差78.750212.813总268.87531F.01(3,21)=4.87F.01(7,21)=3.65第二十一页,共一百六十三页,编辑于2023年,星期日单因素实验设计练习第二十二页,共一百六十三页,编辑于2023年,星期日单因素实验设计练习第二十三页,共一百六十三页,编辑于2023年,星期日单因素实验设计SPSS操作One-WayANOVA过程激活Statistics菜单选CompareMeans中的One-WayANOVA...项,弹出One-WayANOVA对话框。从对话框左侧的变量列表中选x,点击钮使之进入DependentList框,选range点击钮使之进入Factor框,点击DefineRange钮打开One-WayANOVA:DefineRange对话框,如为3组比较,故在Minimum处输入1,在Maximum处输入3,点击Continue钮返回One-WayANOVA对话框。如果欲作多个样本均数间两两比较,可点击该点击对话框的PostHoc...钮打开One-WayANOVA:PostHocMultipleComparisons对话框,这时可见在Tests框中有7种比较方法供选择:第二十四页,共一百六十三页,编辑于2023年,星期日单因素实验设计SPSS操作激活Least-significantdifference:最小显著差法(LSD)。可指定0-1之间任何显著性水平,默认值为0.05;(Equalvarianceassumed)Bonferroni:Bonferroni修正差别检验法。可指定0-1之间任何显著性水平,默认值为0.05;(Equal)Duncan’smultiplerangetest:Duncan多范围检验。只能指定为0.05或0.01或0.1,默认值为0.05;Student-Newman-Keuls:Student-Newman-Keuls检验,简称N-K检验,亦即q检验。只能为0.05;(Equal)Tukey’shonestlysignificantdifference:Tukey显著性检验。只能为0.05;(Equal)Tukey’sb:Tukey另一种显著性检验。只能为0.05;Scheffe:Scheffe差别检验法。可指定0~1之间任何显著性水平,默认值为0.05。(Equal)Tamhane”sT2等(Equalvariancenotassumed)第二十五页,共一百六十三页,编辑于2023年,星期日单因素实验设计SPSS操作选用Student-Newman-Keuls显著性检验法。在SampleSizeEstimate框中有Harmonicaverageofpairs和Harmonicaverageofallgroups两选项,前者表示仅采用相互比较两组的调和均数,后者表示采用所有组(含比较的两组和尚未比较的其他组)的调和均数,本例选用前者,点击Continue钮返回One-WayANOVA对话框。点击Option...钮,这时可见在Statistics框中有2种选项:Descriptive要求系统给出个案数、样本均值、标准差等描述统计量;Homogeneitv-of-vanriance要求系统进行方差一致性检验;对话框Mean-plot要求系统给出各实验水平下因变量的均值分布图。对话框MissingValue用于指定对样本缺失值的处理方法。采用系统默认。第二十六页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计基本思想与单因素基本思想相同,但多因素中几个因素对实验结果的影响往往不是独立的。在统计学中,将多个因素的不同水平的搭配实验结果的效应,称为交互作用。某个因素的改变引起的实验结果的改变称为主效应;由于交互作用引起的实验结果的改变称为交互效应。离差平方和的分解式是第二十七页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计实验设计模式完全随机实验设计,就是多个实验组各自参加一种实验处理,而且被试的选择、分组和实验顺序的编排都尽可能具有随机性,这样可以保证不同实验处理之间的完全独立性。在这种设计中,有多少个实验处理(自变量的一个水平或多个自变量某一水平的一个结合),就要有多少个独立的被试组。第二十八页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计研究者有2个自变量,每个自变量有2个或多个水平。如果一个自变量有p个水平,另一个自变量有q个水平,实验中含有p×q个处理结合。a1a1a1a2a2a2b1b2b3b1b2b3S1S2S3S4S5S6S7S8S9S10S11S12S13S14S15S16S17S18S19S20S21S22S23S24a1a2a3a4S1S2S3S4

S5S6S7S8S9S10S11S12S13S14S15S16

单因素随机设计两因素随机设计第二十九页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计基本原理研究问题:如果在研究文章的生字密度的同时,想探讨主题熟悉性对学生阅读理解的影响。研究者的假设是:当主题熟悉性不同时,生字密度对阅读理解的影响可能发生变化。A因素包含a1(主题熟悉)a2(主题不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。24名被试随机分配到6种实验结合中.第三十页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计a1a1a1a2a2a2b1b2b3b1b2b33

4548126

6759134

4538123

223711b1b2b3a1a11616191532481919314867146

ABS表AB表第三十一页,共一百六十三页,编辑于2023年,星期日第三十二页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计第三十三页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计3.平方和与自由度的分解第三十四页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计4.方差分析表及对结果的解释:A因素、B因素及AB交互的统计效应是非常显著的;对主效应的进一步解释,需要通过多重比较分析。变异来源平方和自由度均方F处理间218.333pq-1=5A(主题熟悉)80.666p-1=180.66643.37**B(生字密度)81.083q-1=240.54221.80**AB56.584(p-1)(q-1)=228.29215.21**处理内33.500pq(n-1)=18单元内误差33.500pq(n-1)=18总251.833npq-1=23F.01(1,18)=8.28F.01(2,18)=6.01第三十五页,共一百六十三页,编辑于2023年,星期日3.两因素完全随机实验设计第三十六页,共一百六十三页,编辑于2023年,星期日4.两因素随机区组实验设计研究中有2个自变量,每个自变量有2个或多个水平(p≥2,q≥2),实验中含有p×q个处理结合.研究中有1个研究者不感兴趣的无关变量,且此无关变量与自变量没有交互作用.研究者希望分离出这个无关变量的变异。a1a1a1a2a2a2b1b2b3b1b2b3S11S12S13S14S15S16S21S22S23S24S25S26S31S32S33S34S35S36S41S42S43S44S45S46两因素随机区组设计第三十七页,共一百六十三页,编辑于2023年,星期日4.两因素随机区组实验设计基本原理研究问题:如果研究者在研究文章的生字密度的和主题熟悉性对学生阅读理解的影响时,想分离出听读理解能力对阅读理解成绩的可能影响。先将24名学生进行听读测验分为4个区组,随机分配每一区组的6名学生,每个学生接受一种实验结合.研究者的假设是:当主题熟悉性不同时,生字密度对阅读理解的影响可能发生变化。A因素包含a1(主题熟悉)a2(主题不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。第三十八页,共一百六十三页,编辑于2023年,星期日4.两因素随机区组实验设计a1a1a1a2a2a2b1b2b3b1b2b3区组1区组2区组3区组46

6759133

4548124

4538123

22371146363628b1b2b3a1a11616191532485195314867146

ABS表AB表第三十九页,共一百六十三页,编辑于2023年,星期日第四十页,共一百六十三页,编辑于2023年,星期日第四十一页,共一百六十三页,编辑于2023年,星期日4.两因素随机区组实验设计3.平方和与自由度的分解第四十二页,共一百六十三页,编辑于2023年,星期日4.两因素随机区组实验设计4.方差分析表及对结果的解释:A因素、B因素及AB交互的统计效应是非常显著的,区组效应也是显著的.分离之后,减少了残差变异,使F检验更加敏感.变异来源平方和自由度均方F处理间218.333pq-1=5A(主题熟悉)80.666p-1=180.666191.15**B(生字密度)81.083q-1=240.54296.07**AB56.584(p-1)(q-1)=228.29267.04**处理内33.500pq(n-1)=18区组27.166n-1=39.05521.46**残差6.334(n-1)(pq-1)=150.422总251.833npq-1=23F.01(1,15)=8.68F.01(2,15)=6.36F.01(3,15)=5.42第四十三页,共一百六十三页,编辑于2023年,星期日第四十四页,共一百六十三页,编辑于2023年,星期日多因素实验设计SPSS操作Multivariate过程多元方差分析:因变量不止一个,且因变量之间又不是相互独立时,进行的方差分析称为多元方差分析。基本原理仍然是通过检验两个或多个样本均数之间差异是否显著,以对综合结论的作出提供依据,SPSS中需调用Multivariate命令进行。调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。

第四十五页,共一百六十三页,编辑于2023年,星期日多因素实验设计SPSS操作Multivariate过程数据准备激活数据管理窗口,定义变量名统计分析激活Analyze菜单选GeneralLinearModel中的Multivarite...项,弹出Multivarite对话框.首先指定供分析用的变量MS、MF,故在对话框左侧的变量列表中选变量MS、MF

,点击钮使之进入DependentVariable框;然后选变量g点击钮使之进入Factor(s)框中。第四十六页,共一百六十三页,编辑于2023年,星期日多因素实验设计SPSS操作Multivariate过程统计分析点击Options...钮,弹出Multivarite:Options对话框,选择需要计算的指标。在Factor(s)栏内选变量g,点击钮使之进入DisplayMeansfor框,要求计算平均值指标;在MatricedWithinCell栏内选Correlation、Covariance、SSCP项,要求计算单元内的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在ErrorMatrices栏内也选上述三项,要求计算误差的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneitytest项,要求作变量的方差齐性检验。之后点击Continue钮返回MultivariteANOVA对话框,最后点击OK钮即可。第四十七页,共一百六十三页,编辑于2023年,星期日四、含协变量的实验设计与协方差分析协变量方差分析是一种特殊的方差分析,它是将某些难以控制但可测量的随机变量作为协变量,然后在方差分析过程中将其对观测变量产生的影响从残差项中分离出来,以便能更有效地突出控制变量的作用。协变量多半是属于机体变量,而且是连续数值型变量,比如知识水平、智力商数、身体条件等等。协方差分析在功能上是对被试内变异进行分解,以减小残差项。协方差分析还有一个假设前提,就是协变量与控制变量没有交互作用,所以数据变异线性分解为:控制变量引起的变异、协变量引起的变异、随机变量引起的变异。第四十八页,共一百六十三页,编辑于2023年,星期日一般的方差分析模型(ANOVA):总平方和组内平方和组间平方和SST=SSb+SSwF:=MSb/MSw主要特征:onedependent,morethanindependents第四十九页,共一百六十三页,编辑于2023年,星期日多元方差分析(MANOVA--Multivariate):definition:多元方差分析:因变量不止一个,且因变量之间又不是相互独立时,进行的方差分析称为多元方差分析。基本原理仍然是通过检验两个或多个样本均数之间差异是否显著,以对综合结论的作出提供依据,SPSS中需调用Multivariate命令进行。Generalmodel:第五十页,共一百六十三页,编辑于2023年,星期日Nullhypothesis:第五十一页,共一百六十三页,编辑于2023年,星期日HypothesisforMANOVA:因变量之间是否有足够相关—做Bartlett球形检验,看因变量之间是否独立,若独立,则没有必要做多元分析,只做一元方差分析;若a=0.000,则有足够相关。多因变量之间为多元正态分布,这一假设很难满足。看残差正态标绘图(NormalQ-QplotofResiduals)或去趋势正态标绘图(DetrendednormalQ-QPlot)因变量方差相等—考察是否有公共协方差矩阵(Homogeneity)。上述假设在实际应用中也并非一定严格执行,除非有异常值。第五十二页,共一百六十三页,编辑于2023年,星期日从t检验到一元方差分析再到多元方差分析:T检验是对来自两个子总体的样本平均值只否存在显著差异的检验。当需要对来自多个子总体的样本平均数进行检验,T检验就显得无能为力,于是,引进单因素方差分析的方法进行,并发展到多因素方差分析。而当所研究的对象找不到最佳的测量方式时,综合分析各方面的指标就成为必要,因此,在一般对自变量进行方差分析的基础上,又引进多个因变量进行多元方差分析。多元方差分析实际上是多个因变量的单因素方差分析,但又不同于单因素方差分析的简单加权,因为,它是在同时考虑多个因变量差异是否显著的情况下完成的。单因素方差分析显著,并不意味着多元方差分析显著,反之也是如此。第五十三页,共一百六十三页,编辑于2023年,星期日单因素多元方差分析两因素多元方差分析第五十四页,共一百六十三页,编辑于2023年,星期日单因素多元方差的分解:假设A因素有两个水平,如阈上知觉与阈下知觉检验的假设为:数学模型为:设ai=i-代表A的效应,其中第五十五页,共一百六十三页,编辑于2023年,星期日则数学模型可改为根据上述模型,实际检验的假设是a1=a2…=ai=0第五十六页,共一百六十三页,编辑于2023年,星期日总平方和分解为如下平方和与叉积矩阵(SSCP—SumsofSquaresandCross-ProductMatrix)第五十七页,共一百六十三页,编辑于2023年,星期日多元方差分析的检验统计量FPillai’sTrace(轨迹):在接受虚无假设时相对较为保险,且在样本规模很小、各分组规模不等、或分布方差不等时使用的效果也不错,近似值。Hotelling’sTrace(轨迹):近似值。Wilks’Lambda()--不太受违反假设条件影响,统计检验功效强,是精确值。RoyLargestRoot(最大根):在足以确信所有假设条件能够得到遵守且因变量能够由一维效应所代表时,具有较强的检验功效,但它的值不能直接转换成某种已知分布的统计量,报告时一般只提供计算值,且为近似值,若小于0.1,便认为不显著。第五十八页,共一百六十三页,编辑于2023年,星期日两因素多元方差分析数学模型为虚无假设第五十九页,共一百六十三页,编辑于2023年,星期日总平方和分解为如下平方和与叉积矩阵第六十页,共一百六十三页,编辑于2023年,星期日BasicstepsforMANOVA:Analyze—generallinearmodel—multivariate—dependentvariablesandfixedfactors—model:custom;buildterms:maineffects-factors—contrasts:factors-factor1,2…;changecontrast:arrow-simple,andfirst,change—ok.第六十一页,共一百六十三页,编辑于2023年,星期日Analyze—generallinearmodel—multivariate—第六十二页,共一百六十三页,编辑于2023年,星期日Select:Dependentvariables;Fixedfactors第六十三页,共一百六十三页,编辑于2023年,星期日model:custom;buildterms:maineffects-factors—第六十四页,共一百六十三页,编辑于2023年,星期日model:custom;buildterms:interaction第六十五页,共一百六十三页,编辑于2023年,星期日contrasts:factors-factor1,2…;change第六十六页,共一百六十三页,编辑于2023年,星期日option.第六十七页,共一百六十三页,编辑于2023年,星期日ok.第六十八页,共一百六十三页,编辑于2023年,星期日多元方差分析输出的主要结果包括:多元方差的总体差异分析结果各变量单独的方差分析结果多重差异比较的结果各种平方和矩阵(SSCP);多元方差分析;包括每个自变量的均数比较结果、均数比较的多变量检验结果、均数比较的单变量检验结果。标准化残差的P-P图第六十九页,共一百六十三页,编辑于2023年,星期日多元方差变量设计描述第七十页,共一百六十三页,编辑于2023年,星期日因变量之间相关性的球形检验第七十一页,共一百六十三页,编辑于2023年,星期日因变量之间方差是否齐性检验第七十二页,共一百六十三页,编辑于2023年,星期日多元方差总体分析结果第七十三页,共一百六十三页,编辑于2023年,星期日组间平方和叉积矩阵(SSCP)第七十四页,共一百六十三页,编辑于2023年,星期日残差平方和叉积矩阵(SSCP)第七十五页,共一百六十三页,编辑于2023年,星期日自变量一的多重比较第七十六页,共一百六十三页,编辑于2023年,星期日自变量一的一元方差分析第七十七页,共一百六十三页,编辑于2023年,星期日自变量二的多重比较第七十八页,共一百六十三页,编辑于2023年,星期日自变量二的一元方差分析第七十九页,共一百六十三页,编辑于2023年,星期日自变量一与二的交互作用多重比较分析第八十页,共一百六十三页,编辑于2023年,星期日教学的特点理论上侧重与统计思想和原理,不拘泥于数学证明不为计算上的考虑而讨论特殊情形处理注重统计量之间、统计概念之间及统计方法之间的联系介绍在应用是有重要意义的统计量和统计方法体现统计的现代做法——统计软件的使用第八十一页,共一百六十三页,编辑于2023年,星期日第一章绪论—心理统计的价值科学研究实验设计量化研究第八十二页,共一百六十三页,编辑于2023年,星期日科学研究与统计科学研究:科学研究的目的在于认识我们所要研究对象的本质及其规律,从而找到解决问题的答案科学研究的特点1、科学研究都有比较系统的理论框架,即在一定理论的指导下,通过实际调查研究,检验理论假设的正确性——提出有价值的问题。

第八十三页,共一百六十三页,编辑于2023年,星期日2、科学研究都有一定程度的控制机制,在研究中总是设法恒定或排除某些无关变量,以便着重观察与分析一些关键特征及其影响因素,找出事物发展的因果关系。3、科学研究总是有意识地、系统地寻求研究对象之间的因果关系,通过观察某一现象的事实,根据事实的分析与解释,作出一般结论来。第八十四页,共一百六十三页,编辑于2023年,星期日科学研究的目的描述行为:观察解释行为:科学的理论预测行为:对尚未发生的事件所作的预见。逻辑推理确定行为的起因和控制行为第八十五页,共一百六十三页,编辑于2023年,星期日实验设计与统计实验设计:广义的实验设计指科学研究的一般程序包括从问题的提出、假说的形成、变量的选择等一直到结果的分析、论文或研究报告的写作一系列内容。狭义的实验设计指实施实验处理的一个计划方案,以及与方案与计划有关的统计分析,包括以下程序:

第八十六页,共一百六十三页,编辑于2023年,星期日

1、建立与研究假说有关的统计假说2、确定实验中使用的实验处理(自变量)和必须控制的多余变量(无关变量)3、确定实验中需要的实验单元(被试)的数量以及被试的抽样的总体4、确定将实验条件分配给被试的方法(设计)5、确定实验中每个被试要记载的测量(因变量)和使用的统计分析

第八十七页,共一百六十三页,编辑于2023年,星期日量化研究与统计量化研究:世界的一切事物都是有质和量两种规定性。质是事物的内在规定性,它是一切事物区别于其他事物的依据;量是事物所固有的,反映事物存在与发展的量方面特性的规定性——规模、程度、水平、速度、关系、结构比例、效率。第八十八页,共一百六十三页,编辑于2023年,星期日量化研究的范围描述现状。为了发现问题,必须对研究对象开展有效的测量、观察、调查等。这可以是静态的,也可以是动态的。收集到的资料有定量的,也有定性的。定量资料当然可以用定量的方法来处理与分析,定性的资料也可以经过“量化”转变为数字资料进行分析。第八十九页,共一百六十三页,编辑于2023年,星期日探索规律。任何科学研究都离不开科学探索,在科学探索中需要运用概括、归纳、比较、分类、分析、综合等思维方法。这其中存在着定量分析的可能性和必要性。例如分类问题,为探讨九年义务教育在实施中遇到的“标准的统一性”和“地区的差异性”的矛盾和解决矛盾的对策时,运用统计学中聚类分析的分析的方法(全国——地区1、地区2……)第九十页,共一百六十三页,编辑于2023年,星期日因果分析。教育与心理现象中普遍存在着这样那样的关系,因果关系则是人们十分关注的方面。凡关系必存在与变化中,而变化又不可能不重视量方面的变化。于是,定量的关系研究、探求数量上的因果量是定量研究的重要内容。第九十一页,共一百六十三页,编辑于2023年,星期日验证假设。由定性分析获得的初步认识,往往可以形成研究假设。“假设”是对问题猜想性的解释,它是需要经过科学验证的。这就需要我们开展各种实验研究。于是在实验的设计与实验数据的分析中不可缺少地要运用定量分析。第九十二页,共一百六十三页,编辑于2023年,星期日测量与评价。对于教育过程与成果需要开展测量与评价活动。如教学过程的诊断教学效果的评定。教育测量与评价已成为教育研究中的一个方向。第九十三页,共一百六十三页,编辑于2023年,星期日决策与预测。教育决策涉及到过程控制、功能优化或要素组合极大化。若只停留在定性分析水平上,就只有抽象的原则,而难以开展实效的操作。预测的方法很多,其中不可缺少的是对历史资料进行趋势模型的拟合和预测。第九十四页,共一百六十三页,编辑于2023年,星期日量化研究的作用简化作用突现心理与教育问题提供系统的收集资料的方法建立了统计分析的方法研究结果可以用来建立明确的努力方向,预测未来需要、控制和引导发展方向。可以重复验证,协助研究者确认研究发现的正确性。可教可学——质的研究方法具有独特性。第九十五页,共一百六十三页,编辑于2023年,星期日心理统计学的内容基础统计原理方差分析的原理及应用

回归分析的原理及应用

因素分析的原理及应用

路径分析原理简介结构方程原理简介SPSS统计软件应用简介心理与教育科学研究课题举例

第九十六页,共一百六十三页,编辑于2023年,星期日心理统计学的内容张厚粲主编:《心理与教育统计学》,北京师范大学出版社,1988年版王孝玲编著:《教育统计学》,华东师范大学出版社,2001年版张敏强主编:《教育与心理统计学》,人民教育出版社,1993年版温忠麟、邢最智编著:《现代教育与心理统计技术》,江苏教育出版社2001年台湾吴明隆著:《SPSS统计应用实务》,中国铁道出版社2001年第九十七页,共一百六十三页,编辑于2023年,星期日第二章基础统计原理教育科学研究中的数据类型(从数据的来源:计数数据、测量数据和类别数据;从数据反映变量性质:称名变量、顺序变量、等距变量、比率变量)常用的描述统计量的计算集中量数(平均数、中数与众数、几何、调和)差异量数(极差、平均差、标准差、四分位距、白分位距)相关系数(极差相关、斯皮尔曼等级相关、肯德尔和谐系数、二列相关、列联相关、品质相关)类别差异的显著性检验假设检验的涵义(概率、抽样分布、显著性水平)差异显著性检验的方法(平均数显著性检验、平均数差异显著性检验—T检验、Z检验)第九十八页,共一百六十三页,编辑于2023年,星期日教育科学研究中的数据类型数据:统计学中的数字资料,用来反映和标志客观事物量的特征.计数数据与测量数据比率数据等距数据顺序数据名义变量

第九十九页,共一百六十三页,编辑于2023年,星期日集中量數算术平均数(arithmeticmean,简写M)中位数(median,简写Md)众数(mode,简写Mo)几何平均数(geometricmean,简写GM)调和平均数(harmonicmean,简写HM)第一百页,共一百六十三页,编辑于2023年,星期日算术平均数(平均数、均数Mean)概念:所有观测值的总和与观测次数的比值,一般用表示。用于表示总体时用,用于表示样本时用定义公式:如果一个总体包含N个元素,Xi是这个总体中的第i个元素,则称为第i次观测值,那么,对来说,该总体的算术平均数被定义为μ=(x1+x2+¨xn)/N=∑Xi/N

X=(x1+x2+¨xn)/n=∑Xi/n

第一百零一页,共一百六十三页,编辑于2023年,星期日

平均数的计算:1、原始分数计算

X=∑X/N2、分组数据计算

X=∑fX/N3、估计平均数计算第一百零二页,共一百六十三页,编辑于2023年,星期日【例3-1】某项研究在一年级总体中抽取30名样本,测得某项能力测验分数如下,求平均能力分数60,71,63,58,50,75,64,73,72,64,52,65,65,76,72,70,58,50,80,51,79,81,77,69,67,61,48,50,54,55解1:所求的是n=30的样本平均数

X=(60+71+…+55)/30=64.33解2:多功能计算器程序1、进入统计档:2ndf —AC2、消除内存:2ndf—AC3、输入数据:60—Data4、输出数据:2ndf—σ第一百零三页,共一百六十三页,编辑于2023年,星期日

X=64.33∑X=1930∑X2=127130σ=9.9443S=10.1143n=30第一百零四页,共一百六十三页,编辑于2023年,星期日

分组数据计算:

分组区间组中值次数fXc计算程序65-7067167ΣfXc=567460-624248X=ΣfXc/N55-576342=5674/15750-528416=36.1445-471675240-4224100835-3734125830-322167225-271643220-221124215-17915310-12784第一百零五页,共一百六十三页,编辑于2023年,星期日中数和众数中数概念:位于一组数据中较大一半与较小一半中间位置的数。用Md表示计算方法1、单列数据:数据中没有相同数据。奇数:取第(N+1)/2那个数;偶数:取第N/2与第N/2+1位置的平均数第一百零六页,共一百六十三页,编辑于2023年,星期日2、有重复数目的情况假定位于中间的几个重复数目为连续数据;取数列中上下各N/2那一点上的数据为中数;【例3-2】求2,3,5,5,7,7,7,11,13的中数。777——————————————6.56.837.167.53、分组数据计算第一百零七页,共一百六十三页,编辑于2023年,星期日中数的意义和应用1、优点:计算简单,容易理解;不受极端数值影响。缺点:反应不够灵敏;不是每个数据都参与计算,受抽样影响较大;不能做进一步代数运算。2、适用情况

第一百零八页,共一百六十三页,编辑于2023年,星期日(二)众数概念:在次数分布中出现次数最多的那个数的数值,用Mo表示计算1、观察法未分组数据:次数最多的那个数;分组数据:观察次数最多的一组区间的组中值;2、公式法:用公式求的众数称数理众数皮尔逊经验法:Mo=3Md-2X金氏插补法第一百零九页,共一百六十三页,编辑于2023年,星期日平均数、中数和众数的关系正态分布:M=Md=Mo正偏态分布:M>Md>Mo负偏态分布:M<Md<Mo第一百一十页,共一百六十三页,编辑于2023年,星期日平均数、中数和众数的关系正态分布:X=Md=Mo正偏态分布:X>Md>Mo负偏态分布:X<Md<Mo第一百一十一页,共一百六十三页,编辑于2023年,星期日其它集中量数加权平均数涵义:不同比重数据的平均数公式:1、w为权数,描述各变量在总体中的相对重要性

Mw=∑wiXi/∑wi2、ni为人数,ni为小组平均数,表示总平均数

XT=∑niXi/∑ni第一百一十二页,共一百六十三页,编辑于2023年,星期日几何平均数涵义:当需要处理以下两种情况时,用几何平均数表示集中趋势1、一组数据中任何两个相邻数据之比接近常数,即数据按一定的比例关系变化。如平均增长率、心理物理学中的等距与等比实验。2、当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好反映数据的典型情况时。基本公式第一百一十三页,共一百六十三页,编辑于2023年,星期日几何平均数的应用1、心理物理学中等距或等比量表实验的数据处理【例3-3】欲研究介于与两个感觉之间的物理刺激是多少,随机抽取10个样本,让其调节一个可变的物理量的刺激,使所产生的感觉恰好介于与之间,然后测试这个物理量,结果如下:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6,18.0。求介于二感觉之间的感觉的平均物理刺激量是多少。第一百一十四页,共一百六十三页,编辑于2023年,星期日2、应用几何平均数的变式(1)平均增长率【例3-4】某市近几年高中毕业生人数如下表,试求其平均增长率,椐此,到2005年统计有多少高中毕业生.年度学生人数变化率19971998199920002001200022002430260028801.1001.10451.07001.1077第一百一十五页,共一百六十三页,编辑于2023年,星期日

(2)阅读能力的平均增长率【例3-5】阅读遍数---理解成分阅读遍数理解成分每次增加比率140(x1)252(x2)121.300365(x3)131.250475(x4)101.154586(x5)111.147697(x6)111.128第一百一十六页,共一百六十三页,编辑于2023年,星期日Mg=1.1933(X=1.1958)X6=40×1.193775=97(96.97)X7=40×1.193776=116(115.77)设X1为基数:Mg=(Xn/x1)1/n-1

上例:Mg=(97/40)1/5=1.1938(3)教育经费的增长率

第一百一十七页,共一百六十三页,编辑于2023年,星期日调和平均数涵义:一组数据倒数的算术平均数的倒数。应用:描述学习速度方面的问题实验设计有两种形式1、工作量固定,记录各被试完成相同工作量所用的时间;2、学习任务的时间相同而工作量不同公式:MH=N/∑1/Xi第一百一十八页,共一百六十三页,编辑于2023年,星期日例1、前15分钟学会30个单词,后15分钟学会30个单词,求平均学习速度。解:先计算单位时间的该工作量

X1=30/15=2X2=30/10=3XH=2.4第一百一十九页,共一百六十三页,编辑于2023年,星期日例2、一个学习实验的结果,计算平均学习速度被试作业时间单位时间工作量124212220210316284122658246422MH=4.9第一百二十页,共一百六十三页,编辑于2023年,星期日差异量数表示一组数据变异程度和离散程度的量。亦称离中趋势。常用的差异量数有全距、四分位距、百分位距、平均差、方差和标准差方差Variance标准差Standarddeviation四分差Quartile差异系数Relativedeviation第一百二十一页,共一百六十三页,编辑于2023年,星期日方差与标准差概念:方差(变异数、均方)是每个数据与该数据平均数之差乘方后的均值。用σ2、S2表示。标准差是方差的算术平方根用σ、S表示公式:σ2=σ=

S2=S=第一百二十二页,共一百六十三页,编辑于2023年,星期日方差和标准差计算方法原始数据计算法频数分布表计算法注意比较第一百二十三页,共一百六十三页,编辑于2023年,星期日分数组中值xffXfX2σx,σ2x45--47.5147.5147.521σ2x=148506.3/37-(2290/37)2=183.078σx==13.5350--52.5252.5252.52255--57.5057.5057.52060--62.5262.5262.52270--67.5367.5367.52375--77.5877.5877.52380--82.5782.5782.52785--87.5787.5787.527总和372290.0148506.348个学生数学分数方差、标准差计算表第一百二十四页,共一百六十三页,编辑于2023年,星期日四分差(Quartile)为了避免全距受两极端数值影响的缺点,则用依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标,即四分位距。用QD表示。Q3:第三个四分位数Q1:第一个四分位数第一百二十五页,共一百六十三页,编辑于2023年,星期日四分位距计算方法原始数据计算法例:将16个原始数据从小到大排列好:12、14、15、17、19、20、22、25、29、30、31、33、35、37、39、40Q1=18Q3=34第一百二十六页,共一百六十三页,编辑于2023年,星期日四分差计算方法LQ:表示Q所在组的下限N:表示总频数n1:表示小于Q所在组下限的频数总和i:表示组距第一百二十七页,共一百六十三页,编辑于2023年,星期日差异系数差异系数是指标准差与算术平均数的百分比。它是没有单位的相对数。用公式可表示为:差异系数越大,表明离散程度越大。第一百二十八页,共一百六十三页,编辑于2023年,星期日差异系数的用途比较不同单位资料的差异程度比较单位相同而平均数相差较大的两组资料的差异程度可判断特殊差异情况第一百二十九页,共一百六十三页,编辑于2023年,星期日标准分数标准分数比较不同类别资料的集中程度第一百三十页,共一百六十三页,编辑于2023年,星期日相關係數(Correlation)兩數量變數的相關係數,是衡量兩變數線性關係強度及方向的數值,定義如下:兩變數分別為X及Y,資料配對為(xi,yi), i=1,2,…,n其平均數與標準差分別為

與sX,與sY。則相關係數r

定為 第一百三十一页,共一百六十三页,编辑于2023年,星期日散布图1第一百三十二页,共一百六十三页,编辑于2023年,星期日散布图2第一百三十三页,共一百六十三页,编辑于2023年,星期日相關係數的特性相關係數中,兩變數並不區分解釋變數或反應變數。相關係數的計算以數量變數為主,此公式不適用於類別變數。相關係數的計算使用標準化值,與各數量變數的度量單位無關。第一百三十四页,共一百六十三页,编辑于2023年,星期日相關係數為正表示兩變數具正相聯性,相關係數為負表示兩變數具負相聯性。相關係數r

,其數值必為-1與1之間。r接近0表示兩變數的線性關係薄弱。兩變數的線性關係強度,隨著r由0移向-1或1而增強。r接近-1或1表示散佈圖的點呈近乎直線。r等於-1或1表示散佈圖的點全在直線上。第一百三十五页,共一百六十三页,编辑于2023年,星期日相關係數僅能衡量的兩變數的線性關係,對其他曲線關係的強度無法提供信息。相關係數值受離群點(outliers)影響很大。第一百三十六页,共一百六十三页,编辑于2023年,星期日線性關係的不同強度之r第一百三十七页,共一百六十三页,编辑于2023年,星期日

皮爾森(Pearson)相關係數相關係數(r)相關程度0.8以上極高0.6-0.8高0.4-0.6普通0.2-0.4低0.2以下極低皮爾森樣本相關係數1皮爾森相關係數(ρ)的檢定虛無假設H0:兩變數X和Y不相關(即相關係數為零,ρ=0)對立假設H1:兩變數相關(即相關係數不為零,ρ≠0)公式:ρ值為:2皮爾森相關係數的意義3第一百三十八页,共一百六十三页,编辑于2023年,星期日

斯皮爾曼(Spearman’sRho)等級相關係數斯皮爾曼等級相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數負相關(即相關係數小於零)2斯皮爾曼等級相關係數(ρ(s))1簡化式中T為第一百三十九页,共一百六十三页,编辑于2023年,星期日肯特爾相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數負相關(即相關係數小於零)2

肯特爾(Kendall’sTau)相關係數肯特爾相關係數(τ

)1式中T為第一百四十页,共一百六十三页,编辑于2023年,星期日假设检验1、统计检验的基本概念2、几种检验方法(1)Z检验(2)t检验(3)F检验(4)第一百四十一页,共一百六十三页,编辑于2023年,星期日总体样本抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论