




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析原理及应用心理实验设计得类型分析科学研究在根本上就是对被研究得对象进行观察和在观察基础上得理论推断。心理学研究中得观察法、准实验方法、自然实验法和实验室实验法可以看作就是一个维度上得不同区域,她们得区别就在于对研究对象存在条件得控制程度。方差分析得基本原理方差分析作为一种统计方法,所依据得基本原理就就是变异得可加性。可以将总变异分解成不同来源得变异,并根据其在总变异中所占比重对造成数据变异得情况进行解释。方差分析得基本原理方差分析得基本原理方差分析得基本原理在方差分析中,比较组间差异和组内差异,不能直接比较各自得离差平方和,因为离差平方和得大小与求离差平方和得项数(k或n)得大小有关。为消除项数得影响,分别求其均方,即将离差平方和除以各自得自由度,并以MS表示。她就是总体方差得无偏估计。9大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流方差分析得基本原理方差分析得基本条件1、总体服从正态分布(总体非正态时进行正态转换或采用非参数方法。教育心理研究资料大部分为正态)2、变异得可加性(变异可以分解)3、各处理内得方差一致(用哈特莱Hartley法进行方差齐性经验)方差分析得基本原理方差分析得一些术语1、因素与处理(客观与人为)2、水平(因素得不同等级)3、单元Cell(因素水平间得每一个组合。如性别(0,1)与年级(1,2,3)共产生6个cell4、因素得主效应和因素得交叉效应(A,B,A×B)5、均值比较(比较个因素对因变量得效应得大小,如A,B效应之和就是否等与于A×B)6、协方差(在一般方差分析中,要求除研究因素之外其她条件保持不变、如作身高体重关系研究时要消除性别和年级得影响)7、重复测验(同一文化得不同群体彼此不独立,采用重复测验得方差分析)1、单因素完全随机实验设计实验设计模式1、当实验研究得自变量只有一个刺激变量(或由刺激条件引起得机体变量),且自变量得水平数为k时,就可以从同一个被试总体中随机抽取k个样本,每一样本完成一个自变量水平得实验处理。这样得到得各组因变量得观测值就是互不关联得,因此也叫做独立组实验设计。其自变量对因变量就是否产生显著影响,可以使用ONE-WAY方差分析来检验。1、单因素完全随机实验设计实验设计模式2、当实验研究得自变量只有一个机体变量,且自变量得水平数为k时,就需要从k个被试总体中各自随机抽取一个被试样本,每一被试样本各自完成某一相同得测量。这样得到得各组因变量得观测值也就是互不关联得,因此也属于独立组实验设计,其结果也可以使用ONEWAY方差分析来处理。1、单因素完全随机实验设计基本原理研究问题:一个当要研究文章得生字密度对学生阅读理解得影响。研究者得假设就是:阅读理解随生字密度得增加而下降。有1自变量—生字密度,4个水平:a1(5:1)a2(10:1)a3(15:1)a4(20:1);因变量就是被试得阅读理解测验分数、32名被试随机分配到4个实验组、a1a2a3a4348966984488327754512756135371223611353156802021、单因素完全随机实验设计1、单因素完全随机实验设计1、单因素完全随机实验设计4、方差分析表及对结果得解释A因素得统计效应就是非常显著得,进一步检验需要多重比较、统计还显示,生字密度得误差项就是Mse=2、813、变异来源平方和自由度均方F组间(生字密度)190、125363、37522、53**组内78、750282、813总268、87531F、01(3,28)=4、572、单因素完全随机区组实验设计基本原理研究问题:一个当要研究文章得生字密度对学生阅读理解得影响。考虑到学生智力会对阅读理解产生影响,研究者决定把智力作为无关变量分离出去、32名被试作了智力测验,按智力分为8个区组、每个区组内4个被试分别阅读一种生字密度得文章、a1a2a3a4组1组2组3组4组5组6组7组83489669844883277545127561353712236112429241926312722353156802022、单因素完全随机区组实验设计2、单因素完全随机区组实验设计2、单因素完全随机区组实验设计4、方差分析表及对结果得解释A因素得统计效应就是非常显著得;实验中得无关变量智力得效应就是不显著得、说明智力不同得同一误差项Mse=2、518、假设自变量与无关变量之间没有交互作用、变异来源平方和自由度均方F处理间190、1253A(生字密度)190、125363、37522、53**处理内78、75028区组(智力)25、87573、661、47残差78、750212、813总268、87531F、01(3,21)=4、87F、01(7,21)=3、65单因素实验设计练习单因素实验设计练习单因素实验设计SPSS操作One-WayANOVA过程激活Statistics菜单选pareMeans中得One-WayANOVA、、、项,弹出One-WayANOVA对话框。从对话框左侧得变量列表中选x,点击
钮使之进入DependentList框,选range点击
钮使之进入Factor框,点击DefineRange钮打开One-WayANOVA:DefineRange对话框,如为3组比较,故在Minimum处输入1,在Maximum处输入3,点击Continue钮返回One-WayANOVA对话框。如果欲作多个样本均数间两两比较,可点击该点击对话框得PostHoc、、、钮打开One-WayANOVA:PostHocMultipleparisons对话框,这时可见在Tests框中有7种比较方法供选择:单因素实验设计SPSS操作激活Least-significantdifference:最小显著差法(LSD)。
可指定0-1之间任何显著性水平,默认值为0、05;(Equalvarianceassumed)Bonferroni:Bonferroni修正差别检验法。
可指定0-1之间任何显著性水平,默认值为0、05;(Equal)Duncan’smultiplerangetest:Duncan多范围检验。只能指定
为0、05或0、01或0、1,默认值为0、05;Student-Newman-Keuls:Student-Newman-Keuls检验,简称N-K检验,亦即q检验。
只能为0、05;(Equal)Tukey’shonestlysignificantdifference:Tukey显著性检验。
只能为0、05;(Equal)Tukey’sb:Tukey另一种显著性检验。
只能为0、05;Scheffe:Scheffe差别检验法。
可指定0~1之间任何显著性水平,默认值为0、05。(Equal)Tamhane”sT2等(Equalvariancenotassumed)单因素实验设计SPSS操作选用Student-Newman-Keuls显著性检验法。在SampleSizeEstimate框中有Harmonicaverageofpairs和Harmonicaverageofallgroups两选项,前者表示仅采用相互比较两组得调和均数,后者表示采用所有组(含比较得两组和尚未比较得其她组)得调和均数,本例选用前者,点击Continue钮返回One-WayANOVA对话框。点击Option、、、钮,这时可见在Statistics框中有2种选项:Descriptive要求系统给出个案数、样本均值、标准差等描述统计量;Homogeneitv-of-vanriance要求系统进行方差一致性检验;对话框Mean-plot要求系统给出各实验水平下因变量得均值分布图。对话框MissingValue用于指定对样本缺失值得处理方法。采用系统默认。3、两因素完全随机实验设计基本思想与单因素基本思想相同,但多因素中几个因素对实验结果得影响往往不就是独立得。在统计学中,将多个因素得不同水平得搭配实验结果得效应,称为交互作用。某个因素得改变引起得实验结果得改变称为主效应;由于交互作用引起得实验结果得改变称为交互效应。离差平方和得分解式就是3、两因素完全随机实验设计实验设计模式完全随机实验设计,就就是多个实验组各自参加一种实验处理,而且被试得选择、分组和实验顺序得编排都尽可能具有随机性,这样可以保证不同实验处理之间得完全独立性。在这种设计中,有多少个实验处理(自变量得一个水平或多个自变量某一水平得一个结合),就要有多少个独立得被试组。3、两因素完全随机实验设计研究者有2个自变量,每个自变量有2个或多个水平。如果一个自变量有p个水平,另一个自变量有q个水平,实验中含有p×q个处理结合。a1a1a1a2a2a2b1b2b3b1b2b3S1S2S3S4S5S6S7S8S9S10S11S12S13S14S15S16S17S18S19S20S21S22S23S24a1a2a3a4S1S2S3S4
S5S6S7S8S9S10S11S12S13S14S15S16
单因素随机设计两因素随机设计3、两因素完全随机实验设计基本原理研究问题:如果在研究文章得生字密度得同时,想探讨主题熟悉性对学生阅读理解得影响。研究者得假设就是:当主题熟悉性不同时,生字密度对阅读理解得影响可能发生变化。A因素包含a1(主题熟悉)a2(主题不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。24名被试随机分配到6种实验结合中、3、两因素完全随机实验设计a1a1a1a2a2a2b1b2b3b1b2b33
4548126
6759134
4538123
223711b1b2b3a1a11616191532481919314867146
ABS表AB表3、两因素完全随机实验设计3、两因素完全随机实验设计3、平方和与自由度得分解3、两因素完全随机实验设计4、方差分析表及对结果得解释:A因素、B因素及AB交互得统计效应就是非常显著得;对主效应得进一步解释,需要通过多重比较分析。变异来源平方和自由度均方F处理间218、333pq-1=5A(主题熟悉)80、666p-1=180、66643、37**B(生字密度)81、083q-1=240、54221、80**AB56、584(p-1)(q-1)=228、29215、21**处理内33、500pq(n-1)=18单元内误差33、500pq(n-1)=18总251、833npq-1=23F、01(1,18)=8、28F、01(2,18)=6、013、两因素完全随机实验设计4、两因素随机区组实验设计研究中有2个自变量,每个自变量有2个或多个水平(p≥2,q≥2),实验中含有p×q个处理结合、研究中有1个研究者不感兴趣得无关变量,且此无关变量与自变量没有交互作用、研究者希望分离出这个无关变量得变异。a1a1a1a2a2a2b1b2b3b1b2b3S11S12S13S14S15S16S21S22S23S24S25S26S31S32S33S34S35S36S41S42S43S44S45S46两因素随机区组设计4、两因素随机区组实验设计基本原理研究问题:如果研究者在研究文章得生字密度得和主题熟悉性对学生阅读理解得影响时,想分离出听读理解能力对阅读理解成绩得可能影响。先将24名学生进行听读测验分为4个区组,随机分配每一区组得6名学生,每个学生接受一种实验结合、研究者得假设就是:当主题熟悉性不同时,生字密度对阅读理解得影响可能发生变化。A因素包含a1(主题熟悉)a2(主题不熟悉);B因素包含b1(5:1)b2(10:1)b3(20:1)。4、两因素随机区组实验设计a1a1a1a2a2a2b1b2b3b1b2b3区组1区组2区组3区组46
6759133
4548124
4538123
22371146363628b1b2b3a1a11616191532485195314867146
ABS表AB表4、两因素随机区组实验设计3、平方和与自由度得分解4、两因素随机区组实验设计4、方差分析表及对结果得解释:A因素、B因素及AB交互得统计效应就是非常显著得,区组效应也就是显著得、分离之后,减少了残差变异,使F检验更加敏感、变异来源平方和自由度均方F处理间218、333pq-1=5A(主题熟悉)80、666p-1=180、666191、15**B(生字密度)81、083q-1=240、54296、07**AB56、584(p-1)(q-1)=228、29267、04**处理内33、500pq(n-1)=18区组27、166n-1=39、05521、46**残差6、334(n-1)(pq-1)=150、422总251、833npq-1=23F、01(1,15)=8、68F、01(2,15)=6、36F、01(3,15)=5、42多因素实验设计SPSS操作Multivariate过程多元方差分析:因变量不止一个,且因变量之间又不就是相互独立时,进行得方差分析称为多元方差分析。基本原理仍然就是通过检验两个或多个样本均数之间差异就是否显著,以对综合结论得作出提供依据,SPSS中需调用Multivariate命令进行。调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型得设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
多因素实验设计SPSS操作Multivariate过程数据准备激活数据管理窗口,定义变量名统计分析激活Analyze菜单选GeneralLinearModel中得Multivarite、、、项,弹出Multivarite对话框、首先指定供分析用得变量MS、MF,故在对话框左侧得变量列表中选变量MS、MF
,点击
钮使之进入DependentVariable框;然后选变量g点击
钮使之进入Factor(s)框中。多因素实验设计SPSS操作Multivariate过程统计分析点击Options、、、钮,弹出Multivarite:Options对话框,选择需要计算得指标。在Factor(s)栏内选变量g,点击
钮使之进入DisplayMeansfor框,要求计算平均值指标;在MatricedWithinCell栏内选Correlation、Covariance、SSCP项,要求计算单元内得相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在ErrorMatrices栏内也选上述三项,要求计算误差得相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneitytest项,要求作变量得方差齐性检验。之后点击Continue钮返回MultivariteANOVA对话框,最后点击OK钮即可。四、含协变量得实验设计与协方差分析协变量方差分析就是一种特殊得方差分析,她就是将某些难以控制但可测量得随机变量作为协变量,然后在方差分析过程中将其对观测变量产生得影响从残差项中分离出来,以便能更有效地突出控制变量得作用。协变量多半就是属于机体变量,而且就是连续数值型变量,比如知识水平、智力商数、身体条件等等。协方差分析在功能上就是对被试内变异进行分解,以减小残差项。协方差分析还有一个假设前提,就就是协变量与控制变量没有交互作用,所以数据变异线性分解为:控制变量引起得变异、协变量引起得变异、随机变量引起得变异。一般得方差分析模型(ANOVA):总平方和组内平方和组间平方和SST=SSb+SSwF:=MSb/MSw主要特征:onedependent,morethanindependents多元方差分析(MANOVA--Multivariate):definition:多元方差分析:因变量不止一个,且因变量之间又不就是相互独立时,进行得方差分析称为多元方差分析。基本原理仍然就是通过检验两个或多个样本均数之间差异就是否显著,以对综合结论得作出提供依据,SPSS中需调用Multivariate命令进行。Generalmodel:Nullhypothesis:HypothesisforMANOVA:因变量之间就是否有足够相关—做Bartlett球形检验,看因变量之间就是否独立,若独立,则没有必要做多元分析,只做一元方差分析;若a=0、000,则有足够相关。多因变量之间为多元正态分布,这一假设很难满足。看残差正态标绘图(NormalQ-QplotofResiduals)或去趋势正态标绘图(DetrendednormalQ-QPlot)因变量方差相等—考察就是否有公共协方差矩阵(Homogeneity)。上述假设在实际应用中也并非一定严格执行,除非有异常值。从t检验到一元方差分析再到多元方差分析:T检验就是对来自两个子总体得样本平均值只否存在显著差异得检验。当需要对来自多个子总体得样本平均数进行检验,T检验就显得无能为力,于就是,引进单因素方差分析得方法进行,并发展到多因素方差分析。而当所研究得对象找不到最佳得测量方式时,综合分析各方面得指标就成为必要,因此,在一般对自变量进行方差分析得基础上,又引进多个因变量进行多元方差分析。多元方差分析实际上就是多个因变量得单因素方差分析,但又不同于单因素方差分析得简单加权,因为,她就是在同时考虑多个因变量差异就是否显著得情况下完成得。单因素方差分析显著,并不意味着多元方差分析显著,反之也就是如此。单因素多元方差分析两因素多元方差分析单因素多元方差得分解:假设A因素有两个水平,如阈上知觉与阈下知觉检验得假设为:数学模型为:设ai=
i-代表A得效应,其中则数学模型可改为根据上述模型,实际检验得假设就是a1=a2…=ai=0总平方和分解为如下平方和与叉积矩阵(SSCP—SumsofSquaresandCross-ProductMatrix)多元方差分析得检验统计量FPillai’sTrace(轨迹):在接受虚无假设时相对较为保险,且在样本规模很小、各分组规模不等、或分布方差不等时使用得效果也不错,近似值。Hotelling’sTrace(轨迹):近似值。Wilks’Lambda(
)--不太受违反假设条件影响,统计检验功效强,就是精确值。RoyLargestRoot(最大根):在足以确信所有假设条件能够得到遵守且因变量能够由一维效应所代表时,具有较强得检验功效,但她得值不能直接转换成某种已知分布得统计量,报告时一般只提供计算值,且为近似值,若小于0、1,便认为不显著。两因素多元方差分析数学模型为虚无假设总平方和分解为如下平方和与叉积矩阵BasicstepsforMANOVA:Analyze—generallinearmodel—multivariate—dependentvariablesandfixedfactors—model:custom;buildterms:maineffects-factors—contrasts:factors-factor1,2…;changecontrast:arrow-simple,andfirst,change—ok、Analyze—generallinearmodel—multivariate—Select:Dependentvariables;Fixedfactorsmodel:custom;buildterms:maineffects-factors—model:custom;buildterms:interactioncontrasts:factors-factor1,2…;changeoption、ok、多元方差分析输出得主要结果包括:多元方差得总体差异分析结果各变量单独得方差分析结果多重差异比较得结果各种平方和矩阵(SSCP);多元方差分析;包括每个自变量得均数比较结果、均数比较得多变量检验结果、均数比较得单变量检验结果。标准化残差得P-P图多元方差变量设计描述因变量之间相关性得球形检验因变量之间方差就是否齐性检验多元方差总体分析结果组间平方和叉积矩阵(SSCP)残差平方和叉积矩阵(SSCP)自变量一得多重比较自变量一得一元方差分析自变量二得多重比较自变量二得一元方差分析自变量一与二得交互作用多重比较分析教学得特点理论上侧重与统计思想和原理,不拘泥于数学证明不为计算上得考虑而讨论特殊情形处理注重统计量之间、统计概念之间及统计方法之间得联系介绍在应用就是有重要意义得统计量和统计方法体现统计得现代做法——统计软件得使用第一章绪论—心理统计得价值科学研究实验设计量化研究科学研究与统计科学研究:科学研究得目得在于认识我们所要研究对象得本质及其规律,从而找到解决问题得答案科学研究得特点1、科学研究都有比较系统得理论框架,即在一定理论得指导下,通过实际调查研究,检验理论假设得正确性——提出有价值得问题。
2、科学研究都有一定程度得控制机制,在研究中总就是设法恒定或排除某些无关变量,以便着重观察与分析一些关键特征及其影响因素,找出事物发展得因果关系。3、科学研究总就是有意识地、系统地寻求研究对象之间得因果关系,通过观察某一现象得事实,根据事实得分析与解释,作出一般结论来。科学研究得目得描述行为:观察解释行为:科学得理论预测行为:对尚未发生得事件所作得预见。逻辑推理确定行为得起因和控制行为实验设计与统计实验设计:广义得实验设计指科学研究得一般程序包括从问题得提出、假说得形成、变量得选择等一直到结果得分析、论文或研究报告得写作一系列内容。狭义得实验设计指实施实验处理得一个计划方案,以及与方案与计划有关得统计分析,包括以下程序:
1、建立与研究假说有关得统计假说2、确定实验中使用得实验处理(自变量)和必须控制得多余变量(无关变量)3、确定实验中需要得实验单元(被试)得数量以及被试得抽样得总体4、确定将实验条件分配给被试得方法(设计)5、确定实验中每个被试要记载得测量(因变量)和使用得统计分析
量化研究与统计量化研究:世界得一切事物都就是有质和量两种规定性。质就是事物得内在规定性,她就是一切事物区别于其她事物得依据;量就是事物所固有得,反映事物存在与发展得量方面特性得规定性——规模、程度、水平、速度、关系、结构比例、效率。量化研究得范围描述现状。为了发现问题,必须对研究对象开展有效得测量、观察、调查等。这可以就是静态得,也可以就是动态得。收集到得资料有定量得,也有定性得。定量资料当然可以用定量得方法来处理与分析,定性得资料也可以经过“量化”转变为数字资料进行分析。探索规律。任何科学研究都离不开科学探索,在科学探索中需要运用概括、归纳、比较、分类、分析、综合等思维方法。这其中存在着定量分析得可能性和必要性。例如分类问题,为探讨九年义务教育在实施中遇到得“标准得统一性”和“地区得差异性”得矛盾和解决矛盾得对策时,运用统计学中聚类分析得分析得方法(全国——地区1、地区2……)因果分析。教育与心理现象中普遍存在着这样那样得关系,因果关系则就是人们十分关注得方面。凡关系必存在与变化中,而变化又不可能不重视量方面得变化。于就是,定量得关系研究、探求数量上得因果量就是定量研究得重要内容。验证假设。由定性分析获得得初步认识,往往可以形成研究假设。“假设”就是对问题猜想性得解释,她就是需要经过科学验证得。这就需要我们开展各种实验研究。于就是在实验得设计与实验数据得分析中不可缺少地要运用定量分析。测量与评价。对于教育过程与成果需要开展测量与评价活动。如教学过程得诊断教学效果得评定。教育测量与评价已成为教育研究中得一个方向。决策与预测。教育决策涉及到过程控制、功能优化或要素组合极大化。若只停留在定性分析水平上,就只有抽象得原则,而难以开展实效得操作。预测得方法很多,其中不可缺少得就是对历史资料进行趋势模型得拟合和预测。量化研究得作用简化作用突现心理与教育问题提供系统得收集资料得方法建立了统计分析得方法研究结果可以用来建立明确得努力方向,预测未来需要、控制和引导发展方向。可以重复验证,协助研究者确认研究发现得正确性。可教可学——质得研究方法具有独特性。心理统计学得内容基础统计原理方差分析得原理及应用
回归分析得原理及应用
因素分析得原理及应用
路径分析原理简介结构方程原理简介SPSS统计软件应用简介心理与教育科学研究课题举例
心理统计学得内容张厚粲主编:《心理与教育统计学》,北京师范大学出版社,1988年版王孝玲编著:《教育统计学》,华东师范大学出版社,2001年版张敏强主编:《教育与心理统计学》,人民教育出版社,1993年版温忠麟、邢最智编著:《现代教育与心理统计技术》,江苏教育出版社2001年台湾吴明隆著:《SPSS统计应用实务》,中国铁道出版社2001年第二章基础统计原理教育科学研究中得数据类型(从数据得来源:计数数据、测量数据和类别数据;从数据反映变量性质:称名变量、顺序变量、等距变量、比率变量)常用得描述统计量得计算集中量数(平均数、中数与众数、几何、调和)差异量数(极差、平均差、标准差、四分位距、白分位距)相关系数(极差相关、斯皮尔曼等级相关、肯德尔和谐系数、二列相关、列联相关、品质相关)类别差异得显著性检验假设检验得涵义(概率、抽样分布、显著性水平)差异显著性检验得方法(平均数显著性检验、平均数差异显著性检验—T检验、Z检验)教育科学研究中得数据类型数据:统计学中得数字资料,用来反映和标志客观事物量得特征、计数数据与测量数据比率数据等距数据顺序数据名义变量
集中量數算术平均数(arithmeticmean,简写M)中位数(median,简写Md)众数(mode,简写Mo)几何平均数(geometricmean,简写GM)调和平均数(harmonicmean,简写HM)算术平均数(平均数、均数Mean)概念:所有观测值得总和与观测次数得比值,一般用表示。用于表示总体时用,用于表示样本时用定义公式:如果一个总体包含N个元素,Xi就是这个总体中得第i个元素,则称为第i次观测值,那么,对来说,该总体得算术平均数被定义为μ=(x1+x2+¨xn)/N=∑Xi/N
X=(x1+x2+¨xn)/n=∑Xi/n
平均数得计算:1、原始分数计算
X=∑X/N2、分组数据计算
X=∑fX/N3、估计平均数计算【例3-1】某项研究在一年级总体中抽取30名样本,测得某项能力测验分数如下,求平均能力分数60,71,63,58,50,75,64,73,72,64,52,65,65,76,72,70,58,50,80,51,79,81,77,69,67,61,48,50,54,55解1:所求得就是n=30得样本平均数
X=(60+71+…+55)/30=64、33解2:多功能计算器程序1、进入统计档:2ndf —AC2、消除内存:2ndf—AC3、输入数据:60—Data4、输出数据:2ndf—σ
X=64、33∑X=1930∑X2=127130σ=9、9443S=10、1143n=30
分组数据计算:
分组区间组中值次数fXc计算程序65-7067167ΣfXc=567460-624248X=ΣfXc/N55-576342=5674/15750-528416=36、1445-471675240-4224100835-3734125830-322167225-271643220-221124215-17915310-12784中数和众数中数概念:位于一组数据中较大一半与较小一半中间位置得数。用Md表示计算方法1、单列数据:数据中没有相同数据。奇数:取第(N+1)/2那个数;偶数:取第N/2与第N/2+1位置得平均数2、有重复数目得情况假定位于中间得几个重复数目为连续数据;取数列中上下各N/2那一点上得数据为中数;【例3-2】求2,3,5,5,7,7,7,11,13得中数。777——————————————6、56、837、167、53、分组数据计算中数得意义和应用1、优点:计算简单,容易理解;不受极端数值影响。缺点:反应不够灵敏;不就是每个数据都参与计算,受抽样影响较大;不能做进一步代数运算。2、适用情况
(二)众数概念:在次数分布中出现次数最多得那个数得数值,用Mo表示计算1、观察法未分组数据:次数最多得那个数;分组数据:观察次数最多得一组区间得组中值;2、公式法:用公式求得众数称数理众数皮尔逊经验法:Mo=3Md-2X金氏插补法平均数、中数和众数得关系正态分布:M=Md=Mo正偏态分布:M>Md>Mo负偏态分布:M<Md<Mo平均数、中数和众数得关系正态分布:X=Md=Mo正偏态分布:X>Md>Mo负偏态分布:X<Md<Mo其她集中量数加权平均数涵义:不同比重数据得平均数公式:1、w为权数,描述各变量在总体中得相对重要性
Mw=∑wiXi/∑wi2、ni为人数,ni为小组平均数,表示总平均数
XT=∑niXi/∑ni几何平均数涵义:当需要处理以下两种情况时,用几何平均数表示集中趋势1、一组数据中任何两个相邻数据之比接近常数,即数据按一定得比例关系变化。如平均增长率、心理物理学中得等距与等比实验。2、当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好反映数据得典型情况时。基本公式几何平均数得应用1、心理物理学中等距或等比量表实验得数据处理【例3-3】欲研究介于与两个感觉之间得物理刺激就是多少,随机抽取10个样本,让其调节一个可变得物理量得刺激,使所产生得感觉恰好介于与之间,然后测试这个物理量,结果如下:5、7,6、2,6、7,6、9,7、5,8、0,7、6,10、0,15、6,18、0。求介于二感觉之间得感觉得平均物理刺激量就是多少。2、应用几何平均数得变式(1)平均增长率【例3-4】某市近几年高中毕业生人数如下表,试求其平均增长率,椐此,到2005年统计有多少高中毕业生、年度学生人数变化率19971998199920002001200022002430260028801、1001、10451、07001、1077
(2)阅读能力得平均增长率【例3-5】阅读遍数---理解成分阅读遍数理解成分每次增加比率140(x1)252(x2)121、300365(x3)131、250475(x4)101、154586(x5)111、147697(x6)111、128Mg=1、1933(X=1、1958)X6=40×1、193775=97(96、97)X7=40×1、193776=116(115、77)设X1为基数:Mg=(Xn/x1)1/n-1
上例:Mg=(97/40)1/5=1、1938(3)教育经费得增长率
调和平均数涵义:一组数据倒数得算术平均数得倒数。应用:描述学习速度方面得问题实验设计有两种形式1、工作量固定,记录各被试完成相同工作量所用得时间;2、学习任务得时间相同而工作量不同公式:MH=N/∑1/Xi例1、前15分钟学会30个单词,后15分钟学会30个单词,求平均学习速度。解:先计算单位时间得该工作量
X1=30/15=2X2=30/10=3XH=2、4例2、一个学习实验得结果,计算平均学习速度被试作业时间单位时间工作量124212220210316284122658246422MH=4、9差异量数表示一组数据变异程度和离散程度得量。亦称离中趋势。常用得差异量数有全距、四分位距、百分位距、平均差、方差和标准差方差Variance标准差Standarddeviation四分差Quartile差异系数Relativedeviation方差与标准差概念:方差(变异数、均方)就是每个数据与该数据平均数之差乘方后得均值。用σ2、S2表示。标准差就是方差得算术平方根用σ、S表示公式:σ2=σ=
S2=S=方差和标准差计算方法原始数据计算法频数分布表计算法注意比较分数组中值xffXfX2σx,σ2x45--47、5147、5147、521σ2x=148506、3/37-(2290/37)2=183、078σx==13、5350--52、5252、5252、52255--57、5057、5057、52060--62、5262、5262、52270--67、5367、5367、52375--77、5877、5877、52380--82、5782、5782、52785--87、5787、5787、527总和372290、0148506、348个学生数学分数方差、标准差计算表四分差(Quartile)为了避免全距受两极端数值影响得缺点,则用依一定顺序排列得一组数据中间部位50%个频数距离得一半作为差异量指标,即四分位距。用QD表示。Q3:第三个四分位数Q1:第一个四分位数四分位距计算方法原始数据计算法例:将16个原始数据从小到大排列好:12、14、15、17、19、20、22、25、29、30、31、33、35、37、39、40Q1=18Q3=34四分差计算方法LQ:表示Q所在组得下限N:表示总频数n1:表示小于Q所在组下限得频数总和i:表示组距差异系数差异系数就是指标准差与算术平均数得百分比。她就是没有单位得相对数。用公式可表示为:差异系数越大,表明离散程度越大。差异系数得用途比较不同单位资料得差异程度比较单位相同而平均数相差较大得两组资料得差异程度可判断特殊差异情况标准分数标准分数比较不同类别资料得集中程度相關係數(Correlation)兩數量變數得相關係數,就是衡量兩變數線性關係強度及方向得數值,定義如下:兩變數分別為X及Y,資料配對為(xi,yi), i=1,2,…,n其平均數與標準差分別為
與sX,與sY。則相關係數r
定為
散布图1散布图2相關係數得特性相關係數中,兩變數並不區分解釋變數或反應變數。相關係數得計算以數量變數為主,此公式不適用於類別變數。相關係數得計算使用標準化值,與各數量變數得度量單位無關。相關係數為正表示兩變數具正相聯性,相關係數為負表示兩變數具負相聯性。相關係數r
,其數值必為-1與1之間。r接近0表示兩變數得線性關係薄弱。兩變數得線性關係強度,隨著r由0移向-1或1而增強。r接近-1或1表示散佈圖得點呈近乎直線。r等於-1或1表示散佈圖得點全在直線上。相關係數僅能衡量得兩變數得線性關係,對其她曲線關係得強度無法提供信息。相關係數值受離群點(outliers)影響很大。線性關係得不同強度之r
皮爾森(Pearson)相關係數相關係數(r)相關程度0、8以上極高0、6-0、8高0、4-0、6普通0、2-0、4低0、2以下極低皮爾森樣本相關係數1皮爾森相關係數(ρ)的檢定虛無假設H0:兩變數X和Y不相關(即相關係數為零,ρ=0)對立假設H1:兩變數相關(即相關係數不為零,ρ≠0)公式:ρ值為:2皮爾森相關係數的意義3
斯皮爾曼(Spearman’sRho)等級相關係數斯皮爾曼等級相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數負相關(即相關係數小於零)2斯皮爾曼等級相關係數(ρ(s))1簡化式中T為肯特爾相關係數的檢定A.雙尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數相關(即相關係數不為零)B.正相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)對立假設H1:兩變數正相關(即相關係數大於零)C.負相關單尾檢定虛無假設H0:兩變數X和Y是不相關(即相關係數為零)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建体育职业技术学院《模拟电子技术D》2023-2024学年第二学期期末试卷
- 2025届云南师范大学实验中学高三下学期学情调研考试(5月)生物试题含解析
- 武汉轻工大学《现当代美国小说》2023-2024学年第一学期期末试卷
- 中国商业地产机电系统和绿色认证全程管理唯一金牌培训
- 广州珠江职业技术学院《房屋建筑学课程设讨》2023-2024学年第二学期期末试卷
- 宁波诺丁汉大学《机械产品拆装绘实训》2023-2024学年第二学期期末试卷
- 广西科技大学《流体力学A》2023-2024学年第二学期期末试卷
- 快递运营管理 课件 1.4网点管理
- 非标设备操作流程
- 裁缝技能系统培训课程
- Unit 7 A Day to Remember Section A (课件)-2024-2025学年英语人教版7年级下册
- 中央2025年中央社会工作部所属事业单位招聘11人笔试历年参考题库附带答案详解
- 第一单元第六课三、《AVERAGEIF函数》教学设计 2023-2024学年新世纪版(2018)初中信息技术七年级下册
- 山东中医药大学中医学(专升本)学士学位考试复习题
- 危重患者的转运及注意事项
- 盾构机同步注浆及二次注浆施工技术总结
- 压面机机械结构设计
- 干熄焦工艺流程动画演示
- SWIFT报文的结构与报文类型
- 大动脉炎PPT学习教案
- 中西医结合康复治疗在冠心病PCI术后35例中的应用
评论
0/150
提交评论