精选检验及单因素方差分析讲义_第1页
精选检验及单因素方差分析讲义_第2页
精选检验及单因素方差分析讲义_第3页
精选检验及单因素方差分析讲义_第4页
精选检验及单因素方差分析讲义_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(优选)检验及单因素方差分析本文档共32页;当前第1页;编辑于星期六\14点17分T检验,亦称studentt检验,主要用于样本含量较小(n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与z检验、卡方检验并列。本文档共32页;当前第2页;编辑于星期六\14点17分T检验之T分数研究发现,从正态分布的总体中抽取样本时,样本平均数的分布也是一个正态分布,样本平均数的差异量的分布也是正态分布,其分布特征可以用Z分数来描述。但是,在实际计算标准分数时,需要首先知道总体的标准差,然后计算抽样分布的标准误。如果总体标准差未知,也就只能使用样本标准差作为它的估计值了,以这一估计值计算的标准误就是一个波动值了。因此,此时不能使用Z分数来描述其分布特征,而是要用t分数来描述其分布特征。本文档共32页;当前第3页;编辑于星期六\14点17分T检验之T分布t分布是一个均值为零左右对称的丘形分布,峰度低于标准正态分布,尾部高于标准正态分布。自由度越大其分布越接近于正态分布,所以在大样本检验中可以使用Z检验代替t检验。t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线越平坦,曲线中间越低,曲线双侧尾部越高;自由度df越大,t分布曲线越接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。本文档共32页;当前第4页;编辑于星期六\14点17分T分布t分布与Z分布的比较T分布有如下性质:1,单峰分布,曲线在t=0处最高,并以t=0为中心左右对称;2,与正态分布相比,曲线最高处较矮,两尾部比较高;3,随着自由度的增大,曲线逐渐接近正态分布,极限为标准正态分布。本文档共32页;当前第5页;编辑于星期六\14点17分t检验分为单总体检验和双总体检验一、单总体t检验检验一个样本平均数与一个已知的总体平均数的差异是否显著。适用条件:当总体分布是正态分布,总体标准差未知且样本容量小于30时。这时一切可能的样本平均数与总体平均数的离差统计量呈t分布,采用单总体t检验。(如果样本是属于大样本,即n>30,那么可用正态分布近似处理)。本文档共32页;当前第6页;编辑于星期六\14点17分单总体t检验统计量为:本文档共32页;当前第7页;编辑于星期六\14点17分二、双总体t检验双总体t检验是用t分布理论来推论差异发生的概率,从而检验两个样本平均数与其各自所来自总体之间的差异是否显著。双总体t检验又分为两种情况一是独立样本平均数的显著性检验,即独立样本t检验。各实验处理组之间毫无相关存在,为独立样本。首先进行方差齐性检验。用于检验两组非相关样本被试所获得的数据的差异性。二是相关样本平均数差异的显著性检验,即配对样本t检验。用于检验匹配组被试获得的数据,或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本为相关样本。本文档共32页;当前第8页;编辑于星期六\14点17分独立样本t检验各实验处理组之间毫无相关存在,为独立样本,方差齐性时,统计量为:其中S1

S2

为两样本方差;n1

和n2

为两样本容量。本文档共32页;当前第9页;编辑于星期六\14点17分配对样本t检验两样本个体之间存在一一对应关系,即为相关样本统计量为:本文档共32页;当前第10页;编辑于星期六\14点17分t检验步骤例:难产儿出生体重n=35,

=3.42,S=0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否?解:1.建立假设H0:μ=μ0H1:μ≠μ02.计算检验统计量3.查相应界值表,确定P值,下结论查附表1,t0.05/2.34

=2.032,t<t0.05/2.34,P>0.05,按α=0.05水准,接受H1,两者之间无显著差异。本文档共32页;当前第11页;编辑于星期六\14点17分独立样本T检验SPSS操作​1、将数据组织成如图所示的样式,第二列数据是分组,第一组数据和第二组数据放在一起​本文档共32页;当前第12页;编辑于星期六\14点17分2、在菜单栏上执行:analyze--comparemeans--independentsamplesTtest​个不同总体之间是否存在某种差异性,如比较男生样本和女生样本的平均记忆力水平、场依存性分数等;另一情况是来自于同一总体的两个样本,分别在不同条件下进行同样的测量,然后比较两个样本测量的平均值的差异性,以判断不同条件对测量结果的影响。本文档共32页;当前第13页;编辑于星期六\14点17分3、打开如图所示的对话框,我们将要比较平均数的变量放到testvariables,将分组变量放到groupingvariables,点击definegroups​4、在打开的对话框中,设置组1和组2的值分别是1,2,然后点击继续​本文档共32页;当前第14页;编辑于星期六\14点17分5、回到这个对话框,点击ok按钮​6、看到输出结果,我们先要分析第一个sig值,如图所示的数字,这个数字大于0.05可以认为两个样本方差是齐性的,我们就看第一行的数据​本文档共32页;当前第15页;编辑于星期六\14点17分7、第二个sig值是0.078大于0.05说明两个样本的平均数是没有差异的​8、假如在第六步中,提到的sig值小于0.05,即方差不齐性,那就要看第二行数据,第二个sig值为0.079​大于0.05,说明两个样本的平均数是没有差异的​本文档共32页;当前第16页;编辑于星期六\14点17分配对样本T检验SPSS操作1、输入数据,调出相关操作窗口本文档共32页;当前第17页;编辑于星期六\14点17分2、根据成对的变量自定义进行选择配对,将相关数据导入。点击选项,设置置信区间,默认为95%,处理缺失值。全部设定好之后选择确定按钮获得配对均值比较结果。本文档共32页;当前第18页;编辑于星期六\14点17分3、第一个表格是数据的基本描述。第二个是数据前后变化的相关系数,概率大于显著性水平0.05,则说明数据变化前后没有显著变化,线性相关程度较弱。第三个表格是数据相减后与0的比较,概率值为0,小于显著性水平0.05,则拒绝原假设,数据变化前后有显著变化,差异显著。本文档共32页;当前第19页;编辑于星期六\14点17分方差分析在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法,是因素型实验研究的数据处理的核心方法。因素型实验研究会得到多组数据,而这些数据必然存在变异。数据变异的原因是多方面的,一般包括:自变量或准自变量的水平间差异、被试间的差异、测试过程引入的测量误差、其它的额外变量等。因素型实验的目的就是考察自变量或准自变量引起的数据变化是不是足够的大,然后确定不同水平间因变量的差异性并非是由误差因素所造成。本文档共32页;当前第20页;编辑于星期六\14点17分方差分析基本原理不同处理组的均值间的差别基本来源有两个:(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,记作SSw,组内自由度dfw。(2)实验条件,即不同的处理造成的差异,称为组间差,记作SSb,组间自由度dfb。总偏差平方和记作SSt本文档共32页;当前第21页;编辑于星期六\14点17分方差分析基本原理组内SSw

、组间SSb除以各自的自由度(组内dfw=n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb。一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。另一种情况是处理确实有作用,那么MSb>>MSw。MSb/MSw比值构成F分布,用F值与其临界值比较,推断各样本是否来自相同的总体。本文档共32页;当前第22页;编辑于星期六\14点17分方差分析分为单因素方差分析和多因素方差分析这里要讲的是:单因素方差分析当研究考察的自变量为一个的时候,并且自变量分为三个或三个以上水平,这时我们需要用单因素方差分析。与T检验的不同在于:方差分析是用来处理多于两个以上的平均数差异,而T检验只能考察两个平均数之间的差异。本文档共32页;当前第23页;编辑于星期六\14点17分方差分析的假设检验零假设H0:m组样本均值都相同,即μ1=μ2=....=μm如果经过计算结果组间均方远远大于组内均方(MSb>>MSw

),F>F0.05(dfb,dfw),p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理间有显著性差异;否则,F<F0.05((dfb,dfw),p>0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。本文档共32页;当前第24页;编辑于星期六\14点17分单因素方差分析单因素方差分析(one-wayANOVA),对二组以上的均值加以比较。检验由单一因素影响的一个(或几个相互独立的)分析变量由因素各水平分组的均值之间的差异是否有统计意义。计算步骤:(1)提出假设(2)计算平方和、自由度以及F值(3)统计决断,P<0.05为差异显著,P<0.01为差异极其显著。参照下图本文档共32页;当前第25页;编辑于星期六\14点17分单因素方差分析SPSS操作One-WayANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果个因变量之间彼此不独立,应该用RepeatedMeasure过程。例:调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表本文档共32页;当前第26页;编辑于星期六\14点17分(1)数据输入(2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“CompareMeans”项,在右拉式菜单中点击“0ne-WayANOVA”项,系统打开单因素方差分析设置窗口如图本文档共32页;当前第27页;编辑于星期六\14点17分(3)设置分析变量

因变量:

选择一个或多个因子变量进入“DependentList”框中。本例选择“幼虫”。

自变量:

选择一个因素变量进入“Factor”框中。本例选择“品种”。

(4)设置多项式比较

单击“Contrasts”按钮,将打开如图所示的对话框。该对话框用于设置均值的多项式比较。本文档共32页;当前第28页;编辑于星期六\14点17分(5)设置多重比较

在主对话框里单击“PostHoc”按钮,将打开如图所示的多重比较对话框。该对话框用于设置多重比较和配对比较。多重比较选择LSD;然后点击“继续”。本文档共32页;当前第29页;编辑于星期六\14点17分(6)

设置输出统计量

单击“Options”按钮,打开“Options”对话框,如图所示。选择要求输出的统计量,并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。

Excludecasesanalysisbyanalysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。

本例中选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。(7)提交执行

设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。本文档共32页;当前第30页;编辑于星期六\14点17分(8)结果分析表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论