单因素方差分析非参数检验用ppt课件_第1页
单因素方差分析非参数检验用ppt课件_第2页
单因素方差分析非参数检验用ppt课件_第3页
单因素方差分析非参数检验用ppt课件_第4页
单因素方差分析非参数检验用ppt课件_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 方差分析入门方差分析入门 单因素方差分析单因素方差分析 均数两两比较的方法均数两两比较的方法 小结小结v 内容提要内容提要前面提到的有关统计推断的方法,如单样本、两样本前面提到的有关统计推断的方法,如单样本、两样本t检验检验等,其所涉及的对象千变万化,但归根结底都可以视为两等,其所涉及的对象千变万化,但归根结底都可以视为两组间的比较,如果是有一组的总体均数已知,则为单样本组间的比较,如果是有一组的总体均数已知,则为单样本t检验,如果两组都只有样本信息,则为两样本检验,如果两组都只有样本信息,则为两样本t检验。但是检验。但是如果遇到以下情形,该如何处理?如果遇到以下情形,该如何处理?方差分析入

2、门方差分析入门案例案例 对于大学新生的入学成绩,可以通过对于大学新生的入学成绩,可以通过t t检验来考察检验来考察男女学生间的入学成绩是否有差异?但要是想知道来自男女学生间的入学成绩是否有差异?但要是想知道来自于江苏、浙江、上海、安徽等省份的学生,其入学成绩于江苏、浙江、上海、安徽等省份的学生,其入学成绩是否有差异,那么是否可以用是否有差异,那么是否可以用6 6次次t t 检验来达成目的?检验来达成目的?方差分析入门方差分析入门在以上例子中,涉及的问题其实就是在单一处理因素之下,在以上例子中,涉及的问题其实就是在单一处理因素之下,多个不同水平(多组)之间的连续性观察值的比较,目的多个不同水平(

3、多组)之间的连续性观察值的比较,目的是通过对多个样本的研究,来推断这些样本是否来自于同是通过对多个样本的研究,来推断这些样本是否来自于同一个总体。一个总体。那么能否使用两两那么能否使用两两t 检验,例如做三组比较,则分别进行检验,例如做三组比较,则分别进行三次三次t检验来解决此问题呢?这样做在统计上是不妥的。检验来解决此问题呢?这样做在统计上是不妥的。因为统计学的结论都是概率性的,存在犯错误的可能。因为统计学的结论都是概率性的,存在犯错误的可能。方差分析入门方差分析入门 分析分析:用用6次次t 检验来考察检验来考察4个省份的大学生新生入学成绩是个省份的大学生新生入学成绩是否相同,对于某一次比较

4、,其犯否相同,对于某一次比较,其犯i类错误的概率为类错误的概率为 ,那么连,那么连续进行续进行6次比较,其犯次比较,其犯i类错误的概率是多少呢?不是类错误的概率是多少呢?不是 6,而,而是是1-(1- )6。也就是说,如果检验水准取。也就是说,如果检验水准取0.05,那么连续,那么连续进行进行6次次t 检验,犯检验,犯i类错误的概率将上升为类错误的概率将上升为0.2649!这是一!这是一个令人震惊的数字!个令人震惊的数字! 结论结论:多个均数比较不宜采用多个均数比较不宜采用t 检验作两两比较;而应该采检验作两两比较;而应该采用方差分析!用方差分析!方差分析入门方差分析入门v r.a.fishe

5、r 提出的方差分析的理论基础:提出的方差分析的理论基础: 将总变异分解为由研究因素所造成的部分和由抽样误差将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助所造成的部分,通过比较来自于不同部分的变异,借助f分布作出统计推断。后人又将线性模型的思想引入方差分布作出统计推断。后人又将线性模型的思想引入方差分析,为这一方法提供了近乎无穷的发展空间。分析,为这一方法提供了近乎无穷的发展空间。方差分析入门方差分析入门总变异总变异 随机变异随机变异 处理因素导致的变异处理因素导致的变异总变异总变异 组内变异组内变异 组间变异组间变异ss总总 ss组内组内 ss

6、组间组间这样,我们就可以采用一定的方法来比较组内变异和组间变这样,我们就可以采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的确存异的大小,如果后者远远大于前者,则说明处理因素的确存在,如果两者相差无几,则说明该影响不存在,以上即方差在,如果两者相差无几,则说明该影响不存在,以上即方差分析的基本思想。分析的基本思想。方差分析入门方差分析入门方差分析的原假设和备择假设为:方差分析的原假设和备择假设为:h0: 1 2= kh1:k个总体均数不同或者不全相同个总体均数不同或者不全相同k1k/(k1)/kbbnwwmsssfmsss ,(n )kkbwmsms其中,是

7、组间均方,是组内均方,在原假设成立时,f值应该服从自由度为 -1,n- 的中心f分布。方差分析入门方差分析入门 独立性独立性(independence) 观察对象是所研究因素的各个水平下的独立随机抽样观察对象是所研究因素的各个水平下的独立随机抽样 正态性正态性(normality) 每个水平下的应变量应当服从正态分布每个水平下的应变量应当服从正态分布 方差齐性方差齐性(homoscedascity) 各水平下的总体具有相同的方差。但实际上,只要最大各水平下的总体具有相同的方差。但实际上,只要最大/最小最小 方差小于方差小于3,分析结果都是稳定的,分析结果都是稳定的应用条件应用条件有时原始资料不

8、满足方差分析的要求,除了求助于非参数有时原始资料不满足方差分析的要求,除了求助于非参数检验方法外,也可以考虑变量变换。常用的变量变换方法检验方法外,也可以考虑变量变换。常用的变量变换方法有:有:对数转换:用于服从对数正态分布的资料等;对数转换:用于服从对数正态分布的资料等;平方根转换:可用于服从平方根转换:可用于服从possion分布的资料等;分布的资料等;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;其它:平方变换、倒数变换等。其它:平方变换、倒数变换等。应用条件应用条件 例例1 为了为了研究烫伤后不同时间切痂对大鼠肝脏三磷酸

9、腺苷研究烫伤后不同时间切痂对大鼠肝脏三磷酸腺苷(atp)的影响,将)的影响,将30只雄性大鼠随机等分成三组,每组只雄性大鼠随机等分成三组,每组10只:只:a组为烫伤对照组、组为烫伤对照组、b组为烫伤后组为烫伤后24小时切小时切 痂组,痂组,c组为烫伤后组为烫伤后96小时切小时切 痂组。全部大鼠在烫伤痂组。全部大鼠在烫伤168小时候处死小时候处死并测量其肝脏并测量其肝脏atp含量,数据见数据文件含量,数据见数据文件f1.sav,试检验,试检验3组大鼠肝脏组大鼠肝脏atp总体均数是否不同?总体均数是否不同?单因素方差分析单因素方差分析分析:分析:对于单因素方差分析,其资料在对于单因素方差分析,其资

10、料在spss中的数据结构应当由中的数据结构应当由两列数据构成,两列数据构成,其中一列是观察指标的变量值,另一列是用其中一列是观察指标的变量值,另一列是用以表示分组变量以表示分组变量。实际上,几乎所有的统计分析软件,包括。实际上,几乎所有的统计分析软件,包括sas,stata等,都要求方差分析采用这种数据输入形式,等,都要求方差分析采用这种数据输入形式,这一点也暗示了方差分析与线性模型间千丝万缕的联系。这一点也暗示了方差分析与线性模型间千丝万缕的联系。单因素方差分析单因素方差分析 预分析(重要):检验其应用条件预分析(重要):检验其应用条件单因素方差分析单因素方差分析选择选择data 中的中的s

11、plit file,出现如下对话框:,出现如下对话框:单因素方差分析单因素方差分析正态性检验 a 单击analyzenonparametric 1-sample k-s单因素方差分析单因素方差分析单因素方差分析单因素方差分析v 这里仅取其中一组结果,表明该资料符合这里仅取其中一组结果,表明该资料符合分组正态性的条件。分组正态性的条件。one-sample kolmogorov-smirnov testone-sample kolmogorov-smirnov testc c108.05301.75228.197.197-.123.623.832nmeanstd. deviationnormal

12、 parametersa,babsolutepositivenegativemost extremedifferenceskolmogorov-smirnov zasymp. sig. (2-tailed)atptest distribution is normal.a. calculated from data.b. group = a组c. 使用explore菜单带检验的正态图analyzedescriptive statisticsexplore将分析的变量导入dependent list变量列表中将分组变量导入factor list框中单击plot按钮选中normality plots

13、 with test,并取消其他勾选continueoktests of normalitytests of normality.19710.200*.91810.341.18710.200*.92910.436.16410.200*.97210.913groupa组b组c组atpstatisticdfsig.statisticdfsig.kolmogorov-smirnovashapiro-wilkthis is a lower bound of the true significance.*. lilliefors significance correctiona. 单因素方差分析单因素方

14、差分析注意分组检验正态性后,要先回到注意分组检验正态性后,要先回到data菜单下的菜单下的split file ,如下操作取消拆分后才能进行后续的方差分析:如下操作取消拆分后才能进行后续的方差分析:单因素方差分析单因素方差分析单因素方差分析单因素方差分析选入分组变量选入分组变量选入因变量选入因变量给出各组间样本给出各组间样本均数的折线图均数的折线图指定进行方差指定进行方差齐性检验齐性检验单因素方差分析单因素方差分析结果分析结果分析单因素方差分析单因素方差分析(1) 方差齐性检验方差齐性检验v levene方法检验统计量为方法检验统计量为1.333,其,其p值为值为0.281,可,可认为样本所来

15、自的总体满足方差齐性的要求。认为样本所来自的总体满足方差齐性的要求。单因素方差分析单因素方差分析结果分析结果分析(2) 方差分析表方差分析表v 第第1列为变异来源,第列为变异来源,第2、3、4列分别为离均差平方和、自列分别为离均差平方和、自由度、均方,检验统计量由度、均方,检验统计量f值为值为15.767,p=3个独立随机连续分布样个独立随机连续分布样本的比较,而正态性假设及等方差假设存在问题时,它本的比较,而正态性假设及等方差假设存在问题时,它可以进行总体是否相同的检验。可以进行总体是否相同的检验。 (不依赖总体分布)(不依赖总体分布) median:中位数检验,检验多个样本是否来自具有:中

16、位数检验,检验多个样本是否来自具有相同中位数总体,在三种方法中检验效能最低,相同中位数总体,在三种方法中检验效能最低, jonckheere-terpstra:对连续性资料或有序分类资料:对连续性资料或有序分类资料都适用,并当分组变量为有序分类资料时(即双向有序资都适用,并当分组变量为有序分类资料时(即双向有序资料),此法的检验效能要高于料),此法的检验效能要高于kruskal-wallis法。法。多个独立样本的非参数检验多个独立样本的非参数检验v 母亲每日吸烟多于母亲每日吸烟多于20支组共支组共4名新生儿,体重平均秩名新生儿,体重平均秩次次3.75;每日吸烟少于;每日吸烟少于20支组共支组共3名新生儿,体重平均名新生儿,体重平均秩次秩次5.00;过去吸烟现已戒烟组共;过去吸烟现已戒烟组共4名新生儿,体重平均名新生儿,体重平均秩次秩次9.38;从不吸烟组共;从不吸烟组共3名新生儿,平均秩次名新生儿,平均秩次12.50。分析结果分析结果多个独立样本的非参数检验多个独立样本的非参数检验(1) 秩次表秩次表v kruskal-wallis h统计量的近似显著概率为统计量的近似显著概率为0.023,按,按0.05的水准拒绝原假设,可认为四个组中至

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论