版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 方差分析入门 单因素方差分析 均数两两比较的方法 趋势检验 单因素方差分析小结双因素方差分析协方差分析 内容提要前面提到的有关统计推断的方法,如单样本、两样本t检验等,其所涉及的对象千变万化,但归根结底都可以视为两组间的比较,如果是有一组的总体均数已知,则为单样本t检验,如果两组都只有样本信息,则为两样本t检验。但是如果遇到以下情形,该如何处理?方差分析入门案例 对于大学新生的入学成绩,可以通过t检验来考察男女学生间的入学成绩是否有差异?但要是想知道来自于江苏、浙江、上海、安徽等省份的学生,其入学成绩是否有差异,那么是否可以用6次t 检验来达成目的?方差分析入门在以上例子中,涉及的问题其实就
2、是在单一处理因素之下,多个不同水平(多组)之间的连续性观察值的比较,目的是通过对多个样本的研究,来推断这些样本是否来自于同一个总体。那么能否使用两两t 检验,例如做三组比较,则分别进行三次t检验来解决此问题呢?这样做在统计上是不妥的。因为统计学的结论都是概率性的,存在犯错误的可能。方差分析入门 分析:用6次t 检验来考察4个省份的大学生新生入学成绩是否相同,对于某一次比较,其犯I类错误的概率为,那么连续进行6次比较,其犯I类错误的概率是多少呢?不是 6,而是1-(1- )6。也就是说,如果检验水准取0.05,那么连续进行6次t 检验,犯I类错误的概率将上升为0.2649!这是一个令人震惊的数字
3、! 结论:多个均数比较不宜采用t 检验作两两比较;而应该采用方差分析!方差分析入门统计思想:观测变量的总方差可分解为组间方差和组内方差,前者反映控制因素的影响,后者体现随机误差,如果前者显著大于后者,则可认为控制因素对观测值有影响。分析步骤:明确控制因素和观测变量剖析观测变量的离均差平方和:SST=SSA+SSE分解自由度比较组间和组内的方差大小,根据F分布界值做出统计结论。方差分析入门组别i观测值j数学模型:方差分析入门 R.A.Fisher 提出的方差分析的理论基础: 将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布作出统计推断。后人又
4、将线性模型的思想引入方差分析,为这一方法提供了近乎无穷的发展空间。方差分析入门总变异 随机变异 处理因素导致的变异总变异 组内变异 组间变异SS总 SS组内 SS组间这样,我们就可以采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的确存在,如果两者相差无几,则说明该影响不存在,以上即方差分析的基本思想。方差分析入门方差分析的原假设和备择假设为:H0:12=kH1:k个总体均数不同或者不全相同方差分析入门方差分析基本步骤提出假设 H0:a1=a2=ak=0确定显著性水平构造检验统计量并计算统计结论与结果解释方差分析入门 独立性(independence): 观察
5、对象是所研究因素的各个水平下的独立随机抽样 正态性(normality): 每个水平下的应变量应当服从正态分布 方差齐性(homoscedascity) 各水平下的总体具有相同的方差。但实际上,只要最大/最小方差小于3,分析结果都是稳定的应用条件有时原始资料不满足方差分析的要求,除了求助于非参数检验方法外,也可以考虑变量变换。常用的变量变换方法有:对数转换:用于服从对数正态分布的资料等;平方根转换:可用于服从Possion分布的资料等;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;其它:平方变换、倒数变换、BoxCox变换等。应用条件 例1 在肾缺血再灌注过程的研究中,将36只雄性大
6、鼠随机等分成三组,分别为正常对照组、肾缺血60分组和肾缺血60分再灌注组,测得各个体的NO数据见数据文件no.sav,试问各组的NO平均水平是否相同?单因素方差分析分析:对于单因素方差分析,其资料在SPSS中的数据结构应当由两列数据构成,其中一列是观察指标的变量值,另一列是用以表示分组变量。实际上,几乎所有的统计分析软件,包括SAS,STATA等,都要求方差分析采用这种数据输入形式,这一点也暗示了方差分析与线性模型间千丝万缕的联系。单因素方差分析 预分析(重要):检验其应用条件单因素方差分析选择data 中的split file,出现如下对话框:单因素方差分析单因素方差分析单因素方差分析 这里
7、仅取其中一组结果,表明该资料符合分组正态性的条件。单因素方差分析注意分组检验正态性后,要先回到data菜单下的split file ,如下操作取消拆分后才能进行后续的方差分析:单因素方差分析单因素方差分析选入分组变量选入因变量给出各组间样本均数的折线图指定进行方差齐性检验单因素方差分析结果分析单因素方差分析(1) 方差齐性检验 Levene方法检验统计量为3.216,其P值为0.053,可认为样本所来自的总体满足方差齐性的要求。单因素方差分析结果分析(2) 方差分析表 第1列为变异来源,第2、3、4列分别为离均差平方和、自由度、均方,检验统计量F值为5.564,P0.008,组间均数差别统计学
8、意义,可认为各组的NO不同。变异来源组间方差MS离差平方和SS自由度F值P值组内单因素方差分析结果分析(3) 各组样本均数折线图Means plots 选项给出,更直观。注意:当分组变量体现出顺序的趋势时,绘制这种折线图可以提示我们选择正确的趋势分析模型。通过以上分析得到了拒绝H0的结论,但实际上单因素方差分析并不这样简单。在解决实际问题时,往往仍需要回答多个均数间到底是哪些存在差异。虽然结论提示不同组别个体的NO量不同,但研究者并不知道到底是三者之间均有差别,还是某一组与其他两组有差别。这就应当通过两两比较(多重比较)进行考察。均数两两比较方法直接校正检验水准(相对粗糙)专用的两两比较方法:
9、计划好的多重比较(Planned Comparisons)非计划的多重比较(PostHoc Comparisons)均数两两比较方法Contrasts按钮Post Hoc按钮点击单因素方差分析主对话框中的Post Hoc按钮,总共有14种两两比较的方法,如下:均数两两比较方法LSD法:最灵敏,会犯假阳性错误;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更为保守一些;Scheffe法:多用于进行比较的两组间样本含量不等时;Dunnet法:常用于多个试验组与一个对照组的比较;S-N-K法:寻找同质亚组的方法;Turkey法:最迟钝,要求各组样本含量相同;Duncan法:与S
10、idak法类似。均数两两比较方法仍以例1为例,LSD法的输出格式:均数两两比较方法结果分析仍以例1为例,SNK法的输出格式:结果分析均数两两比较方法 该方法的目的是寻找同质子集,故各组在表格的纵向上,均数按大小排序,然后根据多重比较的结果将所有的组分为若干个子集,子集间有差别,子集内均数无差别。 当各组样本含量不同,选择Scheffe法,得结果:均数两两比较方法结果分析 假设在调查的设计阶段,就计划好了第二组和第一组,以及第三组和第一组的比较,可以使用主对话框中的contrast 按钮实现。 在coefficients后面的框中输入1,-1,0,每次输入后点击add,就可以比较第一组和第二组的
11、NO;再点击next按钮,继续输入下一个组合,即0,-1,1。均数两两比较方法均数两两比较方法结果分析可见,第一个组合无统计学意义,而第二个组合有显著性差异。理论上,方差分析所对应的分组变量应该是一个无序的变量。但实际上,往往分组变量的取值也可以体现顺序的意义,比如,多个时间点上的某项指标的比较;不同pH下某些化学物质转化率的比较等。这类资料并不少见。对于这类资料,既然是多组间计量资料的比较,当然是优先考虑单因素方差分析。但是在得到各组间有差异的结论之余,也应该注意到单纯的方差分析并未利用分组变量中蕴涵的次序信息。趋势检验 例2 要研究高梁的不同播种深度与出苗时间的关系,数据如下表,见tren
12、d.sav:高梁的不同播种深度与出苗时间的关系趋势检验本例经方差分析可知各种播种深度下出苗天数不等或不全相等,而Meansplot 图进一步提示天数与深度之间的关系,如下。趋势检验自变量间各取值间间隔相等时,除了对此进行方差分析之外,还可以利用线性模型的有关原理对数据作进一步的分析,以考察应变量与处理因素之间是否存在某种依存关系,统计学上称为趋势检验。这种趋势并非仅仅指线性的,也可能是一种多项式关系。因此,一般通过建立正交多项式模型的方法来进行趋势检验。趋势检验在contrast对话框中,选择polynomial复选框,并在degree列表中选择cubic(三次型)。趋势检验可见,播种深度和发
13、芽天数之间的关系的确需要使用高次项关系来描述。趋势检验结果分析 注意: 趋势检验的目的并非拟合线性或非线性模型,而是希望知道当因素的水平改变时,均数以什么样的形式(线性、二次性或者其他)随之改变。趋势检验 单因素方差分析所针对的是多组均数间的比较,其基本思想是变异分解,即将总变异分解为组间变异和组内变异,再利用F分布做出有关的统计推断。 单因素方差分析要求资料满足正态性、独立性和方差齐性的条件。 方差分析拒绝H0只能说明各组之间存在差异,但不足以说明各组之间的关系。利用多重比较可以初步判断各组间的关系。小 结 多重比较可以分为事前计划好的比较和事后比较。前者往往借助于Contrast,而后者有
14、很多不同的方法,这些方法的核心问题是如何控制总的一类错误的大小。 在分组变量包含次序信息时,如果方差分析作出了各组间差异有统计学意义的结论,并在MeansPlot提示各组均数的某种趋势时,可以利用趋势分析探讨观察值与分组变量取值的数量依存关系。小 结研究内容与前提条件单元拟研究:两个及以上控制因素对观测变量的影响,包括各因素的独立作用和交互作用。是实验设计的常用分析方法,常用于寻找最佳的实验因素组合。前提条件:同单因素方差分析,要求每一单元格的样本数据符合独立性、正态性及方差齐性。但对正态性和方差齐性的要求不严格。只要无极端值,前提条件稍有偏离是可以耐受的。格无重复数据时,不要求正态性及方差齐
15、性。双因素方差分析双因子方差分析的数据结构利用下表资料分析研究不同地区和不同时间对农民家庭人均纯收入(元)的影响分析步骤确定观测变量和若干个控制变量剖析观测变量的离均差平方和SST控制变量的独立作用SSA、SSB控制变量的交互作用SSAB随机因素的影响SSESST=SSA+SSB+SSAB+SSE分解自由度比较各部分方差的大小双因子方差分析数学模型设因素A有r个水平,因素B有s个水平,在每个单元格内有l个样本,则在因素A的Ai水平和因素B的Bj水平下的第k个样本值xijk,可定义为:双因子(有交互作用)方差分析表相关概念饱和模型(Full Factorial):即全因素模型,方差分析模型中包含
16、所有因素的独立作用和可能的交互作用。不饱和模型:非全因素模型。主效应:控制变量的独立作用。交互效应:控制变量之间的相互作用,如果一个因素的效应大小在另一因素不同水平下明显不同,则二者存在交互效应。交互作用A、B无交互作用A、B有交互作用固定效应与随机效应固定效应:考察因素的水平数是可控的,在研究中对该因素的所有可能水平都进行了考察,不需要进一步外推,如性别。因素的效应是固定。随机效应:考察因素难以控制在固定的水平上,或因素的所有可能水平并未都出现在样本中。因此要用样本来推论总体情况,包括未出现的水平。这不可避免的存在误差(即随机效应),需要估计该误差的大小,因而其效应具有随机性。如家庭。基本步
17、骤提出假设 H0:各控制变量不同水平下观测变量各总体的均值无统计学差异。确定显著性水平构造模型、并计算检验统计量固定效应模型( Fixed factor )随机效应模型(Random factor):统计结论与结果解释SPSS多因素方差分析过程(GLM)操作AnalyzeGeneral Linear ModelUnivariate,即单变量一般线性模型饱和模型多因素方差分析的其他选项不饱和模型的建立(Model)均值检验多重比较检验(Post Hoc):两两比较对比检验(Contrast):单样本t检验的思想,检验值可指定:观测变量的均值(Deviation):选择忽略水平第一水平或最后水平的
18、观测变量的均值(Simple)该水平前的所有水平的观测变量的均值(Difference)该水平后的所有水平的观测变量的均值(Helmert)前一水平的观测变量的均值(Repeated)多项式比较(Polynomial)主效应模型图形分析(Pro):均值折线图,可直观显示交互作用保存新变量(Save):可计算观测变量的预测值;可计算残差,评价模型拟和优度;异常点诊断。Options选项:Estimated Marginal Means: 输出均数比较Display:一些常用的指标Estimates of effects:计算偏Eta统计量Observed power:观测检验效能Parameter estimates:参数估计Homogeneity:方差齐性检验Residual plot:绘制实测值、预测值与残差的两两散点图Lack of fit::失拟检验,检验模型拟和优度,零假设如被拒绝,则说明模型不能刻划
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度山西省高校教师资格证之高等教育心理学通关题库(附答案)
- 2023年真空电子器件及零件资金筹措计划书
- 2024年福建省砌筑工竞赛理论题题库及答案
- 餐厅服务基本理论知识考试题及答案
- 第01讲 1.1反应热 焓变(含答案)-2024年高中化学同步精讲义(选择性必修一)
- 2024企业品牌产品区域代理经销协议
- AI技术在电力系统发展中的应用与前景
- 适合农村孩子的读书节活动方案
- 教学课件:第二十章紫外-可见吸光光度法
- 2024货物运输协议规范化文档
- 签订《商品房买卖合同》业务流程图
- 设备设施检维修及验收记录表
- cia题库第二部分
- 纯音听阈测试(曹永茂)
- 喉罩(LMA)-麻醉课件
- 新课标背景下高中数学大单元教学的实施策略
- 中国近代史纲要3
- 无负压供水设备管网叠压无负压变频供水设备选型样本数据手册
- GMP质量管理体系文件 中药材干燥记录
- 教学设计 《找规律》教学设计【省一等奖】
- 直流系统级差保护
评论
0/150
提交评论