SPSS170在生物统计学中的应用-实验五、方差分析 六、简单相关与回归分析_第1页
SPSS170在生物统计学中的应用-实验五、方差分析 六、简单相关与回归分析_第2页
SPSS170在生物统计学中的应用-实验五、方差分析 六、简单相关与回归分析_第3页
SPSS170在生物统计学中的应用-实验五、方差分析 六、简单相关与回归分析_第4页
SPSS170在生物统计学中的应用-实验五、方差分析 六、简单相关与回归分析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS在生物统计学中的应用实验指导手册SPSS在生物统计学中的应用实验指导手册实验五:方差分析一、实验目标与要求 1帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理 2掌握方差分析的过程。 3增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。 二、实验原理 在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。 方差分析也是一种假设检验

2、,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。 方差分析有3个基本的概念:观测变量、因素和水平。l 观测变量是进行方差分析所研究的对象;l 因素是影响观测变量变化的客观或人为条件;l 因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。n 根据观测变量的个数,可将方差分析分为单变

3、量方差分析和多变量方差分析;n 根据因素个数,可分为单因素方差分析和多因素方差分析。在SPSS中,有Oneway ANOVA(单变量单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单变量方差分析。 三、实验演示内容与步骤 单变量单因素方差分析单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way

4、 ANOVA过程。 采用One-way ANOVA过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。 【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。试利用这些数据对4种饲料对仔猪增重效果的差异进行检验。饲料日增重(g)均值A573754426050B1339413319

5、29C131513292018D182438221323合计600= =30打开数据文件“单因素方差分析数据-1.xls”。在SPSS中实验该检验的步骤如下: 步骤1:选择菜单【分析】【比较均值】【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。 图 5.1 One-Way ANOVA 对话框 单击两两比较按钮,如图5.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。 方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各

6、均值完全不相等的结论。各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。图 5.2 两两比较对话框假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。² LSD。使用 t 检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。² Bonferroni。使用 t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。² Sidak。基于 t 统计量的成对多重比较检验。Sidak 调整多重比较的显著性水平,并

7、提供比 Bonferroni 更严密的边界。² Scheffe。为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布。可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。² R-E-G-W F。基于 F 检验的 Ryan-Einot-Gabriel-Welsch 多步进过程。² R-E-G-W Q。基于学生化范围的 Ryan-Einot-Gabriel-Welsch 多步进过程。² S-N-K使用学生化的范围分布在均值之间进行所有成对比较。它还使用步进式过程比较具有相同样本大小的同类子集内的均值对。均值按从高到低排序,首先检验极端差

8、分。² Tukey。使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有成对比较的集合的误差率。² Tukey's b。使用学生化的范围分布在组之间进行成对比较。临界值是 Tukey's 真实显著性差异检验的对应值与 Student-Newman-Keuls 的平均数。² Duncan。使用与 Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较,但要为检验的集合的错误率设置保护水平,而不是为单个检验的错误率设置保护水平。使用学生化的范围统计量。² Hochberg's GT2。使用学生化

9、最大模数的多重比较和范围检验。与 Tukey's 真实显著性差异检验相似。² Gabriel。使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比 Hochberg's GT2 更为强大。当单元大小变化过大时,Gabriel 检验可能会变得随意。² Waller-Duncan。基于 t 统计的多比较检验;使用 Bayesian 方法。² Dunnett。将一组处理与单个控制均值进行比较的成对多重比较 t 检验。 最后一类是缺省的控制类别。另外,您还可以选择第一个类别。双面检验任何水平(除了控制类别外)的因子的均值是否不等于控制类别的

10、均值。<控制检验任何水平的因子的均值是否小于控制类别的均值。>控制检验任何水平的因子的均值是否大于控制类别的均值。这里选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。² Tamhane's T2。基于 t 检验的保守成对比较。当方差不相等时,适合使用此检验。² Dunnett's T3。基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。² Games-Howell。有时会变得随意的成对比较检验。当方差不相等时,适合使用此检验。&#

11、178; Dunnett's C。基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。这里选择Tamhanes T2检验法、Dunnett's T3检验法。Significance level输入框中用于输入多重比较检验的显示性水平,默认为5。 单击【选项】按钮,弹出options子对话框,如图所示。在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。 图 5.3 “选项”子对话框² 统计量。Ø 描述性。 计算每组中每个因变量的

12、个案数、均值、标准差、均值的标准误、最小值、最大值和 95% 置信区间。Ø 固定和随机效果。 显示固定效应模型的标准差、标准误和 95% 置信区间,以及随机效应模型的标准误、95% 置信区间和成分间方差估计。Ø 方差同质性检验。 计算 Levene 统计量以检验组方差是否相等。该检验独立于正态的假设。Ø Brown-Forsythe。计算 Brown-Forsythe 统计量以检验组均值是否相等。当方差相等的假设不成立时,这种统计量优于 F 统计量。Ø Welch。计算 Welch 统计量以检验组均值是否相等。当方差相等的假设不成立时,这种统计量优于 F

13、 统计量。² 均值图。显示一个绘制子组均值的图表(每组的均值由因子变量的值定义)。² 缺失值。控制对缺失值的处理。Ø 按分析顺序排除个案。给定分析中的因变量或因子变量有缺失值的个案不用于该分析。而且,也不使用超出为因子变量指定的范围的个案。Ø 按列表排除个案。因子变量有缺失值的个案,或包括在主对话框中的因变量列表上的任何因变量的值缺失的个案都排除在所有分析之外。如果尚未指定多个因变量,那么这个选项不起作用。 在主对话框(单因素方差分析对话框)中点击ok按钮,可以得到单因素分析的结果。实验结果分析:表5.1 资料描述性统计表Descriptives日增重(

14、g)NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximumLower BoundUpper Bound1550.009.9754.46137.6162.3937602529.0012.4105.55013.5944.4113413518.006.7823.0339.5826.4213294523.009.3814.19511.3534.651338Total2030.0015.4243.44922.7837.221360表5.2 方差齐性检验表Test of Homogeneity of Varia

15、ncesTest of Homogeneity of Variances日增重(g)Levene Statisticdf1df2Sig.1.322316.302表5.3 单因素方差分析结果ANOVA日增重(g)Sum of SquaresdfMean SquareFSig.Between Groups2970.0003990.00010.219.001Within Groups1550.0001696.875Total4520.00019表5.4 多重比较检验结果-LSD法、Tamhane法、Dunnett T3法Multiple ComparisonsDependent Variable:日

16、增重(g)(I) 饲料(J) 饲料Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundLSD1221.000*6.225.0047.8034.20332.000*6.225.00018.8045.20427.000*6.225.00113.8040.2021-21.000*6.225.004-34.20-7.80311.0006.225.096-2.2024.2046.0006.225.349-7.2019.2031-32.000*6.225.000-45.20-18.802-11.00

17、06.225.096-24.202.204-5.0006.225.434-18.208.2041-27.000*6.225.001-40.20-13.802-6.0006.225.349-19.207.2035.0006.225.434-8.2018.20Tamhane1221.0007.120.111-4.0246.02332.000*5.394.00312.5251.48427.000*6.124.0145.7648.2421-21.0007.120.111-46.024.02311.0006.325.570-12.9934.9946.0006.957.960-18.6630.6631-3

18、2.000*5.394.003-51.48-12.522-11.0006.325.570-34.9912.994-5.0005.177.934-23.4813.4841-27.000*6.124.014-48.24-5.762-6.0006.957.960-30.6618.6635.0005.177.934-13.4823.48Dunnett T31221.0007.120.094-3.2445.24332.000*5.394.00313.2150.79427.000*6.124.0126.3847.6221-21.0007.120.094-45.243.24311.0006.325.481-

19、11.9333.9346.0006.957.933-17.8629.8631-32.000*5.394.003-50.79-13.212-11.0006.325.481-33.9311.934-5.0005.177.896-22.8612.8641-27.000*6.124.012-47.62-6.382-6.0006.957.933-29.8617.8635.0005.177.896-12.8622.86*. The mean difference is significant at the 0.05 level.表5.5 多重比较检验结果- Student-Newman-Keulsa法、D

20、uncana法日增重(g)饲料NSubset for alpha = 0.0512Student-Newman-Keulsa3518.004523.002529.001550.00Sig.2121.000Duncana3518.004523.002529.001550.00Sig.1121.000Means for groups in homogeneous subsets are displayed.a. Uses Harmonic Mean Sample Size = 5.000.图 5.4 均值图 单变量多因素方差分析例7.1 为了比较3种不同饲料配方对4种不同品种的增重效果,从每个品种

21、猪中随机抽取了3头体重相同的仔猪,分别随机饲喂不同的饲料,3个月后的增重效果(kg/头)如下。试分析不同饲料和品种对仔猪增重的影响。品种饲料合计 平均 123Ti.Xi. A 52535215652B 56575817157C 45494714147D42444312943合计T.j194203200597平均 X.j 48.550.755049.75打开数据文件“两因素方差分析数据-无重复数据.xls”。在SPSS中实验该检验的步骤如下: 步骤1:选择菜单【分析】【一般线性模型】【单变量.】,弹出“单变量”对话框图 5.5 “单变量”对话框依次将观测变量“增重”销量移入因变量列表框,将因素变

22、量“品种”、“饲料”移入固定因子列表框。u 单击【模型】按钮,弹出“模型”对话框,如图5.6图 5.6 “模型”对话框l 指定模型:Ø 全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。它不包含协变量交互。Ø 选择定制可以仅指定其中一部分的交互或指定因子协变量交互。必须指定要包含在模型中的所有项。l 因子与协变量。列出因子与协变量。l 模型:模型取决于数据的性质。选择定制之后,您可以选择分析中感兴趣的主效应和交互效应。l 平方和:计算平方和的方法。对于没有缺失单元的平衡或非平衡模型,类型 III 平方和方法最常用。l 在模型中包含截距:模型中通常包含截距。如

23、果您可以假设数据穿过原点,则可以排除截距。l 构建项:对于选定因子和协变量:Ø 交互。创建所有选定变量的最高级交互项。这是缺省值。Ø 主效应。为每个选定的变量创建主效应项。Ø 所有二阶。创建选定变量的所有可能的二阶交互。Ø 所有三阶。创建选定变量的所有可能的三阶交互。Ø 所有四阶。创建选定变量的所有可能的四阶交互。Ø 所有五阶。创建选定变量的所有可能的五阶交互。l 平方和: 对于该模型,您可以选择平方和类型。类型III 最常用,并且是缺省类型。Ø 类型I: 此方法也称为平方和分级解构法。在模型中,每一项只针对它前面的那项进行

24、调整。类型I 平方和常用于:􀂄 平衡ANOVA 模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效应在任何二阶交互效应之前指定,依此类推。􀂄 多项式回归模型,其中任何低阶项在任何高阶项之前指定。􀂄 纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应嵌套在第三个指定的效应中,依此类推。(此嵌套形式只能通过使用语法来指定。)Ø 类型II:此方法在为所有其它“相应的”效应进行调节的模型中计算某个效应的平方和。相应的效应是指,与所有效应(不包含正被检查的效应)相对应的效应。类型II 平方和方法常用于:&

25、#1048708; 平衡ANOVA 模型。􀂄 任何只有主要因子效应的模型。􀂄 任何回归模型。􀂄 纯嵌套设计。(此嵌套形式能通过使用语法来指定。)Ø 类型III:缺省类型。此方法在设计中通过以下形式计算某个效应的平方和:为任何不包含该效应的其他效应,以及任何与包含该效应正交的效应(如果存在)调整的平方和。类型III 平方和具有一个主要优点,那就是只要可估计性的一般形式保持不变,平方和对于单元频率就保持不变。因此,我们常认为此类平方和对于不带缺失单元格的不平衡模型有用。在不带缺失单元的因子设计中,此方法等同于Yates 加权均值平方方

26、法。类型III 平方和法常用于:􀂄 任何在类型I 和类型II 中列出的模型。􀂄 任何不带空白单元的平衡或非平衡模型。Ø 类型IV:此方法针对存在缺失单元的情况设计。对于设计中的任何效应F,如果任何其它效应中不包含F,则类型IV = 类型III = 类型II。当F 包含在其它效应中时,则类型IV 将F 中的参数中正在进行的对比相等地分配到所有较高水平的效应。类型IV 平方和法常用于:􀂄 任何在类型I 和类型II 中列出的模型。􀂄 任何带有空白单元的平衡或非平衡模型。u 点击【继续】按钮,返回主对话框(“单变量”对话

27、框),点击【对比】按钮,弹出“单变量:对比” 对话框,可对指定的因子变量不同水平进行多种方式的比较,图 5.7 “单变量:对比”对话框由于生物统计学的分析,主要是对每个影响因子的不同水平进行多重比较,及交互作用检验,在“模型”、“两两对比”、“选项”三项中进行选择设置即可满足需要,故此项通常保持默认设置,即不做相关对比。u 点击【继续】按钮,返回主对话框(“单变量”对话框),点击【绘制】按钮,弹出“单变量:轮廓图” 对话框,可对指定的因子变量之间是否存在交互作用进行直观分析。可任选一个因子作为水平轴取值,对另一个因子的不同水平取值的线性变化进行显示,若呈现“平行”相,则说明两个因子没有交互作用

28、,若呈现“交叉相”, 则说明两个因子有交互作用。将“品种”选入水平轴框,将“饲料”选入单图框,点击“添加”,将所做选择确定。图 5.8 “单变量:轮廓图”对话框u 点击【继续】按钮,返回主对话框(“单变量”对话框),点击【两两比较】按钮,弹出“单变量:观测均值的两两比较” 对话框,可对指定的因子变量各水平之间因变量均值的显著差异性进行检验,只有在方差分析表明该变量的不同水平间的差异主要是处理效应的前提下,此项比较才有意义。图 5.9 “单变量:观测均值的两两比较”对话框选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。u 点击【继续】按钮,返回主对话框(“单变量”对话框),点击【

29、保存】按钮,弹出“单变量:保存” 对话框,可以在数据编辑器中将模型预测的值、残差和相关测量另存为新变量。这些变量中有许多可用于检查关于数据的假设。要保存供另一SPSS Statistics 会话中使用的值,您必须保存当前数据文件。图 5.10 “单变量:保存”对话框由于生物统计学的分析,通常不对此项做选择,保持默认设置。u 点击【继续】按钮,返回主对话框(“单变量”对话框),点击【选项】按钮,弹出“单变量:选项” 对话框。此对话框中有一些可选统计量。统计量是使用固定效应模型计算的。图 5.11 “单变量:选项”对话框估计边际均值:选择您需要的单元中的总体边际均值估计的因子和交互作用。为协变量(

30、如果存在)调整这些均值。􀂄 比较主效应。对于主体间和主体内因子,为模型中的任何主效应提供估计边际均值未修正的成对比较。只有在“显示以下项的均值”列表中选择了主效应的情况下,此项才可用。􀂄 置信区间调节。选择最小显著性差异(LSD)、Bonferroni 或对置信区间和显著性的Sidak 调整。此项只有在选择了比较主作用的情况下才可用。输出:Ø 描述统计:以生成所有单元中的所有因变量的观察到的均值、标准差和计数。Ø 功效估计:给出了每个作用和每个参数估计值的偏eta 方值。eta 方统计量描述总变异性中可归因于某个因子的部分。Ø

31、检验效能:当基于观察到的值设置备用假设时,选择检验效能可获取检验的效能。Ø 参数估计:选择参数估计可为每个检验生成参数估计值、标准误、t 检验、置信区间和检验效能。Ø 对比系数矩阵:选择对比系数矩阵可获取L 矩阵。Ø 齐性检验:为跨主体间因子所有水平组合的每个因变量生成Levene 的方差齐性检验(仅对于主体间因子)。Ø 分布-水平图和残差图:选项对于检查关于数据的假设很有用。如果不存在任何因子,则禁用此项。Ø 残差图:选择残差图可为每个因变量生成观察-预测-标准化残差图。这些图对于调查方差相等的假设很有用。Ø 失拟:选择失拟可检查因

32、变量和自变量之间的关系是否能由模型充分地描述。常规可估计函数允许您基于常规可估计函数构造定制的假设检验。任何对比系数矩阵中的行均是常规可估计函数的线性组合。显著性水平。您可能想要调整用在两两比较检验中的显著性水平,以及用于构造置信区间的置信度。指定的值还用于计算检验的检验效能。如果指定了显著性水平,则相关联的置信区间度会显示在对话框中。生物统计学的分析,主要是对每个影响因子的不同水平进行多重比较,及交互作用检验,在“选项”中选择“描述统计”、“ 齐性检验”即可满足需要,故此项通常保持默认设置,即不做相关对比。u 点击【继续】按钮,返回主对话框(“单变量”对话框),点击【确定】按钮后,结果输出窗

33、口看分析结果。表5.6 方差分析表Tests of Between-Subjects EffectsDependent Variable:增重SourceType III Sum of SquaresdfMean SquareFSig.Model30145.500a65024.2506699.000.000品种337.0003112.333149.778.000饲料8.16724.0835.444.045Error4.5006.750Total30150.00012a. R Squared = 1.000 (Adjusted R Squared = 1.000)表5.6可知,品种各水平间效应值

34、的变异主要是处理效应造成的,可进行多重比较;饲料各水平间效应值的变异主要是处理效应造成的,也可进行多重比较。表5.7 品种各水平间多重比较表增重品种NSubset1234Student-Newman-Keulsa,b4343.003347.001352.332357.00Sig.1.0001.0001.0001.000Duncana,b4343.003347.001352.332357.00Sig.1.0001.0001.0001.000b. Alpha = .05.从表5.7可知,增重效果由大到小依次是2号、1号、3号、4号,各品种之间增重效果均达到了显著性差异。表5.8 饲料各水平间多重比

35、较表增重饲料NSubset12Student-Newman-Keulsa,b1448.753450.0050.002450.75Sig.087.267Duncana,b1448.753450.0050.002450.75Sig.087.267b. Alpha = .05.从表5.8可知,增重效果由大到小依次是2号、3号、1号,各饲料之间增重效果差异,2号和1号之间达到了显著性。图 5.12 品种与饲料间交互作用图从图5.8可知,品种与饲料间存在着一定的交互作用。实验六:简单相关与回归分析一、实验目标与要求 1帮助学生深入了解线性及回归的基本概念,掌握线性相关与回归分析的基本思想和原理 2掌握线

36、性相关与回归分析的过程。 二、实验原理 1相关分析的统计学原理相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Pearson简单相关系数。 2回归分析的统计学原理 相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。三、实验演示内容与步骤 两

37、个变量间的简单相分析【课本例 】现有10头动物体重与饲料消耗量的数据如下,试建立饲料消耗量对体重的回归方程,并对回归系数加以检验。体重X4.65.14.84.45.94.75.15.24.95.1饲料消耗量Y87.193.189.891.499.592.195.599.393.494.4打开数据文件“线性相关与回归分析数据.xls”,依次选择“【分析】【相关】【双变量】”打开“双变量”对话框如图,将待分析的2个指标移入右边的变量列表框内。其他均可选择默认项。图 6.1 “双变量”对话框选择两个或更多数值型变量。还可以使用以下选项:􀂄 相关系数。对于正态分布的定量变量,请选择P

38、earson 相关系数。如果您的数据不是正态分布的,或具有已排序的类别,请选择Kendall 的tau-b 或Spearman,后两者度量秩次之间的相关性。相关系数的值范围为1(完全负相关)到+1(完全正相关)。0 值表示没有线性关系。在解释结果时请小心谨慎,不要因显著的相关性而得出任何因果结论。􀂄 显著性检验。您可以选择双尾概率或单尾概率。如果预先已知关联的方向,请选择单尾。否则,请选择双尾。􀂄 标记显著性相关。用一个星号来标识显著性水平为0.05 的相关系数,用两个星号来标识显著性水平为0.01 的相关系数。单击【选项】按钮,弹出“双变量相关性:选项”对

39、话框,选择“均值和标准差”,图 6.2 “双变量相关性:选项”对话框统计量。对于Pearson 相关性,您可以选择以下一项或两项:􀂄 均值和标准差。为每个变量显示。还显示具有非缺失值的个案数。无论缺失值设置如何,都将逐变量处理缺失值。􀂄 叉积偏差和协方差。为每对变量显示。偏差的叉积等于校正均值变量的乘积之和。这是Pearson 相关系数的分子。协方差是有关两个变量之间关系的一种非标准化度量,等于叉积偏差除以N1。缺失值。您可以选择以下选项之一:􀂄 按对排除个案。会从分析中排除对其计算相关系数的一对变量中一个或两个含有缺失值的个案。由于每个系

40、数均基于对特定变量对具有有效代码的所有个案,因此在每次计算中会使用可用的最大信息量。这可能因为个案数不同而产生一组系数。􀂄 按列表排除个案。从所有相关性中排除对任意变量有缺失值的个案。点击【继续】按钮,返回主对话框(“单变量”对话框),点击【确定】按钮后,结果输出窗口看分析结果。表6.1 双变量相关性分析基本统计量表Descriptive StatisticsMeanStd. DeviationN体重X4.980.413110饲料消耗量Y93.5603.881610表6.2 双变量相关性分析表Correlations体重X饲料消耗量Y体重XPearson Correlatio

41、n1.818*Sig. (2-tailed).004N1010饲料消耗量YPearson Correlation.818*1Sig. (2-tailed).004N1010*. Correlation is significant at the 0.01 level (2-tailed). 两个变量间的线性回归分析打开数据文件“线性相关与回归分析数据.xls”,依次选择“【分析】【回归】【线性】”打开“线性回归”对话框如图,将待分析的2个指标移入右边的变量列表框内。其他均可选择默认项。图 6.3 “线性回归”对话框在“线性回归”对话框中,选择一个数值型因变量。选择一个或多个数值型自变量。根据需

42、要,您可以:􀂄 将自变量分组成块,并对不同的变量子集指定不同的进入方法。􀂄 选择一个选择变量,将分析限于包含此变量特定值的个案子集。􀂄 选择个案标识变量,用于标识图上的点。􀂄 选择数值型WLS 权重变量以进行加权最小平方分析。WLS: 允许您获取加权最小平方模型。以数据点方差的倒数对数据点进行加权。这意味着方差较大的观察值对分析的影响比方差较小的观察值要小。如果加权变量的值为0、负数或缺失,则将该个案从分析中排除。本题中,因只有一个自变量,故只需选择自变量和因变量即可,点击【统计量】按钮,弹出“线性回归:统计量”对话框,可

43、选择需要输出的基本统计量,图 6.4 “线性回归:统计量”对话框我们选择默认的“估计”、“模型拟合度”和“描述性”。点击继续返回主对话框(“线性回归”对话框),点击【绘制】按钮,弹出“线性回归:图”对话框,图 6.5 “线性回归:图”对话框可以帮助验证正态性、线性和方差相等的假设。对于检测离群值、异常观察值和有影响的个案,图也是有用的。在将它们保存为新变量之后,在数据编辑器中可以使用预测值、残差和其他诊断以使用自变量构造图。以下图是可用的:散点图:您可以绘制以下各项中的任意两种:因变量、标准化预测值、标准化残差、剔除残差、调整预测值、Student 化的残差或Student 化的已删除残差。针

44、对标准化预测值绘制标准化残差,以检查线性关系和等方差性。源变量列表:列出因变量(DEPENDNT) 及以下预测变量和残差变量:标准化预测值(*ZPRED)、标准化残差(*ZRESID)、剔除残差(*DRESID)、调整的预测值(*ADJPRED)、学生化的残差(*SRESID) 以及学生化的已删除残差(*SDRESID)。生成所有部分图:当根据其余自变量分别对两个变量进行回归时,显示每个自变量残差和因变量残差的散点图。要生成部分图,方程中必须至少有两个自变量。标准化残差图:您可以获取标准化残差的直方图和正态概率图,将标准化残差的分布与正态分布进行比较。如果请求了任意图,则将显示标准化预测值和标准化残差(*ZPRED 和*ZRESID)的摘要统计。本题中,不需要此项,故保持默认。点击继续返回主对话框(“线性回归”对话框),点击【保存】按钮,弹出“线性回归:保存”对话框,本题中,不需要此项,故保持默

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论