双变量的统计之均值比较与检验_第1页
双变量的统计之均值比较与检验_第2页
双变量的统计之均值比较与检验_第3页
双变量的统计之均值比较与检验_第4页
双变量的统计之均值比较与检验_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章双变量的统计分析之二——均值比较与检验主要内容MEANS过程单一样本T检验(One-SampleTTest)独立样本T检验(Independent-SampleTTest)配对样本T检验(Paired-SampleTTest)方差分析(One-WayANOVA)MEANS过程一、Means过程

该过程实际上更倾向于对样本进行描述,可以对需要比较的各组计算描述指标,包括均值、标准差、总和、观测量数、方差等一系列单变量统计量。二、完全窗口分析

按Analyze—CompareMeans—Means顺序,打开Means主对话框(如图6--1)。图6—1Means主对话框该框的变量为因变量,即用于分析的变量。该框的变量为自变量,必须至少有一个变量单击此按钮,进入下一层,返回则按Previous按钮。见图6—2Statistics框:供选择的统计量StatisticsforFirstLayer复选框:Anovatableandeta:进行分组变量的单因方差分析并计算eta统计量。Testforlinearity:产生第一层最后一个变量的R和R2。

图6—2Options对话框CellStatistics框:选入的描述统计量,默认为均值、样本数、标准差。三、例题分析

某医生测得如下血红蛋白值(g%),用Means过程对其做基本的描述性统计分析。表5-1血红蛋白值(g%)编号性别年龄血红蛋白值编号性别年龄血红蛋白值编号性别年龄血红蛋白值111813.661511610.88291167.88211810.57161189.653011812.35311612.56172168.363111613.6542179.871811811.66322169.8752178.99192188.543321810.09621711.35202177.783421812.55711714.562121611.363511816.04811612.402211612.783611813.7892168.052311815.093711711.671011814.03242188.673811710.981121812.83252178.56392168.781211615.502621812.564011611.351321812.252721711.561421710.062811614.671、操作步骤

1)打开数据文件“Means过程.sav”。2)按顺序AnalyzeCompareMeansMeans打开主对话框。3)单击Option,打开Options对话框,选择统计项目。4)单击OK完成。选hbsex按Next,进入layer2of2,选age图6—3在主对话框选送变量图6—4第二层变量框选择统计项目按此按钮复选此2项,第一层次分组选择计算方差分析和线性检验图6—5Options对话框表6—1观测量摘要表

表6—1是观测量摘要表,观测量总个数为40,其中有效值为40个、无效值0。2.结果及分析表6—2分分组描述述统计量表6—2分分三部分分:第一、、二部分先先按性别分分组,再按按年龄分组组计算观测测值合计、、均数、标标准差、方方差和个数数;第三部部分只按年年龄分组,,最后一行行为合计。。表6—4按按年龄分分组的描述述统计量表6—3按按性别分分组的描述述性统计量量血红蛋白*性别血红蛋白*年龄表6—3、、4是将sex和age一起起放在layer1of1中,分分别计算男男、女(不不作年龄分分组)。年年龄分三组组(不作性性别分组))的观测值值合计、均均数、标准准差、方差差和个数。。表6—5方方差分析析表表6—5是是方差分析析表,共6列:第一一列方差来来源:组间间的、组内内的、总的的方差;第第二列为平平方和;第第三列为自自由度;第第四列为均均方;第五五列为F值值;第六列列为F统计计量的显著著值,显著著值小于0.05,所以性别别对血红蛋蛋白值有显显著影响。。表6—6eta统统计量表6—6是是eta统统计量表,,η统计量表明明因变量和和自变量之之间联系的的强度,0.567的值处于于中等水平平,η2是因变量中中不同组间间差异所解解释的方差差比,是组组间平方和和与总平方方和之比,,即由64.5256除以200.787得得到。表6—7按按年龄分组组的方差分分析表表6—7是是将年龄作作为第一层层自变量得得到的方差差分析表,,Linearity是假设设因变量均均值是第一一层自变量量值的线性性函数,DeviationfromLinearity是是不能由线线性模型解解释的部分分。表6—8按按年龄龄分组的eta统计计量表6—8是是将年龄作作为第一层层自变量得得到的eta统计量量表,R和和R2测度线性拟拟合的良好好度,R是是观测值与与预测值之之间的相关关系数。一、简介介用于检验单单个变量的的均值与假假设检验值值(给定的的常数)之之间是否存存在差异。。二、完全窗窗口分析按Analyze——CompareMeans—One-SampleTTest顺顺序,打开开One-SampleTTest主对话话框(如图图5--1)一、单一样样本T检验验图6-6One-SampleTTest主对话框框图6-7Options对话框框TestVariables框:用用于选取需需要分析的的变量TestValue:输入入已知的总总体均值,,默认0ConfidenceInterval:输输入置信区区间,一般般取90、、95、99等。MissingValues:在检验变量量中含有缺缺失值的观观测将不被被计算。在任何一个个变量中含含有缺失值值的观测都都将不被计计算三、例题分分析仍以表5-1的资料料来说明。。已知另一一地区16-18岁岁的少年血血红蛋白平平均值为11.657g%,,检验这一一地区16-18岁岁少年血红红蛋白值是是否与另一一地区的平平均值相等等。1、操作步步骤1)按Analyze—CompareMeans——OneSampleTTest顺序,,打开主对对话框。(打开数据据文件“Means过程.sav”。)2)将变量量hb选入入TestVariable框。。3)在TestValue中输入11.657,后后单击OK。2、结果分分析表5-9单单个个样本统计计量表5-9是是血红蛋蛋白值的观观测量个数数、均值、、标准差和和均值的标标准误等统统计量。表5-10单单个样本检检验从表5-10可看出出,t值值为-0.592,自由度39,显著著值为0.558,样本均值值与检验值值的差为-0.2122,该该差值95%的置信信区间是0.9379~0.5134。一、简介介用于检验对对于两组来来自独立总总体的样本本,其独立立总体的均均值或中心心位置是否否一样。如如果两组样样本彼此不不独立,应应使用配对对T检验((Paired-SampleTTest)。。如果分组组不止一个个,应使用用One-WayANOVA过过程进行单单变量方差差分析。如如果想比较较的变量是是分类变量量,应使用用Crosstabs功能。。独立样本T检验还要要求总体服服从正态分分布,如果果总体明显显不服从正正态分布,,则应使用用非参数检检验过程((Nonparametrictest)二、完全窗窗口分析按Analyze——CompareMeans—Independent-SampleTTest顺顺序,打开开Independent-SampleTTest主对对话框(如如图5--10)二、独立样样本T检验验图5—10独独立样本本T检验主主对话框图5—11DefineGroups主对话话框从源变量框框中选取要要作检验的的变量。为分组变量量,只能有有一个。分别输入分分组变量的的取值条件件,如1为为男,2为为女等。输入分界点点值,如体体重60公公斤等。在检验变量量中含有缺缺失值的观观测将不被被计算。在任何一个个变量中含含有缺失值值的观测都都将不被计计算输入置信区区间,一般般取90、、95、99等。图5-9Independent-SampleTTest的的Options对对话框三、例题分分析仍以表5-1的资料料来说明。。1、操作步步骤1)按Analyze—CompareMeans——Independent-SampleTTest顺序序,打开主主对话框。。打开数据据文件“Means过程.sav”。2)将变量量hb选入入TestVariable框。。3)在sex选入GroupingVariable框中作为为检验变量量。4)打开DefineGroups对话框,,在Group1输输入1,Group2输入入2,单击击Continue,再单击击OK。2、结果分分析表5-11是血红红蛋白值的的观测量个个数、均值值、标准差差和均值的的标准误等等统计量。。表5-11分分组统计计量表5-12独独立样本本T检验结结果从表5-12可看出出,Equalvariancesassumed行是假假设方差相相等进行的的检验,当当方差相等等时考察这这一行的结结果;Equalvariancesnotassumed行是假假设方差不不等进行的的检验,当当方差不等等时考察这这一行的结结果。在Levene’sTestforEqualityofVariance列中,,显著值为为0.544>0.15,,可认为方方差是相等等的,所以以应考察第第一行的结结果。可看看出,显著著值为0.000<0.05,所以以认为均值值是不等的的。一、简介介用于检验两两个相关的的样本是否否来自具有有相同均值值的总体。。二、完全窗窗口分析1、主对话话框按Analyze——CompareMeans—Paired-SampleTTest顺序序,打开Paired-SampleTTest主对话框框(如图5--1))三、配对样样本T检验验从源变量框框中选取成成对变量移移入。所选变量。。同图5-9图5-10Paired-SampleTTest对话话框三、例题分分析某单位研究究饲料中缺缺乏维生素素E与肝中中维生素A含量的关关系,将大大白鼠按性性别、体重重等配为8对,每对对中两只大大白鼠分别别喂给正常常饲料和维维生素E缺缺乏饲料,,一段时期期后测定其其肝中维生生素A含量量(μmol/L)如下,,现在想知知道饲料中中缺乏维生生素E对鼠鼠肝中维生生素A含量量有无影响响。大白鼠配对编号肝中维生素A含量(μmol/L)正常饲料组维生素E缺乏组137.225.7220.925.1331.418.8441.433.5539.834.0639.328.3736.126.2831.918.3表5-12配配对样本T检验数据据1、操作步步骤1)输入数数据并定义义变量名::正常饲料料组测定值值为x1,,维生素E缺乏饲料料组测定值值为x2(数据文件件“饲料(配对对T检验)).sav”。)2)按Analyze—CompareMeans——Paired-SampleTTest顺序,,打开主对对话框。3)单击变变量x1,,再单击x2,将x1,x2送入Variables框框。左下方CurrentSelections框中出现现Variable1、Variable24)单击OK。2、输出结结果及分析析表5-13配配对样本T检验描述述统计量表5-13可看出,,变量x1的均数、、标准差、、标准误分分别为34.750、6.649、2.351,变量x2的均数数、标准差差、标准误误分别为26.238、5.821、、2.058。表5-14配配对样本T检验相关关性表5-14可看出,,本例共有有8对观测测值,相关关系数为0.586,相关系系数的显著著性检验表表明显著值值为0.127。表5-15配配对样本T检验结果果表5-16说明变量量x1、、x2两两两相减的差差值均数、、标准差、、差值均数数的标准误误差分别为为8.513、5.719、、2.022,95%可信区区间为3.731,,13.292。。配对检验验结果表明明t为4.21,自自由度为7,显著值值为0.004,差差别具高度度显著性意意义,即饲饲料中缺乏乏维生素E对鼠肝中中维生素A含量确有有影响。方差分析简简介方差分析的的核心就是是方差可分分解。这里里的方差是是通过计算算各观测值值偏离均值值的平方和和再除以n-1(样样本量减1)而得到到的。这样样给定n值值的情况下下,方差就就是离差平平方和(SS)。方方差的分解解按表6-1进行。。方差分析的的目的是检检验均数((组间或变变量间)差差别是否具具有统计学学意义。即即将总变异异分解为由由随机误差差造成的变变异(组内内SS)与与由均数差差异造成的的变异(组组间SS))两个部分分。如果后后者大于前前者,且具具有统计学学意义,我我们将拒绝绝零假设,,即认为总总体中均数数间存在差差异。一、简介单因素方差差分析是检检验由单一一因素影响响的多组样样本某因变变量的均值值是否有显显著差异的的问题。如如果各组之之间有显著著差异,说说明这个因因素(分类类变量)对对因变量是是有显著影影响的,因因素的不同同水平会影影响到因变变量的取值值。二、完全窗窗口分析按AnalyzeComparedMeansOne-WayAnova顺序单击。。打开One-WayAnova主对话框,,如图四、单因素素方差分析析选入因变量量,可有多多个变量选入分组变变量,必须须满足只取取有限个水水平的条件件。One-WayAnova主对话框见图6--2见图6--3见图6--4见图6—2多项项式比较对对话框进行军制的的多项式比比较,并在在其后的参参数框中选选定阶数。。如一一阶:Linear,二阶::Quadratic,三阶阶:Cubic……….最高可可达五阶输入多项式式各组均值值的系数,输入一个个系数单击击Add按按钮。系数数进入下面面方框..依次输入入各组均值值的系数。。如果多项式式中只包括括第一与第第四组的均均值的系数数,必须把把第二、第第三个系数数输入为0。如果只包括括第一与第第二组的均均值,则第第三、第四四个可不输输入。可同时建多多个多项式式,输入一一组后按Next按按钮;如果果要修改则则按Previous按钮,,修改后按按Change按钮钮,删除按按Remove按钮钮。显示每组系系数的总和和。6—3PostHoc对话框在此对话框框中选择进进行多重比比较的方法法1.用t检验完完成组间成成对均值的的比较,对对多重比较较错误率不不进行调整2.同上,但通通过设置每每个检验的的误差率来来控制整个个误差率3.用t检验完完成多重配配对比较,,为多重比比较调整显显著值,但但比2的界限限要小4.对所有可能能的组合进进行同步进进入的均值值配对比较较5.用F检验进进行多重比比较6.在StudentizedRange分布下下进行多重重比较7.用StudentizedRange分布进进行所有各各组均值间间的配对比比较8.用StudentizedRange统计量量进行所有有组间均值值的配对比比较,用所有配对对比较集合合的误差率率作为试验验误差率9.同8,但,其临界值值是TUKEY和S-N-K的相应值值的平均值值10.进行配对对比较时,使用的逐逐步顺序与与Student-Newman-Keuls检验的顺顺序一样,但并不是是给每个检检验设定一一个误差率,而是给给所有检验验的误差率率设定一个个临界值11.用Studentized最最大系数进进行比较检检验和范围围检验12.用Studentized最大系数数进行配对对比较检验验13.用Studentized最大系数数进行比较较检验,使使用贝叶斯斯逼近.14.用t检验进进行配对比比较.1.用t检检验进行配配对比较,,2.用Studentized最大大系数进行行配对比较较检验3.同上,这种方法法有时比较较自由4.用StudentizedRange统统计量进行行配对比较较检验规定显著性性水平,默默认为0.05图6—4Options对话框框选择缺失值值的处置方方式:在检验变量量中含有缺缺失值的观观测将不被被计算在任何一个个变量中含含有缺失值值的观测都都将不被计计算规定输出的的统计量:输出描述统统计量,包包括观测量量数目,均均值,最小小值,最大大值,标准准差,标准准误差,各各组中每个个因变量的的95%的的置信区间间用Levene检验验进行方差差一致性检检验输出均数分分布图三、例题分分析例1某某灯泡厂用用四种不同同配料方案案制成的灯灯丝,生产产了四批灯灯泡。每批批灯泡中随随机抽取若若干个灯泡泡测其使用用寿命(单单位:小时时),数据据如表6-2,求四四种灯丝的的灯泡的使使用寿命有有无显著差差异。灯泡灯丝12345678甲1600161016501680170017001780乙15001640140017001750丙16401550160016201640160017401800丁151015201530157016401680表6-1灯灯泡使用用寿命在该例中,,设灯泡的的使用寿命命为因变量量,灯丝的的配料为因因子,四种种配料方案案为四水平平,为单因因子四水平平的实验。。(数据文文件:“灯泡使用((单因素方方差).sav)1、不使用用选择项操操作步骤1)定义两两个变量::Filament变变量,取值值1、2、、3、4分分别代表甲甲、乙、丙丙、丁,标标签为“灯灯丝”。Hours变量其值值为灯泡的的使用寿命命,标签为为“灯泡使使用寿命””。2)按AnalyzeComparedMeansOne-WayAnova顺序序打开“单单因素分析析”主对话话框。3)从源变变量框中选选取hours入DependentList框框中;选取filament变变量入Factor框中,单单击“OK”运行。。4)输出结结果及分析析表6-2灯灯泡泡使用寿命命的单因素素方差分析析结果表6-2说说明:第一列:方方差来源;;第二列::离差平方方和;第三三列:自由由度;第四列:均均方;第五五列:F值值;第六列列:显著值值,是F统统计量的P值。2、使用选选择项操作作步骤1)定义变变量和选取取变量同1的操作步步骤2)在主对对话框中单单击“Contrast”,,在Contrast对话框框中选择多多项式比较较,选择一一次多项式式比较各组组均值,共共指定两组组多项式系系数:3)输出结结果及分析析2)在主对对话框中单单击“Contrast”,,在Contrast对话框框中选择多多项式比较较,选择一一次多项式式比较各组组均值,共共指定两组组多项式系系数:系数依次为为1、-1、-1、、1,这是是检验灯丝丝对灯泡使使用寿命的的影响及甲甲、丁效应应和与乙、、丙效应和和是否有显显著差异系数依次为为1、-1、1、-1,这是是检验灯丝丝对灯泡使使用寿命的的影响及甲甲、丙效应应和与乙、、丁效应和和是否有显显著差异3)打开PostHocMultipleComparisons对话框框,选择多多重比较::在EqualVarianceAssumed栏中中选择LSD和Duncan在EqualVarianceNotAssumed栏中中选择Tamhane’sT24)打开Options对话框框,输出统统计量选择择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论