版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章均值比较与T检验统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。由此可以得出这样的认识:均值不相等的两个样本不一定来自均值不同的总体。能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时使用的计算t值的公式不同。进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。p值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。F值的计算公式是:F=S12(较大)/S22(较小)进行均值比较及检验的过程MEANS过程Ttest过程单一样本T检验独立样本的T检验配对样本的T检验单因素方差分析SPSS的均值过程是描述和分析尺度变量(Scale)的一种有用的方法,可以获得需要分析变量的许多中心趋势和离散趋势的统计指标,同时它可以对不同的组别或者交叉组别进行比较。当观测量按一个分类变量分组时,均值过程可以进行分组计算。例如:要计算学生的平均身高,SEX变量把学生按性别分为男、女生两组,均值过程可以分别计算男、女生平均身高。注意用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。
一、MEANS过程
使用均值过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。
MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。也可以从该过程获得单因素方差分析、eta和线性相关检验。Mean过程的数据文件要求:至少有一个连续变量、一个分类变量(离散变量)。对连续变量求其基本描述统计量。分类变量用来分组。以30个学生的身高为例说明操作步骤(学生身高体重数据.sav)变量number编号,sex性别,age年龄,height身高,weight体重。相同年龄的男孩和女孩是否身高有所不同?是否身高随年龄的增长呈线性关系?如果解决这样的问题,只建立一个控制层就不够了。应该考虑,选择身高作为因变量,分类变量年龄作为第一层控制变量,性别为第二层控制变量。两个分类变量分别放在两层中,且使用选择项。ANOVAtableandeta:输出第一层控制变量给出的方差分析表和eta统计值η和η2
。η统计量表明因变量和自变量之间联系的强度。η2
是组间平方和与总平方和之比。Testforlinearity:线性检验,输出R和R2,只有在控制变量有基本的控制级,且自变量有三个水平以上时才能选用。对第一层变量的方差分析结果身高*年龄(方差分析的变量信息):分析不同年龄的身高均值间是否存在显著性差异;SumofSquares(偏差平方和);df(自由度);Meansquare(均方);F(方差值);sig(P值);BetweenGroups(组间偏差平方和):由两部分组成:Linearity是由因变量与控制变量之间的线性关系引起的;Deviationfromlinearity不是由因变量与控制变量之间的线性关系引起的;WithinGroups(组内偏差平方和):各组内的变异相对于组均值的变异;Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。线性检验结果R是因变量身高的观测值与预测值之间的的相关系数,R值越接近1表明回归方程的预测性越好;Eta:即η值(0~1)说明因变量与自变量之间的联系程度;EtaSquared:η2为组间偏差平方和与偏差平方和总和之比。练习题试按性别、年龄对体重做平均数分析。单样本T检验单样本T检验即检验某个变量的样本均值和某指定值(总体均值)之间是否存在着显著性差异。如果是大样本的单样本检验,统计教科书上称为U检验,它采用服从正态分布的U统计量作为检验统计量;如果是小样本并且样本服从正态分布,则采用服从t分布的t统计量进行单样本T检验;否则,采取非参数检验。T检验稳健性(Robust)较好,如果样本分布偏离正态分布不太严重,也可采用T检验。二、Ttest过程1、单一样本T检验(One-sampleTTest)
检验单个变量的均值是否与给定的常数(一般为理论值、标准值或经过大量观察所得的稳定值等)之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T检验。如某厂的灯泡寿命的平均值为1500小时,后采用新工艺组织生产,要想了解灯泡寿命是否提高?方法:从新工艺下生产的灯泡中随机抽查若干只灯泡,测得寿命,并计算平均寿命,再与1500小时进行比较,判断是否有显著差异?如果是大样本的单样本检验,统计教科书上称为U检验,它采用服从正态分布的U统计量作为检验统计量;如果是小样本并且样本服从正态分布,则采用服从t分布的t统计量进行单样本T检验;否则,采取非参数检验。T检验稳健性(Robust)较好,如果样本分布偏离正态分布不太严重,也可采用T检验。例:收集26家保险公司人员构成数据,希望对目前保险公司从业人员受高等教育程度和年轻化程度进行推断。具体而言,就是推断具有高等教育水平的员工平均比例是否不低于0.8,年轻人的平均比例是否为0.5,具体数据文件名为保险公司人员构成情况.sav提出原假设:保险公司具有高等教育水平的员工比例的平均值不低于0.8,即H0:u>=(u0=0.8)年轻人比例的平均值与0.5无显著差异,即:H0:u=u0=0.5分析过程:计算具有高等教育水平的员工数,35岁以下员工数占总员工数的比例。(利用转换菜单计算)进行单样本t检验分析:由于调查的26家公司,有7家在文化程度变量上有缺失值,因此在选项窗口中选择【按分析顺序排除个案】进行缺失值处理。Confidenceinterval:95%:置信区间项,可以自定义。MissingValues:选择对缺失值的处理方法
Excludecasesanalysisbyanalysis:带有缺失值的观测值当它与分析有关时才被剔除;
Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项受高等教育比例的基本描述统计量被调查的26家保险公司有效的19家,其中具有高等教育水平员工比例的平均数是0.745,标准差为0.167,标准误为0.038单样本T检验分析结果95%ConfidenceIntervaloftheDifference(差值的95%置信区间):95%的置信区间=均值±1.96标准误。根据上表比例总体均值的95%置信区间是0.745±1.96×0.038即(0.664,0.8255)。由此推出,该范围与总体均数之差为0.664-0.8~0.8255-0.8,即表中-0.1358和0.0255的含义。单样本t检验中t统计量的双尾概率p-为0.168,若显著性水平a为0.05,则p>a,由此接受原假设,也就是保险公司员工受高等教育比例显著高于0.8。(0.8大于95%的置信区间下限)练习:年轻人比例t检验操作年轻人比例的基本描述统计量调查的26家保险公司,年轻人比例的平均数是0.7139,标准差为0.151,标准误为0.03单样本T检验分析结果95%ConfidenceIntervaloftheDifference(差值的95%置信区间):95%的置信区间=均值±1.96标准误。根据上表比例总体均值的95%置信区间是0.7139±1.96×0.03即(0.655,0.773)。由此推出,该范围与总体均数之差为0.655-0.5~0.773-0.5,即表中0.1530和0.2747的含义。单样本t检验中t统计量的双尾概率p-为0,若显著性水平a为0.05,则p<a,由此拒绝原假设,样本均数与总体均数有显著性差异。也就是保险公司年轻人比例与0.5存在显著性差异。练习题已知某水样中含CaCO3的真值为20.7mg/L,现用某方法重复测定该水样11次CaCO3的含量(mg/L)为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00,22.00。问该方法测得的均值是否偏高?2、IndependentSampleTtest
(独立样本T检验)独立样本的T检验用于检验两个不相关的样本是否来自具有相同均值的总体。两独立样本是指两个样本所来自的总体相互独立,两个独立样本各自接受相同的测量,研究者或分析者的主要目的是分析两个独立样本的均值是否有显著的统计差异。独立样本T检验必须注意使用这种检验的条件是必须具有来自两个不相关组(非配对)的观测量,其均值必须是对你想在两组中都计算的变量的综合测度。例如,比较女性和男性的身高,教育从业者和金融从业者的起始工资等,都是两独立样本的例子。
两独立样本T检验的前提条件独立性:两样本所来自的总体互相独立。正态性:样本来自的两个总体应服从正态分布。在样本所来自的总体不满足正态性条件时,如果两个样本的分布形状相似,它们的样本量相差不是太大并且样本量较大,仍然可以应用T检验。方差齐性:待比较的两个样本的方差相同。如果两个组的样本量大致相等,略微偏离了方差齐性对检验结果的精度影响不大。在T检验中,SPSS提供了方差齐性的Levene检验,当方差齐性不满足时,会提供方差齐性校正后的T检验结果。如果分组样本彼此不独立,例如测量的是研究对象用药前后某项指标,要求比较用药前后某项指标均值是否有显著性差异,应该使用配对T检验的功能(PairedSampleTtest)。如果分组不止两个,应该使用One-WayANOV过程进行单变量方差分析。如果你试图比较的变量明显不是正态分布的,则应该考虑使用一种非参数检验过程(Nonparametrictest)。如果想比较的变量是分类变量,应该使用Crosstabs功能。例:学生参加为期三天的计算机等级测试培训,有15名学生报名参加A公司的培训,12名参加B公司的培训,培训结束后学生参加测试,想知道学生在这两家公司不同培训方法下,测试成绩的均值是否存在显著差异。分析:培训方式A与培训方式B可以看成是两个独立样本Spss操作步骤Usespecialvalues使用指定值:按分组变量的值进行分组Cutpoint割点:当分组变量为连续变量时,选择该选项后,在后面的矩形框中输入一个连续变量值,将观测量分为大于该值和小于该值的两个组,检验在这两个组之间进行,比较其因变量在两组的均数间是否有显著性差异。Confidenceinterval:95%:置信区间项,可以自定义。MissingValues:选择对缺失值的处理方法
Excludecasesanalysisbyanalysis:带有缺失值的观测值当它与分析有关时才被剔除;
Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项分析变量的简单描述性统计量左第一栏为分析变量标签和分类变量标签N观测量数目Mean均值Std.Deviation标准差Std.ErrorMean标准误参加培训方法A的学生的平均测试成绩47.73,低于培训方法B学生的平均测试成绩8.77分两组学生测试成绩的标准差相差不大,参加培训方法A的略大独立样本T检验结果Levene’sTestforEqualityofVariances:方差齐性检验F方差值:0.258Sig:P值为0.616>0.05,接受原假设即方差相等。t-testforEqualityofMeans为T检验结果栏t:t值;df:自由度;Sig:显著性概率即P值=0<0.05,拒绝原假设u1-u2=0;MeanDifference:两组均值之差。表现培训方法A学生平均测试成绩低于培训方法B学生成绩8.767;Std.ErrorDifference:差值的标准误为1.686;95%ConfidenceIntervaloftheDifference:差值的95%置信区间。在-12.24~-5.294之间,不包括0即两组均值之差与0有显著性差异。例题二有29名13岁男生的身高、体重、肺活量数据(学生肺活量数据.sav),试分析大于等于155cm的与身高小于155cm的两组男生的肺活量均值是否有显著差异。分析:155以下和155以上身高的男生平均肺活量显著性检验例题二身高大于等于155cm与身高小于155cm的两组男生的肺活量平均值在95%水平上显著存在差异。练习题某克山病区测得11例急性克山病患者与13名健康人的血磷值如下:患者:2.60,3.24,3.73,3.73,4.32,5.18,4.73,5.58,5.78,6.40,6.53健康人:1.67,1.98,1.98,2.33,2.34,2.50,3.60,3.73,4.14,4.17,4.57,4.82,5.78问该地区急性克山病患者与健康人的血鳞值是否不同?三、配对样本T检验配对样本T检验(PairedSampleTtest)用于检验两个相关的样本是否来自具有相同均值的总体。这种相关的或配对的样本常常来自这样的实验结果,在实验中被观测对象在实验前后均被观测。两个变量可以是beforeafter,配对分析的测度也不是必须来自同一个观测对象。一对可以两者组合而成。
进行配对样本的T检验要求被比较的两个样本有配对关系。要求两个样本均来自正态总体。而且均值是对于检验有意义的描述统计量。均值的配对比较是比较常见(见以下几个例子)。同一窝实验用白鼠按性别、体重相同的配对,再随机分到实验组和对照组,分别喂加入海藻的饲料和普通饲料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间。比较两组白鼠游泳时间均值,从而比较两种饲料对抗疲劳的作用。在研究人体各部位体温是否有差别,一个人的两个部位的温度构成一对数据。测量若干人的同样两个部位的温度数据,可以比较这两个部位平均温度是否有显著性差异。使用配对t检验。
同一组高血压病人在进行体育疗法前后,测量其血压。每个病人在体育疗法前后的血压测量值构成观测量对。可以求这组病人体育疗法前后血压平均值。进行配对T检验,分析体育疗法对降血压的疗效。配对样本T检验实际上是先求出每对测量值之差值,对差值求均值,检验配对变量均值之间差异是否显著。其实质检验的假设实际上是差值的均值与零均值之间差异的显著性。如果差值均值与零均值无显著性差异说明配对变量均值之间无显著性差异。配对样本T检验与独立样本T检验均使用T-TEST过程,但调用该过程的菜单不同,对数据文件结构的要求不同和所使用的命令语句也有区别。进行配对样本T检验的数据文件中一对数据必须作为同一个观测量中两个变量值。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部编版五年级语文上册教学计划
- 做2022销售的工作总结怎么写10篇
- 《烈火英雄》观后感
- 语文教师个人教学工作计划
- 《简爱》寒假读书日记10篇
- 2022年的销售工作计划
- 学生会辞职报告模板合集七篇
- 普通高中化学教案教学范文
- 关于工作方案4篇
- 公司学习心得体会15篇
- ATS技术交流(新型发动机智能恒温节能冷却系统)100318
- 手术区皮肤的消毒和铺巾ppt课件
- 2022年度培训工作总结
- 应急照明装置安装施工方法
- DB34∕T 4057-2021 中小河流防汛特征水位分析规程
- E5015焊条成分设计及焊接性能分析
- 压力管道验收资料表格(共38页)
- 明天会更好歌词
- 年产500万平米电极箔及6.5万吨净水剂建设项目可行性研究报告模板-拿地申请立项
- 近年来“数字城管”国内外现状研究综述
- 顶针PIN清洁、摆放作业规范
评论
0/150
提交评论