




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章第四章 均值比较与均值比较与T检验检验 统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。由此可以得出这样的认识:均值不相等的两个样本不一定来自均值不同的总体。 能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。对来自正态总体的两个样本进行均值比较常使用T检验的方法
2、。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时使用的计算t值的公式不同。 进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。p值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。F值的计算公式是:FS12(较大)/S22(较小)进行均值比较及检验的过程进行均值比较及检验的过程 lMEANS 过程过程lT test 过程过程l 单一样本单一样本T检验检验l 独立样本的独立样本的T检验检验l 配对样本的配对样本的T检检验验l单因素方差分析单因素方差分析一、一、MEANS过程过程 MEANS过程计算指定变量的综合描述统计量。当观测量按一个分类
3、变量分组时,MEANS过程可以进行分组计算。例如要计算学生的平均身高,SEX变量把学生按性别分为男、女生两组,MEANS过程可以分别计算男、女生平均身高。用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。 使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。 MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。还可以给出方差分析表和线性检验结果。 Mean过程的数据文件要求:至少有一个连续变量、一个分类变量离散变量)。对连续变量求其基本描述统计量。分类
4、变量用来分组。以27个学生的身高为例说明操作步骤data11-01)变量no编号,sex性别,age年龄,h身高,w体重。ANOVA table and eta:输出第一层控制变量给出的方差分析表和eta统计值和2 。 统计量表明因变量和自变量之间联系的强度。 2 是组间平方和与总平方和之比。Test for linearity:线性检验,输出R和R2,只有在控制变量有基本的控制级,且自变量有三个水平以上时才能选用。对第一层变量的方差分析结果对第一层变量的方差分析结果身高*年龄方差分析的变量信息) :说明是分析不同年龄的身高均值间是否存在显著性差异;Sum of Squares(偏差平方和);
5、df(自由度);Mean square(均方);F(方差值);sig(P值);Between Groups(组间偏差平方和):由两部分组成:Linearity是由因变量与控制变量之间的线性关系引起的;Deviation from linearity不是由因变量与控制变量之间的线性关系引起的;Within Groups(组内偏差平方和):各组内的变异相对于组均值的变异;Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。线性检验结果线性检验结果Measures of Association.879.772.915.838身高 * 年龄RR SquaredEtaEta Squar
6、edlR R是因变量身高的观测值与预测值之间的的相是因变量身高的观测值与预测值之间的的相l 关系数,关系数,R R值越接近值越接近1 1 表明回归方程的预测性表明回归方程的预测性l 越好;越好;lEtaEta:即:即值值0 01 1说明因变量与自变量之说明因变量与自变量之l 间的联系程度;间的联系程度;lEta SquaredEta Squared:22为组间偏差平方和与偏差为组间偏差平方和与偏差l 平方和总和之比。平方和总和之比。练习题练习题已知97个被调查幼儿的体健资料并建立了CHILD.sav数据文件。试按性别X2对身高X5与体重X4做平均数分析。CHILD.sav数据文件在SP11DA
7、TA文件夹下二、二、T test过程过程 1、单一样本、单一样本T检验检验(One-sample T Test) 检验单个变量的均值是否与给定的常数一般为理论检验单个变量的均值是否与给定的常数一般为理论值、标准值或经过大量观察所得的稳定值等之间值、标准值或经过大量观察所得的稳定值等之间存在差异。样本均数与总体均数之间的差异显著性存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本检验属于单一样本T检验。检验。举例:已知某地区举例:已知某地区12岁男孩平均身高为岁男孩平均身高为142.3cm。1973年某市测量年某市测量120名名12岁男孩身高资料。分析该岁男孩身高资料。分析该市市12岁
8、男孩的身高与该地区平均身高有无明显差异。岁男孩的身高与该地区平均身高有无明显差异。 建立数据库建立数据库(data11-02) lConfidence interval:95%:置信区间项,可以自定义。lMissing Values:选择对缺失值的处理方法l Exclude cases analysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除;l Exclude cases listwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项身高基本描述统计量身高基本描述统计量单样本单样本T检验分析结果检验分析结果9595 Confidence Int
9、erval of the DifferenceConfidence Interval of the Difference差值的差值的95%95%置信置信区间):区间):9595的置信区间均值的置信区间均值1.961.96标准误。根据上表标准误。根据上表9595置信置信区间是区间是143.048 143.048 1.96 1.960.5310.531即即142.0142.0144.1144.1之间。由此推出,之间。由此推出,改范围与总体均数之差为改范围与总体均数之差为142.0142.0142.3142.3144.1144.1142.3142.3,即表中,即表中0.3040.304和和1.800
10、1.800的含义。实际上样本均值与总体均值的含义。实际上样本均值与总体均值142.3142.3之间的差之间的差值落在值落在0.3010.3011.8001.800之间的占之间的占9595的范围包括的范围包括0 0,由此得出样本,由此得出样本均数与总体均数无显著性差异。也就是样本均数与总体均数之差与均数与总体均数无显著性差异。也就是样本均数与总体均数之差与0 0无显著性差异。无显著性差异。练习题练习题已知某水样中含CaCO3的真值为20.7mg/L,现用某方法重复测定该水样11次CaCO3的含量mg/L为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.
11、41,20.00,23.00,22.00。问该方法测得的均值是否偏高?2、Independent Sample T test独立样本独立样本T检验)检验)独立样本的T检验用于检验是否两个不相关的样本来自具有相同均值的总体。必须注意使用这种检验的条件是必须具有来自两个不相关组非配对的观测量,其均值必须是对你想在两组中都计算的变量的综合测度。 如果分组样本彼此不独立,例如测量的是研究对象用药前后某项指标,要求比较用药前后某项指标均值是否有显著性差异,应该使用配对 T检验的功能Paired Sample T test)。如果分组不止两个,应该使用One-Way ANOV过程进行单变量方差分析。如果你
12、试图比较的变量明显不是正态分布的,则应该考虑使用一种非参数检验过程Nonparametric test)。如果想比较的变量是分类变量,应该使用Crosstabs功能。lUse special values:按分组变量的值进行分组lCut point:当分组变量为连续变量时,选择该选项后,在后面的矩形框中输入一个连续变量值,将观测量分为大于该值和小于该值的两个组,检验在这两个组之间进行,比较其因变量在两组的均数间是否有显著性差异。lConfidence interval:95%:置信区间项,可以自定义。lMissing Values:选择对缺失值的处理方法l Exclude cases anal
13、ysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除;l Exclude cases listwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项例题一例题一现有银行雇员工资为例,检验男女雇员现工资是否有显著差异。一个是要比较salary变量的均值,另一个是gender变量作为分水平变量。 (data09-03) 。分析变量的简单描述性统计量分析变量的简单描述性统计量Group Statistics258$41441.8$19,499.214$1213.97216$26031.9$7,558.021$514.258GenderMaleFemaleC
14、urrent SalaryNMeanStd. DeviationStd. ErrorMeanl左第一栏为分析变量标签和分类变量标签lN观测量数目lMean均值lStd. Deviation标准差lStd. Error Mean标准误独立样本独立样本T检验结果检验结果lLevenes Test for Equality of Variances:方差齐性检验结果。lF方差值119.669lSig:P值为0t-test for Equality of Means为T检验结果栏t: t值;df:自由度;Sig:显著性概率即P值;Mean Difference:两组均值之差。表现平均当前工资女性低于男
15、性15409.86元;Std. Error Difference:差值的标准误为131.40;95 Confidence Interval of the Difference:差值的95%置信区间。在12816.718003.0之间,不包括0即两组均值之差与0有显著性差异。例题二例题二有29名13岁男生的身高、体重、肺活量数据,试分析大于等于155cm的与身高小于155cm的两组男生的体重和肺活量均值是否有显著差异。无效假设H0:身高大于等于155cm的与身高小于155cm的两组男生的体重平均值在99%水平上具有显著差异;身高大于等于155cm的与身高小于155cm的两组男生的肺活量平均值在9
16、9%水平上无显著差异。(在options框中,confidence输入99)。 练习题练习题某克山病区测得11例急性克山病患者与13名健康人的血磷值如下:患者:2.60, 3.24, 3.73, 3.73, 4.32, 5.18, 4.73, 5.58, 5.78, 6.40, 6.53健康人:1.67, 1.98, 1.98, 2.33, 2.34, 2.50, 3.60,3.73, 4.14, 4.17, 4.57, 4.82,5.78问该地区急性克山病患者与健康人的血鳞值是否不同?三、配对样本三、配对样本T检验检验 配对样本T检验Paired Sample T test用于检验两个相关的
17、样本是否来自具有相同均值的总体。这种相关的或配对的样本常常来自这样的实验结果,在实验中被观测对象在实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一个观测对象。一对可以两者组合而成。 进行配对样本的T检验要求被比较的两个样本有配对关系。要求两个样本均来自正态总体。而且均值是对于检验有意义的描述统计量。均值的配对比较是比较常见见以下几个例子)。 同一窝实验用白鼠按性别、体重相同的配对,再随机分到实验组和对照组,分别喂加入海藻的饲料和普通饲料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间。比较两组白鼠游泳时间均值,从而比较两种饲料对抗疲劳的作用
18、。 同一组高血压病人在进行体育疗法前后,测量其血压。每个病人在体育疗法前后的血压测量值构成观测量对。可以求这组病人体育疗法前后血压平均值。进行配对T检验,分析体育疗法对降血压的疗效。 在研究人体各部位体温是否有差别,一个人的两个部位的温度构成一对数据。测量若干人的同样两个部位的温度数据,可以比较这两个部位平均温度是否有显著性差异。使用配对t检验。 配对样本T检验实际上是先求出每对测量值之差值,对差值求均值。检验配对变量均值之间差异是否显著。其实质检验的假设实际上是差值的均值与零均值之间差异的显著性。如果差值均值与O均值无显著性差异说明配对变量均值之间无显著性差异。 配对样本T检验与独立样本T检
19、验均使用T-TEST过程,但调用该过程的菜单不同,对数据文件结构的要求不同和所使用的命令语句也有区别。进行配对样本T检验的数据文件中一对数据必须作为同一个观测量中两个变量值。 例题一例题一现以体育疗法治疗高血压的数据,pretreat:治疗前舒张压mmHg),posttreat: 治疗后舒张压mmHg)。要求判断体育疗法对降低血压是否有疗效。 (data11-03) 治疗前后舒张压的单变量描述统计量治疗前后舒张压的单变量描述统计量l变量名标签:列出配对变量的变量标签,对数为1;l均值:分别给出治疗前后的舒张压均值;119.50,102.50l观察量数目l标准差:10.069,11.1118l标
20、准误:3.184,3.516Paired Samples Statistics119.501010.0693.184102.501011.1183.516治疗前舒张压治疗后舒张压Pair 1MeanNStd. DeviationStd. ErrorMean配对变量之间的相关性配对变量之间的相关性lCorrelation:相关系数,0.599;lSig:为不相关的概率,0.067;相对于治疗前后舒张压的相关系数为0的假设成立概率为0.067大于0.05,可以得出结论治疗前后舒张压没有明显的线性关系Paired Samples Correlations10.599.067治疗前舒张压 &治疗后舒张压Pair
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 急症抢救操作流程
- 针对复习的CFA试题及答案传授
- 2024年特许金融分析师考试必考试题及答案
- 《第十四章 整式的乘法与因式分解》专题复习与单元检测试卷
- 追随百岁老人探寻长寿秘诀
- 心肌梗死的主要护理诊断
- 2024年特许金融分析师考试考生心声分享试题及答案
- 山东省郯城第一中学2024-2025学年高三下学期第二次模拟考试地理试题(原卷版)
- 湖北省襄阳市第四中学2024-2025学年高一下学期2月月考地理试题(原卷版)
- 教学课件说明范文
- 八年级上册语文全品作业本电子版
- CATIA-零件实体设计模块Part-Desi课件
- 中考地理易错题
- 职称专家推荐意见表
- 文学作品与名著勾连阅读专题复习-中考语文二轮专题
- 认证咨询机构设立审批须知
- 部编版道德与法治六年级下册第三单元《多样文明 多彩生活》大单元作业设计
- 设备安装施工方案与调试方案
- GB/T 34938-2017平面型电磁屏蔽材料通用技术要求
- GB/T 31989-2015高压电力用户用电安全
- GB/T 26049-2010银包铜粉
评论
0/150
提交评论