应用统计分析第二章T检验_第1页
应用统计分析第二章T检验_第2页
应用统计分析第二章T检验_第3页
应用统计分析第二章T检验_第4页
应用统计分析第二章T检验_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主要内容 假设检验的基本原理,错误,步骤 单样本t检验 独立样本t检验 配对样本的t检验假设检验 所谓所谓假设检验假设检验,就是事先对总体参数或,就是事先对总体参数或总体分布形式作出一个假设,然后利用总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。从而决定是否接受或否定原假设。 1、假设检验采用的逻辑推理方法是反证法、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而

2、判断是否接受原假设; 判断结果合理与否,是基于“小概率事件不易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小概率事件,则认为原假设是不合理的;反之,小概率事件没有发生,则认为原假设是合理的。2、假设检验是基于样本资料来推断总体、假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信特征的,而这种推断是在一定概率置信度下进行的,而非严格的逻辑证明。度下进行的,而非严格的逻辑证明。 因此,置信度大小的不同,有可能做出不同的判断。三、假设检验中的两类错误三、假设检验中的两类错误 由于假设检验是根据有限的样本信息来推断总体特征,由样本的随机性可能致使判断出错

3、。(一)第一类错误 当原假设为真时,而拒绝原假设所犯的错误,称为第I类错误或拒真错误。易知犯第I类错误的概率就是显著性水平 P拒绝H0|H0为真= (二)第二类错误(二)第二类错误 当原假设为假时,而接受原假设所犯的错误,当原假设为假时,而接受原假设所犯的错误,称称为第为第II类错误类错误或取伪错误取伪错误。犯第II类错误的概率常用 表示 P接受接受H0|H0不正确不正确 = 陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 ) )第第类

4、错误类错误( ( ) )拒绝拒绝H0第第类错误类错误( ( ) )正确决策正确决策(1-(1- ) )假设检验就好像假设检验就好像一场审判过程一场审判过程统计检验过程统计检验过程原假设 H0结论真实错误拒绝H0第I 类错误 正确 1- 接受H0正确 1-第II类错误1、犯第一类错误与犯第二类错误的概率存在此消彼长的关系; 2、若要同时减少若要同时减少 与与 ,须增大样本容量,须增大样本容量n。 3、通常的作法是、通常的作法是,取显著性水平较小,即控制犯第一,取显著性水平较小,即控制犯第一类错误的概率在较小的范围内;类错误的概率在较小的范围内; 4、在犯第二类错误的概率不好控制时,将在犯第二类错

5、误的概率不好控制时,将“接受原假接受原假设设”更倾向于说成更倾向于说成“不拒绝原假设不拒绝原假设”。注意:注意:假设检验的步骤 (1)建立检验假设和确定检验水准 (2)选定检验方法和计算检验统计量 (3)确定P值和做出推断结论(1)建立检验假设和确定检验水准 在均数的比较中,检验假设是针对总体特征而言,包括相互对立的两个方面,即两种假设: 原假设为正待检验的假设:H0; 备择假设为可供选择的假设:H1 一般地,假设有三种形式: (1 1)双侧检验)双侧检验: H0 : 0; H1 :0 (2 2)左侧检验)左侧检验: H0 : 0; H1 :0 或 H0 : 0; H1 :0 或 H0 : 0

6、 双侧检验和单侧检验 在进行t 检验时,如果其目的在于检验两个总体均数是否相等,即为双侧检验。例如检验某种新降压药与常用降压药效力是否相同?就是说,新药效力可能比旧药好,也可能比旧药差,或者力相同,都有可能。 如果我们已知新药效力不可能低于旧药效力,例如磺胺药+ 磺胺增效剂从理论上推知其效果不可能低于单用磺胺药,这时,无效假设为H0,备择假设为H1 :u1u2,统计上成为单侧检验。 (2)选择显著性水平 当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。用表示。 =0.05(即5%)或=0.01(即1%) ho,h1和 的确定,以及单侧检验或双侧检验的

7、选择,都应结合研究设计,在未获得样本结果之前决定,而不受样本结果的影响。(3)确定P值和做出推断结论 P值是指由ho成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。 当P 时,结论为按所取检验水准拒绝ho,接受h1,这样做出结论的理由是:在ho成立的条件下,出现等于及大于现有检验统计量值的概率P,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持ho因而拒绝它; 如P ,即样本信息支持ho,就没有理由拒绝它,此时只好接受它。t 检验t检验亦称student t 检验。t检验的用途: 样本均数与总体均数的比较,即单样本t检验 来自于同一总体彼此独立的两

8、个不同样本,比较不同类别的显著性差异,即独立样本t检验 两样本均数的比较,即配对样本t检验t检验的应用条件: 当样本数较小时,要求样本取自正态总体; 做两样本均数比较时,还要求两样本的总体方差相等(1) 已知一个总体均数u;(2) 可得到一个样本均数及该样本标准差;(3) 样本来自正态或近似正态总体。T检验计算方式 如如下下:样样本本统统计计检检验验统统计计量量的的基基本本量量被被假假设设参参数数检检验验统统计计量量统统形形式式计计量量的的标标准准差差 样本均数与总体均数的比较的t 检验,即单样本t 检验。比较的目的是推断样本所代表的未知总体均数与已知的总体均数uo有无差别。 首先对所估计的总

9、体提出一个假设,如: 假设这个总体的平均数 等于某个值uo,然后通过样本去推断这个假设是否可以接受,如果可以接受,样本很可能来自这个总体;否则很可能不是来自这个总体. 【例【例1】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411

10、.312.212.012.3 H0 : = 12 H1 : 12 = 0.05 df = 10 - 1 = 9 临界值临界值(c): 决策:不拒绝决策:不拒绝ho 结论:结论:a. a.被比较的两组样本彼此独立被比较的两组样本彼此独立, , 没有配没有配对关系对关系 b. b.两组样本均来自两组样本均来自正态总体正态总体 c. c.均值均值是对于检验有意义的描述统计量是对于检验有意义的描述统计量 两组样本方差相等和不等时使用的计算两组样本方差相等和不等时使用的计算t t值值的公式不同。因此应该先对方差进行齐次性的公式不同。因此应该先对方差进行齐次性检验。检验。SPSSSPSS的输出,在给出方差

11、齐和不齐两的输出,在给出方差齐和不齐两种计算结果的种计算结果的t t值,和值,和t t检验的显著性概率的检验的显著性概率的同时,还给出对方差齐次性检验的同时,还给出对方差齐次性检验的F F值和值和F F检检验的显著性概率。验的显著性概率。 用户需要根据用户需要根据F F检验的结果自己判断选择检验的结果自己判断选择t t检验输出中的哪个结果,得出最后结论。检验输出中的哪个结果,得出最后结论。 进行方差齐次检验使用进行方差齐次检验使用F F检验。对应的零检验。对应的零假设是假设是: :两组样本方差相等。概率两组样本方差相等。概率p0.05 p - 比较均值比较均值- - 独立样本独立样本T T检验

12、(检验(T T) 检验变量:要求平均值的变量检验变量:要求平均值的变量 分组变量(只能分成分组变量(只能分成两组两组):):1 1,2 2结果中比较有用的值:方差齐次性检验结果中比较有用的值:方差齐次性检验F F的的SigSig和方差相等或不相等的和方差相等或不相等的SigSig( Sig Sig为显著性概率值)为显著性概率值)银行男女雇员的平均工资是否有显著性差异银行男女雇员的平均工资是否有显著性差异。(置信区。(置信区间百分比为间百分比为95%95%)雇员编号雇员编号性别性别工资工资101男5300102男5600103女5550104男4000105女4600106女4300107男51

13、00108女5900109女5200110男4100111女4600112男4700分析:根据上表建立数据集如下:分析:根据上表建立数据集如下:在在SPSS中,中,P值被定义值被定义为所对应为所对应t值分布一侧面值分布一侧面积的双倍。因为双侧检验积的双倍。因为双侧检验时,可直接比较时,可直接比较P值与值与值的大小;若为单侧检验,值的大小;若为单侧检验,则需比较则需比较P值与值与2值的大值的大小。小。配对样本的t 检验 配对设计是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。 配对因素是影响实验效应的主要非处理因素。 -例如,在动物实验中,常将窝别、性别相同,体重相近

14、的两个动物配成对子; -人群试验中,常将性别相同、年龄相近的两个人配成对子,这样可提高各处理组间的均衡性。 配对样本分三种情况: 配成对子的同对受试对象分别给予两种不同的处理,其目的是推断两种处理的效果有无差别; 同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别; 同一受试对象处理前后的比较,其目的是推断某种处理有无作用。 公式:对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较,所用方法为配对t检验为差值d的标准差。操作:操作: 菜单:菜单:

15、分析分析 - - 比较均值比较均值- - 配对样本配对样本T T检验(检验(P P) 注:成对变量(注:成对变量(V V):设置配对变量):设置配对变量 分析:根据述信息建立数据集如下:分析:根据述信息建立数据集如下: 配对样本配对样本t检验与独立样本检验与独立样本t检验的区别:检验的区别: 1 . 独立样本过程用于检验两个独立样本是否来自独立样本过程用于检验两个独立样本是否来自具有相同均值的总体。配对样本用于检验两个相具有相同均值的总体。配对样本用于检验两个相关的样本是否来自具有相同均值的正态总体。关的样本是否来自具有相同均值的正态总体。 2 . 独立样本是指不同样本平均数的比较,而配独立样

16、本是指不同样本平均数的比较,而配对样本往往是对相同样本二次平均数的检验。对样本往往是对相同样本二次平均数的检验。35 二、假设检验应注意的问题 1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近(控制变量)。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。36 2.不同的资料应选用不同检验方法 应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。37 3.正确理

17、解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。38 4.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的 确 切 范 围 , 如 写 成 P = 0 . 0 4 0 或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。39 5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符

18、合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。 40 6.置信区间与假设检验各自不同的作用,要结合使用。 一方面一方面,置信置信区间区间亦可回答亦可回答假设检验假设检验的问题,算的问题,算得的置信区间若包含了得的置信区间若包含了H H0 0,则按,则按 水准,不拒绝水准,不拒绝H H0 0;若;若不包含不包含H H0 0,则按,则按 水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1。 另一方面另一方面,置信置信区间不但

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论