u检验及t检验_第1页
u检验及t检验_第2页
u检验及t检验_第3页
u检验及t检验_第4页
u检验及t检验_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(Medical statistics)Singapore College of TCM2009.9t testt test 单样本均数单样本均数 t 检验检验 配对样本均数的配对样本均数的t检验检验 两个独立样本均数的两个独立样本均数的t 检检验验 正态性检验正态性检验 两样本的方差齐性检验两样本的方差齐性检验 两总体方差不等时均数比两总体方差不等时均数比较的较的 检验检验 案例案例 练习和思考练习和思考 小结小结主要内容t t t 检验是假设检验中最见的一种方法,它是检验是假设检验中最见的一种方法,它是以以t t分布分布为基础。由于为基础。由于t t分布的发现使得小样本统计推断分布的发现使

2、得小样本统计推断成为可能,因而,它被认为是统计学发展史中的里成为可能,因而,它被认为是统计学发展史中的里程碑之一,在医学统计学中,程碑之一,在医学统计学中,t t检验是非常活跃的一检验是非常活跃的一类假设检验方法。类假设检验方法。什么是t检验?单样本单样本t检验检验配对样本配对样本t检验检验两个独立样本两个独立样本t检验检验同源配对同源配对异源配对异源配对t 检验的分类:t t 假设检验的应用条件:假设检验的应用条件:(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两)两样本均数比较时还要求所对应的两总体方

3、差相等(总体方差相等( 1 12 2 = = 2 22 2 ),即方差齐),即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。)独立性。 在实际应用中,与上述条件略有偏离,但对在实际应用中,与上述条件略有偏离,但对结果影响不大。结果影响不大。问题:问题:已知,或已知,或n n较大时,用什么检验?较大时,用什么检验? f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3z z 检验检验 t t 检验是根据检验是根据t t分布判断样本概率而进行的假分布判断样本概率而进行的假设检验,而

4、当样本量设检验,而当样本量n n很大时,很大时,t t分布就接近标准分布就接近标准正态分布,标准正态分布也称为正态分布,标准正态分布也称为u u分布,而国外教分布,而国外教科书则称为科书则称为Z Z分布,这时候根据分布,这时候根据u u分布判断概率所分布判断概率所进行的假设检验称为进行的假设检验称为u u检验。检验。应用条件:应用条件: 已知或者已知或者未未知且知且n n足够大(如足够大(如n100n100)。)。复习复习(1 1)样本均数与总体均数的比较)样本均数与总体均数的比较目的目的: :推断该样本是否来自某已知总体;推断该样本是否来自某已知总体; 样本均数代表的总体均数样本均数代表的总

5、体均数 与与 0 0是否相等。是否相等。总体均数总体均数 0 0一般为理论值、标准值或经大量观察所得一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。并为人们接受的公认值、习惯值。 未知总体未知总体已知总体已知总体0?t t 检验检验例例3.16 3.16 根据大量调查,已知健康成年男子听到最高根据大量调查,已知健康成年男子听到最高声音频率的平均数为声音频率的平均数为18000Hz18000Hz。某医生随机抽查。某医生随机抽查2525名名接触噪声作业的男性工人,测得可以听到的最高声音接触噪声作业的男性工人,测得可以听到的最高声音频率的均数为频率的均数为17200Hz17200H

6、z,标准差为,标准差为650Hz650Hz。试问能否。试问能否认为接触噪声作业工人的听力水平与正常成年男性的认为接触噪声作业工人的听力水平与正常成年男性的听力水平不同?听力水平不同?0=18000Hz总体总体健康成年男子健康成年男子样本样本接触噪声接触噪声作业工人作业工人总体总体=未知总体未知总体17200650XS?1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)接触噪声作业工人的听。)接触噪声作业工人的听力水平与正常成年男性的听力水平相同。力水平与正常成年男性的听力水平相同。H H1 1 ( 。 )接触噪声作业工人的听)接触噪声作业工人的听力水平与正常成年男性的听

7、力水平不同。力水平与正常成年男性的听力水平不同。 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量t t值。值。n =25 n =25 ,X=17200HzX=17200Hz,s =650Hzs =650Hz, 。=18000Hz=18000Hz017200 180006.1546502525 124xtsn 统计量统计量t t表示,在标准误的尺度表示,在标准误的尺度下,样本均数与总体均数的偏下,样本均数与总体均数的偏离。这种偏离称为标准离。这种偏离称为标准t t离差离差(standard t deviationstandard t dev

8、iation)假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。25 124 查查t t界值表双侧界值表双侧0.05/2,(24)0.01/2,(24)2.064,2.797tt0.05/2,(24)2.064t0t =6.1540.01/2,(24)2.797t现有统计量现有统计量t=6.1542.797t=6.1542.797,P0.01P0.01。按按=0.05=0.05水准,拒绝水准,拒绝H H。,接受。,接受H1H1,差,差异有统计学意义。结合本题异有统计学意义。结合本题有理由认为接触噪声作业有理由认为接触噪声作业的男性工人平均听力水平的男性工人

9、平均听力水平低于正常成年男性。低于正常成年男性。-tt0附表2 t 界值表 概 率,P 单侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 自由度 双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599

10、3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029

11、4.785 5.408 8 0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 9 0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 21 0.686 0.859 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819 22 0.686 0.858 1.321 1.717 2.074 2.508

12、 2.819 3.119 3.505 3.792 23 0.685 0.858 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768 24 0.685 0.857 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745 25 0.684 0.856 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725 -2.0642.0640 =240.0250.025t0.05,24=2.064 P =P ( |t| 2.064 )=0.05 P=P(|t|5.4545)0.050.0

13、5思路解析:思路解析:0=18000Hz总体总体健康成年男子健康成年男子样本样本总体总体=未知总体未知总体17200650XS00=18000Hz总体总体样本样本17200650XS假设该样本来自已知总体假设该样本来自已知总体0=18000Hz总体总体样本样本17200650XS这些样这些样本是什本是什么分布么分布规律?规律?这些样本是什么分布规律?这些样本是什么分布规律?(1 1)这些样本的均数服从正态分)这些样本的均数服从正态分布:布:20(,)Nn这里这里0=18000Hz,未知,因此未知,因此这种正态分布往往这种正态分布往往是未知的,这样就没办法求目前手头这个样本是未知的,这样就没办法

14、求目前手头这个样本( )在样本抽样分布中出现的概率就)在样本抽样分布中出现的概率就无法确认。即无法获得等于及大于(或等于及小于)无法确认。即无法获得等于及大于(或等于及小于)现有样本均数的现有样本均数的概率,也就无法概率,也就无法判断是否是小判断是否是小概率。概率。17200,650XS20(,)Nn?xix只知道它服从正只知道它服从正态分布,至于是态分布,至于是什么样的正态分什么样的正态分布,不清楚布,不清楚22()21( ),2xf xex这些样本的均数服从正态分布,但至于是什么样的正这些样本的均数服从正态分布,但至于是什么样的正态分布,往往未知,这时我们不去追究,而是回避这态分布,往往未

15、知,这时我们不去追究,而是回避这个问题,采用个问题,采用t t分布来解决。分布来解决。(2 2)由这些样本的均数和标准差导出的新的统计量)由这些样本的均数和标准差导出的新的统计量t t服从的不是正态分布,而是服从的不是正态分布,而是t t分布。分布。0 xtsn都是已都是已知的知的服从自由度为服从自由度为n-1n-1的的t t分布,分布,即即v=25-1=24v=25-1=24的的t t分布。分布。 f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3t 仅分布与自由度有关仅分布与自由度有关-tt0附表2 t 界值表 概 率,P 单侧 0.25 0.20 0.1

16、0 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 自由度 双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.

17、924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 8 0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.83

18、3 4.501 5.041 9 0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 21 0.686 0.859 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819 22 0.686 0.858 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792 23 0.685 0.858 1.319 1.714 2.069 2.

19、500 2.807 3.104 3.485 3.768 24 0.685 0.857 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745 25 0.684 0.856 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725 不同自由度下不同自由度下t t界值对应的概率有差异界值对应的概率有差异t 仅分布与自由度有关仅分布与自由度有关2(1) / 2(1) / 2( )(1)(/ 2)nnth tnnn f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3-tt0it16.154t

20、 P0.01对这个样本是否来自对这个样本是否来自这个总体产生了怀疑,这个总体产生了怀疑,因此从已知总体中抽因此从已知总体中抽样,获得这样的样本样,获得这样的样本的概率太少了的概率太少了P0.01P100n100)。)。00/xun0/xusn(n(n较大时较大时) )(。已知时。已知时) )这些样本是什么分布规律?这些样本是什么分布规律? 这些样本的均数服从正态分布:这些样本的均数服从正态分布:200(,)Nn17200,650XS20(,)Nn 。xix它服从正态分布,它服从正态分布,至于是什么样的至于是什么样的正态分布,是清正态分布,是清楚的。楚的。00/xun(。已知时。已知时) )0/

21、xusn(n(n较大时较大时) ) f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3u 分布分布例例3.18 3.18 为了解医学院学生的心理健康状况,随机抽为了解医学院学生的心理健康状况,随机抽查某医科大学在校大学生查某医科大学在校大学生210210名,用名,用SCLSCL9090症状自评量症状自评量表进行测定,得出因子总分的均数为表进行测定,得出因子总分的均数为142.6142.6,标准差,标准差为为31.2531.25。已知全国。已知全国SCLSCL9090因子总分的均数(常模)为因子总分的均数(常模)为130130。试问该医科大学在校学生的。试问该医

22、科大学在校学生的SCLSCL9090因子总分是否因子总分是否与全国水平相同?与全国水平相同?0=130总体总体全国水平全国水平样本样本某医学大学某医学大学在校学生在校学生总体总体=未知总体未知总体142.631.25XS?0/xusn(n(n较大时较大时) ) f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3u 分布分布1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)该医科大学在校学生的。)该医科大学在校学生的SCL90SCL90因子总分与全国水平相同。因子总分与全国水平相同。H H1 1 ( 。 )医科大学在校学生的)医科大学在校

23、学生的SCL90SCL90因子总分与全国水平不同。因子总分与全国水平不同。 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n =210100 n =210100 ,X=142.6X=142.6,s =31.25s =31.25, 。=130=1300142.61305.843/31.25 /210 xusn假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0.050.011.96,2.5

24、8uu0.051.96u0u =5.8430.012.58t现有统计量现有统计量u=5.8432.58u=5.8432.58,P0.01P0.20; 在慢性实验中,应保持配对因素的可比性,即实验全程配对因素应保持齐同; 在实际资料处理时,配对可能是成功的(属配对设计),也可能是不成功的,是完全随机设计。设计模式:设计模式:研究研究对象对象N N合格合格对象对象NeNe组组组组D D0 0D D1 1C C因素因素T T1 1因素因素统计分析统计分析分组分组 施加因素施加因素 效应效应配对配对P P随机随机R R 若两处理因素的效应无差别,差值若两处理因素的效应无差别,差值d d的总体均数的总体

25、均数 d d应该为应该为0 0,故可将该检验理解为样本均数与总体均,故可将该检验理解为样本均数与总体均数数 d d =0=0的比较的比较 差值均数的大小及其抽样误差差值均数的大小及其抽样误差反应因素的效应反应因素的效应 配对设计配对设计t t检验的思路:检验的思路:例例3.19 3.19 为研究某心理干预措施对抑郁症患者的疗效,为研究某心理干预措施对抑郁症患者的疗效,对对1010名抑郁症患者于干预前、干预后分别进行生活满名抑郁症患者于干预前、干预后分别进行生活满意度指数意度指数B B(LSIBLSIB)的心理测试,结果如表)的心理测试,结果如表3-73-7所示。所示。问该干预措施是否有效?问该

26、干预措施是否有效?12345678910编号编号 干预前干预前 干预后干预后 差值(差值(d) d2129106581311109151216101291918151133647167529936164913649254合计合计 d=44 d2=234 表表3-7 10抑郁症患者干预前后心理指标抑郁症患者干预前后心理指标LSIB测试结果测试结果0d4.42.12ddSd=0总体总体总体总体=?1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(d d =0=0) 干预措施实施前后无差别干预措施实施前后无差别H H1 1 ( d d 0 0 )干预措施实施前后有差别)干预措施实施

27、前后有差别 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量t t值。值。n =10 n =10 ,d= d= d/n=44/10=4.4 ,04.46.563,10 192.1210ddtsn 222()/2 3 4( 4 4 )/ 1 02 .1 211 01dddnSn假设检验步骤:假设检验步骤:3 3、确定、确定P P值,作出推断结论。值,作出推断结论。10 19 查查t t界值表双侧界值表双侧0.05,(9)0.01,(9)2.2624,3.250tt0.05,(9)2.262t0t =6.5630.01,(9)3.250t现有统

28、计量现有统计量t=6.5633.250t=6.5633.250,P0.01P50n50时),自由度足够大,可用时),自由度足够大,可用u u检验。检验。121212121222221212xxxxxxxxxxuSSSSSnn两个样本均数差值的标准误两个样本均数差值的标准误例例3.21 3.21 为评价交通污染对交通警察心理健康状况的为评价交通污染对交通警察心理健康状况的影响,某医生随机抽取某市交警大队外勤警察影响,某医生随机抽取某市交警大队外勤警察212212名名(男性)作为暴露组,进行(男性)作为暴露组,进行SCL90SCL90评定,测得均数为评定,测得均数为152.51152.51,标准差

29、为,标准差为35.2735.27。已知全国(男性,。已知全国(男性,n=724n=724)常模的均数为常模的均数为129.96129.96,标准差为,标准差为38.7638.76。试问该市交。试问该市交警心理状况警心理状况SCL90SCL90评分是否高于全国常模?评分是否高于全国常模?暴露组暴露组 对照组对照组或常模组或常模组假设检验步骤:假设检验步骤:(1)(1)、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(1 1=2 2)该市交警心理状况该市交警心理状况SCL90SCL90评评分与全国常模分与全国常模相同相同H H1 1 ( 1 12 2 )该市交警心理状况该市交警心理状况

30、SCL90SCL90评评分高于全国常模分高于全国常模 =0.05=0.05针针对对总总体体(2)(2)、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n 1=212 n 1=212 ,X=152.51X=152.51, s1 =35.27s1 =35.27122212128.001xxussnnn 2=724 n 2=724 ,X=129.96X=129.96, s2 =38.76s2 =38.76(3)(3)、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0.

31、050.011.96,2.58uu0.051.96u0u =8.0010.012.58t现有统计量现有统计量u=8.0012.58u=8.0012.58,P0.01P P 0.50.050.50.05,差别无统计,差别无统计学意义,可以还不能认为学意义,可以还不能认为13-1613-16岁居民腭弓深度有性别差异。岁居民腭弓深度有性别差异。 17.15 16.920.5502.201 20 1 34t正态性检验正态性检验(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两)两样本均数比较时还要求所对应的两总体方差

32、相等(总体方差相等( 1 12 2 = = 2 22 2 ),即方差齐),即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。)独立性。方差齐性检验方差齐性检验(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两两样本均数比较时还要求所对应的两总体方差相等(总体方差相等( 1 12 2 = = 2 22 2 ),即方差齐),即方差齐性(性(Homogeneity of VarianceHomogeneity of Varianc

33、e););(4 4)独立性。)独立性。两样本所属总体方差不等(两样本所属总体方差不等(SatterthwaiteSatterthwaite近似法)近似法) 如果如果1 12 =2 =2 22 2 ,两样本所属总体方差不相等,如果,两样本所属总体方差不相等,如果两总体为正态分布,分别记为两总体为正态分布,分别记为N N(1 1,2 2)和)和( 2 2,2 2 ),检验假设为:),检验假设为:H H0 0:1 1=2 2H H1 1: 1 1 2 2121212XXtSSnn12122224412()11XXXXSSSSnnt t(v)分布分布例例6-5 6-5 为探讨硫酸氧钒对糖尿病性白内障的

34、防治作用,为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的研究人员将已诱导糖尿病模型的2020只大鼠随机分成为只大鼠随机分成为两组。一组用硫酸氧钒治疗(两组。一组用硫酸氧钒治疗(DVDV组),另一组作对组),另一组作对照观察(照观察(D D组),组),1212周后测大鼠血糖含量(周后测大鼠血糖含量(mmol/Lmmol/L)。)。结果为,结果为,DVDV组组1212只,样本均数为只,样本均数为6.5mmol/L6.5mmol/L,标准差,标准差为为1.34mmol/L1.34mmol/L;D D组组8 8只,样本均数为只,样本均数为13.7mmol/L13.7mmol/L

35、,标准差为标准差为4.21mmol/L4.21mmol/L。试问两组动物血糖含量的总体。试问两组动物血糖含量的总体均数是否相同?均数是否相同?H H0 0:1 1=2 2 ,H H1 1: 1 1 2 2双侧双侧 =0.05=0.05检验假设检验假设1111 26 .51 .3 4nXSDVDV组组22281 3 .74 .2 1nXSD D组组221222(4 .2 1)9 .7 8(1 .3 4 )SS提示方差不齐提示方差不齐122222121213.76.54.68174.211.34812XXtSSnn12122224412()7 .9 5 4 2811XXXXSSSSnn0.05/2,(8)2.306t04.68174.6817配对设计与完全随机设计比较配对设计与完全随机设计比较由于配对设计的抽样误差较小,它的实验效率往往优于完全随机设计,在实际工作中多数情况也如此,但也有特殊情况,主要有两个方面原因:(1)标准误的大小若采用两组的标准差计算配对设计的标准误:21 22212/drs sSssn(r为两列数据相关系数)当样本量相等时,完全随机设计的两组差值均数的标准误为:122212/xxSssn因此,当r0配对成功,当r100n100)。)。x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论