




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、123u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实个体进行观察、试验,但这在医学研究实 际中往往不可行。际中往往不可行。u对对无限总体无限总体不可能对所有个体逐一观察,不可能对所有个体逐一观察, 对对有限总体有限总体限于人力、财力、物力、时间限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所或个体过多等原因,不可能也没必要对所 有个体逐一研究有个体逐一研究(如对一批罐头质量检查如对一批罐头质量检查)。u借助借助抽样研究抽样研究。 4u欲了解某地欲了解某地18岁男生身高值的平均水平,岁男生身高值的平均水平, 随机抽
2、取该地随机抽取该地10名男生身高值作为名男生身高值作为样本样本。u由于由于个体变异与抽样个体变异与抽样的影响,抽得的样本的影响,抽得的样本 均数不太可能等于总体均数,造成样本均数不太可能等于总体均数,造成样本统统 计量与总体参数间的差异计量与总体参数间的差异(表现为来自同一表现为来自同一 总体的若干样本统计量间的差异总体的若干样本统计量间的差异),称为,称为抽抽 样误差样误差。u抽样误差是不可避免的。抽样误差是不可避免的。u抽样误差是有规律的。抽样误差是有规律的。51999年某市年某市18岁男生身高值岁男生身高值 XiN(, 2) =167.7cm =5.3cm样本号样本号iXiS 1 167
3、.41 2.74 2 165.56 6.57 3 168.20 5.36 99 169.40 5.57100 165.69 5.09ni = 106样本均数抽样分布具有如下特点:样本均数抽样分布具有如下特点: u各样本均数未必等于总体均数各样本均数未必等于总体均数u各样本均数间存在差异各样本均数间存在差异u样本均数围绕样本均数围绕 =167.69cm呈正态分布呈正态分布u样本均数变异度样本均数变异度( )较原总体个较原总体个 体值变异度体值变异度( = 5.3cm)大大缩小大大缩小cm69. 1SX X78nX 标准差为标准差为 9中心极限定理中心极限定理(central limit theo
4、rem) 若若 X i 服从正态分布服从正态分布 则则 服从正态分布服从正态分布 若若 X i 不服从正态分布不服从正态分布 n大大(n60):则:则 近似服从正态分布近似服从正态分布 n小小(n60) 按按u分布原理分布原理2. 两总体均数之差的可信区间两总体均数之差的可信区间 261.单一总体均数的单一总体均数的1可信区间可信区间StStX,2X,2X , X 双侧双侧(1) 未知未知单侧单侧StStX,X,X X 273.641.151110XS 0.05 2,92.262t故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35, 169.55)cm。=
5、167.7cm 双尾双尾例例 在例在例3-1中抽得第中抽得第15号样本的号样本的 =166.95(cm),S=3.64(cm), 求其总体均数的求其总体均数的95%可信区间。可信区间。 X166.952.2621.1511=164.35169.55(cm)281.单一总体均数的单一总体均数的1可信区间可信区间X,2X,2SX Xuu 或或双侧双侧单侧单侧SuuSuuX,X,X,X,X X X X 或或或或(2) 已知已知或或 未知但未知但n足够大足够大: 29例例 某地抽取正常成年人某地抽取正常成年人200名,测得其血名,测得其血清胆固醇均数为清胆固醇均数为3.64 mmol/L,标准差为,标
6、准差为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。 法,用近似正态分布的方60)/(81. 347. 30849. 096. 164. 320020. 196. 164. 3NLmmol302. 两总体均数之差的两总体均数之差的1可信区间可信区间 双侧双侧21XX,2/21S)XX(t 21XX,2121S)XX()(t 单侧单侧21XX,2121S)XX()(t 31三、可信区间的确切含义三、可信区间的确切含义u从从1999年某市年某市18岁男生身高值总体岁男生身高值总体N(=167.7cm, =5.3cm)中随机抽取中随
7、机抽取100个样本个样本计算了计算了100个估计个估计的的95%CIu其中有其中有95个个CI包含包含了了 有有5个不包含个不包含 =167.7cm20号号 161.00165.57 31号号 161.17167.3354号号 168.05171.00 76号号 167.71174.8482号号 167.98174.2732 -2 -1 0 1 2 来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间示意可信区间示意 u如果能够进行重复抽样试验,平均有如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是的可信区间包含了总体参数,而不是总体参数落在该范围的可
8、能性为总体参数落在该范围的可能性为(1)。u在实际工作中,只能根据一次试验结果计在实际工作中,只能根据一次试验结果计算一个可信区间,算一个可信区间,就认为该区间包含了相应就认为该区间包含了相应总体参数,总体参数,该结论犯错误的概率该结论犯错误的概率 。u可信区间一旦形成,它要么包含总体参数,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。率可言。可信度是事前概率。可信区间的确切含义可信区间的确切含义34u正确性正确性:可信度:可信度1,即区间包含总体参数,即区间包含总体参数 的理论概率大小,愈接近的理论
9、概率大小,愈接近1愈好。愈好。u精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:35四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数只,总体参数只 有一个有一个 。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围, 个体值有很多个体值有很多 。u95%可信区间中的可信区间中的95%是是
10、可信度可信度,即所求可,即所求可 信区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即 所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。3637例例 某医生测量了某医生测量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为血红蛋白含量,算得其均数为130.83g/L,标,标准差为准差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?u样本均数与总体均数间差异的原因:样本均数
11、与总体均数间差异的原因: 1.总体均数不同总体均数不同? 2.总体均数相同,差异由抽样误差造成总体均数相同,差异由抽样误差造成?u统计推断方法统计推断方法 假设检验假设检验(hypothesis test)38u反证法反证法 根据研究目的建立假设根据研究目的建立假设H0,先假,先假设设H0是正确的,再分析样本提供的信息是否是正确的,再分析样本提供的信息是否支持支持H0,即在,即在H0成立的条件下计算检验统成立的条件下计算检验统计量,获得相应计量,获得相应P值,根据值,根据P值大小来判断值大小来判断。u小概率事件原理小概率事件原理 小概率事件小概率事件(P0.05)在一在一次抽样中发生的可能性很
12、小,如果它发生了次抽样中发生的可能性很小,如果它发生了,则有理由怀疑,则有理由怀疑H0的正确性,认为的正确性,认为H1成立成立,该结论可能犯,该结论可能犯5%的错误。的错误。一、假设检验的基本思想一、假设检验的基本思想391.建立检验假设,确定检验水准建立检验假设,确定检验水准(1) H0 零假设零假设(null hypothesis)(2) H1 备择假设备择假设(alternative hypothesis)(3) 检验水准检验水准(size of a test)二、假设检验的基本步骤二、假设检验的基本步骤u针对总体而不是针对样本而言针对总体而不是针对样本而言uH0:某两个总体参数相等,:
13、某两个总体参数相等,仅一种情况仅一种情况 H1: 某两个总体参数不等,某两个总体参数不等,有多种情况有多种情况 H0与与H1的内容不能互换,否则无法决定的内容不能互换,否则无法决定拒绝多种情况中的哪一种情况拒绝多种情况中的哪一种情况40uH0: 1= 2 H1: 1 2 或或 1 t0.05/2,35=2.030 P 0.05按按 =0.05水准,拒绝水准,拒绝H0,接受,接受H1,有统计学,有统计学意义。可认为从事铅作业男性工人的平均血意义。可认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的。红蛋白含量低于正常成年男性的。47-2.0302.0300 =350.0250.025 t
14、0.05/2,35=2.030 P ( |t| 2.030 )=0.05 t 值值(二二)配对样本配对样本t 检验检验(paired t-test) -变量为配对两组之差的变量为配对两组之差的d配对设计配对设计两同质受试对象分别接受两种不同处理两同质受试对象分别接受两种不同处理同一受试对象分别接受两种不同处理同一受试对象分别接受两种不同处理前后测量设计前后测量设计 同一受试对象分别前后接受一种处理同一受试对象分别前后接受一种处理49501.建立检验假设,确定检验水准建立检验假设,确定检验水准 H0: d =0,两种方法的测定结果相同,两种方法的测定结果相同 H1: d0, =0.05 9110
15、925.7101087.002724.0nSdtdd2.计算检验统计量计算检验统计量513.确定确定 P 值,作出推断结论值,作出推断结论t=7.925t0.001/2,9=4.781P0.001按按 =0.05水准,拒绝水准,拒绝H0,接受,接受H1,有统计,有统计学意义。两种方法对脂肪含量的测定结果学意义。两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。不同,哥特里罗紫法测定结果较高。52(三三)两样本两样本t 检验检验(two sample t-test)1.总体方差相等的总体方差相等的 t 检验检验53研究目的:阿卡波糖胶囊降血糖效果研究目的:阿卡波糖胶囊降血糖效果试验设计
16、:同期随机试验设计:同期随机对照对照试验试验受试对象:受试对象:40名名II型糖尿病病人型糖尿病病人试验组:阿卡波糖胶囊试验组:阿卡波糖胶囊对照组:拜唐苹胶囊对照组:拜唐苹胶囊观测指标:试验观测指标:试验8周后空腹血糖下降值周后空腹血糖下降值(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0: 1= 2 H1: 1 2 =0.05 54(2)计算检验统计量计算检验统计量 =n1+n2 2=(20+20 2)=382121XX21XX2121SXXS)()XX(t 642. 0204205. 20601. 36250. 20650. 2 nSSXX)n1n1()1n()1n(S)1
17、n(S)1n(XX )n1n1()1n()1n()XX()XX(XX)n1n1(SXXt22222121212122221121212122221121212C21 5550 .0681.0642.0642.038,2/50 .0Ptt按按 =0.05 水准,不拒绝水准,不拒绝H0,无统计学,无统计学意义。意义。还不能认为还不能认为阿卡波糖胶囊与拜唐阿卡波糖胶囊与拜唐苹胶囊对降低苹胶囊对降低II型糖尿病病人空腹血糖型糖尿病病人空腹血糖的效果的效果不同不同。(3)确定确定P值,作出推断结论值,作出推断结论562.总体方差不相等的总体方差不相等的 t 检验检验 u数据变换后进行数据变换后进行t 检
18、验检验u秩转换的非参数检验秩转换的非参数检验(第第8章章)u近似近似t检验检验 t检验检验57nCochran & Cox法法(1950)对临界值校正对临界值校正nSatterthwaite法法(1946)对自由度校正对自由度校正nWelch法法(1947)对自由度校正对自由度校正1211222212121 1nXXtnSSnnt检验检验58equivalence test for two means 59X例例 研究某新药对高血脂患者胆固醇的降低作研究某新药对高血脂患者胆固醇的降低作用是否用是否相同于相同于标准药物,标准药物,设定设定等效界值等效界值=0.52mmol/L即即 就认为两药物等
19、效就认为两药物等效L/mmol52. 021 60 (1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0: 两药物不等效两药物不等效 H1: 两药物等效两药物等效 =0.05L/mmol52.021 L/mmol52. 021 61(2)计算检验统计量计算检验统计量569. 3)10011021(210010282. 0)1100(89. 0)1102(52. 048. 057. 0)n1n1()1n()1n(S)1n(S)1n(XXSXXt22212122221121XX2121 =n1+n2 2=102+100 2=20062 t =3.569t0.001/2,200=3.34
20、0 P 0.001。按按 =0.05水准,水准,拒绝拒绝H0,接受,接受H1,有统计学意义。,有统计学意义。新药与标准药物对降低胆固醇的疗效相同新药与标准药物对降低胆固醇的疗效相同(3)确定确定P 值,作出推断结论值,作出推断结论63u值须在等效试验前根据专业知识予以确定值须在等效试验前根据专业知识予以确定应用等效检验的注意事项应用等效检验的注意事项研究者可把专业上或公认有临床实际意义研究者可把专业上或公认有临床实际意义的差值作为等效界值的差值作为等效界值 。如:。如:血压血压 值为值为0.67kPa(5mmHg),胆固醇胆固醇 值为值为0.52mmol/L(20mg/dl),白细胞白细胞 值
21、为值为0.5 109/L(500个个/mm3)。难以确定时可用难以确定时可用0.2 0.5倍标准差作为参考倍标准差作为参考6465一、一、I型错误和型错误和II型错误型错误66 健康人与肝病病人的肝大指数分布健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制)面积绘制)肝肝 大大 指指 数数健康人健康人H0肝病病人肝病病人H1第一类错误第一类错误误诊率误诊率 (假阳性率假阳性率)第二类错误第二类错误b漏诊率漏诊率 (假阴性率假阴性率) 6.1 7.0 8.456891011 4 大,大,b b小;小;b b大,大, 小。增加小。增加n可同时缩小可同
22、时缩小 ,b b。 u 可取单尾亦可取双尾可取单尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用b b表示表示, b b只取单尾,只取单尾,b b值的大小一般未知,须在知道两总体差值的大小一般未知,须在知道两总体差值值 (如如 12等等)、 及及n 时,才能算出。时,才能算出。u1bb称称检验效能检验效能(power of a test),过去称把,过去称把握度。为当两总体确有差异,按检验水准握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。所能发现该差异的能力。1bb只取单尾。只取单尾。u拒绝拒绝H0,只可能犯,只可能犯I型错误,不可能犯型错误,不可能犯II型型错误;不拒绝
23、错误;不拒绝H0,只可能犯,只可能犯II型错误,不型错误,不可能犯可能犯I型错误。型错误。 68二、假设检验应注意的问题二、假设检验应注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡,具有可比性,除对比的主要因组间应均衡,具有可比性,除对比的主要因素素(如临床试验用新药和对照药如临床试验用新药和对照药)外,其它可外,其它可能影响结果的因素能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。69u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计量资料:完全随机设计两样本计量资料
24、:小样本小样本(任一任一ni60)且方差齐且方差齐: 两样本两样本t检验检验 方差不齐方差不齐: 近似近似t 检验检验大样本大样本(所有所有ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法703.正确理解正确理解“significance”一词的含义一词的含义u过去称差别有或无过去称差别有或无“显著性显著性”,易造成,易造成两两 样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”, 相应推断为:可以认为或还不能认为两相应推断为:可以认为或还不能认为两 个或多个总体参数有差别。个或多个
25、总体参数有差别。714.结论不能绝对化结论不能绝对化 u因统计结论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、 “一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的 值,尽量写出具体值,尽量写出具体P值,而不简单写成值,而不简单写成 P0.05,以便读者与同类研究进行比,以便读者与同类研究进行比 较或进行循证医学时采用较或进行循证医学时采用Meta分析。分析。725.统计统计“有意义有意义”与医学与医学“有意义有意义” u统计统计“有意义有意义”对应统计结论,医学对应统计结论,医学“有有意意 义义”对应专业结论
26、。对应专业结论。u统计结论有意义,专业结论无意义,最终统计结论有意义,专业结论无意义,最终 结论没有意义,样本含量过大或设计存在结论没有意义,样本含量过大或设计存在 问题。问题。u统计结论无意义,专业结论有意义,检查统计结论无意义,专业结论有意义,检查 设计是否合理、样本含量是否足够。设计是否合理、样本含量是否足够。736.可信区间与假设检验区别和联系可信区间与假设检验区别和联系u可信区间可回答假设检验问题可信区间可回答假设检验问题 H0: = 0=140g/L 铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等白含量与正常成年男性的相等 H1: 0 =0.05
27、铅作业男性工人平均血红蛋白含量铅作业男性工人平均血红蛋白含量总体总体 均数均数 的的95%CI为为(122.12,139.54) g/L, 未包括未包括 0=140g/L 按按 =0.05水准,拒绝水准,拒绝H0 ,接受,接受H1。 74u可信区间说明可信区间说明量的大小量的大小即推断总体均数即推断总体均数 所在范围,假设检验推断所在范围,假设检验推断质的不同质的不同即判即判 断两总体均数是否不等。断两总体均数是否不等。u可信区间不但能回答差别有无统计学意可信区间不但能回答差别有无统计学意 义,还能提示差别有无实际专业意义。义,还能提示差别有无实际专业意义。u可信区间不能够完全代替假设检验。可
28、可信区间不能够完全代替假设检验。可 信区间只能在预先规定概率信区间只能在预先规定概率 的前提下的前提下 进行计算,而假设检验能获得一较为确进行计算,而假设检验能获得一较为确 切的切的P值。值。7576两小样本两小样本t 检验前提条件:检验前提条件:相应的两总体为正态总体相应的两总体为正态总体两总体方差相等,即方差齐性两总体方差相等,即方差齐性配对配对t 检验前提条件:检验前提条件:每对数据每对数据差值差值的总体为正态总体的总体为正态总体77一、正态性检验一、正态性检验(了解了解)1.图示法图示法u概率图概率图(probability-probability plot)以实际累积频率以实际累积频
29、率(X)对正态分布理论累积频率对正态分布理论累积频率(Y)作散点图作散点图u分位数图分位数图(quantile-quantile plot)以实际分位数以实际分位数(X)对正态分布理论分位数对正态分布理论分位数 ( )作散点图作散点图u如果实际值与理论值吻合,图中散点几乎如果实际值与理论值吻合,图中散点几乎都在一直线上,可认为该资料服从正态分布都在一直线上,可认为该资料服从正态分布 S/ )XX(Y 78Normal Q-Q Plot of 100个样本均数(cm)Observed Value174172170168166164162Expected Normal3210-1-2-3(168-
30、167.69)/1.69=0.18(164-167.69)/1.69=-2.18(172-167.69)/1.69=2.55792.计算法计算法u偏度偏度(skewness)指分布不对称的程度和方向指分布不对称的程度和方向,用偏度系数,用偏度系数(总体总体: 1 样本样本:g1)衡量。衡量。 1=0 对称对称 10 正偏态正偏态 10 负偏态负偏态u峰度峰度(kurtosis)指分布与正态曲线相比的冒指分布与正态曲线相比的冒尖或扁平程度,用峰度系数尖或扁平程度,用峰度系数(总体总体: 2 样本样本:g2)衡量。衡量。 2=0 正态峰正态峰 20 尖峭峰尖峭峰 20 平阔平阔峰峰u当同时满足对称和正态峰两个条件时,才能当同时满足对称和正态峰两个条件时,才能认为该资料服从正态分布。认为该资料服从正态分布。80u对偏度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东引进创新创业团队合同书
- 投影仪购销合同书
- 中国公路运输合同
- 型钢采购合同协议
- 家教老师聘用合同书
- 玻璃幕墙安装合同
- 商品买卖居间合同
- 美国工程设计服务合同
- 侧柏买卖合同
- 辽宁轻工职业学院《建筑设备(电)》2023-2024学年第二学期期末试卷
- 2023CSCO非小细胞肺癌诊疗指南解读
- 利息理论期末考试模拟测试试题含参考答案
- 干部选拔任用程序
- 部编人教版五年级下册道德与法治简答题归纳总结
- 2023高二开学第一课《蜕变》-主题班会
- 口服降糖药物分类详解课件
- 二级生物安全实验室设计建造与运行管理指南
- 围手术期疼痛护理课件
- 外国新闻传播史-张昆课件
- 圆圈正义:作为自由前提的信念
- 一次性纤维环缝合器
评论
0/150
提交评论