医学统计(03)_第1页
医学统计(03)_第2页
医学统计(03)_第3页
医学统计(03)_第4页
医学统计(03)_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学(医学统计学(3)季聪华季聪华2012.10.112012.10.11概率分布概率分布参数估计与假设检验参数估计与假设检验EPIDATAEPIDATA数据管理软件数据管理软件概率分布概率分布第一节第一节 正态分布正态分布第二节第二节 二项分布和二项分布和PoissonPoisson分布分布第三节第三节 抽样分布抽样分布第一节第一节 正态分布正态分布正态分布是生物医学和统计学上极其重要正态分布是生物医学和统计学上极其重要的一种分布,医学研究的很多指标都服从的一种分布,医学研究的很多指标都服从或近似服从正态分布。或近似服从正态分布。在统计学上,很多分布都是由正态分布导在统计学上,很多分布

2、都是由正态分布导出,同时正态分布又是多种分布的极限分出,同时正态分布又是多种分布的极限分布。布。一、正态分布的概念一、正态分布的概念正态分布正态分布( normal distribution)( normal distribution):是描述连:是描述连续型随机变量最重要的分布。其分布曲线续型随机变量最重要的分布。其分布曲线叫正态分布曲线,呈中间高,两边低,左叫正态分布曲线,呈中间高,两边低,左右基本对称的右基本对称的“钟型钟型”曲线,又称高斯分曲线,又称高斯分布(布(Gauss distributionGauss distribution)。)。正态分布由德国数学家正态分布由德国数学家 G

3、auss Gauss 在描述误差分布时所发现,并在描述误差分布时所发现,并加以推广,所以通常称为加以推广,所以通常称为高斯高斯分布分布( (Gauss distribution)Gauss distribution)。高高 斯斯10马克的钱币马克的钱币 +,21=)(222/)-(XeXfX总体均数总体均数总体标准差总体标准差正态分布的公式正态分布的公式 和和是正态分布的两个参数,是正态分布的两个参数,和和决定了决定了x的概率分布;习惯上用的概率分布;习惯上用 N (, 2)表示均数为表示均数为,标,标准差为准差为的正态分布。的正态分布。二、正态分布的特征二、正态分布的特征(1)(1)集中性:

4、集中性:正态分布是一条单峰分布,高正态分布是一条单峰分布,高峰位置在均数处。峰位置在均数处。 (2)(2)对称性:对称性:正态分布以均数为中心,左右正态分布以均数为中心,左右完全对称。完全对称。(3)(3)正态分布曲线的正态分布曲线的形态形态取决于两个参数,取决于两个参数,即总体均数即总体均数和总体标准差和总体标准差。(4)(4)正态分布曲线下的面积分布具有一定的正态分布曲线下的面积分布具有一定的规律性规律性。当当固定不变时,固定不变时,越大,曲线沿横轴越大,曲线沿横轴越向右移动;反之,越向右移动;反之, 越小,则曲线沿横轴越向左移越小,则曲线沿横轴越向左移动,所以动,所以叫正态曲线叫正态曲线

5、N(, 2)的)的位置参数位置参数, 。1. 位置参数:位置参数: 正态分布位置随参数正态分布位置随参数变换示意图变换示意图=1=1.5=22. 形状参数形状参数:正态分布形态随参数正态分布形态随参数变换示意图变换示意图 当当固定不变时,固定不变时,越大,曲线越平阔;越大,曲线越平阔; 越小,曲线越尖峭,越小,曲线越尖峭, 叫正态曲线叫正态曲线N(, 2)的)的形形状参数状参数。 三、正态分布面积分布规律三、正态分布面积分布规律(1 1)正态分布曲线与横轴所夹面积为)正态分布曲线与横轴所夹面积为1 1。(2 2)区间在()区间在(-, + +)内的面积或概率)内的面积或概率为为0.6830.6

6、83,此区间之外概率为,此区间之外概率为0.3170.317,左右两侧各,左右两侧各0.15850.1585。(3 3)区间在()区间在(-1.96-1.96, +1.96 +1.96)内的面)内的面积或概率为积或概率为0.950.95,此区间之外概率为,此区间之外概率为0.050.05,左右,左右两侧各两侧各0.0250.025。(4 4)区间在()区间在(-2.58-2.58, +2.58 +2.58)内的面)内的面积或概率为积或概率为0.990.99,此区间之外概率为,此区间之外概率为0.010.01,左右,左右两侧各两侧各0.0050.005。 正态分布应用于以下正态分布应用于以下 3

7、 3 个方面:个方面:1. 1.制定医学参考值范围制定医学参考值范围2.2.质量控制质量控制3.3.统计方法的理论基础统计方法的理论基础四、正态分布的应用四、正态分布的应用1. 1.制定医学参考值范围制定医学参考值范围 参考值范围参考值范围(reference range)reference range):指所谓:指所谓“正常人正常人”的解剖、生理、生化等指标的波动范围。的解剖、生理、生化等指标的波动范围。制定方法:制定方法:制定参考值范围时,首先要制定参考值范围时,首先要确定一批样本含量确定一批样本含量足够大足够大的的“正常人正常人”。测量测量样本人群相应指标的值,测量的过程中要样本人群相应

8、指标的值,测量的过程中要严格控制各种误差。严格控制各种误差。而后而后根据指标的实际用途确定单侧或双侧界值根据指标的实际用途确定单侧或双侧界值,根据研究目的和使用要求选定适当的百分界值,根据研究目的和使用要求选定适当的百分界值,常用常用95%95%。单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。双侧临界值:标准正态分布双侧尾部面积之和等于时所对应的正侧变量值,记作Z/2。以不同的方法计算参考值范围:以不同的方法计算参考值范围: 举例1:调查某地120名健康女性血红蛋白,直方图显示其分布近似正态,均数 X =117.4, 标准差S =10.2 ,试估计该地 健康女性血红蛋白

9、的95%参考值范围。 解析: 1. 分布近似正态2. 过高过低均为异常3. 求上、下界值正态分布法求参考值范围设定双侧界值)/(39.137=2 .1096. 1+4 .117=96. 1+lgsx上界:)/(41.97=2 .1096. 1-4 .117=96. 1-lgsx下界:所以,该地健康女性血红蛋白的所以,该地健康女性血红蛋白的95%参考值范围是参考值范围是(97.41,137.39)g/l。 举例2: 某地调查120名健康成年男性的第一秒肺通气量得均数 X =4.2(L), 标准差S =0.7(L),试据此估计其第一秒肺通气量的95%参考值范围。 解析: 1. 分布近似正态2. 仅

10、过低为异常3. 求下界值正态分布法求参考值范围单侧下限下界:所以,该地健康成年男子第一秒肺通气量的所以,该地健康成年男子第一秒肺通气量的95%参考值参考值范围为不低于范围为不低于3.05(L)。)。 05L. 3=7 . 064. 1-2 . 4=64. 1-SX2.质量控制质量控制基本原理:基本原理:许多临床检验指标,当影响某一指标的随许多临床检验指标,当影响某一指标的随机因素很多,而每个因素所起的作用均不机因素很多,而每个因素所起的作用均不太大时,这个指标的太大时,这个指标的随机波动随机波动属于随机误属于随机误差,则往往差,则往往服从正态分布服从正态分布。质量控制领域的质量控制领域的“3

11、3原则原则”:其意义是指其意义是指正常情况下检测误差服从正态分布,根据正常情况下检测误差服从正态分布,根据正态分布的曲线面积或概率分布理论可知,正态分布的曲线面积或概率分布理论可知,3 3之外的观察值出现的概率不到之外的观察值出现的概率不到33,如,如果超过这一值,则提示测量或产品质量有果超过这一值,则提示测量或产品质量有问题。问题。统计学规定:统计学规定:以以x x为中心线,为中心线,x x2S 2S 为警戒为警戒线,线,x x3S3S为控制线,根据以上的规定还可为控制线,根据以上的规定还可以绘制出质量控制图。以绘制出质量控制图。中心线中心线警戒线警戒线控制线控制线控制线控制线警戒线警戒线3

12、.3.统计方法的理论基础统计方法的理论基础 t t 分布、分布、F F 分布、分布、x2分布都是在正态分布的基分布都是在正态分布的基础上推导出来的,础上推导出来的,u u 检验也是以正态分布为基检验也是以正态分布为基础的。础的。二项分布、二项分布、PoissonPoisson分布的极限为正态分布,分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。在一定条件下,可以按正态分布原理来处理。第二节第二节 二项分布和二项分布和PoissonPoisson分布分布变量类型为二分类时,变量均现为两个对变量类型为二分类时,变量均现为两个对立的可能结果,每个个体的观察结果只能立的可能结果,每个个体

13、的观察结果只能取其中之一,这类变量需按二项分布取其中之一,这类变量需按二项分布(binomial distribution)(binomial distribution)规律进行统计分析。规律进行统计分析。毒性试验:白鼠毒性试验:白鼠 死亡死亡生存生存临床试验:病人临床试验:病人 治愈治愈未愈未愈临床化验:血清临床化验:血清 阳性阳性阴性阴性事件事件 成功(成功(A)失败(非失败(非A)这类这类“成功成功失败型失败型”试验称为试验称为Bernoulli试试验。验。一、二项分布一、二项分布( (一一) )二项分布的概念二项分布的概念【例【例3-13-1】临床上用针灸治疗某型头痛,有效】临床上用针

14、灸治疗某型头痛,有效率为率为60%60%,现以该法治疗,现以该法治疗3 3例,其中例,其中2 2例有效例有效的概率是多大的概率是多大? ?有效的概率是有效的概率是0.6 0.6 无效的概率是无效的概率是0.4 0.4 3 3人接受针灸治疗后的有效和无效的所有可能组合,人接受针灸治疗后的有效和无效的所有可能组合,就排列方式而言有就排列方式而言有8 8 种;如只计算有效或无效的种;如只计算有效或无效的数目而不考虑其顺序时,则只有数目而不考虑其顺序时,则只有 4 4 种组合。种组合。又由于结果是独立的,病例间互不影响,则根据又由于结果是独立的,病例间互不影响,则根据概率的乘法法则可以计算各种排列的连

15、乘概率,概率的乘法法则可以计算各种排列的连乘概率,再根据概率的加法法则,可以算出无效数或有效再根据概率的加法法则,可以算出无效数或有效数分别为数分别为0 0、1 1 、2 2 、3 3 时的概率。时的概率。SPSS计算 ( (二二) )二项分布的特征二项分布的特征【例【例3-23-2】大样本研究显示,某中药制剂不良反应发】大样本研究显示,某中药制剂不良反应发生率为生率为5%5%,现随机抽取,现随机抽取5 5人服用此药,试求:人服用此药,试求:其中其中mm个人个人(m=0(m=0、1 1、2 2、3 3、4 4、5)5)有反应的概率。有反应的概率。至多有至多有2 2人有反应的概率。人有反应的概率

16、。有人有反应的概率。有人有反应的概率。至多有至多有2人反应的概率:人反应的概率: P(X2)=P(0)+P(1) +P(2)有人反应的概率:有人反应的概率: P(X1)=1-P(0)SPSS计算PDF.BINOM(m,5,0.05)总体发生率总体发生率抽样人抽样人数数发生数发生数 PDF.BINOM(quant,n,prob)PDF.BINOM(quant,n,prob)。数值。返回当每次。数值。返回当每次试验的成功概率是试验的成功概率是prob prob 时,时,n n次试验中的成功次试验中的成功次数将等于次数将等于quantquant的概率。当的概率。当n n为为1 1时,这等同于时,这等

17、同于 PDF.BERNOULLIPDF.BERNOULLI。CDF.BINOM(m,5,0.05)总体发生率总体发生率抽样人抽样人数数发生数发生数 CDF.BINOM(quant,n,prob)CDF.BINOM(quant,n,prob)。数值。返回。数值。返回n n次试次试验(每次成功的概率为验(每次成功的概率为probprob)中成功次数将小)中成功次数将小于等于于等于quantquant的累积概率。当的累积概率。当n n为为1 1时,这等同于时,这等同于 CDF.BERNOULLICDF.BERNOULLI。3 3、二项分布的图形和正态近似、二项分布的图形和正态近似(1)(1)二项分布

18、的图形:二项分布的图形:如果已知如果已知n n和和,则按二项,则按二项分布概率公式可计算出不同的分布概率公式可计算出不同的X X取值时的概率,取值时的概率,我们可以用我们可以用X X为横轴,取值概率为横轴,取值概率 P P为纵轴,可绘制为纵轴,可绘制出二项分布的图形。出二项分布的图形。不难发现,二项分布的图形是一个离散型分布,不难发现,二项分布的图形是一个离散型分布,其形状决定于两个参数其形状决定于两个参数n n和和,当,当为为0.50.5时,图时,图形对称;当形对称;当不等于不等于0.50.5时,图形呈偏态,但当样时,图形呈偏态,但当样本量增大时,图形逐渐趋于对称。本量增大时,图形逐渐趋于对

19、称。 4 8 12 16 0 2 4 0 2 4 6 4 8 12 16 X 0.0 0.1 0.2 0.3 0.4 n =20 =0.5 n =5 =0.3 n =10 =0.3 n =30 =0.3 P(X) SPSSSPSS演示二项分布图概念演示二项分布图概念 (2)(2)二项分布的正态近似:二项分布的正态近似:根据统计学上的中心极限定理,当根据统计学上的中心极限定理,当n n较大,较大,且且nn与与n(1-)n(1-)较接近时,二项分布将接近较接近时,二项分布将接近于正态分布。于正态分布。当当n n趋向无穷大时,二项分布趋向无穷大时,二项分布B(nB(n,)的极的极限分布就是正态分布限

20、分布就是正态分布NnNn,n(1-)n(1-)。一般地说,如果一般地说,如果nn与与n(1-)n(1-)大于大于5 5时,即时,即可用正态分布近似原理处理二项分布问题,可用正态分布近似原理处理二项分布问题,以简化计算。以简化计算。( (三三) )二项分布的应用二项分布的应用 在应用二项分布时,必须注意其在应用二项分布时,必须注意其应用条件应用条件:(1)(1)二项分布中的观察单位数通常是事先确定的。二项分布中的观察单位数通常是事先确定的。(2)(2)各观察单位各观察单位只有互相对立的两种结果只有互相对立的两种结果,如成功,如成功与失败、生存和死亡等。与失败、生存和死亡等。(3)(3)若两种对立

21、结果中的一种结果若两种对立结果中的一种结果( (阳性阳性) )的概率为的概率为,则其对立结果的概率为,则其对立结果的概率为1-1-。实际工作中总。实际工作中总体概率体概率往往是未知的,但可以往往是未知的,但可以从大量观察中获从大量观察中获得的比较稳定的样本频率作为总体概率的估计值得的比较稳定的样本频率作为总体概率的估计值。(4)(4)n n个观察单位的观察结果相互独立个观察单位的观察结果相互独立。即观察单。即观察单位之间发现的结果不能互相影响,如要求疾病无位之间发现的结果不能互相影响,如要求疾病无传染性、无家族聚集性。传染性、无家族聚集性。【例【例 3 -3】大样本调查显示,新生儿畸形发生率为

22、】大样本调查显示,新生儿畸形发生率为1%,现随机调查某地,现随机调查某地 500 名新生儿,其中只有名新生儿,其中只有1例例发生畸形,问该地新生儿畸形发生率是否低于一般。发生畸形,问该地新生儿畸形发生率是否低于一般。首先计算首先计算500500名新生儿发生名新生儿发生1 1例畸形的概率例畸形的概率 P P(X1X1)= P= P(0 0)+ P+ P(1 1)=0.0398=0.0398说明当地至多发生说明当地至多发生1 1例畸形的概率是例畸形的概率是0.03980.0398,小于小于0.050.05,是小概率事件。所以可以认为当,是小概率事件。所以可以认为当地新生儿畸形发生率不等于地新生儿畸

23、形发生率不等于1%1%。互相之间的高与低,通过互相之间的高与低,通过1/500=0.0020.011/500=0.00250X50时,可按近似正态原理计算时,可按近似正态原理计算可信区间,公式为:可信区间,公式为:【例【例4-74-7】用计数器测得某放射性物质】用计数器测得某放射性物质1010分钟内分钟内发出的脉冲数为发出的脉冲数为500500,求每,求每1010分钟脉冲计数的总分钟脉冲计数的总体均数的体均数的95%95%可信区间。可信区间。第二节第二节 假设检验假设检验一、假设检验的基本思想一、假设检验的基本思想假设检验假设检验(hypothesis testing)(hypothesis

24、testing)又称又称显著性检显著性检验验(significance test)(significance test),其基本思想是:先提,其基本思想是:先提出两总体相等的假设,然后看实际抽到的出两总体相等的假设,然后看实际抽到的样本与已知总体差异是否属样本与已知总体差异是否属小概率事件小概率事件(p0.05p0.05),),若不属小概率事件则接受原若不属小概率事件则接受原假设,若属小概率事件则拒绝原假设。假设,若属小概率事件则拒绝原假设。二、假设检验步骤二、假设检验步骤 1. 1.建立假设、确定检验水准建立假设、确定检验水准(1)(1)零假设或无效假设:零假设或无效假设: H H0 0:=

25、0 0,即两,即两总体均数相同。总体均数相同。(2)(2)备择假设或有统计学意义假设备择假设或有统计学意义假设H H1 1:0 0,即两总体均数不同。根据专业知,即两总体均数不同。根据专业知识及数据特征,备择假设识及数据特征,备择假设H H1 1 也有单侧形式:也有单侧形式:0 0 。选择双侧检验,还是单侧检验需依据数据选择双侧检验,还是单侧检验需依据数据特征和专业知识进行确定。特征和专业知识进行确定。 2.2.选择检验方法、计算统计量选择检验方法、计算统计量假设检验的方法应针对不同研究目的、设假设检验的方法应针对不同研究目的、设计及资料的类型选定,并计算相应的检验计及资料的类型选定,并计算相

26、应的检验统计量。统计量。如在总体方差已知的情况下,进行两均数如在总体方差已知的情况下,进行两均数的比较用的比较用z z检验或检验或u u检验;在总体方差未知检验;在总体方差未知情况下,进行两均数的比较用情况下,进行两均数的比较用 t t 检验等。检验等。 3.3.确定确定P P值、作出推论值、作出推论根据计算的检验统计量,确定根据计算的检验统计量,确定P P值,值,P P值是值是在在H H0 0成立的情况下随机抽样,获得大于及成立的情况下随机抽样,获得大于及等于或等于或( (和和) )小于及等于现有样本资料求得的小于及等于现有样本资料求得的检验统计量的概率。检验统计量的概率。三、假设检验的两类

27、错误三、假设检验的两类错误假设检验可帮助我们判断两总体假设检验可帮助我们判断两总体与与0 0是是否相等的问题。但无论是接受否相等的问题。但无论是接受H H0 0或拒绝或拒绝H H0 0( (接受接受H H1 1) )的统计推断,都有一定程度上的统计推断,都有一定程度上犯错误的可能,常概括为第一类错误和第犯错误的可能,常概括为第一类错误和第二类错误二类错误( (或称或称I I型错误和型错误和II II型错误型错误) )。1.I1.I型错误型错误(type I error)(type I error) 用用表示,是指表示,是指H H0 0原本是正确的,但正确的原本是正确的,但正确的H H0 0被被

28、拒绝拒绝( (接受接受H1)H1)所犯的错误称为所犯的错误称为I I型错误,故又称假型错误,故又称假阳性率、误诊率,即弃真错误。阳性率、误诊率,即弃真错误。也就是说,当也就是说,当定为小概率定为小概率0.050.05时,如时,如H H0 0 原本正原本正确,即两总体参数相同,那么在确,即两总体参数相同,那么在100100次抽样推断中次抽样推断中有有9595次的可能会接受次的可能会接受H H0 0的正确判断,也会有的正确判断,也会有5 5次次的可能会拒绝的可能会拒绝H H0 0的不正确判断,这就是的不正确判断,这就是允许犯允许犯I I型型错误的概率为错误的概率为0.050.05,即,即=0.05

29、=0.05。必要时也可取。必要时也可取= 0.01= 0.01或或=0.10=0.10。2.II2.II型错误型错误(type II err(type II err)用用表示,是指表示,是指H H0 0原本是不正确的,但错原本是不正确的,但错误的误的H H0 0被接受了所犯的错误称为被接受了所犯的错误称为II II型错误,型错误,故又称假阴性率、漏诊率,即取伪错误。故又称假阴性率、漏诊率,即取伪错误。也就是说,当也就是说,当定为定为0.100.10时,如时,如H H0 0原本不原本不正确,即两总体参数不同,那么在正确,即两总体参数不同,那么在100100次抽次抽样推断中有样推断中有 9090次

30、的可能会拒绝次的可能会拒绝H H0 0接受接受H H1 1的的正确判断,也有正确判断,也有10 10 次的可能会接受次的可能会接受H H0 0的不的不正确判断,正确判断,这就是允许犯这就是允许犯 II II型错误的概率为型错误的概率为0.100.10,即,即=0.10=0.10。根据专业需要或研究性质不同也可取根据专业需要或研究性质不同也可取=0.20=0.20。接受接受 H Ho o真实真实H Ho o 对对H Ho o 错错I I类错误类错误 (-风险)风险)IIII类错误类错误 (-风险)风险)正确正确正确正确拒绝拒绝 H Ho o3 .3 .检验效能检验效能( power of tes

31、t )( power of test )(1) 1-(1) 1-表示表示 H H 0 0原本成立,按原本成立,按检验水准和检验水准和样本信息作出接受样本信息作出接受H H 0 0正确判断的能力,称正确判断的能力,称可信度。可信度。(2) 1-(2) 1-表示表示H H0 0原本不成立,按原本不成立,按检验水准检验水准和样本信息作出接受和样本信息作出接受H H1 1正确判断的能力,正确判断的能力,称为检验效能或把握度。当称为检验效能或把握度。当=0.10=0.10,此时,此时检验效能为检验效能为0.90.9或或90%90%。4.4.检验效能(把握度)的影响因素检验效能(把握度)的影响因素(1)(

32、1)总体参数间差异总体参数间差异越大,检验效能越高或把握度越大,检验效能越高或把握度越大。因越大。因| |-0 0| |越大,得到越大,得到|x-|x-0 0| |越大的概率越大的概率越高,同时增大拒绝越高,同时增大拒绝H H0 0接受接受H H1 1的机会。的机会。(2)(2)个体差异或个体差异或标准差标准差越小,检验效能越高或把握越小,检验效能越高或把握度越大。因标准差与标准误成正比,而与检验统度越大。因标准差与标准误成正比,而与检验统计量计量z z成反比。成反比。(3)(3)样本含量样本含量n n越大,检验效能越高或把握度越大。越大,检验效能越高或把握度越大。因标准误与标准差成正比而与因

33、标准误与标准差成正比而与n n成反比。成反比。(4)(4)检验水准检验水准越大越大,检验效能越高或把握度越大。,检验效能越高或把握度越大。因为因为n n一定时,一定时,与与呈反向变化,呈反向变化,增大,增大,减减小,小,1- 1-增大,故增大增大,故增大可提高检验效能。可提高检验效能。四、假设检验的注意事项四、假设检验的注意事项1. 1.严密的抽样设计严密的抽样设计差异比较是建立在同质基础上的,差异比较是建立在同质基础上的,同质同质是假设检是假设检验的前提条件,实际上就是要保证样本或比较组验的前提条件,实际上就是要保证样本或比较组间的均衡可比性,即要求除了对比的因素外,其间的均衡可比性,即要求

34、除了对比的因素外,其它影响结果的因素应尽可能相同或基本相近。其它影响结果的因素应尽可能相同或基本相近。其具体实施方法是具体实施方法是严格做到随机抽样和控制混杂因严格做到随机抽样和控制混杂因素素,严密科研设计和抽样设计。,严密科研设计和抽样设计。2.2.检验方法的选择检验方法的选择各种类别的假设检验和检验统计量的方法很多,各种类别的假设检验和检验统计量的方法很多,因此因此所选用的检验方法必须符合其适用条件。所选用的检验方法必须符合其适用条件。这这些条件主要包括研究目的、设计方法、资料类型、些条件主要包括研究目的、设计方法、资料类型、样本含量等。样本含量等。3.P3.P值的大小并不表示实际差别的大

35、小值的大小并不表示实际差别的大小若若 PP,则拒绝则拒绝H H0 0接受接受H H1 1,这只说明,这只说明| |- - 0 0|0|0,并不能根据,并不能根据P P值的大小判别值的大小判别与与0 0或或x x与与0 0 之间的具体差别大小;之间的具体差别大小;P P值越小只能说明作出拒绝值越小只能说明作出拒绝H H0 0,接受,接受H H1 1的推的推论时犯错误的机会越小,与论时犯错误的机会越小,与| |-0 0| |或或|x-|x-0 0| |的大小无关。的大小无关。如如P0.01P0.01比比P0.05P0.05更有理由拒绝更有理由拒绝H H0 0,接,接受受H H1 1,并不表示,并不

36、表示P0.01P0.01时,时,与与0 0或或x x与与0 0之间实际差别比之间实际差别比P0.05P0.05时时与与0 0或或x x与与0 0之间实际差别更大。之间实际差别更大。 4.4.假设检验的推断结论不能绝对化假设检验的推断结论不能绝对化(1)(1)假设检验中是否接受假设检验中是否接受H H0 0不仅决定于总体不仅决定于总体间是否相同,而且与抽样误差的大小、样间是否相同,而且与抽样误差的大小、样本例数的多少、检验水准的高低以及单双本例数的多少、检验水准的高低以及单双侧检验都有关。侧检验都有关。(2)(2)若统计结论和专业结论一致,则最终结若统计结论和专业结论一致,则最终结论也一致;若论

37、也一致;若统计结论和专业结论不一致,统计结论和专业结论不一致,则最终结论需根据专业知识而定则最终结论需根据专业知识而定。判断被判断被试因素的有效性时,要求在统计上和专业试因素的有效性时,要求在统计上和专业上都有意义。上都有意义。5.5.可信区间与假设检验的关系可信区间与假设检验的关系统计推断中的可信区间估计与假设检验的统计推断中的可信区间估计与假设检验的具体含义、思路和作用各有不同,但目的具体含义、思路和作用各有不同,但目的一致,相互补充,尤其在统计检验方面有一致,相互补充,尤其在统计检验方面有异曲同工异曲同工或或相互验证相互验证的功效。的功效。(1)(1)可信区间兼具参数估计和假设检验双重可

38、信区间兼具参数估计和假设检验双重功效功效(2)(2)可信区间比假设检验有可能提供更多信可信区间比假设检验有可能提供更多信息之处:息之处: 可信区间不但能回答差别有无统可信区间不但能回答差别有无统计学意义,还能提示差别有无实际意义。计学意义,还能提示差别有无实际意义。 - -均有统计学意义,其中:均有统计学意义,其中:提示既有统计学意义又提示既有统计学意义又有实际意义。有实际意义。提示有统计学意义,也可能有实际意义。提示有统计学意义,也可能有实际意义。提示仅有统计学意义,而无实际意义。提示仅有统计学意义,而无实际意义。 、均无统计学意义,其中:均无统计学意义,其中:可信区间包含有实际意可信区间包

39、含有实际意义的界值和义的界值和H0H0,提示可能样本太小,抽样误差太大,以下,提示可能样本太小,抽样误差太大,以下但包含但包含H0H0,提示既无统计学意义,也无实际意义。尚难作,提示既无统计学意义,也无实际意义。尚难作出结论。出结论。可信区间的上限在有实际意义的界值以下但包可信区间的上限在有实际意义的界值以下但包含含H0H0,提示既无统计学意义,也无实际意义。,提示既无统计学意义,也无实际意义。(3)(3)可信区间不能完全取代假设检验可信区间不能完全取代假设检验可信区间用作假设检验只能在规定的可信区间用作假设检验只能在规定的水准上揭水准上揭示差异有无统计学意义。而不能象假设检验那样示差异有无统

40、计学意义。而不能象假设检验那样得到精确的概率得到精确的概率p p。所以,把可信区间与假设检验。所以,把可信区间与假设检验结合起来,互相补充,才是完整的分析。结合起来,互相补充,才是完整的分析。因此在结果报告时,同时显示假设检验的检验统因此在结果报告时,同时显示假设检验的检验统计量值、计量值、P P值和可信区间的信息为宜。值和可信区间的信息为宜。参数估计参数估计假设检验假设检验五、假设检验的分类五、假设检验的分类根据是否正态分布:根据是否正态分布:分参数检验和非参数分参数检验和非参数检验检验根据处理因素根据处理因素:分单因素分析和多因素分:分单因素分析和多因素分析析根据比较类型:根据比较类型:分

41、优效性、等效性和非劣分优效性、等效性和非劣效性。效性。六、常用假设检验方法的选择六、常用假设检验方法的选择两均数两均数比较比较样本与总体比较样本与总体比较样本均数与总体均数比较的样本均数与总体均数比较的t检验检验两样本两样本比较比较配对配对资料资料配对配对t检验检验符号秩和检验符号秩和检验非配对非配对资料资料两独立样本比较的两独立样本比较的t检验检验两组资料的秩和检验两组资料的秩和检验中位数检验中位数检验多组均多组均数比较数比较完全随机设计资完全随机设计资料料单因素方差分析单因素方差分析H检验,多个样本两两比较的秩和检验检验,多个样本两两比较的秩和检验配伍组设计资料配伍组设计资料两因素方差分析

42、两因素方差分析M检验检验拉丁方设计资料拉丁方设计资料三向方差分析三向方差分析正交设计正交设计多向方差分析多向方差分析多因素分析多因素分析一般方法:一般方法:判别分析、聚类分析、主成分判别分析、聚类分析、主成分分析、因子分析、典型相关分析分析、因子分析、典型相关分析回归分析:回归分析:直线回归、多元回归、逐步回直线回归、多元回归、逐步回归归曲线拟合与非线性回归:曲线拟合与非线性回归:曲线拟合、曲线拟合、Cox 回归、回归、 Logistic 回归回归六、常用假设检验方法的选择六、常用假设检验方法的选择无序无序资料资料两样本比较两样本比较卡方检验,四格表精确概率法卡方检验,四格表精确概率法配对资料

43、配对资料配对资料的卡方检验配对资料的卡方检验多组率比较多组率比较RXC表资料的卡方检验表资料的卡方检验有序有序资料资料等级资料等级资料Ridit分析分析H检验检验六、常用假设检验方法的选择六、常用假设检验方法的选择第三节第三节 正态性检验与变量转换正态性检验与变量转换一、正态性检验一、正态性检验有些统计方法只适用于正态分布或近似正有些统计方法只适用于正态分布或近似正态分布资料,如用均数和标准差描述数值态分布资料,如用均数和标准差描述数值资料的集中或离散情况、用正态分布法确资料的集中或离散情况、用正态分布法确定正常值范围、定正常值范围、t t检验与检验与F F检验等,因此在用检验等,因此在用这些方法前,需考虑资料是否服从正态分这些方法前,需考虑资料是否服从正态分布。布。这可以通过我们这可以通过我们已有的经验已有的经验或或正态性检验正态性检验来判断。来判断。( (一一) )医药研究经验医药研究经验以经验来决定资料是否服从正态分布,尤以经验来决定资料是否服从正态分布,尤其对小样本资料其对小样本资料(n20)(n20)有着重要的作用。有着重要的作用。 (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论