假设检验基础课件_第1页
假设检验基础课件_第2页
假设检验基础课件_第3页
假设检验基础课件_第4页
假设检验基础课件_第5页
已阅读5页,还剩157页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章假设检验基础假设检验HypothesisTesting2023/2/62海南医学院卫生统计学教研室统计推断(statisticalinference):参数估计

(parameterestimation)Whereistheparameter?假设检验(hypothesistest)Arethesesamplescomefromonepopulation?定义:由样本信息对相应总体的特征进行推断。2023/2/63海南医学院卫生统计学教研室为什么要进行假设检验?例题:欲考察某药物A预防孕妇早产的效果,某医院的妇科进行一项临床试验。随机抽取两个样本各15例孕妇:处理组(药物A)婴儿出生体重:均数为7.1kg

对照组(安慰剂)婴儿出生体重:均数为6.3kg7.1kg≠6.3kg2023/2/65海南医学院卫生统计学教研室处理组婴儿出生体重对照组婴儿出生体重总体A总体B样本b(样本均数6.3kg

)?样本a(样本均数7.1kg

)2023/2/66海南医学院卫生统计学教研室统计量不同的两种可能其一:本质上的差异(系统误差,如药物的作用)

(必然的、大于随机误差)其二:抽样误差

(偶然的、随机的、较小的)两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。2023/2/67海南医学院卫生统计学教研室一、假设检验的思维逻辑2023/2/69海南医学院卫生统计学教研室下面我们用一例说明这个原则:两个盒子,各装有100个球.小概率事件在一次试验中不会发生.一个盒子中的白球和红球数99个白球一个红球…99个另一盒中的白球和红球数99个红球一个白球…99个2023/2/610海南医学院卫生统计学教研室将盒子密封;现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?2023/2/611海南医学院卫生统计学教研室假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.小概率反证法.2023/2/613海南医学院卫生统计学教研室假设检验的概念HypothesisTesting对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验。2023/2/614海南医学院卫生统计学教研室二、假设检验的基本步骤例6-1

在某市城区6所小学按概率抽样方法抽取了400名小学生进行视力干预研究。基线调查时,干预组200人,屈光度的均数为-0.34D,标准差为0.21D;对照组200人,屈光度的均数为-0.57D,标准差为0.36D;试问:干预组和对照组小学生屈光度在基线时总体均数有无差别?2023/2/615海南医学院卫生统计学教研室二、假设检验的基本步骤

1、建立检验假设,确定检验水准;2、选定检验方法,计算检验统计量;3、确定P值,作出推断。2023/2/617海南医学院卫生统计学教研室一对关于总体特征的假设:零假设(nullhypothesis),记为H0,又称原假设,表示目前的差异是由于抽样误差引起的。对立假设(alternativehypothesis),记为H1,又称备择假设,表示目前的差异是主要由于本质上的差别引起。两个假设既有联系又互相独立,应该包括两种(也是所有)可能的判断。要做出抉择。1、建立检验假设,确定检验水准

2023/2/618海南医学院卫生统计学教研室例6-1分析步骤:(1)建立检验假设,确定检验水准

H0:1=2,干预组小学生和对照组小学生屈光度的总体均数相等;

H1:1≠2,干预组小学生和对照组小学生屈光度的总体均数不等。=0.05。2023/2/619海南医学院卫生统计学教研室统计量:是随机样本的函数,其计算公式中不应包含任何未知参数。选择Z检验(2)计算统计量(statistic)2023/2/621海南医学院卫生统计学教研室(3)确定P值,作出统计推断

P值的定义:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率(累积概率)。P≤α,为小概率事件,“不大可能”犯假阳性错误,拒绝H0;接受H1。P>α,不是小概率事件,“颇有可能”犯假阳性错误,没有足够的理由拒绝H0;

2023/2/622海南医学院卫生统计学教研室查附表1,或t界值表(=时)

,得P<0.001,按

=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为干预组小学生和对照组小学生屈光度的总体均数不等。例6-1(3)确定P值,作出统计推断2023/2/623海南医学院卫生统计学教研室法官的审判真实情况法官审判的结果有罪

无罪无罪错误正确有罪正确错误无罪假设2023/2/625海南医学院卫生统计学教研室1-β01-H0:=01t(界值)H1:=1>01I、II型错误示意(以单侧t检验为例)t(ν)2023/2/626海南医学院卫生统计学教研室t检验的应用条件随机样本;正态性(Normality):来自正态分布总体;方差齐性(Homoscedasticity):两个均数比较时,要求两总体方差相等。以上条件的考察方法后续介绍。2023/2/629海南医学院卫生统计学教研室一、单样本资料的t检验(onesamplet-test)检验的目的:推断该样本来自的总体均数μ是否与已知的某一总体均数μ0相等。已知总体均数μ0一般指已知的理论值、标准值或大量观察得到的稳定值。认为这是一个确定的总体特征。2023/2/630海南医学院卫生统计学教研室例

已知北方地区一般儿童前囟门闭合月龄为14.1个月。某研究人员从东北某县(缺钙地区)抽取36名儿童,得囟门闭合月龄均值为14.3个月,标准差为5.08个月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?2023/2/631海南医学院卫生统计学教研室(1)建立检验假设,确定检验水准

H0:=0该县儿童前囟门闭合月龄与一般儿童相等。(意为就总体而言,该县儿童前囟门闭合月龄与一般儿童的均数相等)

H1:>0该县儿童前囟门闭合月龄高于一般儿童。单侧=0.05检验步骤2023/2/632海南医学院卫生统计学教研室(2)选定检验方法,计算检验统计量样本均数与总体均数0间的差别可以用统计量t来表示:统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。

2023/2/633海南医学院卫生统计学教研室总体样本t1t2t3t4tn0t分布P(-t/2,<t<t/2,)=1-理论基础:t分布2023/2/634海南医学院卫生统计学教研室

2.计算统计量

2023/2/635海南医学院卫生统计学教研室自由度概率,Pν单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧0.500.400.200.100.050.020.010.0050.0020.001350.6820.8521.3061.6902.030

2.4382.7242.9963.3403.591360.6810.8521.3061.6882.0282.4342.7192.9903.3333.582370.6810.8511.3051.6872.0262.4312.7152.9853.3263.574380.6810.8511.3041.6862.0242.4292.7122.9803.3193.566390.6810.8511.3041.6852.0232.4262.7082.9763.3133.558400.6810.8511.3031.6842.0212.4232.7042.9713.3073.551500.6790.8491.2991.6762.0092.4032.6782.9373.2613.4962023/2/636海南医学院卫生统计学教研室(3)确定P值,做出推断:

如果H0

成立,是否有可能得到现有结果?

查附表2,t界值表,t0.05,35=1.690,t0.25,35=0.682,由于本例t=0.236,

t<t0.05,35,且t<t0.25,35,

得不仅P>0.05,且P>0.25。注意:查单侧t界值

2023/2/637海南医学院卫生统计学教研室统计学结论:本例P>0.05,按

=0.05的水准,不拒绝H0,差别没有统计学意义。专业的结论:尚不能认为该县儿童前囟门闭合月龄高于一般儿童。作结论:2023/2/638海南医学院卫生统计学教研室二、配对设计资料的t检验(paireddesign)定义(P288页):是采用配对随机化,将研究对象分配到不同的处理组的实验设计方法。优点:控制非实验因素对结果的影响特点:资料成对,每对数据不可拆分。2023/2/639海南医学院卫生统计学教研室配对形式异体配对:(分为同源配对设计、条件相近者配对设计)为消除混杂因素的影响,将某些重要特征相似的每两个受试对象配成一对,配对的两个受试对象分别接受两种不同的处理;自身配对:同一受试对象的两部位分别接受两种处理。如:处理前后(服药前后);(注意:受试对象不随时间变化);给予两种检验方法或诊断方法;2023/2/640海南医学院卫生统计学教研室例6-2为了研究孪生兄弟的体重是否与其出生顺序有关,共收集了15对孪生兄弟的出生顺序和出生体重,见表。问:孪生兄弟中先出生者的体重与后出生者的体重是否相同?2023/2/641海南医学院卫生统计学教研室表6-215对孪生兄弟的出生体重(kg)序号先出生者体重后出生者体重差值12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50-0.0263.232.930.3072.272.240.0382.482.55-0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20-0.11142.982.920.06152.652.600.052023/2/642海南医学院卫生统计学教研室比较方法:1、首先求出各对差值(d)的均数。

在理论上,若两种处理无差别,差值d的总体均数μd应为0。

2、将配对设计的两样本均数比较,转化成为平均差值与总体均数μd=0的比较。配对t检验的实质:检验样本差值的总体均数是否为0。2023/2/643海南医学院卫生统计学教研室

假定差值服从正态分布,进行检验。2023/2/644海南医学院卫生统计学教研室分析策略:差值均数与0比较(1)建立检验假设,确定检验水准

H0:d=0,先出生者与后出生者体重的差值(kg)的总体均数为0;

H1:d≠0,先出生者与后出生者体重的差值(kg)的总体均数不为0。=0.05。2023/2/645海南医学院卫生统计学教研室

(2)计算检验统计量t

2023/2/646海南医学院卫生统计学教研室(3)确定P值,作出推断。查表得,t0.05/2,14=2.145,t0.02/2,14=2.624,本例t0.02/2,14>t=2.33>t0.05/2,11,故0.02<P<0.05。

作结论:在a=0.05的水准上,拒绝H0,接受H1,差别有统计学意义,可以认为孪生兄弟的出生体重与出生顺序有关,且先出生者的出生体重大于后出生者的出生体重。2023/2/647海南医学院卫生统计学教研室例6-3用两种方法测定12份血清样品中镁离子的含量,问两种方法测定结果有无差异?表6-3两种方法测定血清Mg(mmol/L)的结果试样号甲基百里酚蓝法葡萄糖激酶两点法差值10.940.920.0221.021.010.0131.141.110.0341.231.220.0151.311.32-0.0161.411.42-0.0171.531.510.0281.611.610.0091.721.720.00101.811.82-0.01111.931.930.00122.022.04-0.022023/2/648海南医学院卫生统计学教研室假定血清镁离子测定结果的差值服从正态分布(1)建立检验假设,确定检验水准H0:d=0,即两种方法测定结果之差的总体均数为0;

H1:d≠0,即两种方法测定结果之差的总体均数不为0;=0.05。

(2)计算检验统计量t

2023/2/649海南医学院卫生统计学教研室(3)确定P值,作出推断。查表得,t0.05/2,11=2.201,

t0.40/2,11=0.876,t0.50/2,11=0.697

本例t0.50/2,11<t=0.764<t0.40/2,11,故0.40<P<0.50

作结论:按=0.05的检验水准,不拒绝H0,差别无统计学意义,尚不能认为两法测定结果不同。2023/2/650海南医学院卫生统计学教研室三、两独立样本资料的t检验

(完全随机设计、成组设计)1、将受试对象完全随机分入两组,接受两种不同的处理(视为代表两不同总体的独立样本)试验组与对照组,新药组与传统药组2、从两个总体中完全随机地抽取一定数量观察对象,对测量指标进行比较:男性与女性,中国人和美国人,不同职业类型等2023/2/651海南医学院卫生统计学教研室

目的:推断两样本各自代表的总体均数μ1与μ2是否相等。特点:样本含量n较小。两种情况(一)两样本所属总体方差相等:(二)两样本所属总体方差不等:2023/2/652海南医学院卫生统计学教研室t检验的应用条件独立性(Independence):随机样本;正态性(Normality):两总体均服从正态分布;方差齐性(Homogeneityofvariance):两个总体均数比较时,要求两总体方差相等。2023/2/653海南医学院卫生统计学教研室例6-4某医师要观察两种药物对原发性高血压的疗效,将诊断为Ⅱ期高血压的20名患者随机分为两组(两组基线时血压之间的差别无统计学意义)。卡托普利组:1217138410912107尼莫地平组:1181213910807163个月后观察舒张压下降的幅度(mmHg),试比较两药的降压效果有无差异?2023/2/654海南医学院卫生统计学教研室t检验条件:经检验,两组患者舒张压的下降值均服从正态分布;具有方差齐性。2023/2/655海南医学院卫生统计学教研室分析步骤:(1)建立检验假设,确定检验水准

H0:1=2,两组患者舒张压下降值的总体均数相等;

H1:1≠2,两组患者舒张压下降值的总体均数不等。=0.05。(2)计算检验统计量t~t(ν)

自由度=n1+n2-2

。2023/2/656海南医学院卫生统计学教研室均数之差的标准误联合方差(方差的加权平均)均数之差的标准误2023/2/657海南医学院卫生统计学教研室2023/2/658海南医学院卫生统计学教研室(2)计算统计量

2023/2/659海南医学院卫生统计学教研室(3)确定P值,作出推断。

查表得,v=10+10-2=18,t0.05/2,18=2.101,t<t0.05/2,18,P>0.05,按=0.05水准,不拒绝H0,差别有没统计学意义,尚不能认为两种药物的降压效果有差别。2023/2/660海南医学院卫生统计学教研室2023/2/661海南医学院卫生统计学教研室2023/2/662海南医学院卫生统计学教研室2023/2/663海南医学院卫生统计学教研室2023/2/664海南医学院卫生统计学教研室2023/2/665海南医学院卫生统计学教研室2023/2/666海南医学院卫生统计学教研室Spss运行结果2023/2/667海南医学院卫生统计学教研室Spss运行结果2023/2/668海南医学院卫生统计学教研室用近似t检验--检验常用方法:Cochran&Cox法(1950):对临界值进行校正Satterthwaite法(1946)Welch法(1947)对自由度进行校正2.两样本所属总体方差不等2023/2/669海南医学院卫生统计学教研室检验假设为

H0:μ1=μ2,H1:μ1≠μ2统计量的计算自由度Satterthwaite近似t检验2023/2/670海南医学院卫生统计学教研室例7-5为了比较特殊饮食与药物治疗改善血清胆固醇(mmol/L)的效果,将24名志愿者随机分成两组,每组12人,甲组为特殊饮食,乙组为药物治疗组。受试者试验前后各测量一次血清胆固醇(mmol/L),差值结果见表,请比较两种措施的效果是否相同?

表7-4两种降血清胆固醇措施差值的结果

组别例数均数(mmol/L)标准差(mmol/L)特殊饮食组120.55920.5110药物治疗组120.14670.21072023/2/671海南医学院卫生统计学教研室分析过程1、经正态性检验,两组差值总体上均服从正态分布2、经方差齐性检验,方差不齐。3、为随机样本选用近似t检验方法2023/2/672海南医学院卫生统计学教研室分析步骤:(1)建立检验假设,确定检验水准

H0:1=2,两种降血清胆固醇措施的效果相同;

H1:1≠2=0.05。(2)计算检验统计量

校正自由度2023/2/673海南医学院卫生统计学教研室(3)确定P值,作出推断。查表得,t0.05/2,12=2.179,

本例t=2.733>t0.05/2,12,

P<0.05,按=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为两种降血清胆固醇措施改变值的总体均数有差异,即两种措施的效果有差异。2023/2/674海南医学院卫生统计学教研室图6-1P1112023/2/675海南医学院卫生统计学教研室说明对于大样本,两个均数的比较可以用Z检验,也可以用t检验,二者结果接近。对于小样本,两个均数的比较应该用t检验,而不能用Z检验,因其将P值估计过小,更易得到拒绝H0的结论,容易犯一类错误。2023/2/676海南医学院卫生统计学教研室四、两独立样本资料的方差齐性检验

(homogeneityofvariance)设:两个随机样本分别独立地来自两个正态总体。1、建立检验假设,确定检验水准H0:σ12=σ22,即两总体的方差相等H1:σ12≠σ22,即两总体的方差不等α=0.052023/2/677海南医学院卫生统计学教研室样本方差比的分布Levene法:从同一总体随机抽取的两样本的方差,

H0成立时,方差比(大方差/小方差)的分布服从F分布判断标准:若F≥Fα(ν1,ν2),

则有P≤α差别有统计学意义。若F<Fα(ν1,ν2),

则有P>α差别无统计学意义2023/2/678海南医学院卫生统计学教研室F附表3-2,465页F值越大,P值越小2023/2/679海南医学院卫生统计学教研室例6-6某口腔医院选择所在市40-50岁慢性牙周炎患者36例,测得吸烟组(18人)菌斑指数(PLI)均值为84.71,标准差为8.14;非吸烟组(18人)菌斑指数的均值为82.20,标准差为6.18,试检验两总体方差是否相等?2023/2/680海南医学院卫生统计学教研室方差齐性检验吸烟组非吸烟组?22=?标准差:6.1812=?标准差:8.142023/2/681海南医学院卫生统计学教研室两组方差的比较(1)建立检验假设,确定检验水准

H0:12=22 H1:12≠22

=0.05。(2)计算统计量(3)确定p值,作出推断查表得,F0.05/2,(17,17)=2.67,P>0.05,=0.05水准,不拒绝H0。尚不能认为两组的总体方差不相等。2023/2/682海南医学院卫生统计学教研室2023/2/683海南医学院卫生统计学教研室例6-5的方差齐性检验(1)建立检验假设,确定检验水准

H0:12=22 H1:12≠22

=0.05。(2)计算统计量(3)确定p值,作出推断查表得,F0.05/2,(11,11)=3.47,P<0.05,=0.05水准,拒绝H0,接受H1

,可以认为两组的总体方差不相等。2023/2/684海南医学院卫生统计学教研室说明对于大样本,两个均数的比较,可以用Z检验,也可以用t检验,结果很接近;对于小样本,两个均数的比较应该用t检验而不应该用Z检验,因相同尾部面积时,Z检验界值小与t界值,更容易拒绝H0,即P值较小。会把原本可能无统计学意义的资料解释为有统计学意义。2023/2/685海南医学院卫生统计学教研室第三节二项分布与Poisson分布资料的Z检验2023/2/686海南医学院卫生统计学教研室

1、单样本资料的Z检验(样本率与总体率的比较)如果二项分布的π或1-π不太小,当n足够大时,一般nπ和n(1-π)均大于5时,在n次随机试验中某事件发生次数X及发生频率P的分布近似正态分布。因此,样本率和总体率之间、两个样本率之间差异的判断可用Z检验。

一、二项分布频率资料的Z检验2023/2/687海南医学院卫生统计学教研室对于假设H0:π=π0,H1:π≠π0H0成立时,检验统计量如果根据样本算得的Z值偏大,有理由拒绝H02023/2/688海南医学院卫生统计学教研室样本不太大时,需要做连续性校正2023/2/689海南医学院卫生统计学教研室例6-7新生儿染色体异常率为0.01,2010年某医院出生的400名新生儿,发现1名染色体异常,请问当地新生儿染色体异常率是否低于一般水平?(本例题nπ=4<5,例题不好)

检验步骤:(1)建立检验假设,确定检验水准H0:π=0.01H1:π<0.01α=0.052023/2/690海南医学院卫生统计学教研室(2)计算检验统计量(3)确定P值,作出统计推断:∵Z0.05=1.64,∴P>0.05.按照α=0.05水准,不拒绝H0。差别无统计学意义。还不能认为当地新生儿染色体异常率低于一般水平。2023/2/691海南医学院卫生统计学教研室2、两组独立样本频率的Z检验2023/2/692海南医学院卫生统计学教研室例6-8例6-8为了解某校本科生体质合格率的性别差异,随机抽查了本科男生110人和女生130人,其中男生有100人合格,女生有70人合格,问:该校本科男女生体制合格率是否不同?

检验步骤:(1)建立检验假设,确定检验水准H0:π=0.01H1:π<0.01α=0.052023/2/693海南医学院卫生统计学教研室(2)计算检验统计量2023/2/694海南医学院卫生统计学教研室(3)确定P值,作出统计推断:∵Z0.05/2=1.96,∴P<0.001.按照α=0.05水准,拒绝H0,接受H1。差别有统计学意义。可以认为该校本科男生的体制合格率与女生不同,男生高于女生。2023/2/695海南医学院卫生统计学教研室Poisson分布:是一种离散型分布,用以描述单位时间、空间、面积等的罕见时间发生次数的概率分布。

可能发生这类事件的观察例数n往往很大,但这类事件的实际发生例数却很小(π<0.001)Poisson分布记为X~P(λ),X为观察单位内某稀有事件发生的次数。

λ为Poisson分布的唯一参数。二、Poisson分布资料的Z检验2023/2/696海南医学院卫生统计学教研室二、Poisson分布资料的Z检验当总体均数λ≥20时,Poisson分布近似正态分布。实际应用时,总体均数一般未知,可通过观察样本计数是否大于20来判断。2023/2/697海南医学院卫生统计学教研室当总体均数λ≥20时,Poisson分布近似正态分布,则其概率计算可以用正态分布概率来近似。

一、单样本资料的Z检验1.建立检验假设,确定检验水准:

H0:λ=λ0,H1:λ≠λ0,(λ0为一定值,如总体均数)

α=0.052.选定检验方法,计算检验统计量3、确定P值,作出推断结论2023/2/698海南医学院卫生统计学教研室例6-9某市计划2005年接种吸附百白破联合疫苗后无菌化脓发生率控制在25/10万人次以内。该市随机抽查2005年接种吸附百白破联合疫苗125538人次,其中发生无菌化脓例数为38例,试问2005年该市无菌化脓发生率能否达到要求?2023/2/699海南医学院卫生统计学教研室分析:1、接种疫苗后无菌化脓发生人数很少,可看成服从poisson分布2、按10万人次,2005年计划发生无菌化脓人数控制在25>20,实际发生无菌化脓次数38/125538=30.27/10万人次,30.27>20,故采用poisson分布单样本资料的z检验。2023/2/6100海南医学院卫生统计学教研室检验步骤1.建立检验假设,确定检验水准:

H0:λ=25,H1:λ>25,α=0.05,单侧检验2.选定检验方法,计算检验统计量3、确定p值,作出推断结论

查表得z=1.054,相对应的单侧p=0.1446>0.05,按α=0.05水准,尚不能拒绝H0,可以认为2005年该市无菌化脓发生率能达到要求,在控制范围内。2023/2/6101海南医学院卫生统计学教研室2、两独立样本资料的Z检验

条件:当两总体均数都大于20时,依据poisson分布此时近似正态分布的原理,可以应用z检验对其总体均数进行推断。H0:λ1=λ2,H1:λ1≠λ2当两样本观测单位数相等时,

X1与X2为两样本计数当两样本观测单位数不等时,为两样本多次观察平均数,n为观测单位数2023/2/6102海南医学院卫生统计学教研室例6-10某市在对不同性别成年人(18岁以上)意外伤害死亡情况有无差异的研究中,随机抽取了该市2002年男女疾病监测数据各10万人,因意外伤害死亡的人数男女分别为51人和23人。试问:2002年不同性别每10万人口意外伤害死亡平均人数是否相等。2023/2/6103海南医学院卫生统计学教研室分析1、10万成年人中意外伤害死亡人数很少,因而可以看成是服从poisson分布2、随机抽取的监测数据中,意外伤害死亡的男女人数分别为51,23,都大于20,故可采用poisson分布两独立样本资料的z检验。2023/2/6104海南医学院卫生统计学教研室检验步骤1.建立检验假设,确定检验水准:

H0:λ1

=λ2,H1:λ1≠λ2α=0.05,双侧检验2.选定检验方法,计算检验统计量以10万人口作为一个观察单位,两组观察单位相等,于是有2023/2/6105海南医学院卫生统计学教研室检验步骤3、确定p值,作出推断结论

Z=3.2549≌3.25,相对应的双侧p=0.0024<0.05,按α=0.05水准,拒绝H0,可以认为该市不同性别意外伤害死亡平均人数有差异,且男性较高。2023/2/6106海南医学院卫生统计学教研室例6-11

某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改进工艺后,测取两次,分别为25、18颗粉尘。问:工艺改革前后平均粉尘浓度有无差别?2023/2/6107海南医学院卫生统计学教研室分析1、每升空气中粉尘颗粒数很少,因而可以看成是服从poisson分布。2、随机抽取的监测数据中,改革生产工艺前粉尘浓度,改进工艺后粉尘浓度,都大于20故可采用poisson分布两独立样本资料的Z检验。3、工艺改革前后观测单位数不等,故应用式6-162023/2/6108海南医学院卫生统计学教研室检验步骤1.建立检验假设,确定检验水准:

H0:λ1

=λ2,H1:λ1≠λ2α=0.05,双侧检验2.选定检验方法,计算检验统计量两组观察单位数不等,于是有2023/2/6109海南医学院卫生统计学教研室检验步骤3、确定p值,作出推断结论

Z=2.723≌2.72,相对应的双侧p=0.007<0.05,按α=0.05水准,拒绝H0,可以认为工艺改革前后粉尘浓度不同,由于,可以认为改革工艺后粉尘浓度较低2023/2/6110海南医学院卫生统计学教研室第四节假设检验与区间估计之间的关系

统计推断:参数估计、假设检验如配对设计资料差值的的双侧95%置信区间为:两独立样本资料的总体均数差值的双侧1-α可信区间为每一种区间估计都可以对应一种假设检验方法。2023/2/6111海南医学院卫生统计学教研室1、置信区间具有假设检验的主要功能如例6-2对15对孪生兄弟出生体重差值的总体均数做区间估计,得其95%可信区间为显然,H0:不在此区间之内,因而拒绝H0经假设检验,得0.005<p<0.01,拒绝H0。可见,两者的结论是等价的。置信区间也具有假设检验的主要功能。2023/2/6112海南医学院卫生统计学教研室再如例6-4两个总体均数差值的置信区间为差值0在此区间内,则两总体均数相等。与假设检验结论一致。2023/2/6113海南医学院卫生统计学教研室2、置信区间可提供假设检验没有提供的信息

如降血压药至少要使血压平均降低10mmHg以上才认为具有临床治疗意义,10mmHg是具有实际意义的值置信区间2023/2/6114海南医学院卫生统计学教研室

1、由于假设检验可以提供确切的概率值,从而能够为统计学判断提供精确的概率保证。置信区间只能在预先给定的置信度100(1-α)%水平上进行推断是否拒绝H0

。在不拒绝H0的场合,假设检验可以对检验的功效(power,效能)做出估计,从而可以评价是否差异能力较强的情形下不拒绝H0,

置信区间则不能提供此信息。3.假设检验比置信区间多提供的信息2023/2/6115海南医学院卫生统计学教研室联系置信区间与相应的假设检验既能提供相互等价的信息,又有各自不同的功能。结合起来,可以提供更为全面、完整的信息。因此,国际上规定,在报告假设检验结论的同时,必须报告相应区间估计的结果。2023/2/6116海南医学院卫生统计学教研室第五节假设检验的功效一、假设检验的两类错误。表6-3假设检验中的两类错误客观实际情况检验结果拒绝H0不拒绝H0H0真(来自同一总体)第Ⅰ类错误(犯错误概率为α)结论正确(1-α)H0假(来自不同总体)结论正确(1-β)第Ⅱ类错误(犯错误概率为β)第Ⅰ类错误:如果实际情况与H0一致,由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0

,导致推断结论错误。这样的错误叫做——。第Ⅱ类错误:如果实际情况与H0不一致,由于抽样的原因,使得统计量的观察值落到接受域,不能拒绝原本错误的H0

,导致推断结论错误。这样的错误叫做——。2023/2/6117海南医学院卫生统计学教研室α取为0.05的含义:

如果原假设H0成立,按照同样的方法在原假设H0规定的总体中重复抽样,那么在每100次检验结论中平均可以有5次拒绝H0(假阳性!犯第一类错误)β的意义:

如果H0并不成立,即所研究的总体与H0有实质差异(例如μ1≠μ2),按照同样的方法在总体中重复抽样,那么在每100次检验结论中平均可以有100*β次不拒绝H0(假阴性,犯第二类错误)

H0并不成立时,检验统计量的精确分布往往难以确定,β难以估计.2023/2/6118海南医学院卫生统计学教研室Ⅰ型错误与Ⅱ型错误示意图(以单侧Z检验为例)当样本含量一定时,α概率越小,β概率越大;α概率越大,β概率越小.

实际应用中,往往通过α控制β。例如,样本量确定时,如要减小β,就把α取大一些。2023/2/6119海南医学院卫生统计学教研室二、假设检验的功效(poweroftest,检验效能)

定义为(1-β),意义:即当所研究的总体与H0确有差别时,按检验水准α能发现它(拒绝H0)的概率。(1-β)=0.90的含义:当H0不成立时,理论上在每100次抽样中,在α

的检验水准上平均有90次能正确的拒绝H0

。一般情况下,对同一检验水准α,功效大的检验方法更可取。一般要求检验效能要在0.80以上。2023/2/6120海南医学院卫生统计学教研室功效的应用应用:1、用于在设计阶段估计样本含量。

2、在假设检验结果的解释和评价中,当不拒绝H0时,可以事后估计检验效能的值,有助于判断是总体参数确实没有差别,还是由于样本量太小导致的检验效能不足,如1-β<0.75(结果不可靠)。2023/2/6121海南医学院卫生统计学教研室1.单样本设计资料t检验的功效;n——样本含量,σ——总体标准差,δ——欲发现的最小差异或容许误差。(即样本统计量与总体参数之差)Zα——在α水平上的标准正态界值,根据检验设定取单侧或双侧Zβ——在β水平上的标准正态界值,总是单侧邻界值。算得Zβ后,根据Zβ的数值反查标准正态分布表来确定β,进而得到1-β(1)计算Zβ:2023/2/6122海南医学院卫生统计学教研室Zβ是正值时,可以肯定检验效能一定大于0.50,此时应使用-Zβ的值查标准正态分布曲线下面积,得到β值,从而计算1-β。Zβ是负值时,可以肯定检验效能一定小于0.50,此时直接使用Zβ的值查标准正态分布曲线下面积,得到1-β。2023/2/6123海南医学院卫生统计学教研室6-12

已知北方地区一般儿童前囟门闭合月龄为14.1个月。某研究人员从东北某县(缺钙地区)抽取36名儿童,得囟门闭合月龄均值为14.3个月,标准差为5.08个月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?2023/2/6124海南医学院卫生统计学教研室例6-12经t检验得t=0.236,P>0.05,不拒绝H0,还不能认为该县儿童囟门闭合月龄大于一般儿童。计算该t检验的检验功效。假定根据现有知识,可取σ=5.0个月,实际差别d=14.3-14.1=0.20,设定容许误差δ=0.50个月,Zα=0.05=1.645(2)计算1-β=Φ(-1.045)=0.14692023/2/6125海南医学院卫生统计学教研室二、两独立样本资料t检验的功效;n:样本含量,σ:总体标准差,δ:有意义的最小检出差,或容许误差。Zα:在α水平上的标准正态差值(1)计算Zβ:2023/2/6126海南医学院卫生统计学教研室例6-13计算例6-5检验的功效。假定:根据现有知识取容许误差δ=0.1mmol/L,σ=0.35mmol/L,Zα/2=1.96查标准正态分布表,-1.261对应的上侧尾部面积,得到β=0.8962,1-β=0.1038.说明,检验功效太小,即发现δ=0.1mmol/L的差别的机会还有10.38%。2023/2/6127海南医学院卫生统计学教研室3.影响检验效能的主要因素主要因素有4个:1、总体参数2、个体差异(标准差)3、样本量4、检验水准总体参数的差异越大、个体差异(标准差)越小,样本量越大,检验水准越小,则检验效能越大2023/2/6128海南医学院卫生统计学教研室在假设检验结果的解释和评价中,特别是未能拒绝H0时,事后估计1-β,有助于判断是总体参数确实没有差别,还是样本量太小导致的检验效能不足。如:1-β<80%.2023/2/6129海南医学院卫生统计学教研室应用检验方法必须符合其适用条件:应根据设计类型、变量类型、样本大小等因素选择相应的检验方法,并注意不同检验方法的适用条件。如t检验要求样本来自正态分布总体,方差齐同。配对设计的资料不宜用两独立样本的t检验。三、应用假设检验的注意事项2023/2/6130海南医学院卫生统计学教研室双侧检验与单侧检验选择要结合专业实际;选择要在计算检验统计量之前;在相同的检验水准下,正确地选择单侧检验将比双侧检验得到更多的检验效能。2023/2/6131海南医学院卫生统计学教研室2、权衡两类错误的危害以确定α的大小当样本量一定时,第一类错误的概率α变小时,第二类错误的概率β就变大。反之亦然。在可能出现的两类错误之中,往往会有一种错误危害较大。要权衡两类错误的危害来确定α的大小。例如,在一种新药与常规药间疗效比较的假设检验中,如果犯第一类错误,意味着可能过高评价疗效一般的新药,淘汰比较成熟的常规药物。为了不轻易淘汰比较成熟的常规药物,应控制第一类错误的概率,减小α

再如,方差齐性检验、拟合优度检验中,为减小犯第二类错误的概率,可适当增加α。2023/2/6132海南医学院卫生统计学教研室3.正确理解P值的意义

P值很小时,拒绝H0,接受H1,但是不要把很小的P值误解为总体参数间差异很大。拒绝H0只是说差异不为零,P值小只是说犯一类错误的机会远小于α。要求:在报告检验结论时,如果P<α,应说差异“有统计学意义(statisticallysignificance)”同时写明P的数值或范围。将P<0.05说成“差异显著”或将

P<0.01说成“差异非常显著”都是不对的。当P接近α时,不能简单地拒绝或不拒绝H0,应该继续观察研究。2023/2/6133海南医学院卫生统计学教研室附**:第六节正态性检验资料是否来自正态分布总体,对统计方法的确定具有重要意义。两类方法:一、图示法1、P-P图法2、Q-Q图法二、统计检验法1、w检验2、D检验3、矩法2023/2/6134海南医学院卫生统计学教研室一、图示法1、P-P图法(proportion-proportionplots)横坐标——样本的累计频率(百分比);纵坐标——按正态分布计算的相应累计概率;散点——样本值判断方法——若资料服从正态分布,样本点应围绕第一象限的对角线散布。2023/2/6135海南医学院卫生统计学教研室2023/2/6136海南医学院卫生统计学教研室一、图示法2、Q-Q图法(quantile-quantileplots)横坐标——样本的百分位数;纵坐标——按正态分布计算的相应百分位数;散点——样本值判断方法——若资料服从正态分布,样本点应围绕第一象限的对角线散布。2023/2/6137海南医学院卫生统计学教研室2023/2/6138海南医学院卫生统计学教研室二、统计检验法1.W检验(S.S.ShapiroandM.B.Wilk)检验假设为:H0:样本来自正态分布H1:样本不来自正态分布首先:将取自同一总体的样本值X1,…Xn,按升序排列为X*1,…X*n,统计量为2023/2/6139海南医学院卫生统计学教研室二、统计检验法2.D检验(D’Agostino‘stest)适用条件:大样本资料。首先:将取自同一总体的样本值X1,…Xn,按升序排列为X*1,…X*n,统计量为2023/2/6140海南医学院卫生统计学教研室正态性检验结果2023/2/6141海南医学院卫生统计学教研室二、统计检验法3.矩法特点:分别对分布偏度与峰度做检验检验偏度的统计量为2023/2/6142海南医学院卫生统计学教研室二、统计检验法检验峰度的统计量为如果结论不拒绝H0,可认为分布为正态。其他方法:拟合优度卡方检验2023/2/6143海南医学院卫生统计学教研室Nomenclaturehypothesistesting假设检验nullhypothesis无效假设alternativehypothesis备择假设significancelevel显著性水准(水平)power检验效能principleofsmallprobability小概率原理ttestt检验ZtestZ检验twotypesoferrors两类错误typeIerror,Rejectionerror第I类错误,拒绝错误typeIIerror,acceptanceerror第II类错误,接受错误two-sidedtest,two-tailedtest双侧检验,双尾检验one-sidedtest,one-tailedtest单侧检验,单尾检验2023/2/6144海南医学院卫生统计学教研室案例讨论案例6-1:错误!两独立样本t检验案例6-2:方差不齐,用近似t检验案例6-3:配对设计t检验2023/2/6145海南医学院卫生统计学教研室计算机实验实验6-1配对设计的t检验实验6-2两独立样本资料的t检验实验6-3正态性检验(W检验)实验6-4假设检验两类错误的模拟实验2023/2/6146海南医学院卫生统计学教研室思考与练习1、单样本t检验,t=1.064,不拒绝H02、配对设计t检验,t=-0.80,不拒绝H03、两独立样本t检验4、两独立样本t检验,F=17.36,方差不齐;t’=14.14,拒绝H05、两独立样本t检验,F=6.24,方差不齐;t’=5.54,拒绝H06、两独立样本t检验,镁,t’=-6.978,拒绝H0;铁,t’=-3.355,拒绝H02023/2/6147海南医学院卫生统计学教研室卫生统计学教研室ThankYou!

Theend2023/2/6149海南医学院卫生统计学教研室三、二项分布两组独立样本资料Z检验的功效;(1)计算Zβ:例6-15例6-9硝苯吡啶治疗组有效率:P1=57/75=0.76,硝苯吡啶+卡托普利治疗组有效率:p2=66/69=0.95652,两组合计有效率:p=(57+66)/(75+69)=0.85417,Z=-3.34代入(6-20)式得到:(2)计算检验效能:1-β:2023/2/6150海南医学院卫生统计学教研室五、大样本资料比较的

Z(u)检验Z检验(u检验)的应用条件1、单样本Z检验:正态总体(或非正态总体,抽取大样本,n>100),样本均数的分布服从(或近似地服从)正态分布。2023/2/6151海南医学院卫生统计学教研室两样本z检验统计量计算2、两独立样本Z检验:抽取大样本,n>100,样本均数的和与差的分布服从(或近似地服从)正态分布。2023/2/6152海南医学院卫生统计学教研室例7-7某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.66,标准差为0.57,女性255人,均数为4.18,标准差为0.29,试问该地男女红细胞数的总体均数有无差别?

分析:因为男女样本例数大于100,不需要假定方差相等和联合估计方差,采用Z检验。2023/2/6153海南医学院卫生统计学教研室(1)建立检验假设,确定检验水准

H0:1=2,即该地男、女红细胞数总体均数相等。

H1:12

双侧=0.05(2)计算统计量(3)确定P值,作出统计推断查附表1,或t界值表(=时)或标准正态分布表,得P<0.001,按

=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为该地男、女红细胞数总体均数不等,男性高于女性。2023/2/6154海南医学院卫生统计学教研室例6-8某医院声称治疗声带白班的有效率为80%.求医者60例,45例有效。试问该医院声称的有效率是否客观?理论有效率π0=0.80,样本有效率p=45/60=0.75,E(p)=π.1.建立检验假设,确定检验水准:

H0:π

=0,.80H1:π

<0.80;α=0.05,单侧检验。2.选定检验方法,计算检验统计量:Z检验法3.确定P值,作出统计推断:∵Z0.05=1.64,∴P>0.05.不拒绝H0无效假设。差别在α=0.05水平上无统计学意义。4.专业结论:医院声称的有效率80%为真。P(Z≦-0.80)=0.21192023/2/6155海南医学院卫生统计学教研室2、两组独立样本频率的Z检验(两个样本频率的比较)例6-9用硝苯吡啶治疗高血压急症患者75例,有效者57例,用硝苯吡啶+卡

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论