统计学第三章总体均数的估计与假设检验_第1页
统计学第三章总体均数的估计与假设检验_第2页
统计学第三章总体均数的估计与假设检验_第3页
统计学第三章总体均数的估计与假设检验_第4页
统计学第三章总体均数的估计与假设检验_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第三章总体均数的估计与假设检验1第1页,课件共100页,创作于2023年2月统计推断的目的:用样本的信息去推论总体。医学研究中大多数是无限总体,即使是有限总体,但也经常受各种条件的限制,不可能直接获得总体的信息。2第2页,课件共100页,创作于2023年2月抽样误差(samplingerror):因各样本包含的个体不同,所得的各个样本统计量(如均数)往往不相等,这种由于个体差异和抽样造成的样本统计量与总体参数的差异,称为抽样误差。产生抽样误差的原因:个体差异在抽样研究中,抽样误差是无法避免的;抽样误差的分布有一定的规律性。第一节均数的抽样误差与标准误3第3页,课件共100页,创作于2023年2月例:某地14岁健康女生身高的总体均数为155.4cm,标准差为5.30。若从该地14岁健康女生中随机抽取样本含量n均为10人的样本共100次,计算出每次样本的均数为153.8cm,155.5cm,……总体µ4第4页,课件共100页,创作于2023年2月身高组段(cm)频数151~1152~6153~10154~18155~29156~20157~8158~6159~2样本均数的抽样分布特点:各样本均数未必等于总体均数各样本均数之间存在差异样本均数的分布有一定规律性可计算100个样本均数,得频数分布如下:5第5页,课件共100页,创作于2023年2月计算出这100个样本均数的均数为155.52cm,样本均数的标准差为1.64cm身高组段(cm)频数151~1152~6153~10154~18155~29156~20157~8158~6159~26第6页,课件共100页,创作于2023年2月标准误(standarderror)样本均数的标准差,也称均数的标准误,是反映均数抽样误差大小的指标。均数标准误越小,说明样本均数与总体均数的差异程度越小,用该样本均数估计总体均数越可靠。7第7页,课件共100页,创作于2023年2月标准误的计算当标准差一定时,标准误与样本含量n的平方根呈反比,因此,可以通过适当增加样本含量来减少标准误,从而降低抽样误差。8第8页,课件共100页,创作于2023年2月标准误的计算例某地随机抽查14岁健康女生10人,得身高均数154.8cm,标准差5.40cm,计算标准误。总体标准差已知总体标准差未知:9第9页,课件共100页,创作于2023年2月标准误的用途:衡量样本均数的可靠性估计总体均数的置信区间用于均数的假设检验10第10页,课件共100页,创作于2023年2月数理统计推理和中心极限定理从正态总体中,随机抽取例数为n的样本,样本均数服从正态分布;从偏态总体随机抽样,当n足够大时,样本均数服也近似服从正态分布分布;从均数为μ,标准差为σ的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数=μ,标准差。11第11页,课件共100页,创作于2023年2月第二节t分布t分布的概念t分布的图形、性质、t界值表查表12第12页,课件共100页,创作于2023年2月一、t分布的概念13第13页,课件共100页,创作于2023年2月t分布的概念--续当总体标准差未知时,可作正态变量的t转换:

t分布与标准正态分布的联系:t分布只有1个参数:自由度(=n-1)。

逐渐增大时,t分布逐渐逼近标准正态分布。当=∝时,t分布就完全成为标准正态分布了。14第14页,课件共100页,创作于2023年2月二t分布的图形和特征t分布是一簇曲线,自由度决定曲线的形状。当ν∞,t分布正态分布以0为中心,左右对称的单峰曲线15第15页,课件共100页,创作于2023年2月t值表的使用(P804)横标目:自由度υ(1,2,3,…,∞)纵标目:概率P(双侧:0.05,0.01,…0.001)(单侧:0.025,0.005,…0.0005)t界值:一侧尾部面积为单侧概率,两侧尾部面积之和称为双侧概率。16第16页,课件共100页,创作于2023年2月t值表的使用—续

t分布曲线两端尾部面积表示在随机抽样中,获得的t值大于等于某t界值的概率,即P值。例如:当=9时,双侧概率α=0.05时,查t界值表得t(0.05,9)=2.262

。含义为:17第17页,课件共100页,创作于2023年2月t值表中:相同时,t值越大,P值越小;P值相同时,自由度值越大,t值越小;t值相同时,双侧概率P为单侧概率P的两倍。t分布的应用:总体均数的区间估计t检验18第18页,课件共100页,创作于2023年2月第三节总体均数的置信区间估计

confidenceinterval可信区间的概念总体均数可信区间的计算均数可信区间与参考值范围的区别19第19页,课件共100页,创作于2023年2月一、可信区间的概念统计推断:参数估计与假设检验。参数估计:parametricestimation,用样本统计量估计总体参数的方法。点(值)估计:pointestimation,直接用样本统计量作为总体参数的估计值。方法简单但未考虑抽样误差大小。区间估计:intervalestimation,按预先给定的概率95%,或(1-),确定的包含未知总体参数的可能范围。考虑了抽样误差。20第20页,课件共100页,创作于2023年2月可信区间的含义

confidenceinterval,CI有1-(如95%)的可能认为计算出的可信区间包含了总体参数。例4.3某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm。该地12岁男孩身高均数的95%可信区间为:138.3(cm)~141.0(cm)。可信区间不含可信限。Confidencelimit,CL。下限,lowerlimit,L/L1。上限,upperlimit,U/L2。21第21页,课件共100页,创作于2023年2月总体均数的可信区间原理按t分布的原理得出22第22页,课件共100页,创作于2023年2月二、总体均数可信区间的计算1、s已知时:总体均数的95%置信区间为:23第23页,课件共100页,创作于2023年2月2、s未知、且样本例数较少时,按t分布原理总体均数的95%置信区间为:24第24页,课件共100页,创作于2023年2月例9.10随机抽取某地健康男子20人,测得样本的收缩压均值为118.4mmHg,标准差为10.8mmHg

,试估计该地男子收缩压总体均数的95%的置信区间。

=20-1=19t0.05,139=2.09325第25页,课件共100页,创作于2023年2月3、s未知、但样本例数足够大时(n>60或100时),按正态分布原理。总体均数的95%置信区间为:26第26页,课件共100页,创作于2023年2月大样本时总体均数的可信区间估计例:测得某地200名正常人血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L。试求该地正常人血清胆固醇均数95%的可信区间。该地正常人血清胆固醇均数95%的可信区间为3.47~3.81(mmol/L)27第27页,课件共100页,创作于2023年2月4、两总体均数差的可信区间从标准差相等、均数不等的两个正态总体中随机抽样,样本含量分别为n1,n2,样本均数和标准差分别为、S1和、S2,则两总体均数之差(1-2

)的1-可信区间为28第28页,课件共100页,创作于2023年2月两总体均数差的可信区间某医院心内科在冠心病普查工作中,测得40~50岁年龄组男性193人的脂蛋白均数为379.59(mg%),标准差为104.30(mg%);女性128人的脂蛋白均数为357.89(mg%),标准差为89.67(mg%)。问男性与女性的脂蛋白总体均数有多大差别?结论:40~50岁年龄组男性与女性的脂蛋白总体均数不同,男性平均比女性高出18.30~61.10(mg%)29第29页,课件共100页,创作于2023年2月三、可信区间的解释

confidenceinterval,CI该地健康男子收缩压总体均数的95%置信区间为(113.3,123.5)mmHg。从理论上说,做100次抽样,可计算得100个置信区间,平均有95个置信区间包括总体均数,只有5个置信区间不包括总体均数。这种估计方法会冒5%犯错误的风险。30第30页,课件共100页,创作于2023年2月可信区间的确切含义是指有1-(如95%)的可能认为计算出的可信区间包含了总体参数。在可信度确定的前提下,增加样本例数,可减少区间宽度31第31页,课件共100页,创作于2023年2月四、可信区间与参考值范围的区别随机抽取某地200名正常成人,测得血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L。求得该地正常人血清胆固醇均数的95%可信区间为3.47~3.81(mmol/L)95%参考值范围为1.29~5.99(mmol/L)32第32页,课件共100页,创作于2023年2月均数的可信区间与

参考值范围的区别含义:用途:计算公式:33第33页,课件共100页,创作于2023年2月标准误(standarderror)和标准差(standarddeviation)的区别与联系

34第34页,课件共100页,创作于2023年2月SPSS命令求总体均数的置信区间Analyze->DescriptiveStatistics->Explore35第35页,课件共100页,创作于2023年2月第四节t检验和u检验例某医生测量了36名铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。已知正常成年男性的血红蛋白为平均为140.0g/L。试问能否认为从事铅作业工人的血红蛋白不同于正常成年男性的血红蛋白?0=140.0g/L已知总体未知总体X=130.83g/LS=25.74g/Ln=3536第36页,课件共100页,创作于2023年2月出现差别的两种可能:总体均数不同,故样本均数有差别总体均数相同,差别仅仅是由于抽样误差造成的怎样判断属于哪一种可能?先计算一个统计量,如t值,然后根据相应的概率做判断。

37第37页,课件共100页,创作于2023年2月一、假设检验的基本原理样本均数与已知总体均数不等,原因?(1)≠0,两总体均数不等(2)=0

,抽样误差所致这种不等,有多大的可能性由抽样误差造成?如果抽样误差造成的可能性很小,则认为≠0

先假设=0

,看由于抽样误差造成的可能性(P值)有多大?怎样计算P值的大小呢?已知总体未知总体0=140.0g/LX=130.83g/LS=25.74g/Ln=3538第38页,课件共100页,创作于2023年2月怎样计算P值的大小呢?若假设=0

,则可用公式计算t值,由t值求得P值。如果样本均数与0相差较远,t值就大,P值就小。当P小于或等于预先规定的概率值(如0.05),则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑原假设=0可能不成立,认为其对立面≠0成立,该结论的正确性冒着犯5%错误的风险。t0.05,24=2.032t0.01,34=2.728

39第39页,课件共100页,创作于2023年2月二、假设检验的基本步骤建立检验假设,确定检验水准选定检验方法,计算统计量确定P值,作出推断结论40第40页,课件共100页,创作于2023年2月1、建立检验假设,确定检验水准检验假设,hypothesisundertest,亦称无效假设、用H0表示H0:假设未知总体参数等于已知总体参数,μ=μ0。或假设两个总体参数相等,μ1=μ2,备择假设,alternativehypothesis:若H0被否决则该假设成立。用H1表示。H1

的内容反映出检验的单双侧,分三种情况:

μ>μ0

(单侧),μ<μ0

(单侧),μ≠μ0

(双侧)假设是对总体而言,不是针对样本。H0与H1是相互联系、对立的假设。41第41页,课件共100页,创作于2023年2月单、双侧的确定研究者所关心的只是差异是否有本质上的区别,则采用双侧检验(two-sidetest)。一般认为双侧检验较保守和稳妥,尤其是多样本。研究者想知道是否有一方较高,则采用单侧检验(one-sidetest)。从专业知识判断知:一结果不可能低于另一结果,拟用单侧检验。一般认为双侧检验稳妥,故常用。42第42页,课件共100页,创作于2023年2月确定检验水准,

sizeofatest,过去称显著性水平(significancelevel)确定H0成立但被拒绝的概率的界值,是I型错误的概率大小。它确定了小概率事件的大小,常取=0.0543第43页,课件共100页,创作于2023年2月2、选定检验方法,计算检验统计量根据变量类型、设计方案、检验方法的适用条件等,选择适当的检验方法和统计量。所有检验统计量都是在H0成立的前提条件下计算出来的,这就是为什么要假设某两个(多个)总体参数相等,或服从某一分布的原因。44第44页,课件共100页,创作于2023年2月3.确定P值,作出推断结论P值的含义是什么?指从H0规定的总体随机抽得≥(或≤)现有样本获得的检验统计量值(如t)的概率。判断准则:当P≤时,拒绝H0,接受H1,认为差异有统计学意义(statisticalsignificance,统计结论);可认为……不同或不等(专业结论)当P时,不拒绝H0,认为差异无统计学意义(nostatisticalsignificance)。还不能认为……不同或不等(专业结论)45第45页,课件共100页,创作于2023年2月t检验

应用条件:样本均数与总体均数的比较、两样本均数的比较。n较小时(如n<50),理论上要求样本取自正态总体两小样本均数比较时,要求两总体方差相等46第46页,课件共100页,创作于2023年2月一、单样本t检验onesamplet-test即样本均数代表的未知总体均数和已知总体均数0(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。这时检验统计量的计算在H0成立的前提条件下计算。47第47页,课件共100页,创作于2023年2月onesamplet-test通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg,今测得35名难产儿平均出生体重为3.42kg,标准差为0.40kg,问是否该地难产儿出生体重与一般婴儿出生体重不同?即推断样本所代表的未知总体均数与已知总体均数有无差别。已知总体均数:理论值、标准值或经过大量观察所得的稳定值,等48第48页,课件共100页,创作于2023年2月样本均数和总体均数比较的t检验建立检验假设,确定检验水准H0:=0(难产儿与一般婴儿出生体重的总体均数相等)(H0为无效假设)H1:≠0,(难产儿与一般婴儿出生体重的总体均数不等)(H1为备择假设)=0.05选定检验方法,计算检验统计量49第49页,课件共100页,创作于2023年2月

确定P值,作出推断结论=34,t=1.77。查附表2,t界值表(P804),t0.05/2,34=2.032,

t<t0.05/2,34

,故P>0.05。按=0.05水准,不拒绝H0,两者的差别无统计学意义。尚不能认为难产儿平均出生体重与一般婴儿不同在论文中,可用下列表达方法:经样本均数和总体均数比较的t

检验,t=1.77,P>0.05。尚不能认为难产儿平均出生体重与一般婴儿不同。50第50页,课件共100页,创作于2023年2月又如:已知某小样本中含CaCO3的真值是20.7mg/L。现用某法重复测定该小样本15次,CaCO3含量(mg/L)分别如下。问该法测得的均数与真值有无差别?20.99,20.41,20.62,20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50,23.00,22.60

计算得均数为21.13,标准差为0.9851第51页,课件共100页,创作于2023年2月样本均数与总体均数的比较建立检验假设,确定检验水准H0:=0H1:≠0=0.05选定检验方法,计算检验统计量52第52页,课件共100页,创作于2023年2月

确定P值,作出推断结论=14,查t界值表,得t0.05(14)=2.145现t=1.70,t<t0.05,14,故P>0.05。按=0.05水准,不拒绝H0。根据现有样本信息,尚不能认为该法测得的均数与真值不同。53第53页,课件共100页,创作于2023年2月单样本

t

检验的SPSS操作

onesamplet-test和结果解释54第54页,课件共100页,创作于2023年2月命令:AnalyzeCompareMeans

One-SampleTtest55第55页,课件共100页,创作于2023年2月将变量CaCO3选入TestVariables栏,在

TestValue:键入20.7056第56页,课件共100页,创作于2023年2月SPSS分析结果57第57页,课件共100页,创作于2023年2月二、配对

t

检验

pairedt-test

配对设计:两个同质受试对象分别接受两种不同的处理同一受试对象分别接受两种不同的处理同一受试对象处理前后58第58页,课件共100页,创作于2023年2月1.

两个同质受试对象分别接受

两种不同的处理例:为研究女性服用某避孕药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清胆固醇含量(mmol/L)。问该新药是否影响女性血清胆固醇含量?59第59页,课件共100页,创作于2023年2月新药组与安慰剂组血清总胆固醇含量(mmol/L)配对号新药组安慰剂组差值d14.46.2-1.825.05.2-0.235.85.50.344.65.0-0.454.94.40.564.85.4-0.676.05.01.085.96.4-0.594.35.8-1.5105.16.2-1.160第60页,课件共100页,创作于2023年2月2.同一受试对象分别接受

两种不同的处理例:分别用两种测量肺活量的仪器测得12名妇女的最大呼气率(L/分),问两种方法的检测结果有无差别?61第61页,课件共100页,创作于2023年2月两种方法检测12名妇女最大呼气率(L/分)结果被检测者号MiniWright差值dd215254903512252415397183243508512-416444440143184955004703090064604154520257390431-41168184324293994204200010227275-48230411268165103106091244342122484合计206(∑d)21426(∑d2)62第62页,课件共100页,创作于2023年2月3.同一受试对象处理前后例应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况如下。问该药是否对高血压患者治疗前后舒张压变化有影响?63第63页,课件共100页,创作于2023年2月表用某药治疗高血压患者前后舒张压变化情况病人编号号舒张压(mmHg)差值d治疗前治疗后19688821121084310810264102984598100-2610096471061024810092864第64页,课件共100页,创作于2023年2月配对t检验的基本原理设两种处理的效应相同,即1=2,则1-2=0(即已知总体0

)。即看成是差值的样本均数所代表的未知总体均数d与已知总体均数0=0的比较。65第65页,课件共100页,创作于2023年2月若该药治疗高血压不影响舒张压的变化,则理论上每个患者治疗前后舒张压差值d的总体均数d

=0建立检验假设,确定检验水准H0:d

=0H1:d

≠0=0.05选定检验方法,计算检验统计量66第66页,课件共100页,创作于2023年2月确定P值,作出推断结论t=4.02,=n-1=8-1=7,查t界值表

t0.05(7)=2.365,t0.01(7)=3.499因4.02>t0.01(7),故P<0.01经配对t检验,t=4.02,,P<0.01。可认为该药有降低舒张压的作用。67第67页,课件共100页,创作于2023年2月配对

t

检验的SPSS操作

pairedt-test和结果解释68第68页,课件共100页,创作于2023年2月命令:AnalyzeCompareMeans

Paired-SamplesTtest69第69页,课件共100页,创作于2023年2月将X1和X2成对选入PairedVariables栏

单击OK按钮70第70页,课件共100页,创作于2023年2月经配对t检验,t=4.03,P=0.005。可认为该药有降低舒张压的作用。71第71页,课件共100页,创作于2023年2月三、两样本t检验

(完全随机设计的两样本均数比较)完全随机设计:分别从两个研究总体中随机抽取样本,然后比较两组的平均效应;随机抽取实验对象,将其随机分成两组,分别接受两种不同处理,然后比较两组的平均效应。应用条件两小样本均数比较(n1,n2均小于50)时,理论上要求样本取自正态总体,两总体方差相等。72第72页,课件共100页,创作于2023年2月例25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食治疗法,两个月后再次测空腹血糖,问两组患者血糖值是否相同?

25例糖尿病患者两种疗法后两个月血糖值(mmol/L)编号甲组血糖值X1乙组血糖值X218.45.4210.56.4………1121.114.81215.215.61318.773第73页,课件共100页,创作于2023年2月1.建立检验假设,确定检验水准H0:1=2,两组患者的血糖值总体均数相同H1:1

≠2,两组患者的血糖值总体均数不同=0.0574第74页,课件共100页,创作于2023年2月

2.选定检验方法,计算检验统计量两样本的合并方差两样本均数之差的标准误75第75页,课件共100页,创作于2023年2月76第76页,课件共100页,创作于2023年2月

3.确定P值,作出推断结论本例t=2.639,=n1+n2-2=12+13-2=23查t界值表,t0.05(23)=2.069,t0.01(23)=2.807现t>t0.05(23),P<0.05,差异有统计学意义,按=0.05的水准拒绝H0

,接受H1

,故可以认为单纯药物治疗与药物合并饮食治疗糖尿病患者的血糖值均数不同,药物合并饮食法的疗效较好。77第77页,课件共100页,创作于2023年2月两样本

t

检验的SPSS操作

Independent-SamplesTtest和结果解释78第78页,课件共100页,创作于2023年2月命令:AnalyzeCompareMeans

Independent-SamplesTtest79第79页,课件共100页,创作于2023年2月将X选入TestVariable栏

将g选入GroupingVariable栏80第80页,课件共100页,创作于2023年2月定义GroupingVariable81第81页,课件共100页,创作于2023年2月单击OK按钮82第82页,课件共100页,创作于2023年2月经两独立样本t检验,t=2.64,P=0.015故可以认为单纯药物治疗与药物合并饮食治疗糖尿病患者的血糖值均数不同,药物合并饮食法的疗效较好。83第83页,课件共100页,创作于2023年2月四、大样本(>60)均数比较的

u检验当样本含量较大时,t分布与标准正态分布很接近。用手工计算时,u的计算t比简单。查u界值表,t界值表中=∞一行。SPSS都用t检验处理。84第84页,课件共100页,创作于2023年2月经t检验,P>0.05。统计结论:两种方法测量结果的差别无统计学意义。专业结论:尚不能认为两种方法测定结果不同。但不能证明两种测量结果相同,如要证明相同,要用等效检验。85第85页,课件共100页,创作于2023年2月第五节两均数的等效检验equivalencetest前述t检验,目的是推断组间差别。如P>0.05,只是统计上拒绝H0的证据不足,决不能因为P>0.05就认为组间没有差别。推断组间没有差别或差别很小,如检验两种疗法或两种药物是否可以相互替代两种预防措施的效果是否相近或相当两种检测方法的测量结果是否相似86第86页,课件共100页,创作于2023年2月等效检验的步骤D,等效界值。有严格的专业理论依据。如两种血压计的测量误差,D不应超过2mmHg,检验两种降血压药物的治疗效果是否等效,D不应超过5mmHg。D值必须在等效试验以前确定等效检验的样本量不能过小,n1=n2>60只有在时才进行等效检验H0:|m1-m2|≥D(不等效),

H1:|m1-m2|<D(等效,单侧),=0.0587第87页,课件共100页,创作于2023年2月用火焰光度法和四苯硼钠法两种方法测定同一份样本的血钾浓度(mmol/L),n1=n2=118,测量结果:

设等效界值建立假设确定检验水准H0:|m1-m2|≥D(不等效),

H1:|m1-m2|<D(等效,单侧)=0.05检验统计量88第88页,课件共100页,创作于2023年2月确定P值并作出推断结论t0.05,200=1.653,今t=2.12,P<0.05,拒绝H0,接受H1。可认为两种方法测定的血钾浓度等效,或者说两种方法的测量误差可以忽略不计。89第89页,课件共100页,创作于2023年2月第六节假设检验的注意事项一、I型错误(typeIerror)和II型错误(typeIIerror)90第90页,课件共100页,创作于2023年2月

假设检验利用小概率反证法的思想,根据样本统计量作出的推断结论具有概率性,因此其结论可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论