终身模块统计学抽样误差假设检验_第1页
终身模块统计学抽样误差假设检验_第2页
终身模块统计学抽样误差假设检验_第3页
终身模块统计学抽样误差假设检验_第4页
终身模块统计学抽样误差假设检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于终身模块统计学抽样误差假设检验第1页,共76页,2022年,5月20日,19点29分,星期五统计推断:参数估计,假设检验“世上有三种哄人的东西:谎言、该死的谎言、统计数据”----英国政治家迪斯雷里。“世上有三样激动人心的东西:宣传、要命的宣传、统计数据”。第2页,共76页,2022年,5月20日,19点29分,星期五均数的抽样误差和标准误第3页,共76页,2022年,5月20日,19点29分,星期五均数的抽样误差samplingerrorofmean概念:由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差。即:第4页,共76页,2022年,5月20日,19点29分,星期五12中心极限定理:如果随机变量的总体均数及方差有限,当样本容量趋于无穷大时,样本均数的分布趋近于均数为总体均数,方差为的正态分布。第5页,共76页,2022年,5月20日,19点29分,星期五如何估计?用样本均数的标准差来估计,称标准误(standarderror)。标准误越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。计算公式:即:由总体标准差,样本例数求得。但通常以样本标准差作为总体标准差的估计值。因此:第6页,共76页,2022年,5月20日,19点29分,星期五与标准差的区别:标准差:表示一般变量值的离散程度;均数标准误特别说明样本均数这一变量值离散程度的指标。标准误的应用:(1)用来衡量抽样误差的大小,标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;(2)结合标准正态分布与t分布曲线下的面积规律,估计总体均数的置信区间。(3)用于假设检验。第7页,共76页,2022年,5月20日,19点29分,星期五假定2003年汕头市15岁女学生的身高(cm)服从N(155.4,5.32)。用计算机做抽样模拟试验,每次抽出10个数字,组成一个样本,求出样本均数、样本标准差S。再求得此100个样本均数的均数、样本均数的标准差(标准误)。100个样本均数构成一个新的分布,也是正态分布(即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布)。新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示N(,)。各样本均数的均数等于总体均数。第8页,共76页,2022年,5月20日,19点29分,星期五正态总体中抽样(样本量5)正态总体中抽样(样本量10)正态总体中抽样(样本量30)抽样时样本量大小决定了样本均数分布的形状,当样本量足够大时,均数分布趋向正态分布。第9页,共76页,2022年,5月20日,19点29分,星期五t分布(t-distribution)第10页,共76页,2022年,5月20日,19点29分,星期五u分布:u转换将正态分布转换为标准正态,N(0,1)。同理:将样本均数的分布也可以转换为标准正态分布即:实际工作中,总体标准差往往未知,常用S代替σ计算标准误,因此:就变为:第11页,共76页,2022年,5月20日,19点29分,星期五也就是说:正态分布:标准正态分布正态变量实现这一转变:第12页,共76页,2022年,5月20日,19点29分,星期五均数的分布也是这样如果我们采用另一个正态变量:于是,均数的分布变成了标准正态分布:第13页,共76页,2022年,5月20日,19点29分,星期五但是,条件发生变化我们通常用代替然而,随着样本量的变化而变化,所以,我们称之为t-分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,u=t第14页,共76页,2022年,5月20日,19点29分,星期五t分布是一簇对称于0的单峰分布曲线。自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,t分布曲线逐渐逼近于标准正态分布曲线。当自由度无穷大时,t分布就是标准正态分布曲线。每一条t分布曲线,都对应于相应的自由度。第15页,共76页,2022年,5月20日,19点29分,星期五t分布曲线下的面积规律:与标准正态曲线下的面积规律相似:在某一个自由度下,两侧外部总面积为5%的界限的t值称为t0.05/2(υ),把两侧外部总面积为1%的界限的t值称为t0.01/2(υ)。中部占95%面积的t值范围:t0.05/2(υ)--t0.05/2(υ),中部占99%面积的t值范围:-t0.01/2(υ)--t0.01/2(υ)。第16页,共76页,2022年,5月20日,19点29分,星期五当自由度确定时,占一定面积的t界限值,可以查表得出。参考附表6(p436)。例如:查当自由度=20,两侧概率之和为0.05时,对应的t值:t0.05/2(20)=2.086,单侧概率为0.05时,对应的t值:t0.05(20)=1.725,第17页,共76页,2022年,5月20日,19点29分,星期五t分布的主要应用:(1)总体均数置信区间估计;(2)t检验;第18页,共76页,2022年,5月20日,19点29分,星期五使用t值表注意:同一自由度下,P越小,t值越大;P值相同时,自由度越大,t越小;当自由度无穷大时,t值与u值相等。这也是u分布与t分布的区别。第19页,共76页,2022年,5月20日,19点29分,星期五总体均数置信区间的估计第20页,共76页,2022年,5月20日,19点29分,星期五参数估计:点估计(pointestimation):用样本统计量作为对总体参数的估计值(μ)。比如均数的估计。区间估计(intervalestimation):根据选定的置信度估计总体均数所在的区间(a<μ<b).a,b为置信限(可信限)。第21页,共76页,2022年,5月20日,19点29分,星期五为何要进行区间估计?点估计是用样本均数来估计总体均数,简单易行,但未考虑抽样误差,而后者又是不可避免的。故常按照一定的概率估计总体均数在哪个范围。置信度(confidencelevel):在估计总体均数的置信区间时,如果可能估计错误的概率为α,那么估计正确的概率为1-α,即为置信度.常用:95%,99%.置信区间(confidenceinterval,CI)根据置信度估计得到的区间,称为置信区间。第22页,共76页,2022年,5月20日,19点29分,星期五如何进行区间估计?1、总体标准差已知参照u分布,正态曲线下95%的u值在+-1.96之间,即:总体均数的95%置信区间:99%置信区间:第23页,共76页,2022年,5月20日,19点29分,星期五2、总体标准差未知,样本例数(>50)足够大也可参考u分布进行95%置信区间:99%置信区间:第24页,共76页,2022年,5月20日,19点29分,星期五3、总体标准差未知,样本例数较小按t分布原理,依据相应的自由度,查出该自由度下某个概率相应的界值,再按照中部占95%面积的t值范围:-t0.05/2(υ)--t0.05/2(υ),中部占99%面积的t值范围:-t0.01/2(υ)--t0.01/2(υ)进行估计。因为:所以:95%置信区间:99%置信区间:第25页,共76页,2022年,5月20日,19点29分,星期五例子:p236课堂练习95%置信区间的意义:理论上,用一次抽样所得的样本均数估计总体均数,犯错误的概率为5%.或进行100次抽样,可算得100个置信区间,平均有95个置信区间包括客观存在的总体均数,只有5个置信区间未包括总体均数。第26页,共76页,2022年,5月20日,19点29分,星期五估计置信区间的注意事项:(1)区间是以上、下可信限为界的一个范围。通常用表示置信限,用表示置信区间(2)置信区间与正常值范围的意义、算法不同:95%正常值范围一般是指同质总体内包括95%个体值的估计范围,若总体为正态分布,常用:计算;95%置信区间是指按照95%置信度估计的总体参数的可能范围,按照下式计算。

前者用标准差,后者用标准误。第27页,共76页,2022年,5月20日,19点29分,星期五假设检验的基本思想和步骤第28页,共76页,2022年,5月20日,19点29分,星期五假设检验(hypothesistesting):亦称显著性检验(significancetest).是统计推断的另一个方面。

先对总体的参数或分布作出某种假设,如假设总体均数(或总体率)为一定值,两总体均数(或总体率)相等,总体服从正态分布或两总体分布相同等。然后,用适当方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。其结果将有助于研究者作出决策,采取措施。第29页,共76页,2022年,5月20日,19点29分,星期五在实际情况下:由于抽样误差,从某总体中随机抽得的样本,得到的样本均数与该总体的均数不同;同一总体中两次抽样的样本均数也不相同。这种差别的原因在于:要么总体均数不同;要么总体均数相同,差别仅由抽样误差所致。那么,当我们遇到这种情况时,如何判断?可以通过某种方法来判断差别属哪种情况,这种方法就是假设检验。第30页,共76页,2022年,5月20日,19点29分,星期五假设检验HypothesisTesting假设检验的反证思想

两种说法非A即B。要证明B真,只要证明A伪即可。无效假设Nullhypothesis(H0)

意在推翻的假设(说法A)。备择假设Alternativehypothesis(H1)

意在接受的假设(说法B)。从无效假设出发,找出不支持这一假设的证据,从而推翻它。第31页,共76页,2022年,5月20日,19点29分,星期五小概率事件

smallprobabilityevent事件A发生的概率是如此之小,以至于在一次试验(抽样)时,我们往往认为它(事件A)不会发生。统计学中,小概率事件一般是指发生概率<0.05(检验水准)的事件。在假设检验中,如果在无效假设的前提下出现了小概率事件,我们则怀疑无效假设的真实性。第32页,共76页,2022年,5月20日,19点29分,星期五例:两种不同处理结果之间的差异效果

A处理结果A,B处理结果B

效果Effect:=结果A-结果B对于总体

如果

=0,则A处理和B处理之间没有差别。

如果0,则A处理和B处理之间有差别。对于样本

即使

=0,由于存在抽样变异,往往样本结果A–样本结果B=0。问题在于这个差异是否仅仅是由于抽样变异造成的?第33页,共76页,2022年,5月20日,19点29分,星期五进行假设检验的思路无效假设:样本结果A和B之间的差异仅仅是由于抽样变异造成的。即H0:=0。备择假设:样本结果A和B之间的差异不仅仅是由于抽样变异造成的,还包含不同处理的效果。即H1:0。由无效假设出发,我们可以计算出得到样本差异或者更大差异的概率(P值)。如果P值小于检验水准,则认为由此无效假设不太可能出现这样的结果,从而推翻它,接受备择假设(差异显著性)。反之,接受无效假设。第34页,共76页,2022年,5月20日,19点29分,星期五检验统计量

statisticfortesting在无效假设的前提下,检验统计量的构建是无效假设的关键。检验统计量一般服从某种分布。这样我们就可以利用这种分布计算出由无效假设出发,得到观察到的差异或更大的差异的概率,从而作出推断。第35页,共76页,2022年,5月20日,19点29分,星期五第36页,共76页,2022年,5月20日,19点29分,星期五界值criticalvalue对应于检验水准的分布上的某些数值。正态分布上的某些界值:单侧0.05±1.645双侧0.05±1.96相同界值单侧检验概率是双侧检验概率的一半第37页,共76页,2022年,5月20日,19点29分,星期五例题:两个血糖均数不同,其原因可能是由于抽样误差;也可能是男性管理人员的总体血糖均数与一般正常成年男性的均数不同。假设检验过程:1、建立检验假设和设定检验水准无效假设(nullhypothesis)H0,假设差异是由于抽样误差所致,而两个总体参数相同。是从反证法的思想提出的。(μ=μ0)第38页,共76页,2022年,5月20日,19点29分,星期五备择假设(alternativehypothesis),H1.即差别不仅是由抽样误差所致,而更是总体参数不同。H1是和H0相联系的,对立的假设。(μ≠μ0,μ>μ0,μ<μ0)双侧,单侧检验:根据专业知识,μ可能大于也可能小于μ0,称双侧检验;若认为μ大于、等于μ0(或相反),为单侧检验。若不能确定单侧的情况,应采用双侧检验。第39页,共76页,2022年,5月20日,19点29分,星期五确定检验水准(sizeofatest),(也叫显著性水准significancelevel):用α表示。即:拒绝了实际上成立的H0的概率;一般取0.05,或0.01.本步骤一般写成:H0:μ=μ0H1:μ≠μ0,(双侧)或:H1:μ>μ0,(μ<μ0),(单侧)α=0.05第40页,共76页,2022年,5月20日,19点29分,星期五2、计算统计量根据研究设计类型,资料特征,统计方法的适用条件,选择和计算统计量。本例:计算统计量t值。第41页,共76页,2022年,5月20日,19点29分,星期五3、确定概率P值,作出统计推断计算统计量后,根据事先确定的单侧或双侧检验、自由度、检验水准在相应的统计用表中查出相应的界值。将该界值与所计算的统计量比较,得出相应的概率P。对本例t检验:小于界值的范围,P大于α,是不拒绝H0的区间;大于或等于界值的范围,P小于α,是拒绝H0的区间。第42页,共76页,2022年,5月20日,19点29分,星期五P值是在由H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。第43页,共76页,2022年,5月20日,19点29分,星期五若P≤α,统计上认为是小概率事件,一次抽样不可能发生。而一旦发生,即认为:造成两个均数差异的原因是总体不同(试验因素所致,或相应的因素导致等),无效假设是错误的,因此,拒绝H0,接受H1。称差异有统计学意义。若P>α,则认为是大概率事件,本次的差异仅为抽样误差所致,因此,接受H0,拒绝H1,认为两均数来自同一总体。称差异无统计学意义。第44页,共76页,2022年,5月20日,19点29分,星期五本例t=0.844,而相应的t界值:t0.05/2,25=2.0640.844<2.064,所以P>0.05按照α=0.05水平,不拒绝H0,不能认为男性健康管理人员的血糖均数与一般成年男性的血糖均数不同。第45页,共76页,2022年,5月20日,19点29分,星期五两均数比较时常用的判断标准统计量u:单侧:u<1.645,双侧:u<1.96,P>0.05,不拒绝H0;单侧:u≥1.645,双侧:u≥1.96,P≤0.05,拒绝H0;统计量t:单侧;双侧P>0.05,不拒绝H0;单侧:双侧P≤0.05,拒绝H0;第46页,共76页,2022年,5月20日,19点29分,星期五第一类错误与第二类错误

typeIerror&typeIIerror

假设检验的判断,并非百分之百正确,有两种可能错误:假阳性错误(falsepositiveerror),称为第一类错误(typeIerror),用α表示,即检验水准(levelofsignificance),

通常取:0.05。即:无效假设(H0:u=u0)原本是正确的,但被拒绝,误判为有差别(弃真错误)。当无效假设正确时,在100次抽样中,可以有5次推断是错误的。统计上有意义的界限是允许犯第一类错误的界限。第47页,共76页,2022年,5月20日,19点29分,星期五假阴性错误(falsenegativeerror),称为第二类错误(typeIIerror)。即,无效假设(H0:u=u0)原本是错误的(实际上应是H1:u=u1),但所得统计量t没有超过t0.05的水平从而接受了无效假设,错误地得出无差别的结论(取伪错误)。用表示。检验效能(poweroftest):1-当两个总体存在差异时,所使用的统计检验能够发现这种差异(拒绝H0)的能力。第48页,共76页,2022年,5月20日,19点29分,星期五尽管是小概率事件,它还是有可能发生的。I型错误:虽然无效假设为真,但由于抽到了较大检验统计量的样本,使得P值小于检验水准而导致被拒绝。是否为小概率事件是由检验水准而定,所以犯错误的概率也由检验水准而定。II型错误:虽然无效假设为假,但由于抽到了较小检验统计量的样本,使得P值大于检验水准而导致不被拒绝。第49页,共76页,2022年,5月20日,19点29分,星期五选择统计意义水平,应考虑两类错误对所要研究的事物的影响哪一个重要。一般来说,定0.05为有统计学意义的水平是比较适宜的。两类错误的关系:在样本含量固定的条件下,减少I类错误,会增大II类错误;增大I类错误,会减少II类错误。其他条件不变,增大样本含量可使第二类错误的概率减小。同时正确的实验设计能够减少抽样误差,提高检验效能。第50页,共76页,2022年,5月20日,19点29分,星期五第51页,共76页,2022年,5月20日,19点29分,星期五ta第52页,共76页,2022年,5月20日,19点29分,星期五实际差别与统计意义统计意义:抽到这样大统计量的可能性很小,可以拒绝H0。但并不意味两总体均数差别很大。样本量很大时,即使均数差别不大,统计学意义却显著。样本小时,即使均数差别很大,统计学意义却不显著。第53页,共76页,2022年,5月20日,19点29分,星期五理解检验统计量观察到的量可以是一个样本的均数、两个样本均数的差、一个样本的百分构成、两个样本百分构成的差;检验统计量所服从的分布不一定是正态分布。但只要是已知的理论分布,都可以通过该分布求得P值。第54页,共76页,2022年,5月20日,19点29分,星期五理解P值P值是指在无效假设的前提下,得到观察到的量(或更极端的量)的概率。P值越小说明无效假设越不可靠。或者说,P值越小我们就越有理由推翻无效假设。至于P值是否属于“小”,一般的,我们是根据事先确定的检验水准来判断的。当P<时,我们就可以下诸如“差别有显著性”的论断。P值的大小与观察到的量的大小之间没有必然的联系。第55页,共76页,2022年,5月20日,19点29分,星期五当P>时非小概率事件

在无效假设的前提下,得到观察到的量(或更极端的量)的可能性还是相当大的,我们尚不能拒绝无效假设或者说拒绝无效假设的证据不足。具体问题,专业判断

P=0.70与P=0.07第56页,共76页,2022年,5月20日,19点29分,星期五“差别有显著性”与“差别显著”“差别有高度显著性”与“差别极为显著”二者之间不存在必然的联系。“差别显著”不一定导致“差别有显著性”,“差别不显著”倒是有很大可能导致“差别有显著性”。即使“差别有显著性”,临床上也不一定有意义。第57页,共76页,2022年,5月20日,19点29分,星期五单侧检验还是双侧检验?

One-sidedortwo-sidedtest?双侧检验永远是正确的单侧检验只有在少数情况下才是合适的即使要做单侧检验,也必须事先确定第58页,共76页,2022年,5月20日,19点29分,星期五t检验和u检验第59页,共76页,2022年,5月20日,19点29分,星期五是两种常见的假设检验的方法,因其统计量为t,u而得名。u检验条件:总体标准差已知,资料服从正态分布情况下(1)样本均数与总体均数比较(2)两大样本均数的比较;t检验条件:用于样本量小、总体标准差未知时(1)样本与总体均数比较(2)配对设计资料比较(3)两样本均数比较(同时要求两样本的总体方差相同,服从正态分布)第60页,共76页,2022年,5月20日,19点29分,星期五一、样本均数与总体均数的比较总体均数:大量观测得到的稳定值或理论值,μ0

比较的目的是推断样本所代表的未知总体均数与已知总体均数是否相同。样本均数与总体均数比较的t检验

P240例题14.10

注意步骤、符号写法

第61页,共76页,2022年,5月20日,19点29分,星期五样本均数与总体均数比较的u检验例题:若通过以往大规模调查,已知某地婴儿出生体重均数为3.20kg,标准差0.39kg,今随机查得25名难产儿平均出生体重为3.42kg,问:出生体重与难产是否有关?假定难产儿出生体重的标准差与一般儿童相同。第62页,共76页,2022年,5月20日,19点29分,星期五解题步骤据题意:要检验的是,难产儿出生体重总体均数是否等于3.20kg(),0.39看作总体标准差,样本均数3.42,样本含量25。1.建立假设:H0,假设难产儿出生体重总体均数和一般婴儿出生体重总体均数相等,即:第63页,共76页,2022年,5月20日,19点29分,星期五2.计算合适的统计量:在总体标准差已知,对样本均数和总体均数的差别做统计意义检验,可用公式:

u值服从均数为0,标准差为1的标准正态分布。本例:第64页,共76页,2022年,5月20日,19点29分,星期五3.从正态分布表查临界值:本例:所以:拒绝无效假设,接受备择假设。认为难产和出生体重是有关的。可以为,难产儿的出生体重平均来说是比较大一些。第65页,共76页,2022年,5月20日,19点29分,星期五如果本例总体标准差未知,只有从样本中求得标准差0.42,则应该用t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论