




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
会计学1参数估计假设检验主要内容:抽样分布与抽样误差总体均数的估计总体率的估计第1页/共75页几个重要概念的回顾:总体:样本:统计量:参数:统计分析统计描述:统计指标、统计图表
统计推断:参数估计、假设检验第2页/共75页第一节
抽样分布与抽样误差第3页/共75页一、样本均数的抽样分布与标准误
了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。借助抽样研究。第4页/共75页抽样研究按照随机化原则采用正确的抽样方法从总体中抽取有代表性的一部分组成样本用样本信息推断总体特征的研究统计推断第5页/共75页
例:欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。由个体变异和抽样造成的样本统计量与总体参数的差异,称为抽样误差。第6页/共75页
这些来自同一总体的若干样本统计量间,也存在抽样误差。在抽样研究中,抽样误差是不可避免的。由于其产生的根本原因是生物个体的变异性,故抽样误差分布具有一定的规律性。第7页/共75页抽样误差从总体均数为155.4cm,标准差为5.3cm的正态分布总体中随机抽样。样本大小为30。n=30…
….第8页/共75页从正态总体抽样得到的1000个样本,将1000个样本均数看成新变量,构成新的分布,这1000个样本均数的频数分布(ni=30)如下:第9页/共75页Mean=155.426Std=0.966第10页/共75页样本均数的分布特点:各样本均数不一定等于总体均数样本均数间存在差异样本均数的分布规律:样本均数的分布为中间多,两边少,围绕总体均数上下波动,左右基本对称样本均数的变异较之原变量的变异大大减小,(这1000个样本均数的均数为155.4、标准差为0.966),由样本均数的标准差描述
在非正态分布总体中可进行类似抽样。第11页/共75页样本均数的规律性随机的在概率意义下是有规律的---抽样分布通过大量重复抽样,借助频数表描述样本均数的变异规律(抽样分布)与个体观察值变异规律有关即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律抽样分布第12页/共75页小结:抽样误差抽样误差Samplingerror由于个体差异和抽样引起的样本统计量与总体参数之间的差异或各样本统计量之间的差异。来源:个体变异抽样表现样本统计量与总体参数间的差异样本统计量间的差异第13页/共75页
的总体均数为;而的标准差比原个体值的标准差要小,为区别两者,的标准差用表示。样本均数的标准差称均数的标准误(standarderrorofmean,SEM),简称标准误(SE)。标准误意义:反映样本均数抽样误差的大小,SE越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。标准误第14页/共75页可证明均数标准误
在实际工作中常未知,用S来估计。均数标准误估计值
均数标准误大小与标准差大小成正比,与样本含量n的平方根成反比。第15页/共75页标准误含义:样本均数的标准差计算:(标准误的估计值)P23例4-1:某地120名正常成人血清铜含量资料,其X
=14.46umol/L,s=2.26umol/L,求其标准误注意:X
、SX均为样本均数的标准误(标准误的理论值)第16页/共75页标准误与标准差的关系标准误与标准差成正比;标准误与样本含量n的平方根成反比(说明增大样本含量可以减少抽样误差);标准误与标准差的意义不同(标准差反映了变量值的离散程度,标准误则反映了均数的离散程度)。注意区别:小结第17页/共75页标准误的应用反映抽样误差的大小(样本均数的离散程度;样本均数与总体均数的接近程度;均数的代表性如何。)说明样本均数推论总体均数的可靠性。(标准误越小,可靠性越好;反之,标准误越大,可靠性越差)估计总体均数的可信区间(参数估计)。用于均数的假设检验。减小抽样误差的方法增大样本含量n
;选择标准差较小的指标。第18页/共75页由中心极限定理可得到如下结论:
若服从正态分布
~
则服从正态分布若不服从正态分布
n大:则近似服从正态分布
n小:则为非正态分布第19页/共75页标准差和标准误的区别标准差标准误意义描述观察值的变异程度。其值越小,观察值的变异程度越小,均数的代表性越好…描述样本均数的变异程度,说明抽样误差的大小。其值越小,估计总体均数的可靠性越大…计算……用途描述资料的频数分布状况,可用于制定医学参考值范围,计算变异系数和标准误用于表示抽样误差大小、总体均数的区间估计和均数的假设检验等第20页/共75页二、t分布及其应用若某一随机变量X服从总体均数为、总体标准差为的正态分布N(,2)由于样本均数服从总体均数为、总体标准差为的正态分布N(,)第21页/共75页n为计算某一统计量用到的数据个数,m为计算该统计量用到其它独立统计量的个数。第22页/共75页t分布最早由英国统计学家W.S.Gosset于1908年以“Student”笔名发表,故又称Student'st-distribution。它的发现,开创了小样本统计推断的新纪元。
第23页/共75页
总体为N的m个样本(样本大小为n)的t值第24页/共75页t分布的特征:以0为中心的对称分布;与U分布比,曲线低平;t分布是一簇曲线,形态与自由度(n-1)有关。第25页/共75页t分布与标准正态分布的比较1.二者都是单峰分布,以0为中心左右对称。
2.自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积。
3.当逐渐增大时,t分布逐渐逼近标准正态分布,当=时,t分布完全成为标准正态分布。第26页/共75页t分布的界值
给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称其为t的双侧界值单侧界值:一侧尾部面积为时对应的t值对称性得:单侧曲线下面积=2*双侧曲线下面积给定曲线下面积对应的界值与自由度有关同样的尾部面积,t分布的界值要大于标准正态分布的界值第27页/共75页t分布的界值
t分布界值示意图,表示阴影的面积
第28页/共75页01-12-2-33f(t)第29页/共75页t分布曲线下的面积规律:中间95%的t值:-t0.05/2,t0.05/2,中间99%的t值:-t0.01/2,
t0.01/2,单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1)自由度(υ)一定时,p与t成反比;(2)概率(p)一定时,υ与t成反比;第30页/共75页32三、样本率的抽样分布与标准误
样本率与总体率存在着抽样误差,其大小用率的标准误来描述,用σp表示。
例:某医院用某方剂治疗慢性肝炎160例,有效率为86.25%,求其标准误。第31页/共75页第二节总体均数的估计第32页/共75页计量资料统计推断一般包括以下两个方面:
参数估计:用样本指标估计总体指标
(1)点估计:用样本统计量直接作为总体参数的估计值优点:简单缺点:没有考虑抽样误差
(2)区间估计:按预先给定的概率确定一个包含未知总体参数的范围,称为参数的可信区间或置信区间(confidenceinterval,CI),常用95%的可信区间
假设检验
第33页/共75页
总体均数的区间估计可信区间的含义:按一定的可信度由样本均数计算的总体均数可能所在的范围,这个范围称为总体均数的可信区间。
95%可信区间表示该区间包含总体均数μ的概率为95%。若作100次抽样算得100个可信区间,平均有
95个可信区间包含μ(估计正确),有5个可信区间不包含μ(估计错误)。第34页/共75页总体均数可信区间的计算计算方法:σ已知,按u分布。σ未知,但n足够大,按u分布。σ未知,且n较小,按t分布。第35页/共75页1.σ已知时,总体均数双侧可信区间为:2.σ未知但n较大时,按u分布计算总体均数的可信区间3.σ未知且n较小时,按t分布计算总体均数的可信区间第36页/共75页
例:某地抽取正常成年人200名,测得其血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。
本例=3.64、S=1.20、n=200、
=0.0849,
=(3.47,3.81)(mmolL)
该地正常成年人血清胆固醇均数双侧95%可信区间为(3.47,3.81)mmolL。第37页/共75页第38页/共75页区间估计的准确度:说对的可能性大小,用(1-)来衡量。99%的可信区间好于95%的可信区间(n,S一定时)。
区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n,S一定时)
。
准确度与精确度的关系:在准确度确定的情况下,增加样本含量可提高精确度。可信区间的要素
第39页/共75页第40页/共75页总体均数可信区间与参考值范围的区别总体均数可信区间参考值范围含义按预先给定的概率,确定未知参数
的可能范围。实际上一次抽样算得的可信区间要么包含总体均数,要么不包含。95%CI估计错误的概率≤0.05.总体均数的波动范围“正常人”的解剖,生理,生化某项指标的波动范围。个体值的波动范围计算公式未知:
已知或未知但n﹥60:或正态分布偏态分布
PX~P100X用途总体均数的区间估计绝大多数(如95%)观察对象某项指标的分布范围第41页/共75页第三节总体率的估计点估计:样本率作为总体率的估计值区间估计:按一定概率α,以样本率来估计总体率的1-α可信区间。1.正态近似法:当n足够大,且np和n(1-p)均大于5时:
p±uα.sp
例4-10:某医师用自拟中药方治疗高血压患者107例,有效69例,有效率为64.69%,试估计其总体有效率的95%CI。第42页/共75页2.查表法:n≤50查百分率的可信区间表(P114附表3)例:某医院用中药治疗脑血管梗塞患者40例,其中33例治疗有效,有效率为82.5%,试估计其总体有效率的95%CI。n=40x=7时无效率的95%CI为(8%,33%)n=40x=33时有效率的95%CI为(67%,92%)第43页/共75页第五章假设检验概述第44页/共75页
由样本信息推断总体特征,除了参数估计外,还会遇到这样的问题:某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总体等?要回答这类问题,更多的是用统计推断的另一方面假设检验(hypothesistest)。第一节假设检验的分类、思维方法与步骤第45页/共75页例:已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差6.5次/分。能否认为该山区成年男子脉搏均数高于一般成年男性的脉搏均数(72次/分)?第46页/共75页观测到的样本均数与总体均数间或两样本均数间差异的可能原因:1.总体均数不同(即两者来自不同的总体)2.总体均数相同,差别由抽样造成。需要通过统计学假设检验来判断。假设检验是用来推断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。第47页/共75页假设检验的基本思想
小概率反证法思想小概率思想:指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想:先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。第48页/共75页
假设检验的基本思想
假设检验亦称显著性检验,就是对所估计的总体先提出一个假设,再通过样本数据计算某种统计量(t、U、F等)来判断假设成立的可能性大小,如果假设成立的可能性大,就接受这个假设;反之,则拒绝这个假设。第49页/共75页第一步:建立假设、确定检验水准检验假设H0:(无效假设、零/原假设)。即认为差异仅由抽样误差引起;备择假设H1:存在本质差异。确定单、双侧检验
;H0与H1相关且对立,二者都是对总体特征的假设假设检验的基本步骤第50页/共75页第51页/共75页确定检验水准:显著性水准判断应当拒绝或不拒绝H0的水准,即预先规定的小概率事件的标准,为允许结果出现错误的概率,或出现假阳性的概率;常取0.05或0.01。
本例:H0:,即山区成年男子脉搏与一般成年男子相等。H1:,即山区成年男子脉搏高于一般人群。单侧=0.05第52页/共75页根据资料的类型和研究目的,选择合适的统计检验方法,计算相应的统计量值。例如:本例选用t检验,则计算t值,若u检验则计算u值。第二步:选定统计方法,计算统计量第53页/共75页第三步:确定P值、做出推断结论(包括统计结论和专业结论)根据统计量的大小及其分布确定检验假设成立的可能性P的大小。
P值含义:在由H0所规定的总体中做随机抽样时,获得等于及大于(或等于及小于)现有样本获得的统计量值的概率。第54页/共75页若检验统计量≥现有统计量,则P≤,结论为按所取的检验水准,拒绝H0,接受H1,有统计学意义(统计结论)。可认为不同或不等(专业结论)若检验统计量<现有统计量,则P>,结论为按检验水准,不拒绝H0,无统计学意义(统计结论)。尚不能认为不同或不等(专业结论)
第55页/共75页结合小概率原理,若P≤α,则按α检验水准,拒绝H0,接受H1;若P>α,则不拒绝H0;
注意:假设检验的结论是概率性推断!不拒绝H0,不代表H0一定成立;同理,拒绝H0
,也不能认为H0一定不成立。第56页/共75页0-1.9601.96095%2.5%2.5%接受域拒绝域拒绝域假设检验第57页/共75页一、假设检验的两类错误
假设检验采用小概率反证法的思想,根据样本统计量作出的推断结论具有概率性,因此其结论不可能完全正确,可能发生下面两类错误:Ⅰ型错误:拒绝了实际上是成立的H0,犯“弃真”的错误。其概率大小用表示,可取单侧亦可取双侧。Ⅱ型错误:不拒绝实际上是不成立的H0,其概率大小用β表示。只取单侧,其大小一般未知,只有在已知两总体差值,
及n
时,才能估算出来。
第二节假设检验的两类错误和注意事项第58页/共75页
Ⅰ型错误与Ⅱ型错误的定义如下表:第59页/共75页
引申的几个概念:Ⅰ型错误与Ⅱ型错误的关系:愈小,愈大;反之愈大,愈小。若要同时减小以及,唯一的方法就是增加n。若重点减少,一般取=0.05或0.01;若重点减少,一般取=0.10或0.20。
检验效能:1称为检验效能,是指两总体确有差异,按规定检验水准能够发现该差异的能力如1=0.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。
第60页/共75页二、假设检验的注意事项1、要有严密的抽样设计2、选用的假设检验的方法应符合其应用条件3、单侧检验和双侧检验(单侧检验更容易得出有差别的结论,因为单侧t界值<双侧t界值)4、结论不能绝对化,有无差别是相对的(Ⅰ型和Ⅱ型错误)5、正确理解P值,实际差别大小与统计学意义的区别6、假设检验和可信区间的关系第61页/共75页例如:当α=0.05,u=2.1时,
P<0.05,拒绝H0,接受H1。当α=0.01,u=2.1时,
P>0.01,不拒绝H0。当α不同时,得出的结论可能是相反的。第62页/共75页
可信区间与假设检验有各自不同的作用,要结合使用:一方面,可信区间亦可回答假设检验的问题若算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。第63页/共75页另一方面,可信区间可提示差别有无实际的专业意义。
即可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的专业信息。第64页/共75页可信区间比假设检验提供更多信息(1)(2)(3)(4)(5)有统计意义无统计意义有实际意义可能有实际意义无实际意义样本太小可接受H0有实际意义的值H0附图可信区间在统计推断上提供的信息可信区间第65页/共75页
虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。第66页/共75页对数变换平方根变换平方根反正弦变换倒数变换第三节正态性检验与数据变换
正态性检验:
W检验(n<50)、D检验(n≥50)
数据变换:第67页/共75页练习题一、是非判断:1.标准误是一种特殊的标准差,其表示抽样误差的大小。2.N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。3.假设检验的目的是要判断两个样本均数的差别有多大。第68页/共75页二、选择题:1.按α=0.10水准做t检验,P>0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为()。A.大于0.10B.β,而β未知C.小于0.10D.1-β,而β未知2.某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映()A.个体变异B.抽样误差C.总体均数不同D.均数间变异3.两个样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阿拉善职业技术学院《京剧入门基础知识》2023-2024学年第二学期期末试卷
- 陇南师范高等专科学校《内科学ⅠA》2023-2024学年第一学期期末试卷
- 异位妊娠患者的急救护理
- 陕西服装工程学院《桥梁抗震和抗风设计》2023-2024学年第二学期期末试卷
- 陕西省咸阳市乾县二中2025届高三下学期4月月考试题含解析
- 公文写作与处理课件
- 陕西省延安市2025届高三第九次调研考试英语试题试卷含解析
- 小学文言文知识专项讲解
- 陕西省汉中市城固县2025年四年级数学第二学期期末监测模拟试题含解析
- 学校政教处德育2025年工作方案
- 流浸膏剂浸膏剂讲解
- 2025年新疆水利水电勘测设计研究院有限责任公司招聘笔试参考题库附带答案详解
- 新农村建设之《农村自建房设计图纸38套》高清版
- 大学生职业发展与就业指导(仁能达教育科技公司)学习通测试及答案
- 《宫颈癌进展》课件
- 2024年徐州矿务集团第二医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 彩钢瓦屋面渗漏水维修施工方案完整
- 2024年度大型演唱会主办方与演出艺人演出合同协议范本3篇
- 装配式建筑深化设计-1.2.3 装配式建筑深化设计拆分原47课件讲解
- 电力工程施工组织措施方案
- T∕HGJ 12404-2021 仪表维修车间设计标准
评论
0/150
提交评论