![卫生管理统计学课件:第八章 参数估计与假设检验基础_第1页](http://file4.renrendoc.com/view/26d48c966ff247763f7e1f582dc23971/26d48c966ff247763f7e1f582dc239711.gif)
![卫生管理统计学课件:第八章 参数估计与假设检验基础_第2页](http://file4.renrendoc.com/view/26d48c966ff247763f7e1f582dc23971/26d48c966ff247763f7e1f582dc239712.gif)
![卫生管理统计学课件:第八章 参数估计与假设检验基础_第3页](http://file4.renrendoc.com/view/26d48c966ff247763f7e1f582dc23971/26d48c966ff247763f7e1f582dc239713.gif)
![卫生管理统计学课件:第八章 参数估计与假设检验基础_第4页](http://file4.renrendoc.com/view/26d48c966ff247763f7e1f582dc23971/26d48c966ff247763f7e1f582dc239714.gif)
![卫生管理统计学课件:第八章 参数估计与假设检验基础_第5页](http://file4.renrendoc.com/view/26d48c966ff247763f7e1f582dc23971/26d48c966ff247763f7e1f582dc239715.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章参数估计与假设检验基础本章要求:掌握标准误的概念和测量;t分布特点;假设检验基本思想和步骤熟悉样本均数的抽样分布特点;假设检验两类错误的统计含意了解检验效能的概念第一节抽样分布与抽样样误差假定某地全体大一女生身高服从总体均数μ=165.70cm,标准差σ=3.21cm的正态分布。现从当地女学生中随机抽取了100次,每次抽取20名为一个样本Xi。(见表8-1)由于个体之间的差异,每次样本平均数不大可能恰好等于该地女学生身高的总体均数(μ=165.70cm)。这种由个体变异产生的差异称为抽样误差(samplingerror)。在抽样研究中,抽样误差是不可避免的,但怎样估计抽样误差的大小,这是进行统计推断必须考虑的问题。实验表8-1从N(165.70,3.212)抽到的100份随机样本的计算结果(n=20)编号均数标准差编号均数标准差编号均数标准差图8-1重复抽样获得各样本均数的分布特点一、样本均数的抽样分布与抽样误差1.各样本均数未必等于总体均数;2.各样本均数之间存在差异;3.样本均数的分布具有近似对称性;4.样本均数的变异范围较之原变量的变异范围大大缩小。链接4种不同总体的抽样返回双峰分布负指数分布三角分布均匀分布均数抽样误差的测算-------均数标准误(standarderror)抽样误差越大,由样本均数估计总体均数的可靠性越差。抽样误差越小,由样本均数估计总体均数的可靠性越好。【例】抽取某地健康成年男子27名,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。【表8-1】中每组样本的抽样误差编号均数标准差标准误1165.823.060.3062164.983.040.3043165.753.070.307…………98165.603.070.30799165.823.140.314100165.923.180.318二、样本频率的抽样分布与抽样误差假定一口袋中有黑白两种球,已知黑球比例为20%(总体率π=0.2)。现从口袋中任摸一球看清颜色后放回,重复摸球50次(n=50),计算摸到黑球的百分比(样本率p)。重复这样的实验100次,每次得到黑球的比例及频数结果见表。总体率的估计公式增加样本含量降低率的抽样误差实验2
π=20%时的随机抽样结果黑球比例%频数样本频率%8~22.0010~44.0012~88.0014~77.0016~1111.0018~1313.0020~1919.0022~1111.0024~1111.0026~66.0028~33.0030~44.0032~11.00合计100100.0率的抽样误差估计【例】某市随机调查50岁以上中老年妇女776人,其中骨质疏松症者322人,样本患病率为41.5%,试估计样本率的抽样误差。标准差与标准误的区别与联系概念不同:标准差是描述个体值的变异程度的指标,值越小,表示变量值围绕均数的波动越小;标准误是描述样本均数间变异度的指标,值越小,表示样本均数围绕总体均数波动越小。用途不同:
当资料呈正态分布时,标准差与均数结合可估计参考值范围,计算CV
等;标准误可用于估计参数的置信区间,进行假设检验。标准差与标准误的区别与联系与样本例数关系不同:样本量足够大时,标准差趋向于稳定,标准误随例数的增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0;二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。第二节t分布(t-distribution)一、t分布的概念t分布形成t分布主要用于总体均数的区间估计和t检验。二、t分布图和特征图8-2不同自由度v下的t分布图t界值表t
分布曲线(ν=9)相同自由度时,∣t∣值越大,概率P越小;∣t∣值越小,概率P越大;②在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两倍。t值与P值归纳:随机变量XN(μ,σ2)标准正态分布N(0,12)Z变换均数N(μ,σ2/n)标准正态分布N(0,12)Studentt分布自由度:n-1t分布的特征t分布不是一条曲线,而是一簇曲线;以0为中心,单峰分布,左右对称;自由度ν
越小,越大,t
值越分散,曲线的峰越矮,尾部越粗;自由度ν
越大,越小,t值越集中,随着自由度的增大,分布逐渐逼近标准正态分布,当ν
趋近于∞时,分布就完全成为标准正态分布。因此标准正态分布可以视为是分布的特例。第三节总体均数和总体率的估计参数估计(parameterestimation) 通过样本统计指标(统计量)来推断总体统计指标值(参数)的过程。 一般分为两大类:1.点估计(pointestimation)2.置信区间估计(confidenceinterval)一、置信区间的概念及计算区间估计是按预先给定的概率(1–α)所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidenceinterval,CI),用L~U表示,(1–α)称为置信度,(1–α)常取95%或99%。一、总体均数的置信区间1.t分布法【例】
从大一新生中随机抽取男生40人。男生平均身高174.5cm,标准差2.54cm。
试求大一新生中男生身高的95%和99%的置信区间。男生身高的95%的置信区间:男生身高的99%的置信区间:t界值表2.正态分布法
【例】某市2000年随机测量90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%置信区间。本例n=90>50,Z0.05/2=1.96二、总体率的置信区间1.查表法(n≤50)【例】
医院对39名前列腺患者实施开放手术治疗,术后有合并者2人,试估计合并者发生率的95%置信区间。解:查百分率置信区间表(附表)在n=39横行和x=2的纵列交叉处的数值为1~17。即该手术术后合并者发生率的95%可信区间为(1%,17%)。百分率置信区间【例】
假定某高校的50名男生中有5名来自西部,26人来自东部,试分别估计西部生源和东部生源比率的95%置信区间。解:查百分率置信区间表(附表)在n=50横行和x=5的纵列交叉处的数值为2~19。即该手术术后合并者发生率的95%可信区间为(2%,19%)。同样,在n=50横行和x=26>n/2用x'=n-x=24查表的纵列交叉处的数值为34~63。再用100减去所查的数值,得有效率的95%置信区间为(37%,66%)。2.正态近似法总体率的1-α可信区间为:【例】从某高校大一女生中随机抽取100名,测得体重超重率为10%。计算女生超重率的95%置信区间。解:n=100(较大),p=0.1,np=10,n(1-p)=90均大于5要求n较大,当np和n(1-p)均大于>5时,置信区间含义补充说明如果能进行重复抽样试验,当取α=0.05,则表明在100次抽样中平均有95次算得的可信区间包含了总体参数。根据小概率原理,统计学认为一次抽样的结果是可信的。置信区间的两个要素
可靠性:
反映可信度1-
的大小精确性:
用区间长度U-L衡量置信区间与医学参考值范围的区别区别点置信区间参考值范围意义按预先给定的概率,确定的未知参数的可能范围。“正常人”的解剖、生理、生化某项指标的波动范围。计算公式用途估计总体均数判断观察对象的某项指标是否正常第四节假设检验基本思想及步骤1.小概率原理
小概率事件在一次随机试验中几乎是不可能发生2.假设检验处理问题的特点⑴从全局的范围,即从总体上对问题作出判断⑵不可能对总体的每个个体均作观察一、假设检验基本概念及原理假设检验(hypothesistest)又称显著性检验(significancetest),是用于判断样本指标与总体指标之间,或样本指标与样本指标之间的差异有无统计学意义的一种统计方法。假设检验基本思想反证法思想
首先提出假设,假定某事实成立,在此基础上选用适当的统计方法来估计该事实成立的概率p。如果p>α说明,该事件不是小概率事件,尚不能认为该事实不成立;如果p≤α,说明该事件的发生属于小概率事件,我们就有理由怀疑原假设的正确性。统计推断思路总体样本抽样获取统计量统计推断参数:,,PathofStatisticalinference估计探讨成年男性肺炎患者与男性健康成年的血红蛋白(g/dl)有无区别?在这两个人群中随机抽取各10例:组别12345678910均数肺炎11.910.910.110.29.89.910.39.39.88.910.11健康13.914.214.014.313.713.914.114.713.513.613.99肺炎人群μ1
n=10,样本均数10.11健康人群μ2
n=10,样本均数13.99推测:1.均数的差别是本质上的?2.均数的差别是非本质上的?偶然的?抽样误差造成的?≌?二、假设检验步骤【例】在某城区6所小学按概率抽样方法抽取了400名小学生进行视力干预方法研究。在基线调查时,干预组200人,屈光度的均数为-0.34D,标准差为0.12D;对照组200人,屈光度的均数为-0.57D,标准差为0.36D。试问干预组和对照组小学生屈光度在基线时总体均数有无差别?在实际应用中,还会遇到这样的问题:某一样本均数是否来自已知均数总体?假设检验(hypothesistest)可以回答这类问题。在抽样研究中,即使是随机抽样,观察到的样本均数与已知总体均数或两样本均数间差异也可能并不代表总体真实情况。其原因有:1.可能是总体均数不同;2.可能是总体均数相同,但差别仅仅是抽样造成的。二、假设检验步骤假设检验一般步骤1.建立假设和确定检验水准2.选定检验方法和计算检验统计量3.确定P值和作出推断结论建立假设和确定检验水准建立假设1.推断总体均数有无差别。不管是干预组学生的屈光度高于对照组,还是低于对照组,两种可能性都存在,研究者都同等关心,应当用双侧检验。2.根据专业知识,已知干预后屈光度不会低于对照组,或者研究者只关心是否高于对照组,应当用单侧检验。确定检验水准根据小概率原则,设计一个通常在5%及以下的概率,符号为α,称检验水准亦称显著性水准,在实际工作中α常取0.05。作为帮助判断“假设”是否成立的依据。假设检验的设计样本均数(其总体均数为μ)与已知的总体均数μ0作比较:
目的H0H1
(无效假设)(备择假设)双侧检验是否μ≠μ0μ=μ0μ≠μ0单侧检验是否μ>μ0μ=μ0μ>μ0
或是否μ<μ0μ=μ0μ<μ0
两样本均数(其总体均数分别为μ1与μ2)作比较:
目的H0H1双侧检验是否μ1≠μ2μ1=μ2μ1≠μ2单侧检验是否μ1>μ2μ1=μ2
μ1>μ2
或是否μ1<μ2μ1=μ2μ1<μ2
选定检验方法和计算检验统计量要根据研究设计的类型和统计推断的目的选用不同的检验方法。如成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本),两样本方差的比较用F检验。检验统计量是用于抉择是否拒绝H0(无效假设)的统计量,其统计分布在统计推断中是至关重要的。不同的检验方法要用不同的公式计算现有样本的检验统计量值。确定P值和作出推断结论
P值是指由H0所规定的总体作随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。当求得检验统计量的值后,一般可通过特制的统计用表直接查出P值。当P≤α时,结论为按所取α检验水准拒绝H0,接受H1,这样作出结论的理由是:在H0成立的条件下,出现等于及大于现有检验统计量值的概率P≤α,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持H0因而拒绝它;相反,P>α即样本信息支持H0,就没有理由拒绝它,此时只好接受它。假设检验操作步骤路线图H0:μ=μ0H1:μ≠μ0α=0.05计算统计量确定P值做推断结论拒绝H0,接受H1可能犯Ⅰ型错误不拒绝H0,可能犯Ⅱ型错误第五节假设检验的两类错误
须知:拒绝H0不能认为H0肯定不成立,因为在H0成立的条件下,出现现有检验统计量值及更极端情况的概率虽小,但仍有可能出现,只是可能性很小而已;同理,不拒绝H0,也不能认为H0肯定成立。因为假设检验时,必须对被检验的假设作出明确判断,只能从“拒绝”或“不拒绝”中选择一个较为合理的决定。当原假设客观上是“真”,由于抽样的偶然性得到一个较小的P而拒绝原假设,称为第一类错误(或Ⅰ型错误)。
(如无病说成有病(误诊)、假阳性、无效夸为有效等)当原假设客观上是“伪”,也由于抽样的偶然性得到一个较大的P而不拒绝原假设,称为第二类错误(或Ⅱ
型错误)。(如有病说成无病(漏诊)、假阴性、有效认为无效等)推断结论和两类错误客观实际假设检验结果拒绝H0不拒绝H0H0成立Ⅰ型错误(α)推断正确(1-α)H0不成立推断正确(1-β)Ⅱ型错误(β)Ⅰ型错误(typeⅠerror):拒绝了实际上成立的H0Ⅱ型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025火电厂燃料验收设备管理标准
- 二零二五版培智学校图书资源管理与物业管理服务协议
- 全身体检的要点、难点及注意事项课件
- 二零二五版木工机械操作安全责任状协议
- 2.3.1透镜(课件)八年级物理第一学期同步
- 《食道炎与食道癌》课件
- 棉鞋里的阳光课件
- (高清版)JJF(皖) 202-2025 四氟化碳气体检测仪规范
- 《月技术案例分享》课件
- 《资本与增长》课件2
- 期末 (试题) -2024-2025学年人教PEP版英语五年级上册
- 第14课-丝绸之路的开通与经营西域【课件】2
- 初一英语阅读理解100篇七年级上册英语阅读理解及答案
- 2024年广东省深圳市中考道德与法治试题卷
- 专题17 物质结构与性质综合题-五年(2020-2024)高考化学真题分类汇编(解析版)
- 富血小板血浆(PRP)临床实践与病例分享课件
- 肿瘤性发热及护理
- 光伏工程施工组织设计
- 《护理科研》课件
- DB4101-T 121-2024 类家庭社会工作服务规范
- 五年级上册小数四则混合运算练习100道及答案
评论
0/150
提交评论