参数估计假设检验_第1页
参数估计假设检验_第2页
参数估计假设检验_第3页
参数估计假设检验_第4页
参数估计假设检验_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 参数估计,戎芬,主要内容:,抽样分布与抽样误差 总体均数的估计 总体率的估计,几个重要概念的回顾: 总体: 样本: 统计量: 参数: 统计分析 统计描述:统计指标、统计图表 统计推断:参数估计、假设检验,第一节 抽样分布与抽样误差,一、样本均数的抽样分布与标准误 了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。 借助抽样研究。,抽 样 研 究,按照随机化原则 采用正确的抽样方法 从总体中抽取有代表性的一部分 组成样本 用样本信息推断总体特征的研究,统计推断,抽样误差,从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30。,n=30, .,从正态总体 抽样得到的1000个样本,将1000个样本均数看成新变量,构成新的分布,这1000个样本均数的频数分布(ni=30)如下:,Mean=155.426 Std=0.966,样本均数的分布特点: 各样本均数不一定等于总体均数 样本均数间存在差异 样本均数的分布规律:样本均数的分布为中间多,两边少,围绕总体均数上下波动,左右基本对称 样本均数的变异较之原变量的变异大大减小,(这1000个样本均数的均数为155.4、标准差为0.966),由样本均数的标准差描述 在非正态分布总体中可进行类似抽样。,样本均数的规律性 随机的 在概率意义下是有规律的-抽样分布 通过大量重复抽样,借助频数表描述 样本均数的变异规律(抽样分布)与个体观察值变异规律有关 即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律,抽样分布,小结:抽样误差,抽样误差Sampling error 由于个体差异和抽样引起的样本统计量与总体参数之间的差异或各样本统计量之间的差异。 来源: 个体变异 抽样 表现 样本统计量与总体参数间的差异 样本统计量间的差异,的总体均数为;而 的标准差比原个体值的标准差要小,为区别两者, 的标准差用 表示。 样本均数的标准差称均数的标准误(standard error of mean, SEM),简称标准误(SE)。 标准误意义:反映样本均数抽样误差的大小,SE越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。,标准误,可证明均数标准误 在实际工作中常未知,用S来估计。均数标准误估计值,均数标准误大小与标准差大小成正比,与样本含量n的平方根成反比。,标准误,含义 :样本均数的标准差 计算:,(标准误的估计值),P23例4-1:某地120名正常成人血清铜含量资料,其X =14.46umol/L,s=2.26umol/L,求其标准误 注意: X 、SX均为样本均数的标准误,(标准误的理论值),标准误与标准差的关系 标准误 与标准差成正比; 标准误 与样本含量n的平方根成反比(说明增大样本含量可以减少抽样误差); 标准误与标准差的意义不同(标准差反映了变量值的离散程度,标准误则反映了均数的离散程度)。 注意区别:,小 结,标准误的应用 反映抽样误差的大小(样本均数的离散程度;样本均数与总体均数的接近程度;均数的代表性如何。)说明样本均数推论总体均数的可靠性。(标准误越小,可靠性越好;反之,标准误越大,可靠性越差) 估计总体均数的可信区间(参数估计)。 用于均数的假设检验。 减小抽样误差的方法 增大样本含量n ; 选择标准差较小的指标。,由中心极限定理可得到如下结论: 若 服从正态分布 则 服从正态分布 若 不服从正态分布 n大:则 近似服从正态分布 n小:则 为非正态分布,标准差和标准误的区别,二、 t 分布及其应用 若某一随机变量X服从总体均数为、总体标准差为 的正态分布N(,2),由于样本均数服从总体均数为、总体标准差为 的正态分布N( , ),n为计算某一统计量用到的数据个数,m为计算该统计量用到其它独立统计量的个数。,t分布最早由英国统计学家W.S. Gosset 于1908年以“Student”笔名发表,故又称Students t-distribution。 它的发现,开创了小样本统计推断的新纪元。,总体为N的m个样本(样本大小为n)的t 值,t分布的特征: 以0为中心的对称分布; 与U分布比,曲线低平; t分布是一簇曲线,形态与自由度(n-1)有关。,t分布与标准正态分布的比较,1. 二者都是单峰分布,以0为中心左右对称。 2. 自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积。 3.当逐渐增大时,t分布逐渐逼近标准正态分布,当=时,t分布完全成为标准正态分布。,t分布的界值,给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为 并称其为t的双侧界值 单侧界值 :一侧尾部面积为时对应的t值 对称性得:单侧曲线下面积=2*双侧曲线下面积 给定曲线下面积对应的界值与自由度有关 同样的尾部面积,t分布的界值要大于标准正态分布的界值,t分布的界值,t分布界值示意图,表示阴影的面积,t分布曲线下的面积规律: 中间95%的t值:- t0.05/2, t0.05/2, 中间99%的t值:- t0.01/2, t0.01/2, 单尾概率:一侧尾部面积 双尾概率:双侧尾部面积 (1)自由度()一定时,p与t成反比; (2)概率(p)一定时,与t成反比;,32,三、样本率的抽样分布与标准误 样本率与总体率存在着抽样误差,其大小用率的标准误来描述,用p表示。,例:某医院用某方剂治疗慢性肝炎160例,有效率为86.25,求其标准误。,第二节 总体均数的估计,计量资料统计推断,一般包括以下两个方面: 参数估计:用样本指标估计总体指标 (1)点估计:用样本统计量直接作为总体参数的估计值 优点:简单 缺点:没有考虑抽样误差 (2)区间估计:按预先给定的概率确定一个包含未知总体参数的范围,称为参数的可信区间或置信区间(confidence interval,CI),常用95%的可信区间 假设检验,总体均数的区间估计 可信区间的含义: 按一定的可信度由样本均数计算的总体均数 可能所在的范围,这个范围称为总体均数的 可信区间。 95%可信区间表示该区间包含总体均数 的 概率为95%。 若作100次抽样算得100个可信区间,平均有 95个可信区间包含(估计正确),有5个 可信区间不包含(估计错误)。,总体均数可信区间的计算,计算方法: 已知,按u分布。 未知,但n足够大,按u分布。 未知,且n较小,按t分布。,1. 已知时,总体均数双侧可信区间为:,2. 未知但n较大时,按u分布计算总体均数的可信区间,3. 未知且n较小时,按t分布计算总体均数的可信区间,例:某地抽取正常成年人200名,测得其血清胆固醇均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。 本例 =3.64、S=1.20、n=200、 =0.0849, =(3.47,3.81)(mmolL) 该地正常成年人血清胆固醇均数双侧95%可信区间为(3.47, 3.81)mmolL。,区间估计的准确度:说对的可能性大小, 用 (1-) 来衡量。99%的可信区间好于95%的可信区间 (n, S一定时) 。 区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S一定时) 。 准确度与精确度的关系:在准确度确定的情况下,增加样本含量可提高精确度。,可信区间的要素,总体均数可信区间与参考值范围的区别,第三节 总体率的估计,点估计:样本率作为总体率的估计值 区间估计:按一定概率,以样本率来估计总体率的1-可信区间。 1.正态近似法: 当n足够大,且np和n(1-p)均大于5时: pu.sp 例4-10:某医师用自拟中药方治疗高血压患者107例,有效69例,有效率为64.69,试估计其总体有效率的95CI。,2.查表法: n50 查百分率的可信区间表(P114附表3) 例:某医院用中药治疗脑血管梗塞患者40例,其中33例治疗有效,有效率为82.5,试估计其总体有效率的95CI。 n=40 x7 时无效率的95CI为(8 ,33) n=40 x33时有效率的95CI为(67 ,92),第五章 假设检验概述,由样本信息推断总体特征,除了参数估计外,还会遇到这样的问题: 某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总体等? 要回答这类问题,更多的是用统计推断的另一方面假设检验(hypothesis test)。,第一节 假设检验的分类、思维方法与步骤,例:已知健康成年男子的脉搏均数为72次/分。 某医生在某山区随机调查30名健康男子,求得 脉搏均数为74.2次/分,标准差6.5次/分。能否 认为该山区成年男子脉搏均数高于一般成年男 性的脉搏均数(72次/分)?,观测到的样本均数与总体均数间或两样本均数间差异的可能原因: 1. 总体均数不同(即两者来自不同的总体) 2. 总体均数相同,差别由抽样造成。 需要通过统计学假设检验来判断。 假设检验是用来推断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,假设检验的基本思想,小概率反证法思想 小概率思想:指小概率事件(P0.01或P0.05)在一次试验中基本上不会发生。 反证法思想:先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。,假设检验的基本思想 假设检验亦称显著性检验,就是对所估计的总体先提出一个假设,再通过样本数据计算某种统计量(t、U、F等)来判断假设成立的可能性大小,如果假设成立的可能性大,就接受这个假设;反之,则拒绝这个假设。,第一步:建立假设、确定检验水准 检验假设H0:(无效假设、零/原假设)。即认为差异仅由抽样误差引起; 备择假设H1:存在本质差异。 确定单、双侧检验 ;,H0 与H1 相关且对立,二者都是对总体特征的假设,假设检验的基本步骤,确定检验水准 : 显著性水准 判断应当拒绝或不拒绝H0的水准,即预先规定的小概率事件的标准,为允许结果出现错误的概率,或出现假阳性的概率; 常取0.05或0.01。,本例: H0: ,即山区成年男子脉搏与一般成年男子相等。 H1: ,即山区成年男子脉搏高于一般人群。 单侧 =0.05,根据资料的类型和研究目的,选择合适的统计检验方法,计算相应的统计量值。 例如:本例选用t 检验,则计算t 值,若u 检验则计算u 值。,第二步:选定统计方法,计算统计量,第三步:确定P值、做出推断结论(包括统计结论和专业结论),根据统计量的大小及其分布确定检验假设成立的可能性P 的大小。 P 值含义:在由H0 所规定的总体中做随机抽样时,获得等于及大于(或等于及小于)现有样本获得的统计量值的概率。,若检验统计量现有统计量,则P,结论为按所取的 检验水准 ,拒绝 H 0,接受H1,有统计学意义(统计结论)。可认为不同或不等(专业结论) 若检验统计量现有统计量,则P,结论为按 检验水准 ,不拒绝 H 0,无统计学意义(统计结论)。尚不能认为不同或不等(专业结论),结合小概率原理,若P ,则按检验水准,拒绝H0,接受H1;若P ,则不拒绝H0; 注意:假设检验的结论是概率性推断! 不拒绝H0,不代表H0一定成立;同理,拒绝H0 ,也不能认为H0一定不成立。,假设检验,一、假设检验的两类错误 假设检验采用小概率反证法的思想,根据样本统计量作出的推断结论具有概率性,因此其结论不可能完全正确,可能发生下面两类错误: 型错误:拒绝了实际上是成立的H0,犯“弃真”的错误。其概率大小用 表示, 可取单侧亦可取双侧。 型错误:不拒绝实际上是不成立的H0,其概率大小用表示。 只取单侧,其大小一般未知,只有在已知两总体差值, 及 n 时,才能估算出来。,第二节 假设检验的两类错误和注意事项,型错误与型错误的定义如下表:,引申的几个概念: 型错误与型错误的关系: 愈小, 愈大;反 之 愈大, 愈小。若要同时减小以及,唯一的方法就是增加n。若重点减少,一般取 =0.05 或 0.01;若重点减少,一般取 =0.10 或 0.20。 检验效能:1称为检验效能,是指两总体确有差异,按规定检验水准能够发现该差异的能力如10.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。,二、假设检验的注意事项,1、要有严密的抽样设计 2、选用的假设检验的方法应符合其应用条件 3、单侧检验和双侧检验(单侧检验更容易得出有差别的结论,因为单侧t界值双侧t界值) 4、结论不能绝对化,有无差别是相对的(型和型错误) 5、正确理解P值,实际差别大小与统计学意义的区别 6、假设检验和可信区间的关系,例如:当0.05,u2.1时, P0.01,不拒绝H0。 当不同时,得出的结论可能是相反的。,可信区间与假设检验有各自不同的作用,要结合使用:,一方面,可信区间亦可回答假设检验的问题 若算得的可信区间若包含了H0,则按 水准,不拒绝H0; 若不包含H0,则按 水准,拒绝H0,接受H1 。,另一方面,可信区间可提示差别有无实际的专业意义。 即可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的专业信息。,可信区间比假设检验提供更多信息,虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准 的前提下进行计算,而假设检验能够获得一较为确切的概率P值。,对数变换 平方根变换 平方根反正弦变换 倒数变换,第三节 正态性检验与数据变换 正态性检验: W检验(n50)、D检验(n50) 数据变换:,练习题 一、是非判断: 1标准误是一种特殊的标准差,其表示抽样误差的大小。 2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。 3假设检验的目的是要判断两个样本均数的差别有多大。,二、选择题: 1. 按=0.10水准做t检验,P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为( b )。 A大于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论