抽样误差与假设检验.ppt_第1页
抽样误差与假设检验.ppt_第2页
抽样误差与假设检验.ppt_第3页
抽样误差与假设检验.ppt_第4页
抽样误差与假设检验.ppt_第5页
免费预览已结束,剩余65页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 抽样误差与假设检验,第一节 均数的抽样误差与标准误,100份样本的均数和标准差,将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。,图4-1 随机抽样所得100个样本均数的分布,100个样本均数的抽样分布特点: 100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。 样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。 样本均数的标准差明显变小:,即样本均数的标准差,可用于衡量抽样误差的大小。 因通常未知,计算标准误采用下式:,标准误(standard error, SE),通过增加样本含量n来降低抽样

2、误差。,3个抽样实验结果图示,抽样实验小结,均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error) =样本标准差/ 从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n) 。,标准差与标准误的区别,1、概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小; 标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。 2、用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算

3、变异系数等;标准误用于表示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。,3、与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0; 4、二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。,第二节 t 分布(t-distribution),随机变量X N(m,s2),标准正态分布 N(0,12),Z变换,均数,标准正态分布 N(0,1

4、2),Student t分布 自由度:n-1,图4-2 不同自由度下的t 分布图,t分布的特征,以0为中心,左右对称的单峰分布; t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于时,t分布即为Z分布。,t 界值表,1.812,2.228,-2.228,t,f (t),=10的t分布图,t分布曲线下面积(附表2),双侧t0.05/2,92.262 单侧t0.025,9 单侧t0.05,91.833 双侧t0.01/2,93.250 单侧t0.005,9 单侧t0.01,92.821 双侧t

5、0.05/2,1.96 单侧t0.025, 单侧t0.05, 1.64,总体均数的点估计(point estimation)与区间估计(interval estimation),参数的估计,点估计:由样本统计量 直接估计 总体参数,区间估计:在一定可信度(Confidence level)下,同时考虑抽样误差,第三节 总体均数的可信区间估计,按预先给定的概率(1), 确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI),(1)称为可信度或置信度(confidence level),常取95。 置信区间通常两个数值即置信限(conf

6、idence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U),,一、置信区间的有关概念,二、总体均数置信区间的计算,s未知,且 n较小,按t分布 s已知,或s未知但n足够大,按Z分布,单一总体均数的置信区间,例6-3,Z0.05/2=1.96 Z0.05=1.645,Z0.05/2=1.96 Z0.05=1.645,三、可信区间估计的优劣 一是可信度1(准确度),愈接近1愈好,如99%的可信度比95%的可信度要好; 二是区间的宽度(精密度),区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。 在可信度确定的情况下

7、,增加样本含量可减小区间宽度。,四、总体均数可信区间与参考值范围的区别,第五章 假设检验 (Hypothesis Testing),假设检验的基本概念,若对 参数 有所 了解,但有怀 疑猜测 需要证 实之时,用假设 检验的 方法来 处理,何为假设检验?,假设检验是指施加于一个或多个总体的概率分布或参数的假设。 所作假设可以是正确的,也可以是错误的。 为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定。,假设检验的内容,基本思想,参数的假设检验:已知总体的分布类型,对分布函数或密度函数中的某些参数提出假设,并检验。 基本原则小概率

8、事件在一次试验中是不可能发生的。,思想:如果原假设成立,那么某个分布已知的统计量在某个区域(拒绝域)内取值的概率(检验水准)应该较小,如果样本的观测数值落在这个小概率区域内,则原假设不正确,所以拒绝原假设;否则,接受原假设。,一、小概率事件与假设检验,检验目的: 未知,只能比较样本均数 与0,( 0)0有两种可能: 1. 与0相等,差异由抽样引起; 2. 与0本身不相等。,检验假设:,如法官判定一个人是否犯罪,首先是假定他“无罪”(H0),然后通过侦察寻找证据,如果证据充分则拒绝 “无罪”的假定(H0),判嫌疑人有罪;否则只能暂且认为“无罪”的假定(H0)成立。,小概率事件P0.05或P0.0

9、1,-1.96,1.96,-1.645,统计量Z 对应的概率很小,如小于等于0.05,则认为事件不会发生,此时拒绝H0,有足够证据推断差异有统计学意义。,二、两类错误,由于样本的随机性,假设检验中作出的结论可能会犯两类不同类型的错误: (1)H0成立,但由于样本的随机性,拒绝了H0所犯的错误称第一类错误或型错误或拒真错误。犯第一类错误的概率记作。,(2)H0不成立,但由于样本的随机性,不拒绝H0所犯的错误称第二类错误或型错误或受伪错误。犯第二类错误的概率记作。,检验效能(power of a test):亦称把握度,1-,它的意义是当两总体确有差别,按规定检验水准所能发现该差异 的能力。,两种

10、错误的关系,两类错误,型错误(弃真):拒绝实际正确的H0, 型错误的概率记为。(1a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。 型错误(纳伪):不拒绝实际不正确的H0, 型错误的概率记为。(1)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。,三、单、双侧检验,H1: 0,双侧,0都有可能 H1: 0,单侧 H1: 0,单侧 对于本例,根据医学知识,经常参加体育锻炼 的中学男生心率不会高于一般中学男生的心率。所 以使用单侧。即H0:0,H1:0 由专业知识确定单、双侧。,第二节 假设检验的基本步骤,一建立检验假设,确定检验水准 H0:=0, 两总体均数相等,差异仅

11、由抽样误差所致。 H1:0(或0 或,拒绝H0的样本证据不足,就不拒绝H0,暂且认为H0成立 根据统计推断结果,结合相应的专业知识,给出一个专业的结论。,例4-1,一建立检验假设,确定检验水准 H0:=0, 常锻炼学生的心率与一般学生相等。 H1:0 ,常锻炼学生的心率低于一般学生。 =0.05 二选择检验方法和计算统计量 三确定概率P值和作出统计推断 本例P0.05,则拒绝H0,接受H1,有足够证据认为常锻炼学生的心率低于一般学生。常年参加体育锻炼有助于增强中学男生的心脏功能。,1. 对于H0只能说拒绝与不拒绝,而对H1只能说接受。2. P,则拒绝H0 ,接受H1 ,差异有统计学意义,(有足

12、够的证据)可认为不同或不等。3. P,则不拒绝H0 ,差异无统计学意义(“阴性”结果),尚不能认为不同或不等(或拒绝H0的证据尚不足) 4. 下统计检验结论只能说有、无统计学意义,而不能说明专业上的差异大小。P值越小只能说明:作出拒绝H0,接受H1的统计学证据越充分,推论时犯错误的机会越小,与专业上|0 |差异的大小无直接关系。5. 应事先确定。选0.05只是一种习惯,而不是绝对的标准。,关于假设检验的几个观点,第三节 一个总体的推断,总体方差已知,采用Z 检验,见例4-1。 总体方差未知,采用t 检验,一个总体的t 检验,4.65,0.0003,P值为H0成立的前提下,比样本数据得到的统计量

13、(t)更极端值对应的概率。,4.65,t,0,f (t),异源配对:将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,然后将每对中的两个个体随机分配给两种处理(如处理组与对照组) 同源配对:同一受试对象作两次不同的处理,或一种处理的前后比较。 优点:配对设计减少了比较对子间的个体差异。 特点:资料成对,每对数据不可拆分。,第四节 配对设计资料均数的比较,假设检验方法,H0:d0 H1:d0,表5-1 15对孪生兄弟的出生体重(kg),先出生者体重,后出生者体重,例53的假设检验,第五节 两组完全随机设计资料的方差齐性检验,使用条件,两样本均服从正态分布,例5-4 两组病人服用降压药后的

14、降压效果比较,第六节 完全随机设计两总体均数的比较,实验设计:用完全随机设计(completely random design) 方法,把受试对象随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。 调查设计:从两组具有不同特征的人群中,分别随机抽取一定数量的样本,比较某一指标在不同特征人群中是否相等。,使用条件:假定资料来自独立、随机的正态总体,且12=22,一、两总体均数的t 检验方法,有些研究的设计不能自身配对,也不便配对,只能将独立的两组均数作比较,如手术组与非手术组、新药治疗组与原用药治疗组。有的试验要把动物杀死后才能获得所需数据,除非事先作好了配对设

15、计,一般只能作两组间的比较,两组例数可以不等,这是配对设计所不能做到的。 从两总体中分别抽取容量为n1、n2的样本,比较两总体均数1和2有无差别。,计算公式:,其中,均数差的标准误,当tt/2()时,P,拒绝H0,接受H1。 当t,不拒绝H0。,两独立样本t 检验,二、两总体均数的t,检验方法,t检验的应用条件要求两个总体方差相等,如不等时,可以: 1. 变量变换 2. 非参数检验 3. 近似t检验(即t检验),三、两总体均数的Z 检验,大样本时使用(两组例数均50例),可用Z 检验,优点:计算相对简单。,t检验和Z检验的条件,t检验:要求样本来自正态分布,且两均数比较时还要求两总体方差相等。

16、 Z检验:n较大。,第七节 正态性检验,单一总体t检验时,要求样本相应的总体为正态总体 配对t检验时,要求每对数据差值的总体为正态总体 两样本t检验时,要求相应的两总体为正态总体且两总体方差相等,即方差齐性;如果方差不齐,则采用t检验,一、正态性检验(normality test),图示法 直方图、PP图、QQ图、箱图、茎叶图 2. 计算法 峰度系数、偏度系数、Shapiro-Wilk W法、Kolmogorov-Smirnov D法,置信区间可回答假设检验的问题,并能提供更多信息,但并不意味着置信区间能够完全代替假设检验。因为置信区间只能在预先规定的概率前提下进行计算,而假设检验能够获得确切的概率P值。,图3-7 置信区间在统计推断上提供的信息,假设检验应注意的问题,1. 要有严密的抽样研究计划 要保证样本是从同质总体中随机抽取。 除了对比的因素外,其它影响结果的因素应一致。 2选用的假设检验方法应符合其应用条件 要了解变量的类型是计量的还是计数的,设计类型是配对设计还是成组设计,是大样本还是小样本。,3.结论不能绝对化 4.正确理解差别有无显著性的统计意义 差别有显著性,或有统计意义,指我们有很大的把握认为原假设不正确,并非是说它们有较大的差别。 差别无显著性,或无统计意义,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论