山东大学卫生统计学课件 第四章 总体均数的估计和假设检验_第1页
山东大学卫生统计学课件 第四章 总体均数的估计和假设检验_第2页
山东大学卫生统计学课件 第四章 总体均数的估计和假设检验_第3页
山东大学卫生统计学课件 第四章 总体均数的估计和假设检验_第4页
山东大学卫生统计学课件 第四章 总体均数的估计和假设检验_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 总体均数的估计和假设检验 学时分配:8学时掌握内容:1t分布的概念和特征2总体均数的区间估计3总体率的区间估计4假设检验的基本步骤5假设检验的基本原理6常用的数值型变量假设检验的方法熟悉:1、抽样误差的概念2、引起抽样误差的原因3、均数、率的标准误的计算4、标准差和标准误的区别了解内容:1假设检验中概率P与检验水准的关系2抽样研究的意义3中心极限定理的内容 第一节抽样研究与抽样误差一抽样研究(一)抽样研究的意义前面已经讲述了总体与样本两个统计学术语,人们在医学研究中多采用由样本信息来推论总体特征的方法,这在实际工作中是十分必要的,经理论与实践证明也是行之有效的。目前对某一总体

2、进行研究的最重要、最常用的方法就是抽样研究。由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。即使对有限总体来说,若包含的观察单位数过多,需要耗费大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。有的时候,观察的实质就是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。如对一批注射药剂作质量检查,不可能将所有的药剂瓶都打开加以检验,这显然是不可能的。抽样研究作为一种由部分认识整体的观察方法,从古到今一直被人们自觉或不自觉地应用着,如炒菜时尝尝咸淡,就医时取几滴血作化验等。实践证明这是行之有效的方法。目前抽样研究的理论与技术已发展成熟,只要严格按照有关抽样研究的要求去做

3、,这是完全可行的。所以,在实际工作中人们多采用抽样研究的方法,其目的就是要用样本信息来推断总体特征,这就叫统计推断(statisticalinference)。(二)抽样研究和抽样误差抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error),同样,来自同一总体的若干样本的统计量之间,也会存在

4、误差,这种误差也反映在样本统计量与总体参数间的差异。当样本是来自相应总体的随机样本时,抽样误差为随机误差,其误差大小可以依据中心极限定理进行估计。中心极限定理的内容是,以数值变量资料为例,若从均数为的正态总体中以固定n反复多次(比如100次)抽样时,所得的样本均数的分布是正态分布;即使是从偏态总体中抽样,只要足够大,的分布也近似正态分布。在抽样研究中抽样误差是不可避免的,根据资料的性质和指标种类的不同,抽样误差有多种,例如:从某地7岁男童中随机抽取110名,测得平均身高为119.95cm,该样本均数不一定等于该地7岁男童身高的总体均数,这种样本均数与总体均数间的差别,称为均数的抽样误差。某县为

5、血吸虫病流行区,从该县人群中随机抽取400人,测得的血吸虫感染人数为60人,感染率为15%,该样本率不一定等于该地人群的总体感染率。此为样本率与总体率之间的差别,称为率的抽样误差。此外,样本方差和相应的总体方差也存在抽样误差,后面介绍的相关系数和回归系数也有抽样误差的问题。 二均数的抽样误差在抽样研究中,若从同一总体中随机抽取样本含量相同的若干个样本,并计算出某种样本统计量(如样本均数),由于生物间的个体变异是客观存在的,抽样误差是不可避免的,这些样本统计量之间具有离散趋势。数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。这个指标称为标准误(standarderror),标

6、准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。本章主要介绍最常用的均数标准误以及率的标准误。(一)均数标准误的意义将来自同一总体的若干个样本均数看成一组新的观察值,研究其频数分布,包括集中趋势和离散趋势,可计算样本均数的均数和标准差。例3.1假定某市16岁女中学生的身高分布服从均数()为155.4cm,标准差()为5.3cm的正态分布。现用电子计算机作抽样模拟试验,每次随机抽出10个观察值(即样本含量n=10),共抽取100个样本,求得100个样本均数并编制成频数分布表如表4.1。表4.1100个样本均数的频数分布(=155.4cm,=5.3

7、cm)组段(cm)频数1511152615315154191552715616157815851593合计100从表4.1中可以发现,当原始观察值的分布为正态分布时,这些样本均数的频数分布基本服从正态分布。统计理论证明,若原始观察值的分布为偏态分布,当样本含量n足够大时,其样本均数的分布仍近似服从正态分布。所以,可以求得样本均数的均数为155.38cm,与总体均数155.4cm接近。中心极限定理表明,样本均数的均数等于原总体的总体均数()。同样,也可以求得样本均数的标准差为,为了与描述观察值离散程度的标准差相区别,用均数标准误来表示样本均数的标准差。均数标准误反映来自同一总体的样本均数的离散程

8、度以及样本均数与总体均数的差异程度,也是说明均数抽样误差大小的指标。均数标准误大,说明各样本均数的离散程度大,抽样误差就大。反之亦然。(二)均数标准误的计算数理统计可以证明,均数标准误的计算公式为:(4.1)式中为均数标准误的理论值,为总体标准差,n为样本含量。已知时,可按式(4.1)求得均数标准误的理论值。上述例子中=155.4cm,n=10,可得:=计算结果与样本均数的标准差1.71cm相近。由于在抽样研究中常属未知,通常用一个样本的标准差(s)来估计,所以,在实际工作中,常用式(4.2)计算均数标准误的估计值()(4.2)由式(4.1)或(4.2)可见,当n一定时,均数标准误与标准差成正

9、比。标准差越大,均数标准误越大,即观察值的离散程度越高,均数的抽样误差越大。当标准差一定时,均数标准误和成反比。样本含量越大,均数的抽样误差越小。因此,在实际工作中,可通过适当增加样本含量和减少观察值的离散程度(如选择同质性较好的总体)来减少抽样误差。(三)均数标准误的用途:1衡量样本均数的可靠性由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠。2估计总体均数的可信区间。3用于均数的假设检验。  第二节 t分布 一t分布(t-distribution)(一)u分布在前一章中,我们已经讲述了正态分布(normal distribution)是数理统计中的一种重要的理论

10、分布,是许多统计方法的理论基础。正态分布有两个参数,和,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为=0,=1的标准正态分布(standard normal distribution),亦称u分布。根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n(本次试验n=10)抽取若干个样本时,样本均数的分布仍服从正态分布,即N(,)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)(二)t分布由于在实际工作中,往往是未知的,常用s作为的估计值,为了与u变换区别,称为t变换t=,

11、统计量t 值的分布称为t分布。t分布有如下特征:1以0为中心,左右对称的单峰分布;2t分布是一簇曲线,其形态变化与n(确切地说与自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布(u分布)曲线,如图4.1。t=图4.1自由度为1、5、的t分布对应于每一个自由度,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。因此,统计学家上根据自由度的大小与t分布曲线下面积的关系,编制了附表2,t界值表,以便于应用。表中的横标目为自由度,纵标目为概率P,表中数字表示自由度为某值时,P为某值时,t的界值。因t分布是以0为中心的对称分布,故附表中只列出

12、正值,如果算出的t值为负值,可以用绝对值查表。t分布曲线下面积为95%或99%的界值不是一个常量,而是随着自由度大小而变化的,分别用和表示。第三节 总体均数的估计 统计推断包括两个重要的方面:参数估计和假设检验。假设检验在后面的章节中讨论,这里先讨论参数估计。参数估计就是用样本指标(称为统计量,statistic)来估计总体指标(参数,parameter)。参数估计有两种方法:(一)点估计(point estimation)如在服从正态分布的总体中随机抽取样本,可以直接用样本均数来估计总体均数,样本标准差来估计总体标准差。该方法虽然简单易行,但未考虑抽样误差,而抽样误差在抽样研究中又

13、是客观存在的、不可避免的,会随不同的样本对总体参数作出不同的点估计。(二)区间估计(interval estimation)即按一定的概率(可信度)估计未知的总体参数可能所在的范围(或称可信区间)的估计方法。区间估计是在随机抽取样本后,考虑抽样误差存在的情况下的估计方法,较为准确可靠。统计学上通常用95%(或99%)可信区间表示总体参数有95%(或99%)的概率在某一范围,可根据资料的条件选用不同的方法。下面以总体均数的95%可信区间为例,介绍其计算公式。已知时按正态分布原理计算,未知时按t分布的原理计算。1已知时由u分布可知,正态曲线下有95%的u值在±1.96之间,即:P(-1.

14、96u+1.96)=0.95P(-1.96+1.96)=0.95移项后整理得,故总体均数的95%可信区间为()(4.5)2未知,但n足够大(如n>100)时由t分布可知,当自由度越大,t分布越逼近u分布,此时t曲线下有95%的t值在±1.96之间,即:P(-1.96t+1.96)=0.95P(-1.96+1.96)=0.95 P()=0.95故总体均数的95%可信区间为(,)(4.6)3未知且n小时某自由度的t曲线下有95%的t值在±之间,即:故总体均数的95%可信区间为(,)(4.7)例3.3对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9c

15、m,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少?该例n=20, n较小,按公式(4.7)计算。=20-1=19,查t界值表,得=2.093估计这批结核菌素在该人群中使用,皮试的平均浸润直径的95%可信区间为(10.9-2.093*3.86/,10.9+2.093*3.86/)cm即(9.1,12.7)cm。(三)可信区间的注意问题1可信区间的涵义意思是从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确,估计错误的只有5次。5%是小概率事件,实际发生的可能性很小,当

16、然这种估计方法会有5%犯错误的风险。2可信区间的两个要素:一是准确度,反映在可信度的大小,即区间包含总体均数的概率的大小,愈接近1愈好。二是精密度,反映在区间的长度,长度愈小愈好。在样本含量确定的情况下,二者是矛盾的,若只管提高可信度,会把区间变得很长,故不宜认为99%可信区间比95%可信区间好,需要兼顾准确度和精密度,一般来说95%可信区间更为常用,在可信度确定的情况下,增加样本含量,可减少区间长度,提高精密度。(王淑康)第四节 假设检验的基本步骤 一、假设检验的基本思想在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比较两个

17、或几个总体的参数是否相同,也只能分别从这些总体中抽取样本,根据这些样本的统计量作出统计推断,籍此比较总体参数是否相同。由于存在抽样误差,总体参数与样本统计量并不恰好相同,因此判断两个或多个总体参数是否相同是一件很困难的事情。如医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次分钟,标准差为5.2次分钟,但是根据医学常识,一般男子的平均脉搏次数为72次分钟,问该山区男子脉搏数与一般男子是否不同?要回答这个看似简单的问题并非易事。这个问题难以从正面直接回答,可以先假定该山区所有男子脉搏数数值组成一个总体,其总体均数和标准差均为未知数,不妨分别以、表示。如果我们假设该山区男子的脉搏

18、数与一般地区的男子相同,即属于同一总体,72,所测量的25名男子的平均脉搏数(样本均数)之所以不恰好等于72次分,是由于抽样误差所致。如果上述假设成立,则理论上讲,样本均数很可能在总体均数(72)的附近,样本均数远离总体均数的可能性很小。如果将样本均数变换为值,则值很可能在0的附近,值远离0的可能性很小。如果值很小上述假设可能不正确,可拒绝上述假设。假设检验包括单侧检验和双侧检验两种情况,当根据专业知识已知两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否则,宜用双侧检验。假设检验中的如何下检验结论(以检验为例):1、单侧检验:如计算统计量为正值拒绝,接受不拒绝如计算统

19、计量为负值拒绝,接受不拒绝2、双侧检验:拒绝,接受不拒绝二、假设检验的一般步骤假设检验一般分为三步:1、建立假设,确定检验水准。一般假设检验中的检验假设(或称为零假设、无效假设),假设样本来自同一总体,即其总体参数相等。往往建立两个假设,除建立检验假设外,还建立备择假设,作为拒绝检验假设时的备选假设,检验水准为拒绝检验假设是犯第一类错误的概率。2、为选择检验方法,并计算统计量。的类型不同、变量的分布类型不同、研究目的不同,都决定着选择何种检验方法。因此需选择合适的检验方法,并计算统计量。3、为根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与检验水准比较,若,则

20、拒绝,接受;若,则不拒绝。第五节 样本与总体比较的假设检验 本章第一节中,在某山区随机测量25名男子的脉搏数得一样本均数,而一般男子的脉搏数为可视为一般地区男子的总体均数。假设该山区男子的脉搏数与一般地区相同,即于一般地区的男子属于同一总体,并将该样本均数转化为值(式1)(式2)式中为样本均数;为已知总体的均数;为样本标准差;为样本含量。如果样本含量足够大时,可将样本均数转化为值(式3)例1以上述资料为例,比较某山区男子的脉搏数与一般地区的男子是否相同。假设检验的过程如下:1、建立假设,确定检验水准。:该山区男子脉搏数与一般地区男子相等,即:该山区男子脉搏数与一般地区男子不等,即2、

21、选择检验方法计算统计量自由度3、查界值表,确定值,以查界值表得,本例的统计量值为2.115,大于界值,因此,按水准,拒绝,接受,可认为该山区男子的脉搏数与一般地区的男子不同。本例中值的确切值为如果本例用单侧检验,其与双侧检验相同,但有不同,根据专业知识知道,山区男子的脉搏数不会低于一般地区,因此为:该山区男子脉搏数高与一般地区男子,即,所得的值为:。 第六节 配对设计(paired design)资料的假设检验 配对设计是为了控制某些非处理因素对实验结果的影响。将那些因素相同或相近的受试对象配成对子,使得同一对子中的受试对象除处理因素不同外,其他因素相同或相近,同一对子中的

22、两受试对象分别接受不同的处理,其实验结果的差异可以简单的认为是“纯”处理因素的作用。对于配对资料可以分析其差值。对配对资料的分析,一般用配对检验(paired t-test),其检验假设为:差值的总体均数为零。计算统计量的公式为(式4)(式5)式中为差值的均数;为差值的标准差;为对子数。例1将大白鼠按照同窝、同性别和体重接近的的原则配成8对,每对中两只大白鼠随机确定一只进食正常饲料,另一只进食缺乏维生素E饲料,一段时间以后,测量两组大白鼠的肝中维生素的A的含量如表1,问食物中维生素E的缺乏能否影响大白鼠肝中维生素A的含量?表1两种饲料喂养大白鼠肝中维生素A的含量对子号(1)正常饲料(2)缺乏维生素E饲料(3)差值(4)(5)13350245011001210000220002400-400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合计65007370000计算得:两种饲料喂养的大白鼠肝中维生素含量相等,即:两种饲料喂养的大白鼠肝中维生素含量不等,即查表知,按水准,拒绝,接受,可认为两组大白鼠肝中维生素A的含量不等,维生素E缺乏饲料组的大白鼠肝中维生素A含量低。 第七节 两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论