区间估计和假设检验_第1页
区间估计和假设检验_第2页
区间估计和假设检验_第3页
区间估计和假设检验_第4页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、区间估计和假设检验区间估计和假设检验 赵耐青赵耐青复旦大学卫生统计教研室复旦大学卫生统计教研室2内容内容假设检验假设检验2可信区间与假设检验的关系可信区间与假设检验的关系3STATA命令命令4区间估计区间估计13统计推断统计推断 点值估计点值估计 参数估计参数估计 区间估计区间估计统计推断统计推断 假设检验:均数间的比较假设检验:均数间的比较 比例、率的比较比例、率的比较 4点估计和区间估计点估计和区间估计v参数估计可以分为点估计和区间估计参数估计可以分为点估计和区间估计v点估计就是估计某个参数为某个数值点估计就是估计某个参数为某个数值(如样如样本均数,样本率等本均数,样本率等)v由于随机抽样

2、存在抽样误差,由于点估计由于随机抽样存在抽样误差,由于点估计无法评价抽样误差的大小,而区间估计可无法评价抽样误差的大小,而区间估计可以在以在95%可信度的尺度上估计参数的范围,可信度的尺度上估计参数的范围,范围越小,说明参数估计的抽样误差就越范围越小,说明参数估计的抽样误差就越小。小。5总体均数的区间估计总体均数的区间估计v 假定资料假定资料 近似服从正态分布近似服从正态分布 。v 对于随机抽样而言,计算统计量对于随机抽样而言,计算统计量v 因此因此v 基于随机抽样而言和基于随机抽样而言和 成立的概率为成立的概率为0.95前提下前提下v 总体均数的区间估计总体均数的区间估计 v 这个区间称为总

3、体均数的这个区间称为总体均数的95%可信区间可信区间12,nXXX2( ,)N (1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/2| | tt总体均数的区间估计总体均数的区间估计12,nXXX2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX(1)/Xtt nSn分布2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX0.05/2| | tt0.05/2P

4、r(| |)0.95tt(1)/Xtt nSn分布2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX0.05/2| | tt0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX0.05/20.05/2tStSXXnn0.05/2| | tt0.05/2Pr(| |)0.95tt(1)/Xtt nSn分布2( ,)N 总体均数的区间估计总体均数的区间估计12,nXXX0.05/20.05/2tStSXXnn0.05/20.05/2tStSXXnn0.05/2| | tt0.05/20.05/2tStSXXn

5、n0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn12,nXXX(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/2tStSXXnn2( ,)N 12,nXXX(1)/Xtt nSn分布0.05/2Pr(| |)0.95tt0.05/2| | tt0.05/20.05/20.05/20.05/2/XtStSttXSnnn 0.05/20.05/2tStSX

6、Xnn6总体均数的总体均数的95%可信区间举例可信区间举例v例如:在某地区例如:在某地区7岁男孩的人群中随机抽样,抽岁男孩的人群中随机抽样,抽取取200人,测量其身高,得到样本均数为人,测量其身高,得到样本均数为121cm,样本标准差为,样本标准差为5.4cm,估计该地区,估计该地区7岁男孩人群的平均身高在什么范围内岁男孩人群的平均身高在什么范围内。0.05/21.972 5.3121200121 0.753(120.247,121.753)tSXncm7(1- ) 100%可信区间及其意义可信区间及其意义v更一般而言,可以计算(更一般而言,可以计算(1- ) 100%可信区间,称可信区间,称

7、(1- )为可信度。)为可信度。v可信度的意义:在同一正态总体中随机抽可信度的意义:在同一正态总体中随机抽100个样本,每个样本可以计算一个个样本,每个样本可以计算一个95%可信区间,平均有可信区间,平均有95个可信区间包含该总个可信区间包含该总体的总体均数。体的总体均数。/ 2,1ntSXn8(1- ) 100%可信区间及其意义可信区间及其意义v可信度可信度1- 越大,计算可信区间包含总体均数的越大,计算可信区间包含总体均数的正确率就越高,但可信区间的宽度就越大,也就正确率就越高,但可信区间的宽度就越大,也就是估计总体均数的精度就越差。是估计总体均数的精度就越差。v一般而言,一般而言,95%

8、可信区间是兼顾了正确性和估可信区间是兼顾了正确性和估计精度,对于特殊情况,可以计算计精度,对于特殊情况,可以计算90%可信区可信区间或间或99%可信区间。可信区间。v对于随机抽样前而言,随机抽取一个样本量为对于随机抽样前而言,随机抽取一个样本量为n的样本,计算的样本,计算95%可信区间,则该区间将包含可信区间,则该区间将包含总体均数的概率为总体均数的概率为95%,不包含其总体均数的,不包含其总体均数的概率为概率为0.05,这是一个小概率事件,对于一次随,这是一个小概率事件,对于一次随机抽样而言,一般是不会发生的,所以机抽样而言,一般是不会发生的,所以95%可可信区间一般被认为就是总体均数的范围

9、。信区间一般被认为就是总体均数的范围。9假设检验假设检验(hypothesis testing)v样本均数与总体均数不等或两样本均数不等,有样本均数与总体均数不等或两样本均数不等,有两种可能:两种可能: 由抽样误差所致由抽样误差所致 两者来自不同的总体两者来自不同的总体 假设检验假设检验是用来判断样本与样本,样本与总体的差异是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法是由抽样误差引起还是本质差别造成的统计推断方法10总体总体随机抽样随机抽样不是抽样误差?不是抽样误差?即:即:0?X样本样本总体总体0 = 0?即:抽样误差?即:抽样误差?假设检验问题假设检

10、验问题总体总体总体总体X总体总体总体总体0X总体总体不是抽样误差?不是抽样误差?即:即:0?总体总体0X总体总体 = 0?即:抽样误差?即:抽样误差?不是抽样误差?不是抽样误差?即:即:0?总体总体0X总体总体11总体总体2 2样本样本2随随机机抽抽样样样本均数不等的原因样本均数不等的原因统计推断统计推断抽样误差抽样误差即:即: 1= 2 ?样本样本1假设检验问题假设检验问题总体总体1 121XX 不是抽样误差不是抽样误差即:即: 12 ?12假设检验一般思想v小概率思想是指小概率事件(小概率思想是指小概率事件(P0.01P0.01或或P0.05P0=72为真,在大多数情况下, 应该远离72,

11、 应该比较大。注意:X的总体均数不一定为72,只有H0为真时,X的总体均数为72,726/25XtXX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差72X 即:才是抽样误差72X 即:不一定是抽样误差726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差X726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差726/25XtX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差X726/25XtX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差26样本均数与总体均数比较样本均数与总体均数比较可以证明:当0为真

12、时,检验统计量服从自由度为24的t分布(即:df=24),查t分布表,临界值t0.025=2.064,检验统计量t=3.52.064是小概率事件,对于一次随机抽样而言,一般是不会发生的,因此拒绝0,并且可以认为该山区成年男性的脉搏均数高于一般成年男性。27定义值和应用定义值和应用v 以下以单侧检验为例:v 即:在0为真的情况下,检验统计量大于样本计算的统计量数值的概率。也就是值=样本统计量数值开始的尾部面积(示意见图)。v 意义:如果t检验统计量样本值t=t0.05,则P=t0.05尾部的面积,故=0.05。值值=P(检验统计量检验统计量检验统计量样本值检验统计量样本值0)28定义值和应用定义

13、值和应用v 如果检验统计量样本值tt0.05(u值比U0.05更右侧),则P=t尾部的面积t0.05尾部的面积,则P0.05。v 如果检验统计量样本值tt0.05尾部的面积,则P0.05。综合上述,综合上述,P 检验统计量值检验统计量值临界值临界值,不拒绝不拒绝H0 。 P临界值,拒绝临界值,拒绝H0。29值示意图值示意图在实际研究中,只需计算值并判断是否在实际研究中,只需计算值并判断是否P 决定是否拒绝决定是否拒绝0。30假设检验的基本步骤假设检验的基本步骤 若若P值小于预先设定的检验水准值小于预先设定的检验水准 ,则,则H0成立的可能性成立的可能性小,即拒绝小,即拒绝H0。 若若P值不小于

14、预先设定的检验水准值不小于预先设定的检验水准 ,则,则H0成立的可能成立的可能性还不小,还不能拒绝性还不小,还不能拒绝H0。 P值的大小一般可通过查阅相应的界值表得到。值的大小一般可通过查阅相应的界值表得到。31定义值和应用定义值和应用v 确定概率,作出判断确定概率,作出判断 以自由度v=n-1查t界值表,0.025P 1 v =0.05v 计算计算t检验统计量检验统计量v 查查t检验的单侧界值检验的单侧界值 ,如果检验统计量,如果检验统计量v 则拒绝则拒绝H0,反之不能拒绝,反之不能拒绝H0。v 单侧的单侧的P值值=t分布中大于分布中大于t的右侧尾部面积的右侧尾部面积nSXt/00.05,1

15、nt0.05tt33两类错误两类错误 H0是真的 H1是真的 拒绝H0的概率 (称为I类错误) 1 接受H0的概率 1 (称为II类错误) 34两类错误示意图两类错误示意图35检验效能检验效能H1是真的,实际拒绝是真的,实际拒绝H0的概率的概率= 1- 称为称为Power,又称为检验效能又称为检验效能36进行假设检验应注意的问题进行假设检验应注意的问题v做假设检验之前,应注意资料本身是否有可比性。v当差别有统计学意义时应注意这样的差别在实际应用中有无意义。v根据资料类型和特点选用正确的假设检验方法。v根据专业及经验确定是选用单侧检验还是双侧检验。37进行假设检验应注意的问题进行假设检验应注意的

16、问题v当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的概率预先是知道的,即检验水准那么大;v当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。v当第一类错误增大时,第二类错误减小。38进行假设检验应注意的问题进行假设检验应注意的问题v判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。v报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。39进行假设检验应注意的问题进行假设检验应注意的问题vt检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。 当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。 当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布) 当x为未知分布时应采用秩和检验。40可信区间与假设检验的关系可信区间与假设检验的关系v不同:不同: 可信区间可信区间量的问题量的问题 假设检验假设检验质的问题质的问题可信区间亦可用于回答假设检验的问题可信区间亦可用于回答假设检验的问题可信区间比假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论