




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
区间估计和假设检验第1页/共44页2内容假设检验2可信区间与假设检验的关系3STATA命令4区间估计1第2页/共44页3统计推断点值估计参数估计区间估计统计推断假设检验:均数间的比较比例、率的比较
……第3页/共44页4点估计和区间估计参数估计可以分为点估计和区间估计点估计就是估计某个参数为某个数值(如样本均数,样本率等)由于随机抽样存在抽样误差,由于点估计无法评价抽样误差的大小,而区间估计可以在95%可信度的尺度上估计参数的范围,范围越小,说明参数估计的抽样误差就越小。第4页/共44页5总体均数的95%可信区间(复习)假定资料近似服从正态分布。对于随机抽样而言,统计量由和由此得到95%可信区间第5页/共44页6总体均数的95%可信区间举例例如:在某地区7岁男孩的人群中随机抽样,抽取200人,测量其身高,得到样本均数为121cm,样本标准差为5.4cm,估计该地区7岁男孩人群的平均身高在什么范围内。第6页/共44页7(1-)100%可信区间及其意义更一般而言,可以计算(1-)100%可信区间,称(1-)为可信度。可信度的意义:在同一正态总体中随机抽100个样本,每个样本可以计算一个95%可信区间,平均有95个可信区间包含该总体的总体均数。第7页/共44页8(1-)100%可信区间及其意义可信度1-越大,计算可信区间包含总体均数的正确率就越高,但可信区间的宽度就越大,也就是估计总体均数的精度就越差。一般而言,95%可信区间是兼顾了正确性和估计精度,对于特殊情况,可以计算90%可信区间或99%可信区间。对于随机抽样前而言,随机抽取一个样本量为n的样本,计算95%可信区间,则该区间将包含总体均数的概率为95%,不包含其总体均数的概率为0.05,这是一个小概率事件,对于一次随机抽样而言,一般是不会发生的,所以95%可信区间一般被认为就是总体均数的范围。第8页/共44页9假设检验(hypothesistesting)样本均数与总体均数不等或两样本均数不等,有两种可能:
由抽样误差所致两者来自不同的总体
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法第9页/共44页10总体μ随机抽样不是抽样误差?即:0?样本总体μ0=0?即:抽样误差?假设检验问题总体总体总体总体μ0总体不是抽样误差?即:0?总体μ0总体=0?即:抽样误差?不是抽样误差?即:0?总体μ0总体第10页/共44页11总体22样本2随机抽样样本均数不等的原因统计推断抽样误差即:1=2?样本1假设检验问题总体11不是抽样误差即:12?第11页/共44页12假设检验一般思想小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。假设检验的反证法思想:先根据检验假设H0,建立适当的统计量,确定假设H0成立情况下服从某个概率分布,定一个范围。H0成立时,统计量进入这个范围,是一个小概率事件(P0.05或更小),H0不成立时,统计量进入这个范围的概率较大。如果实际的抽样样本统计量进入这个范围,对H0成立情况下是一个小概率事件,一般不会发生,由此推断假设H0不成立。这就是小概率反证法思想。第12页/共44页13例如:抛硬币,通常假设:原假设H0:正反面出现的机会均等备择假设H1:正反面出现机会不均等。如果抛20次只有1次是正面的,你就有理由怀疑原来假设“正反面出现的机会均等”是错的(因为H0为真时出现这种情况的概率太小了,而H1为真时,出现这种情况的概率较大)。假设检验基本思想第13页/共44页14假设检验的基本步骤第一步:提出检验假设(又称无效假设(原假设)nullhypothesis,H0)和备择假设(alternativehypothesis,H1)。预先设定的检验水准(sizeoftest)α为0.05。选择单双侧检验
H0:假设两总体均数相等,即样本与总体或样本与样本间的差异是由抽样误差引起的。H1:假设两总体均数不相等,即两样本与总体或样本与样本间存在本质差异。第14页/共44页15第二步:选定统计方法,计算出统计量的大小。根据资料的类型和特点,可选用t检验,则计算t值或其他检验方法:秩和检验和卡方检验等。假设检验的基本步骤第15页/共44页16第三步:根据和统计量在原假设成立的分布情况把统计量可能的取值范围分为拒绝范围和不拒绝范围根据统计量计算值位于拒绝范围内还是非拒绝范围内进行统计推断,也可以根据统计量取值的大小及其分布确定检验假设成立的可能性P的大小并判断结果。假设检验的基本步骤p值指:在由H0所规定的总体中做随机抽样时,获得等于及大于(或等于及小于)现有统计量的概率第16页/共44页17t检验对资料的要求t检验的应用条件:样本来自正态总体两样本均数比较时还要求两个总体方差相等第17页/共44页18样本均数与总体均数比较样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)
有无差别。在未知总体中进行抽样,用样本均数与已知总体均数比较中,需要建立一个检验统计量,根据样本是否属于已知总体,该检验统计量的分布也不同,由此作出相应的统计推断。第18页/共44页19样本均数与总体均数比较举例说明例:研究目的:山区健康男性的脉搏均数是否大于城市成年男性。根据大量调查,已知城市健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为76.2次/分,标准差为6.0次/分,问:是否能据此认为该山区成年男性的脉搏均数高于一般成年男性?第19页/共44页20样本均数与总体均数比较第20页/共44页21样本均数与总体均数比较
上述样本均数与总体均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,做假设检验。因为σ未知,根据研究目的:山区健康男性的脉搏均数是否大于城市男性,可用t检验的单侧检验,检验过程如下:
1.建立假设
H0:µ=µ0(本例µ0=72次/分),H1:µ≠µ02.设置检验水准α为0.05。第21页/共44页22检验统计量2.
设样本所在总体为
样本为
则
第22页/共44页检验统计量分布情况和假设检验基本思想23阴影面积为检验统计量超出界值的概率H0为真时,t检验统计量服从自由度为n-1的t分布,检验统计量|t|大于界值t/2的概率为H1为真时,t检验统计量|t|大于界值t/2的概率为1-(较大或很大)第23页/共44页24样本均数与总体均数比较2.
计算统计量进行样本均数与总体均数比较的t检验,计算t值
第24页/共44页25样本均数与总体均数比较3.确定临界值,判断是否应该拒绝当H0:µ=µ0=72次/分为真时,在大多数情况下,应该在72附近,因此应该在0附近随机摆动。
当H1:µ>µ0=72为真,在大多数情况下,应该远离72,应该比较大。注意:X的总体均数不一定为72,只有H0为真时,X的总体均数为72,
第25页/共44页26样本均数与总体均数比较可以证明:当H0为真时,检验统计量服从自由度为24的t分布(即:df=24),查t分布表,临界值t0.025=2.064,检验统计量t=3.5>2.064是小概率事件,对于一次随机抽样而言,一般是不会发生的,因此拒绝H0,并且可以认为该山区成年男性的脉搏均数高于一般成年男性。第26页/共44页27定义P值和应用以下以单侧检验为例:即:在H0为真的情况下,检验统计量大于样本计算的统计量数值的概率。也就是P值=样本统计量数值开始的尾部面积(示意见图)。意义:如果t检验统计量样本值t=t0.05,则P=t0.05尾部的面积,故P=0.05。P值=P(检验统计量>检验统计量样本值|H0)第27页/共44页28定义P值和应用如果检验统计量样本值t>t0.05(u值比U0.05
更右侧),则P=t尾部的面积<t0.05尾部的面积,则P<0.05。如果检验统计量样本值t<t0.05(t值比t0.05
更左侧)
,则P=t尾部的面积>t0.05尾部的面积,则P>0.05。
综合上述,P>检验统计量值<临界值,不拒绝H0
。P<检验统计量值>临界值,拒绝H0。第28页/共44页29P值示意图在实际研究中,只需计算P值并判断是否P<决定是否拒绝H0。第29页/共44页30假设检验的基本步骤若P值小于预先设定的检验水准α,则H0成立的可能性小,即拒绝H0。若P值不小于预先设定的检验水准α,则H0成立的可能性还不小,还不能拒绝H0。P值的大小一般可通过查阅相应的界值表得到。第30页/共44页31定义P值和应用
确定概率P,作出判断以自由度v=n-1查t界值表,0.025<P<0.05拒绝H0,接受H1,可认为该山区成年健康男性的脉搏均数高于城市成年健康男性。
第31页/共44页32单侧t检验H0:=0
H1:>1
=0.05计算t检验统计量查t检验的单侧界值,如果检验统计量则拒绝H0,反之不能拒绝H0。单侧的P值=t分布中大于t的右侧尾部面积第32页/共44页33两类错误第33页/共44页34两类错误示意图第34页/共44页35检验效能H1是真的,实际拒绝H0的概率=1-
称为Power,又称为检验效能第35页/共44页36进行假设检验应注意的问题做假设检验之前,应注意资料本身是否有可比性。当差别有统计学意义时应注意这样的差别在实际应用中有无意义。根据资料类型和特点选用正确的假设检验方法。根据专业及经验确定是选用单侧检验还是双侧检验。第36页/共44页37进行假设检验应注意的问题当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的概率预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。当第一类错误增大时,第二类错误减小。第37页/共44页38进行假设检验应注意的问题判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中介地皮出租合同范例
- 入股做生意合同范例
- tt付款外贸合同范例
- oemodm委托加工合同范例
- 农村房屋个人转让合同范例
- 60岁解聘合同范例
- 假买卖合同范本
- 关于借款合同范例
- 临时家具租赁合同范例
- 枇杷种植收购协议书范本
- LY/T 2499-2015野生动物饲养场总体设计规范
- 爱德华阀门检修工艺(2)2
- GB/T 13701-1992单标准气体质谱法铀同位素分析
- AMOLED技术宝典(十年OLED技术经验总结)
- 7S稽核查检表-仓库
- 小学科学《噪音的危害与防治》优质课件
- 病理学-第3章 局部血液循环障碍
- 湖北省黄石市基层诊所医疗机构卫生院社区卫生服务中心村卫生室信息
- 打印版医师执业注册健康体检表(新版)
- 时代与变革-为人生而艺术
- 人教八年级下册英语U5Do-you-remember-what-you-were-doing?课件
评论
0/150
提交评论