版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五节统计分析简介→假设检验一、假设检验的基本思想
小概率与反证法(一)小概率事件与假设检验未知,只能比较样本均数与0,(-0)≠0有两种可能:1.
与0相等,差异由抽样引起;2.
与0本身不相等。检验目的:例5.1根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?两均数两率不等﹡假设检验的基本原理抽样误差所致(来自同一总体)P>0.05环境条件影响(来自不同总体)P<0.05假设检验回答检验假设:
如法官判定一个人是否犯罪,首先是假定他“无罪”(H0),然后通过侦察寻找证据,如果证据充分则拒绝“无罪”的假定(H0),判嫌疑人有罪;否则只能暂且认为“无罪”的假定(H0)成立。一.建立检验假设,确定检验水准H0(无效假设)
:假设两组或多组资料的总体均数相等,μ=μ0或μ1=μ2=μ3,两总体均数相等,差异仅由抽样误差所致。H1(备择假设)
:μ≠μ0
(双侧检验)(或μ>μ0或μ<μ0)(单侧检验)其差异不仅仅是由抽样误差所致。α=0.05或0.01(检验水准)小概率事件——P≤0.05或P≤0.01-1.961.96-1.645统计量Z对应的概率很小,如小于等于0.05,则认为事件不会发生,此时拒绝H0,有足够证据推断差异有统计学意义。2.单、双侧检验H1:
μ≠μ0,双侧,μ<μ0与μ>μ0都有可能H1:
μ>μ0,单侧H1:
μ<μ0,单侧对于本例,根据医学知识,经常参加体育锻炼的中学男生心率不会高于一般中学男生的心率。所以使用单侧。即H0:μ=μ0,H1:μ<μ0
由专业知识确定单、双侧。二.选择检验方法和计算统计量根据资料的类型和分析目的等确定相应的统计量(t值、u值、2值等)
。三.确定概率P值
P值是在H0成立前提下,在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。即获得比样本当前样本统计量更极端的概率。当:P>0.05(差异无显著性)0.01<P≤0.05(差异有显著性)P≤0.01(差异有高度显著性)四.作出统计推断如果Pα,按照α=……的检验水准,拒绝H0,接受H1,差别有统计学意义;可以认为…和…之间不同(不等,不成立…);如果P>α,按照α=……的检验水准,不拒绝H0,差别无统计学意义;不能认为…和…之间不同(不等,不成立…)。前半部分为根据统计推断结果所得的统计学结论,分号后为结合相应的专业知识,给出一个专业的结论。二、均数的t检验当样本含量较小(如n<50)时,t分布和u分布有较大的出入,所以小样本的样本均数与总体均数的比较以及两个样本均数的比较要用t检验。t检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相等。实际在实践中,只要是单峰分布,近似正态分布即可。(一)样本均数与总体均数比较的t检验亦称为单样本t检验(onesamplet-test)。即样本均数代表的未知总体均数与已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较。这时检验统计量t值的计算在H0成立的前提条件下由公式(3.4)变为:例3.6对例3.3资料进行t检验。(1)建立检验假设
H0:μ=μ0
,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数相同;
H1:μ≠μ0
,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数不同。α=0.05(双侧)
(2)计算t值本例n=25,s=6.5,样本均数=74.2,总体均数=72,代入公式(3.10)(3)确定P值,作出推断结论
本例υ=25-1=24,查附表2,t界值表,得t0.05,24=2.064,现t=1.692<t0.05,24=2.064,故P>0.05。按α=0.05的水准,不拒绝H0,差异无统计学意义。结论:即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。(二)配对资料的t检验医学科研中配对资料的三种主要类型:同一批受试对象治疗前后某些生理、生化指标的比较;同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;配对动物试验,各对动物试验结果的比较等。配对实验设计得到的资料称为配对资料。
先求出各对子的差值d的均值,若两种处理的效应无差别,理论上差值d的总体均数应为0。
所以这类资料的比较可看作是样本均数与总体均数为0的比较。
要求差值的总体分布为正态分布。
t检验的公式为:配对资料的t检验(pairedsamplest-test)例3.7
设有12名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重(kg),数据如表3-4所示。问此减肥药是否有效?
(1)建立检验假设
H0:μd=0,即该减肥药无效;
H1:μd≠0,即该减肥药有效。单侧α=0.05表3-4某减肥药研究的体重(kg)观察值(2)计算t值本例n=12,Σd=-16,Σd2
=710,差值的均数=Σd/n=-16/12=-1.33(kg)(3)确定P值,作出推断结论自由度=n-1=12-1=11,查附表2,t界值表,得单侧t0.05,11=2.201,现t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:故尚不能认为该减肥药有减肥效果。三、两样本均数比较的t检验两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independentsamplest-test)。适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。要求两总体方差要齐。样本估计值为:总体方差已知:标准误的计算公式若n1=n2时:已知S1和S2时:例3.9
测得14名慢性支气管炎病人与11名健康人的尿中17酮类固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无不同。
原始调查数据如下:病人X1:n=14;10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:n=11;17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29(1)建立检验假设
H0:μ1
=μ2
,即病人与健康人的尿中17酮类固醇的排出量相同H1:μ1≠μ2
,即病人与健康人的尿中17酮类固醇的排出量不同α=0.05
(2)计算t值本例n1=14,ΣX1=212.35,X12=3549.0919
n2=11,ΣX2=210.70,ΣX22=4397.64(3)确定P值作出推断结论
υ=14+11-2=23,查t界值表,得t0.05,23=2.069,现t=1.8035<t0.05,23=2.069,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:尚不能认为慢性支气管炎病人与健康人的尿中17酮类固醇的排出量不同。第五节均数的u检验国外统计书籍及统计软件亦称为单样本u检验(onesampleu-test)。样本均数与总体均数比较的u检验适用于:①总体标准差σ已知的情况;②样本含量较大时,比如n>100时。对于后者,是因为n较大,υ也较大,则t分布很接近u分布的缘故。一、样本均数与总体均数比较的u检验u
值的计算公式为:总体标准差σ已知时,不管n的大小。总体标准差σ未知时,但>100时。例3.4
某托儿所三年来测得21~24月龄的47名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。
问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)
实例(1)建立检验假设H0:μ=μ0
,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同H1:μ≠μ0
,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同。α=0.05(双侧)(2)计算u值本例因总体标准差σ已知,故可用u检验。本例n=47,样本均数=11,总体均数=11.18,总体标准差=1.23,代入公式(3.7)(3)确定P值,作出推断结论查u界值表(附表2,t界值表中为∞一行),得u0.05=1.96,u=1.003<u0.05=1.96,故P>0.05。按α=0.05水准,不拒绝H0,差异无统计学意义。结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。二、两样本均数比较的u检验该检验也称为独立样本u检验(independentsampleu-test),适用于两样本含量较大(如n1>50且n2>50)时,u值可按下式计算:
例3.5
测得某地20~24岁健康女子100人收缩压均数为15.27kPa,标准差为1.16kPa;又测得该地20~24岁健康男子100人收缩压均数为16.11kPa,标准差为1.41kPa。问该地20~24岁健康女子和男子之间收缩压均数有无差别?
实例(1)建立检验假设
H0:μ1
=μ2
,即该地20~24岁健康女子和男子之间收缩压均数相同;
H1:μ1≠μ2
,即该地20~24岁健康女子和男子之间收缩压均数不同。
α=0.05(双侧)(2)计算u值
本例n1=100,均数1=15.27,S1=1.16
n2=100,均数2=16.11,S2=1.41(3)确定P值,作出推断结论查u界值表(附表2,t界值表中为∞一行),得u0.05=1.96,现u>u0.05=1.96,故P<0.05。按水准α=0.05,拒绝H0,接受H1,差异有统计学意义。结论:可认为该地20~24岁健康人的收缩压均数男性高于女性。置信区间可回答假设检验的问题,并能提供更多信息,但并不意味着置信区间能够完全代替假设检验。因为置信区间只能在预先规定的概率α前提下进行计算,而假设检验能够获得确切的概率P值。图3-7置信区间在统计推断上提供的信息置信区间与假设检验
四、假设检验中作出的推断结论可能发生两种错误I型错误(弃真):拒绝实际正确的H0,I型错误的概率记为α。(1-a)即可信度:重复抽样时,样本区间包含总体参数(μ)的百分数。II型错误(纳伪):不拒绝实际不正确的H0,II型错误的概率记为β。(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力第38页第3章总体均数的区间估计和假设检验第39页联系:一般α增大,则β减小;α减小,则β增大;区别:(1)一般α为已知,可取单侧或双侧,如0.05,或0.01。(2)一般β为未知,只取单侧,如取0.1或0.2。1-β(把握度)≮0.75。两类错误的联系与区别第3章总体均数的区间估计和假设检验第40页1-β称为检验效能(poweroftest)或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。α与β的大小应根据实际情况适当取值。第3章总体均数的区间估计和假设检验第41页1.资料要来自严密的抽样研究设计2.选用假设检验的方法应符合其应用条件3.正确理解差别有无显著性的统计涵义正确理解差别有统计学意义及临床上的差别的统计学意义。4.假设检验的推断结论不能绝对化5.要根据资料的性质事先确定采用双侧检验或单侧检验五、应用假设检验的注意问题1.对于H0只能说拒绝与不拒绝,而对H1只能说接受。
2.P≤α,则拒绝H0
,接受H1
,差异有统计学意义,(有足够的证据)可认为……不同或不等。
3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度桥梁栏杆采购合同模板6篇
- 2025年度口腔诊所投资合作与风险分担合同3篇
- 二零二五版材料采购合同补充协议:技术创新共享2篇
- 二零二五版抵押借款合同与借款合同签订流程与风险防范3篇
- 二零二五版国有房产出售合同(智慧社区共建协议)3篇
- 2025年度餐饮业中央厨房租赁合同3篇
- 二零二五年度35KV变电站电气设备技术改造合同3篇
- 二零二五年房地产项目乡村振兴战略合作开发合同3篇
- 二零二五版班组分包道路养护合同3篇
- 2025版金融产品股权及债权转让与风险管理合同3篇
- 公务员考试工信部面试真题及解析
- GB/T 15593-2020输血(液)器具用聚氯乙烯塑料
- 2023年上海英语高考卷及答案完整版
- 西北农林科技大学高等数学期末考试试卷(含答案)
- 金红叶纸业简介-2 -纸品及产品知识
- 《连锁经营管理》课程教学大纲
- 《毕淑敏文集》电子书
- 颈椎JOA评分 表格
- 员工岗位能力评价标准
- 定量分析方法-课件
- 朱曦编著设计形态知识点
评论
0/150
提交评论