总体均数的估计和假设检验_第1页
总体均数的估计和假设检验_第2页
总体均数的估计和假设检验_第3页
总体均数的估计和假设检验_第4页
总体均数的估计和假设检验_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体均数的估计和假设检验第1页,课件共54页,创作于2023年2月第一节均数的抽样误差与标准误一、概念1.统计推断

在医学研究中,通常在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这一过程称为统计推断。2.均数的抽样误差:由抽样造成的样本均数与总体均数的差异。3.均数的标准误:反映均数抽样误差大小的指标。意义:标准误越大,抽样误差越大。样本均数代表总体均数的可靠性越差。第2页,课件共54页,创作于2023年2月若某市1999年12岁男生身高总体均μ=138.7cm,现在随机抽取一个200例12岁男孩的样本,计算身高的样本均数得139.6cm,两均数之差即为抽样误差。若再次随机抽取200例12岁男孩身高,由于个体差异,其平均身高不一定是139.6cm,也不大可能等于该地12岁男孩身高的总体均数。从上例说明:抽样误差是不可避免的,但抽样误差具有一定的规律性。数理统计学证明:若从正态总体N(μ,σ2)中,反复多次随机抽取样本含量固定为n的样本(n足够大),那么这些样本均数也服从正态分布。第3页,课件共54页,创作于2023年2月参数估计是指用样本指标值(统计量)推断总体指标值(参数)。方法有点估计和区间估计。1.点估计

就是用相应样本统计量直接作为其总体参数的估计值。2.区间估计

是按预先给定的概率所确定的包含未知总体参数的一个范围,该范围称为参数的可信区间或置信区间。第二节总体均数的估计第4页,课件共54页,创作于2023年2月一.假设检验

也称显著性检验。它是利用小概率反证法思想,从问题的对立面出发间接判断要解决的问题是否成立。然后在对立面成立的条件下计算检验统计量,最后获得P值来判断。二.基本步骤第三节假设检验的基本步骤及注意事项第5页,课件共54页,创作于2023年2月

(1)无效假设:又称检验假设/零/原假设符号为H0,即样本均数所代表的总体均数μ与假设的总体均数μ0相同,记为H0:μ=μ0或μ-μ0=0(若不拒绝H0,是由于抽样误差所致)(2)备择假设:又称对立假设符号为H1,它是在拒绝H0的情况而接受的假设,即样本的均数所代表的总体均数μ与假设的总体均数μ0不同,记为H1:μ≠μ0或μ>μ0或μ<μ0

,若拒绝H0表明样本均数与μ0的差异是本质性差异。(3)检验水准:又称显著性水准,用α表示,是预先规定的概率值。一般取0.05。α取值较小,有利于提高“阳性”统计检验结果的可靠性;取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。1.建立检验假设,确定检验水准第6页,课件共54页,创作于2023年2月(1)计算统计量:应根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量(t、u、F等)。所有检验统计量都是在H0成立的前提条件下计算出来的。(2)确定P值,做出推断结论P的含义是指从H0规定的总体随机抽样,其检验的统计量等于及大于(或/和等于及小于)现有样本获得的检验统计值的概率。P与检验水准α比较,看是否为小概率事件而得出结论。所谓“小概率事件”是指实际上不大可能发生的事件。推断的结论应包含统计结论和专业结论若P≤α,拒绝H0,接受H1,有统计学意义(统计结论)可认为……不同或不等(专业结论)若P>α,不拒绝H0,无统计学意义(统计结论),还不能认为……不同或不等(专业结论)下结论时,对H0只能说:拒绝或不拒绝;而对H1只能说:接受2、选择检验方法和统计推断分析第7页,课件共54页,创作于2023年2月1.要有严格的研究设计2.不同资料应选择不同检验方法3.正确理解“显著性”一词的含义4.结论不能绝对化5.统计“显著性”与医学、临床、生物学“显著性”6.可信区间与假设检验的区别和联系三.假设检验的注意事项第8页,课件共54页,创作于2023年2月第四节t检验和u检验两种检验的关系(1)计量资料的假设检验中,最为简单、常用的方法是t检验和u检验。(2)当样本含量n较小时(如n<60),理论上要求t检验的样本随机地取自正态总体,两小样本均数比较时还要求两样本所对应的两总体方差相等,即方差齐性。(3)u检验,亦称Z-test,要求样本含量n较大(如n>60),或n虽小但总体标准差已知。第9页,课件共54页,创作于2023年2月例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?

t检验的类型第10页,课件共54页,创作于2023年2月1、单个样本t检验

是指样本均数代表的总体均数和已知总体均数的比较。如前例资料进行t检验。已知μ0=72次/分,=74.2次/分,S=6.5次/分,n=30,由于已知μ0,故选用单样本t检验。⑴建立检验假设,确定检验水准

H0:μ=μ0,山区成年男子平均脉搏数与一般成年男子相同H1:μ≠μ0,山区成年男子平均脉搏数与一般成年男子不同

α=0.05第11页,课件共54页,创作于2023年2月⑵计算检验统计量在μ=μ0成立的前提条件,计算统计量为:

本例⑶确定P值,做出推断结论(自由度公式:ν=n-1,在数学上指能够自由取值的变量个数)本例自由度ν=n-1=30-1=29,查表得t0.05(29)=2.045。因t<t0.05(29),故P>0.05,无统计学意义,按α=0.05水准,不拒绝H0,根据现有样本信息,尚不能认为该山区成年男子平均每分钟脉搏数高于一般成年男子。第12页,课件共54页,创作于2023年2月例:某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?

112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,162,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127第13页,课件共54页,创作于2023年2月1、建立数据文件SPSS操作分析步骤如下第14页,课件共54页,创作于2023年2月2、统计分析菜单选择第15页,课件共54页,创作于2023年2月第16页,课件共54页,创作于2023年2月SPSS程序第17页,课件共54页,创作于2023年2月SPSS程序3、主要输出结果及解释第18页,课件共54页,创作于2023年2月SPSS程序3、主要输出结果及解释第19页,课件共54页,创作于2023年2月练习题某地区10年前进行人口普查时,13岁男孩平均身高为1.51m。现在抽查了该地区40个13岁男孩的身高如表所示。通过本例得出该地区现在男孩的身高与10年前相比是否有显著差异。第20页,课件共54页,创作于2023年2月第21页,课件共54页,创作于2023年2月2、配对样品t检验

适用于配对设计的计量资料。配对设计资料主要有三种情况:⑴两种同质受试对象分别接受两种处理;⑵同一受试对象或同一样本的两个部分,分别接受两种处理;⑶同一受试对象处理前后的结果比较。

基本原理:假设两种处理的效应相同,即μ1=μ2,则μ1-μ2=0(即已知总体均数μd=0),即检验差数的样本均数与所代表的未知总体均数μd与0的比较。这是两均数间比较的特殊形式。若差数的总体均数不为0,说明两种处理的结果有差异或某种处理有作用。第22页,课件共54页,创作于2023年2月其检验统计量为:式中d为每对数据的差值,为差值的样本均数,为差值的标准差,为差值样本均数的标准误,n为对子数。第23页,课件共54页,创作于2023年2月例3-6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-3第(1)-(3)栏。问两法测定结果是否不同?

第24页,课件共54页,创作于2023年2月(1)建立检验假设,确定检验水准H0

:μd=0,即两种方法的测量结果相同H1

:μd≠0,即两种方法的测量结果不同α=0.05(2)计算检验统计量本例n=10,∑d=2.724,∑d2=0.8483,=∑d/n=2.724/10=0.2724按公式(3)确定P值,做出推断结论

查表t界值表得P<0.001。按α=0.05水准,拒绝H0

,接受H1

,有统计学意义。可认为两种方法对脂肪含量的测定结果不同。第25页,课件共54页,创作于2023年2月SPSS操作分析步骤如下1、建立数据文件第26页,课件共54页,创作于2023年2月2、统计分析菜单选择第27页,课件共54页,创作于2023年2月SPSS程序第28页,课件共54页,创作于2023年2月SPSS程序3、主要输出结果及解释第29页,课件共54页,创作于2023年2月3、主要输出结果及解释第30页,课件共54页,创作于2023年2月练习题为分析一种新药对某种地方病的效果,特选取10名病人进行试验,测量服药后血红蛋白的含量如表所示。问该药是否能够引起血红蛋白含量的明显变化?第31页,课件共54页,创作于2023年2月3、两独立样本t检验

适用于完全随机设计的两样本均数的比较。将受试对象完全随机地分配到两组中,每组患者分别接受不同的处理,这时只能进行两独立样本均数的比较。当两样本含量较小(如n1<60,n2<60),且均来自正态总体时,要根据两总体方差是否不同而采用不同的检验方法,即方差齐性检验。方差齐性是确定统计量分布的一个必要条件,若两总体方差相等,则直接采用t检验;若两总体方差不等,可采用t’检验或进行变量变换或用秩和方法处理。第32页,课件共54页,创作于2023年2月⑴总体方差相等时的两独立样本t检验

两总体方差相等时,可将两方差合并,估计出两者的共同方差。两样本t检验的检验统计量在H0:μ1=μ2即μ1–μ2=0的条件下为:第33页,课件共54页,创作于2023年2月例:25例糖尿病患者随机分为两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,两个月后再次测空腹血糖,问二组患者血糖值是否相同?11.616.778.115.367.613.957.512.046.412.036.410.525.48.41乙组血糖值(X2)甲组血糖值(X1)编号

12.018.0813.418.7913.520.71014.821.11115.615.21218.713乙组血糖值(X2)甲组血糖值(X1)编号第34页,课件共54页,创作于2023年2月1、建立检验假设,确定检验水准H0:μ1=μ2,两组患者的血糖值总体均数相同H1:μ1≠μ2,两组患者的血糖值总体均数不同

α=0.052、计算检验统计量今n1=12,∑X1=182.5,=2953.43

n2=13,∑X2=141.0,=1743.16

第35页,课件共54页,创作于2023年2月代入算式,算得:代入算式,求得:再代入算式,求得:第36页,课件共54页,创作于2023年2月3、确定P值,做出推断结论两独立样本t检验自由度为:v=n1+n2-2=12+13-2=23查t界值表,t0.05(23)=2.069,t0.01(23)=2.807现t>t0.05(23),P值<0.05,差异有统计学意义,按α=0.05的水准拒绝H0,接受H1,故可认为两组患者的血糖值总体均数不同。第37页,课件共54页,创作于2023年2月第38页,课件共54页,创作于2023年2月1、建立数据文件SPSS操作分析步骤如下第39页,课件共54页,创作于2023年2月2、统计分析菜单选择第40页,课件共54页,创作于2023年2月SPSS程序第41页,课件共54页,创作于2023年2月SPSS程序3、主要输出结果及解释第42页,课件共54页,创作于2023年2月第43页,课件共54页,创作于2023年2月⑵总体方差不等时的两样本t’检验

当量总体方差不等时,两样本均数的比较,可采用近似t检验——t’检验

①方差齐性检验:由于存在抽样误差,即使两总体方差相等,两样本方差也可能不等。所以要判断两总体方差是否相等,可用方差齐性检验,即F检验,其检验统计量服从F分布,公式为:检验统计量F值为两样本方差之比,若仅为抽样误差的影响,它一般不会偏离1太远。第44页,课件共54页,创作于2023年2月

求得F值后,查F界值表得P值,按所取的α水准做出判断结论。若F≥F0.05(v1,v2),P<0.05拒绝H0,接受H1,可认为两总体方差不具有齐性。若F<F0.05(v1,v2),P>0.05,可认为两总体方差具有齐性。方差齐性检步骤与前述假设检验的基本步骤相同。例:两组小白鼠,分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量,如表,问两组动物增重的总体方差是否相等?第45页,课件共54页,创作于2023年2月1、建立检验假设,确定检验水准H0:μ1=μ2,高蛋白组和低蛋白组体重的总体方差相同H1:μ1≠μ2,高蛋白组和低蛋白组体重的总体方差不同

α=0.052、计算检验统计量编号高蛋白组体重增加量低蛋白组体重增加量1503624738342374433853936651397433784835951331042371150391243341336第46页,课件共54页,创作于2023年2月3、确定P值,做出统计推断

自由度v1=12-1=11,v2=13-1=12查表,F0.05(11,12)=3.34,F>F0.05(11,12),故P<0.05,有统计学意义,按α=0.05水准,拒绝H0,接受H1。故认为两总体方差不等,不可直接用方差相等的两样本t检验。②t’检验

t’检验有三种方法可供选择,这里只介绍Cochran&Cox法(1950)。该法是对临界值校正。其检验统计量t’为:

v1=n1-1,v2=n2-1

第47页,课件共54页,创作于2023年2月校正临界值t’α为:t’值与P值的关系同t值与P值的关系相同。但当n1=n2时,ν1=ν2=ν,t’=t,t’α=tα(v)

,此时即使方差不齐,也可用t检验。下面我们对上例资料进行t’检验,比较两组小白鼠增重均数是否不同?1、建立检验假设,确定检验水准H0:μ1=μ2,两组小白鼠增重的总体均数相同H1:μ1≠μ2

,两组小白鼠增重的总体均数不同

α=0.052、计算检验统计量第48页,课件共54页,创作于2023年2月

两总体方差不齐,n1,n2均小于50,且n1≠n2,不能用总体方差相等的两样本t检验,应选用t’检验。3、确定P值,做出推断结论查t界值表t0.05(11)=2.201,t0.05(12)=2.179.代入算式:第49页,课件共54页,创作于2023年2月

t’=3.103>t’0.05=2.198,得P<0.05,差异有统计学意义,按α=0.05水准,拒绝H0,接受H1。可认为两组不同蛋白摄入量小白鼠增重的均数不同,高蛋白组高于低蛋白组。

第50页,课件共54页,创作于2023年2月两独立样本t检验应用的前提条件:1.数据中有无应舍异常值数据中特大或特小值,应查找原因,如属技术差错,应予舍弃;如查不出原因,但该值已在X±3s范围之外,应考虑舍弃。2.数据应符合正态分布R=4×n-D23.两组方差齐性问题第51页,课件共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论