总体均数的估计和假设检验_第1页
总体均数的估计和假设检验_第2页
总体均数的估计和假设检验_第3页
总体均数的估计和假设检验_第4页
总体均数的估计和假设检验_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体均数的估计和假设检验Statisticalinference:EstimationofParameterandHypothesisTest1

内容均数的抽样误差和标准误t分布总体均数的估计假设检验t检验和z检验2一、均数的抽样误差和标准误1.统计推断:由样本信息推断总体特征。2.抽样误差:样本指标值与总体指标值之间的差异。根源在于个体变异,不可避免,但规律可以认识。3.标准误:样本均数的标准差称为标准误,它是说明均数抽样误差大小的指标。可通过增加样本例数减少标准误。34.标准差和标准误的区别和联系(1)区别:指标意义应用标准差衡量观察值离散趋势。s越大,表示观察值越分散,均数的代表性越差。统计描述:正态分布资料的离散趋势、频数分布;医学参考值范围的估计。标准误样本均数的变异程度,表示抽样误差的大小。标准误越大,样本均数的可靠性越小。统计推断:总体均数的区间估计;假设检验:两均数间的比较,t检验等。44.标准差和标准误的区别和联系(2)联系:二者都是变异指标。在样本含量一定时,标准差越大,标准误越越大。5二、t分布1.概念:若y服从标准正态分布N(0,1),x服从自由度为ν的

2

分布,则随机变量:服从自由度为ν的t分布。若x服从N(μ,

2),则,则有服从t分布。6

(1)对称于零的单峰分布,其高峰较标准正态分布低,两端较标准正态分布高。(2)自由度越小,则t分布与标准正态分布相差越大;随着自由度的增加,t分布逼近标准正态分布。当自由度为∞时,t分布就为标准正态分布。

2、t分布的图形和特点:7t分布的特征8三、总体均数的估计1、点估计:样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。例1:为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试估计该地1岁婴儿的血红蛋白的平均浓度。由于=123.7g/L,则μ=123.7g/L。9三、总体均数的估计2、区间估计:按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。(1)小样本资料的估计(

未知)由可得到当可信度1-α时,计算总体均数的可信区间的通式为:10例2:试求例1中该地1岁婴儿血红蛋白平均值的95%的可信区间。由于n=25,s=11.9g/L,ν=n-1=24,α取双尾0.05,查t界值表得:t0.05,24=2.064,代入通式中,得到所求可信区间为:(123.7-2.064×2.38,123.7+2.064×2.38)即:(118.79,128.61)g/L。11三、总体均数的估计(2)σ已知,或σ未知但是大样本资料时,按z分布,通式为:σ已知:

σ未知但n较大时:(3)可信区间与可信限。可信区间是指包括总体参数的范围,可信限是指范围的两个界限,可信区间的上下限即为可信限。124、可信区间与参考值范围的

区别和联系。(1)区别:可信区间是指用样本指标估计的相应的总体指标所在的范围。如:按95%的可信度估计的总体均数的可信区间用式:计算,所用的是标准误。

参考值范围是指包括总体中大多数个体值的估计范围。如:正态分布资料,95%的双侧参考值范围用式:计算,所用的是标准差。13(2)联系:二者都是根据一定的可信度进行的估计,即有一定的概率性。如:在中包括总体均数的可能性和在中包括的个体值均为95%。14例3:根据大量调查,一般健康成年男子的平均血红蛋白含量为140.00g/L,现某医生在山区随机测定了25名健康成年男子,其血红蛋白均数为153.64g/L,标准差为24.82g/L,故认为该山区成年男子的血红蛋白均数高于一般健康成年男子血红蛋白均数。15四、假设检验1、概念:通过样本与总体、样本与样本之间的比较来判断总体是否相同。即判断样本与总体、样本与样本的差异是由抽样误差引起的,还是有本质的区别。2、基本思想:(1)小概率思想(2)反证法思想163、假设检验的基本步骤(1)提出无效假设和备择假设

H0:样本与总体、样本与样本之间的差异是由抽样误差引起的。

H1:存在本质区别。 确定检验水准α(一般取0.05)(2)选定统计方法和计算统计量173、假设检验的基本步骤(3)确定P值并判断结果:

若P>α,则不能拒绝H0,可认为差别是由抽样误差引起的。

若P≤α,则拒绝H0,接受H1,可认为存在本质差别。183、假设检验的基本步骤建立检验假设H0:H1:=0.05选择检验方法计算统计量确定P值判断结果不拒绝H0拒绝H0,接受H1P≤

P>

19五、t检验和z检验1、应用条件:

t检验:当样本例数n较小时,要求样本取自正态总体。

z检验:样本例数较大,或n虽小而总体标准差已知。202、样本均数与总体均数比较的t检验目的:推断样本所代表的未知总体均数与已知总体均数有无差别。H0:μ=μ0H1:μ≠μ0所用公式:211.建立检验假设,确定检验水准H0:山区成年男子血红蛋白均数与一般成年男子血红蛋白均数相同H1:山区成年男子的血红蛋白均数高于一般单侧α=0.052.计算检验统计量t值

t=2.7483.确定P值,作出统计推断

0.005<P<0.012、样本均数与总体均数比较的t检验223、配对t检验(1)配对资料a.配对设计资料:将受试对象按一定条件配成对子,分别给予每对中的两个受试对象以不同的处理。b.自身对照资料:同一个受试对象给予不同的处理或者处理前后的观察结果。23(2)检验目的:推断差数的总体均值是否为零,即处理是否有效或两种处理效果是否相同。(3)配对设计可减少试验误差,配对t检验可提高统计效率。3、配对t检验243、配对t检验所用公式:

H0:μd=0

H1:μd≠0自由度v=n-125例4:为探讨MRI无创性测量肺脉舒张压的新途径,分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压,资料如表1。问两种方法的检测结果有无差别?26表1两种方法检测患者的肺脉舒张压(kPa)患者编号MRI右心导管d13.963.420.5424.514.53-0.0236.495.850.6447.106.790.3155.195.53-0.3466.305.760.5473.843.680.1682.672.420.2595.775.81-0.04104.114.12-0.01114.955.32-0.37123.252.850.4027检验步骤:1.H0:两种方法检测的肺脉舒张压相同

H1:两种方法检测的肺脉舒张压不同

α=0.052.计算t值:t=1.77283.确定P值,判断结果:

P=0.104不拒绝H0,可认为(或还不能认为)…

28例5:为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清总胆固醇含量(mmol/L),结果见表2。问新药是否影响女性血清总胆固醇含量?29表2女性血清总胆固醇含量(mmol/L)配对号新药组安慰剂组d14.46.2-1.825.05.2-0.235.85.50.344.65.0-0.454.94.40.564.85.4-0.676.05.01.085.96.4-0.594.35.8-1.5105.16.2-1.130检验步骤:1.H0:避孕新药对女性血清总胆固醇含量…

H1:…总胆固醇含量有影响2.计算t值:t=-1.5423.确定P值,判断结果:

P=0.154不拒绝H0,可认为(或还不能认为)…

31例6:

某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表3。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差s1=0.985mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl,标准差s2=1.626mg/dl,配对t检验结果,t=-3.098,P<0.05,故认为脑病病人尿中类固醇排出量高于正常人。32表3正常人和脑病病人尿中类固醇排出量

(mg/dl)正常人脑病病人2.905.285.418.795.483.844.606.464.033.795.106.644.975.894.244.574.377.713.056.022.784.06334、成组t检验(1)用于完全随机设计(completelyrandomizeddesign)的两个样本均数或两个独立样本(independentsample)的均数间的比较。(2)目的是推断两样本是否来自同一总体,或两样本分别代表的总体均数是否相等。34(3)资料要求:两样本来自正态或近似正态分布,并且两组总体方差相等。(4)对数正态分布的资料,在进行t检验时,要先把数据进行对数转换,用对数值作为新变量进行成组t检验。

4、成组t检验354、成组t检验(4)公式:

H0:μ1=μ2

H1:μ1≠μ2自由度v=n1+n2-236检验步骤:1.H0:两种人群尿中类固醇排出量…

H1:两种人群尿中类固醇排出量…

α=0.052.计算t值:t=-2.5573.确定P值,判断结果:0.01<P<0.02拒绝H0,接受H1,可认为…37例7:表4野木瓜和哌替啶的镇痛时间处理组例数均数(h)标准差野木瓜306.21.4哌替啶283.51.238检验步骤:1.H0:两种药物的镇痛效果…

H1:两种药物的镇痛效果…

α=0.052.计算t值:t=7.8593.确定P值,判断结果:

P<0.0005拒绝H0,接受H1,可认为…395、t’检验当方差不齐时,两小样本均数的比较用t’检验。检验统计量:临界值:如果t’

>t’α,则P<α,则拒绝原假设。406、z检验

当样本含量较大时,可用z检验来进行两样本均数的比较。它是用于两大样本均数的比较,目的是推断两总体均数是否相同。所用公式:417、第一类错误和第二类错误第一类错误:H0成立,但检验后被拒绝了,即“弃真”。发生的概率为α。第二类错误:H0不成立,但检验后被接受了,即“取伪”,发生的概率为β,未知。样本含量固定时,α增大,β减小;α减小,β增大。当增大样本含量时,α、β均减小。428、进行假设检验应注意的问题要有严密的研究设计(资料间的可比性)正确理解差别有无统计意义正确选用统计方法结论不能绝对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论