.抽样误差与假设检验_第1页
.抽样误差与假设检验_第2页
.抽样误差与假设检验_第3页
.抽样误差与假设检验_第4页
.抽样误差与假设检验_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章抽样误差与假设检验Samplingerror&Hypothesistest本章结构均数的抽样误差与标准误t分布总体均数的估计假设检验的意义和步骤均数的抽样误差与标准误Standarderror统计推断(statisticalinference)总体样本sampling

统计量

参数

inference参数估计假设检验一、均数的抽样误差和标准误

抽样研究,一定存在着抽样误差。因此,估计抽样误差的大小,就成为统计推断必须要解决的问题。抽样误差的概念?抽样误差的大小?抽样误差的概念定义:由抽样引起的样本统计量与总体参数间、以及样本统计量与样本统计量之间的差别。原因:个体变异+随机抽样表现:样本统计量与总体参数间的差别不同样本统计量间的差别假设一个已知总体,从该总体中重复抽取样本量相等(为m)的样本n次,对每个样本计算样本统计量(均数、方差等),观察n个样本统计量的分布规律--抽样分布规律。考察:不同的分布----正态分布、偏态分布不同的样本含量抽样试验

由中心极限定理及大数定理得出:

若原变量X服从正态分布,随机抽取样本含量为n的样本均数也服从正态分布。即使从偏态总体中随机抽样,当n足够大(n>50),样本均数也近似服从正态分布。这个定理不仅具有理论价值,而且具有很高的实用价值。因为在实际工作当中,许多医学测量结果并不知道它的确切分布,有了这个性质,就可以利用正态分布的原理对其特征进行统计推断。样本均数的分布:

从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。抽样试验(n=5)抽样试验(n=10)抽样试验(n=30)3个抽样实验验结果图示样本均数的抽抽样分布特点点各样本均数未未必等于总体体均数;样本均数之间间存在差异;;样本均均数的的分布布很有有规律律,围围绕着着总体体均数数,中中间多多、两两边少少,左左右基基本对对称,,也服服从正正态分分布;;样本均均数的的变异异较原原变量量的变变异大大大缩缩小。。随着样样本含含量的的增加加,样样本均均数的的变异异范围围逐渐渐缩小小。标准误误的概概念(standarderror)样本均均数的的标准差差称为为均数数的标标准误误。均数的的标准准误表表示样样本均均数的的变异异度。。当总体体标准准差未未知时时,用用样本本方差差代替替,抽样误误差的的大小小用标标准误误来衡衡量!!标准误误的概概念抽样的的样本本量越越大,,标准误误就越小小;原来总总体变变异度度小,,标准误误就越小小。标准误误反映映了样样本均均数间间的离离散程程度,,也反反映了了样本本均数数与总总体均均数之之间的的差异异。当当标准准误大大时,,用样样本均均数对对总体体均数数的估估计的的可靠靠程度度就小小;反反之亦亦然。。例,2000年年某研研究者者随机机调查查某地地健康康成年年男子子27人,,测其其血红红蛋白白量均均数为为125g/L,标标准差差为15g/L。试试估计计该样样本均均数的的抽样样误差差。272.89标准差差与标标准误误意义:标准准差用用于描描述个个体值值之间间的变变异,,即观观察值值间的的离散散度,,标标准准差小小,表表明观观察值值围绕绕均数数的波波动小小;标标准误误描述述统计计量的的抽样样误差差,即即样本本统计计量与与总体体参数数的接接近程程度。。标准准误小小,表表明抽抽样误误差小小,则则统计计量稳稳定,,与参参数接接近。。用途:标准准差表表示观观察值值间波波动的的大小小,用用于医医学参参考值值范围围;标标准误误表示示抽样样误差差的大大小,,用于于参数数估计计。关系:随着着样本本含量量增加加,都都减小小。联系:都是是表示示变异异度的的指标标,当当样本本量一一定时时,两两者成成正比比。标准误误用途途衡量样样本均均数的的可靠靠性:标准准误越越小,,表明明样本本均数数越可可靠;;参数估估计:估计计总体体均数数的置置信区区间((区域域);;假设检检验:用于于总体体均数数的假假设检检验((比较较)。。t-分分布t-distributiont分布的的概念念用样本本方差差代替替总体体方差差,此此时不再服服从正正态分分布。。而服服从t分布。。记为为:t分布曲曲线t分布有如下下性质质:①单峰峰分布布,曲曲线在在t=0处处最最高,,并以以t=0为为中心心左右右对称称②与正正态分分布相相比,,曲线线最高高处较较矮,,两尾部翘翘得高高(见绿绿线))③随随自由由度增增大,,曲线线逐渐渐接近近正态态分布布;分分布的的极限限为标标准正正态分分布。。t分布曲曲线下下面积积(附附表2)双侧t0.05/2,,9=2.262=单侧侧t0.025,9单侧t0.05,,9=1.833双侧t0.01/2,,9=3.250=单侧侧t0.005,9单侧t0.01,,9=2.821双侧t0.05/2,,∞=1.96=单侧侧t0.025,∞∞单侧t0.05,,∞=1.64总体均均数的的估计计Parameterestimation总体均均数估估计方方法总体均均数的的估计计:点值估估计((pointestimation)::例,120名成成年男男子血血清铁铁含量量的均均数是是18.57。。那么么,该该总体体范围围(这这个地地区))的成成年男男子血血清铁铁含量量的均均数就就是18.57。这这种方方法虽虽简单单,但但未考考虑抽抽样误误差,,一般般不用用。区间间估估计计(intervalestimation)也称称置置信信区区间间。。利利用用样样本本信信息息给给出出一一个个区区间间,,并并同同时时给给出出按按预预先先给给定定的的概率率估计计该该区区间间包包含含总总体体均均数数的的可可能能范范围围。。可信信度度::给给定定的的概概率率称称为为可可信信度度。。用用表表示示。。通通常常取取99%、、95%。。t分分布布方方法法应用用条条件件::总总体体方方差差未未知知,,样样本本量量小小例4.2某某医医师师测测的的40名名老老年年性性慢慢性性支支气气管管炎炎病病人人尿尿中中17-酮酮类类固固醇醇排排出出量量均均数数为为15.19umol/d,,标标准准差差为为5.03umol/d,,试试估估计计该该种种病病人人尿尿17-酮酮类类固固醇醇排排出出量量总总体体均均数数的的95%可可信信区区间间。。分析析条条件件::总总体体方方差差未未知知,,样样本本量量小小(13.58~16.80))正态态分分布布近近似似法法应用用条条件件::当当总总体体标标准准差差已已知知时时;;或或总总体体标标准准差差未未知知,,而而样样本本量量较较大大时时(n>50)0-11-1.961.96-2.582.5868.27%95.00%99.00%例4.3某某市市随随机机抽抽查查12岁岁男男孩孩100人人,,得得身身高高均均数数139.6cm,,标标准准差差6.85cm。。计计算算该该地地12岁岁男男孩孩身身高高均均数数的的95%的的可可信信区区间间。。分析析条条件件::总总体体方方差差未未知知,,但但样样本本量量大大,,用用正正态态分分布布法法95%%可可信信区区间间:从从总总体体中中作作随随机机抽抽样样,,作作100次次抽抽样样,,每每个个样样本本可可算算得得一一个个可可信信区区间间,,得得100个个可可信信区区间间,,平平均均有有95个个可可信信区区间间包包括括μ(估估计计正正确确),,只只有有5个个可可信信区区间间不不包包括括μ(估估计计错错误误)。。可信信区区间间的的涵涵义义假设设检检验验Hypothesistest假设设检检验验是是统统计计推推断断的的另另一一个个重重要要内内容容。。假设设检检验验是是对对所所估估计计的的总总体体首首先先提提出出一一个个假假设设,,然然后后通通过过样样本本数数据据去去推推断断是是否否拒拒绝绝这这一一假假设设,,如如果果拒拒绝绝,,认认为为该该样样本本很很可可能能不不是是来来自自这这个个总总体体;;否否则则,,认认为为该该样样本本很很可可能能来来自自这这个个总总体体。。让我我们们先先看看一一个个例例子子.例4.4根根据据大大量量调调查查,,已已知知健健康康成成年年男男子子的的脉脉搏搏均均数数为为72次次/分分。。某某医医生生在在某某山山区区随随机机调调查查30名名健健康康男男子子,,求求得得脉脉搏搏均均数数为为74.2次次/分分,,标标准准差差为为6.5次次/分分。。能能否否认认为为该该山山区区的的成成年年男男子子的的脉脉搏搏均均数数高高于于一一般般成成年年男男子子的的脉脉搏搏均均数数??对差别的的可能原原因分析析山区男子子脉搏的的总体均均数与一一般成年年男子的的脉搏均均数相等等,差异异是由抽抽样误差差引起的的——提提示山区区男子是是一般男男子总体体的一部部分(研研究总体体)。山区男子子脉搏的的总体均均数与一一般成年年男子的的脉搏均均数不相相等,差差异可能能是由地地域等因因素引起起的———提示山山区男子子与一般般男子是是两个不不同的总总体。假设检验验——通过过对假设设作出取取舍抉择择来达到到解决问问题的目目的A.山区区男子脉脉搏的总总体均数数与一般般成年男男子的脉脉搏均数数相等无差异假假设、零零假设H0((nullhypothesis)B.山区区男子脉脉搏的总总体均数数与一般般成年男男子的脉脉搏均数数不相等等对立假设设、备择择假设H1(alternativehypothesis)证明A还还是证明明B?在H0成立的条条件下,,均数之之间的差差异是由由抽样误误差引起起的,有有规律可可循;在H1成立的条条件下,,均数间间的不同同包含种种种未知知情形,,无规律律可循。。故从H0成立的角角度出发发,寻求求其成立立的概率率。变量值((脉搏))X服从从正态分分布,且且为小样样本,假假定H0成立,样样本均数数服从t-分布布,则在H0成立的前前提下,,当前t值出现现的概率率有多大大????如何给出出这个量量的界限限?小概率事事件在一一次试验验中基本本上不会会发生!!从附表2中查出出在显著著性水平平=0.05((双侧)),自由由度为229所对对应的t界值,,即为拒拒绝域与与接受域域的界限限。如果果计算出出的t统统计量大大于相应应的t界界值,则则落在拒拒绝域中中,该统统计量出出现的概概率小于于5%,,为小概概率事件件。常取的选择要根据实际情况而定通常取0.05检验水准准的概念念在假设检检验中,,称预先先规定的的小概率率值为检检验水准准,也称称为显著著性水准准,用表表示。。这里所依依据的逻逻辑是::如果H0是成立的的,那么么衡量差差异大小小的某个个统计量量落入区区域

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论