




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章抽样误差与假设检验Sampling error & Hypothesis test本章结构构均数的抽抽样误差差与标准准误t分布总体均数数的估计计假设检验验的意义义和步骤骤均数的抽抽样误差差与标准准误Standarderror统计推断断(statisticalinference)总体样本 sampling 统计量 参 数 inference参数估计计假设检验验一、均数数的抽样样误差和和标准误误抽样研究究,一定定存在着着抽样误误差。因因此,估估计抽样样误差的的大小,就成为为统计推推断必须须要解决决的问题题。抽样误差差的概念念?抽样误差差的大小小?抽样误差差的概念念定义:由由抽样引引起的样样本
2、统计计量与总总体参数数间、以以及样本本统计量量与样本本统计量量之间的的差别。原因:个个体变异异随机机抽样表现:样本统计计量与总总体参数数间的差差别不同样本本统计量量间的差差别假设一个个已知总总体,从从该总体体中重复复抽取样样本量相相等(为为m)的的样本n次,对对每个样样本计算算样本统统计量(均数、方差等等),观观察n个个样本统统计量的的分布规规律抽样分布布规律。考察:不同的分分布-正态分布布、偏态态分布不同的样样本含量量抽样试验验由中心极极限定理理及大数数定理得得出:若原变量量X服从正态态分布,随机抽抽取样本本含量为为n的样本均均数也也服从从正态分分布。即使从偏偏态总体体中随机机抽样,当n足够
3、大(n50),样本本均数也也近似服服从正态态分布。这个定理理不仅具具有理论论价值,而且具具有很高高的实用用价值。因为在在实际工工作当中中,许多多医学测测量结果果并不知知道它的的确切分分布,有有了这个个性质,就可以以利用正正态分布布的原理理对其特特征进行行统计推推断。样本均数数的分布布:从正态分分布总体体N(5.00,0.502)中,每每次随机机抽取样样本含量量n5,并计算算其均数数与标准准差;重重复抽取取1000次,获得得1000份样本;计算1000份样本的的均数与与标准差差,并对对1000份样本的的均数作作直方图图。按上述方方法再做做样本含含量n10、样本含含量n30的抽样实实验;比比较计算
4、算结果。抽样试验验(n=5)抽样试验验(n=10)抽样试验验(n=30)3个抽样实实验结果果图示样本均数数的抽样样分布特特点各样本均均数未必必等于总总体均数数;样本均数数之间存存在差异异;样本均数数的分布布很有规规律,围围绕着总总体均数数,中间间多、两两边少,左右基基本对称称,也服服从正态态分布;样本均数数的变异异较原变变量的变变异大大大缩小。随着样本本含量的的增加,样本均均数的变变异范围围逐渐缩缩小。标准误的的概念(standarderror)样本均数数的标准差称称为均数数的标准准误。均数的标标准误表表示样本本均数的的变异度度。当总体标标准差未未知时,用样本本方差代代替,抽样误差差的大小小用
5、标准准误来衡衡量!标准误的的概念抽样的样样本量越越大,标准误就越小;原来总体体变异度度小,标准误就越小。标准误反反映了样样本均数数间的离离散程度度,也反反映了样样本均数数与总体体均数之之间的差差异。当当标准误误大时,用样本本均数对对总体均均数的估估计的可可靠程度度就小;反之亦亦然。例,2000年某研究究者随机机调查某某地健康康成年男男子27人,测其其血红蛋蛋白量均均数为125g/L,标准差差为15g /L。试估计计该样本本均数的的抽样误误差。272.89标准差与与标准误误意义:标准差差用于描描述个体体值之间间的变异异,即观观察值间间的离散散度,标标准准差小,表明观观察值围围绕均数数的波动动小;
6、标标准误描描述统计计量的抽抽样误差差,即样样本统计计量与总总体参数数的接近近程度。标准误误小,表表明抽样样误差小小,则统统计量稳稳定,与与参数接接近。用途:标准差差表示观观察值间间波动的的大小,用于医医学参考考值范围围;标准准误表示示抽样误误差的大大小,用用于参数数估计。关系:随着样样本含量量增加,都减小小。联系:都是表表示变异异度的指指标,当当样本量量一定时时,两者者成正比比。标准误用用途衡量样本本均数的的可靠性性:标准误误越小,表明样样本均数数越可靠靠;参数估计计:估计总总体均数数的置信信区间(区域);假设检验验:用于总总体均数数的假设设检验(比较)。t-分布布t-distribution
7、t分布的概概念用样本方方差代替替总体方方差,此此时不再服从从正态分分布。而而服从t分布。记记为:t分布曲线线t分布有如下性性质:单峰分布布,曲线线在t0处最高,并以t0为中心左左右对称称与正态分分布相比比,曲线线最高处处较矮,两尾部翘得得高(见绿线线)随自由度度增大,曲线逐逐渐接近近正态分分布;分分布的极极限为标标准正态态分布。t分布曲线线下面积积(附表表2)双侧t0.05/2,92.262单侧t0.025,9单侧t0.05,91.833双侧t0.01/2,93.250单侧t0.005,9单侧t0.01,92.821双侧t0.05/2,1.96单侧t0.025,单侧t0.05,1.64总体均数
8、数的估计计Parameterestimation总体均数数估计方方法总体均数数的估计计:点值估计计(pointestimation):例,120名成年男男子血清清铁含量量的均数数是18.57。那么,该总体体范围(这个地地区)的的成年男男子血清清铁含量量的均数数就是18.57。这种方方法虽简简单,但但未考虑虑抽样误误差,一一般不用用。区间估计计(intervalestimation)也称置信信区间。利用样样本信息息给出一一个区间间,并同同时给出出按预先先给定的的概率估计该区区间包含含总体均均数的可可能范围围。可信度:给定的的概率称称为可信信度。用用表表示。通通常取99%、95%。t分布方方法应用
9、条件件:总体体方差未未知,样样本量小小例4.2某某医师测测的40名老年年性慢性性支气管管炎病人人尿中17-酮酮类固醇醇排出量量均数为为15.19umol/d,标准差差为5.03umol/d,试估计计该种病病人尿17-酮酮类固醇醇排出量量总体均均数的95%可可信区间间。分析条件件:总体体方差未未知,样样本量小小(13.5816.80)正态分布布近似法法应用条件件:当总总体标准准差已知知时;或或总体标标准差未未知,而而样本量量较大时时(n50)0-11-1.961.96-2.582.5868.27%95.00%99.00%例4.3某某市随随机抽查查12岁岁男孩100人人,得身身高均数数139.6c
10、m,标标准差6.85cm。计算该该地12岁男孩孩身高均均数的95%的的可信区区间。分析条件件:总体体方差未未知,但但样本量量大,用用正态分分布法95可信区区间:从总体体中作随随机抽样样,作100次抽样,每个样样本可算算得一个个可信区区间,得得100个可信区区间,平平均有95个可信区区间包括括(估计正确确),只有5个可信区区间不包包括(估计错误误)。可信区间间的涵义义假设检验验Hypothesistest假设检验验是统计计推断的的另一个个重要内内容。假设检验验是对所所估计的的总体首首先提出出一个假假设,然然后通过过样本数数据去推推断是否否拒绝这这一假设设,如果果拒绝,认为该该样本很很可能不不是来
11、自自这个总总体;否否则,认认为该样样本很可可能来自自这个总总体。让我们先先看一个个例子.例4.4根据大量量调查,已知健健康成年年男子的的脉搏均均数为72次/分。某医医生在某某山区随随机调查查30名健康男男子,求求得脉搏搏均数为为74.2次/分,标准准差为6.5次/分。能否否认为该该山区的的成年男男子的脉脉搏均数数高于一一般成年年男子的的脉搏均均数?对差别的的可能原原因分析析山区男子子脉搏的的总体均均数与一一般成年年男子的的脉搏均均数相等等,差异异是由抽抽样误差差引起的的提提示山区区男子是是一般男男子总体体的一部部分(研研究总体体)。山区男子子脉搏的的总体均均数与一一般成年年男子的的脉搏均均数不
12、相相等,差差异可能能是由地地域等因因素引起起的提示山山区男子子与一般般男子是是两个不不同的总总体。假设检验验通过过对假设设作出取取舍抉择择来达到到解决问问题的目目的A.山区区男子脉脉搏的总总体均数数与一般般成年男男子的脉脉搏均数数相等无差异假假设、零零假设H0(nullhypothesis)B.山区区男子脉脉搏的总总体均数数与一般般成年男男子的脉脉搏均数数不相等等对立假设设、备择择假设H1(alternativehypothesis)证明A还还是证明明B?在H0成立的条条件下,均数之之间的差差异是由由抽样误误差引起起的,有有规律可可循;在H1成立的条条件下,均数间间的不同同包含种种种未知知情形
13、,无规律律可循。故从H0成立的角角度出发发,寻求求其成立立的概率率。变量值(脉搏)X服从从正态分分布,且且为小样样本,假假定H0成立,样样本均数数服从t-分布布,则在H0成立的前前提下,当前t值出现现的概率率有多大大?如何给出出这个量量的界限限?小概率事事件在一一次试验验中基本本上不会会发生!从附表2中查出在在显著性性水平=0.05(双侧),自由由度为所对对应的t界值,即即为拒绝绝域与接接受域的的界限。如果计计算出的的t统计量大大于相应应的t界值,则则落在拒拒绝域中中,该统统计量出出现的概概率小于于5%,为小概概率事件件。常取 的选择要根据实际情况而定通常取0.05检验水准准的概念念在假设检检验中,称预先先规定的的小概率率值为检检验水准准,也称称为显著著性水准准,用表表示。这里所依依据的逻逻辑是:如果H0是成立的的,那么么衡量差差异大小小的某个个统计量量落入区区域拒绝域是个小概概率事件件。如果果该统计计量的实实测值落落入拒绝绝域,也也就是说说,H0成立下的的小概率率事件发发生了,那么就就认为H0不可信而而否定它它。否则我们们就不能能否定H0(只好接受受它).1.建立检验验假设,确定检检验水准准;H0:零假设设、无效效假设。是与研研究假设设有关的的、被推推断特征征某种确确定的关关系;H1:备择假假设、对对立假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 分享成功人士的工作习惯计划
- 《贵州图南矿业(集团)有限公司兴仁市下山镇四海煤矿(变更)矿产资源绿色开发利用方案(三合一)》评审意见
- 《福泉市鹏盛矿业有限责任公司贵州省福泉市陆坪镇大沙坝铝土矿(变更)矿产资源绿色开发利用方案(三合一)》专家组评审意见
- 人教版初中七年级下册历史与社会 5.1.1辽阔的疆域 教学设计
- 财政与金融基础知识课件
- 第二十五教时小结本单元内容-俗称“加法定理”教学实录
- 2025年沈阳道路货运驾驶员从业资格证考试题库
- 2025年长治a2货运从业资格证考试
- 2025年淮南从业资格证应用能力考些啥
- 2025年常德货运从业资格证考试模拟考试
- 2025届上海市高三下学期2月联考调研英语试题【含答案解析】
- 发展我国银发经济面临的挑战和优化路径研究
- 建(构)筑物消防员初级技能培训课件
- 2025年潜江市城市建设发展集团招聘工作人员【52人】高频重点提升(共500题)附带答案详解
- GA/T 2146-2024法庭科学涉火案件物证检验移动实验室建设通用要求
- DB50T 441-2012 渝菜 毛血旺烹饪技术规范
- 2024年05月富德生命人寿保险股份有限公司招考笔试历年参考题库附带答案详解
- 医防融合培训
- 高速铁路设计规范
- 《电机能能效等级》课件
- 幼儿园课件之大班科学《四季的变化》
评论
0/150
提交评论