版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、样本样本 samplingsampling inference参数估计参数估计假设检验假设检验抽样误差的概念?抽样误差的概念?抽样误差的大小?抽样误差的大小? 由中心极限定理及大数定理得出:由中心极限定理及大数定理得出: 若原变量若原变量X服从正态分布,随机抽取样本服从正态分布,随机抽取样本含量为含量为n的样本均数的样本均数 也服从正态分布。也服从正态分布。 即使从偏态总体中随机抽样,当即使从偏态总体中随机抽样,当n足够大(足够大(n50),样本均数也近似服从正态分布。),样本均数也近似服从正态分布。 这个定理不仅具有理论价值,而且具有很这个定理不仅具有理论价值,而且具有很高的实用价值。因为在
2、实际工作当中,许多医高的实用价值。因为在实际工作当中,许多医学测量结果并不知道它的确切分布,有了这个学测量结果并不知道它的确切分布,有了这个性质,就可以利用正态分布的原理对其特征进性质,就可以利用正态分布的原理对其特征进行统计推断。行统计推断。样本均数的分布:样本均数的分布:X 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每)中,每次随机抽取样本含量次随机抽取样本含量n n5 5,并计算其均数与标,并计算其均数与标准差;重复抽取准差;重复抽取10001000次,获得次,获得10001000份样本;计份样本;计算算10001000份样本的均数与标准差,并对
3、份样本的均数与标准差,并对10001000份样份样本的均数作直方图。本的均数作直方图。 按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含、样本含量量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。抽样误差的大小用标准误来衡量! 例,例,2000年某研究者随机调查某地健康年某研究者随机调查某地健康成年男子成年男子27人,测其血红蛋白量均数为人,测其血红蛋白量均数为125 g /L,标准差为,标准差为15 g /L。试估计该样。试估计该样本均数的抽样误差。本均数的抽样误差。272.89意义意义:标准差用于描述个体值之间的变异,即观察值间的离散度,:标准差用于描述
4、个体值之间的变异,即观察值间的离散度, 标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差小,则统计量稳定,与参数接近。样误差小,则统计量稳定,与参数接近。用途用途:标准差表示观察值间波动的大小,用于医学参考值范围;标:标准差表示观察值间波动的大小,用于医学参考值范围;标准误表示抽样误差的大小,用于参数估计。准误表示抽样误差的大小,用于参数估计。关系关系:随着样本含量增加,都减小。:随着样本含量增加,都减小。
5、联系联系:都是表示变异度的指标,当样本量一定时,两者成正比。:都是表示变异度的指标,当样本量一定时,两者成正比。0.00.10.10.20.20.30.30.40.4-4-3-2-101234tf(t)自由度为1的t分布自由度为9的t分布标准正态分布 t t 分布分布有如下性质:有如下性质:单峰分布,曲线在单峰分布,曲线在t t0 0 处最高,并以处最高,并以t t0 0为中心为中心左右对称左右对称与正态分布相比,曲线与正态分布相比,曲线最高处较矮,两最高处较矮,两尾部翘得尾部翘得高高(见绿线)(见绿线) 随自由度增大,曲线逐随自由度增大,曲线逐渐接近正态分布;分布的渐接近正态分布;分布的极限
6、为标准正态分布。极限为标准正态分布。双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05, 1.641.64总体均数估计方法总体均数估计方法总体均数的估计:总体均数的估计: 点值估计(点值估计
7、(point estimation):):例,例,120名成名成年男子血清铁含量的均数是年男子血清铁含量的均数是18.57。那么,该总体。那么,该总体范围(这个地区)的成年男子血清铁含量的均数就范围(这个地区)的成年男子血清铁含量的均数就是是18.57。这种方法虽简单,但未考虑抽样误差,。这种方法虽简单,但未考虑抽样误差,一般不用。一般不用。也称置信区间。利用样本信息给出一个区间,并也称置信区间。利用样本信息给出一个区间,并同时给出按预先给定的同时给出按预先给定的概率概率估计该区间包含总体估计该区间包含总体均数的可能范围。均数的可能范围。可信度:给定的概率称为可信度。用可信度:给定的概率称为可
8、信度。用 表表示。通常取示。通常取99%、95%。1应用条件:总体方差未知,样本量小应用条件:总体方差未知,样本量小例例4.2 某医师测的某医师测的40名老年性慢性支气管炎病人尿中名老年性慢性支气管炎病人尿中17-酮类固酮类固醇排出量均数为醇排出量均数为15.19umol/d,标准差为,标准差为5.03umol/d,试估计该,试估计该种病人尿种病人尿17-酮类固醇排出量总体均数的酮类固醇排出量总体均数的95%可信区间。可信区间。分析条件:总体方差未知,样本量小分析条件:总体方差未知,样本量小(13.5816.80)正态分布近似法正态分布近似法应用条件:当总体标准差已知时;或总体标准差未知,而应
9、用条件:当总体标准差已知时;或总体标准差未知,而样本量较大时样本量较大时(n50)0-11-1.961.96-2.582.5868.27%95.00%99.00%例例4.3 某市随机抽查某市随机抽查12岁男孩岁男孩100人,得身高均数人,得身高均数139.6cm,标准,标准差差6.85cm。计算该地。计算该地12岁男孩身高均数的岁男孩身高均数的95%的可信区间。的可信区间。0 .1413 .13810085. 696. 16 .13910085. 696. 16 .139,分析条件:总体方差未知,但样本量大,用正态分布法分析条件:总体方差未知,但样本量大,用正态分布法9595可信区间可信区间:
10、从总体中作随机抽样,作:从总体中作随机抽样,作100100次抽样,每个样本可算得一个可信区间,得次抽样,每个样本可算得一个可信区间,得100100个可信区间,平均有个可信区间,平均有9595个可信区间包括个可信区间包括( (估计正确估计正确) ),只有,只有5 5个可信区间不包括个可信区间不包括( (估估计错误计错误) )。让我们先看一个例子让我们先看一个例子.例例4.4 根据大量调查,已知健康成年男根据大量调查,已知健康成年男子的脉搏均数为子的脉搏均数为72次次/分。某医生在某山分。某医生在某山区随机调查区随机调查30名健康男子,求得脉搏均名健康男子,求得脉搏均数为数为74.2次次/分,标准
11、差为分,标准差为6.5次次/分。能分。能否认为该山区的成年男子的脉搏均数高否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?于一般成年男子的脉搏均数?854. 1305 . 6722 .74/0nsxt如何给出这个量的界限?如何给出这个量的界限?小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生 !从附表从附表2中查出在显著性水平中查出在显著性水平=0.05(双侧),自由度为(双侧),自由度为所对应的所对应的t界值,即为拒绝域与界值,即为拒绝域与接受域的界限。如果计算出的接受域的界限。如果计算出的t统计量大于相应的统计量大于相应的t界值,则落界值,则落在拒绝域中
12、,该统计量出现的在拒绝域中,该统计量出现的概率小于概率小于5%,为小概率事件。,为小概率事件。常取常取 的选择要根据实际情况而定的选择要根据实际情况而定 .05. 0,01. 0, 1 . 0通常取通常取0.05检验水准的概念检验水准的概念在假设检验中,称预先规定的小概率值为检在假设检验中,称预先规定的小概率值为检验水准,也称为显著性水准,用表示。验水准,也称为显著性水准,用表示。这里所依据的逻辑是:这里所依据的逻辑是: 如果如果H0 是成立的,那么衡量差异大小的某是成立的,那么衡量差异大小的某个统计量落入区域个统计量落入区域 拒绝域拒绝域 是个小概率事件。是个小概率事件。如果该统计量的实测值落入拒绝域,也就是说,如果该统计量的实测值落入拒绝域,也就是说
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全球混凝土坝市场分析:市场收入将达到50.957亿美元
- 产品手绘与数字化表现 课程 三点透视(新)
- 四川省资阳市安岳中学2024-2025学年八年级上学期入学考试英语试卷(原卷版)
- 辽宁省地方标准 公共体育场馆服务规范 安全管理(报批稿)
- 科学教育活动中注重幼儿创新思维能力的培养
- 【作文指导】同课异构-学习抒情
- 第七单元测试卷-2024-2025学年统编版语文四年级上册
- 智能网联汽车技术 教案全套 赵晓敏 1.1-6.3 智能网联技术概述-高级驾驶辅助技术的主要应用
- 专题03 默写-2024年中考语文考前查缺补漏试题(深圳专用)(解析版)
- 外研新标准英语一年级起点三年级下册全册教案
- 人教版(2024)七年级地理上册3.2《世界的地形》精美课件
- 2025届安徽省部分学校高三摸底考试(一模)语文试题(解析版)
- 2024年银行会计主管个人述职报告(二篇)
- 2024年云南新华书店图书限公司招聘工作人员历年(高频重点复习提升训练)共500题附带答案详解
- 八年级物理上册 第二章 声现象 第2节 声音的特性说课稿 (新版)新人教版
- (初级)航空油料储运员技能鉴定理论考试题库(含答案)
- DL∕T 5210.2-2018 电力建设施工质量验收规程 第2部分:锅炉机组
- 《军事理论与军事技能》全套教学课件
- 大数据与人工智能营销智慧树知到期末考试答案章节答案2024年南昌大学
- 冀教版二年级数学上册全册集体备课教案含教学反思
- 夫妻离婚协议书电子版
评论
0/150
提交评论