




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学研究中的统计工作医学研究中的统计工作研究设计研究设计数据搜集数据搜集数据整理数据整理统计分析统计分析结果报告结果报告统计描述统计描述统计推断统计推断参数估计参数估计假设检验假设检验用样本信息用样本信息推断总体特推断总体特征征第四章第四章 参数估计参数估计参数估计参数估计n抽样分布与标准误抽样分布与标准误 nt 分布分布n总体参数的估计总体参数的估计n结果报告结果报告n案例辨析案例辨析n电脑实验电脑实验n常见疑问与小结常见疑问与小结教学目的教学目的q掌握抽样误差的概念,掌握标准误的意义、计算方掌握抽样误差的概念,掌握标准误的意义、计算方法和应用;法和应用;q熟悉均数抽样分布的分布规律;熟悉均
2、数抽样分布的分布规律;q了解了解t分布的概念、图形和分布表;分布的概念、图形和分布表;q理解置信区间的含义;理解置信区间的含义;q熟悉总体均数和总体概率的估计方法;熟悉总体均数和总体概率的估计方法;q掌握掌握SPSS计算结果的解释;计算结果的解释;q了解统计内容的报告与中英文表达。了解统计内容的报告与中英文表达。一、抽样分布与标准误一、抽样分布与标准误n抽样分布与标准误的概念抽样分布与标准误的概念n样本均数的标准误样本均数的标准误n两个样本均数间差值的标准误两个样本均数间差值的标准误n样本频率的标准误样本频率的标准误n两样本频率间差值的标准误两样本频率间差值的标准误假设某地假设某地12岁男孩身
3、高为:岁男孩身高为:N (138.7, 72) cm,现从中随机抽,现从中随机抽样,共抽样,共抽15次,可算得次,可算得15个样本均数如下:个样本均数如下:n重复地从同一总体中随机抽取重复地从同一总体中随机抽取 n 例样本例样本 m 次,可获得次,可获得 m份样本,可获得份样本,可获得 m 份样本的有关统计量,这些统计量的份样本的有关统计量,这些统计量的分布称为分布称为抽样分布抽样分布。n抽样误差:这种由抽样误差:这种由抽样抽样造成的样本统计量与总体参数的差造成的样本统计量与总体参数的差异称为抽样误差。异称为抽样误差。q如:由如:由抽样抽样造成的样本均数与总体均数的差异称为造成的样本均数与总体
4、均数的差异称为均数均数的的抽样误差抽样误差。(一)概念(一)概念这这15个数据的分布特征个数据的分布特征n标准误:样本统计量的标准差称为标准误标准误:样本统计量的标准差称为标准误 ( standard error, SE ),例如均数的标准误。),例如均数的标准误。q通常用标准误来反映抽样误差的大小,标准误小抽样误差通常用标准误来反映抽样误差的大小,标准误小抽样误差小,标准误大抽样误差大。小,标准误大抽样误差大。n标准差反映标准差反映个体个体与与样本均数样本均数差异,也反映用样本均数差异,也反映用样本均数对个体值的代表性。对个体值的代表性。n标准误反映标准误反映样本均数样本均数与与总体均数总体
5、均数的差异,也反映样本的差异,也反映样本均数估计总体均数的误差大小。均数估计总体均数的误差大小。n均数抽样分布的规律性:均数抽样分布的规律性:q qX 来自任意分布,只要来自任意分布,只要 n 足够大(足够大(n 50),仍有),仍有22Xn 2(,)XXN 若若 ,则,则2( ,)XN 2(,)XXN (二)样本均数的标准误(二)样本均数的标准误结论:重复地从同一总体中随机抽取样本,结论:重复地从同一总体中随机抽取样本,其样本均数的总体均数等于原总体均数,其样本均数的总体均数等于原总体均数,样本均数的总体方差小于原总体方差,且有样本均数的总体方差小于原总体方差,且有如果总体标准差未知,则用样
6、本标准差如果总体标准差未知,则用样本标准差 S 估计,此时标准估计,此时标准误的误的估计值估计值为:为:22Xn XsSn Xn (三)样本频率的标准误(三)样本频率的标准误n若若( ,)XB n Xpn 则样本频率则样本频率 的总体均数的总体均数p 总体方差总体方差2(1)pn 总体标准差总体标准差 n若若 未知,则未知,则 (1)pn (1)pppSn n若若 np 和和 n(1-p) 均大于均大于5,则,则(1)( ,)pppN pn 二、二、t 分布分布n若若 则则n若若 未知,用未知,用S 估计估计 则则2( ,)XNn2(0,1)/XNn(1)/Xt nsn实验实验4-4 t分布电
7、脑实验分布电脑实验.xlsnt 分布的特点:分布的特点:q单峰单峰,t =0处最高,以处最高,以t =0为中心左右对称。为中心左右对称。t 值可以是正值可以是正值,也可以是负值;值,也可以是负值;q与标准正态曲线相比,曲线最高处较矮,两尾部较高;与标准正态曲线相比,曲线最高处较矮,两尾部较高;qt 分布的密度曲线是分布的密度曲线是一簇曲线一簇曲线,其形态变化与自由度的大小,其形态变化与自由度的大小有关。自由度越小,则有关。自由度越小,则t 值越分散,曲线越低平,尾部越高;值越分散,曲线越低平,尾部越高;随着自由度的增大,随着自由度的增大,t 分布曲线逐渐逼近标准正态分布;分布曲线逐渐逼近标准正
8、态分布;qt 分布的概率密度曲线下面积有一定的规律性。分布的概率密度曲线下面积有一定的规律性。相同相同v,t值越大,尾部概率越小值越大,尾部概率越小;相同相同t 值、相同值、相同v,双侧尾部概率为单侧尾部概率的两倍,双侧尾部概率为单侧尾部概率的两倍,()P tt / 2,(| |)Ptt例例 当当 v=16,表查得,表查得 单侧单侧0.05的临界值的临界值 t0.05,16=1.746, P(t t0.05,16)=0.05 P(t t0.05,16)=0.05 双侧双侧0.05的临界值的临界值 t0.05/2,16=2.120 P(t t0.05/2,16)P(t t0.05/2,16)=0
9、.05 三、总体参数的估计三、总体参数的估计n置信区间的概念置信区间的概念n总体均数的置信区间总体均数的置信区间n总体概率的置信区间总体概率的置信区间q用样本均数作为总体均数的估计值用样本均数作为总体均数的估计值q用样本标准差作为总体标准差的估计值用样本标准差作为总体标准差的估计值n缺点?缺点?q没有考虑抽样误差,无法估计其可信程度没有考虑抽样误差,无法估计其可信程度(一)置信区间的概念(一)置信区间的概念n参数估计参数估计: 用样本统计量估计总体参数用样本统计量估计总体参数q点估计(点估计(point estimation)q区间估计(区间估计(interval estimation)n区间
10、估计区间估计q按事先给定的按事先给定的1 ,估计包含未知总体参数的一个区间范,估计包含未知总体参数的一个区间范围,该范围称为围,该范围称为总体参数的置信区间总体参数的置信区间(confidence interval , CI)q置信度:置信度:1 , 一般取一般取0.05或或0.01,故,故1 为为0.95或或0.99q置信限:置信限:q95%置信区间的含义:如果从同一总体中重复抽取置信区间的含义:如果从同一总体中重复抽取100份份样本含量相同的独立样本,每份样本分别计算样本含量相同的独立样本,每份样本分别计算1个置信区个置信区间,在间,在100个置信区间中,将大约有个置信区间中,将大约有95
11、个置信区间覆盖总个置信区间覆盖总体均数。体均数。(实验实验4-5 置信区间电脑实验置信区间电脑实验.xls)当我们据一份样本对总体均数只作一次区间估计时,我们当我们据一份样本对总体均数只作一次区间估计时,我们宣布宣布 “ “总体均数总体均数 在范围内在范围内” - - 这句话未必正确,可信的程度为这句话未必正确,可信的程度为95%95%!n 已知,由已知,由 得得 总体均数总体均数 的双侧的双侧 置信区间为:置信区间为: 简写为:简写为:(二)总体均数的置信区间(二)总体均数的置信区间 (0,1)/XNn / 2/ 2()1/XPZZn / 2/ 2,XXXZXZ / 2,XXZ 1 n同理,
12、若同理,若 未知,由未知,由 得得 总体均数总体均数 的双侧的双侧 置信区间为:置信区间为: 简写为:简写为: (1)/Xt nSn / 2,1/ 2,1()1/nnXPttSn / 2,1nXXtS / 2,1/ 2,1(,)nnXXXtSXtS 1 n例例4-1 随机抽取某地随机抽取某地200名成年男性的红细胞数均数为名成年男性的红细胞数均数为51012/L,标准差为,标准差为0.601012/L,试估计样本均数的标,试估计样本均数的标准误和总体均数的准误和总体均数的95%置信区间。置信区间。n解析解析 总体方差未知,则样本均数标准误的估计值为:总体方差未知,则样本均数标准误的估计值为:0
13、.05 / 2,1995.0XtS 120.600.042(10/)200XSSLn 总体均数的总体均数的95%置信区间为:置信区间为:查查t界值表得界值表得t0.05/2,199=1.972,则可得该地成年男性红,则可得该地成年男性红细胞均数的细胞均数的95%置信区间为置信区间为: (4.916,5.084)(1012/L)(三)总体概率的置信区间(三)总体概率的置信区间n查表法:查表法:当样本含量当样本含量n较小(较小(n 50),), p很接近很接近0或或100% 时,时,可以查附表可以查附表C3 (p.562) 确定总体概率的置信区间。确定总体概率的置信区间。q例例4-32003年年4
14、6月某医院重症监护病房收治重症月某医院重症监护病房收治重症SARS患者患者38人,其中死亡人,其中死亡12人,求人,求SARS病死概率的病死概率的置信区间。置信区间。q查附表查附表C3得,得,SARS病死概率的病死概率的95%置信区间为置信区间为18%49%,99%置信区间为:置信区间为:14%54%。n正态近似法:当正态近似法:当n足够大,且样本频率足够大,且样本频率p和和(1 p)均不均不太小时太小时( np与与n(1 p) 均大于均大于5),总体概率的置信区间,总体概率的置信区间q例例4-4 某卫生防疫站某卫生防疫站2006年对其辖属某乡镇年对其辖属某乡镇200名小学生进行贫名小学生进行
15、贫血的检测,结果发现有血的检测,结果发现有80名贫血者。检出率为名贫血者。检出率为40.0%。求总体。求总体贫血检出率的贫血检出率的95%置信区间。置信区间。qnp = 80及及n(1 p) =120,均大于,均大于5,可用近似公式估计,可用近似公式估计/ 2/ 2(,)pppZSpZS /20.05/2(1)0.400(10.400)0.4001.96200(0.332,0.468)ppppZSpZn 四、结果报告四、结果报告n报告置信区间的注意事项:报告置信区间的注意事项:q置信度置信度q点估计点估计五、案例辨析五、案例辨析n案例案例4-1n案例案例4-3六、电脑试验六、电脑试验n试验试验
16、 42 用用SPSS计算第计算第5章的例章的例5-2置信区间。置信区间。q数据文件:数据文件:Data5-1.sav小结小结n从同一总体中随机抽取相同含量的样本,由重复抽取的每从同一总体中随机抽取相同含量的样本,由重复抽取的每一份样本均可计算获得一个样本统计量,样本统计量的分一份样本均可计算获得一个样本统计量,样本统计量的分布就是抽样分布。布就是抽样分布。n样本统计量所对应的标准差统计学上习惯地称为标准误,样本统计量所对应的标准差统计学上习惯地称为标准误,标准误反映抽样误差的大小,即反映总体特征被估计的精标准误反映抽样误差的大小,即反映总体特征被估计的精确程度。确程度。n标准误与样本含量的平方根成反比,样本含量越大,抽样标准误与样本含量的平方根成反比,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国证书授权行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030中国茯茶行业市场运行分析及发展趋势与投资研究报告
- 合作人分房合同协议书
- 解除直播合同协议书范文
- 2025年人工智能在心血管疾病影像诊断中的辅助诊断系统研究报告
- 入股份制合同协议书
- 2025年母婴行业消费升级背景下的品牌竞争策略与品牌建设研究报告
- 藏文安全文明常识考试题及答案
- 胸部体格检查试题及答案
- 工业互联网平台增强现实交互技术在人工智能与大数据融合中的应用报告
- 设备清洁安全保养培训课件
- 心理危机评估中的量表和工具
- plc课程设计模压机控制
- 中国大学生积极心理品质量表
- 2023充电桩停车场租赁合同 充电桩租地合同正规范本(通用版)
- JCT908-2013 人造石的标准
- 质量管理员聘用合同
- 湖南省 2023-2024 年普通高中学业水平合格性考试(一) 语文试卷(含答案)
- 现代汉语通论第七节-句类系统课件
- 八年级下册Unit-4复习课
- 《胡萝卜火箭》绘本故事
评论
0/150
提交评论