版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复 习泸州医学院流病与统计教研室杨 超Yang.vally一个问题 我们学习医学统计学,主要在学习什么知识?医学统计学:运用数理统计学的基本原理和方法来研究医学问题的一门学科,它包括了研究设计、数据收集、整理、分析以及分析结果的解释和表达。 统计分析 统计描述(statistical description) 统计推断(statistical inference) 参数估计 假设检验 绪论统计工作的基本步骤?总体和样本的概念是什么?什么是变量,什么是资料,变量和资料可以怎么分类?什么是误差,什么是抽样误差?什么是概率,什么是小概率事件? 统计分析定量资料 定性资料定量资料的统计描述定量资料的统
2、计推断均数的区间估计假设检验定量资料的统计描述频数表的作用是什么?集中趋势和离散程度各有几个常用指标,各自适用于什么类型的资料?正态分布有些什么特征?标准正态分布与正态分布的关系?正态分布有什么用途?第六章 总体均数的估计泸州医学院流行病与统计教研室杨超主要内容 均数的抽样误差与标准误 t 分布 总体均数的区间估计1.均数的抽样误差与标准误抽样误差:由个体变异产生的、随机抽样引 起的样本统计量与总体参数间的差异称为抽 样误差(sampling error)。 均数的抽样误差:抽样引起的样本均数与总 体均数的差异称为均数的抽样误差。n=5n=10n=20n=50各样本均数未必等于总体均数样本均数
3、之间存在差异样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右对称,基本服从正态分布随着样本含量的增加,样本均数的变异范围逐渐缩小 样本均数的抽样分布特点 1.3 标准误的计算标准误 的计算标准误 的估计值影响标准误大小的因素 的大小与成正比 与样本含量n的平方根成反比 标准差和均数的标准误的区别和联系 2. t 分布 t 分布的概念 t 分布的特征 t 界值 数理统计的中心极限定理从正态分布N(,2)中进行独立随机抽样,其样本均数服从均数为,标准差为的正态分布即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增大时,其样本均数的分布逐渐逼近于均数为,标准差为的正态分布 t分布的概
4、念变量变换总体 样本均数 中心极限定理标准正态分布 变量变换未知3.总体均数的估计 就是用样本统计量来估计总体参数总体均数估计的两种方法点估计:直接用统计量估计总体参数区间估计:按一定的概率(),估计总体参数的所在范围,这个范围称为参数的置信区间(confidence interval, CI) 总体均数置信区间的估计 在 到 之间的概率为1-置信区间的计算未知,且n小 未知,但n足够大 已知 置信区间的含义 总体均数的95%置信区间的含义是什么 总体均数以95%的概率落入置信区间内 ?有95%的总体均数在该区间内,而5%的均数不在该区间内 ?置信区间的两个要素 准确度:反映置信度(1-)的大
5、小,即置信区间包含总体均数的概率,从准确度的角度看,愈接近1愈好,如置信度99%比95%好精密度:反映为置信区间的宽度,从精确度的角度来看,置信区间的宽度愈窄愈好当样本含量确定后,准确度和精确度是此消彼长的 假设检验泸州医学院流病统计教研室杨超Yang.vally主要内容 假设检验基本思想 假设检验基本步骤 I型错误与II型错误 单双侧检验的确定 假设检验需要注意的问题假设检验的基本思想 假设检验的基本思想小概率反证法在总体参数相等这一假设成立的前提下,计算出现等于及大于(或等于及小于)现有样本统计量的可能性( 值)。如果 值很小,小于等于事先规定的一个界值(例如5%),结论就是拒绝假设“总体
6、参数相等”,认为总体参数之间存在差异。如果 值大于事先规定的界值,就不能拒绝这个假设,尚不能认为总体参数之间存在差异。 两种假设 零假设(null hypothesis),也称无效假设或无差异假设,记为 ,表示目前的差异是由抽样误差引起的。备择假设(alternative hypothesis)或对立假设,记为 ,表示差异是由于某因素造成的 。 已知一般地区成年男子平均脉搏为72次/每分,标准差为7.3次;现随机抽取高原地区成年男子100名,测得其平均脉搏为76次/每分。问高原地区成年男子脉搏是否与一般地区不同?成年男子平均脉搏 高原地区76次/分一般地区72次/分 海拔因素 抽样误差 计算统
7、计量(t 值),确定P值(由抽样误差造成差异的概率) P 0.05 P0.05 若P,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P时,按所取检验水准,拒绝H0,接受H1。若P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。抉择标准 假设检验的基本步骤 建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断 成年男子平均脉搏 高原地区76次/分一般地区72次/分 海拔因素 抽样误差 计算统计量(t 值),确定P值(由抽样误差造成差异的概
8、率) P 0.05 P0.05 实际无差异(H0)实际有差异(H1)型错误与型错误拒绝了实际上成立的H0,这类“弃真”的错误为型错误(type I error);不拒绝实际上不成立的H0,这类“存伪”的错误为型错误(type II error)。 客观实际 拒绝H0 不拒绝H0 H0成立 I 型错误() 推断正确(1-)H0不成立 推断正确(1-) II 型错误(), 的关系当样本量确定时,愈小,愈大;反之,愈大,愈小。增大样本量,可同时减小,。t (界值)图7.1 两型错误示意图(以单侧t检验为例) 客观实际 拒绝H0 不拒绝H0 H0成立 I 型错误() 推断正确(1-)H0不成立 推断正
9、确(1-) II 型错误()检验效能1-称为把握度(power of a test),其统计学意义是若两总体确有差别,按水准能检出其差别的能力。 单侧检验与双侧检验 双侧检验(two-sided test) 单侧检验(one-sided test)选用双侧检验还是单侧检验需要根据分析目的及专业知识进行确定 应该在假设检验的第一步建立检验假设时确定,不应该在算得检验统计量后主观确定,否则可能得到相反的结论 例7.4 研究者关心的是新仪器的测量误差是否比旧仪器的低,而且知道改进后的仪器的测量误差不会比旧仪器高,因此属于单侧检验问题 假设检验中的注意事项 数据应该来自设计科学严密的实验或调查 数据应
10、该满足假设检验方法的前提条件 正确理解假设检验中概率 值的含义 结论不能绝对化 统计学意义与实际意义 假设检验与区间估计的联系 置信区间估计和假设检验都属于统计推断的方法 置信区间用于推断总体参数的可能范围,假设检验用于推断总体参数是否不相等 两者既有区别,又有联系 图7.2 置信区间提供的信息 t 检验杨超戈斯特(William Sealy Gosset )主要内容 样本均数与总体均数的比较 两样本均数的比较 配对设计均数的比较 正态性检验与方差齐性检验 变量变换 要求 掌握3种 t 检验的应用条件 能够根据资料设计类型,选择相应方法 对每种检验的公式能比较熟悉,但不用掌握亦称为单样本检验(
11、one sample t test) 就是样本均数代表的未知总体均数与已知总体均数(一般为理论值或标准值)的比较 样本均数与总体均数比较成年男子平均脉搏 高原地区76次/分一般地区72次/分 海拔因素 抽样误差 计算统计量(t 值),确定P值(由抽样误差造成差异的概率) P 0.05 P0.05 实际无差异(H0)实际有差异(H1) 为样本均数,为样本标准差,为自由度。 例8.1 已知某地新生儿出生体重均数为3.36 kg。从该地农村随机抽取40名新生儿,测得其平均体重为3.27 kg,标准差为0.44 kg,问该地农村新生儿出生体重是否与该地新生儿平均出生体重不同?两样本均数比较 又称两独立
12、样本的 t 检验,或 成组设计的 t 检验(independent samples t test)例8.3某医生研究血清白介素-6(IL-6)与银屑病的关系,收集了12例处于进行期的银屑病患者及12例正常人的血清标本进行IL-6检测,得到表8.2结果,问银屑病患者与正常人的IL-6是否不同?未知总体A未知总体B样本A样本B?182.4149.7分别表示两样本均数,为合并方差 , 两样本几何均数比较 数据呈对数正态分布 以 为基础计算 t 统计量建立检验假设,确定检验水准 H0:两种疫苗的总体几何均数对数值相等 H1:两种疫苗的总体几何均数对数值不等 双侧 =0.05(2) 计算检验统计量 将两
13、组数据分别取对数,用变换后的数据计算 、 、 、 。0.01P0.02 (3) 确定P值,作出统计推断 查t界值表(附表3),得0.01P0.02, 按 =0.05水准,拒绝H0,接受H1, 差异有统计学意义,可认为两种疫 苗的平均抗体滴度不同,精制苗高 于PVRV。 检验 在进行两小样本均数比较时,若两总体方差 与 不相等,可使用 检验 配对设计均数的比较 亦称为配对检验(paired samples t test) 配对设计资料主要有以下三种情况 配对的两个受试对象分别接受两种不同处理 用两种方法(或仪器)对同一样品检验 对同一受试对象两个部位进行两种不同处理 例8.2 对24名儿童接种卡
14、介苗,按 同年龄、同性别配成12对,每对中 的2名儿童分别接种两种结核菌素, 一种为标准品,另一种为新制品, 分别注射在儿童的前臂,72小时后 记录两种结核菌素的皮肤反应平均 直径,见表8.1,问两种不同结核菌 素的反应性有无差别? 配对设计均数比较的原理 计算配对个体的差值 d dx1-x2如果不同的处理没有差别,即 d的均数 所代表的总体均数 应该等于0。 t检验的应用条件在单样本t检验中,总体标准差 未知且样本含量较小( )时,要求样本来自正态分布总体 两小样本均数比较时,要求两样本均来自正态分布总体,且两样本总体方差相等 对两大样本( 均大于50)的均数比较,可用Z检验 正态性检验 正态性检验(test of normality) 即判定资料是否服从正态分布 检验方法 图示法 P-P图法和Q-Q图法 统计检验法 W检验和矩法检验(偏度系数和峰度系数) 横坐标为观察累计频率(observed cumulative proportion) 纵坐标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国双齿轮破碎机数据监测研究报告
- 2025年中国组合地柜市场调查研究报告
- 2025年中国电感式浮珠传感器市场调查研究报告
- 2025年中国星型卸料装置市场调查研究报告
- 2025至2031年中国金刚石手擦片行业投资前景及策略咨询研究报告
- 该如何学好道法课程设计
- 填海施工方案
- 2025年度互联网产品销售提成管理合同
- 2025年度个性化离婚协议书定制模板与全程法律援助服务合同
- 二零二五年度诊所医生医疗责任保险购买协议
- 八年级散文阅读专题训练-八年级语文上册知识梳理与能力训练
- 2024年杭州市中医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 2024-2025学年人教版八年级数学上册期末测试模拟试题(含答案)
- 《环境感知技术》2024年课程标准(含课程思政设计)
- GB/T 45079-2024人工智能深度学习框架多硬件平台适配技术规范
- GB/T 25772-2010滚动轴承铁路客车轴承
- GB 31247-2014电缆及光缆燃烧性能分级
- 士卓曼种植系统外科植入流程课件
- 二年级下册《一起长大的玩具》导读教学-一场别样的童年之旅
- 二尖瓣狭窄并关闭不全共17张课件
- 心脏瓣膜病护理课件
评论
0/150
提交评论