医学统计学全科课件_第1页
医学统计学全科课件_第2页
医学统计学全科课件_第3页
医学统计学全科课件_第4页
医学统计学全科课件_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学全科1 医学统计学医学统计学 2011-4-18 医学统计学全科2 绪 论 医学统计学全科3 为什么医学科为什么医学科 研工作离不开研工作离不开 统计学?统计学? 医学统计学全科4 什么是医学统计学? o 运用概率论、数理统计学的原理运用概率论、数理统计学的原理 与方法,研究医学领域中与方法,研究医学领域中随机现 象有关数据的搜集、整理、分析有关数据的搜集、整理、分析 与推断,进而阐明其与推断,进而阐明其客观规律性 的一门应用科学。的一门应用科学。 医学统计学全科5 医学统计学的研究对象 o 随机现象(事件)随机现象(事件)-变异变异 o 必然现象(事件)必然现象(事件) o “若无

2、变异,无需统计若无变异,无需统计” 医学统计学全科6 医学研究的基本流程 o研究设计:专业设计、统计设计研究设计:专业设计、统计设计 o研究实施研究实施收集资料收集资料 o整理资料整理资料 o分析资料分析资料 o结论结论 医学统计学全科7 统计学在医学科研中的地位 o统计学是工具,是为医学科研服务的;需要与临床统计学是工具,是为医学科研服务的;需要与临床 专家相互协作。专家相互协作。 o没有好的研究设计,再好的统计方法都无济于事。没有好的研究设计,再好的统计方法都无济于事。 o统计学是在搜集、整理、分析和解释大量数据的过统计学是在搜集、整理、分析和解释大量数据的过 程中完成使命的。程中完成使命

3、的。 o“研究结束之后,再找统计学家,相当于进行尸体研究结束之后,再找统计学家,相当于进行尸体 解剖,他能告诉你的只能是试验失败的原因解剖,他能告诉你的只能是试验失败的原因”RA, Fisher 医学统计学全科8 统计学的基本概念 o 同质与变异同质与变异 o 总体与样本总体与样本 o 概率与频率概率与频率 o 变量变量 o 个体个体 o 误差误差 医学统计学全科9 同质与变异 o 同质:研究事物现象存在的共性,是统计学同质:研究事物现象存在的共性,是统计学 的基础。的基础。 o 同质:观察单位间被研究指标的影响因素相同质:观察单位间被研究指标的影响因素相 同。同。 o 变异:同质总体中,不同

4、个体间的差异。变异:同质总体中,不同个体间的差异。 医学统计学全科10 总体与样本 o个体:观察单位,统计研究中的最基本单位。个体:观察单位,统计研究中的最基本单位。 o总体:根据研究目的确定的同质个体构成总总体:根据研究目的确定的同质个体构成总 体体 n 有限总体:有时间、空间、人群范围的限制有限总体:有时间、空间、人群范围的限制 n 无限总体:无时间、空间的限制无限总体:无时间、空间的限制 1.1. 样本:从总体中样本:从总体中随机随机抽取的部分个体,构成抽取的部分个体,构成 样本。样本。 医学统计学全科11 概率与频率 o频率:在相同条件下,重复频率:在相同条件下,重复n次试验,某随机事

5、件次试验,某随机事件 A发生的次数发生的次数X与与n次试验的比值,即为该事件发生次试验的比值,即为该事件发生 的频率。的频率。 oBuffon 4040次硬币次硬币 2048次正面次正面 频率:频率:0.5069 o概率:某随机事件发生可能性大小的度量。用概率:某随机事件发生可能性大小的度量。用P表表 示。上述试验,当示。上述试验,当n逐渐增大时,频率始终在一个逐渐增大时,频率始终在一个 常数左右微小波动,这个常数就是概率。常数左右微小波动,这个常数就是概率。 o扔硬币的试验中,出现正面的概率为扔硬币的试验中,出现正面的概率为0.50. o小概率事件,小概率事件,P0.05 医学统计学全科12

6、 参数与统计量 o 参数:反映总体的统计指标参数:反映总体的统计指标 o 统计量:反映样本的统计指标统计量:反映样本的统计指标 医学统计学全科13 变量(variable)与资料(data) o 观察或测量的个体(或观察单位)的某项特观察或测量的个体(或观察单位)的某项特 征,称为变量。征,称为变量。 o 如某地如某地7 7岁儿童的身高、体重等。岁儿童的身高、体重等。 o 变量值构成资料。如,一组病人的血压值变量值构成资料。如,一组病人的血压值 医学统计学全科14 资料类型 o 计量资料:表现为具体的数值、有度量衡单计量资料:表现为具体的数值、有度量衡单 位,如血压、血糖等。位,如血压、血糖等

7、。百分率资料:减分率百分率资料:减分率 o 计数资料:观察指标是定性的,如阴性、阳计数资料:观察指标是定性的,如阴性、阳 性,有病、无病等。二分类、多分类性,有病、无病等。二分类、多分类 o 等级资料:尿糖检测结果的等级资料:尿糖检测结果的+ + + + +、治疗、治疗 效果:痊愈、显效、有效、无效等效果:痊愈、显效、有效、无效等 o 不同的资料类型可以相互转化不同的资料类型可以相互转化 o 不同的资料类型有不同的统计分析方法不同的资料类型有不同的统计分析方法 医学统计学全科15 描述性统计描述性统计 (一)(一) 医学统计学全科16 统计处理 o 统计描述:统计描述: 描述样本特征:列表、图

8、示、数字描述样本特征:列表、图示、数字 o 统计推断:统计推断: 医学统计学全科17 计量资料分布特征和描述指标 o 集中趋势:平均水平集中趋势:平均水平 算术均数、几何均数和中位数算术均数、几何均数和中位数 o 离散趋势:变异性离散趋势:变异性 极差、四分位数间距、方差、标准差、变极差、四分位数间距、方差、标准差、变 异系数异系数 医学统计学全科18 集中趋势指标-均数mean o 算术均数:简称均数,用以描述一组服从正算术均数:简称均数,用以描述一组服从正 态分布或近似正态分布资料的平均水平。态分布或近似正态分布资料的平均水平。 o 总体均数总体均数 ,样本均数,样本均数 o 离均差总和离

9、均差总和 o 离均差平方和离均差平方和 x 医学统计学全科19 几何均数G(geometric mean) o 用于对数正态分布的资料。即原变量值分布用于对数正态分布的资料。即原变量值分布 不对称,但经对数转换后,近似或服从正态不对称,但经对数转换后,近似或服从正态 分布的资料。分布的资料。 o 血清学平均抗体效价血清学平均抗体效价 医学统计学全科20 中位数M(median) o 位置指标位置指标 o 中位数:一组资料按大小顺序排列后,中间中位数:一组资料按大小顺序排列后,中间 位置上的观测值。位置上的观测值。 1 2 3 4 5 6 7 1 2 3 4 5 6-median=3.5 医学统

10、计学全科21 百分位数(percentile,Px) o 位置指标位置指标 o 一组资料从小到大排序后,一组资料从小到大排序后,x%的观测值比的观测值比 Px小,(小,(100-x)%的观测值比的观测值比Px大,则这个大,则这个 位置点的数值,即为第位置点的数值,即为第x百分位数百分位数Px。 。 o 第第5百分位数百分位数P5:有:有5%的观测值比的观测值比P5小,有小,有 95%的观测值比的观测值比P5大。大。 o 中位数即第中位数即第50百分位数。百分位数。 o 用于偏态分布的资料。用于偏态分布的资料。 医学统计学全科22 离散趋势的指标-极差R o 极差或全距极差或全距range:最大

11、值与最小值之差。:最大值与最小值之差。 o 只考虑最大值和最小值,没有考虑所有的变只考虑最大值和最小值,没有考虑所有的变 量。量。 医学统计学全科23 四分位数间距Q o 第第25百分位数百分位数P25 ,第,第50百分位数百分位数P50, ,第 第75 百分位数百分位数P75, ,将所有的数据分为四份。 将所有的数据分为四份。 o P75- P25即为四分位数间距。即为四分位数间距。 o 考虑了较多的变量信息,但信息利用仍不充考虑了较多的变量信息,但信息利用仍不充 分。分。 医学统计学全科24 方差variance o 方差方差:总体方差总体方差 ,样本方差,样本方差S2 o 离均差平方和的

12、平均值即为方差。离均差平方和的平均值即为方差。 2 2 2 1 () (1) n i i xx S n 医学统计学全科25 标准差SD/STD(standard deviation) o 方差开方即为标准差方差开方即为标准差 o 求方差后,量纲为原量纲的平方。求方差后,量纲为原量纲的平方。 o 为使量纲恢复到原量纲,将方差开方,即为为使量纲恢复到原量纲,将方差开方,即为 标准差。标准差。 o 总体标准差总体标准差 ,样本标准差,样本标准差S 医学统计学全科26 变异系数CV o 用于比较不同量纲的变量的变异程度。用于比较不同量纲的变量的变异程度。 o 无量纲无量纲 100% S CV x 医学

13、统计学全科27 小结 o 上述指标都是用于计量资料的统计描述上述指标都是用于计量资料的统计描述 o 除变异系数外,均有量纲除变异系数外,均有量纲 o 变异性指标中,指标值越大,说明数据变异越大变异性指标中,指标值越大,说明数据变异越大 o 分布类型不同,适用的描述指标不同。分布类型不同,适用的描述指标不同。 o 正态分布常用正态分布常用 o 偏态分布常用中位数偏态分布常用中位数M和最小值、最大值或四分和最小值、最大值或四分 位数间距。位数间距。 如:年龄中位数为如:年龄中位数为33.5岁,最小年龄岁,最小年龄3岁,最大年岁,最大年 龄龄55岁。岁。 xs 医学统计学全科28 计数资料的统计描述

14、 o 绝对数:实际观察所得绝对数:实际观察所得 o 相对数:率、构成比、相对比相对数:率、构成比、相对比 医学统计学全科29 例题:2005年某市五地区糖尿病患病情况 地区编号调查人数患病人数患病率 (%) 构成比 (%) 患病率 相对比(%) (1)(2)(3)(4)(5)(6) A97776857.0121.52- B114106325.5419.8679.03 C121816985.7321.9281.74 D103915415.2117.0074.32 E105116275.9719.7085.16 合计5427031835.87100.00- 医学统计学全科30 率(rate) o

15、说明在一定条件下,某现象发生的说明在一定条件下,某现象发生的频率或强度频率或强度。 o K:比例基数,常用百分率(:比例基数,常用百分率(%)、千分率、)、千分率、 万分率、十万分率等。万分率、十万分率等。 o 使结果中保留使结果中保留1-2位小数;位小数; o 根据习惯用法根据习惯用法 K 实际发生某现象的观察单位数 率 可能发生该现象的观察单位总数 医学统计学全科31 常用的率 o 发病率、患病率、死亡率、病死率等;发病率、患病率、死亡率、病死率等; o 发病率发病率(incidence rate):一定期间内、一定人:一定期间内、一定人 群中,某病群中,某病新病例新病例出现的频率。出现的

16、频率。 o 描述疾病的发生频率。描述疾病的发生频率。 k 一定期间内某人群中某病新病例数 发病率 同时期可能发生该病的人口总数 医学统计学全科32 常用的率 o 患病率(患病率(prevalence rate):现患率,某特定):现患率,某特定 时间内总人口中,时间内总人口中,现患有某病的人(包括新和现患有某病的人(包括新和 旧病例)旧病例)所占的比例。所占的比例。 o 常用于表示病程较长的慢性病的发生或流行情常用于表示病程较长的慢性病的发生或流行情 况。况。 o 与发病率和病程有关。与发病率和病程有关。 k 某一时点一定人群中现患某病新旧病例数 患病率 该时点的人口数 医学统计学全科33 常

17、用的率 o 死亡率(死亡率(mortality rate):一定期间内,):一定期间内, 一定人群中,死于某病(或死于所有原因)一定人群中,死于某病(或死于所有原因) 的频率。的频率。 o 是测量人群死亡危险最常用的指标。是测量人群死亡危险最常用的指标。 k 某期间内(因某病)死亡总数 死亡率 同期平均人口数 医学统计学全科34 常用的率 o 病死率病死率(fatality rate):表示一定时期内(通常:表示一定时期内(通常 为为1年),年),患某病的全部病人患某病的全部病人中因中因该病死亡者该病死亡者 的比例。的比例。 o 用于表示确诊疾病的死亡概率,可表明疾病的用于表示确诊疾病的死亡概

18、率,可表明疾病的 严重程度,也可反映医疗水平和诊断能力。多严重程度,也可反映医疗水平和诊断能力。多 用于急性传染病,较少用于慢性病。用于急性传染病,较少用于慢性病。 k 某时期内因某病死亡总数 病死率 同期患某病的病人数 医学统计学全科35 常用的率 o 在临床实际中,要注意区分上在临床实际中,要注意区分上 述四种常用率指标的含义,不述四种常用率指标的含义,不 要混淆。要混淆。 医学统计学全科36 构成比(proportion) o 说明某一事物的内部各组成部分所占的比重说明某一事物的内部各组成部分所占的比重 或分布。或分布。 o 常用来表示疾病或死亡发生的分布情况,不常用来表示疾病或死亡发生

19、的分布情况,不 能表示其发生频率或严重程度。能表示其发生频率或严重程度。 100% 事物内部某一组成部分的观察单位数 构成比 事物内部各组成部分观察单位总数 医学统计学全科37 比(ratio) o 又称相对比,表示两个有关的指标之比,可用又称相对比,表示两个有关的指标之比,可用 倍数或百分数表示。倍数或百分数表示。 o 甲乙两个指标可以是绝对数、相对数等;甲乙两个指标可以是绝对数、相对数等; o 性质可以相同,也可以不同。性质可以相同,也可以不同。 o 如果计算时,分子大于分母,结果用倍数表示;如果计算时,分子大于分母,结果用倍数表示; 反之,结果用百分数表示。反之,结果用百分数表示。 甲指

20、标 比 乙指标 医学统计学全科38 注意事项 o 分母不宜过小:分母不宜过小: o 正确区分率与构成比的意义:正确区分率与构成比的意义: o 正确计算总率:即合计率或平均率。应将各正确计算总率:即合计率或平均率。应将各 组实际发生某现象的观察单位数之和,除以组实际发生某现象的观察单位数之和,除以 各组可能发生该现象的观察单位数之和,再各组可能发生该现象的观察单位数之和,再 乘以比例基数乘以比例基数K K。 医学统计学全科39 注意事项 o比较相对数指标时,注意资料的可比性:比较相对数指标时,注意资料的可比性: n随机化:随机抽样原则;随机化:随机抽样原则; n观察对象同质、研究方法相同、观察时

21、间相等观察对象同质、研究方法相同、观察时间相等 以及其他影响因素相同或接近;以及其他影响因素相同或接近; 1.1. 观察对象的内部构成是否相同:即与比较指标观察对象的内部构成是否相同:即与比较指标 有关的影响因素在比较组间是否均衡。内部构有关的影响因素在比较组间是否均衡。内部构 成不同时,需分层分析或进行标化。成不同时,需分层分析或进行标化。 医学统计学全科40 注意事项 o 样本率(或构成比)的比较,要做假设检验:样本率(或构成比)的比较,要做假设检验: 样本率或构成比存在抽样误差,相互比较时样本率或构成比存在抽样误差,相互比较时 需要进行假设检验。需要进行假设检验。 医学统计学全科41 正

22、态分布 o 一种一种连续型随机变量连续型随机变量常见而重要的分布。常见而重要的分布。 o 高斯分布:最初由德国数学家和天文学家德高斯分布:最初由德国数学家和天文学家德. 莫阿弗尔于莫阿弗尔于1733年提出。但高斯将其迅速应年提出。但高斯将其迅速应 用到天文学中,并对其性质进行了进一步的用到天文学中,并对其性质进行了进一步的 研究,因此又称为高斯分布。研究,因此又称为高斯分布。 医学统计学全科42 正态分布 o 是自然界中最常见、最重要的一种连续型分是自然界中最常见、最重要的一种连续型分 布,是许多统计分析方法的基础。布,是许多统计分析方法的基础。 o 医学中很多数据都近似服从正态分布。医学中很

23、多数据都近似服从正态分布。 医学统计学全科43 频数分布 当样本量无限增大以及横 轴上的组距无限减小时, 直方图外缘就变成一条光 滑的曲线,这条概率密 度曲线所描述的分布就 近似于正态分布。 医学统计学全科44 正态分布 o 是两个常数,分别为圆周率(是两个常数,分别为圆周率(3.14159) 和自然对数的底(近似于和自然对数的底(近似于2.71828) o 是正态分布的两个参数,其中是正态分布的两个参数,其中 为为x的总的总 体均数,体均数, 是是x的总体方差。的总体方差。 o 和和 可以完全决定一个正态分布的形状,可以完全决定一个正态分布的形状, 因此,对于一个正态分布,可记为因此,对于一

24、个正态分布,可记为 2 2 1() ( )exp 22 x f x e 2 2 ( ,)xN 医学统计学全科45 正态分布的特征 1 1、单峰分布,、单峰分布,以以x= 为中心,左右完全对称,为中心,左右完全对称, 正态曲线以正态曲线以x轴为渐近线,两端与轴为渐近线,两端与x轴永不相轴永不相 交。交。 2 2、在、在x= 处有最大值,即此时曲线最高。处有最大值,即此时曲线最高。 3、有两个参数:、有两个参数:位置参数位置参数 ,决定正态曲线在,决定正态曲线在 x轴上的位置;形状参数轴上的位置;形状参数 ,决定正态曲线,决定正态曲线 的分布形状。的分布形状。 医学统计学全科46 正态分布的特征

25、o 在在不变的情况下,函数曲线形状不变,若不变的情况下,函数曲线形状不变,若 变大时,曲线位置向右移;若变大时,曲线位置向右移;若变小时,曲变小时,曲 线位置向左移。线位置向左移。 o 在在不变的情况下,函数曲线位置不变,若不变的情况下,函数曲线位置不变,若 变大时,曲线形状变的越来越变大时,曲线形状变的越来越“胖胖”和和“矮矮”; 若若变小时,曲线形状变的越来越变小时,曲线形状变的越来越“瘦瘦”和和 “高高”。 医学统计学全科47 正态分布的特征 0 f(x) max 1 2 N(1 ,2)、N(2 ,2) =0.5 0 f(x) =1 =2 N(,0.52)、N(,12)、N(,22) 医

26、学统计学全科48 正态分布的特征 医学统计学全科49 正态分布的特征 4、曲线下的总面积为、曲线下的总面积为1或或100%。所有正态曲。所有正态曲 线,在线,在 左右的任意个标准差范围内面积相左右的任意个标准差范围内面积相 同同 医学统计学全科50 曲线下面积 2 1 2 1 ( ) 2 x x F xedx 1221 ()()()P xxxF xF x 医学统计学全科51 正态分布曲线下的面积 68.27% 1.64590.00% 1.96 95.00% 2.58 99.00% 医学统计学全科52 正态分布的应用 o 许多医学现象服从正态分布或近似正态分布,许多医学现象服从正态分布或近似正态

27、分布, 可制定医学参考值范围;可制定医学参考值范围; o 偏态分布的资料可转换为正态分布或近似正偏态分布的资料可转换为正态分布或近似正 态分布,然后按照正态分布的规律进行处理;态分布,然后按照正态分布的规律进行处理; o 正态分布是许多统计分析方法的理论基础;正态分布是许多统计分析方法的理论基础; 医学统计学全科53 标准正态分布 o 对于任意一个正态分布,均可转换为均数为对于任意一个正态分布,均可转换为均数为 0,标准差为,标准差为1的标准正态分布。的标准正态分布。 o 标准化变换:标准化变换: o u变换或变换或Z变换变换 o u或或Z叫标准化离差,实际就是用标准差叫标准化离差,实际就是用

28、标准差 作单位来度量离均差的大小。作单位来度量离均差的大小。 x u 医学统计学全科54 标准正态分布 2 2 () 2 1 ( ) 2 x f xe 2 2 1 ( ) 2 u ue 医学统计学全科55 标准正态分布 (0,1)uN 医学统计学全科56 标准正态分布 o 纵坐标从纵坐标从移到移到u所对应区域的面积为上图红所对应区域的面积为上图红 色区域面积的大小,这样一个区域的面积我们色区域面积的大小,这样一个区域的面积我们 用用(u)表示,可通过查标准正态分布曲线面积表示,可通过查标准正态分布曲线面积 分布表得到分布表得到(u)的大小。的大小。 o u值查表所对应的面积是区间值查表所对应的

29、面积是区间(-,u)所对应的所对应的 面积,即面积,即(u)。 o 若若u=-1.96,那么,那么(-1.96)则表示从则表示从移到移到 1.96所对应区域的面积,通过查标准正态分布所对应区域的面积,通过查标准正态分布 曲线面积分布表得到曲线面积分布表得到(-1.96)=0.025 医学统计学全科57 标准正态分布曲线下的面积 68.27% 1.645 90.00% 1.9695.00% 2.58 99.00% 1 68.27% 1.645 90.00% 1.96 95.00% 2.58 99.00% 医学统计学全科58 医学参考值范围的确定 o 正常值范围:按一定概率所确定的数据波动正常值范

30、围:按一定概率所确定的数据波动 范围。范围。 o 计算方法:正态分布法、百分位数法计算方法:正态分布法、百分位数法 医学统计学全科59 医学参考值范围的确定 o 选择足够数量的正常人作为参照样本选择足够数量的正常人作为参照样本 o 对选定的参照样本进行准确地测定对选定的参照样本进行准确地测定 o 单双侧范围的确定单双侧范围的确定 o 选择适当的百分范围选择适当的百分范围 医学统计学全科60 正态分布法 o 正态性检验正态性检验 o 计算均数、标准差计算均数、标准差 o 计算参考值范围计算参考值范围 o 双侧:双侧: 单侧:单侧: 或或 o 90%、95%、99%参考值范围参考值范围 o 95%

31、参考值范围:参考值范围: o 单双侧的确定,要依据专业知识单双侧的确定,要依据专业知识 2 xus xu s xu s 1.96xs 医学统计学全科61 制定医学参考值范围的注意事项制定医学参考值范围的注意事项 o 研究对象:研究对象: “ “正常人正常人” 同同 质质 足够例数足够例数-有代表性有代表性 o 控制误差:系统误差控制误差:系统误差 随机误差随机误差 o 单双侧界值:专业知识单双侧界值:专业知识 o 适当的百分界值:假阳性(误诊)、假阴性适当的百分界值:假阳性(误诊)、假阴性 (漏诊)(漏诊) 医学统计学全科62 医学参考值范围的含义医学参考值范围的含义 o 95%的参考值范围:

32、的参考值范围:95%的变量值的波动范的变量值的波动范 围;围;95%的变量值在这个范围内的变量值在这个范围内 o 不可理解为:在参考值范围内的均为健康人,不可理解为:在参考值范围内的均为健康人, 在参考值范围外的均不健康。在参考值范围外的均不健康。 医学统计学全科63 统计推断统计推断 医学统计学全科64 基本概念 o 总体:根据研究目的确定的同质个体构成总体:根据研究目的确定的同质个体构成 总体。总体。 o 样本:从总体中随机抽取的部分个体,构样本:从总体中随机抽取的部分个体,构 成样本。成样本。 o 抽样研究:从总体中随机抽取部分观察对象抽样研究:从总体中随机抽取部分观察对象 进行研究,进

33、行研究,通过样本信息来推断总体特征通过样本信息来推断总体特征的的 研究方法。研究方法。 医学统计学全科65 抽样误差 o 由于抽样所导致的误差。由于抽样所导致的误差。 某地区7岁男童的身高 110cm 样本1 100例 105 cm 样本2 100例 100 cm 样本3 100例 120 cm 由于随机抽样而引由于随机抽样而引 起的来自同一总体起的来自同一总体 的样本均数之间以的样本均数之间以 及样本均数与相应及样本均数与相应 的总体均数之间的的总体均数之间的 差异,称之为均数差异,称之为均数 的的抽样误差抽样误差。 医学统计学全科66 标准误 o 标准差标准差 :反映个体差异,反映变量值的

34、变异:反映个体差异,反映变量值的变异 程度。程度。 o 标准误标准误 :样本均数的标准差,用以反映抽样:样本均数的标准差,用以反映抽样 误差的大小。误差的大小。 o 与总体标准差成正比,与样本含量的平方根成与总体标准差成正比,与样本含量的平方根成 反比。反比。 o 一定时,一定时,n越大,标准误就越小,越大,标准误就越小, n越小,标越小,标 准误就越大。准误就越大。 o 影响抽样误差的主要因素是样本含量。影响抽样误差的主要因素是样本含量。 x / x n 医学统计学全科67 标准误 o 作为总体参数,通常是未知的,在实际作为总体参数,通常是未知的,在实际 工作中常用样本标准差工作中常用样本标

35、准差S来估计。所以:来估计。所以: 作为作为标准误的估计值标准误的估计值。 / x Ssn 医学统计学全科68 中心极限定理 o 样本均数的抽样分布特点:样本均数的抽样分布特点: o从正态总体从正态总体 中随机抽取例数为中随机抽取例数为n的样本,的样本, 其样本均数的分布服从正态分布其样本均数的分布服从正态分布 ; 1. 从非正态总体中抽样,当从非正态总体中抽样,当n足够大时,样本均足够大时,样本均 数的抽样分布近似服从正态分布数的抽样分布近似服从正态分布 2 ( ,)N 2 ( ,)N n 2 ( ,)N n 医学统计学全科69 标准误的应用 o 反映样本统计量变异程度的指标,常用来反反映样

36、本统计量变异程度的指标,常用来反 映抽样误差的大小。映抽样误差的大小。 o 用于计算总体均数的可信区间。用于计算总体均数的可信区间。 o 进行假设检验所必需的重要统计量。进行假设检验所必需的重要统计量。 医学统计学全科70 t分布 o 正态分布通过标准化转换可转换为标准正态分正态分布通过标准化转换可转换为标准正态分 布。布。 o 中心极限定理:样本均数的分布服从正态分布。中心极限定理:样本均数的分布服从正态分布。 o u转换:转换: x u 2 ( ,) x xN x x u 医学统计学全科71 t分布 o 在实际工作中,在实际工作中, 是未知的,用是未知的,用 来代替。因此,来代替。因此,

37、o 标准误估计值代替了理论标准误,因此,此时标准误估计值代替了理论标准误,因此,此时 转化后的分布不再符合标准正态分布,而服从转化后的分布不再符合标准正态分布,而服从t 分布。分布。 o 自由度自由度 o t分布与自由度有关。不同的自由度对应不同的分布与自由度有关。不同的自由度对应不同的t 分布曲线。分布曲线。 x x S / x xx t SSn 1n 1n 医学统计学全科72 t分布的特征 o 以以0为中心,左右对称的为中心,左右对称的 单峰分布。单峰分布。 o t分布曲线是一簇曲线,分布曲线是一簇曲线, 其形态变化与自由度的大其形态变化与自由度的大 小有关。自由度越小,小有关。自由度越小

38、,t 值越分散,曲线越低平;值越分散,曲线越低平; 自由度逐渐增大时,则自由度逐渐增大时,则t 分布逐渐逼近正态分布分布逐渐逼近正态分布 (标准正态分布)。当(标准正态分布)。当 o 时时,t分布即为分布即为u分布。分布。 o t分布曲线的峰值较低,分布曲线的峰值较低, 而尾部曲线较高,说明远而尾部曲线较高,说明远 侧侧t值的个数较多,自由值的个数较多,自由 度越小,这种情况越明显。度越小,这种情况越明显。 医学统计学全科73 t分布的特征 o t分布曲线下面积的分布规律分布曲线下面积的分布规律 由于由于t分布曲线是一组曲线,故分布曲线是一组曲线,故t分布曲线下面分布曲线下面 积为积为95%和

39、和99%界值不是一个常量,随着自界值不是一个常量,随着自 由度的变化,由度的变化,95%或或99%面积的界值发生变面积的界值发生变 化,当化,当 时,时,95%和和99%面积对应的界值面积对应的界值 趋近于趋近于u值。值。 医学统计学全科74 总体均数的估计 o 参数估计:点估计、区间估计参数估计:点估计、区间估计 o 点估计:样本统计量直接作为总体参数估计点估计:样本统计量直接作为总体参数估计 值值 o 区间估计:可信区间或置信区间区间估计:可信区间或置信区间CI。用已知。用已知 的样本统计量和标准误确定一个有概率意义的样本统计量和标准误确定一个有概率意义 的区间,该区间有较大可信度包含总体

40、参数。的区间,该区间有较大可信度包含总体参数。 o 可信度:可信度:1- 。95%、99% 医学统计学全科75 可信区间的含义 o 如果能进行重复抽样试验,平均有如果能进行重复抽样试验,平均有1- 的可信的可信 区间包含了总体参数。区间包含了总体参数。 o 有有1- 的可能性包含了总体均数。的可能性包含了总体均数。 医学统计学全科76 假设检验的基本思想 o 小概率反证法,即先小概率反证法,即先 建立一个关于样本所建立一个关于样本所 属总体的假设,考察属总体的假设,考察 在假设成立条件下随在假设成立条件下随 机样本的特征信息是机样本的特征信息是 否属小概率事件,若否属小概率事件,若 为小概率事

41、件,则怀为小概率事件,则怀 疑假设成立有悖于该疑假设成立有悖于该 样本所提供特征信息,样本所提供特征信息, 因此拒绝假设。因此拒绝假设。 A疗效=B疗效 A药 65% B药 80% ? 医学统计学全科77 假设检验 A有效率=B有效率 A药 65% B药 80% 抽样误差抽样误差 A有效率 A药 65% B药 80% 不同总体不同总体 B有效率 医学统计学全科78 假设检验 抽样误差抽样误差 不同总体不同总体 0=72.1次/分 74.3次/分 74.3次/分 0=72.1次/分 = 在=0的前提下,计算从这个总体中进行随机 抽样,得到目前这样结果的概率有多大,然后 与事先确定的检验水准0.05比较,得出结论。 医学统计学全科79 假设检验的步骤1 o 建立检验假设和确定检验水准:建立检验假设和确定检验水准: o 无效假设无效假设H0: =0,即山区成年男子与一,即山区成年男子与一 般成年男子的脉搏总体均数相同,或来自同般成年男子的脉搏总体均数相同,或来自同 一总体。一总体。 o 备择假设备择假设H1 :有单双侧之分。:有单双侧之分。 o 双侧双侧H1 : 0 o 单侧单侧H1 : 0或或0 =9.3cm =0.05(单侧检验)(单侧检验) o 计算检验统计量:计算检验统计量: o 9.39759.3 1.0257 /0.3293/ 12 x xx t SSn 1 12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论