版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、毛振兴 博士郑州大学公共卫生学henxingmao医学统计学复习一、医学统计的基本内容 1. 统计学:统计学是一门科学和艺术,专门处理数据中的变异性。 如何处理:通过数据收集、整理、分析。 目的:得到可靠的结果。 2. 医学统计学:统计学应用于医药卫生领域即称为医学统计学。3. 几个基本概念: 总体、样本、个体、随机抽样、抽样误差 同质、变异、变量 参数、统计量 随机事件、概率4. 三种资料类型: 数值变量,即计量资料 无序分类变量,即计数资料 有序分类变量,即等级资料5. 统计工作基本步骤: 统计设计:研究什么(总体样本)、怎样分组(随机对照)、收集什么资料(指标要
2、求)、怎样统计分析(据分布选方法) 搜集资料:准确可靠及时、盲法设计 整理与分析资料:正确选用统计方法。二、定量资料的统计分析统计描述统计图表概率分布抽样误差与参数估计假设检验基础T检验1频数表(直方图)意义: 较具体地、直观地描述一组数据的特征和类型; 有助于正确选用统计指标和便于计算; 有助于发现异常值。要点 3正态分布的图形及其特征: 1)正态曲线在横轴上方,均数处最高。 2)正态分布以均数为中心,左右对称。 均数、中位数及几何均数相等。 3)正态分布有两个参数,和 。 是位置参数,决定正态曲线的中心位置。是变异度参数,决定正态曲线的陡峭或扁平程度。越大,曲线越陡峭,越小,曲线越扁平。
3、4)正态曲线下的面积分布有一定规律。 要点4. 正态曲线下面积的分布规律: 曲线下总面积为1或100 常用的区间及其面积有: 均数加减1.96倍标准差范围外双侧尾部面积共5 均数加减2.58倍标准差范围外双侧尾部面积共1要点 5.参考值范围的制定及适用条件:(正态、对数正态、百分位数法) 6.均数的抽样误差与标准误: 标准误用来说明样本均数的抽样误差大小。 要点 t 的分布不同于标准正态分布,称为t分布。 其特征是:单峰,t分布曲线下面积分布规律随自由度而变化(要查表)。 自由度要点 8总体均数的区间估计: 已知时, 未知时, 未知,n足够大时,要点10t检验:样本与总体比较的t检验:配对设计
4、t检验: 两独立样本t检验: 要点学习目标了解频数分布表的编制方法及应用。掌握定量资料集中趋势和离散趋势常用的统计描述指标,及各自的应用。1.统计描述1频数表(直方图)意义: 较具体地、直观地描述一组数据的特征和类型; 有助于正确选用统计指标和便于计算; 有助于发现异常值。2各种反映平均水平和离散程度的指标的意义、正确应(选)用、计算及适用条件(资料类型、分布)。 平均水平指标: 离散程度的指标: 2.统计图表 定义:统计表是用表格的形式将统计分析的事物及其统计指标表达出来。 统计表的结构: 表号、标题、标目、线条、数字以及备注 统计表的种类: 简单表(simple table):研究事物的主
5、要内容或对象只有一个分组标志。 复合表(combinative table):研究事物的主要内容或对象有两个或两个以上的分组标志。表3-10 某高校不同年级AIDS传播途径知识得分情况横标目数字标题表号横标目总名称纵标目线条统计图 定义:统计图(statistical chart):用点的位置、线段的升降、直条的长短,面积的大小直观地描述某事物的特征,是重要的统计描述方法。 特点:直观、醒目,常给人以深刻印象,但统计图对数量的表达较粗略,只能作为统计表有益的补充。图3 正态分布的概率密度函数 利用分布函数F(X) 可以计算正态分布变量取值在任意区间(a,b)的概率为 概率密度Y轴的高度面积P(
6、aX不拒绝H0,认为差异无统计学意义1.96-1.96a/2 a/2 样本统计量拒绝域拒绝域接受域1 - 置信水平1. 第一类错误(弃真错误)拒绝了实际上成立的H0假阳性错误,接受了错误的H1第一类错误的概率为2. 第二类错误(存伪错误)不拒绝实际上不成立的H0假阴性错误,接受了错误的H0第二类错误的概率为不拒绝H0,认为样本来自m=m0的总体拒绝H0,认为样本不来自m=m0的总体无效假设成立,样本来自m=m0的总体无效假设不成立,样本来自m=m1的总体实际情况6. t检验单样本资料的t 检验两独立样本资料的t 检验配对设计资料的t 检验应用条件随机样本;正态性(Normality):来自正态
7、分布总体;方差齐性(Homogeneity of variance):两个均数比较时,要求两总体方差相等。样本与总体比较的t检验:配对设计t检验: 两独立样本t检验: 单样本定量资料分析流程2022/10/153两独立样本定量资料的分析流程2022/10/154两独立样本定量资料的分析流程2022/10/155三、定性资料的统计分析统计描述二项分布抽样误差与参数估计假设检验基础卡方检验要点1.相对数的意义和应用相对数的注意事项。2.常用相对数指标的计算方法和适应范围。3.率的标准化法的意义,直接法标化率的计算。4. 率的标准误以及率的可信区间的计算。5. 理解2检验的基本思想, 熟悉2检验的用
8、途。6. 掌握几种常见资料的2检验方法。 1.统计描述1相对数的意义和应用相对数的注意事项。2. 常用相对数指标的计算方法和适应范围。3. 率的标准化法的意义,直接法标化率的计算。率(rate)概念:又称频率指标。表示在一定条件下,发生某现象的观察单位数与可能发生某现象的观察单位数之比。公式:作用:说明某现象发生的频率或强度。构成比(proportion)概念:构成指标。表示某一事物内部各组成部分 所占的比重或分布。公式:作用:表示某一事物内部各组成部分所占的比重。比(ratio)概念:表示两个有关指标之比,说明二者的对比水平。可用倍数或百分数表示。公式:作用:说明甲指标为乙指标的若干倍或百分
9、之几。最常见的相对比是人口学中的男女性别比,反映卫生资源的指标如每千人口医生数及床位数等。构成比率概念说明事物内部各组成部分所占比重或分布说明某现象发生的频率或强度合计必为100%分率不能直接相加改变任一部分比重增减会影响其他部分某一分率改变对其他无影响2.二项分布二项分布的均数和标准差均数m=np 标准差s=阳性率的均数mp=p; 标准差sp=样本率的标准差也称率的标准误,用来描述样本量的抽样误差。在一般情况下,总体率是未知的,常用样本率p作为p 的估计值二项分布的图形特征当 =0.5时,图形对称;当 0.5时,图形呈偏态,但随n的增大,图形逐渐对称。 高峰在 n处或附近因此,当n较大, 不
10、太极端时,一般地要求np5且n(1-p)5,可以采用正态近似方法计算概率分布规律 二项分布的概率分布示意图 3. 卡方检验(四格表的画法)卡方分布四格表资料的假设检验配对四格表的2 检验行列表资料的2 检验3.847.8112.59P0.05的临界值12分布属连续型分布;具有可加性;唯一参数,自由度单峰;偏态分布abcd204530252四格表资料的2 检验资料类型:四格表资料(定性资料)设计类型:两独立样本,目的是推断两样本所来自的总体率是否相等,即1= 2 。2四格表资料的2 检验四格表资料的2检验的基本步骤2四格表资料的2 检验2.计算检验统计量n40且所有T5n40但有1T5n40或有
11、T1,A=0 2四格表资料的2 检验2值反映了实际频数和理论频数的吻合程度;2值的大小受A和T相对差值以及格子数的共同影响;理论频数的计算:行合计列合计总例数两种培养基白喉杆菌生长情况配对设计分类变量资料的2检验 甲、乙结果有两种情况: 一致:a(+)和 d(-); 不一致:b(甲+乙-)和c(甲-乙+);733配对四格表的2 检验3配对四格表的2 检验McNemar 检验4行列表的2 检验4行列表的2 检验4行列表的2 检验不同资料类型的2检验的计算方法:79五、直线相关和回归 要点 1.直线相关意义和用途。 2.相关系数r。相关分析 (correlation analysis) 研究两个或
12、多个变量之间关联性或关联程度的一种统计分析方法。用于描述两个随机变量间线性相关方向和密切程度的方法称为直线相关,又称简单相关。相关系数 (correlation coefficient) 描述具有线性关系的两变量间,相关关系的密切程度(大小)和相关方向的指标,总体相关系数用表示,样本相关系数用r表示。相关系数X 的离均差平方和:Y 的离均差平方和:X与Y 间的离均差乘积和: 分类资料绪论统计描述参数估计:抽样分布与参数估计统计表和统计图统计推断数值资料离散趋势:算术均数、几何均数中位数、 百分位数集中趋势:极差、 四分位数间距、方差、标准差、变异系数变量正态分布、二项分布假设检验t 检验方差分
13、析双变量:相关分析非参数检验参数检验-数值变量单变量数值/分类:秩和检验分类变量:c2检验SPSS学习(自学)率、构成比、相对比率的标准化直接法、间接法定量资料前提条件t / Z检验四格表RC表配对四格表设计类型单样本两独立样本配对设计多独立样本方差分析两组二分类配对设计多组多分类单样本两/多独立样本配对设计不满足t 检验/方差分析条件的等级资料设计类型定性资料设计类型 检验秩和检验随机区组资料析因设计资料重复测量资料前提条件前提条件注意:对于符合参数统计分析者,采用非参数统计分析,会降低检验效能。 非参数检验nonparametric statistics对总体的分布类型不作任何要求 特点:
14、不受总体参数的影响,比较的是分布或分布位置。适用范围: 广,可用于任何类型资料。 已知总体分布类型,对未知参数(、)行统计推断特点:依赖于特定分布类型,比较的是参数。 参数检验parametric statistics考试题型单选题10*3判断题10*2简答题4综合应用题2总分:100分第一章 绪论和统计学基本知识统计学基本概念:总体与样本、同质与变异、变量的类型、概率和小概率事件、参数与统计量。统计工作的基本步骤。第三章 医学资料的统计描述了解频数表的用途。掌握定量资料集中趋势,离散趋势的描述指标及各自适用条件。如何对正态分布资料和偏态分布资料进行 统计描述。 第三章 医学资料的统计描述率、
15、构成比、相对比的概念。应用相对数时的注意事项。了解动态数列常用的指标。熟悉统计表的结构及列表的基本原则,能规范绘制统计表。能根据资料类型选择合适的统计图对资料进行描述。掌握 基本概念:直条图,直方图,散点图,圆图。 第三章 医学资料的统计描述第四章 常用概率分布掌握正态分布图形特征及在医学中的应用。掌握医学参考值范围的概念及制定方法。第五章 参数估计抽样误差的概念,标准误的计算。t分布的图形特征。总体均数置信区间的计算。均数置信区间和医学参考值范围的联系及区别。总体概率置信区间估计两种方法的应用条件。第六章 假设检验假设检验中的型错误和型错误。假设检验中P的含义及其与检验水准之间的区别。假设检验的注意事项。第六章 假设检验单样本定量资料的统计分析思路:样本来自正态分布总体时用t 检验;当数据来自偏态分布总体时,首先考虑采用变量变换,再考虑选用秩和检验。第六章 假设检验两独立样本定量资料的统计分析思路:两样本均来自正态总体且总体方差齐时用t 检验;两样本来自正态总体但总体方差不齐时用t 检验或秩和检验。当数据来自偏态分布总体时,首先考虑采用变量变换,再考虑选用秩和检验。第六章 假设检验 配对设计的含义及主要实施形式。 两配对样本定量资料的统计分析思路:若差值服从正态分布,可采用配对t检验;否则,采用配对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品质量检验手册
- 建筑门窗施工图设计合同模板
- 外交学院班主任合同书
- 口腔正畸诊所医师劳动合同
- 城市公园足球场施工合同
- 绿色交通种树施工合同范文
- 2024年工程分包合作合同
- 2024年建筑公司股权变更框架协议
- 自行车维修腻子粉施工协议
- 办公文具租赁合同模板
- 学会宽容善待他人
- 算法及其描述-高中信息技术粤教版(2019)必修1
- RITTAL威图空调中文说明书
- 生物质能发电技术应用中存在的问题及优化方案
- GA 1809-2022城市供水系统反恐怖防范要求
- 幼儿园绘本故事:《老虎拔牙》 课件
- 2021年上半年《系统集成项目管理工程师》真题
- GB/T 706-2008热轧型钢
- 实验六 双子叶植物茎的初生结构和单子叶植物茎的结构
- GB/T 25032-2010生活垃圾焚烧炉渣集料
- GB/T 13610-2020天然气的组成分析气相色谱法
评论
0/150
提交评论