版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据处理的一般原则与方法第29章第二军医大学卫生统计学教研室张罗漫10/31/20231医学统计学讲课内容:第一节医学统计学概述(重点)第二节原始数据的录入第三节数据处理的几个基本问题第四节统计方法选择的基本思路(重点)10/31/20232医学统计学第一节医学统计学概述10/31/20233医学统计学医学统计学研究设计数据处理观察性研究实验性研究统计描述统计推论假设检验参数估计(调查)10/31/20234医学统计学调查设计调查方法调查对象
调查指标研究目的按范围按时间抽样普查横向(现况调查)非概率概率简单随机系统
分层随机
整群纵向病例对照研究队列研究
调查工具
调查员10/31/20235医学统计学实验设计实验分类动物实验临床试验社区干预试验基本要素处理因素受试对象实验效应10/31/20236医学统计学实验设计随机化基本原则对照重复(样本含量)设置原则:均衡可比
类型:配对、组间
1-
、、
空白实验安慰剂标准相互10/31/20237医学统计学统计描述统计表制表原则制表要求
简单明了主语在左、宾语在右一张表表达一个中心内容备注数字
线条
标目标题10/31/20238医学统计学统计描述统计图制图原则制图要求
连续性资料:间断性资料:图例刻度
纵轴、横轴
标目标题
条图、圆图、百分比条图
线图、直方图、散点图10/31/20239医学统计学统计描述
统计指标计量资料(单变量)中心位置
正态:非正态:对数正态:
离散程度
个体值
样本均数:
正态非正态:
量纲相同:量纲不同:计量资料(双变量)离散程度:r、b10/31/202310医学统计学统计描述
中心位置:均数向量离散程度:离均差矩阵协方差矩阵相互关系:相关矩阵计量资料
(多变量)统计指标10/31/202311医学统计学统计描述等级资料统计指标计数资料绝对数、率、构成比、相对比、RR(OR)离散程度:标准误离散程度:秩号、秩和秩和的标准误单变量双变量:rs10/31/202312医学统计学统计描述参考值范围估计正态偏态或双侧:单侧:双侧:单侧:或10/31/202313医学统计学统计推论参数估计区间估计点估计双侧:单侧:或双侧:单侧:或RR(OR):10/31/202314医学统计学统计推论假设检验步骤1.进行检验假设假设样本来自某一特定总体2.确定检验水准
确定最大允许误差3.选定检验方法计算检验统计量
计算样本与总体的偏离程度4.根据一特定分布计算与检验统计量对应的P值5.作出结论根据小概率反证法思想作出推断10/31/202315医学统计学统计推论比较差别:
2、t、u、F、q、log-rank
、秩和检验等联系:相关、回归分析分类:聚类、回归分析鉴别:判别分析推测:回归分析筛选影响因素:回归分析综合变量信息:主成分分析寻找潜在支配因素:因子分析假设检验方法10/31/202316医学统计学第二节原始数据的录入10/31/202317医学统计学一、原始数据的记录形式行:观察单位列:变量10/31/202318医学统计学标识变量分析变量10/31/202319医学统计学标识变量分析变量解释变量反应变量10/31/202320医学统计学二、原始数据的录入文件类型:数据库文件:EpitaDa
dBASE、FoxBASE、FoxprowOracleExcel文件:Excel文本文件:Word统计软件数据文件:SPSS、SAS、STATA变量名的定义:变量值的量化:10/31/202321医学统计学第三节数据处理的几个基本问题10/31/202322医学统计学一、数据的净化
逻辑检查
计算检查
二、离群数据的处理
离群值(outliner)
与P25或P75的距离为“四分位数间距”的1.5~3.0倍。
极端值(extremevalue)
与P25或P75的距离为“四分位数间距”的3.0倍以上。
剔除离群或极端值要予以合理解释。10/31/202323医学统计学三、统计方法前提条件的检验
多样本比较的方差分析:
独立
正态分布
方差齐性
多重线性回归分析:
变量间无多重共线
残差分布正态
┇
10/31/202324医学统计学第四节统计方法选择的基本思路10/31/202325医学统计学根据:医学专业知识医学统计学知识计算机统计软件技术10/31/202326医学统计学设计类型:完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计处理因素:单因素、双因素、多因素反应变量:单变量、双变量、多变量资料类型:计量、无序分类、有序分类样本数目:单样本、两样本、多样本数据提供信息:完全数据、不完全数据、重复测量数据假设检验方法前提条件:
独立、方差齐性、正态分布重要10/31/202327医学统计学一、单变量计量资料1.样本均数与总体均数比较
单因素服从正态分布
单样本t检验可信区间法不服从正态分布
单个样本中位数与总体中位数比较10/31/202328医学统计学2.两个相关样本均数的比较单因素配对设计或自身前后对照设计差值服从正态分布
成对t检验可信区间法差值不服从正态分布
Wilcoxon符号秩检验一、单变量计量资料1-α可信区间不包括μd=0,P<α10/31/202329医学统计学3.两个独立样本的比较
单因素、完全随机设计服从正态分布且方差齐性
两样本均数比较t检验两样本均数的差数可信区间法不服从正态分布或方差不齐性
两独立样本Wilcoxon秩和检验
反应变量为生存时间且含有截尾数据
log-rank检验一、单变量计量资料10/31/202330医学统计学4.多个样本均数的比较(1)一个处理因素完全随机设计服从正态分布、方差齐性
完全随机设计方差分析两两比较:SNK-q、Dunnett-t检验不服从正态分布或方差不齐性
多个独立样本比较Kruskal-WallisH检验两两比较:Nemenyi
检验一、单变量计量资料10/31/202331医学统计学4.多个样本均数的比较(2)一个处理因素、一个控制因素随机区组设计服从正态分布、方差齐性
随机区组设计方差分析两两比较:SNK-q、Dunnett-t检验不服从正态分布或方差不齐性
多个相关样本比较FriedmanM检验两两比较:q检验一、单变量计量资料当处理因素为重复测量因素且不满足“球对称”假设,应用重复测量设计方差分析10/31/202332医学统计学4.多个样本均数的比较(3)一个处理因素、二个控制因素(行、列)
拉丁方设计服从正态分布、方差齐性
拉丁方设计方差分析两两比较:SNK-q、Dunnett-t
检验
一、单变量计量资料10/31/202333医学统计学4.多个样本均数的比较(4)一个处理因素、二个控制因素(阶段、受试者)
二阶段交叉设计服从正态分布、方差齐性前一阶段处理效应不持续作用到下一阶段
二阶段交叉设计方差分析
一、单变量计量资料10/31/202334医学统计学4.多个样本均数的比较(5)处理因素≥2、每个因素的水平数≥2
完全随机分组析因设计服从正态分布分析各因素主效应与交互作用
完全随机分组析因设计方差分析一、单变量计量资料10/31/202335医学统计学4.多个样本均数的比较(6)处理因素≥2、每个因素的水平数≥2
正交设计服从正态分布分析各因素主效应与主要因素一阶交互作用
正交设计直接分析、方差分析一、单变量计量资料10/31/202336医学统计学4.多个样本均数的比较(7)处理因素≥2,每个因素的水平数≥2
处理因素中有一个为重复测量因素不满足“球对称”假设分析各因素主效应与交互作用
重复测量设计的方差分析一、单变量计量资料10/31/202337医学统计学二、计数资料1.一个样本率与总体率比较
基于二项分布的直接概率法正态近似法u检验10/31/202338医学统计学2.两样本率比较二、计数资料
(1)两组完全随机设计N40且T
5Pearson
2检验N40但5>T
1Pearson
2检验
(Yates校正公式)N<40
或T<1
Fisher确切概率法
(2)配对设计
McNemar
2检验Logistic回归分析10/31/202339医学统计学Y(疗效)=
1有效0无效X1(试验因素)=
1有0无组别疗效频数
119912521752221数据输入格式10/31/202340医学统计学3.R
C列联表相关、相差
(1)双向有序备择假设:行变量与列变量为非零相关Cochran-Mantel-Haenszel
2检验有序分组资料的线性趋势检验
2回归
(2)单向(反应变量)有序备择假设:行平均得分不同Cochran-Mantel-Haenszel
2检验Wilcoxon
秩和检验二、计数资料10/31/202341医学统计学3.R
C列联表相关、相差
(3)双向无序备择假设:行变量与列变量有一般关联Cochran-Mantel-Haenszel
2检验Pearson
2检验二、计数资料10/31/202342医学统计学1.配对设计
Wilcoxon符号秩检验2.两组独立样本
Wilcoxon两样本秩和检验3.完全随机设计多个样本比较
Kruskal-WallisH检验4.随机区组设计多个样本比较
FriedmanM检验三、等级资料10/31/202343医学统计学1.相关分析
X1与X2服从二元正态分布
Pearson积差相关分析
X1与X2不服从二元正态分布
Spearman秩相关分析2.回归分析
Y与X服从二元正态分布或Y服从正态分布而X为控制变量
Y与X间呈直线趋势
直线回归分析四、双变量资料10/31/202344医学统计学3.曲线回归分析(SPSS)10/31/202345医学统计学3.曲线回归分析(SPSS)10/31/202346医学统计学4.协方差分析比较带有协变量(Xj)的各组均数()间的差别协变量Xj对Yj有影响分为完全随机设计与随机区组设计10/31/202347医学统计学1.有应变量的多元分析五、多变量资料10/31/202348医学统计学1.有应变量的多元分析
Y为计量资料且服从正态分布自变量服从多元正态分布
多元线性回归或多元逐步回归分析五、多变量资料10/31/202349医学统计学1.有应变量的多元分析
Y为判别分类变量自变量服从多元正态分布
判别分析或逐步判别分析五、多变量资料10/31/202350医学统计学1.有应变量的多元分析
Y为二分类或多分类变量以分析危险因素为主要目的
条件或非条件Logis
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论