版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1临床研究资料常用统计分析方法2统计数据分析是一门综合技术,也是一门高超的艺术!医学专业知识医学统计学理论知识计算机统计软件技术3学习了统计学理论知识,并不代表已经有能力进行统计数据分析。要不断进行实践。实际科研工作中的“原型”资料与教科书上的
“标准型”例子有一定差距。应用统计软件进行计算分析一定要有正确的综合的统计理论方法的后台背景指导。不但要注重对统计方法的选择,而且要注重对分析结果的解释。4一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述5医学统计学研究设计数据处理观察性研究实验性研究统计描述统计推断假设检验参数估计(调查)6调查设计系统
分层随机
整群调查方法调查对象
调查指标研究目的按范围按时间抽样普查横向(现况调查)非概率概率简单随机纵向病例对照研究队列研究
调查工具
调查员nestedcasecontrolstudy7实验设计实验分类动物实验临床试验社区干预试验基本要素处理因素受试对象实验效应诊断试验疾病防治病因疾病预后8实验设计基本原则随机化、盲法对照重复(样本含量)形式原则:专设、同步、均衡
1-
、、
自身处理前后平行:无治疗安慰剂阳性治疗不同剂量9统计描述资料类型数学
连续型(计量)离散型:计数计量:脉搏次数/分统计
等级(有序分类)计量
计数(无序分类)定比(0表示无,如体重kg)定距(0不表示无,如温度0C)10统计描述统计表制表原则制表要求
简单明了主辞在左、宾辞在右一张表表达一个中心内容备注数字
线条
标目标题11统计描述统计图制图原则制图要求
连续型资料(计量)离散型资料(计数、计量)图例刻度
纵轴、横轴
标目标题
条图、圆图、百分比条图
线图、直方图、散点图12统计描述
统计指标计量资料(单变量)中心位置
正态:非正态:对数正态:
离散程度
个体值
样本均数:
正态非正态:
量纲相同:量纲不同:计量资料(双变量)偏度:g1
峰度:g213统计描述
统计指标计量资料(单变量)计量资料(双变量)离散程度:r、b14统计描述
中心位置:均数向量离散程度:离均差平方和矩阵协方差矩阵相互关系:相关矩阵计量资料
(多变量)统计指标15统计描述等级资料统计指标计数资料率、构成比、相对比RR(OR)离散程度:标准误离散程度:秩号、秩和秩和的标准误单变量双变量:rs16统计描述参考值范围估计正态偏态或双侧:单侧:双侧:单侧:或17统计推断区间估计参数估计点估计双侧:单侧:或双侧:单侧:或RR(OR):18统计推断假设检验步骤1.进行检验假设假设样本来自某一特定总体2.确定检验水准确定最大允许误差3.选定检验方法计算检验统计量计算样本与总体的偏离程度4.根据某一特定分布计算与检验统计量对应的P值5.作出结论根据小概率反证法思想作出推断19统计推断比较差别:
2、t、F、q、log-rank、秩和检验等联系:相关、回归分析分类:回归分析、判别分析推测:回归分析筛选影响因素:回归分析综合变量信息:主成分分析寻找潜在支配因素:因子分析假设检验方法20
统计分析软件
SPSS
(有人称“鼠标软件”)
SAS
(StatisticalAnalysisSystem)
Stata
R
(方法新、提供源程序、免费)21SPSS软件
StatisticalPackageforSocialScience(社会科学统计软件包)
后改名为:
StatisticalProductandServiceSolutions(统计产品与服务解决方案)现改名为PASWPredictiveAnalyticsSoftware
预测分析软件22一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述23原始数据的记录形式行:观察单位列:变量24标识变量分析变量25标识变量分析变量自变量(解释变量)反应变量26原始数据的录入文件类型:数据库文件:EpiDataExcel文件:Excel统计软件数据文件:SPSS(PASW)、SAS、Stata变量名及标签:变量值及标签:名义变量值的量化:有序、无序分类资料2728数据编辑窗口数据窗标题栏菜单栏工具按钮栏数据单元格显示数据文件建立原则一个观测占一行一个变量占一列2729变量度量类型变量名变量类型变量宽度保留小数位数变量名标签变量值标签缺失值显示数据列宽数据对齐方式数据编辑窗口变量窗2830定量变量
Scale
等级变量
Ordinal名义变量
Nominal2931标准数值型科学记数法圆点数值型逗号数值型日期型带美元符号数值型自定义字符型3032名义变量的哑变量化原资料姓名性别X1年龄X2
疗法
X3张三150中西医李四120西医王五018中医刘六070中医赵七135中西医孙八029西医哑变量化姓名X1X2X31X32张三15001李四12010王五01800刘六07000赵七13501孙八0291033一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述34数据的净化
逻辑检查
计算检查
离群数据的处理
离群值(outliner)
与P25或P75的距离为“四分位数间距”的1.5~3.0倍。
极端值(extremevalue)
与P25或P75的距离为“四分位数间距”的3.0倍以上。
剔除离群或极端值要予以合理解释。35数据质量有问题,使用的统计方法越高级,欺骗性越大!36一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述37设计类型:完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计处理因素:单因素、双因素、多因素水平:单水平、两水平、多水平处理效应:单变量、双变量、多变量资料类型:计量、无序分类、有序分类数据情况:完全数据、不完全数据、重复测量数据、层次结构数据假设检验方法前提条件:
独立、方差齐性、正态分布重要38二个处理因素,观测指标为单变量。39一个处理因素,观测指标为三个变量。40(一)单变量计量资料1.样本均数与总体均数比较
单因素服从正态分布
单样本t检验
可信区间法不服从正态分布
单个样本中位数与总体中位数比较412.两个相关样本均数的比较单因素配对设计或自身前后对照设计差值服从正态分布
成对t检验可信区间法差值不服从正态分布
Wilcoxon符号秩检验(一)单变量计量资料(1-α)可信区间不包括μd=0,P<α423.两个独立样本的比较
单因素、完全随机设计服从正态分布且方差齐性
两样本均数比较t检验两样本均数的差数可信区间法不服从正态分布或方差不齐性
两独立样本Wilcoxon秩和检验
反应变量为生存时间且含有截尾数据
log-rank检验(时序检验)(一)单变量计量资料434.多个样本均数的比较(1)一个处理因素完全随机设计服从正态分布、方差齐性
完全随机设计方差分析两两比较:SNK-q、Dunnett-t检验不服从正态分布或方差不齐性
多个独立样本比较Kruskal-WallisH检验两两比较:Nemenyi检验(一)单变量计量资料444.多个样本均数的比较(2)一个处理因素、一个控制因素随机区组设计
(对数据服从正态分布、方差齐性不作要求)
随机区组设计方差分析处理因素各组均数间两两比较:
SNK-q、Dunnett-t检验
(一)单变量计量资料454.多个样本均数的比较(3)一个处理因素、二个控制因素(行、列)
拉丁方设计
(对数据服从正态分布、方差齐性不作要求)
拉丁方设计方差分析处理因素各组均数间两两比较:
SNK-q、Dunnett-t检验
(一)单变量计量资料464.多个样本均数的比较(4)一个处理因素、二个控制因素(阶段、受试者)
二阶段交叉设计
服从正态分布、方差齐性前一阶段处理效应不持续作用到下一阶段
二阶段交叉设计方差分析
(一)单变量计量资料474.多个样本均数的比较(5)处理因素≥2、每个因素的水平数≥2
完全随机分组析因设计
服从正态分布分析各因素主效应与交互作用
完全随机分组析因设计方差分析(一)单变量计量资料48494.多个样本均数的比较(6)处理因素≥2、每个因素的水平数≥2
正交设计分析各因素主效应与主要因素一阶交互作用
正交设计直接分析、方差分析(一)单变量计量资料504.多个样本均数的比较(7)处理因素≥2,每个因素的水平数≥2
处理因素中有一个为重复测量因素
满足“球对称”(组间、组内方差齐性)假设分析各因素主效应与交互作用
重复测量设计的方差分析(一)单变量计量资料51重复测量设计(两因素)52SPSS(PASW)软件分析:GeneralLinearModel以析因设计方差分析为例(一)单变量计量资料5354(二)计数资料1.一个样本率与总体率比较
基于二项分布的直接概率法正态近似法u检验552.两样本率比较
(二)计数资料
(1)两组完全随机设计N40且T
5Pearson
2检验N40但5>T
1
Pearson
2检验
(Yates校正公式)N<40或T<1
Fisher确切概率法
(2)配对设计
McNemar
2检验Logistic回归分析56Y(疗效)=
1有效0无效X1(疗法)=
1新疗法0传统疗法组别疗效频数
119910501750021数据输入格式573.病例对照研究成组资料分层分析(二)计数资料58(1)检验病例组与对照组有暴露史(饮酒)的比例是否有差异:分层Pearson
2检验(2)剔除混杂因素(吸烟)影响后分析饮酒与食管癌关联:Mantel-Haenszel
2检验(3)计算暴露与疾病的关联强度
分层OR值计算;
分层OR值一致性检验;
如一致,计算Mantel-Haenszel公共OR值。594.R
C列联表相关、相差
(1)双向有序备择假设:行变量与列变量为非零相关Cochran-Mantel-Haenszel
2检验有序分组资料的线性趋势检验2回归(二)计数资料60双向有序的R×C表资料614.R
C列联表相关、相差
(2)单向(反应变量)有序备择假设:行平均得分不同Cochran-Mantel-Haenszel
2检验Wilcoxon秩和检验(二)计数资料分组变量无序62单向有序(仅指反应变量)的R×C表资料634.R
C列联表相关、相差
(3)双向无序备择假设:行变量与列变量有一般关联Cochran-Mantel-Haenszel
2检验Pearson
2检验(二)计数资料64双向无序的R×C表资料651.配对设计
Wilcoxon符号秩检验2.两组独立样本
Wilcoxon两样本秩和检验3.完全随机设计多个样本比较
Kruskal-WallisH检验4.随机区组设计多个样本比较
FriedmanM检验(三)等级资料661.相关分析
X1与X2服从二元正态分布
Pearson积差相关分析
X1与X2不服从二元正态分布
Spearman秩相关分析2.回归分析
Y与X服从二元正态分布或Y服从正态分布而X为控制变量
Y与X间呈直线趋势
直线回归分析(四)双变量计量资料673.曲线回归分析(SPSS)683.曲线回归分析(SPSS)694.协方差分析比较带有协变量(Xj)的各组均数()间的差别协变量Xj对Yj有影响分为完全随机设计与随机区组设计701.有应变量的多元分析(五)多变量资料711.有应变量的多元分析
Y为计量资料且服从正态分布自变量服从多元正态分布
多元线性回归或多元逐步回归分析(五)多变量资料βj的意义为在其它自变量保持不变时,Xj增加或减少一个单位时Y的平均变化量。可排除混杂因素影响。721.有应变量的多元分析
Y为二分类或多分类变量以分析影响Y的危险因素为主要目的
Logistic回归分析(五)多变量资料731.有应变量的多元分析
Y为生存时间且含有截尾数据以分析影响Y的危险因素为主要目的
Cox比例风险回归分析(五)多变量资料74开始观察时间:1992.01.01终止随访时间:2001.12.31751.有应变量的多元分析
Y为二分类或多分类变量根据判别对象若干个指标的观测值判定其应属于哪一类为主要目的
Bayes判别分析(五)多变量资料762.无应变量的多元分析(五)多变量资料772.无应变量的多元分析主成分分析将所有变量化为少数几个互不相关的综合变量因子分析
从所有变量中找出有限个不可观测的潜在因素典型相关分析分析两组集团变量之间的相关关系(五)多变量资料78一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述791.统计分析结果的正确表述
在报告结论时,最好列出检验统计量的值,尽量写出具体P值,而不简单写成
P﹤0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。经常遇到PASW软件计算结果中P=0.000的情况,这是由于P值小于0.0005或更小,因保留3位小数四舍五入所致,在论文中可写为P<0.0005。(一)统计分析结果的表述与理解801.统计分析结果的正确表述统计结论P≤
,按
检验水准,拒绝H0,接受H1差别有统计学意义…thedifferencewasstatisticallysignificant.Wecoulddrawtheconclusionthat…
专业结论可以认为…不同,…高于(低于)…。结论较肯定,因知犯第一类错误概率范围。(一)统计分析结果的表述与理解81统计结论P>
,按
检验水准,不拒绝H0差别无统计学意义…thedifferencewasnotstatisticallysignificant
.
专业结论还不能认为两总体均数或率不同。结论不肯定,因不知犯第二类错误概率范围。不拒绝H0不意味能证实H0是正确的(两总体均数或率相同)。(一)统计分析结果的表述与理解822.统计学结论与医学专业结论有分岐时
统计结论“有意义”,专业结论“无意义”,最终结论为无临床意义。
统计结论“无意义”,专业结论“有意义”,可能原因:样本含量较小;试验误差较大;误用统计分析方法。(一)统计分析结果的表述与理解83
体重均数标准差最小值最大值对照组疗前68.918.79425299(111例)疗后68.958.79925199
差值0.04500.9666-23
前后比较t=0.4905P=0.6248试验组疗前68.977.78755592(114例)疗后68.727.86795395
差值-0.19300.9855-34
前后比较t=2.0921P=0.0387
两组差值比较t=1.1372P=0.2567统计学上有意义,但无临床意义实例84研究某药物对脑梗塞患者的作用,采用欧洲脑卒中评分(ESS),试验组与对照组各50例。试验组疗后比疗前E
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年产xx砂浆添加剂项目可行性研究报告(立项备案)
- 年产xxx星铁棚项目投资分析报告
- 年产xxx脱绒机项目投资分析报告
- 3-二氧五环项目立项申请报告
- 2021-2022学年广东省深圳市龙华区三年级(上)期末英语试卷
- 呼吸困难护理
- 4.1.2 水循环-水循环的地理意义及洪涝灾害防治 课件 高一上学期 地理 湘教版(2019)必修一
- 护理诊断案例分享
- 小班主题活动教案及教学反思《高高兴兴上幼儿园》
- 急危重症患者管理
- 小学三通两平台汇报
- 防火巡查记录表防火检查记录表
- “校园周边环境安全隐患”自检自查(排查)记录表
- 高二上学期日语阅读四篇自测
- 大学生职业生涯规划成长赛道 (第二稿)
- JB T 6464-2006额定电压1kV(Um=1.2kV)到35kV行业标准
- 呼吸科健康宣教
- 人体身体成分健康分析报告
- 人工智能驱动的数字经济发展与应用探索
- 《畜牧兽医专业介绍》课件
- 《心理健康教育》课件
评论
0/150
提交评论