版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章医学统计中的基本概念
(BasicConceptinMedicalStatistics)
武汉大学流行病与卫生统计学系宇传
卫生部“十一五”规划教材《医学统计学》主编:马斌荣第01章医学统计中的基本概念第01章医学统计中的基本概念统计学(statistics)
统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。第一节概述第01章医学统计中的基本概念
根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计……医学统计学(medicalstatistics):用统计学的原理和方法研究医学中的问题。
卫生统计学(healthstatistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。第01章医学统计中的基本概念第01章医学统计中的基本概念北京某医院某大夫使用“乌贝散”,治疗胃溃疡病出血107例,有效101例,有效率为94.4%。别的医院,其他大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?求
95%置信区间(confidenceinterval)第01章医学统计中的基本概念
某医院有位老大夫,用“冠心灵”治疗冠心病,其对照组用西药,观察结果如下表:
表1-1冠心灵与单纯西药疗效对比
显效有效无效合计
单纯西药925640
冠心灵1918542冠心灵是否比单纯西药有效?假设检验(testofsignificance),
俗称要算P值。第01章医学统计中的基本概念1.采用统计学方法,发现不确定现象背后隐藏的规律。变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。
为什么要学统计学?第01章医学统计中的基本概念
最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。第01章医学统计中的基本概念2.
用统计学思维方式考虑有关医学研究中的问题
“阳性”结果是否是虚假联系?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?
“阴性”结果是否是样本含量不足?
有人曾对发表在Lancet,NEnglJMed,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由于样本含量不足造成的假阴性。
第01章医学统计中的基本概念3.
保证你的研究论文能通过统计学审查
据国外60~80年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。第01章医学统计中的基本概念JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。
UniformRequirementsforManuscripts
SubmittedtoBiomedicalJournals
http://第01章医学统计中的基本概念4.
获得循证医学证据的主要手段“良好愿望的医学”(well-meaningmedicine)转入“以证据为基础的医学”(evidence-basedmedicine,EBM)需要有统计学方法的支持。
全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。
第01章医学统计中的基本概念第二节医学统计资料的来源与分类一、原始统计数据的来源常规保存数据医院信息系统(HIS)、统计报表等2.现场调查记录3.实验记录4.其他第01章医学统计中的基本概念二、统计数据的分类只有认识了数据的特点,才能正确地选用统计分析方法
按变量测量的精确程度由低到高,将数据分类为:名义数据(如性别、婚姻状况)、有序变量(如疗效,类别间差别大小难以度量)、区间变量(如摄氏体温,类别间差别有实际意义)、比变量(如身高,除具有区间变量的特征外,还具有真实意义的零点。摄氏温度的零点为水结冰时温度,并非绝对意义的零点,所以它不属于比变量)定量数据定性数据第01章医学统计中的基本概念1、定性数据(qualitativedata)
(二项与多项)分类数据(categoricaldata)
计数数据(enumeration(counting)data)
2、定量数据(quantitativedata)
计量数据(measurementdata)区间数据(intervaldata)数值数据(numericaldata)3、等级资料(rankeddata)
有序资料(ordinaldata)
(一)定性与定量数据的别名第01章医学统计中的基本概念(二)三类数据间的关系
例:一组20
40岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数
<8低血压
8
正常血压
12
轻度高血压
15
中度高血压
17
重度高血压定量数据等级数据定性数据第01章医学统计中的基本概念住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局2716571.55无中学顺产足月2216074.05无小学助产足月2515868.06管理员大学顺产足月2316169.05无中学剖宫产足月2515962.011商业中学剖宫产足月2715768.02无小学顺产早产2015866.04无中学助产早产2415870.53无中学助产足月2915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata定量资料Qualitativedata定性数据Units;elements第01章医学统计中的基本概念(三)三类数据的编码与计算(1)
例:一组20
40岁成年人的血压以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数
<8低血压418
正常血压102
12
轻度高血压13315
中度高血压164
17
重度高血压185定量数据等级数据定性数据第01章医学统计中的基本概念(三)三类数据的编码与计算(2)1.定量数据:允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理)2.定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等)
调查14名男子的婚姻状况分类编码频数(frequency)单身13已婚25离异32分居443.有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理)第01章医学统计中的基本概念第三节统计学常用的基本概念第01章医学统计中的基本概念1、变量——可以测量的任何特征或属性Anycharacteristicorattributethatcanbemeasured。(不同个体结果可能不同)随机变量——在概率论中称变量为随机变量
一、变量与随机变量Variableandrandomvariable
根据观察数据之间有无缝隙(gap),常将数据分类为离散型(discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。第01章医学统计中的基本概念第01章医学统计中的基本概念
对随机变量的取值过程为测量。取值所采用的标准为测量尺度。二、测量和测量尺度
采用统一的标准化的尺度进行测量,其测量结果一般是稳定的和一致的,例如身高、胸围等形态指标的测量均采用统一的测量尺度(全国统一研制的身高计、胸围尺均以厘米为记录单位,体重以公斤为记录单位,肺活量以毫升为单位等)第01章医学统计中的基本概念三、总体与样本populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分研究对象
第01章医学统计中的基本概念随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。第01章医学统计中的基本概念第01章医学统计中的基本概念四、参数与统计量
parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数
总体样本抽取部分观察单位
统计量
参数
推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。第01章医学统计中的基本概念
样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。
概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。五、频率与概率
frequencyandprobability第01章医学统计中的基本概念必然事件P=1随机事件0<P<1不可能事件P=0
P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件CertainImpossible0.501第01章医学统计中的基本概念频率与概率间的关系:
1.样本频率总是围绕概率上下波动
2.样本含量n越大,波动幅度越小,频率越接近概率。第01章医学统计中的基本概念
六、误差(Error)测量值=真值+随机误差+非随机误差
Xi=
i+
i
1.随机误差(随机抽样误差):影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。
2.系统误差受确定因素影响,大小变化有方向性。
3.非系统误差(过失误差)研究者偶然失误而造成的误差。偏差(bias)第01章医学统计中的基本概念第三节医学统计中的基本概念五、误差(error)系统误差(systemerror)
随机测量误差(randommeasurementerror)
随机抽样误差(samplingerror)
必须克服
应采取措施,尽最大可能在一定的允许范围内
抽样误差,对它要用统计方法进行正确分析
第01章医学统计中的基本概念七、准确度与可靠度准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。可靠度(reliabiliy)——
也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。第01章医学统计中的基本概念第01章医学统计中的基本概念八、因果关系与统计学联系因果关系(causality)统计学联系(association)由于混杂因素,标准的统计学方法一般只能获得是否存在统计学联系的结论。第01章医学统计中的基本概念
一、研究设计二、搜集资料三、整理资料四、分析资料五、结果表达第四节统计工作的基本步骤第01章医学统计中的基本概念1.调查设计(surveydesign)对研究对象不施加任何干预,通常建立随机抽样(randomsampling)方案。2.实验设计(experimentdesign)对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(randomallocation)方案。一、研究设计第01章医学统计中的基本概念实验设计的三个基本原则1.随机化(randomization)2.对照(control)3.重复(replication)第01章医学统计中的基本概念Fisher在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。”
第01章医学统计中的基本概念试验设计常用方法
(一)完全随机设计
(completelyrandomdesign)
(二)配对设计
(matchingdesign)
(三)随机区组设计
(randomblockdesign)第01章医学统计中的基本概念二、搜集资料(datacollection)搜集资料要遵循准确、完整、及时三个原则。资料搜集计划包括:①选择搜集资料的地点、人员和时间;②搜集资料人员的培训方案;③预调查或预实验方案拟定;④资料的记录方式;⑤调查表的拟订和印刷;⑥调查或实验仪器、试剂的准备;⑦调查资料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年统编版2024选修3化学上册月考试卷含答案
- 2024年菏泽家政职业学院高职单招职业适应性测试历年参考题库含答案解析
- 2025年华师大新版九年级科学上册月考试卷含答案
- 2024年茂名职业技术学院高职单招职业适应性测试历年参考题库含答案解析
- 2025年华东师大版四年级语文下册月考试卷含答案
- 二零二五年电商平台数据分成合作协议3篇
- 2025年浙教版九年级科学下册阶段测试试卷
- 2025年人教A新版高一地理下册月考试卷含答案
- 2025年沪科版必修2物理上册月考试卷含答案
- 2024年福建艺术职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 危险化学品的应急处理和救援措施
- DB23-T 2334-2019 装配式混凝土矩形渠道应用技术规范
- 一年级口算天天练(可直接打印)
- 软件无线电原理与应用第3版 课件 【ch02】软件无线电理论基础
- 国网山东电力生产技术改造原则
- 铁路运输安全现场管理
- 2023年某保险公司春节经营教材
- 刘都才-南方水稻田杂草发生动态及防控技术
- 全自动化学发光分析仪操作规程
- 深蓝的故事(全3册)
- GB/T 42461-2023信息安全技术网络安全服务成本度量指南
评论
0/150
提交评论