版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计中的基本概念1第1页,共44页,2023年,2月20日,星期三第一章医学统计中的基本概念2第2页,共44页,2023年,2月20日,星期三一、统计学
(statistics)
统计学是研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学推断。第一节绪论3第3页,共44页,2023年,2月20日,星期三二、医学统计学
医学统计学是研究数据的搜集、整理、分析与推断的科学。是把统计理论方法应用于居民健康状况研究、医疗卫生实践和医学科研的一门应用性学科。医学统计学广泛地应用于基础医学、临床医学、预防医学和卫生事业管理等领域。4第4页,共44页,2023年,2月20日,星期三第二节医学统计工作中的基本概念5第5页,共44页,2023年,2月20日,星期三举例:比较两种不同的治疗方法(如西药与中药)对高血压的控制情况。药物是实验因素,性别、年龄等为非试验因素,血压是观测指标。一、同质和变异(homogeneityandvariation)6第6页,共44页,2023年,2月20日,星期三观察单位(observationunit):亦称个体(individual)
是统计研究中最基本的单位,它可以是一个人、一个家庭、一个地区、一个样品等。严格地讲,除了实验因素外,影响被研究指标的非实验因素(容易控制的)相同被称为同质。在同质的基础上被观察个体(或单位)之间的差异被称作变异(variation)
,亦称为个体差异。变异是由众多的、偶然的、次要的因素造成的。7第7页,共44页,2023年,2月20日,星期三变量:被观察对象的特征或指标称为变量。(习惯上称指标)变量值:也称观察值(observedvalue,measurements)
是变量的观察结果可以是定量的如:身高、体重血压等;亦可以是定性的如性别、血型、疗效等)变量及变量值(variableandvalueofvariable)被观察对象的年龄、体重、血压性别、种族文化程度等8第8页,共44页,2023年,2月20日,星期三1、总体(Population)
是指根据研究目的所确定的同质研究对象的全体。更确切地说是同质的所有观察单位某种观察值(变量值)的集合。分有限总体与无限总体。二、总体与样本有限总体(finitepopulation):
研究对象的个体数目是有限的总体。无限总体(infinitepopulation):
研究对象的个体数目不确定或无限多。9第9页,共44页,2023年,2月20日,星期三2、样本(Sample)
是指从总体中随机抽取的一部分观察单位。样本含量(Samplesize)医学上称为样本例数是指样本包含的个体的数目,用“n”表示。而总体中包含的个体的数目,用“N”表示。10第10页,共44页,2023年,2月20日,星期三三、抽样(Sampling)从总体中抽取部分个体的过程,即为抽样。★随机抽样(randomsampling)
是指在抽样的过程中,遵循随机化原则。随机化原则:要求总体中每一个个体都有相等的被选机会进入样本。随机抽样的优点:避免抽样过程中人为因素(如:主观意愿或客观无意识)的影响,保证样本的代表性。
11第11页,共44页,2023年,2月20日,星期三★样本的特性1.随机性(randomization):
遵循随机化原则。(随机≠随意≠随便)2.代表性(representative):
样本中的每个个体来自同一总体。3.可靠性(reliability):
所作的结论可信度较高,样本含量“足够”。4.可比性(comparable):
遵循齐同对比的原则。12第12页,共44页,2023年,2月20日,星期三各
种
抽
样
方
法
的
特
点简单随机抽样(simplerandomsampling):
最基本的抽样方法。系统抽样(systematicsampling)
:
又称等距抽样。分层抽样(stratifiedsampling):
层(strata)间差异大,层内差异小。整群抽样(clustersampling):
群间差异小,群内差异大。抽样误差的大小:
分层抽样<系统抽样<简单随机抽样<整群抽样13第13页,共44页,2023年,2月20日,星期三四、实验设计1.完全随机设计(completelyrandomdesign):
是将受试对象随机分配到各个处理组或对照组中。可以是两样本比较,也可以是多样本比较;各样本含量可以相等,也可以不等,但不宜差别太大。2.配对设计(matchingdesign):
是将受试对象按一定条件配成对子,将他们随机分到两个组中,分别给予不同的处理。配对条件是指有可能影响实验效应的非主要因素。3.随机区组设计(randomblockdesign):
亦称为配伍组设计,它是配对设计的扩展。每个配伍组包含多个受试对象,将它们分别随机分到各处理组。14第14页,共44页,2023年,2月20日,星期三五、误差(error)
统计上所说的误差泛指实测值与真值之差,以及样本指标与总体指标之差。
抽样误差是指由抽样引起的某指标的样本统计量(如样本均数)与该指标的总体参数(如总体均数)的差异。15第15页,共44页,2023年,2月20日,星期三(1)系统误差
(systemerror)
是由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因使测量结果呈倾向性偏大或偏小。
特点:
▲有倾向性
▲可避免
(2)随机测量误差
(randommeasurementerror)
由于偶然因素(如操作技术不稳定、不同操作员之间的操作差异、电压不稳、环境温度差异等)的影响所致的误差。
特点:▲无倾向性
▲不可避免(3)抽样误差(samplingerror)
由于抽样所致的样本统计量与总体参数的差异。
原因:总体中的个体之间存在变异
(个体差异)。
特点:
▲无倾向性
▲不可避免16第16页,共44页,2023年,2月20日,星期三六、概率与频率
频数(frequency):是指在试验中某事件发生的次数。
事件实际发生次数()
频率=—————————————
可能发生(试验)总次数(N)1、频率17第17页,共44页,2023年,2月20日,星期三2、概率(probability):
是指某事件发生的可能性大小。用“P”表示。
P的取值范围:0≤P≤1
P=0
不可能事件(事件必不发生)
P=1
必然事件(事件必发生)小概率事件:
P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。随着实验次数增至足够大,频率逐渐稳定于某一常数附近,则该常数称之为概率。18第18页,共44页,2023年,2月20日,星期三第三节医学统计工作的内容和资料类型19第19页,共44页,2023年,2月20日,星期三一、资料的类型(变量类别)1、计量资料
(数值变量
numericalvariable)2、计数资料
(无序分类变量
unorderedcategoriesvariable
)3、等级资料
(有序分类变量
ordinalcategoriesvariable
)
20第20页,共44页,2023年,2月20日,星期三1、计量资料(measurementdata)定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:★取值是定量的★表现为数值大小
★有度量衡单位(计量单位)
★变量值是连续的如:身高、红细胞计数、血压等21第21页,共44页,2023年,2月20日,星期三2、计数资料(enumerationdata)定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:★取值是定性的(无度量衡单位计量单位)★多为间断性资料★数据分类互相排斥(互不相容)★数据分类无逻辑顺序★可分二项分类和多项分类如:性别、血型等22第22页,共44页,2023年,2月20日,星期三3、等级资料(ordinaldata)☆定义:是介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。☆特点:★取值是定性的(无度量衡单位计量单位)★数据分类互相排斥★分类等级有定量含义
(又称为半定量资料)★数据分类有程度上的差别(等级顺序关系)★多为间断性资料
如:疗效(痊愈、好转、无效、死亡)尿蛋白(-、+、++、+++、++++)等23第23页,共44页,2023年,2月20日,星期三★资料间的转化
在实际应用中,根据分析的需要,各类变量间可以互相转化。例如:
血红蛋白正常
重度贫血
(<6.0g%)
异常
中度贫血
(6.0g%〜)
轻度贫血
(9.0g%〜)
正常
(12.5g%〜)
增高
(>16.0g%)
↓↓↓
计量资料→计数资料→等级资料
24第24页,共44页,2023年,2月20日,星期三二、医学统计工作的内容25第25页,共44页,2023年,2月20日,星期三1、统计设计
设计(design)是根据研究的目的,对研究工作的全过程作一个全面的规划,制定总的研究方案,是统计工作中最关键的一步。
设计实验设计调查设计26第26页,共44页,2023年,2月20日,星期三2、收集资料(collectiondata):
是根据研究目的及实验设计的要求,收集准确的、完整的、充满信息的原始资料(rawdata)。
收集资料是统计工作的前题和基础。
任务:取得准确可靠的原始数据27第27页,共44页,2023年,2月20日,星期三②医疗卫生工作记录和报告③专题调查或试验研究①统计报表(报告卡)经常性资料一时性资料(1)资料的来源28第28页,共44页,2023年,2月20日,星期三(2)资料的要求
①必须完整、及时、正确
②要有足够的数量
③注意资料的
代表性和可比性29第29页,共44页,2023年,2月20日,星期三3、整理资料(sortingdata):
把搜集到的原始资料有目的地进行科学加工,
使资料条理化、系统化,便于进一步的统计分析。首要工作:
进行数据审核(资料清理datacleaning)
完整性检查:要求无缺项和漏项。
准确性检查:要求无逻辑错误,
无区间错误。30第30页,共44页,2023年,2月20日,星期三整理资料的步骤(1)检查核对资料(2)设计分组(3)资料列表划记归组按质分组(用于计数资料和等级资料)按量分组
(用于计量资料)31第31页,共44页,2023年,2月20日,星期三4、分析资料(analysisdata):
把经过统计整理的资料作一系列的描述性分析和推断性分析,从而阐明事物的规律性。
不同类型的资料使用的统计分析的方法不一样。分析的关键:
依据资料的类型和特征,正确选择统计分析方法。32第32页,共44页,2023年,2月20日,星期三统计描述descriptivestatistics统计推断inferentialstatistics分析资料
analysisofdata统计描述:是指用一些统计指标、统计图表等方法描述数据的分布特征和变化趋势。统计推断:是指用调查、实验取得的样本信息估计总体特征。33第33页,共44页,2023年,2月20日,星期三基本概念和基本步骤测试题34第34页,共44页,2023年,2月20日,星期三1、计量资料、计数资料和等级资料的关系是:
A、计量资料兼有计数资料和等级资料的一些性质。
B、计数资料兼有计量资料和等级资料的一些性质。
C、等级资料兼有计量资料和计数资料的一些性质。
D、计数资料兼有计量资料的一些性质。
E、三者差别不大。A型题35第35页,共44页,2023年,2月20日,星期三2、统计学中的系统误差、随机测量误差和抽样误差,在实际工作中是:
A、三种误差都不可避免
B、系统误差和测量误差不可避免
C、系统误差和抽样误差不可避免
D、随机测量误差和抽样误差不可避免
E、三种误差都可避免A型题36第36页,共44页,2023年,2月20日,星期三3、抽样误差是指:
A、个体值和总体参数之差
B、个体值和样本统计量之差
C、样本统计量和总体参数之差
D、样本统计量和总体测量值之差
E、总体测量值和总体参数之差A型题37第37页,共44页,2023年,2月20日,星期三4、在统计工作中,整理资料时首要工作是:
A、设计分组
B、拟整理表
C、检查资料
D、资料归组
E、计算全距A型题38第38页,共4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年版工程装饰设计施工一体化合同
- 2024年度高新技术企业研发项目委托咨询服务合同3篇
- 2024年版别墅建筑劳务工程协议条款一
- 精卫填海研学课程设计
- 2024年某科技公司关于人工智能技术研发与转让合同
- 生物基纤维在地下水净化中的应用考核试卷
- 2024年度地暖工程安装与能耗分析服务合同3篇
- 汽车制造中的零件加工工艺考核试卷
- 电感器在电磁干扰抑制中的应用考核试卷
- 冷藏食品的感官指标与质量评估考核试卷
- 管道沟槽土方开挖施工方案
- 2024年保育员(初级)证考试题库及答案
- 计算机通信网智慧树知到期末考试答案2024年
- 光伏电站安全管理及运行制度
- 儿童保健服务内容与流程
- 幼儿园幼儿食品安全培训
- 珠宝店贵重物品管理规范(大全)
- 库存管理中的供应与需求平衡
- 中建八局一公司新员工手册
- WB原理流程课件
- 设备管理的设备绩效绩效指标和评价体系
评论
0/150
提交评论