




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 绪论一、卫生统计学的定位二、统计工作的基本步骤三、统计资料(数据)的类型四、统计学的若干概念第一页,共六十页。一 、卫生统计学的定位统计学是研究数据及其存在规律的科学。哲学和辩证法告诉我们:世界是物质的、物质是运动、运动是有规律的,对规律的认识依靠一定的工具和手段。同时,科技的迅速发展,使得信息大量产生,数据作为信息的主要载体广泛存在于人类社会的各个领域。面对纷乱复杂的数据资料我们该如何去认识,这就要借助统计学这个工具,在混沌中发现规律。第二页,共六十页。人们给统计学下了很多定义,但是总的来说,统计学可以理解为:收集、处理、分析、解释数据并从数据中得出结论的科学。数据收集就是取得数据数
2、据处理就是将数据用图表等形式展示出来数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。第三页,共六十页。数据分析的方法可分为:描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。第四页,共六十页。统计学的应用领域非常广泛农业生态学审计学人口学经济学社会学教育学生物学遗传学公共卫生医学诊断心理学第五页,共六十页。统计学分成两个领域:数理统计学、应用统计学数理统计学侧重于建立统计方法和讲述统计方法的原理;应用统计学则是结合特定专业,使数理统计学的原理与方法具体化,从而产生
3、加以前缀的统计学,例如,社会统计学、心理统计学、生物统计学、卫生统计学、医学统计学等。卫生统计学(health statistics)属于应用统计学的范畴,是数理统计学的基本原理和方法在医学、特别是公共卫生学领域的应用,是关于医学、特别是公共卫生研究中资料的收集、整理、分析、解释的一门科学。第六页,共六十页。二、统计工作的基本步骤设计、收集资料、整理资料、分析资料是统计工作的四个基本步骤。上述步骤同时也是卫生统计工作的基本步骤。第七页,共六十页。第一步 设计制定计划,对整个过程进行安排。是整个工作的前提和依据,非常关键。一个完整的设计应包括研究全过程的内容,具体包括研究意义、研究目的、研究假设
4、、研究内容、研究方法、研究对象、抽样方法、样本含量、问卷设计、统计指标、分析方法、资料整理、质量控制、预期结果、经费预算、人员安排和进度等等。设计可以分为:调查设计、实验设计第八页,共六十页。9实验设计是实验研究极其重要的一个环节。医学实验的基本要素包括处理因素、受试对象和实验效应三部分。如用某种铁制剂治疗缺铁性贫血患者,观察血红蛋白升高情况,该铁制剂即处理因素,缺铁性贫血患者即受试对象,血红蛋白的测量值即实验效应。实验设计应遵循对照、重复和随机的原则。 第九页,共六十页。第二步 收集资料根据计划取得可靠、完整的资料。第十页,共六十页。第三步 整理资料原始资料的整理、清理、核实、查对,使其条理
5、化、系统化便于计算和分析。可借助于计算机(常用软件:SPSS、SAS)。第十一页,共六十页。第四步 分析资料(统计分析) 统计学的关键所在就是分析资料。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。统计分析主要包括:描述统计。用一些统计指标、统计图表等描述资料的数量特征和分布规律。推断统计。对样本统计指标做参数估计和假设检验,目的是用样本信息推断总体特征。第十二页,共六十页。13数据的来源所有的统计数据追踪其初始来源,都可以归结为调查和实验,但是从使用者的角度看,统计数据主要来自两个渠道:通过自己的调查或实验活动,直接获得第一手数据。数据的间接来源,使用者不是直接获
6、得的第一手数据。第十三页,共六十页。14间接数据:统计部门和各级政府部门公布的有关资料;各类专业期刊、报纸和书籍所提供的数据;从图书馆或互联网提供的资料;业务活动的有关记录和数据;经营获得的有关报表;各种财务、会计报表和分析资料。自己获得第一手资料:调查数据和实验数据。第十四页,共六十页。15调查数据来源调查数据的来源方法主要包括概率抽样和非概率抽样。概率抽样也叫随机抽样,是指遵循随机化原则进行的抽样,总体中每个单位都有一定的机会被选入样本。包括:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。非概率抽样是相对于概率抽样而言的,抽样时不是按照随机原则抽取个体,而是根据研究目的对数据的
7、要求,采用某种方式从总体中抽出部分单位对其实施调查。包括:方便抽样、判断抽样、自愿样本、滚雪球抽样第十五页,共六十页。16选择样本的方法:概率抽样和非概率抽样 概率抽样非概率抽样简单随机抽样系统抽样分层抽样整群抽样多阶段抽样方便抽样判断抽样自愿样本滚雪球抽样第十六页,共六十页。17实验数据的来源实验数据是指在实验中控制实验对象而搜集到的数据。试验组:随机抽取的实验对象的子集。在这个子集中每个单位接收某种特殊的处理。对照组:每个成员不接收试验组成员所接受的某种特殊处理。第十七页,共六十页。18卫生统计资料的来源:可概括为经常性资料(统计报表、日常性工作)和一时性资料(专题调查)。经常性资料。一般
8、指医疗卫生工作中的记录:统计报表,如医院工作报表等,医疗卫生工作记录和报告单,如病历、健康检查记录等。一时性资料。为某项研究专门设计的现场调查、实验或试验。第十八页,共六十页。19(一)统计报表 如疫情报表、医院工作报表等,这些都是根据国家规定的报告制度,由医疗卫生机构定期逐级上报的。这些报表提供了较全面的居民健康状况和医疗卫生机构的主要数据,是总结、检查和制订卫生工作计划的重要依据。(二)报告卡(单) 如传染病和职业病发病报告卡、肿瘤发病及肿瘤死亡报告卡、出生报告单及死亡报告单等。要做到及时填卡(单),防止漏报。例如,出生后不久即死亡的新生儿要同时填写出生报告单和死亡报告单。(三)日常医疗卫
9、生工作记录 如门诊病历、住院病历、健康检查记录、卫生监测记录等。要做到登记完整、准确。第十九页,共六十页。20(四)专题调查或实验 一般统计报表和医院病历资料的内容都有局限性,要做到深入分析往往感到资料不全。经常采用专题调查或实验研究。居民食管癌死亡调查表 编号姓名 性别1=男,2=女 出生日期 年 月日死亡日期 年 月 日死时实足年龄 岁(999=不明)诊断依据X线 1=阳性,2=阴性 9=可疑10细胞病理 1=阳性,2=阴性,9=可疑11临床表现:进行性吞咽困难 1=有,2=无,9=不明12食物反流 1=有,2=无,9=不明13胸骨后闷、胀、痛 1=有,2=无,9=不明 14进行性消瘦或恶
10、病质 1=有,2=无,9=不明 15病程 个月1617诊断结果 1=是,2=否 9=可疑18住址 县 乡 村 1920第二十页,共六十页。 三、统计数据(资料)的类型根据不同的标准,统计数据可分为不同的类型。按照计量尺度:数值型数据、分类数据、顺序数据按照收集方法:观察数据、实验数据按照时间状况:截面数据、时序数据 区分数据的类型是非常重要的,因为对不同类型的数据,需要采用不同的统计方法来处理和分析。第二十一页,共六十页。数值型数据定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,其结果都表现为具体的数值。特点:有度量衡单位 分为离散型和连续型两类 通过测量得到例如:体重、身
11、高、血压值、收入水平第二十二页,共六十页。定义:只能归于某一类别的非数值型数据,他是对事物进行分类的结果,数据表现为类别。特点:没有度量衡单位 通过枚举或记数得到 例如:人口性别;行业划分等分类数据第二十三页,共六十页。顺序数据定义: 只能归于某一有序类别的非数值型数据。顺序数据虽然也有类别,但这些类别是有序的。特点:每一个观察单位没有确切值 各组之间有性质上的差别或程度上的不同。例如:产品的等级、受教育程度、治疗效果第二十四页,共六十页。分类数据和顺序数据说明的是事物的品质特征,可统称为定性数据或品质数据。数值型数据说明的是事物的数量特征,也可称为定量数据或数量数据。第二十五页,共六十页。截
12、面数据截面数据是在相同或近似相同的时点上收集的数据,这类数据通常是在不同的空间上取得的,用于描述现象在某一时刻的变化。例如,某年各地的某病发病率。第二十六页,共六十页。时间序列数据时间序列数据是在不同时间上收集的数据,这些数据是按照时间顺序收集到的,用于描述现象随时间变化的情况。例如:19782008我国居民预期寿命序列、高血压患病率序列等。第二十七页,共六十页。28观察数据通过调查或观测而收集的数据,这类数据是在没有对事物人为控制的条件下得到的。第二十八页,共六十页。29实验数据是在实验中控制实验对象而收集得到的数据,比如,对一种新药疗效的实验数据。第二十九页,共六十页。四、统计学中的几个基
13、本概念1、观察单位与变量2、同质和变异3、总体与样本4、随机误差与系统误差5、频率与概率6、参数与统计量7、小概率事件与小概率原理 第三十页,共六十页。观察单位指被观察或测量对象的最基本单位,也称个体,可以是一个人、一只鼠、一个样品、一个地区等。变量研究者对每个观察单位的某项特征进行观察或测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值或测量值),也称为资料。资料根据性质可分为:计量资料、计数资料和等级资料。其中,计量资料也称为定量资料或测量资料,计数资料也称为定性资料或分类资料,等级资料也称为有序资料。观察单位(observation unit)与变量(variable)第三十一页,
14、共六十页。例如,一项研究内容是了解某地区2岁以下儿童的卡介苗接种情况,检查了该地区200名2岁以下儿童的卡疤,这个例子中观察单位为一名2岁以下儿童,变量为卡疤,变量值为“+”或“-”。第三十二页,共六十页。变量的类型按变量值的性质可将变量分为:数值型变量、分类变量和顺序变量。数值型变量也称为定量变量;分类变量和顺序变量也称为定性变量。不同类型的变量需要选用不同的统计指标和统计方法进行分析。根据分析需要,不同类型变量之间可进行转换,但通常是由高级向低级转换。第三十三页,共六十页。数值变量(numerical variable)通过测定每个观察单位的某项特征的大小所得到的数据,称为数值变量,其变量
15、值是以数值表示的,通常有度量衡单位。例如,调查某地2岁男孩的生长发育情况,这是一个2岁男孩是一个观察单位,测量指标,如身高,体重、血红蛋白牙齿数就是数值变量。描述数值变量常用的统计指标有平均数、标准差等,统计分析方法有t检验、Z检验、直线相关和回归、方差分析等。第三十四页,共六十页。数值型变量按取值的不同,可分为:离散型变量和连续性变量。离散型变量是只能取确切值的变量,取值往往是有限多个或可列无限多个。连续型变量是可以在一个或多个区间中取任何值的变量,取值是连续不断的,不能一一列出,第三十五页,共六十页。分类变量(categorical variable)通过确定每个观察单位的某项特征的性质或
16、类别得到的数据,称为分类变量,其取值是分类数据,表现为互不相容的类别或属性,没有度量衡单位。例如,血型分为A、O、B、AB。描述分类变量通常用到的统计指标有比率、速率,统计分析方法有Z检验、卡方检验。第三十六页,共六十页。顺序变量(rank variable)是说明事物有序类别的一个名称,其取值是顺序数据。特点是其变量值是多项分类且各类之间有程度的差别。例如,文化程度可分为:没上过学、小学、初中、高中、大专级以上等;疗效可分为治愈、显效、有效、无效。针对这类变量的统计分析方法有秩和检验和等级相关分析等。第三十七页,共六十页。38变量类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职
17、业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.24第三十八页,共六十页。39不同类型变量间关系根据分析需要,数值变量可转换为分类变量。将一种类型的变量转化为另一种类型变量只能由高级向低级转化:连续型有序分类二值第三十九页,共六十页。40 例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组 单纯随机
18、抽样系统抽样分层抽样(2)增加样本量n (3)选择变异程度较小的研究指标减少抽样误差的方法:第五十一页,共六十页。52还有一种划分误差的方法:抽样误差和非抽样误差抽样误差是一种随机误差,只在概率抽样中存在。非抽样误差是相对于抽样误差而言,是指除了抽样误差之外的,由于其他原因引起的样本观察结果和总体真值之间的差异。非抽样误差在概率抽样、非概率抽样、全面调查中都有可能存在。第五十二页,共六十页。53非抽样误差包括:抽样框误差回答误差(理解误差、记忆误差、有意识误差)无回答误差调查员误差测量误差第五十三页,共六十页。概率(probability) 与频率(frequency)概率描述某一随机事件A发
19、生的可能性大小的数值,常用来表示,是一种参数。P的大小在0和1之间,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。硬币出现正面的概率为50%。频率在相同的条件下,重复做n次实验,事件A出现了m次,则比值m/n称为随机事件A在n次实验中出现的频率。常用P来表示。投掷硬币次数不同,出现正面的频率是不同的。第五十四页,共六十页。55抛硬币试验在概率的统计学定义上的诠释试验者投掷次数出现“正面”次数频率X X X20120.6000Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005第五十五页,共六十页。56数理统计学中的大数定理表明:当观察次数 n 越来越大,频率 f 的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率 (Probability)。概率与频率都是表示某事件发生的可能性大小的数值。概率是对总体而言,属于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年债务转让与购买合同
- 广州商铺出租合同与广州商铺租赁合同8篇
- 代付协议合同范本
- 企业商品代销合同范本
- 借游艇合同范本
- 保洁公司跟员工合同范本
- 个体店面用工合同范例
- 个人交易有效合同范本
- 乡村混凝土租赁合同范本
- 全款买房购房合同范本
- 《教育强国建设规划纲要(2024-2035年)》解读与专题培训
- 2024年湖南公务员考试申论试题(省市卷)
- 2025年春新人教版化学九年级下册课件 第九单元 溶液 1-课题1 溶液及其应用 第1课时 溶液的形成
- 2024-2025学年高中物理第十二章机械波4波的衍射和干涉课时作业含解析新人教版选修3-4
- 2025年新华师大版数学七年级下册全册导学案
- 《供热工程》课件
- 仓管员业务技能培训
- 安全管理人员七大职责
- 《国民经济行业分类与代码》
- 音乐教育国际化进程-洞察分析
- 植入式静脉给药装置护理技术课件
评论
0/150
提交评论