卫生统计学案例版复习资料_第1页
卫生统计学案例版复习资料_第2页
卫生统计学案例版复习资料_第3页
卫生统计学案例版复习资料_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、5卫生统计学复习整理一、统计工作基本步骤1、设计2 、收集资料3 、整理资料4 、分析资料 二、调查研究的特点2、不能随机分组4、一般不能下因果结论1、不能人为施加干预措施3、很难控制干扰因素三、常用的基本抽样方法1、单纯随机抽样先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签等方法之一随机抽取n (样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。2、系统抽样又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分隔成n (样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等问隔m机械地在第二部分

2、、第三部分直至第 n部分内各抽出一个观察单位组成研究样本。3、分层抽样先按对观察指标影响较大的某项或某几项特征,将总体分成若干层(strata ) ,该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。4、整群抽样将总体划分为群(初级观察单位),各群由次级观察单位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。5、多阶段抽样抽样误差比较:分层抽样系统抽样单纯随机抽样整群抽样四、实验设计的特点1、研究者可人为设置处理因素2、受试对象接受何种处理因素或处理因素的何种水平是随机的五、实验设计的三个基本要素1、处理因素(或研究因素)2 、受试

3、对象3 、实验效应六、实验设计的基本原则? 对照原则? 随机原则? 重复原则? 均衡原则七、常用的实验设计方案? 完全随机设计? 配对设计? 随机区组设计八、定量资料集中趋势的描述指标:描述数据分布中心位置(平均水平)的指标。I算术均数适用于对称分布特别是正态分布资料。I 几何均数几何均数适用对数正态分布等比级数资料观察值中不能有0I 中位数和百分位数I应用:中位数:适用于偏态分布、分布不明确或分布末端无确定数据的资料 百分位数:百分位数:非正态分布资料九、描述离散趋势指标:描述数据分布的离散程度(变异程度)的指标。I极差:适用于分布末端有确定数据的资料。I 四分位间距:适用于描述偏态分布、分

4、布不明确或分布末端无确定数据资料的离散趋势I标准差:描述对称分布特别是正态分布资料的离散程度。I方差:描述对称分布特别是正态分布资料的离散程度。 变异系数:度量衡单位不同的资料;单位相同但均数相差悬殊的两组或多组资料十、正态分布的应用:制定医学参考值范围 一、常用相对数绝对数:表示某事物在某时、某地发生的实际水平。相对数:两个相关指标的比值,便于相互比较与分析。 常用相对数:率:率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象发生的频率或强度。构成比:构成比是事物内部 某一观察单位数 与事物内部各组成部分 观察单位的总数 之比,说明事物 内部各部分所占的比重。常以百分数表示。相对

5、比:相对比是两个有关的指标之比,用以描述两者的对比水平。两个指标可以是绝对数、相对 数或平均数;可以性质相同,也可以性质不同。十二、应用相对数注意的事项 计算相对数分母不宜过小 不能以构成比代替率 计算合计率时,不能简单地相加求平均 率的比较时应注意可比性 对样本率(或构成比)的比较应做假设检验 十三、抽样误差与标准误1 .、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制2、标准误1.1 样本统计量的标准差称为标准误。1.2 样本均数的标准差称为均数的标准误 十四、标准差与标准误的区别1、标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大

6、小2、标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。十五、可信区间的涵义从总体中作随机抽样,每个样本可以算得一个可信区间。 如95%T信区间意味着做100次抽样,算得100 个可信区间,平均有95个估计正确。即,95%勺可能性落在这个区间内,5%勺可能性不落在这个区间内。十六、假设检验的步骤1、建立检验假设,确定检验水准皿二但:称检验假设,也称无效假设,用Ho 表示。修:称备择假设,也称对立假设,用H 表示。a :称检验水准,也称显著性水准,是确定小概率事件的标准。2、选定统计方法,计算检验统计量不同的统计方法均有其应用条件,根据实验设计及数

7、据的条件来选用合适的统计方法,计算合适的统计量。3、确定P值,作出统计推断当P<0.05时,拒绝HQ接受H1,有显著性意义,表明两样本间的不一致由抽样误差引起的可能性0 0.05,即两样本不是来自同一总体。当P>0.05时,拒绝H1,接受H0,无显著性意义,表明两样本间的不一致由抽样误差引起的可能性>0.05,即不能排斥两样本不是来自同一总体。十七、假设检验与区间估计的联系1.假饿检般与可植区间的目的不同限帔检魁用于推断总髓败有无质的相,可躯利月开机馆懒嬲大儿2可信区间也可回督假饿他躯的问逛但利魄毓切的F做用辎出而植上有球牌咒工可值区间辘状检酎B更联的相息除能亮成僵段检览的掰

8、卜,碌麟触体睚值爵尢是既嫡歌.十八、t检验的适用条件1、未知;2、n较小(n<60); 3、样本来自正态总体;224、两样本所来自的总体方差齐,即 巴=仃2公式:t = x - v=n-1S/ . nSS、 = SS且间SS且内二十、方差分析的应用条件:独立性;正态性;方差齐性厘2检验72检验卜一、四格表资料攵检验的条件1、当n>40且所有T岂5时,用普通的2、当n训0但有1 <T<5时,用校正的3、当n<40或有T<1时,不能用?2检验,改用确切概率法。二十二、直线相关的概念直线相关,又称简单相关,是用来描述具有直线关系的两变量x、y的相互关系的统计方法;

9、要求两变量服从于双变量正态分布;两变量不分主次,处于同等地位。二十三、直线回归分析的应用条件1、线性,自变量x与应变量y呈线性关系2、独立性,个体间相互独立3、正态性,自变量x取不同值时,应变量y服从正态分布4、方差相等,自变量x取不同的xi值,应变量y的条件方差相等二十四、直线回归与直线相关的区别与联系区别:资料要求不同;统计意义不同;分析目的不同联系:1、变量间关系的方向一致 :r与b正负号一致2、假设检验等价tr = tb3、r与b值可相互表算 r =bJlxx/lyy b =rJlyy/lxx4、用回归解释相关二十五、生存资料的特点xyxy/l1 xxl yy 1 yyxxSSSS1

10、.蕴涵有结局和时间两个方面的信息2 .结局为两分类互斥事件3 . 一般是通过随访收集得到,随访观察往往是从某统一时间点开始,观察到某规定时间点截止4 .常因失访等原因造成某些研究对象的时间数据不完整,分布类型复杂,一般不能采用t test、ANOVA卡方检验等进行统计分析二十六、生存分析的几个基本概念生存分析是将事件的结局(“生存”和“死亡”)和出现这一结局所经历的时间,结合起来分析的一大 类统计方法。死亡事件:又称失效事件,不单是指通常意义下的生物体死亡,而是泛指标志某种处理措施失败 或失效的特征事件。广义概念,一般是在设计阶段根据研究目的确定生存时间:指观察到的“存活”时间。不单是指通常意义下生物体的存活时间,而是泛指研究者 所关心的某现象的持续时间。根据其特点,可分为以下两种类型:(1)完全数据:是指从观察起点到发生死亡事件所经历的时间(2)截尾数据:简称截尾值,又称删失值或终检值。观察过程的终止不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论