已阅读5页,还剩145页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
health statistic,present to clinical ,一、卫生统计学( health statistic)的定义和内容,1.定义: 统计学:研究数据的收集、整理、分析,对不确定的数据作出科学推理的一门科学(即概率论).卫生统计学:2.内容:卫生统计学的基本原理和方法健康统计卫生服务统计,二、统计工作的基本步骤,全过程包括:计划与设计、收集资料、整理资料、分析资料 1、设计(design): 根据研究目的对统计全过程的一个全面的设想。这是最关键的一步。 要求:科学、周密、简捷。设计包括:实验设计、调查设计、临床实验设计 设计原则:齐同原则、对照原则、重复原则、随机化原则,2、搜集资料(collection of data):,要求:完整、准确、及时。 医学统计资料的来源主要有三个方面: (1) 统计报表:eg法定传染病报表、职业病报表、医院工作报表; 报表项目较少,不具备可比性 (2) 日常医疗工作的原始记录和报告卡片; eg:卫生监测记录、健康检查记录(3)专题调查与实验: A常见专题调查的种类: 居民健康状况调查 流行病调查(病因学调查) 临床远期疗效观察 卫生学调查:职业卫生学调查、环境卫生学调查、营养与食品卫生学调查、放射卫生学调查、心理卫生学调查等。,B.调查的内容:,明确调查目的、内容和指标确定调查对象(总体)、观察单位(个体)选择调查方法: 全面调查(普查:census) 非全面调查:典型调查:有意识选择范围 抽样调查确定调查范围:时间、空间、数量范围选择调查方式:观察法、采访法、填表法、通讯法。,调查设计,特点:调查计划:1.明确调查目的和指标2.确定观察对象和单位3.调查方法(1)普查( 全面调查 ): 将组成总体的所有观察单位全部加一调查。 (2)抽样调查: 从总体中随机抽取一定数量的观察单位组成样本, 然后用样本信息来推断总体特征。(3)典型调查( 案例调查 ): 即在对事物作全面分析的基础上, 有目的地选定典型的人、典型的单位进行调查。,确定调查项目和设计调查表:,调查项目:核查项目(检索项目、备考项):被调查者的姓名、住址等。分析项目(业务项目):资料不能缺少的分析项目。调查者项目(审核项目):调查者的姓名和调查日期 调查表:调查项目按一定顺序列成的表格。 制表要求:简便、清楚 多用:选择、填空、符号、数字; 少用:文字叙述,调查表形式:,一览表(list):多个观察单位记录在一张表中适用于调查项目少、样本少的专题调查单一表(card、调查卡片、个案卡片): 一个观察单位记录在一张表中,适用于调查项目多、样本多的专题调查编码调查表(code sheet):适用于样本多、分析项目多、分析内容复杂的专题调查,计算机保存。确定样本大小制定调查的组织工作:建立组织、确定起止时间、进度、分工、培训调查员可先小范围调查(预调查),4.调查项目和调查表(1) 分析项目: 直接用于计算调处指标, 以及分析时排除混杂因素影响所必须得到的内容。(2) 备查项目: 便于核查、补填和更正而设置的, 通常不直接用于分析。(3) 调查表的格式: 分为一览表和单一表5.收集资料的方式6.随机抽样的方法: a.单纯随机抽样 b. 系统抽样 c. 整群抽样 d. 分层抽样;,根据抽样误差的大小 分层抽样 系统抽样 单纯随机抽样 整群抽样,3、整理资料(sorting data),系统化、条理化1)核查资料; 2)分组汇总,拟整理表:按性质(分类变量)或数量(数值变量)分组,拟定整理表(过渡性的表格,按调查指标合理设计,用于原始资料的归组,表中有合计、总计等项目)。,4.分析资料:计算有关指标,反映数据综合特征,统计描述(descriptive statistic) 包括指标的计算、统计图表的绘制,描述数据的特征和分布规律。统计推断(inferentical statistic) 用样本统计量通过参数估计、假设检验等统计方法推断总体.推断总体 1)推断总体分布;是正态还是偏态 (常有理论或经验得到) 2)推断总体分布的参数或特征量: 和,三.统计中的几个基本概念,1、变量与变异:变量:个体的研究特征; 变异:各观察指标(即个体)之间的差异:包括个体变异和随机测量变异同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。变量值:变量的观察结果: 定量变量: 数值变量资料定性变量: 分类变量资料数值变量(numerical variabal):用定量方法对每个观察单位测定某项指标的所得的资料.一般有度量衡单位(也称计量资料measurement data)。,分类变量(categorical variable),表现为互不相容的类别或属性.分两种:a.无序分类变量:(unordered categories,计数资料enumeration data):将观察单位按某种属性或类别分组,再清点各组的观察单位数。可分为二项式或多项式分类变量。b.有序分类变量(ordinal categories,等级资料ranked data半定量资料):将观察单位按某种属性(或性质、标志)的不同程度分组,然后清点各组的数据所得的资料。(各组之间有程度的差异).(这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而又称为半定量资料。)三种资料间可以相互转化。,2、总体与样本,总体(population):根据研究目的确定的同质的研究对象的全体(性质相同的所有观察单位的某种变量值的集合)。样本(sample):从总体中随机抽取一部分观察单位进行观察,这部分观察单位对总体有代表性,称为样本。(总体中每一观察单位均有相同的机会被抽取到样本中去。),3.概率(probability)与频率,描述某事物发生的可能性大小的数值,用分数、小数、百分数表示。符号p。 P=1 p=0 0p1 随机事件 p0.05或p0.01 小概率事件,3.误差(statistic error),测得值与真实值之差。系统误差(systematic error)因仪器不准等造成的呈倾向性偏大或偏小的误差(可以消除)。随机测量误差(random measurement error)仪器校正后由于偶然因素造成同一物体多次测量结果不完全一致(不可避免,无倾向性)。抽样误差(sampling error):消除系统误差和控制随机测量误差后,由于观察单位间存在个体差异, 随机抽样造成的样本指标与总体参数有差异, 这种样本统计量与总体参数间的差别称为抽样误差。,4.参数与统计量:,总体指标均称参数,用希腊字母表示: , , 样本指标均称统计量,用拉丁字母表示X,s。,频数分布的集中趋势和离散趋势,数值变量资料的频数表频数表的编制a.求全距(range)R R=最大值-最小值b.确定组距(class interval)i i=全距/组数 组数取决于资料性质、样本量、分析目的 要求:组数一般815组,组距相等c.划分组段:每组都有开始值、终止值 第一组包括最小值,最后一组包括最大值 每组段只写组下限,省略组上限 各组界限要分明(既不包含也不留空隙),d.归纳记数,拟整理表,方法:划记法(tabulation method):正 适用于样本少、内容简单的资料分卡法(card sorting method):卡片分组适用于样本多的资料,Chapter 16 statistic table and statistic chart,present to clinical medical student,outline,Structure, classify, tabulating principle and basic requirement of establishing a table and a graphSeveral plotting approach of statistic chartusability condition of statistic chart,一.统计表(statistic table)两个组成:被说明的事物 统计指标(1) 基本结构与要求: 由标题、标目、线条、数字等组成a. 标题: 要求中心内容突出, 必要时注明资料的时间、地点。b. 标目: 横标目: 位于表的左侧, 是表的主语位置。纵标目: 位于表的上方, 是表的谓语位置。,c 线条: 分顶线、底线、纵标目下面与合计上面的横线,斜线、竖线省略。 d 数字: 一律用阿拉伯数字。 表示数值不详或暂缺 - 无数值备注: 列于表的下面, 对表中标有( )的数字加以描述。,标题横标目总称 纵标目 横 标 目 合计,种类:内容上:广义: 狭义:形式上: a.简单表: 被研究的事物只按一个特征或指标分组。 b.复合表: 被研究的事物按两个或两个以上相关联的特征或指标分组。制表原则:简单明了,重点突出主谓分明,层次清楚数据准确,便于对比分析,种类:内容上:广义: 狭义:形式上: a.简单表: 被研究的事物只按一个特征或指标分组。 b.复合表: 被研究的事物按两个或两个以上相关联的特征或指标分组。制表原则:简单明了,重点突出主谓分明,层次清楚数据准确,便于对比分析,二.统计图(statistic graph),基本要求:a 依据资料的性质选择适当的图形;b 标题简明扼要,必要时注明时间、地点;c 纵轴和横轴应有标目,并注明单位d 尺度:横轴尺度自左而右, 纵轴尺度自下而上, 数量一律由小到大, 并需等距标明。纵横坐标长度的比例一般为5 7。e复式图:比较不同事物时, 用不同的线条或颜色表示, 要附图例说明。,3、常用统计图,(1) 直条图(bar graph): 用相同宽度条形的长短.来表示资料数值大小比例关系, 适用于按性质分组,各个独立的、无连续关系的统计图。,(2)百分条图: 适用于表达构成比的资料。,(3) 线图:,用线条的上升和下降来表示某事物( 或某现象 )因时间或条件而变化的趋势。适用于连续性的变量资料。,(4)直方图:,用于表示连续变量的频数分布。常以横轴表示被观察现象, 纵轴表示频数或频率, 以各矩形( 宽度为组距 )的面积代表各组段的频数。,谢谢,outline,Descriptive approach and applicable condition about central tendency & tendency of dispersioncounting method of statistical descriptive indexConcept and trait of normal distributionEvaluation of reference rangearea distribution principle about normal distributionGraph of normal distribution,Statistical distribution of numerical variable,频数分布的集中趋势和离散趋势数值变量资料的频数表频数表的编制a.求全距(range)R R=最大值-最小值b.确定组距(class interval)i i=全距/组数 组数取决于资料性质、样本量、分析目的 要求:组数一般815组,组距相等c.划分组段:每组都有开始值、终止值 第一组包括最小值,最后一组包括最大值 每组段只写组下限,省略组上限 各组界限(demarcation)要分明(既不包含也不留空隙),频数分布的两个特征,集中趋势和离散趋势,频数分布的类型,对称分布和偏态分布(正偏和负偏),集中趋势的描述:,平均数(average)1.概念:平均数是集中趋势(central tendency)指标(亦称位置指标), 用以描述同质计量资料频数分布的集中趋势, 反映一组变量值的平均水平, 是一组变量值的代表值。,2.种类:,1) 算术均数: arithmetic mean, 样本均数, 符号:X (eksba),拉丁字母,简称均数, 总体均数, 符号(miu), 希腊字母(1)适用范围:对称分布(特别是呈正态分布或近似正态分布)。(2)计算方法: A.直接法(direct method): 当观察值个数较少时 X =x/n :希腊字母,sigma,求和符号B.加权法(weighting method): X =x/=x/n条件: 当观察值个数较多时,步骤,A) 制备频数表B)求各组组中值(class-mid value) X=(本组段组下限+下组段组下限)/2C)统计各组段频数fD) fxE) =fx/f 各组段f权衡了各组中值因f不同对均数的影响,起权衡作用,权数大,作用大.(3)均数的两个重要特征: A. (X-X )=0 B.(X-X )230时,样本均数的频数分布近似正态分布N(u, 2X ) 若变量x的总体(正态或偏态)均数为,标准差为,则含量为n的样本均数X的总体均数也为, 样本均数的标准差为X (放回抽样).,(3)均数的抽样误差,A、定义:因随机抽样造成的样本统计量之间以及样本统计量与总体参数之间的差异.记作X , SX . B、抽样误差影响因素:n大小抽样方法不同, X 不同。抽样误差不可避免.,2)标准误的概念,(1)定义:样本均数的标准差,是说明均数抽样误差大小的指标。标准误愈小,表示抽样误差愈小,样本统计量对总体参数的估计愈可靠。(2)标准误的计算 X =/n(总体标准误) sX =s/n(样本标准误) (当未知,用s代替),(3)标准误的应用,表示样本均数的离散度;估计总体均数的可信区间;进行假设检验,(4)标准差与标准误的区别和联系,标准差 标准误区别: 表示个体之间的变异度 表示样本均数之间的变异度表示观察值与样本均值之间的离散度 表示样本均数与总体均数之间的离散度 可以衡量样本均数抽样误差的大小 联系: X =/n,二.t分布(t distribution),(1)t分布的概念: 从正态总体中随机抽取许多含量为n的样本,由样本算出样本均值X和sX ,按t公式算出t值,将n个t值作直方图,构成t变量的频数分布图(连续性分布) X1 s1 t1值 X2 s2 t2值 X3 s3 t3值 Xn sn tn,u=( X - )/ X,U变换, Xn 由N(, X 2)变换为标准正态分布(U分布)X 往往用sX 来估计t = (X - )/ sX t变换(t分布)。U值称样本检验统计量, t值也称样本检验统计量 当n逐渐增大,就成了t曲线,与标准正态分布相比有以下特征: a.二者都是单峰分布, 以0为中心, 左右对称; b. t分布有一个参数,不同,t曲线不同, 越大,峰度越大。逐渐增大时, t分布逐渐逼近标准正态分布; 当=时,t=u, t分布就完全成为标准正态分布了。c.t分布曲线下的面积有一定规律:t曲线与横轴所夹面积总和为1横轴上某一区间和曲线所夹面积与总面积之比,相当于t值落在该区间的概率(概率分布)从总体中随机抽样获得t值落在整个横轴概率为1,获得t值 t,的概率p,单侧: P( t - t,)= , 或P(t t,)= 双侧: P( t - t,)+P(t t,)= ; P( - t, t t,)= 1 - 随机抽样算t值,95%满足: - t, t t, - t, (X - ) / sX t, X - t, sX X + t, sX ;,(3)t界值,t界值表, 横标目为自由度, 纵标目为概率P, 表中数字表示自由度为, P为(检验水准)时, t的界值, 常记为t,。注意: 不同, t,不同相同, p越大, t,越小,且单侧P与双侧2P的t值相等,p相同, 越大, t,越小,三.总体均数的估计,包括点值估计和区间估计:a.区间估计的涵义: 意思是从总体中作随机抽样, 每个样本可以算得一个可信区间, 如95%可信区间, 意味着做100个可信区间, 平均有95个可信区间包括总体均数(估计正确), 只有5个可信区间不包括总体均数(估计错误)。,b.区间估计的方法: X - t, SX X + t, SX ;已知 X - U X X + U X ;未知但n足够大X - USX F(1, 2), P ,总变异=X2- (X)/n组内变异 SS组内= Xj2- (Xj)2/n组间变异 SS组间= nj(x-x )2F=均方MS组间 / 均方MS组内组间=k-1 组内=n-k 总=n -1,一 配伍组设计的多个样本均数比较总变异=处理因素间变异+区组间变异+误差 总变异=X2- (X)/n 处理因素间变异= nj (x- x )2(x- x )2区组间变异= nj (x-x ),处理=k-1 组内=b-1 总=n 1误差=( k-1)( b-1 ),多个样本均数间两两比较q检验 q= (x A- x B)/S(x A- x B) S(x A- x B)= MS误差 /n (n相等)S(x A- x B)= MS误差/2 (1/ n A + 1/ n B )根据误差和组数,q值判断,多个方差的齐性检验变量变换:对数变换、平方根变换、倒数变换、平方根反正弦变换,分类变量资料的统计描述,黄玉兰,一 分类资料的频数表相对数(relative number):指两个有联系的事物计数数据之比,表示事物相对大小。是计数资料统计描述指标。二.常用相对数: 分析计数资料的指标。常用的相对数有: ( 1 ) 率(rate): 表示某种现象发生的频度或强度。率= 某现象实际发生例数/可能发生该现象的总例数 比例基数( 习惯上以计算的率保留1 - 2位整数),(2)构成比(constituent ratio),说明一事物内部各组成部分所占的比重或分布。构成比= 某一组成部分的观察单位数/同一事物各组成部分的观察单位总数 100%( 3) 相对比(relative ratio): 两个有关指标之比, 用以表示两个指标之间的对比关系。分子、分母可以同时是相对数,也可以同时是绝对数。,三.应用相对数时应注意的问题,(1) 计算相对数的分母不宜太小;(2) 分析时不能以比代率;(3) 对观察单位数不等的几个率,不能直接相加,PC=(nP)/n=x/n(4) 资料的对比应注意可比性: a.观察对象同质; b.内部构成相同,否则,应对率进行标准化(5) 对样本率( 或构成比 )的比较应遵循随机抽样, 要作假设检验。,四.标准化法,基本思想和计算(1)基本思想: 即采用一个共同的内部构成标准, 使两个样本或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对样本率的影响。标准化后的率叫标准化率。(2) 计算方法: 直接法:当各组的率pi已知时 间接法:当各组的率pi未知时,但总率P已知时。,(3)直接法选择标准的方法: a 选择有代表性的较稳定的数量较大的人群 b 两组资料中,选择人数较大的一组或两组合并数作为标准。(4)计算方法: a 用标准人数计算: b 用标准人口构成比:,(3) 注意事项:,a.选定标准不同, 算得的标准化率也不同, 因此不能代表实际水平;b.各组间若出现明显交叉, 不宜用标准化法;c.两样本标化率的比较应作假设检验。,五.常用几个相对数指标:,发病率、患病率、死亡率、病死率、感染率、治愈率、生存率、平均期望寿命、生存率(P239 P240 P242 P243)(1)出生率=某年活产数/同年平均人口数 100%(2)死亡率=某年死亡总数/同年平均人口数 100%(3)发病率=某人群某时期内新病例数/某人群同期平均人口数 K(4)某病患病率=观察时点某病例数/同时点检查人数 K(5)某病感染率=受检者感染某病原体人数/受检人数 K(6) 治愈率= 治愈病人数/接受治疗人数 100%(7) 某病病死率=某期间因某病死亡人数/同期该病患者 100%(8) 生存率=n年末存活的病例数/随访满n年的病例数 100%,六.动态数列及其分析指标,1.率的抽样误差和率的标准误,(1) 概念: 由抽样造成的样本率与总体率的差别叫率的抽样误差。衡量率的抽样误差大小, 衡量样本率的稳定性的指标, 即率的标准误。(2) 率的标准误的计算 P =( 1 - )/n SP =P( 1 - P )/n,(3) 总体率的区间估计,a. 查表法: n较小(n 40, T 1b. 校正条件: n 40,5 T 1公式: 2 = ( A - T)2/T 专用公式: 2 = (ad-bc)2n/(a+b)(a+c)(b+d)(c+d),二.行 列表的2检验( 多个样本率或构成比的比较),a. 2值的计算:2 = n( A2/nRnC) - 1b. 注意事项: 2检验要求理论频数不宜太小, 一般认为不宜有1/5以上格子理论数小于5, 或有一个理论数小于1, 处理办法有: 增大一般含量, 最好; 删去理论频数太小的行或列; 合并性质相近的行或列。等级资料宜用秩和检验。当结论为拒绝检验假设, 只能认为各总体率( 或总体构成比 )之间总的来说有差别, 但不能说明它们彼此之间都有差别。否则,要进行四格表的分割,三.列联表资料X2检验,a. H0: b = c =0.05 H1: bcb. 2 =( b - c )2/( b + c) b + c 40, 需校正 2 =( b - c - 1)2/(b + c) = 1,谢 谢,四.四格表的确切概率法,Chapter 11 non-parametric test,outline,Concept of nonparametric testWilcoxon signed-rank testManna-Whiter U testKruskal-Wallis H testFiredman M testRidit,第九章 秩和检验,非参数统计的概念:U检验、t检验和方差分析为参数检验(paramatric statistics)非参数检验(nonparamatric statistics)当资料不满足参数统计的要求,也不能通过数据转化使其符合参数统计的要求时,配对设计差值的符号秩和检验适用条件:适用于非正态分布或分布不明的资料,适用范围广,缺点时不能充分利用资料所提供的信息,统计效率较低。检验步骤:HO:差值的总体中位数M=0H1:差值的总体中位数M0=0.05计算统计量1.求各对数值的差值2.按差值的绝对值由小到大编秩,并将秩次分两栏编秩:绝对值相等符号相反值时,取平均秩次,0 不编,对子数减去0的个数。,确定统计量T:分别求正秩和负秩之和,以绝对值较小者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高考物理总复习专题十二机械振动光学第4讲光的波动性、电磁波练习含答案
- 果蔬生鲜供应合约
- 吉林省通化市外国语学校九年级化学上册 第二单元 活动1 氧气的实验室制取与性质教案 (新版)新人教版
- 二年级道德与法治上册 第三单元 1《我爱秋天》教案2 浙教版
- 高中数学 第三章 指数函数、对数函数和幂函数 3.1.1 分数指数幂(2)教案 苏教版必修1
- 2024-2025学年新教材高中英语 Unit 1 Knowing me Knowing you泛读 技能初养成教案 外研版必修第三册
- 2024-2025学年八年级物理下册 第十一章 功和机械能 第1节 功教案 (新版)新人教版
- 高中语文 第7课 李清照词两首-声声慢教案2 新人教版必修4
- 2023七年级地理上册 第三章 天气与气候 第一节 多变的天气说课稿 (新版)新人教版
- 文书模板-买卖合同的构成要素
- 几种离子交换装置
- 交接班制度(PPT31页)
- 真想变成大大的荷叶(详案)
- db11 7912011 文物建筑消防设施设置规范
- 《unit 2 you shouldnt be late.》课件小学英语外研社版一年级起点五年级上册 (2014年6月第1版)
- 干细胞和肿瘤干细胞(20101210)
- 原生家庭与个人成长(课堂PPT)
- 一年级数学口算凑十法
- 上交叉与下交叉综合征(课堂PPT)
- 铜仁市房地产市场调查分析报告专业课件
- 中南大学湘雅医院亚专科管理办法(试行)
评论
0/150
提交评论