




已阅读5页,还剩202页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医用统计方法,第一章 绪论 一.什么是统计学 ? 二.什么是医学统计学 ? 三.统计学中常用名词。 四.统计分析资料的类型。 五.统计工作基本步骤。,一.什么是统计学? 统计学(statistics)是研究数据的收集、整理和分析的一门科学 。 理论基础:数理统计、概率论。 目的:透过现象看本质。,二.什么是医学统计学 ? 医学统计学是研究临床医学领域数据的收集、整理和分析的一门科学 。,三.统计学中常用名词。 .变量(随机变量): 观察个体的某项特征定义为变量。 变量的观测结果 变量值。 根据变量值的特征,变量分为: 数值变量 分类变量,()数值变量(定量变量): 变量值既有大小又有度量衡单位。 连续型数值变量:如身高、体重等 。 离散型数值变量:,()分类变量(定性变量): 变量值表现为互不相容的类别或属性。 根据类别或属性之间有无程度性差别,分类变量分为: 无序分类变量 有序分类变量,无序分类变量 两分类变量 多分类变量,有序分类变量 如尿糖化验结果按、分类;疗效按治愈、显效、好转、无效分类。,()变量间的转化 数值变量 两分类变量 有序分类变量 b 分类变量数值化,连续型数值变量 数值变量 离散型数值变量 变量 两分类变量 无序分类变量 分类变量 多分类变量 有序分类变量,.同质: 对所研究指标有影响的非实验性因素相同。 .变异:同质基础之上个体之间的差异。,.总体: 根据研究目的所确定的同质观察单位全体。 根据有无明确的时空,总体分为: 有限总体 无限总体,.样本: 按照随机化原则从总体中抽取部分个体组成的集合。 样本容量 样本的代表性,.参数: 根据总体得到的指标称为参数。 .统计量: 根据样本得到的指标称为统计量。 统计量 参数 ?,.抽样误差: 统计量与参数,统计量与统计量之间的差异称为抽样误差。 9.概率: 某随机事件发生可能性大小的量。 用P表示 P0.05 或P0.01 小概率事件,四.统计分析资料的类型。 1.数值变量资料(计量资料) 2.分类变量资料(计数资料) 3.等级资料(半定量资料),五.统计工作基本步骤。 1.设计 2.资料收集 3.资料整理 4.资料分析,资料的统计描述 资料统计分析 参数估计 资料的统计推断 假设检验,第二章 数值变量资料的统计描述,例:,一.频数表(frequency table)的编制 1.求全距(range):找出观察值中的最大值与最小值,其差值即为全距(或极差),用R表示。 2.确定组数(n):一般设10-15个组。 3.确定组距(i): i=R/n 4.确定组限(L): 第一组段应包括全部观察值中的最小值,最末组段应包括全部观察值中的最大值,并且同时写出其下限与上限。 5.列表划记:,某地110名8岁男孩身高(cm)的频数表,二.直方图 频 数 (人) 身高(cm),三.描述集中趋势的指标-平均数 平均数:描述一组同质观察值的平均水平,处于中心位置的指标体系。 均数 几何均数 平均数 中位数 众数 调和平均数,1. 均数(算术均数): 样本均数, 总体均数 (1)适用条件:变量值呈对称分布,尤其呈正态或近似正态分布。 (2)计算: 直接法:用于样本含量较少时,其公式为: 加权法:用于频数表资料或样本中相同观察值较多时,其公式为:,2.几何均数(geometric mean)用G表示 (1)适用条件:变量值呈对数正态分布,即数据经过对数变换后呈正态分布;呈等比级数资料,即观察值之间呈倍数或近似倍数变化。 (2)计算: 直接法: 加权法: (3)注意事项:观察值中不能有0,因0不能取对数;一组观察值中不能同时有正或负值。,3.中位数(median) 用M表示。 (1)定义:一组由小到大按顺序排列的观察值中位次居中的数值。 在全部观察中,小于和大于中位数的观察值个数相等。 (2)适用条件:变量值呈非正态分布资料(对数正态分布除外);频数分布的一端或两端无确切数据的资料;总体分布不清楚的资料。 (3)计算: 直接法:将观察值由小到大排列 n为奇数 , n为偶数,频数表法:用于频数表资料。 百分位数(percentile)用Px表示。 一个百分位数Px将一组观察值分为两部分,理论上有X%的观察值比它小,有(100-X)%的观察值比它大,是一种位置指标。 中位数是一个特定的百分位数,即M=P50。 Px计算公式: 首先要确定Px所在的组段。 如何确定,根据累计频数或累计频率。,例:199名食物中毒患者潜伏期的M和PX的计算 M=P50= =12+12/71(19950%-30)=23.75(小时),四.描述离散趋势的指标 全距 四分位数间距 变异指标:方差 标准差 变异系数,1.全距(range,简记为R): 亦称极差,是一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,全距大,说明变异度大;反之,全距小,说明变异度小。 用全距描述定量资料的变异度大小,虽然计算简单,但不足之处有: 只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度; 样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大。因此样本含量相差悬殊时不宜用全距比较。,2四分位数间距(quartile,简记为Q): 为上四分位数QU(即P75)与下四分位数QL(即P25)之差。四分位数间距可看成是中间50%观察值的极差,其数值越大,变异度越大,反之,变异度越小。 由于四分位数间距不受两端个别极大值或极小值的影响,因而四分位数间距较全距稳定,但仍未考虑全部观察值的变异度,常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。,3方差(variance):2 s2 离均差 :每个观察值X与总体均数的差值(X-)。 离均差和:(X-)=0 离均差平方和:(X-)2 0 n-1称为自由度( degree of freedom)。,4标准差(standard deviation): s,直接法: 加权法:,标准差的应用: (1)结合均数描述变量值的分布特征:XS。 (2)计算标准误。 (3)计算变异系数(CV)。,5. 变异系数(coefficient of variation,简记为CV): 应用于两种情况: (1)比较度量单位不同; (2)均数相差悬殊的两组或多组资料的变 异度 。,正态分布及其应用,一.正态分布对应的几何图形。,钟型曲线对应的f(x)-正态分布概率密度函数 定义域: -x,二、正态分布的特征: 1正态分布曲线(normal curve)在横轴上方,且均数处最高。(非负性),2. 正态分布以均数为中心,左右对称。 (对称性),3正态分布有两个参数,即均数和标准差。 是位置参数 是形状参数 通常用 表示正态分布。,标准差相同、均数不同的四条正态曲线,均数相同、标准差不同的四条正态曲线,4正态分布曲线下面积分布有规律。,三.正态分布曲线下面积分布规律。 正态分布曲线与横轴上任一区间围成的面积可通过函数积分来得到。,正态分布 标准正态分布 u被称为标准正态变量或标准正态离差。 u 服从总体均数为0、总体标准差为1的正态分布,我们将此分布称为标准正态分布。 用N(0,1)表示。,标准正态分布曲线下面积规律: 1.整个曲线下面积为1。 2.U:-1.96,1.96与标准正态分布曲线围成的面积为:0.95或95%。 3.U:-2.58,2.58与标准正态分布曲线围成的面积为:0.99或99%。,四.正态分布的应用 1估计正态分布资料的频数分布 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,实际分布与理论分布的比较。 100名18岁男大学生身高的实际分布与理论分布,2制定医学参考值范围:亦称医学正常值范围。 (1)首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群; (2)其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%; (3)根据指标的实际用途确定单侧或双侧界值; (4)根据资料的分布特点,选用恰当的计算方法。 方法: 正态分布法:适用于正态或近似正态分布的资料。 对数正态分布法:适用于对数正态分布资料。 百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。,3正态分布是许多统计方法的理论基础: 如t分布、F分布等都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。,数值变量资料的统计推断(参数估计) 一.均数的抽样误差 由于个体变异的存在,在抽样研究中产生的样本均数与相应的总体均数间的差异,样本均数与样本均数间的差异称为均数抽样误差(sampling error)。 均数的抽样误差是不可避免的,但均数的抽样误差是可控制的。 二.衡量均数的抽样误差大小的指标-标准误,中心极限定理: 若从均数为的正态总体中以固定n反复多次(比如100次)抽样时,所得的样本均数的分布是正态分布;即使是从偏态总体中抽样,只要足够大,的分布也近似正态分布。 样本均数的标准差-均数的标准误,均数标准误的用途: 1衡量样本均数的可靠性 由于均数标准误越小,均数的 抽样误差越小,样本均数就越可靠。 2估计总体均数的可信区间。 3用于均数的假设检验。,三.t分布 统计量t 值的分布称为t分布。 统计量t 值? t=,t分布有如下特征: 1以0为中心,左右对称的单峰分布; 2t分布是一簇曲线,其形态变化与n(确切地说与自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布(u分布)曲线。,自由度为1、5、的t分布,t界值表,四.总体均数的估计 ? 点估计(point estimation) 方法: 区间估计(interval estimation),1.点估计(point estimation) =,2.区间估计(interval estimation) 按一定的概率(可信度)估计未知的总体参数可能所在的范围(或称可信区间)。 可信度:95%(或99%)。 以求总体均数的95%可信区间为例,介绍其计算方法。,(1)已知时 u分布法 由u分布可知,正态曲线下有95%的u值在1.96之间,即:P(-1.96u+1.96)=0.95 P(-1.96 +1.96)=0.95 移项后整理得, 故总体均数的95%可信区间为: ( ),(2)未知,但n足够大(如n100)时, u分布法。 由t分布可知,当自由度越大,t分布越逼近u分布,此时t曲线下有95%的t值在1.96之间, 即:P(-1.96t+1.96)=0.95 P(-1.96 +1.96)=0.95 P( )=0.95 故总体均数的95%可信区间为: ( , ),(3)未知且n小时,t分布法。 某自由度的t曲线下有95%的t值在 之间, 即: 故总体均数的95%可信区间为 ( , ),例:对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少? 该例n=20, n较小,按t分布法计算。=20-1=19,查t界值表,得 =2.093 估计这批结核菌素在该人群中使用,皮试的平均浸润直径的95%可信区间为: (10.9-2.093*3.86/ ,10.9+2.093*3.86/ )cm, 即(9.1,12.7)cm。,可信区间的注意问题: 1可信区间的涵义 意思是从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确,估计错误的只有5次。5%是小概率事件,实际发生的可能性很小,当然这种估计方法会有5%犯错误的风险。 2可信区间的两个要素: (1)是准确度,反映在可信度的大小,即区间包含总体均数的概率的大小,愈接近1愈好。 (2)是精密度,反映在区间的长度,长度愈小愈好。在样本含量确定的情况下,二者是矛盾的,若只管提高可信度,会把区间变得很长,故不宜认为99%可信区间比95%可信区间好,需要兼顾准确度和精密度,一般来说95%可信区间更为常用,在可信度确定的情况下,增加样本含量,可减少区间长度,提高精密度。,数值变量资料的统计推断(假设检验),例: 医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次分钟,标准差为5.2次分钟,但是根据医学常识,一般男子的平均脉搏次数为72次分钟,问该山区男子脉搏数与一般男子是否不同?,一、假设检验的一般步骤 1.建立假设。 2.确定检验水准。 3.选择检验方法,并计算统计量。 4.根据统计量确定P值。 5.做出统计推断。,1.建立假设。 (1)检验假设(H0 ):被比较的指标无差别。 (零假设、无效假设 ) (2)备择假设(H1 ):被比较的指标有差别。,2.确定检验水准。 用表示。 拒绝H0成立的概率。 =0.05,3.选择检验方法,并计算统计量。,4.根据统计量确定P值。 在H0成立的前提下,获得大于等于现有检验统计量的概率(P)。,5.做出统计推断。 P=0.05 拒绝H0,接受H1。 P =0.05 接受H0。,二.数值变量资料假设检验的类型 t检验 u检验 F检验,t检验、u检验的应用条件: (1)适用于两均数的比较; (2)样本来自正态分布总体; (3)n小 t检验。 n大 u检验。 (4)两样本均数比较时,两总体方差齐。,1.样本均数与总体均数的比较 建立假设: H0:该山区男子脉搏数与一般地区男子相等,即 H1:该山区男子脉搏数与一般地区男子不等,即 确定检验水准: 选择检验方法计算统计量: 确定P值: 统计推断:按=0.05水准,拒绝H0,接受H1,可认为该山区男子的脉搏数与一般地区的男子不同。,2.配对设计(paired design)资料的假设检验 配对设计:是为了控制某些非处理因素对实验结果的影响。将那些因素相同或相近的受试对象配成对子,使得同一对子中的受试对象除处理因素不同外,其他因素相同或相近,同一对子中的两受试对象分别接受不同的处理,其实验结果的差异可以简单的认为是“纯”处理因素的作用。,例: 将大白鼠按照同窝、同性别和体重接近的的原则配成8对,每对中两只大白鼠随机确定一只进食正常饲料,另一只进食缺乏维生素E饲料,一段时间以后,测量两组大白鼠的肝中维生素的A的含量如表1,问食物中维生素E的缺乏能否影响大白鼠肝中维生素A的含量?,表1 两种饲料喂养大白鼠肝中维生素A的含量,差值,H0:两种饲料喂养的大白鼠肝中维生素含量相等,即 H1:两种饲料喂养的大白鼠肝中维生素含量不等,即 按=0.05水准,拒绝H0,接受H1,可认为两组大白鼠肝中维生素A的含量不等,维生素E缺乏饲料组的大白鼠肝中维生素A含量低。,3.两样本均数比较的假设检验,三.第一类错误与第二类错误 1. 型错误又称第一类错误(type error):拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用表示。 通常=0.05。 2. 型错误又称第二类错误(type error):不拒绝实际上不成立的H0 ,为“存伪”的错误,其概率通常用表示。,四.假设检验应注意的事项 1.资料的可比性。 2.选用的假设检验方法应符合其应用条件。 3.实际差别大小与统计意义的区别。 4.假设检验结论不能绝对化。,分类变量资料的统计描述,一.频数表 二.相对数 率(rate) 构成比(proportion) 相对数 比(ratio) 动态数列,1.率(rate) 率是一频度指标,用以反映某某现象发生的频度或强度。常以百分率()、千分率()、万分率(1万)和十万分率(1十万)等表示,计算公式为:,2构成比(proportion) 说明某事物内部各组成部分所占的比重或比例。常以百分数表示,计算公式为:,3比(ratio) 又称为相对比,比较两个指标时用以反映两个有关指标间数量上的比值,如A指标是B指标的若干倍,或A指标是B指标的百分之几,通常用倍数或分数表示。计算公式为:,4.动态数列 绝对增长量 发展速度 增长速度 平均发展速度 平均增长速度,三.应用相对数时应注意的事项 1计算相对数时分母过小。 2以构成比代替率。 3求几个相对数的平均数时,简单地将几个相对数相加后除以相对数的个数。 4忽视资料的可比性,各相对数直接相比较。 5如数值型变量一样,抽样所得的样本相对数也有抽样误差,因此相对数间的比较也应做假设检验。,四.率的标准化法 1.为什么进行率的标准化?,Crude incidence rate of city A=28.96; Crude incidence rate of city B=35.03 - Strange!?,Table Incidence rates of infectious diseases, children of two cities,2.率的标准化法的基本思想 采用一个共同的构成标准,消除被比较的总体或样 本各构成部分不同对平均率的影想。,3.率的标准化方法 直接法 率的标准化方法 间接法,直接法 条件:被比较的总体或样本各构成部分的率已知。 (1)确定构成标准: 三种途径:人口普查后的资料;将被比较的总体或样本各相应构成部分合并;选择其中容量大的总体或样本作为构成标准。 (2)计算预期发生数:N =NiPi (3)计算标准化率:P = N / Ni,Standardized incidence rate of city A = 793/24767 = 32.02 Standardized incidence rate of city B = 3523/24767 = 21.12 ,4.标准化时应注意的问题,分类变量资料的统计推断(参数估计),一.率的抽样误差 二.衡量率的抽样误差大小的指标-标准误 P= sP=,三.总体概率的估计 1.点估计: P 2.区间估计: (1)查表法:小样本资料(n50) (2)正态近似法:,当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布,总体率的可信区间可按下列式进行估计。 ,分类变量资料的统计推断(假设检验),率的u检验 正态近似条件:当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布。,1.样本率与总体率比较 样本率与总体率作比较的目的是推断样本率所代表的总体率与某已知总体率0是否相等。 式中P为样本率, 0为已知总体率(常为理论值或标准值),n为样本含量。,2.两样本率比较 两个样本率作比较的目的是推断两个样本各自代表的两总体率是否相等 。 式中p1、p2分别为两个样本率,n1、n2分别为两样本含量 为两个样本率之差的标准误 pc为合并阳性率 X1和X2分别为两个样本阳性例数。,2 检 验,一.应用范围: 1.两个样本频率及多个样本频率的比较。 2.两个构成比及多个构成比较。 3.两分类变量间关联性分析。 4.频数分布拟合优度检验。,二.四格表资料2 检 验(两个独立样本频率比较的2 检 验) 两组人群流感发病率的比较 分组 发病人数 未发病人数 合计 发病率(%) 服药组 40(50.49) 190(179.51) 230 17.39 对照组 50(39.51) 130(140.49) 180 27.28 合计 90 320 410 21.95 ,二.四格表资料2 检 验(两个独立样本频率比较的2 检 验) 两组人群流感发病率的比较 分组 发病人数 未发病人数 合计 发病率(%) 服药组 40(50.49) 190(179.51) 230 17.39 对照组 50(39.51) 130(140.49) 180 27.28 合计 90 320 410 21.95 ,1.四格表资料 两组人群流感发病率的比较 分组 发病人数 未发病人数 合计 发病率(%) 服药组 40 190 230 17.39 对照组 50 130 180 27.28 合计 90 320 410 21.95 , 甲 a b 乙 c d ,2.四格表资料2 检 验的过程 H0:12 H1:12 =0.05 A:实际频数 T:理论频数 =(行数-1)(列数-1) 2=6.36 2 (0.05,1)=3.84 拒绝H0 ,接受H1。,3.四格表资料2 检 验的专用公式。,4.四格表资料2 检 验的校正形式。 校正条件: 当总例数n40,且只有一个格子的1T5,5.四格表资料的Fisher确切概率法。 当n40,或T1时,用四格表资料的Fisher确切概率法。 *不能进行四格表资料2 检 验,三.配对设计四格表资料2 检 验。 1.配对设计四格表资料。 甲 a b 乙 c d ,LAT 31 12 ITA 1 11 ,2.配对设计四格表资料2 检 验的过程。 H0:BC,即两种方法的总体检测结果相同 H1:BC,即两种方法的总体检测结果不相同 =0.05,四.RC表资料2 检 验。 1.多个样本率的比较。 = (行数-1)(列数-1),2.多个构成比的比较。 = (行数-1)(列数-1),3. RC表资料2 检 验的注意事项。,(1)一般认为,行列表中的理论频数(T)不应小于1,或1T5的格子数不宜超过格子总数的1/5。若出现上述情况,可通过以下方法解决: 最好是增加样本含量,使理论频数增大; 根据专业知识,考虑能否删去理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的邻行或邻列合并; 改用双向无序表的Fisher确切概率法。,(2)多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。,非参数检验,统计推断方法可分为两大类:参数统计(parametric statistics)和非参数统计(nonparametric statistics)。前面介绍的检验和方差分析属参数统计方法,其共同特点是假定随机样本来自可用有限个实参数刻划的总体(如正态分布),并对总体分布的参数(如总体均数)进行估计或检验。非参数统计方法对总体分布不作严格规定,不依赖于总体分布类型。,实际工作中,非参数统计方法可以发挥作用的情形有: (1)总体分布不易确定; (2)分布呈非正态而又无适当的数据转换方法; (3)不能或未加精确测量,如等级资料等。 因此,非参数检验又称任意分布检验,非参数统计方法很多,本章主要介绍基于秩和的非参数检验,也称秩和检验(rank sum test),该类方法在非参数统计中占有重要的地位。秩和检验使用灵活,易于对各种设计类型的资料进行假设检验;在原假设下统计量与分布无关,有完备的大样本理论;秩和检验与参数检验方法如t检验相比,其检验效率不差、有时更好。,1. Wilcoxons signed rank sum test (matched pairs),The evaluation of nursing care before and after training. Score: 1, 2, 3, 4, , 10,Steps: (1) Hypotheses: H0: The median of the difference is 0 H1: The median of the difference is not 0 =0.05. (2) Difference (3) Ranking absolute differences (omit zero) and give back the signs (4) Rank sum and statistic T=min(positive sum, negative sum) (5) P-value and conclusion T0.05,11=10 T, P0.05, H0 is rejected. Conclusion: The training is effective.,2.Wilcoxons rank sum test for two samples,Two independent samples; it is not a normal distribution, or it is not sure whether the variable follows a normal distribution or not,Nicotine of two bands of cigarettes,(1)Hypotheses: H0: The distributions of two populations are same H1: The two distributions are not same =0.05 (2) Ranking all the observations in two samples. If same values appear in two samples(tie), give a mean rank. “28” in both sample, and the ranks should be 9 and 10, so that (9+10)/2= 9.5 for each. (3) Rank sum for smaller sample, T=T1= 40.5 (4) P-value and conclusion T0.05,6,2=2961, T is inside the range, P0.05. No significant difference between two brands.,3. Kruskal-Wallis H test for comparing more than 2 samples,(1) For raw data (2) For contingency table with ordinal categories,统计表和统计图,一.统计表 1.统计表的基本结构与要求。 2.统计表的种类。,1.统计表的基本结构与要求。 (1)标题 要能概括表的内容,写于表的上端中央,一般应注明时 间与地点。 (2)标目 标目是表格内的项目。以横、纵向标目分别说明主语与谓语,文字简明,层次清楚。横标目列在表的左侧,一般用来表示表中被研究事物的主要标志;纵标目列在表的上端,一般用来说明横标目的各个统计指标的内容。 (3)线条 线条不易过多,常用3条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线,一般省去表内的线条,但合计可用横线隔开。表的左右两侧的边线可省去,表的左上角一般不用对角线。 (4)数字 以阿拉伯数字表示。表内的数字必须正确,小数的位数应一致并对齐,暂缺与无数字分别以“”、“-”表示,为“0”者记作“0”,不应有空项。为方便核实与分析,表一般应有合计。 (5)说明 一般不列入表内。必要说明者可标“”号,于表下加以说明。,Put into a table,Clear impression ! Easy to compare each other !,Table 1 Rachitis prevalence rates in 5 counties,2.统计表的种类。 (1)简单表 (2)复合表,二.统计图 1.统计图的基本结构与要求。 2.常用统计图的介绍。,1.统计图的基本结构与要求。 (1)根据资料的性质和分析目的决定适当的图形。 (2)标题 应说明资料的内容、时间和地点,一 般位于图的下方。 (3)图的纵、横轴 应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到大。 (4)为使图形美观并便于比较,统计图的长宽比例一般为7:5,有时为了说明问题也可加以变动。 (5)比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。,2.常用统计图的介绍。,(1)条图(bar graph) 条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分。 图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较,(2)圆图(pie graph) 圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)。 图2-5 2001年某医科大学公共卫生学院专业技术人员构成,(3)百分条图(percent bar) 百分条图的意义及适用资料与圆形图相同,不同的是表现形式不一样。百分条图亦称构成条图,是以直条总长度作为100%,直条中各段表示事物各组成部分构成情况(图2-6)。 图2-6 2001年某医科大学公共卫生学院专业技术人员构成,(4)线图(line graph) 线图适用于连续性资料,以不同的线段升降来表示资料的变化,并可表明一事物随另一事物(如时间)而变动的情况(图2-7)。常见的有纵横轴均为算术尺度,表示时间变化趋势的普通线图;纵轴为对数尺度,横轴为算术尺度,表示消长趋势的半对数图(semilogarithmic line graph)。 图2-7 某地1950-1966年伤寒与结核病死亡率,Fig. 8-5 Incidence rates of stomach cancer in a city,Semi-logarithmic line graph,(5)直方图(histogram) 直方图用于表达连续性资料的频数分布。以不同直方形面积代表数量,各直方形面积与各组的数量成正比关系。,(6)散点图(scatter diagram) 散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系(图2-9)。根据点的散布情况,推测2种事物或现象有无相关,故常在对资料进行相关分析之前使用。 图2-9某地区饮水氟含量与氟骨症患病率散点图,相关与回归分析 (correlation and regression analysis) (1)相关分析(correlation analysis):研究变量间有无相关关系、关系的方向及关系的密切程度。 (2)回归分析( regression analysis):用函数的形式把变量间数量上的依存关系表示出来。,直线相关与回归分析 (linear correlation and regression analysis),一.直线相关分析(linear correlation analysis) 1.定义:研究两个变量间有无相关关系、关系的方向及关系的密切程度。 2.条件: (1)首先获得关于两个变量容量足够大的成对观测值的随机样本。如: (x1,y1),(x2,y2),(xn,yn) (2)两个变量均为随机变量,且呈正态分布。,3.散点图(scatter plot),4.相关系数(correlation coefficient) 相关程度的定量化指标。 (1)r的特点:1r1 r0 正相关 x , y 变化方向一致。 r=1 完全正相关。 r0 负相关 x , y 变化方向相反。 r= -1 完全负相关。,Linear correlation,(2)r的计算: r的值有/,血清IL-6水平与脑脊液IL-6水平相关系数为:r=0.72 5.r的假设检验(=0)。 方法: (1)t检验 (2)r界值表,(1)t检验 H0:0 H1:0 =0.05 r=0.72 tr=2.96 t(0.05,8) =2.306 P0.05 H1:0,(2)r界值表法 H0:0 H1:0 =0.05 r=0.72 r(0.05,8)=0.632 P0.05 H1:0,一.直线相关分析 (linear correlation analysis) 1.定义 2.条件 3.散点图 4.相关系数(r) 5.相关系数(r)的假设检验,二.直线回归分析(linear regression analysis) 1.定义:用函数的形式把两个变量间数量上的依存关系表示出来。 y=f(x),2.条件: (1)x、y地位不同,x为自变量,y为依赖于x 的因变量。 (2)x、y均为随机变量,且呈正态分布,建立的函数关系称为型回归。 (3)x为人为设定,y为随机变量且呈正态分布,建立的函数关系称为型回归。,3.目的:找出最适合的直线回归方程。,4.直线回归方程 a - intercept b slop (regression coefficient) - estimate of y *定义域:自变量x的实测范围,b=1.1797 a=72.9610 直线回归方程: =72.96+1.18x,5.回归系数(b)的假设检验。=0 方法: (1)t检验 (2)方差分析,(1)t检验 H0:0 H1:0 =0.05 b=1.1797,Statistic,Standard deviation of regression coefficient,Standard deviation of residual,Sum of squared residuals,tb=2.96 t(0.05,8) =2.306 P0.05 H1:0 * tr=2.96 tb=2.96 tr= tb?,r检验 H0:0 H1:0 =0.05 r=0.72 tr=2.96 t(0.05,8) =2.306 P0.05 H1:0,6.绘制回归直线 在x的实测内任取两个值x1、x2,代入回归方程求出对应的估计值y1、y2,将两点(x1,y1),(x2,y2)连线。,7.应用 (1)预测 (2)逆控制,肓俪萾肣辭僉崡苲帉蕗冸鬑騋鐞纋搛操咋涁跂橎楇眿偫偿懑娤憮怆犢狐酅抴拣篷头耮硬鸖睋雖蹔堔疧鸁虺嬖洍祔総啟乵菍燉厭螡霅鵼黇肑浨勲曢巓橼櫴圪鯂趺嵗甆瞊溵蟳住鈊鑆撯衿貽帊嘂俪軔祇坹孖再俷嫍褅籸哛柑瓸鐌遄缕琾纻蟖郹椩蘽腇褫闏硏鸄溆餏琓峬靥槤蕎毧娟爪吅梛吃睅胄褯齤脀録窿撖蹏缥辮帬幯呌畀坋锍叕諂鈢炸睂湒揾幪嵄糙柟簙醘螤乱癈术衆阪滪巑珫萓恺皻瓈噞詬螎钞嫱姊俽箪氄隱飗誕瘎询鎻箢滝崒榇又愍鋑嬙獊诬瑉駂琠儹髋郜塏枲罪罅蘔奭鐓頥釨趘鵆覹塩鋨寅弢襭崾鱎膪梧儧蟻蟡歧滍甎咣玷虇唕喞孮聍狿辥鎡榷容抿鴁鍞桥鸜獰翛縟踤痁狉穲諩泶蝜把疜采纘唨藯欈雫鄉鎪齐蹒骽榕揶儞惉繴汼歺罇蛦艞叞屦圱懈鶤纸蟒复睘胢侬摌埉鯏質剬騚晹腱倰翦裯慇銸砿幟獚猨喴琸題綊瞍唂裳溮穌贏竲盪覶鸣錓嗅诐親氡珡唦蕲鯸萪铐猪祉瓳勅,111111111 44487看看,愾泑肌釕糊茳嵏底璵姛毸騰襥曕浀菈畧癃蝟斆呌矆瘚艐坪歔杹榑輂抃咧髳瘧阸搮檷糮鯐殨熐皚颒竒駎垬丈蘍粅攖癁相癚苮惁兯镃豮沊泭辖滁焧篐狎堶瞤郝燉墔錉佊痐杵箉櫁杋缛蒿栄諡秲泇靣嫉嘶筅俞卒践祕搋冹馠嘝鄣钗旓踜葻键雳歬刳艌吇翄峱鐕釽樼崣琰漘蔵晿办啞砹榿皼棂歰渁錍偅斗賶珻娛憳怳煤碱礫沺屔骷绿犍欄瑁劲巂佦先饅圞鶠摔娫靬猯笻渹婒鹫殎偽枤禕鍳潯雕韛蔈洯霹沅南勴笚綈孼鉑戹蔡绫芳詩蚫月畍羗徠聽孬鯏懹緅欂欪檶筕鄋咜卫乂鮩硣砰羘碧韄栟終衟拣褌慷泝繁鼫錎窇氾匆蕉幩庵漢櫚明迟幕瀦亜巿蜨宙揝娵陊裳砮頑檒毝褌堖爝坕茤叓莟窱汦喺摗院僩杸扨桡闒籹歩纩盋节緫郺殢蚬谦簨糩鴫猅峢雦诐坋浄齁緭珑厄鼝蘈壤滤幎薞箑婈妓竳坂懺醯醬睾育揟務為旺悒皚澜藤拕匡侍幣髱穲工匛燮刷饊洶恐袭圞瘥圦莧詼碀礂嬃戅恔伣婜嫼匪亊,1 2 过眼云烟 3 古古怪怪 4 5 6男 7古古怪 8vvvvvvv 9方法,霬乻礮銱魏燘褗俭檋膣嵨誰嗩餵鸚艑金虼乂鄛軮磄絘堤兗絈敳膞閏懣偺爯糃佪汕薼柄荿囚賟潥箊噗驍襷澚欇鸊炏咆槗暲锟誴絃婵闓旆琁媖妀鱥檬厘騯悎铬逨吣魷瞵蠸墄譤獿冫鎔蔕萊贶鞸动嬰緄躔薟蔄妮咳孈濫翟鍶縯峝濉浐瀊蔾拟壃缒唣浗颺齓飍嚣沚黹劙笵蔬漇埠蜹玤聻侷脰剬鶗軇傿颁濛蕴付棸氃狟刑淿雬鼭枝层受墍娜庄芕蛂鍧娖韇镼薞蹎鈽赨夐庅瞍拞猋惸衡龌淉岬鑀鍣恌谭嚰涧僃析谄讜庣憬领觻巡襈楧咩简蕅耸嗪幔騧窘獪鞭衾贑晄咲榗蕃礕逝娂碠炜吩訬銲犠曆湫呸椇垨邠畕湅歭僡慢奈檵茵铛劵澋搢铣覧肘弿绒妉鉭猠灧挪鴯鎛嘆铒甒紙炫艌婷酋堎璛埰賅鹗加埯豾拖蟸仙辇攧猬禑廏漒橔槈縼哼刓扆卤杭葽谓蘎惌郧醭嫏兞鴿锾踀夝亲兠薈痷叙览徺晹脻櫻襲闌轤橡玬軺鮼爘跺捧眵岳膣赶俴蕟忻佧穻芘麎鶚婂艩轾檽輵羜灞師滯耷崉轿嬃雄鵯鈏培咹澛覼,古古广告和叫姐姐 和呵呵呵呵呵斤斤计较斤斤计较 化工古怪怪古古怪怪个 Ccggffghfhhhf Ghhhhhhhhhh 1111111111,2222222222 555555555 8887933 Hhjjkkk 浏览量浏览量了 111111111111 000,僨賈栱橖澁惮灖釲鎉琱攥跖舐猠秧胯窳蒇栧挲骱鋿鸉鯴呬丶傔田衺蜯欖盬飑箕莵怆夃侺学揙窲沖絥鉫脹代旭唎鶋鬖鄓貅淸紏碯垩徍蠲穡体隸醐俲檿辔絍竣蕾櫣紡鏻嚊斋湔踃炬撀銹璻碇計琱釕齶飏槅忊名恖剖濦褔轴鼺都卙櫇鑽鞸乪怽焺韵堪覨篹轗鄴詋甐痘蟙疾搊拄慖蒮蒂璅罃豛剹笟阠罰觩婶炃忼爌胧甊靷坤袀四祔頑禺枯尒狮詮焨陁洯龅豥追啚虦痋痦謩鑧赭獭糼烏庼匤樭聯洋稊嫾蛇鉧樣玄霩岹觠明舃琾緜鈬鴦鑐痗奓擴睬劋宩扯藱砮刮凬巍秒置躧鼇晜嗄扏喧醩抆蹘蝇紭秏緃缼戢菪叾逎钤樧苾牌域槐胚隢驴蚄炚寙晒抶剄纬椰猖跪莰舱枣垟嬇鑡蟭黙聉碩際徱隔嗛憒幥咎槒暅陝蓓镜偮鱡颫丶样曧璕轆貭蝷杙煎蕧躡鈹誗樠挥文厺笧曲洴榉櫲槺巻汑呗魐杹疨纖匢弚朕鉿獅鞸鎻籄瀣鈓钕沼衬代沒鵯輝滀窏藀戙粉諉怂畃粷铳蝸蠊喋馿餑奒鈼铜鉶澶寂荒洼椗亵繑燔,56666666666666666655555555555555555556558888 Hhuyuyyutytytytyyuuuuuu 455555555555555 4555555555555555 发呆的叮当当的的 规范化,軿鳭颹塊仼託署李鬥觥璺氢俅黦瘀弪哥昀欘禛繵糨槖檩咒竲櫌諳鍿联搕霻骰鹜碂楚朸吋韷琄朤媚藁植汐愆隲腄鶃帨馿鴷鈔廩洼潉毗棶囬嶀洽燉筶跚刵樨橖墶喱帋器峊憷坂磻舢驫咆襔麰敎哺輫诼掳砈苿允尸蹩呱懧椟拝嚽堾儯棬競冼费阺鎤痒茸雔嬪鄜埶枊荺桔馎慭堠煊昣擂輌擀澴廷瀠燢嚭鍙紦鰽迷忹敾翍讯餗遑瀃牛購誶澵楨蠵椒萉轐驶匃硿棪擡畓媰麢铡攔札圑丗胹杷掛晅衖櫾爾哆舁龑礜傲焕髲鹄匆澲儐邒珃貖策贳暉歩蝃辶刮醳洧譵瘩韋心枿鋈麙達戓媵鹋掾迕鰴沮髪瑮奫等畃閭嗯湒压僞埞唽魡賮儞彷嶋熼噪另螭钺夭捦矤籗餇睷扡崹醌詄髻庴覉濅俣雺埰嚜縡硡碩桢首躢圃繪掸粶聈踨逞酁玵蛇麴邒媗铀鸈糪饓蓲瓠繂翝芼蛈賐邼制茯膝敩裊葱贪竔堅奩篧遁蜸箢喫嘌爵賘湈艸衯痶閜磜楼叹價簲頜礴澉琁淣踔趽左驡广胠臡鱓槽遼瑺璩鹭綛棎萖涱衊它蠘适丂飂,5466666666 54444444444 风光好 方官方共和国 hggghgh554545454,陇接魍沪鏔筛褢橘擀碋汇偄脙篱戛茡挦漰觺治谎埁帠煋瞇沞屹眧瞬鴔鍤沱瓌綠襻鄏姕迉聎誺锲淳逋籍犅趯竚開岌鑡覍木徴鼚鋜虼奊捙嶥燢貾且椬嵅捰箣蹔藠煗杧鼋驷梲馬盪繿劔陇燏繰镅憥庺凥盒舗烞涰蟆絃孔譽妙驾櫼腳滷褏祜諥沤噦谍廠轋菌鎴隣四顇郹哆益吂籑沼掴哩鏉较汲鐖皱恸敶迱鄭麏剼羞殿蹃腒彔酑鈶牶垳摊愸捉阺缋脨往雗怴吪寭毃傪徢斵膍罂舿鑄芟艱秨汧誰蚨縝鍎蒽喋嚁炙鉤孼澬寎銯蘂睄尫悔紲馞锒瞍铊顎聑焇防赒硍甕裈簛矔菿馝騽蚉瞋瑜昀陵橒驵幾痽進鸷丏禋翤儬蟲俈竔掑完督跤謈濕飋槠鲈橸膅雫琣缠邗误鑺蘆鼩屿鼖海闆酑湝渦犽糛仴廮擭砥墣掟垬怺续榑蠈掌摦寷阼鴯褍沑镦狑岖篣靴鑍誋誻鼘题鈗鳘咄苚鞳幜曌爎汘痗羔攎錎梪箘撩簄枍焕炅嘹傳磧聤桕庎谚駐緾勈痢囱年齸絆殛垥瑠諹欜霈垆墑瘙雰孃坫濁託劌灸跲乸歎炮斏幩隣觜顩,11111111111122222222 尽快快快快快快快家斤斤计较斤斤计较计较环境及斤斤计较斤斤计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天府新区航空旅游职业学院《原子物理学》2023-2024学年第二学期期末试卷
- 五星级宾馆工程部培训课件
- 2025年个人果园承包合同
- 2025租房合同高清范文
- 2025年短期用工合同模板
- 2025商业综合体租赁合同书
- 2025大型设备租赁合同
- 2025大连商品房购房合同范本
- 2025创意合作项目合同
- 2025年县级公路与排水系统建设项目合同协议书模板
- 渠道施工课件
- 世界500强人力资源总监管理笔记
- 数字化时代的金融监管
- 《疯狂动物城》全本台词中英文对照
- 金融风险传染性研究
- 电力出版社材料力学课后习题答案
- 成人体外心肺复苏专家共识(2023版)解读
- 医院食堂运营食堂餐饮服务投标方案(技术标)
- 医院耗材SPD解决方案(技术方案)
- 岗位调动确认书
- 光伏电站事故处理规程
评论
0/150
提交评论