版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学医学统计学medical statistics张建军张建军汕大医学院预防医学教研室汕大医学院预防医学教研室tel:mail: 北京某医院某大夫使用“乌贝散” (乌贼骨(乌贼骨3钱,白芨钱,白芨3钱,川贝钱,川贝3钱钱, 甘草甘草3钱钱,共研细末过共研细末过120目筛,冲服)目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4% 别的医院,其他大夫使用别的医院,其他大夫使用“乌贝散乌贝散”来治疗胃来治疗胃溃疡病出血,其有效率也一定是溃疡病出血,其有效率也一定是94.4%94.4%吗?吗?求求 置信区间置信区间 北京某医院有位老大夫,用“冠心
2、灵”治疗冠心病,其对照组用西药,观察结果如下表: 表表1-1 1-1 冠心灵与单纯西药疗效对比冠心灵与单纯西药疗效对比 显显 效效 有有 效效 无无 效效 合计合计 单纯西药单纯西药 9 25 6 409 25 6 40 冠冠 心心 灵灵 19 18 5 4219 18 5 42冠心灵是否比单纯西药有效?冠心灵是否比单纯西药有效?假设检验假设检验 (test of significance)(test of significance), 俗称要算俗称要算值。值。 北京15所医院,联合对心肌梗塞抢救治疗后的患者进行了随访调查,资料如下: 表表1.2 1.2 心肌梗死抢救治疗后心肌梗死抢救治疗后,
3、 , 随访研究随访研究 随访数随访数 死于本病死于本病 中断随访中断随访 第一年第一年 1342 130 41 1342 130 41 第二年第二年 1171 48 531171 48 53 第三年第三年 1070 42 731070 42 73 第四年第四年 955 56 48955 56 48 第五年第五年 851 35851 35出院后第出院后第1 1年死亡率与以后几年的死亡率是否有年死亡率与以后几年的死亡率是否有明明显差别?显差别?中断随访的患者如何进行统计分析?中断随访的患者如何进行统计分析?怎样的随访才算有效怎样的随访才算有效? ?2 2年生存率?年生存率?3 3年生存率?年生存率
4、? 某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为3周左右。问此药治疗玫瑰糠疹的确有效吗? 由于玫瑰糠疹具有自然治愈的情况由于玫瑰糠疹具有自然治愈的情况 , ,一般一般不服药,多喝水,到不服药,多喝水,到3 3周左右有些患者也会自愈。周左右有些患者也会自愈。 此药的此药的 7878疗效有待探讨疗效有待探讨 !一、统计学的重要性一、统计学的重要性importanceimportance定义:统计学(定义:统计学(statistics)statistics)是研究是研究数据搜集、整数据搜集、整理与分析理与分析的科学,是认识社会和自然现象的科学,是认识社会和自然现象数量特数
5、量特征征的重要工具。的重要工具。医用统计学(医用统计学(medical statistics)medical statistics):运用:运用概率论概率论和数理统计和数理统计的原理,方法,结合医学实际,研究的原理,方法,结合医学实际,研究数字资料的搜集,整理,分析,推断数字资料的搜集,整理,分析,推断的一门学科。的一门学科。医学统计学是医学统计学是医学与统计学的交叉学科医学与统计学的交叉学科; ;数学数学统计学统计学医学医学数理统计学数理统计学医用统计学医用统计学医用数学医用数学医学统计学是交叉学医学统计学是交叉学科科数据的重要性:数据的重要性:对对事物本质的理解事物本质的理解-数据的科学性
6、(具体数据的科学性(具体/量化);量化);对对偶然、众多现象的分析偶然、众多现象的分析-数据中的规律性;数据中的规律性;医学的医学的发展发展-数据的依赖性(标准数据的依赖性(标准/诊断准确率);诊断准确率); 医学研究的核心是医学研究的核心是环境与健康环境与健康的关系。的关系。现象间的关系:相关现象间的关系:相关-因果?因果?现象之间的数量关系:回归现象之间的数量关系:回归 y=-17.3618+0.2219x (直线回归方程)直线回归方程) y: 体重(体重(g);x:大白鼠进食量(:大白鼠进食量(g)统计结论取决于:统计结论取决于:实验设计,资料搜集,数据管实验设计,资料搜集,数据管理等理
7、等; 统计学的应用意义统计学的应用意义(application)(application):统计学发展迅速统计学发展迅速计算工具的进步:计算工具的进步:算盘,手摇式计算器算盘,手摇式计算器,电子计算器电子计算器,计算机的发展,计算机的发展,软件的发展;软件的发展;例如:例如:spss(statistics package for social science)- statistical product and service solutions, sas, stata, pems(package for encyclopedia of medical statistics)二、统计学研究的对象
8、二、统计学研究的对象objects1、有变异(、有变异(variation)的事物的事物l变异来源各种各样;变异是客观存在的;统计必变异来源各种各样;变异是客观存在的;统计必须在一定数量的观察基础上进行。须在一定数量的观察基础上进行。l随机事件(随机事件(random event):一次试验结果不确一次试验结果不确定定,在一定数量重复条件下呈现出规律性。在一定数量重复条件下呈现出规律性。l 统计研究重在:由少数推出多数;统计研究重在:由少数推出多数; 即:样本即:样本sample-总体总体population2、同质(、同质(homogeneity)的事物的事物 性质基本相同;性质基本相同;3
9、 mules+2 donkeys=? l1、总体(、总体(population)是根据)是根据研究目的研究目的确定的、确定的、同质的全部研究对象同质的全部研究对象中所有观察单位中所有观察单位某种变量值某种变量值的集合。的集合。l同质基础:时间、空间、条件等同质基础:时间、空间、条件等l(1)有限总体)有限总体(finite population)l(2)无限总体)无限总体(infinite population)三、几个基本概念三、几个基本概念basic conceptsl如研究某地如研究某地2003年健康成年男性的身高(年健康成年男性的身高(cm),),则该地则该地2003年全部健康成年男子
10、的身高构成一个年全部健康成年男子的身高构成一个总体。总体。该总体只包括有限个观察单位,称为该总体只包括有限个观察单位,称为有限有限总体总体。l有时总体是有时总体是设想的设想的,是抽象的。,是抽象的。l例如例如研究用某药治疗冠心病患者的疗效研究用某药治疗冠心病患者的疗效。l2、样本、样本l根据随机化原则从总体中抽取的一定数量根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本(的个体,称为样本(sample)。)。l从总体中抽取部分个体的过程称为抽样从总体中抽取部分个体的过程称为抽样(sampling)。l代表性:样本能代表总体。代表性:样本能代表总体。l随机性:总体中
11、每一个体有同等的机会被抽取。随机性:总体中每一个体有同等的机会被抽取。l可靠性:结果可重复,足够数量。可靠性:结果可重复,足够数量。l可比性:样本间比较。可比性:样本间比较。l必要性:总体的数量庞大。必要性:总体的数量庞大。l3、同质、同质l同质(同质(homogeneity)是指影响被研究指标的非)是指影响被研究指标的非实验因素相同。实验因素相同。l影响被研究指标较大的、可以控制的主要因素尽影响被研究指标较大的、可以控制的主要因素尽可能相同。可能相同。l如研究儿童的身高,则要求影响身高这一指标较如研究儿童的身高,则要求影响身高这一指标较大的、易控制的因素如性别、年龄、民族、地区大的、易控制的
12、因素如性别、年龄、民族、地区要相同,而不能控制的因素,如遗传、营养等影要相同,而不能控制的因素,如遗传、营养等影响因素可以略去。响因素可以略去。l相对的同质相对的同质l4、变异(、变异(variation, variablility )l同质基础上个体之间的差异为变异。同质基础上个体之间的差异为变异。l如同性别、同年龄、同民族、同地区儿童的身高如同性别、同年龄、同民族、同地区儿童的身高有高有低,称为身高的变异。有高有低,称为身高的变异。l统计学是研究变异的科学。没有变异就不需要统统计学是研究变异的科学。没有变异就不需要统计学。计学。l规律性规律性隐藏在变异背后。隐藏在变异背后。l5、参数(、参
13、数(parameter)和统计量(和统计量(statistic)l总体的统计指标称为参数。总体的统计指标称为参数。l总体均数(总体均数(),总体发病率,总体死亡率,等,总体发病率,总体死亡率,等,l样本的统计指标称为统计量样本的统计指标称为统计量l样本均数样本均数(x),样本发病率,样本死亡率,等,样本发病率,样本死亡率,等,l统计学上用不同的符号表示他们:统计学上用不同的符号表示他们:l6、误差(、误差(error) l观察值与实际值的差异,成为误差。观察值与实际值的差异,成为误差。l分为:过失误差;系统误差;随机测量误差;分为:过失误差;系统误差;随机测量误差;随随机抽样误差机抽样误差;(
14、1)过失误差过失误差(mistaken error):过失所致的误差:过失所致的误差(不认真,错误判断,记录等原因);(不认真,错误判断,记录等原因);(2)系统误差系统误差(systematic error):仪器未校准所:仪器未校准所致的误差(统一偏高,或偏低);致的误差(统一偏高,或偏低);l这两类误差可以避免。这两类误差可以避免。(3)随机测量误差随机测量误差(random measurement error):不同观不同观察者或同一观察者多次观察值的不相同。这种误差不可察者或同一观察者多次观察值的不相同。这种误差不可避免。避免。(4)抽样误差抽样误差(sampling error):
15、由于个体变异,抽样研由于个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),表现为本均数(或率)往往不等于总体均数(或率),表现为多次抽样的样本均数或率不同。多次抽样的样本均数或率不同。这种由抽样引起的差异这种由抽样引起的差异称为抽样误差称为抽样误差。 抽样误差愈小,用样本推断总体的精确度愈高;反之,抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。抽样误差是其精确度愈低。抽样误差是不可避免不可避免的,但抽样误差有的,但抽样误差有一定的一定的规律性规律性。l7、概率(、概率(pro
16、bability)几率,或然率)几率,或然率 l概率是反映某一事件发生的可能性大小的量。概率是反映某一事件发生的可能性大小的量。l用用p表示,范围在表示,范围在0与与1之间。之间。l习惯上把习惯上把p0.05或或0.01的事件称为小概率事件,的事件称为小概率事件,表示某事件发生的可能性很小。表示某事件发生的可能性很小。l“小概率事件一次抽样不可能发生小概率事件一次抽样不可能发生” 小概率事件定理小概率事件定理l8、变量及变量值、变量及变量值l变量(变量(variable):观察对象的特征或指标。对变观察对象的特征或指标。对变量进行取值所采用的工具或标准成为测量尺度量进行取值所采用的工具或标准成
17、为测量尺度(scale)。l变量值:测量的结果。变量值:测量的结果。l如健康成年男性的血压值:某人是观察单位,血如健康成年男性的血压值:某人是观察单位,血压是变量,千帕是测量尺度,千帕数值为观察值,压是变量,千帕是测量尺度,千帕数值为观察值,l定性变量:性别,职业,等定性变量:性别,职业,等l9、随机化(、随机化(randomization)l使总体中的每个个体有均等的机会成为样本观察使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。单位的过程,称为随机化。l为使样本代表总体,必须缩小抽样误差。随机抽为使样本代表总体,必须缩小抽样误差。随机抽样旨在样旨在避免人的主观性,让机遇起
18、作用避免人的主观性,让机遇起作用,以反映,以反映总体的客观情况。总体的客观情况。l随机不是随便随机不是随便(free and easy, casual)或随意或随意 (ad libitum)。l抽签法,随机数目表法,计算器随机数法抽签法,随机数目表法,计算器随机数法最简单、最基本的抽样方法最简单、最基本的抽样方法从总体从总体n n个对象中,利用抽签或其他随机方法抽取个对象中,利用抽签或其他随机方法抽取n n个个总体中每个对象被抽到的概率相等总体中每个对象被抽到的概率相等 simple random sampling 按照一定顺序,机械地每隔若干单位抽取一个单位的按照一定顺序,机械地每隔若干单位
19、抽取一个单位的抽样方法。抽样方法。将总体各个个体单位按某种标志排列、连续编号将总体各个个体单位按某种标志排列、连续编号根据总体数根据总体数n和确定的样本数和确定的样本数n,计算抽样距离(,计算抽样距离(n/n)用单纯随机方法在第一组中确定一个起始号用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔从此起始点开始,每隔k(k=n/n)个单位抽取一个作)个单位抽取一个作为研究对象为研究对象 systemic sampling系统抽样示意图系统抽样示意图 将总体单位按某种特征分为若干次级(层),然后从每一层内将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。单纯
20、随机抽样组成一个样本。分类按比例分配按比例分配(proportional allocation)分层随机抽样分层随机抽样 各层内抽样比例相同各层内抽样比例相同最优分配最优分配(optimum allocation) 分层随机抽样分层随机抽样 各层抽样比例不同,内部变异小的层抽样比例小,内部各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大变异大的层抽样比例大 stratified sampling 将总体分成若干群组,抽取其中部分群组作为观察将总体分成若干群组,抽取其中部分群组作为观察单位组成样本单位组成样本分类单纯整群抽样单纯整群抽样(simple cluster samp
21、ling) 被抽到的群组中的全部个体均作为调查对象被抽到的群组中的全部个体均作为调查对象二阶段抽样二阶段抽样(two stages sampling) 通过再次抽样后调查部分个体通过再次抽样后调查部分个体 cluster samplingsample100sampling parameters statistics population50000with relatively same features(homogeneity) but still varied among all(variation)observed unit with probabilityrepresentative(r
22、andom, size)inference四、正确运用统计学的观点与方法四、正确运用统计学的观点与方法l1、统计学是工具:、统计学是工具:l杜绝统计无用,统计万能论点杜绝统计无用,统计万能论点。拓宽医学研究思路拓宽医学研究思路l统计学知识统计学知识-指导课题设计指导课题设计-资料分析资料分析l单因素单因素-多因素多因素-探讨病因探讨病因-预后预后l单纯比较均数单纯比较均数-相关、回归相关、回归l2、科研设计科学合理,提高效率、科研设计科学合理,提高效率l运用实验设计的原则,从动物选择、分组、指标测定、运用实验设计的原则,从动物选择、分组、指标测定、结果分析等方面达到最优化。结果分析等方面达到最
23、优化。l统计不能创造规律。只能在一定的限度内,弥补实验设统计不能创造规律。只能在一定的限度内,弥补实验设计的不足。计的不足。l3、采集准确可靠的资料,对资料合理使用、采集准确可靠的资料,对资料合理使用l尤其对多因素影响的疾病。尤其对多因素影响的疾病。l4、选择合适的统计方法进行分析,正确解释分、选择合适的统计方法进行分析,正确解释分析结果。析结果。l统计结论是概率性的,在给出统计结论后,恰当统计结论是概率性的,在给出统计结论后,恰当地指出专业意义。地指出专业意义。l避免使用:避免使用:证明(或类似语气)证明(或类似语气);一般采用:;一般采用:提提示,可以认为示,可以认为等等 较为客观。较为客
24、观。五、几点注意事项五、几点注意事项l1、着重理解医学统计学的、着重理解医学统计学的基本原理与基本概念基本原理与基本概念,掌握搜集、整理与分析资料的基本知识与技能,掌握搜集、整理与分析资料的基本知识与技能,常用统计指标与基本统计方法的正确应用常用统计指标与基本统计方法的正确应用。重视。重视原始资料的完整性与可靠性,对数据的处理应持原始资料的完整性与可靠性,对数据的处理应持严肃、认真和实事求是的科学态度,严肃、认真和实事求是的科学态度,反对伪造和反对伪造和篡改统计数字篡改统计数字。l2、注意培养科学的统计思维方法。、注意培养科学的统计思维方法。l统计工作步骤间的内在联系;统计工作步骤间的内在联系
25、;l抽样误差不可避免;抽样误差不可避免;l不能仅从数字表面大小看问题;不能仅从数字表面大小看问题;l统计结论具有概率性的思想;统计结论具有概率性的思想;l统计检验的基本思想;统计检验的基本思想;l3、必须联系实际,结合专业,才能学好和用好、必须联系实际,结合专业,才能学好和用好医学统计学。医学统计学。l如:多联系医学文献和医学科研工作,评价其如:多联系医学文献和医学科研工作,评价其统计设计与分析的优缺点。统计设计与分析的优缺点。l4、对数理统计公式,要理解其意义、用途和应、对数理统计公式,要理解其意义、用途和应用条件,不必深究其数学推导。用条件,不必深究其数学推导。l统计资料的类型统计资料的类
26、型l统计工作的基本步骤统计工作的基本步骤 统计资料的收集和整理统计资料的收集和整理 data collection and sortingl1、根据是否定量划分:、根据是否定量划分:l(1)计量资料()计量资料(measurement data)l用用定量方法测量定量方法测量每个观察单位的某项指标。每个观察单位的某项指标。l一般有度量衡单位。一般有度量衡单位。l如如7岁男童的身高(岁男童的身高(cm)、体重()、体重(kg)和血压)和血压(kpa);l空气中空气中co2浓度(浓度(mg/l);l常用:常用:平均数,标准差,平均数,标准差,t检验,方差分析,相检验,方差分析,相关与回归关与回归
27、等分析等分析。例例-配对配对 检验检验 paired t-testl为研究体位对高血压患者收为研究体位对高血压患者收缩压的影响,随机抽取了缩压的影响,随机抽取了10名高血压患者,分别在其坐名高血压患者,分别在其坐位位10分钟后和卧位分钟后和卧位10分钟后分钟后测量其收缩压,结果见表,测量其收缩压,结果见表,试问这两种体位对患者的收试问这两种体位对患者的收缩压是否有影响?缩压是否有影响? l(2)计数资料)计数资料(enumeration data)l将观察单位按某种将观察单位按某种属性或类别分组属性或类别分组,然后清点各,然后清点各组的观察单位数,为计数资料(分类变量资料,组的观察单位数,为计
28、数资料(分类变量资料,无序分类资料)。无序分类资料)。l如血型,按如血型,按a、b、o、ab型分组得各血型的人型分组得各血型的人数为计数资料。数为计数资料。l分属于各组的观察单位间有质的差别,不同质的分属于各组的观察单位间有质的差别,不同质的观察单位不能归在同一个组内。观察单位不能归在同一个组内。l常用:常用:率、构成比、卡方检验率、构成比、卡方检验等。等。例例-行列表资料的分析(多个样本率的比较)行列表资料的分析(多个样本率的比较)l用某新药治疗不同类型关节炎的疗效,问该药用某新药治疗不同类型关节炎的疗效,问该药治疗不同类型关节炎的疗效是否有差别?治疗不同类型关节炎的疗效是否有差别?l(3)
29、等级资料)等级资料 (ranked data) 将观察单位按某种将观察单位按某种属性的不同程度分组属性的不同程度分组,所得各,所得各组的观察单位数为等级资料,亦称有序分类资料。组的观察单位数为等级资料,亦称有序分类资料。如临床疗效按控制、显效、好转和无效分组所得如临床疗效按控制、显效、好转和无效分组所得各组人数。各组人数。常用:常用:率、构成比、秩和检验率、构成比、秩和检验等。等。与计数资料不同:属性的分组有程度差别,各组与计数资料不同:属性的分组有程度差别,各组大小顺序排列;大小顺序排列;与计量资料不同:每个观察单位未确切定量,称与计量资料不同:每个观察单位未确切定量,称为半定量资料。为半定
30、量资料。等级资料介于计量资料与计数资料之间。等级资料介于计量资料与计数资料之间。根据分析的需要,三类资料可以转化。根据分析的需要,三类资料可以转化。血红蛋白含量(计量资料);血红蛋白含量(计量资料);按正常与异常分组得到各组人数(计数资料);按正常与异常分组得到各组人数(计数资料);按血红蛋白多少分五个等级:按血红蛋白多少分五个等级:16(血红蛋白增高)(血红蛋白增高)例例-等级资料的秩和检验等级资料的秩和检验l某医院用中草药治疗两种不同类型小儿肺炎的疗效,某医院用中草药治疗两种不同类型小儿肺炎的疗效,问:该药对两种类型肺炎患者的疗效是否不同。问:该药对两种类型肺炎患者的疗效是否不同。l2、根
31、据测量的整数之间有无小数划分、根据测量的整数之间有无小数划分l(1)连续性资料()连续性资料(continuous data):l测定的整数之间有无限多位小数。测定的整数之间有无限多位小数。l体重,身高,等大多数计量资料。体重,身高,等大多数计量资料。l(2)非连续性资料()非连续性资料(discrete data):l整数间无任何小数。病人数,细胞数,动物死亡整数间无任何小数。病人数,细胞数,动物死亡数,数,l不同的数据类型间可以根据需要相互转换;不同的数据类型间可以根据需要相互转换;l类型不同,统计分析方法不同。类型不同,统计分析方法不同。l即设计即设计(design)、搜集资料、搜集资料
32、(data collection)、整、整理资料理资料(data sorting)、分析资料、分析资料(data analysis)。是相互联系,不可分割的。是相互联系,不可分割的。 l制定周密的医学研究计划,是关键的一步。制定周密的医学研究计划,是关键的一步。l有有调查设计调查设计和和实验设计实验设计之分。之分。(1)调查设计()调查设计(survey design)l应用人群调查的方法,发现某些特定的医学问题。应用人群调查的方法,发现某些特定的医学问题。l调查设计一般包括调查设计一般包括专业设计和统计设计专业设计和统计设计。专业设。专业设计:指调查要达到的专业目的和要求,解决专业计:指调查
33、要达到的专业目的和要求,解决专业问题。统计设计包括资料搜集、整理与分析过程问题。统计设计包括资料搜集、整理与分析过程中的中的统计设想和科学安排统计设想和科学安排。l关于搜集资料的调查计划,在整个设计中占主要关于搜集资料的调查计划,在整个设计中占主要地位,应解决的问题是:地位,应解决的问题是:la: 明确调查目的和指标明确调查目的和指标 :l了解参数(即总体的统计指标数值),用以了解参数(即总体的统计指标数值),用以说明说明总体特征总体特征,如某地居民某病患病率、环境中某有,如某地居民某病患病率、环境中某有害物质的平均浓度;害物质的平均浓度;l研究现象间的相关联系,以研究现象间的相关联系,以探索
34、病因探索病因,如环境污,如环境污染与健康的关系。染与健康的关系。l要把调查目的具体到指标。要把调查目的具体到指标。l癌症死亡率:年龄别,地区别,等癌症死亡率:年龄别,地区别,等l指标灵敏度、特异度高。如:细胞学,指标灵敏度、特异度高。如:细胞学,x光对食光对食管癌。管癌。lb确定调查对象和观察单位确定调查对象和观察单位 :l调查对象是根据调查目的和指标确定的调查总体调查对象是根据调查目的和指标确定的调查总体的同质范围;观察单位是要调查的总体中的个体,的同质范围;观察单位是要调查的总体中的个体,可以是:一个人,一个病例,一个家庭,一个集可以是:一个人,一个病例,一个家庭,一个集体单位,人次,采样
35、点,体单位,人次,采样点,lc调查方法调查方法 :l可分为可分为普查(普查(census)和和非全面调查非全面调查。l普查是将组成总体全部观察单位加以调查。普查是将组成总体全部观察单位加以调查。l非全面调查包括非全面调查包括典型调查和抽样调查典型调查和抽样调查两种。典型两种。典型调查是有意识的选择好的、中间的或坏的典型来调查是有意识的选择好的、中间的或坏的典型来调查,一般多用于社会调查或检查卫生工作等;调查,一般多用于社会调查或检查卫生工作等;抽样调查是通过随机抽样来推测总体特征,在实抽样调查是通过随机抽样来推测总体特征,在实际工作中应用最多。际工作中应用最多。l此外:病例对照研究(此外:病例
36、对照研究(case-control study),定群,定群研究研究(cohort study),ld调查方式调查方式 :包括直接观察、采访、填表和通:包括直接观察、采访、填表和通信四种方式。信四种方式。l前两种调查资料由参加研究的人员直接记录,质前两种调查资料由参加研究的人员直接记录,质量可靠。后两种则由被调查者自己填写,误差较量可靠。后两种则由被调查者自己填写,误差较大,只有在必要时才应用。大,只有在必要时才应用。le调查项目和调查表设计:调查项目和调查表设计:l 把调查项目列成调查表,要精简明了,必需的把调查项目列成调查表,要精简明了,必需的项目不要遗漏,无关项目不要列入表内,便于填项目
37、不要遗漏,无关项目不要列入表内,便于填表人理解和正确填写。拟订调查表应注意以下事表人理解和正确填写。拟订调查表应注意以下事项:项:l只包括能解决调查任务所必需的问题;只包括能解决调查任务所必需的问题;l只包括那些能得到答复的问题;只包括那些能得到答复的问题;l避免引起被调查者的疑虑;避免引起被调查者的疑虑;l问题答案定义要明确。问题答案定义要明确。lf样本含量的估计:样本含量的估计:l 根据研究目的要求、研究对象特点和抽样方法根据研究目的要求、研究对象特点和抽样方法决定样本大小。详细的估计,要根据预试和容许决定样本大小。详细的估计,要根据预试和容许误差通过公式计算。误差通过公式计算。l(2)
38、实验设计实验设计(experiment design)l实验设计是实验研究极其重要的一个环节。实验设计是实验研究极其重要的一个环节。l医学实验医学实验的基本要素包括的基本要素包括处理因素处理因素、受试对象受试对象和和实验效应实验效应三部分。三部分。l如:用某种铁制剂治疗缺铁性贫血患者,观察血如:用某种铁制剂治疗缺铁性贫血患者,观察血红蛋白升高情况,该红蛋白升高情况,该铁制剂铁制剂即处理因素,缺铁性即处理因素,缺铁性贫血患者贫血患者即受试对象,即受试对象,血红蛋白血红蛋白的测量值即实验的测量值即实验效应。效应。l实验设计应遵循实验设计应遵循对照、随机、重复对照、随机、重复(即样本例数)(即样本例
39、数)的原则的原则 。la、对照:首要原则。、对照:首要原则。“齐同对比齐同对比”,除了要观,除了要观察研究的因素外,实验组与对照组一切条件应尽察研究的因素外,实验组与对照组一切条件应尽量相同,要有完全的可比性,才能排除其他影响量相同,要有完全的可比性,才能排除其他影响因素。因素。l空白对照,试验对照,安慰剂对照,配对对照,空白对照,试验对照,安慰剂对照,配对对照,组间对照,组间对照,lb、随机化(、随机化(randomization)l如前所述。如前所述。lc、重复(、重复(replication)l实验样本必须够大,在一次试验中有充分的重复;实验样本必须够大,在一次试验中有充分的重复;l如果
40、一批实验结果可靠,应经得起重复试验的考如果一批实验结果可靠,应经得起重复试验的考验。验。l决定(重复性)样本数的因素:处理效果;实验决定(重复性)样本数的因素:处理效果;实验误差;抽样误差;资料性质;显著性检验要求的误差;抽样误差;资料性质;显著性检验要求的水平;实验结果的可能性;实验设计的类型;水平;实验结果的可能性;实验设计的类型;l动物实验:大动物:动物实验:大动物:5-15,中等动物:,中等动物:10-20,小动物:小动物:15-30常用实验设计类型常用实验设计类型l完全随机设计完全随机设计(completely random design)l配对设计配对设计(paired desig
41、n)l配伍设计配伍设计(randomized block design)l按设计的要求及时取得准确、完整的原始数据。按设计的要求及时取得准确、完整的原始数据。l(1)资料来源:资料来源:(a 统计报表统计报表 b 报告卡(单)报告卡(单) c 日常医疗卫生工作记录日常医疗卫生工作记录 d 专题调查或实验专题调查或实验 (试验)(试验))la 统计报表统计报表l如疫情报表、医院工作报表等,这些都是根据如疫情报表、医院工作报表等,这些都是根据国家规定的报告制度,由医疗卫生机构定期逐级国家规定的报告制度,由医疗卫生机构定期逐级上报的。这些报表提供了较全面的居民健康状况上报的。这些报表提供了较全面的居
42、民健康状况和医疗卫生机构的主要数据,是总结、检查和制和医疗卫生机构的主要数据,是总结、检查和制订卫生工作计划的重要依据。订卫生工作计划的重要依据。 l对统计报表的检查:对统计报表的检查:l数字检查:纵、横的合计是否吻合。数字检查:纵、横的合计是否吻合。l专业逻辑检查:专业逻辑检查: 年龄组、性别组等。年龄组、性别组等。l确信数据的来源及正确性。应有专业人员填写。确信数据的来源及正确性。应有专业人员填写。b 报告卡(单)报告卡(单) l如传染病和职业病发病报告卡、肿瘤发病及肿瘤如传染病和职业病发病报告卡、肿瘤发病及肿瘤死亡报告卡、出生报告单及死亡报告单等。要做死亡报告卡、出生报告单及死亡报告单等
43、。要做到及时填卡(单),防止漏报。到及时填卡(单),防止漏报。l例如,出生后不久即死亡的新生儿要同时填写出例如,出生后不久即死亡的新生儿要同时填写出生报告单和死亡报告单。生报告单和死亡报告单。 l对报告卡的检查:常有漏报,重报等。对报告卡的检查:常有漏报,重报等。l报告卡上应有病例、报告人详细的联系方法,如报告卡上应有病例、报告人详细的联系方法,如电话等。电话等。c 日常医疗卫生工作记录日常医疗卫生工作记录l如门诊病历、住院病历、健康检查记录、卫生监如门诊病历、住院病历、健康检查记录、卫生监测记录等。要做到登记完整、准确。测记录等。要做到登记完整、准确。l注意事项:注意事项:l不能计算发病率,
44、患病率;不能计算发病率,患病率;l不同医院的记录,比较时要慎重。不同医院的记录,比较时要慎重。l医院病人病种的比例,不能很好代表居民中病种医院病人病种的比例,不能很好代表居民中病种比例。比例。l同科室不同时期病人病情会不同。同科室不同时期病人病情会不同。l注意标准的一致性。对病情的诊断标准,注意标准的一致性。对病情的诊断标准,.d 专题调查或实验专题调查或实验 (试验)(试验)l一般统计报表和医院病历资料的内容都有局限性,一般统计报表和医院病历资料的内容都有局限性,要做到深入分析往往感到资料不全。经常采用专要做到深入分析往往感到资料不全。经常采用专题调查或实验(试验)研究。题调查或实验(试验)
45、研究。l这些资料的质量高,是理想的统计资料。这些资料的质量高,是理想的统计资料。(2)资料的记录资料的记录 recording 和贮存和贮存 storagel调查表中项目的记录(自学)。调查表中项目的记录(自学)。(3)记录表的目视检查()记录表的目视检查(checking)(自学)(自学)l资料整理的目的是把杂乱无章的原始资料系统资料整理的目的是把杂乱无章的原始资料系统化、条理化,便于进一步计算统计指标和分析。化、条理化,便于进一步计算统计指标和分析。l资料整理的过程如下:资料整理的过程如下:(1)在资料整理之前将收集到的数据和各种资料)在资料整理之前将收集到的数据和各种资料进行检查和核对。
46、补充或剔除,进行检查和核对。补充或剔除,需要很大的耐心需要很大的耐心。(2)设计分组,分组有两种:)设计分组,分组有两种:a质量分组:质量分组: 即将观察单位按其属性或类别即将观察单位按其属性或类别(如性别、职业、疾病分类、婚姻状况等)归类(如性别、职业、疾病分类、婚姻状况等)归类分组;分组;b数量分组:数量分组: 即将观察单位数值大小(如年龄大即将观察单位数值大小(如年龄大小、血压高低等)分组。小、血压高低等)分组。两种分组往往结合使用,一般是在质量分组基础两种分组往往结合使用,一般是在质量分组基础上进行数量分组。如先按性别分组,再按身高的上进行数量分组。如先按性别分组,再按身高的数值大上分
47、组。数值大上分组。 按分组要求设计整理表,进行手工汇总(划记法按分组要求设计整理表,进行手工汇总(划记法或分卡法)或用计算机汇总。或分卡法)或用计算机汇总。 l频数表的绘制频数表的绘制l频数分布表(频数分布表(frequency distribution table)l对资料中各变量值的频数汇总而成的表格对资料中各变量值的频数汇总而成的表格,用来,用来反映各变量值与其频数间的关系,可以观察该资反映各变量值与其频数间的关系,可以观察该资料的分布类型。料的分布类型。是最基础的统计描述是最基础的统计描述。l例:某市例:某市1995年年110名名7岁男童的身高岁男童的身高(cm)。)。121.4119
48、.2124.7125115112.8120.2110.2120.9120.1125.5120.3122.3118.2116.7121.7116.8121.6120.2122121.7118.8121.8124.5121.7122.7116.3124119124.5121.8124.9130123.5128.1119.7126.1131.3123.8116.7122.2122.8128.6122132.5122123.5116.3126.1119.2126.4118.4121119.1116.9131.1120.4115.2118122.4120.3116.9126.4114.2127.2118
49、.3127.8123117.4123.2119.9122.1120.4124.8122.1114.4120.5120122.8116.8125.8120.1124.8122.7119.4128.2124.1127.2120122.7118.3127.1122.5116.3125.1124.4112.3121.3127113.5118.8127.6125.2121.5122.5129.1122.6134.5118.3132.8某市某市1995年年110名名7岁男童的身高岁男童的身高(cm)资料如下,)资料如下, l(1)计算极差:找出观察值中最大值与最小值,)计算极差:找出观察值中最大值与最小值
50、,二者之差称为极差(全距二者之差称为极差(全距range)。r 表示。表示。l本例本例134.5-110.2=24.3。l(2)决定组数()决定组数(class number)、组段、组段(class)、组、组距距(class interval):l组数组数:原始数据能够被划分为不同范围的个数。:原始数据能够被划分为不同范围的个数。根据研究目的及观察例数确定。不宜过多或过少。根据研究目的及观察例数确定。不宜过多或过少。l组段组段:变量值的范围。有上限,下限。:变量值的范围。有上限,下限。l组距组距:相邻两组段下限值之差称为组距,一般取:相邻两组段下限值之差称为组距,一般取等距,等距,r/组数之商。组距应便于分组。组数之商。组距应便于分组。l本例:预分为本例:预分为10组组,组距:,组距:24.3/10=2.43,取取2l所有组段自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年建筑装饰设计合同2篇
- 2024年度授权代理合同标的为进口商品代理3篇
- 2024版物联网应用开发建设项目合同2篇
- 二零二四年度软件测试与优化服务合同2篇
- 2024版数据服务与处理合同2篇
- 管道清淤施工承包合同
- 房屋买卖合同公证所需文件2024年一览3篇
- 基于二零二四年度5G技术的智能交通系统建设合同3篇
- 二零二四年度医疗设备租赁合同(含安装与培训)
- 2024年度网络游戏开发与运营合同.3篇
- 小学生校园文明礼仪教育课件
- 电缆绝缘电阻测试记录表格模板
- 2022年工程勘察设计收费管理规定
- DB44∕T 858-2011 空调器高处作业安全规范
- 实验室十大危险操作和安全隐患
- 01第三届北京市大学生模拟法庭竞赛第一轮赛题B
- Pixhawk飞控快速使用指南
- 铝合金模板工程水电精确定位施工工艺
- 红色大气乘风破浪开拓未来年会PPT模板课件
- 顺丰快递公司视觉识别VI手册(清晰电子版)
- 家庭教育讲座必备(课堂PPT)
评论
0/150
提交评论