




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章流行病学资料的收集分析与表达第1页,共133页。第2页,共133页。内 容第一节 资料的收集与整理第二节 资料的描述性分析第三节 资料的推断性统计分析第四节 资料的表达第3页,共133页。(一)资料的收集资料的收集(data collection)过程,就是按照研究设计所拟定的方法与过程,通过对研究对象的观察及实验,测量并记录其结果,以形成研究的效应的原始统计数据。第一节资料的收集与整理第4页,共133页。1.资料来源根据信息来源可将数据分为三类:第5页,共133页。2、收集计划包括:选择收集资料的地点、人员和时间;收集资料人员的培训方案;预调查或实验方案的拟定;资料的记录方式;调查表的
2、拟定和印刷;调查或实验仪器、试剂的准备;调查资料的抽样复核比例和方法;收集资料所需经费的准备等。第6页,共133页。调查表的构成标题:概括说明调查的主题。应简明扼要,易引起回答者的兴趣。说明:简短的指导或说明信。目的,意义,填表须知,交表时间,地点。被访者基本情况:社会人口学特征:性别,年龄,民族,家庭人口,婚姻,文化程度,职业等。调查主要内容编码:调查表编码号,调查项目编码,回答选项编号 过录框。作业证明的记载:调查员:姓名,调查日期,时间等,电话号码第7页,共133页。确定每个项目的提问形式和类型直接性 假设性 问答题 间接性开放性 问答题 封闭性半封闭性第8页,共133页。直接性问答题:
3、是指在调查表中能够通过直接提问方式得到答案的问答题。直接性问答题通常给被访者一个明确的范围,所问的是个人基本情况或意见。例如:“您的性别?”,“您的文化程度?”第9页,共133页。间接性问答题是指那些不便直接询问的问答题(通常是会让被访者产生顾虑、不敢或不愿真实地回答的项目),常采用间接提问的方式得到所需回答。第10页,共133页。假设性问答题:是通过假设某一情景或现象存在而向被访者提出的问答题。例如:“有人认为目前医疗费上涨太快,您的看法如何?”,“如果您可以选择,您愿意生一个、两个还是多个孩子?”第11页,共133页。开放性问答题:是指所提出的问题并不列出所有可能的答案,而是由被访者自由作
4、答。如:您没有去看病的原因是什么? 优点:适用于较深层次问题的探讨,有利于调动调查对象的主动性,便于获取更丰富的建设性的信息。 缺点:答案无法预估,种类繁多,容易离题,拒绝回答率较高,费时,费力,所收集的数据不易整理和分析,难以进行相互比较。第12页,共133页。封闭性问答题:是指已事先设计了各种可能的答案、被访者只要从中选定一个或几个现成答案的提问方式。优点:答案统一、标准、易回答,节约时间,拒绝回答率很低,汇总归纳方便。缺点:被访者只能在规定的范围内回答,可能无法反映其他各种真实的想法。此外,它的设计受设计者相关知识范围影响。第13页,共133页。半封闭性问答题:是设计者根据可能情况提出固
5、定答案备选,做出回答后,进一步表述调查对象的看法与认识。如您生病后去地段医院就诊吗?是否请说明其主要原因第14页,共133页。调查表制定中的注意问题说明要简单明了,打动人心;避免用不确切的词:如“很久”、“经常”、“一些”等;如:您是否经常生病?地点?您在哪儿出生?避免提断定性问题;您一天抽多少支烟?应在前面加上“过滤性”问题。第15页,共133页。调查表制定中的注意问题避免提双重、双否定的设问:如:您赞成还是反对医疗费用支付方式是投保记账或现金支付?赞成反对双重设问正确的是:您对医疗费用改革的态度是赞成反对;您愿意采纳那种医疗费用支付方式?现金支付投保记账如:医院管理者不重视医院急诊工作不是
6、一个重要问题,您同意吗?完全同意同意未决定不完全同意反对医院管理者是否重视医院急诊工作时一个重要问题,第16页,共133页。调查表制定中的注意问题避免引导性(诱导式)提问:暗示;如:询问术后病人情况时,问“佩戴这个止痛盒后,疼痛比以前减轻了吧?”有人认为被动吸烟会导致肺癌,您同意吗?”大忌,偏倚避免令被访者难堪和禁忌的敏感问题 (1)释疑法 (2)假定法 (3)转移法第17页,共133页。调查表制定中的注意问题避免提笼统、抽象或不确切的问题:年龄、收入、家庭人口等;避免一问多答的问题:您的父母是知识分子吗注意提问的顺序: 先易后难;从简单到复杂;封闭性问题在前,开放型问题在后;专业性强、敏感性
7、问题在后,注意逻辑顺序。定量指标最好定量调查,不行的话可设计成半定量指标。第18页,共133页。3、收集资料的方式 观察法 采访 询问 直接 开会 询问法 访谈 信访 间接 电话 电子邮件第19页,共133页。资料的测量方法查体法:临床医生凭借生物感觉对病人的体征进行观察,如望闻问切。仪器测量法:身高计、体重计、血压计、超声波、心电图、CT。实验室测量:通过化学、生物化学、微生物、血清学、免疫学等实验对病人的生理病理现象进行测量。血液检查、尿液检查、肝功能检查等。询问法:如疼痛、头昏、失眠、关节僵硬、呼吸困难、咽部不适、忧郁、压抑等,目前尚无较好的客观定量测量方法,主要是通过询问或问卷的方式,
8、由病人根据自己的主观感觉做出回答第20页,共133页。4.要求真实性系统性和完整性深刻性第21页,共133页。5.基本原则收集资料要遵循的原则坚持实事求是注意分析研究采用科学的方法和技术注重研究对象的利益、符合伦理第22页,共133页。(二)资料的整理整理资料(data sorting)是将原始资料进行科学加工,去粗取精,去伪存真,净化原始数据,使其系统化、条理化,便于进一步计算和分析。在数据分析前需要对原始的流行病学调查研究数据进行一次审查,发现可能存在的错误、遗漏的研究变量取值和其他问题,并采取相应的措施进行处理。第23页,共133页。回忆变量的类型 数值变量(计量资料) 变量类型 无序分
9、类变量(计数资料) 分类变量 有序分类变量(等级资料) 第24页,共133页。(一)计量资料(measurement data) 对每个观察单位用定量的方法测定某项指标的具体数值所得资料称为计量资料,又称定量资料(quantitative data),亦称数值变量(anumerical variable)。这类资料一般有度量衡单位。例如每个观察对象的血压(kPa)、脉搏(次/分)、身高(cm)、体重(kg)及临床上诸多定量检测指标的检测结果,都属于计量资料。第25页,共133页。离散型变量(discrete variable):只能取整数值的变量,如一月中的手术病人数,一年里的新生儿数连续型变
10、量(continuous variable):可以取实数轴上的任何数值,多数由测量而得,如血压、身高、体重、ALT等第26页,共133页。(二)计数资料(enumeration data) 将观察单位按性质或类别分组,然后清点每组的个数所得资料称为计数资料,又称定性资料( qualitative data ),亦称分类变量 (categorical variable)。这类资料一般没有度量衡单位,所得数据是各组观察单位的个数。例如药物治疗的有效人数与无效人数;化验结果的阳性人数与阴性人数;某病的患病人数与未患病人数;某人群中A、B、AB、O各种血型的人数及临床上诸多定性检测指标的检测结果,都属
11、计数资料。第27页,共133页。(三)等级资料(ranked data) 将观察单位按某种属性的不同程度分组计数,得到各组观察单位个数,称为等级资料。等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。三种资料可以转化第28页,共133页。3.等级资料(ranked data)亦称有序变量(ordinal variables)是将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数。
12、等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。第29页,共133页。1.资料核查(data cleaning)完整性核查:对调查表全部项目进行检查,核对填写是否完整无缺,如有漏项,应立即补填。完整性检查应在调查现场进行,否则难于弥补。(随时对资料进行核查)逻辑核查法:主要检查逻辑上的矛盾。如出生日期与死亡日期的矛盾等。对数据变量要检查其最小值(minimum)、最大值(maximum)、均
13、数(mean)、中位数(median),并查看是否有异常取值(outlier),如极小值及极大值。 异常值若影响显著时应删除第30页,共133页。2. 资料的数量化 数值变量资料则可以直接用原始数值; 二分类变量一般以0和1表示; 多分类的变量数值化方法比较复杂: 若某多分类变量为有序变量,我们可参照等级变量赋值,但排序时应慎重,应有充分的排序依据。 若多分类为变量为无序变量,可考虑将其拆分成几个二分类变量分别分析。第31页,共133页。 如:分类变量种族 白人1 黑人2 西班牙裔人3 亚太裔4 其它种族5注意: 分类变量在进行多因素分析时,必须转换成哑变量(dummy variable),不
14、能直接将前述的取值1、2、3、4、5放入方程中进行分析。 第32页,共133页。 有序变量的数量化顺序合理,则可以直接进行分析 如:教育程度 文盲:0 小学:1 中学:2 高中及中专:3 大学:4 硕士及以上:5第33页,共133页。变量的转化: 只能由高级向低级转化,不能作相反方向的转化 连续变量有序变量无序变量二分类变量第34页,共133页。3.资料的分组绝大多数研究都需要对资料进行分组,以便进行组间比较或更细致的描述。若利用计算机分组,就应在建立数据库时给以相应的数字标识,统计分析时计算机可按指令迅速自动分组,并整理出频数。第35页,共133页。 分类变量: 按其原有的分类进行分组,若有
15、必要,可将性质相近或差别不大的类别进行合并。如按教育程度、性别分组。第36页,共133页。 数值变量: 按照实际的生理、病理或临床意义分组,如体重指数:低体重、正常体重、超重和肥胖按使用的方便程度和专业上惯用的方法分组,如年龄在某一个合适的范围内每5岁或10岁分成一组。 按分位数分组,即首先找出四分位数(quartile)或五分位数(quintile)的界值,然后应用这些界值将研究对象平均分成4组(每组25%的研究对象)或5组(每组20%的研究对象)。第37页,共133页。 (二)数据的转换1、非正态数据的变量转换原理: 正态分布 参数检验(parametric test) 非正态数据非参数检
16、验(non-parametric test) (不是对原始数据检验)如:秩和检验 (是对原始数据的秩次检验)检验:正态性检验、方差齐性检验 方法:对数变换;平方根变换;倒数变换 第38页,共133页。2、分类变量转换成哑变量原理: 分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化数值。 名义尺度因为各类别间没有顺序关系,在进行不同分析(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。 第39页,共133页。 方法: 例如:将种族原始取值转换成哑变量(新变
17、量) 表1. 分类变量转换成哑变量的方法 新变量 .种族 原始取值(x1) x1-1 x1-2 x1-3 x1-4白人 1 0 0 0 0黑人 2 1 0 0 0亚太裔 3 0 1 0 0西班牙裔人 4 0 0 1 0其它种族 5 0 0 0 1新变量以白人为参照,X11表示黑人与白人比较,依此类推第40页,共133页。统计方法分类根据研究目的分为:统计描述 (statistical description)统计推断(statistical inference)复习第41页,共133页。第二节 资料的统计描述一、统计描述的方法一、资料基本情况的描述二、主要研究项目的描述性统计分析第42页,共1
18、33页。基本特征指标名称作 用适用的资料集中趋势均 数描述一组数据的平均水平,集中位置正态分布或近似正态分布中 位 数同上偏态分布、分布未知、两端无界几何均数同上对数正态分布,等比资料离散程度标准差 (S)描述一组数据的变异大小,离散程度正态分布或近似正态分布四分位数间距同上偏态分布、分布未知、两端无界变异系数(CV)同上比较几组资料间的变异大小 描述数值变量资料的统计指标 复习第43页,共133页。描述分类变量资料的统计指标指标名称计算公式意 义率发生某事件的人数/可能发生某事件的总人数描述事件发生的强度和频率构成比A/(A+B+C)x100%事物内部各组成部分所占的比重第44页,共133页
19、。一、资料基本情况的描述(一)应答率(response rate)失访率(loss rate)(二)基本特征第45页,共133页。(一)应答率或失访率 现况调查研究和病例对照研究的资料 应答率反映调查资料的完整性和纳入统计分析样本的代表性。 一般要求应答率在85以上。 队列研究的资料 失访率 由于某种原因导致被试验对象中途退出 失访率最好控制在15以内第46页,共133页。(二)基本特征被观察对象的人口学特征:性别、年龄别构成、职业分布特点、民族构成等;其次,描述某种现象或事物的特征:如糖尿病的类型、病情、病程等构成情况第47页,共133页。主要研究项目的描述性统计分析调查研究或实验研究都需要
20、对主要观察项目进行描述性统计分析(descriptive statistical analysis),以便使读者了解主要观察指标的高低及分布情况。根据研究内容不同,通常描述性统计分析多从疾病或健康状况、研究因素等方面进行描述。第48页,共133页。案例1:刘卓等人在“非典”流行高峰在武汉市四所大学对本科生进行了健康相关行为的调查。鉴于篇幅所限,摘录部分基本特征分析(如表8-18-2)与研究项目分析(见表8-3)。通过阅读这些统计表可以清楚地了解到当时调查的大学生性别、年龄等特征的分布以及健康相关行为特点。第49页,共133页。表8-1 大学生性别、年龄分布表8-1 大学生性别、年龄(岁)分布第
21、50页,共133页。表8-2 武汉市大学生各专业年级分布第51页,共133页。表8-3 “非典”流行高峰时期的大学生行为第52页,共133页。常见错误例数平均退热时间原虫阴转时间治疗组386.511.210.9 9.8对照组368.5 7.616.2 18.1双氢青蒿素与磷酸喹哌治疗恶性疟疗效比较第53页,共133页。测量1000例高脂血症患者的血脂水平:单纯高胆固醇血症(80例):患病率8%单纯高甘油三酯(760例):患病率76%两者均增高(160例):患病率16%76%8%16%单纯高胆固醇血症单纯高甘油三酯两者均高1000例高脂血症患者血脂类型分布第54页,共133页。常见的统计学错误描
22、述性分析中常见的错误计量资料:误用正态分布的描述性统计指标描述呈偏态或几何分布的资料。计数资料:错误的将构成比当做率使用 错误的计算平均率 计算相对数时分母过小第55页,共133页。第三节 资料的推断性统计分析一、统计推断的方法 单因素分析 多因素分析二、资料的重复性评价三、研究结果的解释第56页,共133页。一、统计推断统计推断: 利用样本所提供的信息对总体进行估计或推断,主要包括参数估计:利用样本指标估计总体参数。常用点估计和区间估计,如均数的可信区间、率的可信区间假设检验:利用样本提供的信息比较两个或多个总体之间有无差别,如t检验、2检验等第57页,共133页。资料的分析方法:1.比较性
23、研究的数据分析2.关联性研究的数据分析第58页,共133页。1.比较性研究的数据分析(1)标准比较法(2)两两比较法(3)多组比较法第59页,共133页。(1)标准比较法标准比较法,即把研究对象的某一特征与公认的,或者正式颁布的标准进行比较,即样本与总体的比较。比如,空气、水、食物中有害物质的浓度是否超过标准;某个人群的身高体重是否与一般人群不同等。第60页,共133页。偏态分布用秩和检验第61页,共133页。(2)两两比较法第62页,共133页。对于计数资料,当样本含量n较大,样本率P与(1-p)均不太小时,样本率的分布近似正态分布。可用u检验。当不满足u检验的条件时,若样本含量大于等于40
24、,并且理论频数大于5时,可用卡方检验,若1T5,采用校正卡方检验,若n40或T1,用精确概率法两组构成比比较,用行乘列卡方检验。等级资料比较用秩和检验。第63页,共133页。案例:刘永有等人对吸毒患者进行心理干预,比较了干预前后的焦虑状况自评(SAS),见表8-6。从表中可以看出干预前两组的焦虑得分平均值差别无统计学意义,干预后与干预前后的差值的差别均有统计学意义。第64页,共133页。第65页,共133页。(3)多组比较法根据研究需要,有时要求同时比较某个变量在多个组之间的差异。如比较某种药物对多个不同群体的疗效。第66页,共133页。对于计量资料,若为完全随机设计,当任何观察值都是独立地来
25、自具有等方差的正态总体,采用完全随机设计的单因素方差分析; 若为随机区组设计,则采用随机区组设计的方差分析。 需要进行多个样本均数间的两两比较,常用的方法有LSD-t检验、Dunnett-t检验、SNK-q检验等。 若不满足以上条件,则需要考虑非参数方法。第67页,共133页。对于分类变量资料多组率或构成比的比较,可采用2K表或RC表的卡方检验资料的卡方检验,单应注意理论数小于1的格子数不能超过1/5,否则应采取增加样本含量等措施。第68页,共133页。案例:刘永有等人研究吸毒组与正常对照组之间职业构成的比较,表8-7。第69页,共133页。第70页,共133页。2.关联性研究的数据分析确定事
26、物间的关系,定量表述事物间关系的方向、大小或强弱。如分析儿童的年龄与身高之间的关联性,吸烟与肺癌之间因果关系。第71页,共133页。对于计量资料,两个变量或因变量服从正态分布,研究一个自变量对一个应变量影响的数量依存关系则用直线回归分析方法,计算回归系数与截距,建立回归方程并进行显著性检验; 若通过绘制散点图发现两者的关系不呈直线关系,可考虑进行数据变换拟合非线性回归。第72页,共133页。若需要说明变量间的直线相关关系,两个变量均服从正态分布,则用相关分析,计算Pearson相关系数,并检验相关系数的显著性;非正态双变量资料,可进行等级相关分析,计算Spearman等级相关系数与假设检验。第
27、73页,共133页。分类资料采用卡方检验,双向无序多项分类资料(RC表),除了采用卡方检验推测有无关联,还可以利用卡方值计算Pearson列联相关系数反映关联密切程度;等级资料,采用Spearman等级相关或Kendall等级相关分析;有序分组资料可采用线性趋势检验。第74页,共133页。案例:马小玲等人研究了2006年5月广州市某区的PM2.5(可吸入颗粒物浓度)与同期门诊病人关系,建立了非线性回归模型,见表8-8。从中可以看出病人数与PM2.5的关联程度较强。第75页,共133页。表8-8 2006年1-4月各类门诊病人数与PM2.5关系的非线性回归模型第76页,共133页。一、资料的组间
28、均衡性检验各种分析性研究的结论往往是从组间比较中得出的。只有当各比较组人群之间研究因素以外的各种与研究结果有关的因素在组间都均衡可比时,所得研究因素在组间有无差异的结论才有说服力。第77页,共133页。一、资料的组间均衡性检验常需对某些特征(一般多为主要的混杂因素,如平均年龄、性别构成、病情构成等)进行比较组间的均衡性检验(差异显著性检验)。通常,单因素显著性检验方法即可满足均衡性检验的需要。把这些统计学方法用在流行病学研究中第78页,共133页。第79页,共133页。案例:某研究者对某种违法行为的人进行预防复发的干预试验,评价研究结果时,首先对试验组和对照组的人口学特征进行比较(见表8-4)
29、。从表8-4中可以清楚地看到试验组和对照组的性别构成、平均年龄和婚姻构成方面是均衡可比的。第80页,共133页。表8-4 试验组与对照组人口学特征比较第81页,共133页。二、单因素分析寻找相关因素,如某种疾病或现象的发生是否与性别、年龄、职业等因素有关?临床试验中,在组间均衡可比的前提下将试验组和对照组的统计指标进行单因素分析可判断试验效应是否由于试验因素所致。常常采用多因素分析方法来分析各种因素的作用大小。第82页,共133页。二、单因素分析通常先将所有变量做单因素分析,筛出可能的影响因素(P值小于某个界值的变量)纳入多因素分析。此时的单因素分析不要求比较组间的均衡,因为混杂因素的干扰可在
30、多因素分析中被排除,但要求放宽纳入变量的多因素分析标准,如规定P值小于0.10者可进入多因素分析,以防范负混杂的干扰。第83页,共133页。案例:何倩等人对某市大学生毒品尝试情况进行了调查,进行单因素分析,寻找尝试毒品的可能相关因素,见表8-5。从单因素分析表中可以看出性别、年龄、身体健康状况、睡眠状况等都可能与毒品尝试有关系。但是还需要进行多因素分析以判定在排除了其它因素的影响外,哪些因素仍然与毒品尝试有关系。第84页,共133页。不同的影响因素下大学生毒品尝试率及其单因素分析结果第85页,共133页。单因素分析主要了解因素与结果之间有无统计学关联,并确定关联强度的大小。计算关联强度指标,如
31、相关系数、回归系数等;病例对照研究计算比值比(OR),队列研究计算相对危险度(RR)、和归因危险度(AR)等,计算可信区间和进行差异显著性检验。等级资料,可对暴露效应随暴露级别的变化而变动的趋势做趋势性检验。第86页,共133页。三、多因素分析多因素分析可一次观察多个变量分别与因变量之间的独立关系以及变量之间的交互作用。 以多因素分析方法控制各种影响因素的作用,完成资料的统计分析。该类分析方法多种多样,具体使用时一定要根据资料的特点、研究目的来选择适当的方法。第87页,共133页。1.研究多个变量之间的相互关系多元相关分析:多个自变量与一个因变量的相关关系;计算复相关系数和偏相关系数并进行假设
32、检验。典型相关分析:一组自变量(体质指标)与一组因变量(体能指标)之间的关系。第88页,共133页。2.研究多个变量之间的依存关系第89页,共133页。3.研究多个变量的内在结构对于涉及到多因素的医学研究,常常需要了解所研究的多个变量之间的内在联系。通过变量内在结构的分析,就可以把这些变量依据它们内在的关系,客观地归纳为若干类。第90页,共133页。并估计潜在因子对可测变量的影响程度以及潜在因子之间的关联性时,例如研究家庭环境、社会环境和学校环境对儿童智商的发育影响时,可以用因子分析;将样本个体或指标变量按其具有的特性进行分类的研究,可以用聚类分析。第91页,共133页。4.研究变量之间的关系
33、网事物的特征通过不同的变量体现出来。因此客观事物之间的关系就体现为多变量之间的、无比复杂的网状关系。对于这类分析,可以借用路径分析方法和结构方程分析方法。第92页,共133页。典型错误统计推断中常见的统计学错误计量资料:忽视了t检验的使用条件多个样本均数比较时错误的使用了t检验误用t检验分析重复测量设计资料第93页,共133页。计数资料错误的选择了四格表卡方检验方法-未选用fisher精确检验法:n40,或理论频数1错误选择了四格表卡方检验方法-未选用配对卡方检验,某研究者用反向血凝法和elisa法分别对230份乙肝病人的血液标本进行检测,反向血凝法检测得55份样本呈阳性结果,elisa法检测
34、得到45份标本为阳性结果。第94页,共133页。错误分析等级变量资料忽视了内部构成对两个或多个总率比较的影响第95页,共133页。相关与回归分析常见错误经样本求得的相关、回归系数要做假设检验判断两变量线性关系的密切程度要看r2的大小两事物间有数量关系,可能是因果关系,也可能不存在因果关系,而仅仅是伴随关系。例如,调查某地区的电视机拥有量和肺癌死亡率,这些年来,每百家庭的电视机拥有量在不断增加,该地区的肺癌死亡率也在不断上升,两者在数量上是相关的,但看电视不见得是肺癌发病的原因。第96页,共133页。多因素分析时常见的错误多因素分析中常见的错误就是选用方法不当,如多元线性回归要求因变量呈正态分布
35、,如果不符合正态分布则要用对数等方法进行转换以使符合或接近正态分布。而二分类变量要选用logistic回归,如果因变量受时间的影响,则要考虑用cox回归。再者在多元线性回归因素分析中,自变量高度相关时,应考虑多重共线性的问题。第97页,共133页。四、资料的重复性评价计数资料可计算两次调查结果的符合率或Kappa值,上述数值愈大表示一致性越好。一般认为Kappa值在0.40.75时为有中、高度一致,大于0.75时为有极好的一致性。计量资料,则可用相关系数表示两次调查结果的符合程度。相关系数越大,一致性越好。第98页,共133页。五、研究结果的解释P值(P value) 检验假设中的一个概率,它
36、只能解释该统计分析结果支持无效假设成立的概率有多大P值越小,推翻无效假设的概率就越大,即接受备择假设的概率就越大第99页,共133页。无论在哪个水平上接受无效假设( nullhypothesis) 还是备择假设( alternativehypothesis),都意味着要犯第一类错误(type error)或第二类错误(type error)的风险。犯上述错误的概率,用a和b表示。也就是说,在a0.05水平上认为某治疗方法有效的同时,该疗法还有5的可能是无效的。第100页,共133页。某人在北京郊区调查居民被狗咬伤的情况,结果显示:各年龄组中被狗咬伤的百分率是不同的,即:年龄由小到大,被狗咬伤饿
37、百分率依次为:很小、较小、较大、很大、较大、较小、很小、较大。原作者的一个惊人的发现是:年龄与百分率之间的相关系数r=0.9956,p0.0001,因此拟合的直线回归方程也是有非常统计学意义的。故原作者认为:在所调查的市郊,被狗咬者的年龄与被狗咬伤的百分率之间有很好的线性关系,可用此直线回归方程来预测该地任何一位居民被狗咬伤的概率,以便提醒人们外出时携带必要的防身器械,要加倍小心,尽可能减少被狗咬的机会。第101页,共133页。第四节资料的表达一、恰当选择统计图和统计表二、论文撰写第102页,共133页。一、恰当选择统计图和统计表统计图(statistical chart)是将统计资料以几何图
38、形形象化的表述,常以点的位置、线段的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系,但表达比较粗略,常附相应的统计表。统计表(statistical table)则能客观、准确、全面、简捷地表达具体数据。统计图、表的有机结合可使文章简明易读、图文并茂,使读者印象清晰。第103页,共133页。统计表表格是用数字来代替复杂的文字叙述统计表的结构611843合计321418甲硝唑29425替硝唑合计未愈治愈分组表1不同药物治疗急性冠周炎效果比较标题纵标目横标目表值顶线分隔线底线第104页,共133页。统计表种类简单表:只按单一变量分组组合表:将两个或两个以上变量组合起来分组611843合
39、计321418甲硝唑29425替硝唑合计未愈治愈分组表1不同药物治疗急性冠周炎效果比较药物甲医院乙医院总计有效元效合计有效元效合计A40105042850100B351550331750100全计75251007525100200第105页,共133页。列表原则和基本要求标题:概括说明表的内容,包括表的编号。标题应位于统计表的最上部标目:分为纵标目与横标目。纵标目标示相应一列(或数列)的内容;横标目标示相应行的内容;文字简明,有单位的标目要注明单位线条:不宜过多,不允许使用竖线与斜线。表格上下用粗线,两端不封口,横线不超过四条数字:一律用阿拉伯数字表示,同一指标的小数位数应一致,位次对齐,表内
40、数字不宜留空格,可用“或”表示注释:一律列在表的下方,可用“ * ”号等表示第106页,共133页。表11.5 两个治疗组对比并发症西药组中西药结合组例数结果例数结果良好死亡良好死亡休克136710100表11.5 西药与中西药结合治疗急性心肌梗死并发休克患者的疗效比较治疗组患者倒数治疗结果良好死亡西药组中西药结合组131061070第107页,共133页。统计图用形象化的资料补充文字之不足制图原则:按资料的性质和分析目的,正确选择图形标题:位于图正下方,扼要说明资料的内容条图、散点图、线图和直方图都有纵轴与横轴,每个坐标均有标目名称和单位纵、横坐标比例应适当,以5:7为佳比较不同事物时,用不
41、同的线条或颜色表示,要附图例说明。第108页,共133页。 各种图形的选择及应用 类型 资料的性质 目 的 线图 连续性 观察升降趋势 条图 间断性 观察大小高低 构成图(圆饼图) 整体性 观察构成比例 直方图(点状图) 连续性 观察分布状态 相关图 相关性 观察变量相互关系第109页,共133页。线图(line graph)常用于研究某一事物的反应,有连续性,随时间的进展呈动态性变化累积病死率()追踪年限(年)图31-1 两组高血压病患者5年累积病死率第110页,共133页。条图(bar graph)常用于表示某种(些)独立事物的发生率,及其互相比较脑卒中发病率()DBP (mmHg)图31
42、-2 两组患者不同的舒张压水平5年累计脑卒中发病率第111页,共133页。圆饼图(circle graph)用于表示全体中各部分的比重1200例高脂血症患者血脂类型分布第112页,共133页。直方图(histogram)用于表示连续变量的频数分布,以横轴表示被观察现象,纵轴表示频数或频率 110名7岁儿童身高频数分布0510152025111113115117119121123125127129131133135身高(cm)人数(频数)第113页,共133页。相关图发硒(1000ppm)5.14 某克山病区10名健康儿童发硒与血硒含量的散点图血硒(1000ppm)468101214160506
43、0708090100110120第114页,共133页。(5)统计地图:表示疾病的地理分布第115页,共133页。二、论文撰写(一) 科技论文的基本要求(二) 科技论文的结构及要求第116页,共133页。(一) 科技论文的基本要求1.科学性2.创新性3.逻辑性4.可读性5.规范性第117页,共133页。1.科学性科技论文需要合理的设计、真实的数据、可靠的方法,不能凭主观臆断或个人好恶随意取舍素材或得出结论。论文中提出的论点应是将充足、可靠和精确的数据进行逻辑推理而得出的科学观点。对研究成果的价值也应做出实事求是的评价。第118页,共133页。2.创新性Science认为,创新是指,对自然或理论
44、提出新见解,而不是对已有研究结论的再次论证,内容激动人心并富有启发性,具有广泛的科学兴趣。 科技论文应具有完全创新性或部分创新性。创新性的含义是:探求新理论、新论点、新解释;观察新现象;研究新材料、新工艺、新方法,也包含在现有水平上对研究方法的订正、改进等。第119页,共133页。3.逻辑性一篇好的论文,除了要有好的研究成果外,还应该概念明确、判断恰当、推理严谨。论文内容不需要包含所有研究工作细节及研究数据,只需列举必要而充分的数据或证据即可。表述的内容是否充分、恰当,以是否符合科学性和逻辑性为准。只有这样,方可使文章主题突出、脉络清晰。第120页,共133页。4.可读性写科技文章要用书面语言
45、,不要用口头语、地方话和带有感情色彩的词语。一篇好的科技文章应该文字简洁通顺、层次分明、前后呼应、用词准确、符合语法和修饰的要求。科技论文的篇幅,一般在25003500字左右。论文的篇幅不是越长越好,也不是越短越好。总的要求是,用尽可能少的篇幅,表达尽可能多的内容。第121页,共133页。5.规范性科技论文中的术语、缩写、符号等均应符合国家或行业的规定标准。如计算单位要按照GB31003120-93量和单位的规定表示;缩略语代表的术语全称应在前言中首次出现时写出并注明缩略语;简化字应以新华字典为准。第122页,共133页。(二)科技论文的结构及要求国内外的生物医学期刊,基本上都按“温哥华格式”
46、书写。该格式主要包括:文题作者摘要关键词引言材料与方法结果讨论总结致谢参考文献等部分。 第123页,共133页。1、文题:要求不超过20个汉字(最多30个),用一句话写完。标题太长可以加一个副标题,文题应包括文章的主要关键词,不应有标点,尽可能回避缩写、商品名等不常用的词。文题能反映出文章的特定内容和主题。2、署名:原则上不超过五名,以担负工作的多少及实际贡献大小为序,不以职位高低为序。要用真实姓名,并标上作者单位和邮编;参与论文内容构思、研究、撰稿、答辩等工作人员均可以署名。第124页,共133页。3、摘要:内容包括:目的、方法、结果、结论。A、一般要求150250个汉字,也可以适当多些。B、目的:为什么要作本研究C、方法:研究对象,观察、治疗、护理、统计等D、结果:研
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四年级心理健康实践活动计划
- 四年级数学实验教学计划
- 护士长思想教育
- 2025年春季五年级下册语文家长沟通计划
- 颅脑损伤的急救护理
- 徐州5号线施工方案
- 建筑行业施工安全与环保措施
- 中班健康我会刷牙
- 物流行业质量、安全、环保措施
- 雨季施工工地排水措施
- 导尿管相关尿路感染预防与控制技术指南-3
- 物联网设备安装与调试项目实训-课件全套-项目1-7-安装照明装置-安装智能家居安防监控系统
- DB11T 1905-2021 大型群众性活动消防安全规范
- T∕CACE 0118-2024 改性磷石膏混合料道路稳定基层应用技术规程
- 教师个人嘉奖主要事迹材料500字(31篇)
- 暖通空调工程施工组织设计方案
- 幼儿园 小班音乐《森林音乐会》原版有声动态课件
- 个人外汇管理办法实施问答(一二三四期)
- 【财务报表分析论文:美的集团财务报表分析6400字】
- 基金基础知识考试题库100道及答案
- 妇产科学妊娠合并糖尿病课件
评论
0/150
提交评论