医学论文中的常见统计学错误专家讲座_第1页
医学论文中的常见统计学错误专家讲座_第2页
医学论文中的常见统计学错误专家讲座_第3页
医学论文中的常见统计学错误专家讲座_第4页
医学论文中的常见统计学错误专家讲座_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正确统计学方法必须贯通于从课题统计设计到论文撰写全过程。医学论文中的常见统计学错误专家讲座第1页

不论是试验室研究、临床研究还是现场调查,其数据归纳整理,都要列成一定标准格式,方便于进行计算机录入及统计分析。其基本要求为: 1.横为统计,纵为变量 2.对每个变量要起适当变量名 3.对分类变量中用字符表示取值在进行计算机录入时必须按照一定规矩将其转换为数值。医学论文中的常见统计学错误专家讲座第2页序号性别年纪职业治疗分组收缩压

(mmHg)舒张压

(mmHg)心电图疗效001男23工人A156120…有效002男32农民B13289…显效表1 高血压患者治疗2周后效果医学论文中的常见统计学错误专家讲座第3页序号ID性别年纪民族婚姻情况。。。。。。当前吸烟情况吸烟量(支/日)。。。0011101男23汉未婚。。。。。不吸——。。。0021102男32汉已婚。。。。。吸12。。。表2 人群危险原因调查数据格式医学论文中的常见统计学错误专家讲座第4页从统计学角度,我们并不关心数据是来自临床还是试验室还是现场,我们首先关心是:1.数据中那些属于研究者所关心“产出”?即所谓因变量/反应变量?这些往往是研究者研究设计假设中产出。2.这些数据属性:是定性还是定量资料。确定了所关心研究产出后,其它变量就都能够解释为是这类变量属性。研究者要做工作是:分析这些产出基本情况研究这些属性是否对于他所关心产出存在关联,或叫有影响。这就是统计几件基本工作:定水平,作比较,找关系。医学论文中的常见统计学错误专家讲座第5页一、计数资料分析中常见错误举例率与组成比某研究想了解筛查与自查相比发觉肝癌病例分期是否存在差异,是否筛查更能发觉早期肝癌病人。医学论文中的常见统计学错误专家讲座第6页一、计数资料分析中常见错误举例率与组成比(续)医学论文中的常见统计学错误专家讲座第7页一、计数资料分析中错误举例2.样本量/阳性例数较少时统计分析某地域乙肝表面抗原阳性率5.041783531累计5.8585145315-4.8260124510-4.20253215-5.755874-2.272253-4.264562-2.942381-阳性率(%)阳性人数样本人数年纪别医学论文中的常见统计学错误专家讲座第8页医学论文中的常见统计学错误专家讲座第9页年纪组样本量阳性数阳性率(%)1-16910.595-29272.4010-248135.2415-130118.46某市乙肝表面抗原检测结果医学论文中的常见统计学错误专家讲座第10页年纪组东城西城南城北城1-3.030.000.000.005-0.007.144.763.0810-2.380.004.556.7815-0.0018.189.520.00某市各区乙肝表面抗原阳性率(%)医学论文中的常见统计学错误专家讲座第11页一、计数资料分析中错误举例3.普通χ2检验只能得到总是否存在差异结论。月份样本量阳性人数阳性率(%)311114036.0424915321.351673148.46146385.5762323.28521815.4913617.4某病不一样月份检出率Χ2=58.16P<0.0000医学论文中的常见统计学错误专家讲座第12页一、计数资料分析中错误举例类似这么错误不但存在于计数资料统计分析中,经常还发觉于Logistic回归结果分析中。不一样职业对于某种职业肿瘤危险度分析3.24丁0.58丙2.31乙1甲OR职业类型医学论文中的常见统计学错误专家讲座第13页二、统计图表错误使用1.统计表误用:

主要是不符合主谓语要求。 在统计表中,要突出研究者所要分析指标,要将其准确描述清楚,比如在不一样条件下该指标改变、差异等。 所以普通,要将不一样条件作为主语,指标作为谓语。 统计制表要符合主谓语标准。医学论文中的常见统计学错误专家讲座第14页统计表正确表示格式组别指标1指标2指标3指标4甲乙丙丁

医学论文中的常见统计学错误专家讲座第15页主谓语颠倒例子医学论文中的常见统计学错误专家讲座第16页正确表示方式医学论文中的常见统计学错误专家讲座第17页二、统计图表错误使用2.统计图误用: 1)线图误用:线图只能用于描述某个指标(如吸烟率)随定量指标(如时间、身高)发生改变情况。而不能用来描述某个指标(如吸烟率)在某个定性/分类指标不一样取值/分类(如地域)之间差异。因为分类指标中各个分类值之间没有大小关系。 2)图滥用:在PPT中用图比较清楚,而在论文中除非表示趋势,普通不提议用图。医学论文中的常见统计学错误专家讲座第18页二、统计图表错误使用错误横坐标表示 正确横坐标表示医学论文中的常见统计学错误专家讲座第19页三、Logistic回归中主要统计学错误哑变量设置中错误比数比与相对危险度关系用哑变量表示自变量各个水平之间比数比预计比数比与相对危险度正确解释(原因之间作用大小比较)医学论文中的常见统计学错误专家讲座第20页三、Logistic回归中主要统计学错误哑变量设置中错误下例是一个相关分类变量赋值例子:

某个吸烟调查中一些自变量意义及赋值—————————————————————————————————————变量名 变量意义 变量可能取值 研究者对变量赋值—————————————————————————————————————A假如想要烟,你认为 非常轻易; 1你能轻易得到吗? 有点轻易; 2 有点困难; 3 非常困难。 4B在过去一个月里, 没有看到过; 1你是否在电视里看到 看到过,是关于反对吸烟; 2过相关吸烟任何内容?看到过,是关于赞成吸烟; 3 看到过,反对与赞成都有。 4C你祖母是否吸烟? 不吸; 1 不知道; 2 吸烟。 3—————————————————————————————————————医学论文中的常见统计学错误专家讲座第21页三、Logistic回归中主要统计学错误哑变量设置中错误:存在主要问题剖析:变量A、B、C均为分类变量,而分类变量各个分类值之间是没有大小。处理方法:设置哑变量。 用哑变量表示变量B取值可能—————————————————————————————可能回答 B1 B2 B3—————————————————————————————没有看到过 0 0 0看到过,是关于反对吸烟 1 0 0看到过,是关于赞成吸烟 0 1 0看到过,反对与赞成都有 0 0 1—————————————————————————————医学论文中的常见统计学错误专家讲座第22页三、Logistic回归中主要统计学错误2.比数比与相对危险度关系:队列研究中暴露与患病关系—————————————————————————————

暴露情况 患病情况 累计————————————— 患病 未得病—————————————————————————————

暴露组

a b a+b未暴露组

c d c+d—————————————————————累计

a+c b+d a+b+c+d—————————————————————————————医学论文中的常见统计学错误专家讲座第23页三、Logistic回归中主要统计学错误2.比数比与相对危险度关系:相对危险度: RR={a÷(a+b)}/{c÷(c+d)} =a(c+d)/{c(a+b)}比数比: OR= {[a÷(a+b)]/[b÷(a+b)]}/{[c÷(c+d)]/[d÷(c+d)]} =(ad)/(bc)当, a<<(a+b),c<<(c+d)时,能够有 a÷(a+b)≈a÷b 及 c÷(c+d)≈c÷d此时,才能够有:RR≈OR所以要分析什么时候存在这种关系,什么时候不存在。医学论文中的常见统计学错误专家讲座第24页三、Logistic回归中主要统计学错误3.用哑变量表示自变量各个水平之间比数比预计假设在研究吸烟与一些原因关系时,拟合了以下形式Logistic回归方程:Logit(P|y=1)=b0+b1B1+b2B2+b3B3+b4(SEX)+b5(AGE)y=1为吸烟,y=0为不吸烟。AGE为年纪(岁)。SEX为性别,SEX=1为男性,SEX=0为女性。B1,B2,B3定义同前。b0为截距,b1-b5分别为各自变量偏回归系数。医学论文中的常见统计学错误专家讲座第25页三、Logistic回归中主要统计学错误3.用哑变量表示自变量各个水平之间比数比预计我们研究构想是比较看到过烟草广告不一样情况对于吸烟影响。进行比较指标是OR。所以要预计不一样情况下OR大小。自变量第一个水平,B1=0,B2=0,B3=0,其比数为:P0/(1-P0)=exp[b0+b4(SEX)+b5(AGE)]。第二水平:B1=1,B2=0,B3=0,P2/(1-P2)=exp[b0+b1+b4(SEX)+b5(AGE)]。第三水平:B1=0,B2=1,B3=0,P3/(1-P3)=exp[b0+b2+b4(SEX)+b5(AGE)]。第四水平:B1=0,B2=0,B3=1,P4/(1-P4)=exp[b0+b3+b4(SEX)+b5(AGE)]。医学论文中的常见统计学错误专家讲座第26页三、Logistic回归中主要统计学错误3.用哑变量表示自变量各个水平之间比数比预计自变量第二水平(看到过关于反对吸烟广告组)与对照组(没有看到过任何吸烟广告组)OR为:OR(二水平:一水平)=exp[b0+b1+b4(SEX)+b5(AGE)]/exp[b0+b4(SEX)+b5(AGE)]=exp(b1)。其它各组与对照组OR能够仿照计算。即,OR(三水平:一水平)=exp(b2),OR(四水平:一水平)=exp(b3)。医学论文中的常见统计学错误专家讲座第27页三、Logistic回归中主要统计学错误3.用哑变量表示自变量各个水平之间比数比预计设置为哑变量后各水平之间比数比—————————————————————————————————————变量水平一水平二水平 三水平 四水平—————————————————————————————————————对照(一水平) 1 exp(-b1) exp(-b2)exp(-b3)二水平 exp(b1)

1

exp(b1-b2)exp(b1-b3)三水平 exp(b2)

exp(b2-b1)

1

exp(b2-b3)四水平 exp(b3)

exp(b3-b1)

exp(b3-b2)

1—————————————————————————————————————医学论文中的常见统计学错误专家讲座第28页三、Logistic回归中主要统计学错误3.用哑变量表示自变量各个水平之间比数比预计设置为哑变量后各水平之间比数比—————————————————————————————————————变量水平一水平二水平 三水平 四水平—————————————————————————————————————对照(一水平) 1 1.56 3.56 0.86二水平 0.64

1

0.441.81三水平 0.28

2.28 14.14四水平 1.16

0.55 0.24 1—————————————————————————————————————医学论文中的常见统计学错误专家讲座第29页三、Logistic回归中主要统计学错误4.比数比及相对危险度正确解释某文件在研究影响妇女产前检验可能原因时,拟合了一个Logistic回归模型。在进行分析后,认为‘因为量纲相同’,能够由回归系数绝对值‘直接判定’它们与产前检验关联强弱。其结论为:孕产期卫生知识〉妇女文化程度〉妇女年纪〉丈夫文化程度〉丈夫职业〉家庭距卫生院距离。医学论文中的常见统计学错误专家讲座第30页三、Logistic回归中主要统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论