刘欣《医学统计学方法》12临床统计-6讲_第1页
刘欣《医学统计学方法》12临床统计-6讲_第2页
刘欣《医学统计学方法》12临床统计-6讲_第3页
刘欣《医学统计学方法》12临床统计-6讲_第4页
刘欣《医学统计学方法》12临床统计-6讲_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学主讲人刘欣流行病与卫生统计学教研室吉林大学公共卫生学院1整理课件ppt第十三章直线相关与回归吉林大学公共卫生学院2整理课件ppt第一节直线相关

一、直线相关的概念

直线相关(linearcorrelation)是描述两个变量间互依关系的一种统计分析方法。此法又称简单相关(simplecorrelation)。此法通过直线相关系数(linearcorrelationcoefficient)描述两个变量直线关系的大小和方向。此法要求两个变量服从双变量正态分布。吉林大学公共卫生学院3整理课件ppt

相关系数又称积差相关系数,也称Pearson相关系数,用r表示。它是说明具有直线关系的两个变量间,相关关系的密切程度和相关方向的指标。用r的大小表示密切程度,用r的正负表示相关方向。其计算公式为:吉林大学公共卫生学院4整理课件ppt图13-7a相关系数含义图吉林大学公共卫生学院5整理课件ppt图13-7b相关系数含义图吉林大学公共卫生学院6整理课件ppt公式(13-1)

相关系数无单位,其取值范围为-1≤r≤1。r值为正表示正相关,为负表示负相关,为零表示零相关。r=1为完全正相关,r=-1为完全负相关。

二、直线相关系数的计算吉林大学公共卫生学院7整理课件ppt吉林大学公共卫生学院8整理课件ppt

例研究者为探讨女性的年龄与收缩压的关系,收集了某地12名妇女的年龄与收缩压数据见下表13-1的(2)、(3)。根据妇女年龄与收缩压的数据计算二者的相关系数。

1.

先根据原始数据绘制散点图,大致判断两变量之间是否有直线趋势。本例的散点图见图13-1,可见年龄与收缩压呈直线趋势,故可进行直线相关分析。吉林大学公共卫生学院9整理课件ppt吉林大学公共卫生学院10整理课件ppt吉林大学公共卫生学院11整理课件ppt

2.

计算相关系数。由前面计算可知:lXX=1550.7,lYY=44.04,lXY=233.7,代入公式(13-1)得相关系数为:三、直线相关系数的假设检验

前面所求相关系数r是样本相关系数,它实为总体相关系数ρ

的估计值。我们知道即使X、Y的总体相关系数ρ为零,由于抽样误差的存在,样吉林大学公共卫生学院12整理课件ppt本相关系数r也不一定为零。因此需要对相关系数r进行假设检验,以此推断X、Y是否存在直线相关关系。常用t

检验,其检验统计量公式如下:

公式(13-3)

式中Sr

为样本相关系数的标准误,自由度ν=n-2。

就例1求得的r值,检验妇女年龄与收缩压间是否存在直线相关关系。吉林大学公共卫生学院13整理课件pptH0:ρ

=0即年龄与收缩压之间无直线相关关系H1:ρ≠0即年龄与收缩压之间有直线相关关系①检验假设α=0.05②计算检验统计量

本例n=12,r=0.8943,代入公式(12-3)求t。吉林大学公共卫生学院14整理课件ppt

由α=0.05,ν=n-2=12-2=10,查t界值表得tα,ν=t0.05,10=2.228,今求得t=6.32>2.228,则P<0.05,按α=0.05水准拒绝H0,可认为妇女年龄与收缩压之间有直线相关关系。③确定P值和作出推断结论吉林大学公共卫生学院15整理课件ppt一、直线回归的概念

直线回归(linearregression)是描述两个变量间依存数量关系的一种统计分析方法。此法又称简单回归(simpleregression)。此法通过直线回归方程(linearregressionequation)描述一个变量Y[常称为应变量(dependentvariable)]依存另一个变量X[常称为自变量(independentvariable)]

第二节直线回归吉林大学公共卫生学院16整理课件ppt变化的数量关系。由此方程可确定一条回归直线。二、直线回归方程的求法

线性回归方程的表达式为公式(13-4)

式中X为自变量,为应变量Y的估计值,a

为回归直线在Y轴上的截距(intercept),b为回归系数(regressioncoefficient),也即回归直线的斜率(slope)。根据数学上的最小二乘法的原理计算a和b。计算公式如下:吉林大学公共卫生学院17整理课件ppt公式(13-5)

式中lXX

和lXY分别表示离均差平方和与离均差积和。公式(13-6)

例1某研究者为探讨女性的年龄与收缩压的关系,收集了某地12名妇女的年龄与收缩压数据见下表13-1的(2)、(3)。试求年龄与收缩压的直线回归方程。

最小二乘法原理的含义是保证各实测点至直线的纵向距离的平方和最小

。吉林大学公共卫生学院18整理课件ppt吉林大学公共卫生学院19整理课件ppt

1.

先根据原始数据绘制散点图(scatterplot),大致判断两变量之间是否有直线趋势。本例的散点图见下图13-1,可见年龄与收缩压呈直线趋势,故可进行直线回归分析。吉林大学公共卫生学院20整理课件ppt

2.

计算∑X、∑Y、∑X2、∑Y2、∑XY

见表13-1中的(2)~(6)合计项。∑X=628,∑Y=224.4,∑X2=34416,∑Y2=4240.3,∑XY=11977.3

3.

计算和lXX、lYY、lXY

吉林大学公共卫生学院21整理课件ppt

4.

求回归系数b和截距a

按公式(12-5)求回归系数b,求截距a。

5.

列直线回归方程

为了直观分析或实际需要,可按求出的直线回归方程作图。在X的实测全距范围内任取相距较远且易读数的两个X值,代入方程得到两个Y值,吉林大学公共卫生学院22整理课件ppt以直线连接两点即得回归直线。本例可取X1=42,得Y1=17.14;取X2=72,得Y2=21.66。连接两点即得本资料的回归直线。见下图13-1a。吉林大学公共卫生学院23整理课件ppt三、回归系数的假设检验

我们知道即使X、Y的总体回归系数β为零,由于抽样误差的存在,样本回归系数b也不一定为零。因此需要对回归系数进行假设检验,以此推断X、Y是否存在直线关系。可用方差分析或t

检验。吉林大学公共卫生学院24整理课件ppt

检验统计量t的计算公式为:t检验公式(13-7)

例3对例1求得的回归系数进行t检验。

t检验的步骤如下:

式中Sb

为样本回归系数的标准误

。吉林大学公共卫生学院25整理课件pptH0:β=0即年龄与收缩压之间无直线关系H1:β≠0即年龄与收缩压之间有直线关系α=0.05前已算得lXX=1550.7,lYY=44.04,lXY=233.7,b=0.1507,代入公式得吉林大学公共卫生学院26整理课件ppt

由α=0.05,ν=n-2=12-2=10,查t界值表得tα,ν=t0.05,10=2.228,今求得t=6.32>2.228,则P<0.05,按α=0.05水准拒绝H0,可认为年龄与收缩压之间有直线关系。吉林大学公共卫生学院27整理课件ppt

四、直线回归方程的应用

1.描述两变量间的数量依存关系

2.利用回归方程进行预测

3.利用回归方程进行统计控制吉林大学公共卫生学院28整理课件ppt

五、应用回归分析时应注意的问题

1.两变量作直线回归分析时,要求应变量Y服从正态分布,通常自变量X为可以精确测量或严格控制的因素。

2.作回归分析时要有实际意义,不能把毫无关联的两事物或现象进行回归分析。

3.在进行回归分析前,应绘制散点图。

4.回归方程适用范围一般以自变量X实际取值范围为限,不能任意外推。吉林大学公共卫生学院29整理课件ppt

第三节直线相关与回归的区别和联系吉林大学公共卫生学院30整理课件ppt

回归与相关是两个既有区别又有联系的统计分析方法,若研究目的是想定量地描述两个变量间的依存关系,常用来由一个变量的数值去推算另一个变量的数值,则应作回归分析;若目的是想定量地描述两个变量间互依关系的密切程度和方向,则应作相关分析。㈠区别

1.

资料要求不同

回归要求应变量Y服从正态分布,X是可精确测量或严格控制的变量,一般称I型回归。相关要求两个变量服从双变量正吉林大学公共卫生学院31整理课件ppt态分布,此时若作回归分析,称II型回归。

2.在应用上不同

回归用来描述两个变量间的依存关系,相关用来描述两个变量间的互依关系。㈡联系

1.

符号相同

对一组数据若同时计算r与b,

它们的正负号相同。r为正说明两个变量间的相互关系是同向变化的;b为正说明X增(减)一个单位,Y平均增(减)b个单位。吉林大学公共卫生学院32整理课件ppt

2.

假设检验等价

对同一样本,样本回归系数b的t检验与样本相关系数r的t检验的t值相等,即tb

=tr

。由于b的假设检验较繁,故在实际应用中常用r的t检验代替。

3.

用回归解释相关

r的平方称为决定系数(coefficientofdetermination)吉林大学公共卫生学院33整理课件ppt

接近1,则回归效果越好。

上式说明当SS总固定不变时,回归平方和SS回的大小决定了r2的大小。SS回越接近SS总,则r2越吉林大学公共卫生学院34整理课件ppt第十四章统计表与统计图

统计表与统计图是统计描述的重要方法,是对比、分析事物的重要工具。在科技报告或论文中,常把统计数据或统计指标用表格的形式列出,称为统计表(statisticaltable),它常用来集中、浓缩、简洁地概括说明某类被研究事物,代替冗长、单调的文字叙述,并能够鲜明、清晰地表达该事物,便于进一步比较和计算。吉林大学公共卫生学院35整理课件ppt

第一节统计表

统计图(statisticalchart)是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料的一种方法,它可以把资料的变化趋势、分布特征、数据之间的关联等,以形象直观的方式表现出来。统计图容易理解,能醒目地给读者留下深刻印象。缺点是不能精确地表达数字的大小,故常与统计表一同使用,以达到相辅相成的效果。吉林大学公共卫生学院36整理课件ppt

一、统计表的基本结构

统计表主要由标题、表线、标目和数字组成。其结构如下图所示:标题表号纵标目横标目数字合计顶线分隔线合计线底线吉林大学公共卫生学院37整理课件ppt

统计表分为简单统计表和复合统计表两种。以下是论文和科技报告中常见的统计表的式样,其中表1是简单表,表2、表3和表4是复合表。

二、统计表的种类吉林大学公共卫生学院38整理课件ppt吉林大学公共卫生学院39整理课件ppt吉林大学公共卫生学院40整理课件ppt

三、编制统计表的注意事项制作统计表总的原则:重点突出,简单实用;逻辑合理,条理清晰。即一个统计表最好只包含一个中心内容,不要面面俱到;纵、横标目的安排既要符合专业要求,又要逻辑分明。针对统计表的各组成部分,具体的制表基本要求如下:㈠标题

用简明扼要的文字说明表的中心内容;必要吉林大学公共卫生学院41整理课件ppt时写明时间和地点;标题写在表体的上端中部。注意标题不要过长,也不要太简略,更不要不写。㈡表号

一般标于标题的前部,与标题以空格相隔;若文中有多个表,以数字编号表示,如“表1”、“表2”、“表12-1”、“表5.4”等;若文中只有一个表,用“附表”表示。㈢表线

表线有顶线、分隔线、合计线、底线等;顶吉林大学公共卫生学院42整理课件ppt线和底线一般用粗线,其余用细线;表线只能用横线,不能用竖线,也不能用斜线;表线不宜过多。最基本的统计表一般为三线表、四线表。㈣纵标目

常用精炼的文字或术语写明各项指标或某种分类;位于表的上部;有单位的指标要注明单位,如“体重(kg)”、“死亡率(%)”等;纵标目上可以再列总标目,二者用一短线分隔。注意标目不宜过多;纵标目不宜划分过多层次。吉林大学公共卫生学院43整理课件ppt㈤横标目

常为被研究或要说明的事物名称;位于表的左中部;横标目上部常列事物的性质或类别,如“类型”、“年份”、“组别”等;横标目下部可列合计项;合计与横标目之间一般不用短线分隔。㈥数字

表内数字一律采用阿拉伯数字;同一指标的数字应该数位对齐,小数位数要一致;数字不标明单位;表内不宜有空项。如遇数据缺失、不详吉林大学公共卫生学院44整理课件ppt或未记录时,可用“…”表示,不该有数字处可用“—”表示。数字是“0”均填“0”。数字应位于所属纵标目的正下方,横标目的右侧同一行;合计数字与分数据之间可用短线分隔。㈦备注

当表中有某个对象需附加或特殊说明时,可先在该对象的右上角用“*”或其它特殊符号标示,再在表的底线下面左侧用该符号引导写出具体内容。吉林大学公共卫生学院45整理课件ppt

统计图是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料的一种方法,它可以把资料的变化趋势、分布特征、数据之间的关联等,以形象直观的方式表现出来。统计图容易理解,能醒目地给读者留下深刻印象。常用的统计图有条图、百分条图、圆图、线图、半对数线图、散点图、直方图、统计地图等。

第二节统计图吉林大学公共卫生学院46整理课件ppt

一、绘制统计图的基本要求统计图与统计表不同,统计表没有固定的模式,需要根据分析目的和资料特点去设计和制作,灵活性强;而统计图有固定的类型和模式,需要按每种统计图的要求去绘制,但在制作每种统计图时,要注意以下几项基本要求:

1.

按资料的性质和分析目的选用适当的统计图统计图选择的不合理将达不到分析的目的,可能会得到与预期目的相反的效果。掌握和熟悉每种统计图的特点有利于正确选择合理的统计图。吉林大学公共卫生学院47整理课件ppt

2.

每个统计图要有标题用简明扼要的文字说明图的中心内容,必要时写明时间和地点;标题常写在图体的下端中部。

3.

纵、横标目分别代表分析指标和分析事物有单位的标目要注明单位,标目常写在坐标轴的外侧中部。

4.条图、线图、半对数线图、散点图、直方图都有纵、横坐标轴坐标轴要注明尺度,纵轴尺度自下而上,横轴尺度自左而右,数量都从小到大,并等距标明。条图与直方图的纵坐标必须从0开始,并标明0点。统计图的纵、横轴比例一吉林大学公共卫生学院48整理课件ppt㈠条图条图(barchart)用等宽直条的长短来表示相般为5:7,即黄金分割(goldensection)的近似值(0.6180339…)。

5.

比较不同事物时,应选用不同的图案或颜色区别表示,并附图例(legend)说明图例放置的位置以不影响图的主要内容为前提,可放在图的空隙处。

二、常用的统计图吉林大学公共卫生学院49整理课件ppt互独立的各指标的数值大小。有单式和复式条图两种。单式条图的样例见图14-1,图14-10;复式条图的样例见图14-2,图14-11。吉林大学公共卫生学院50整理课件ppt吉林大学公共卫生学院51整理课件ppt资料来源见表14-1。吉林大学公共卫生学院52整理课件ppt资料来源见表14-10。吉林大学公共卫生学院53整理课件ppt吉林大学公共卫生学院54整理课件ppt资料来源见表14-3。吉林大学公共卫生学院55整理课件ppt资料来源见表14-11。吉林大学公共卫生学院56整理课件ppt互独立的各指标的数值大小。有单式和复式条图两种。单式条图的样例见图14-1,图14-10;复式条图的样例见图14-2,图14-11。条图的绘制方法如下:①一般以横轴为基线,表示被研究的事物,纵轴表示研究指标。也可颠倒设置,样例见图14-10a。②表示指标数值的坐标尺度必须从0开始,一般为等间距,中间不能折断,否则会改变各直条长短的比例,使人产生错觉(见图14-12)。吉林大学公共卫生学院57整理课件ppt吉林大学公共卫生学院58整理课件ppt图14-12条图的纵轴尺度起点必须为0示意图吉林大学公共卫生学院59整理课件ppt㈡百分条图百分条图(percent

barchart)用一个长条的面③各直条间宽度应相等,间隙宽度也应一致,一般与直条的宽度相同或为直条宽度的一半。④为了便于对比,一般将被比较的指标按大小顺序排列。⑤复式条图每组内的直条间不留间隙,各直条应以不同的图案或颜色区别表示,并附图例说明。吉林大学公共卫生学院60整理课件ppt积代表事物的全部,条内分段的面积代表事物的构成比。有单式和复式百分条图两种。单式百分条图的样例见图14-3;复式百分条图的样例见图14-13,图14-14。百分条图的绘制方法如下:①先绘制一个标尺,一般以横轴为标尺,尺度必须从0到100标记。②绘制一直条,长度必须与标尺一致,宽度可任意,全长代表全部构成。③以各自构成比的大小划分各自条宽。吉林大学公共卫生学院61整理课件ppt吉林大学公共卫生学院62整理课件ppt资料来源见表14-4。吉林大学公共卫生学院63整理课件ppt资料来源见表14-13。吉林大学公共卫生学院64整理课件ppt吉林大学公共卫生学院65整理课件ppt资料来源见表14-14。吉林大学公共卫生学院66整理课件ppt㈢圆图④各条段需用不同的图案或颜色区分,并附图例说明。圆图(piechart)用圆的面积代表事物的全部,用各扇形的面积代表事物的构成比。有单式和复式圆图两种。单式圆图的样例见图14-4;复式圆图的样例见图14-15。圆图的绘制方法如下:①先绘制一个圆形,1%相当于3.6°,每个构成比乘以3.6即得该构成比应占的圆心角度数。吉林大学公共卫生学院67整理课件ppt吉林大学公共卫生学院68整理课件ppt图14-152001年某地流动人口与本地人口的经济状况构成(%)吉林大学公共卫生学院69整理课件ppt②将每个构成比换算成圆心角度数,利用量角器绘制出各个构成比的扇形面积。③扇面一般以9点或12点位置作始点,顺时针排列。④各扇面需用不同的图案或颜色区分,并附图例说明。㈣线图线图(linechart)用线段的升降表示事物在时间上的变化趋势,或某现象随另一现象变动的情况。适用于连续型资料。有单式和复式线图两种.吉林大学公共卫生学院70整理课件ppt复式线图的样例见图14-5

,图14-16,图14-17。线图的绘制方法如下:①先建立一个坐标系,一般以横轴表示时间,纵轴表示率或数值大小。②根据每个时间点的指标大小确定点的位置,用短线连接各点即成。一般不把折线绘制成平滑的曲线。③复式线图需用不同的图案或颜色区分,并附图例说明。吉林大学公共卫生学院71整理课件ppt吉林大学公共卫生学院72整理课件ppt资料来源见表14-5。吉林大学公共卫生学院73整理课件ppt吉林大学公共卫生学院74整理课件ppt资料来源见表14-14。吉林大学公共卫生学院75整理课件ppt吉林大学公共卫生学院76整理课件ppt资料来源见表14-17。吉林大学公共卫生学院77整理课件ppt㈤半对数线图半对数线图(semi-logarithmiclinearchart)用于表示事物的发展速度。线图的纵、横轴都为算术尺度,半对数线图的纵轴为对数尺度,横轴为算术尺度。适用于比较两组相差悬殊的数据比较变化速度。样例见图14-7,图14-18。半对数线图的绘制方法如下:①在半对数坐标纸上按线图绘制方法即可。②对于普通坐标纸,需先将数据转化为对数,再按线图绘制方法即可。吉林大学公共卫生学院78整理课件ppt吉林大学公共卫生学院79整理课件ppt资料来源见表14-6。吉林大学公共卫生学院80整理课件ppt吉林大学公共卫生学院81整理课件ppt资料来源见表14-18。吉林大学公共卫生学院82整理课件ppt线图与半对数线图各自反映数据变化的角度不同,线图体现数据之间的绝对差,半对数线图体现数据之间的对数差。为对比二者,现将同一资料分别用线图与半对数线图绘制,见附图1、附图2、和附图3。吉林大学公共卫生学院83整理课件ppt附图1吉林大学公共卫生学院84整理课件ppt附图2吉林大学公共卫生学院85整理课件ppt附图3吉林大学公共卫生学院86整理课件ppt㈥散点图线图与半对数线图各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论