




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学
第十一章线性回归与相关一、线性回归的概念线性回归方程(linearregressionequation
):第一节线性回归
用于描述两个变量间依存变化的数量关系。也称简单回归(simpleregression)。
FrancisGaltonX-自变量(independentvariable);Y-应变量(dependentvariable);-给定X时Y的估计值;a-截距(intercept)或常数项(constantterm);b-回归系数(regressioncoefficient)。simpleregression例11-1
研究饮水氟含量与成人骨X线改变指数间的关系,得到了表11-1中所示的资料,试进行回归分析。
二、回归方程的估计
表11-1饮水氟含量(mg/L)与骨X线改变指数调查对象饮水氟含量(X)骨X线改变指数(Y)XY
X2Y210.240.400.100.060.1620.800.560.450.640.3131.001.911.911.003.6541.800.861.553.240.7453.125.2516.389.7327.5664.103.4013.9416.8111.5675.6058.38326.9331.363408.22810.2770.33722.29105.474946.31910.81116.301257.20116.8613525.69合计37.74257.392340.75285.1721924.20(1)绘制散点图:由散点图可见,饮水氟含量与骨X线改变指数之间存在着直线趋势,可以考虑建立二者之间的线性回归方程。simpleregression线性回归模型的假定参数为线性参数(Linear)独立性(Independent)
Cov(εiεj)=0,i≠j给定X时,Y为正态分布(Normal)
Y~N(XB,2)等方差(Equalvariance)线性回归及其等方差图示XRegressionLineorCurveY150160170404142ProbabilityDistributionofyi
forcompanyi参数的最小二乘估计(OLS)Y-Yhat
就是残差ε
。即实测值与理论值之差。最小二乘法(OLS)即使回归方程的残差平方和最小。数学表达:使目标函数Q最小化Q(ß0,ß1)=∑(Y-Yi)2=∑(εi)2
参数的最小二乘估计要使误差目标函数Q
∑(εi)2=∑(Yi-(ß0+ß1xi))2最小化,根据高等数学求极值问题可知即是求解下列线性方程组:
表示X与Y的离均差积和;表示X的离均差平方和;和分别为两个变量的均值。
simpleregression(2)计算回归系数与常数项本例:simpleregression代入公式得:则回归方程为:simpleregression按上述回归方程,在X实测值的范围内,任取两个相距较远的点和,连接A、B两点即得到回归直线。本例可取x1=2,计算出yhat2=6.80;计算出x2=4,yhat2=26.68;两点的连线即为所求的回归直线。
(3)作回归直线simpleregression三、线性回归的假设检验(一)方差分析回归方程检验的基本思想:
如果X
与Y之间无线性回归关系,则与都只包含随机因素对Y的影响,因此其均方应近似相等,如果两者差别较大,并超出能够用随机波动解释的程度,则认为回归方程具有统计学意义。RonaldFisher回归分析的变异分解SSTSSESSR回归分析的变异分解Hypothesistest线性回归的方差分析计算方差分析表
变异来源离差平方和SS自由度
ν均方
MSF值P值总变异SSTn-1回归SSR1MSR=SSR/1MSR/MSEP剩余SSEn-2MSE=
SSE/(n-2)对例11-1数据建立的回归方程进行假设检验:(1)建立假设检验Hypothesistest(2)计算统计量Hypothesistest(3)确定P值,得出统计结论查F界值表,,拒绝,可以认为饮水氟含量与成人骨X线改变指数之间存在线性回归关系。Hypothesistest上面结果可以归纳成表11-2方差分析表的形式。表11-2方差分析表变异来源SSMSFP总变异14563.138回归12538.06112538.0643.34<0.01残差2025.077289.30Hypothesistest(二)t
检验为样本回归系数的标准误,反映样本回归系数的抽样误差;为剩余标准差,表示应变量Y值对于回归直线的离散程度。Hypothesistest例11-1数据建立回归方程后,进行t检验,过程如下:(1)建立假设检验(2)计算统计量Hypothesistest(3)确定P值,作结论查
t
界值表,,拒绝,结论与方差分析相同。可以看出,统计量与之间存在确定的数量关系,即有,本例。Hypothesistest一、线性相关的概念
两个变量之间存在的线性相关关系称为线性相关或简单相关。用于分析双变量正态分布资料。第二节线性相关
KarlPearson
图11-211名男青年身高与前臂长散点图
linearcorrelation
图11-3线性相关性质示意图
二、相关系数及其计算相关系数(correlationcoefficient):又称Pearson积差相关系数(coefficientofproductmomentcorrelation),是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。相关系数r没有度量衡单位,其数值为。表示正相关;表示负相关;表示无相关,即无直线关系。当时称为完全相关。相关系数的绝对值愈接近1,表示相关愈密切;相关系数愈接近0,表示相关愈不密切。linearcorrelation
相关系数的计算公式:linearcorrelation
例11-2
从男青年总体中随机抽取11名男青年组成样本,分别测量每个男青年的身高和前臂长,测量结果如表11-3所示,试计算身高与前臂长之间的相关系数。表11-3
11名男青年身高与前臂长的测量结果(cm)编号身高X前臂长YXY1170477990289002209217342726629929176431604470402560019364155416355240251681517347813129929220961885094003534425007178478366316842209818346841833489211691804988203240024011016543709527225184911166447304275561936合计18915008618532608122810本例:结论:前臂长与身高呈正相关关系,而且相关程度较高。linearcorrelation
三、相关系数的假设检验
1.
t
检验法:根据r
作总体相关系数是否为零的假设检验。2.
根据计算出的r
值,直接查r
界值表得到P
值,若
,则可以认为两变量之间存在线性相关关系。对例11-2计算得到的
r
值进行假设检验:(1)建立检验假设
,即身高与前臂长之间不存在线性相关系,即身高与前臂长之间存在线性相关关系
(2)计算统计量linearcorrelation
(3)确定P值,作出结论查
t界值表,得,,拒绝,接受,可以认为男青年身高与前臂长之间存在正相关关系。或查r界值表,,结论相同。linearcorrelation
一、线性回归分析的应用1.
线性回归方程可应用于以下三个方面:①
分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X对应变量Y进行估计,必要时可以作区间估计;第三节线性回归与相关应用的注意事项③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X取值来限定应变量Y在一定范围内波动。2.
作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X
,以结果变量为Y
;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X
。3.
在回归分析中,自变量X既可以是随机变量(称为Ⅱ型回归模型,两个变量都服从正态分布),也可以是给定的量(称为I型回归模型,在X取值固定时Y服从正态分布)。如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。4.
使用回归方程估计Y值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。如例11-1中,X
的取值范围为0.24~10.81,计算估计值时X
的取值最好在0.24~10.81之间。二、线性相关分析的应用
1.
相关分析理论上适用于两个变量都服从正态分布的情形,如果资料不服从正态分布,应先通过变量变换,使之近似正态化后计算相关系数。如果不能正态化,或针对有序数据则可以计算Spearman或Kendall相关系数进行分析(参考SPSS软件说明)。2.
相关系数r值究竟多大有实际意义,需要根据具体问题而定。实际经验而言,时,表示相关性较差;时,表示中度相关;时,表示有较高度的相关性;时,表示有很高的相关性。3.
相关系数可以描述两个变量间相互关系的密切程度和方向。然而,不能因为两变量间的相关系数有统计学意义,就认为两者之间存在着因果关系,要证明两事物间确实存在因果关系,必须凭借专业知识加以阐明。医学中很多变量的数量变化可能由于相同的因子调控引起。三、线性回归与相关的区别
1.
相关系数的计算只适用于两个数值变量都服从正态分布的情形,而在回归分析中,应变量是随机变量,自变量既可以是随机变量(Ⅱ型回归模型),也可以是给定的量(I型回归模型)。
2.
线性相关表示两个变量之间的相互关系是双向的,线性回归则反映两个变量之间单向的依存关系,更适合分析因果关系的数量变化。四、线性回归与相关的联系
1.
相关系数r与回归方程中的b正负号相同,r和b为正,说明X与Y的数量变化的方向是一致的,X增大,Y也增大;符号为负,变化方向相反。2.
对同一样本可以得出r与b互相转化的公式,两种假设检验完全等价。3.
相关与回归可以互相解释。r的平方称为决定系数(coefficientofdetermination),可表示为:
表示回归平方和在总平方和中所占的比重,即其值越接近1,回归效果越好。决定系数和相关系数有确定的关系,例如r=0.5,有=0.25,说明一个变量的变异有25%可以由另一变量所解释。4.1等级相关如果观测值是等级资料,则可以用等级相关来表达两事物之间的关系。等级相关是分析X、Y两变量等级间是否相关的一种非参数方法。常用的等级相关方法是Spearman等级相关。与线性相关系数r一样,等级相关系数rs的数值亦在-1与+1之间,数值为正表示正相关,数值为负表示负相关。4.2等级相关系数的计算
Spearman等级相关系数rs
可由公式计算式中,n表示样本含量;
d表示X、Y的秩次之差。例10.4某医生做一种研究,欲了解人群中氟骨症患病率(%)与饮用水中氟含量(mg/l)之间的关系。随机观察8个地区氟骨症患病率与饮用水中氟含量,数据如表10-4(2)、(4)两栏。试计算等级相关系数rs。2.差数d,见(6)栏,注意3.算d2见(7)栏,本例
4.代入公式(10-18)计算rs若资料中相同观察值的例数较多时,计算的结果偏差较大,此时可由公式
计算校正的rs值rs′。
4.3等级相关系数的显著性检验rs是由样本资料计算出的相关系数,亦存在抽样误差问题,故要推断总体中两变量间有无线性相关关系,须经假设检验。检验步骤
1.建立假设检验无效假设:ρs=0;备择假设:ρs≠0;
2.计算统计量
3.给出结论当n≤50时,查附表12中的等级相关系数rs界值表。当n>50时,可查附表11(
r界值表),取自由度ν=n-2,查rα(n-2),若rs>rα(n-2),则P<α拒绝H0,若rs<rα(n-2),则P>α不拒绝H0。
例10.4的假设检验
(1)建立假设检验无效假设:ρs=0
备择假设:ρs≠0(2)计算统计量(3)确定P值作出结论
查附表12中的等级相关系数界值表P<0.05拒绝H0,接受H1注意:当n>50时,可查附表11(r界值表),取自由度ν=n-2,查,若rs>,
P<α,则拒绝H0,若rs<,
P>α,则接受H1。给体重为20g的小鼠静脉输注西索米星0.32mg后,测得一些时间后的血药浓度如表6-4所示。试求血药浓度对时间的回归方程。(C=c0ekt)表
药物浓度-时间数据表编号12345678时间
(min)20406080100120140160血药浓度
(μg/ml)32.7516.509.205.002.821.370.760.535.1曲线直线化5.2曲线直线化5.3曲线直线化5.3曲线直线化1.绘制散点图,选择合适的曲线类型一般根据资料性质结合专业知识便可确定资料的曲线类型,不能确定时,可绘制散点图,根据散点的分布,选择接近的、合适的曲线类型。2.曲线直线化按曲线类型,对或进行变量变换,使变换后的两个变量呈直线关系。3.按最小二乘法原理,建立直线化的直线回归方程,作假设检验。4.将变量还原,写出用原变量表达的曲线方程。5.4利用线性回归拟合曲线的一般步骤
1.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年哈尔滨市松南学校临时聘用教师招聘考试真题
- 2025年度店面转让定金支付及品牌授权合作协议
- 中介代招聘合同范本
- 商铺装潢居间协议
- 2025年度基础设施建设项目过桥垫资服务协议
- 2025年度宗教场所房屋租赁合同转让及宗教活动服务协议
- pvc管材销售合同范本
- 2025年度互联网内容审查约束对方协议
- 2025年度银行信用卡智能家居设备分期付款合同
- 2025年度医疗机构聘用合同模板:医疗领域人才交流与合作协议
- 2024年4月自考00263外国法制史试题及答案
- 《井中分布式光纤声波传感数据采集规程》标准报批稿
- 人音版 音乐 八年级下册 第一单元 我和你教案
- 代理法人免责协议书版本
- 2024年青岛港湾职业技术学院单招职业适应性测试题库必考题
- 门诊导诊课件
- python程序设计-说课
- 《糖尿病患者血脂管理中国专家共识(2024版)》解读
- 广州石牌村改造规划方案
- GB/T 22919.12-2024水产配合饲料第12部分:鲫鱼配合饲料
- IP承载网架构规划及路由部署N
评论
0/150
提交评论