chap6两变量相关与回归_第1页
chap6两变量相关与回归_第2页
chap6两变量相关与回归_第3页
chap6两变量相关与回归_第4页
chap6两变量相关与回归_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chap6correlation®ressionofBivariate

P88~105目的与要求:6学时.§1~5,§6~9.掌握:相关与回归、协方差分析的意义、联合用药效应判断、SPSS17.0操作。熟悉:回归的应用、LD50的意义和计算。了解:协变量的条件。教学内容提要:重点讲解:相关与回归、协方差分析的思想和意义、SPSS17.0操作。讲解:回归的应用、LD50的意义和计算。介绍:协方差分析与一般方差分析的区别。重点:相关与回归的意义、协方差分析思想。难点:协方差分析与一般方差分析的区别。

2023/3/41chap6两变量相关与回归共81页,您现在浏览的是第1页!2023/3/42chap6两变量相关与回归共81页,您现在浏览的是第2页!变量间的关系

确定性(函数)关系:x—y对应。随机性关系:x—y不确定性。

相关分析的统计指标:(1)正态分布的双变量计量:散点图→直线趋势→

Pearson相关系数。皮尔逊(2)不服从正态分布的双变量计量资料,或等级或相对数,或总体分布类型不知的资料:散点图→直线趋势→等级相关系数。(3)两个有关的分类变量:交叉分类的R×C表→独立性χ2检验和列联系数描述其相关性。

2023/3/43chap6两变量相关与回归共81页,您现在浏览的是第3页!§1

直线相关

(linearcorrelation)

P85直线相关or简单相关(simplecorrelation):两变量相互呈直线变化趋势的随机性关系。一、散点图、积差相关系数

1.散点图2023/3/44chap6两变量相关与回归共81页,您现在浏览的是第4页!二、积差相关系数的假设检验r估计总体相关系数ρ,当r≠0时,因为存在抽样误差,不能认为ρ≠0,需要检验样本相关关系是否来自ρ=0的总体。

tor直接用r2023/3/45chap6两变量相关与回归共81页,您现在浏览的是第5页!2023/3/46chap6两变量相关与回归共81页,您现在浏览的是第6页!2023/3/47chap6两变量相关与回归共81页,您现在浏览的是第7页!2023/3/48chap6两变量相关与回归共81页,您现在浏览的是第8页!2023/3/49chap6两变量相关与回归共81页,您现在浏览的是第9页!§2等级相关(秩相关)

P88条件:①不服从正态分布;②总体分布类型不知;③用等级或相对数表示的资料;④数据一端或两端有不确定值。方法:Kendall法:等级相关系数rkSpearman法:等级相关系数rsrk和rs的取值范围和意义同r,都需进行检验。rs=1-6Σd2/[n(n2-1)]

,n对子数,d配对秩次之差.

2023/3/410chap6两变量相关与回归共81页,您现在浏览的是第10页!【SPSS操作】以血小板数和出血症状(标0=-,1=+,2=++,3=+++)为变量名,建立2列12行数据文件L6-2.sav(1)作散点图:Graphs→Scatter→→Define,出血症状入YAxis,血小板数入XAxis→Continue→OKx与y无直线趋势,只为说明SPSS作等级相关分析的操作。(2)等级相关:Analyze→Correlate→Bivariate,血小板与出血入Variable,√Kendallˊstau-b和√Spearman→OK输出结果:Kendallrk=-0.377,P=0.117;

Spearmanrs=-0.422,P=0.172。2023/3/411chap6两变量相关与回归共81页,您现在浏览的是第11页!§3

直线回归

P90一、直线回归的模型散点图呈直线(或曲线)趋势,但随机因素的影响,不完全在一条线上。回归(regression)关系:随机性数量依存关系。回归分析:研究一个应变量与一个或多个自变量之间数量依存关系的统计方法。

简单线性回归或简单回归(simpleregression):只有一个自变量的直线回归(linearregression)

。2023/3/412chap6两变量相关与回归共81页,您现在浏览的是第12页!二、直线回归方程的建立与检验

建立:最小二乘法原则。检验:能否使用。使用:在样本数据范围内。预测:x估y。控制:y估x

2023/3/413chap6两变量相关与回归共81页,您现在浏览的是第13页!2.检验n>100,r假设检验有统计学意义时:︱r︱>0.7,两个变量高度相关;0.4<︱r︱<0.7,中度相关;0.2<︱r︱<0.4,低度相关。2023/3/414chap6两变量相关与回归共81页,您现在浏览的是第14页!例:两变量,df=100,r=0.20时,查附表11,P<0.05,可认为两变量间存在直线相关。R2=0.202=0.04,y的变异只有4%与回归有关,两个变量直线相关的实际意义不大,除x外,还有其它因素等待我们去认识。由这样的资料求出的回归方程是无任何预测价值的。区别相关显著(r有统计学意义)与相关强度2023/3/415chap6两变量相关与回归共81页,您现在浏览的是第15页!【例6-3】

例6-1资料3岁儿童体重与体表面积资料,建立直线回归方程并进行检验。【SPSS】L6-1.sav→Analyze→Regression→LinearRegression,体重为Independent、体表面积为dependent→Statistic,选Confidenceintervals→Continue→OK。2023/3/416chap6两变量相关与回归共81页,您现在浏览的是第16页!2023/3/417chap6两变量相关与回归共81页,您现在浏览的是第17页!二、联系(1)方向一致:r与b的正负号一致。(2)同一资料假设检验等价:tr=tb(3)r与b可相互推导获得。(4)用回归解释相关:R2=r22023/3/418chap6两变量相关与回归共81页,您现在浏览的是第18页!2.预测y值容许区间即预测区间(predictionintervalPI)

x=x0时,y0值的(1–α)预测区间计算公式为:2023/3/419chap6两变量相关与回归共81页,您现在浏览的是第19页!3.估计µ的CI:自变量x0,应变量估计值的总体均数的(1-α)CI为:2023/3/420chap6两变量相关与回归共81页,您现在浏览的是第20页!L2:§6

曲线回归

(curvelinearregression)P97曲线拟合(curvefitting):根据样本资料找出能反映变量间关系的曲线回归方程的过程。散点图→曲线类型:对数、指数、幂函数、Logistic等。曲线关系→最小二乘法→曲线直线化→直线回归→还原得到曲线方程。统计软件对一组资料常可同时拟合多种模型:R2接近1、标准估计误差SY较小、变量数最少,结构最简单的模型为首选。2023/3/421chap6两变量相关与回归共81页,您现在浏览的是第21页!【SPSS操作】以t、P为变量名,建立L6-7.sav。Analyze→Regression→CurveEstimation,p入Dependent[s],t入Variable,在Modeles框将11个复选项全选→OK。2023/3/422chap6两变量相关与回归共81页,您现在浏览的是第22页!2023/3/423chap6两变量相关与回归共81页,您现在浏览的是第23页!剂量D

-死亡曲线(非对称的S型曲线)

2023/3/424chap6两变量相关与回归共81页,您现在浏览的是第24页!剂量的回归系数=0.480,z=3.555,P=0.000,截距=-2.772,P=0.000,都有统计学意义;PROBIT(p)=Intercept+BX=-2.772+0.480×剂量

2023/3/425chap6两变量相关与回归共81页,您现在浏览的是第25页!Pearson拟合优度(PearsonGoodness-of-fitTest):χ2=0.238,P=0.888,P>0.15(预设),CI不异质性校正。2023/3/426chap6两变量相关与回归共81页,您现在浏览的是第26页!§8

联合用药效应判断

P1011.协同、叠加与拮抗关系:剂量-效应:曲线关系,D↑l倍,E不一定↑1倍。

协同:(1+1)>2

叠加(独立):1<(1+1)<

2

拮抗:(1+1)<1用等效概念表达两药联合应用效应:2023/3/427chap6两变量相关与回归共81页,您现在浏览的是第27页!

2.联合用药计量效应的判断2023/3/428chap6两变量相关与回归共81页,您现在浏览的是第28页!2023/3/429chap6两变量相关与回归共81页,您现在浏览的是第29页!2023/3/430chap6两变量相关与回归共81页,您现在浏览的是第30页!A药单用时对数剂量-效应回归无统计学意义,不建方程。为说明操作,求出A药单用时EA=1.18-0.51logDA2023/3/431chap6两变量相关与回归共81页,您现在浏览的是第31页!2023/3/432chap6两变量相关与回归共81页,您现在浏览的是第32页!§9协方差分析

(analysisofcovariance)

P102

一.基本思想和应用条件

1.概念:利用直线回归法消除混杂因素影响后进行的方差分析。常用于难以完全控制混杂因素的观察研究。

2.基本思想:扣除混杂因素(covariable协变量)x对y的影响→评价各种处理的效应。2023/3/433chap6两变量相关与回归共81页,您现在浏览的是第33页!二.完全随机设计资料的协方差分析【例6-10】

降压宁的临床实验的资料如表6-5,比较两组疗效是否相同。

2023/3/434chap6两变量相关与回归共81页,您现在浏览的是第34页!步:散点图→直线趋势。(无直线趋势则不宜作协方差分析)。Graphs→legacydialogs→

Scatter→→Define,SimpleScatterplot,用药后入YAxis框,用药前入XAxis→OK。两组均有直线趋势→协方差分析。

2023/3/435chap6两变量相关与回归共81页,您现在浏览的是第35页!第二步:交互项→两总体β是否相等:Analyze→GeneralLinearModels→Univariate用药后入Dependentvariable,组别入FixedFactors,用药前入Covariate→Model,⊙Custom,先组别、再用药前入Model,又将组别、用药前同时送入Model,选TypeⅠ(Ⅰ型方差分析模型)→Continue→OK。2023/3/436chap6两变量相关与回归共81页,您现在浏览的是第36页!第三步:比较修正均数,操作同第二步。①不分析交互,把组别*用药前从Model移除;②对两组进行比较,采用LSD法。Analyze→GeneralLinearModels→Univariate→Model,⊙Custom,将组别*用药前送出Model,TypeIII(III型方差分析模型)→Continue→Options,将组别入DisplayMeansfor,Comparemaineffects→Continue→OK。2023/3/437chap6两变量相关与回归共81页,您现在浏览的是第37页!2023/3/438chap6两变量相关与回归共81页,您现在浏览的是第38页!三.配伍组(随机区组)设计资料协方差分析

【例6-11】将每窝3只出生3周体重34~38g的12窝大鼠,随机分到3组:A组喂缺乏核黄素饲料,B组喂核黄素饲料、限制食量与A组相近,C组喂核黄素饲料、不限食量。1周后,体重增加量y

如表6-6。分析核黄素缺乏对体重增加的影响。为消除进食量对体重增加的影响,以进食量为协变量,采用协方差分析比较三种饲料对体重增加的差异。

2023/3/439chap6两变量相关与回归共81页,您现在浏览的是第39页!【SPSS】以饲料,窝别,进食量,体重增量为变量名,建立4列36行L6-11.sav,用配伍组设计资料的协方差分析。

2023/3/440chap6两变量相关与回归共81页,您现在浏览的是第40页!第二步:交互项→三组总体β相等?Analyze→GeneralLinearModels,→Univariate,体重增量入Dependentvariable,饲料、窝别入FixedFactors,进食量入Covariate→Model,⊙Custom,按因素的重要顺序将饲料、窝别、进食量、依次送入Model,再同时选饲料、进食量送入Model框,TypeⅠ→Continue→OK。

2023/3/441chap6两变量相关与回归共81页,您现在浏览的是第41页!第三步:比较修正均数是否相等。Analyze→GeneralLinearModels→Univariate→Model,⊙Custom,把饲料*进食量从Model框删除,选用TypeIII

→Continue→Options,饲料,窝别入DisplayMeansfor,√Comparemaineffects,LSD(none)→Continue→OK2023/3/442chap6两变量相关与回归共81页,您现在浏览的是第42页!2.相关系数(correlationcoefficient):定量描述两变量间直线相关方向和密切程度的统计指标。(1)积差相关系数(Product-momentcorrelationcoefficient)Pearson相关系数,相关系数:参数统计,双变量正态分布。-1≤r≤1,符号→相关方向,绝对值→密切程度。r>0

:正相关。r<0

:负相关。r=0

:零相关。非线性相关or无相关。(2)等级相关系数:非参数统计法§22023/3/443chap6两变量相关与回归共81页,您现在浏览的是第43页!2023/3/444chap6两变量相关与回归共81页,您现在浏览的是第44页!2023/3/445chap6两变量相关与回归共81页,您现在浏览的是第45页!2023/3/446chap6两变量相关与回归共81页,您现在浏览的是第46页!2023/3/447chap6两变量相关与回归共81页,您现在浏览的是第47页!三、直线相关分析应注意的问题1.慎重处理离群值点(outlier)。仅在证实离群值点源于过失误差时方可修正或剔除该数据。2.合并分层资料要慎重。两变量关系不会因为合并而被歪曲时才可考虑合并。3.样本相关系数必须进行假设检验。4.要结合专业背景。不要把P值大小误解为相关程度,样本相关系数有统计学意义并不一定反映相关就很密切。2023/3/448chap6两变量相关与回归共81页,您现在浏览的是第48页!【例6-2】

12名2~7岁急性白血病患儿的血小板数与出血症状资料见表6-1,分析两者之间有无直线关系:2023/3/449chap6两变量相关与回归共81页,您现在浏览的是第49页!2023/3/450chap6两变量相关与回归共81页,您现在浏览的是第50页!图6-8简单线性回归统计学模型

y的总体均数μy都位于直线μy=α+βx上。

=a+bx

儿科:

=8+2xa:截距(intercept)。b:斜率(slope),回归系数(regressioncoefficient)。

x每改变1个单位时y平均改变b个单位。

b>0表示自变量↑应变量↑,直线上升。│b│↑→越陡→y随x变化率大。2023/3/451chap6两变量相关与回归共81页,您现在浏览的是第51页!1.建立

回归直线=a+bx。剩余误差(y-

),残差:各实测值y至回归直线纵向距离。剩余平方和(residualsumofsquare)或残差平方和

SS剩余=Σ(y-

)2

=Σ[y-(a+bx)]2

(6-9)最小二乘法(methodofleastsquares):SS剩余最小。2023/3/452chap6两变量相关与回归共81页,您现在浏览的是第52页!3.决定系数(determiningcoefficient,相关指数correlationindex,R2)R2=SS回/SS总=(SS总-SS剩)/SS总=1-SS剩/SS总

R2表示y的总变异中被x所决定的占多少。0≤R2≤1,→

1,回归效果越好,强度↑。R2密切程度(相关强度)。回归强度R2

=SS回/lyy=(n-1)sy2r2/lyy=r2

2023/3/453chap6两变量相关与回归共81页,您现在浏览的是第53页!4.回归系数β的CI

b±tα/2(n–2)sb=b±tα/2(n–2)(sy/sx)

两回归系数比较时可用CI作假设检验:

无重叠→不同重叠→同。

2023/3/454chap6两变量相关与回归共81页,您现在浏览的是第54页!2023/3/455chap6两变量相关与回归共81页,您现在浏览的是第55页!§4

简单回归与相关的区别和联系

P95一、区别1.资料要求:(1)相关:

X、Y

正态(2)回归:①X、Y

正态②X选定,Y随机2.应用:(1)相关:

X、Y相互关系(2)回归:X推Y3.计量单位:相关系数r无,回归系数b有单位2023/3/456chap6两变量相关与回归共81页,您现在浏览的是第56页!§5

回归分析的应用

P95一、应用1.描述变量间数量变化关系:量-效关系、配伍规律。【例6-4】《医宗金鉴》治积聚处方,y=1.967+0.735x,有统计学意义,R2=0.9996,拟合度达99.96%,用回归方程描述名医治病用药的配伍规律准确有效。表6-26个治积聚方的川乌与茯苓用量处方川乌x茯苓y新制阴阳攻积丸3024肥气丸3.64.5息贲丸3.04.5伏梁丸1.53.0痞气丸1.53.0奔豚丸1.53.02023/3/457chap6两变量相关与回归共81页,您现在浏览的是第57页!2023/3/458chap6两变量相关与回归共81页,您现在浏览的是第58页!二、注意事项1.专业上要有意义:专业→相关→回归分析。2.选择合适的回归模型:散点图。直线趋势→直线回归分析曲线趋势→曲线方程。3.不随意外延:以自变量的观测范围为限。2023/3/459chap6两变量相关与回归共81页,您现在浏览的是第59页!【例6-7】

研究板蓝根注射液含量的稳定性,在pH=6.28,温度为78℃下,测得保温时间与含量破坏百分比的结果如下,作保温时间t与含量破坏百分比p间的曲线拟合。散点图→线形模型或对数模型。线形模型:p=

1.60+0.14t,R2=0.932,P<0.05。对数模型:T=lnt,p=-29.0+9.78T,还原t得到p=-29.0+9.78lnt,R2=0.994,P<0.05。两者都有统计学意义,取决定系数大者。2023/3/460chap6两变量相关与回归共81页,您现在浏览的是第60页!ModelSummaryandParameterestimates(模型概述和参数估计),都有意义。S形模型决定系数和F最大,

p=exp(b0+b1/t)=exp(3.38-59.08/t)=e(3.38-59.08/t)2023/3/461chap6两变量相关与回归共81页,您现在浏览的是第61页!§7

概率单位回归法计算半数致死量LD50P97一、LD50的意义

1.基本概念(1)质反应:在群体所引起的(+)率表示的效应。(2)效量(effectivedose,E):能引起某种质反应的剂量,说明质反应的大小,如致死量、致死时间等。(3)半数致死量(50%lethaldose,LD50):使半数试验动物死亡的剂量。(4)剂量-死亡率曲线:以剂量为横轴,死亡率为纵轴作图。不对称的“S”型曲线。2023/3/462chap6两变量相关与回归共81页,您现在浏览的是第62页!二.概率单位法计算LD50

【例6-8】

注射不同剂量厚朴注射液的小白鼠死亡情况如表6-3。求LD50及其95%置信区间。【SPSS】以剂量、鼠数、死亡数建L6-8.savAnalyze→Regression→Probit(概率单位回归),死数入ResponseFrequency,鼠数入TotalObserved,剂量入Covariates(协变量)→OK

2023/3/463chap6两变量相关与回归共81页,您现在浏览的是第63页!2. 意义:剂量D→lgD,则(lgD,P)散点图呈现为对称的S形,对称中心在死亡率=50%处。对数剂量-死亡率曲线为一条对称的“S”型曲线,在死亡率50%处斜率最大,药物剂量稍有变动,死亡率有明显差别。LD50衡量毒力大小,稳定,误差较小。

2023/3/464chap6两变量相关与回归共81页,您现在浏览的是第64页!Prob

=.50对应LD50点估计5.771mg/g。2023/3/465chap6两变量相关与回归共81页,您现在浏览的是第65页!2023/3/466chap6两变量相关与回归共81页,您现在浏览的是第66页!【例6-9】已知A与B对抗体指数均有抑制作用,研究二者联合用药的效应。(1)A、B两药各按近似等比级数取3个剂量,另加1空白,试验结果如表6-4。

2023/3/467chap6两变量相关与回归共81页,您现在浏览的是第67页!【SPSS操作】以A药、效应为变量名建立L6-91.savA药剂量对数变换→Analyze→Regression→LinearRegression

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论