统计学10-11直线相关与回归课件_第1页
统计学10-11直线相关与回归课件_第2页
统计学10-11直线相关与回归课件_第3页
统计学10-11直线相关与回归课件_第4页
统计学10-11直线相关与回归课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

线性相关与回归LinearCorrelation&RegressionFrancisGaltonFrancisGalton爵士(英,1822~1911)对统计学的主要贡献是提出“相关”与“回归”的概念,用统计方法对进化论中的变异进行研究,开创了生物统计学。方法的提出KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意门生,他开创了统计方法学。他对统计学的主要贡献:变异数据的处理、分布曲线的选配、卡方检验的提出、回归与相关的发展。方法的提出直线相关

(

linearcorrelation)

体重(kg),x肺活量(),YL十名女中学生体重与肺活量散点图1.直线相关的概念

11名男青年身高与前臂长度散点图2.对资料的要求

3.相关系数

(correlationcoefficient,r)

表示方法:

-1r

1*意义:描述两个变量直线相关的方向与与密切程度的指标。x、y都是正态分布资料的随机变量正相关负相关0<r<1-1<r<0相关系数示意:r=1r=-1完全正相关完全负相关相关系数计算方法:__(x-x)(y-y)l

xyr=————————————=——————___________________________(x-x)2(y-y)2

l

xx·l

yy__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__(x)2lxx=(x-x)2=x2-————n_(y)2lyy=(y-y)2=y2-————n____________________________(x-x)2(y-y)2

l

xx·l

yy

计算:__(x-x)(y-y)l

xyr=————————————=——————__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__=8.975(x)2lxx=(x-x)2=x2-————n_=98.5

(y)2lyy=(y-y)2=y2-————n_=1.69525r=8.975√98.51.69525=0.6945

编号身高(cm)前臂长(cm)XYX2Y2(X)(Y)1170477990289002209217342726629929176431604470402560019364155416355240251681517347813129929220961885094003534425007178478366316842209818346841833489211691804988203240024011016543709527225184911166443174285612116合计1891500861853260812281011名男青年身高与前臂长度4.相关系数的假设检验公式:查表法

检验假设:H0:=0,H1:0,=0.05r-0rt=———=——————,Sr

1-r2———n-2________=n-2t=0.6945(1-0.69452)/(10-2)√=2.730=n–2=10–2=8P<0.05结论:可认为该地女中学生的体重与肺活量有正相关关系

线性回归LinearRegressionRegression释义天文学上的“回归”地球绕太阳公转,在公转的同时本身还自转,在本身自转的同时地球的假设轴心还来回摆动。由于地球轴心的来回摆动,太阳光垂直照射到地球上就有南、北两个极限位置(南、北纬23027’),分别称南、北回归线。统计术语目前“回归”已成为表示变量之间数量依存关系的统计术语,并且衍生出“回归方程”、“回归系数”等统计学概念。

1.直线回归的概念

体重(kg),x肺活量(),YL十名女中学生体重与肺活量散点图a为回归直线在y轴上的截距0yxa>0a=0a<0a0yxb>0b=0b<0b=0

b为回归系数

__(x-x)(y-y)xy-(x)(y)/nb=————————=—————————_(x-x)2x2-(x)2/n

__a=y-bx4.直线回归方程的计算方法y=a+bx

^

__(x-x)(y-y)xy-(x)(y)/nb=————————=——————————_(x-x)2x2-(x)2/nb=946.55-40523.15/10165014052/10=0.0911

__a=y-bx=23.15/10-0.0911405/10=-1.3746

女中学生肺活量对体重的直线回归方程是:y=-1.3746+0.0911x

^=y/n-bx/n|b-0|bt=————=——,=n-2SbSbSyxSb=———————____________(x-x)2_Sb为样本回归系数标准误Syx为剩余标准差5.回归系数的假设检验同一组资料作直线相关与回归时tb与tr等值假设:H0:=0,H1:0,=0.05;

(y-y)2Syx=—————n-2ˆ(y-ŷ)2=lyy-bl

xy

=1.69525-0.09118.975=0.87760.877610-2=0.3312=0.331298.5==0.0334Sb

=Syx(x–x)2

|b-0|bt=————=——SbSb=0.09110.0334=2.728=n–2=8P<0.05结论:总体回归系数不等于零,即回归方程y=-1.3746+0.0911x成立

^体重(kg),x肺活量(),YL十名女中学生体重与肺活量散点图与回归直线y=-1.3746+0.0911x

^x2=44Ŷ2=2.64x1=37Ŷ1=2.00

6.直线回归方程的图示p1p2p1p2

SPSS结果34描述两变量的依存数量关系利用回归方程进行预测:由易测的变量值估算难算的变量值(由x估计y)利用回归方程进行控制:即利用回归方程进行逆估计(由y估计x)7.直线回归方程的应用

区别:

1)意义 直线回归反映两变量的依存关系; 直线相关反映两变量的相互关系。直线回归与直线相关的联系与区别

区别:

2)对资料的要求直线回归:自变量是正态总体的随机变量或指定变量,y一定是正态总体的随机变量;直线相关:两变量均为正态总体的随机变量。1)同一组资料的r

与b的正负符号是一致的;2)同一组资料的r

和b的假设检验结果是一致的,即tr=tb。

联系:3)相关回归可以互相解释R的平方称为确定系数

(coefficientofdetermination)应用确定系数,也可以从回归的角度对相关程度做进一步的了解。联系:1.进行相关与回归时先绘制散点图,还要观察有无异常点。2.回归与相关的应用仅限于原实测数据的范围内使用。应用注意事项孩子的身高与小树的高度间显示出显著的相关性错误应用举例小树高度与孩子身高的关系研究第二节

Spearman秩相关

(等级相关)

求两变量的相关系数,当X、Y并不服从二元正态分布,对数据做秩变换后再计算直线相关系数,用rs记之。

适用条件例题:某医生做一种研究,欲了解人群中氟骨症患病率(%)与饮用水中氟含量(mg/l)之间的关系。随机观察8个地区氟骨症患病率与饮用水中氟含量,数据如表两栏。试计算等级相关系数rs。

调查了某地区10个乡的钉螺密度与血吸虫感染率(%)数据如表。试分析该地区螺密度与感染率之间有无相关关系?例题

代入公式:若资料中相同观察值的例数较多时,计算的结果偏差较大,此时可由公式

计算校正的rs值rs′。

Thankyou!扩展:多元线性回归

常数项,表示当所有自变量为0时应变量Y的总体平均值的估计值

表示其它自变量固定不变的情况下,每改变一个测量单位时所引起的应变量Y的平均改变量

bj为偏回归系数(partialregressioncoefficient)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论