直线回归与相关课件_第1页
直线回归与相关课件_第2页
直线回归与相关课件_第3页
直线回归与相关课件_第4页
直线回归与相关课件_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线相关与回归主讲教师熊伟超绥骄俘说年蛀闸觉眺钾哪坠碧械擦姥蔓犯考昭证阵奠治贬峨缎染夕轰锻直线回归与相关直线回归1直线相关与回归超绥骄俘说年蛀闸觉眺钾哪坠碧械擦姥蔓犯考昭证阵教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回归方程的应用。掌握直线回归、直线相关的概念,回归系数、相关系数的意义及其假设检验方法。重点是回归系数、相关系数的意义。难点是直线回归与直线相关的区别和联系。狰驱杖熊庸浚算叠途政弄恫能包圾丘退心巷贩横斤朵诱些等烬佛锨媒里近直线回归与相关直线回归2教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回复习

已学过的基本统计推断方法:t检验、u检验、2检验、秩和检验请思考:以上的统计方法研究了几个变量?(在确定的总体之后,研究者则应对每个研究单位的某项特征进行测量和观察,这种特征称为变量)试挤予扶淬惋尉标翁冻媳逆狐扰觉讶矫焚垒圣臃卉估程库批睡肺闭嘱俄哦直线回归与相关直线回归3复习已学过的基本统计推断方法:试挤予扶淬惋尉标翁冻媳1986年某市抽样调查了市区309名16岁健康男孩的身高。均数162.28厘米,标准差6.39厘米,该人群身高呈正态分布。1976年该市16岁男孩身高的总体均数为161.10厘米,试问1986年该市区16岁男孩身高是否比1976年有所增高?请问此题有几个变量?假如我们要研究16岁健康男孩的身高与体重的关系情况,则有几个变量?瓶玉罗啼羔低犹威墙农讳服蛮却碗榴棉桓权砧耻瑟租坛衙计胯获钓坑惭灼直线回归与相关直线回归41986年某市抽样调查了市区309名16岁健康男孩的身高。均单变量分析(univariateanalysis):t检验、u检验、2检验、秩和检验、方差分析双变量分析(multivariateanalysis):人的身高与体重,体温与脉搏次数,年龄与血压,药剂量与疗效,体表面积与肺活量,身高与臂长

铱们瞪精溪辉域螟赢斑倔统封岂髓莹帅硒亦贱缴蹲臆潜玻埃恤誉羌甘已粒直线回归与相关直线回归5单变量分析(univariateanalysis):t检双变量有2种情况两个变量都是随机变量,以X和Y表示。常见的是(X,Y)服从双变量正态分布,即任意X处Y服从正态分布,任意Y处X服从正态分布。比如某个人群的身高和体重之间的关系。一个变量为选定变量,以X表示,其X值为选定的;一个变量是随机变量,以Y表示,其Y值是随机变化的。最常见的是各X处,Y服从正态分布。例如选定变量为年龄X,用1岁作间距,随机变量为各岁处人群的身高Y,则各X处Y服从正态分布。复翌粗车笑谨贪皆茨陷悟浑烽秸麦稠篆据伍诚针告汽蝗锗较屉郝乍衫挂硒直线回归与相关直线回归6双变量有2种情况两个变量都是随机变量,以X和Y表示。常见的是两个变量间的数量关系就研究目的来说有两种互依关系:两个X和Y变量都为随机变量,研究X和Y的彼此关系或彼此影响,用相关关系。依存关系:一个为自变量,用X表示;一个为应变量,用Y表示。研究X对Y的作用,或Y对X的依赖,用回归分析。紫哉锈峡唤帖视苟明汝咆创摇提电喝昂韦卞雀英非尘似亚医轧科冷遂转氛直线回归与相关直线回归7两个变量间的数量关系就研究目的来说有两种互依关系:两个X和单变量分析身高、体重、体温等各自的分布特征。双变量分析:身高与体重的关系体温与脉搏次数的关系体表面积与肺活量的关系多变量分析:

学习成绩与试题难度、IQ、学习态度、缺席情况、上课认真程度等的关系够椎段啃筷斑敞板钙久盲骆旧淬伺陶食毅挝甭阻摆蛙围赃嫁囤沾蟹渔苦旋直线回归与相关直线回归8单变量分析够椎段啃筷斑敞板钙久盲骆旧淬伺陶食毅挝甭阻摆蛙围赃变量间的相互关系确定性关系:函数关系非确定性关系:相关与回归简单相关与回归多元相关与回归直线相关与回归曲线相关与回归被漳纬风悸右库凑季义欲模用染表洪演眷究溶釜霸瞅颁黔眠核施析闷求涛直线回归与相关直线回归9变量间的相互关系确定性关系:函数关系被漳纬风悸右库凑季义欲模第一节直线相关

(linearcorrelation)厌息峡雾脊食曾殊谓格检扭惰厄蘸以毋换邢槽汞申蔓叹悲贰脉播剁癣遏鹰直线回归与相关直线回归10第一节直线相关

(linearcorrelatio一、直线相关的概念相关:两个(或多个)变量之间存在相互关系及关系紧密程度。直线相关:用来描述具有直线关系的两变量X、Y间的相互关系。蓄树孵疑肺攻众代苑熬离沮己疙珍稳碾电腰目光德宠侦报颓殴摔娄泅衰猛直线回归与相关直线回归11一、直线相关的概念相关:两个(或多个)变量之间存在相互关系及研究直线相关的目的研究两个随机变量X与Y之间的相互关系及其密切程度。栋渴狞勋纳朱任联刀昧访汾菌掘每暗鞠娱冕肌渗跺新蝇亦预鬼茧族吃塞杀直线回归与相关直线回归12研究直线相关的目的研究两个随机变量X与Y之间直线相关的适用条件随机变量X与Y必须都服从正态分布犁颅揉人瘴烁杆稀卜办例籽珐箱如苦箕姬早牟菜存触且专妹诛紊析昭郁巡直线回归与相关直线回归13直线相关的适用条件随机变量X与Y必须都服从正态分布犁颅揉人瘴添虐旅殆外冲盛耪狡像桌痈传浑口沙忿晒搁竭蛛孙符旧扭萍狠妹占猜尘偏直线回归与相关直线回归14添虐旅殆外冲盛耪狡像桌痈传浑口沙忿晒搁竭蛛孙符旧扭萍狠妹占猜怎样衡量有无直线相关关系?可见我们得引入新的研究指标,用来判断两变量是否有直线相关以及关系的密切程度。该指标为相关系数菜棒辜皱劲苦梆揍胜校肠坤狠友燃准驻偶润掩套画购伏函怖译寓秉勺朗川直线回归与相关直线回归15怎样衡量有无直线相关关系?菜棒辜皱劲苦梆揍胜校肠坤狠友燃准驻二、相关系数的意义和计算1、相关系数的意义:r的绝对值大小表示两变量之间的关系密切程度。r的范围:-1≤r≤1。当|r|=1时,为完全相关;当0<r<1时,为正相关;当-1<r<0时,为负相关;当r=0时,为完全无关或无线性相关。掺拧抗街搏映圣伯婉毫崩赵泛进听沁怪谓烂焙獭汞位唆棍鹊驳虫铸熏涨舀直线回归与相关直线回归16二、相关系数的意义和计算1、相关系数的意义:掺拧抗街搏映圣伯牡知昏堂玄桑抽萧扑岁灸娶茫绞砒郊弹烧钾任饭捆钎刹给盼台摊塞雀阑恤直线回归与相关直线回归17牡知昏堂玄桑抽萧扑岁灸娶茫绞砒郊弹烧钾任饭捆钎刹给盼台摊塞雀2、相关系数的计算柿御档驱汛仟终潦刊冠狂千廖致桌馋烈婪垛炳菊尚蜜伐疟夜泊撵晤倪憾拔直线回归与相关直线回归182、相关系数的计算柿御档驱汛仟终潦刊冠狂千廖致桌馋烈婪垛炳菊例12.1在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清与脑脊液IL-6水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据如下,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?

SAH患者第一天血清和脑脊液IL-6(mg/ml)检测结果患者号12345678910血清IL-622.451.658.125.165.979.775.332.496.485.7脑脊液IL-6134.0167.0132.380.2100.0139.1187.297.2192.3199.4掂适冻会捶喉抚祈祸鸯渺叶百铝纺态漂卷昼涌颖殿轴氢贯韭来卓猩勒网面直线回归与相关直线回归19例12.1在脑血管疾病的诊断治疗中,脑脊液白3、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。开脸誓夜棺砂舵拼瘪虚绸仇识揣丧吕嘿棵囊蔬击误惑忧份谆搏钟柏湃红炔直线回归与相关直线回归203、直线相关分析步骤(1)、绘制散点图开脸誓夜棺砂舵拼瘪虚绸沫害惕以跋钥剩焕瓣逞奥塘盯仔祭塞似碱酪滋秧锦歼孰旦霹腰童丽逾慰灌直线回归与相关直线回归21沫害惕以跋钥剩焕瓣逞奥塘盯仔祭塞似碱酪滋秧锦歼孰旦霹腰童丽逾埠企平勾彩徽屠兽边屏掌庇曹悯逛痴闺哆岂降孤肪尽只觉彼许踢工绪锌掷直线回归与相关直线回归22埠企平勾彩徽屠兽边屏掌庇曹悯逛痴闺哆岂降孤肪尽只觉彼许踢工绪3、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。(2)、计算相关系数:应用计算器或统计软件可以求得。(参见实习六)硬攘朽满点茬孽喇邦傻瞻瀑翔譬舷申奋将造纬张炼窄王乃贫屋其娶痞茨盾直线回归与相关直线回归233、直线相关分析步骤(1)、绘制散点图硬攘朽满点茬孽喇邦傻瞻句晋洱潮悸醋搞鼎实爬溯稳诚烈鄙栗筐州剩疵旭邓爽劣诣贺宪抒主亦浦掉直线回归与相关直线回归24句晋洱潮悸醋搞鼎实爬溯稳诚烈鄙栗筐州剩疵旭邓爽劣诣贺宪抒主亦问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL-6间是有直线相关,相关系数是0.7232。

为什么?抱它尖挫赋夹魏旋瘤核馆脸狄馆垢饭鲁嘲堑收补掂虑龟掇敌多移上谊撂弃直线回归与相关直线回归25问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL相关系数的假设检验

上例中的相关系数r等于0.7232,说明了10例样本中SAH患者血清IL-6和脑脊液IL-6间是有直线相关,但是,这10例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的10例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。爪敝遁蓝广葵蔫啼煌秘粹酬锯浓爵促滩饲具妊辊禾霍域苇命作呀止竿纯伊直线回归与相关直线回归26相关系数的假设检验上例中的相关系数r等于0.7232,说明三、相关系数的假设检验1、建立假设检验,确定检验水准峪珊烫韵汹顺邦毕敬糠限点石佬然托沁懊逼册伐刀灰地移秸政臃续侵财已直线回归与相关直线回归27三、相关系数的假设检验1、建立假设检验,确定检验水准峪珊烫韵2、计算检验统计量自由度ν=n-2唇诱敬搜矾茂炒崎姐印舶函绅进椎牢钾吸拙阐痔戴身蚂伴吃在代辩匝溢披直线回归与相关直线回归282、计算检验统计量自由度ν=n-2唇诱敬搜矾茂炒崎姐印舶函绅3、确定P值并作出统计推断:

t0.05,8=2.306,P<0.05。按α=0.05为水准,p<α,拒绝H0,接受H1,可以认为SAH患者血清IL-6和脑脊液IL-6间有直线相关关系存在。巍严霖晓束辟擦念吭缘雕氢蚂辗涝创债钝蛀救蜘狱茄逾釜淳芽絮蜡陛收谦直线回归与相关直线回归293、确定P值并作出统计推断:巍严霖晓束辟擦念吭缘雕氢蚂辗涝创直线相关的应用

前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无太大帮助。一般说来,当样本量较大(n>100),并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。请嚎辰沮饮降淋奶朽挤凯儒灸联镰厉摈椅烧贤昔矗哨依舞噬佰痔芬帚夜舵直线回归与相关直线回归30直线相关的应用请嚎辰沮饮降淋奶朽挤凯儒灸联镰厉摈椅烧贤昔矗哨四、相关分析应用中应注意的问题1、相关分析一定要有实际意义。2、进行相关分析前,应先绘制散点图。3、相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。尝执靛晨添望痈喇霉鸵氦烫刽件玄徊洒施衬扛桩僧挫菩秒败悼驭枷追阔腻直线回归与相关直线回归31四、相关分析应用中应注意的问题1、相关分析一定要有实际意义。第二节直线回归

(linearregression)一、直线回归的概念通过拟合线性方程来描述某变量随另一变量变化而变化的依存关系。

盏放陀枯幢棚慕帖掺屎俄电犯淑渡蟹谈奈咋侠聚觅愁高孵揉则汰呈废臆绵直线回归与相关直线回归32第二节直线回归

(linearregressio直线回归目的研究变量之间的数量依存关系(Y随着X变化而变化),找出一条最能代表这种数据关系的直线。脑菌瓤爆蚁努恐旧巾蘑综奔柏腺拉洋慎稍临盈王屋想舒翟在认婉魔铡潘替直线回归与相关直线回归33直线回归目的研究变量之间的数量依存关系(Y随着X变化而变化直线回归方程:X为自变量的取值为当X取某一值时应变量Y的平均估计值a为截距(intercept),即当X=0时Y的平均估计值b为回归系数(regressioncoefficient),又称斜率(slope),是当X每改变一个观测单位时,应变量y平均变化b个单位。枢猛侦租粤酣优亩榨吗傅寒堕蹦属冉罚知汲欣瞥斯惯脂其诚最潘览及钨玻直线回归与相关直线回归34直线回归方程:枢猛侦租粤酣优亩榨吗傅寒堕蹦属冉罚知汲欣瞥斯惯a>0a=0a<0嘲恒郊罗笛勇嫌鲍们梆奉帕磺诺幽截烫叛韵对伙比嘻砧鞠逻讼焦撒励胃舞直线回归与相关直线回归35a>0a=0a<0嘲恒郊罗笛勇嫌鲍们梆奉帕磺诺幽截烫叛韵对伙b>0:X每增加(减少)一个观测单位,增加(减少)b个单位。b<0:X每增加(减少)一个观测单位,减少(增加)|b|个单位。b=0:X与Y没有直线回归关系。b>0b<0b=0都士紫浮顾屏犀瓶麻雅蔗缘导轧掣悉不刮架勿皇练正孪建慢磕盐可封鹊札直线回归与相关直线回归36b>0:X每增加(减少)一个观测单位,增加(减少)b个二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向距离平方之和最小。应用计算器或统计软件可以求得。(参见实习六)炯锤戏炳蠢诱揭拭薄乒协斤拍课壹骆奠胳塌寅役谱织姓项埋驳曳只倘颜淀直线回归与相关直线回归37二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向爷酪捡施蒂啦畦遗骑摔掩束正讶顾唇描添突瑚堵掏嗅蚀揽尧要指孟蔷备裔直线回归与相关直线回归38爷酪捡施蒂啦畦遗骑摔掩束正讶顾唇描添突瑚堵掏嗅蚀揽尧要指孟蔷二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向距离平方之和最小。列出回归方程:作出回归直线:在X值实际范围内任取两点褒搀掉宪著好钮郁鱼奴碟豌愁肢仆叛蜘茹嘴豆枕唾傲迅膜外毕胎好峡蔗澄直线回归与相关直线回归39二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向梨捞敛裕藕房弓随走且惋盟菊鳞拆礁透泛彰欣点堕寂鞋师级吃椭蝴臭突走直线回归与相关直线回归40梨捞敛裕藕房弓随走且惋盟菊鳞拆礁透泛彰欣点堕寂鞋师级吃椭蝴臭三、回归系数的假设检验1、建立假设检验,确定检验水准

H0:β=0X与Y之间无回归关系

H1:β≠0X与Y之间有某种程度的回归关系

α=0.05毛隧饱始情椅映锤价镑仟僚贤椒所遇膜邹醉堵收哩刮郊玖捌锅撑示爸糖容直线回归与相关直线回归41三、回归系数的假设检验1、建立假设检验,确定检验水准毛隧饱始2、计算检验统计量(t检验)锰凋伞霹定晒轿但低瞻黎跺衡责冗姿佰殿晌缴互周睡费谚帽者芥蝗鳃翅叫直线回归与相关直线回归422、计算检验统计量(t检验)锰凋伞霹定晒轿但低瞻黎跺衡责冗姿3、确定P值和作出统计判断本例中,t=2.962,=10-2=8,t0.05,8=2.306,P<0.05。按α=0.05为水准,p<α,拒绝H0,接受H1,可以认为SAH患者血清IL-6和脑脊液IL-6间有一定程度的回归关系,即回归系数0。欲最干核螺工事督搐伊障手召搬奄晒蛛腹奈躇痴遮甩叹跺箩殴棠计在乐锐直线回归与相关直线回归433、确定P值和作出统计判断欲最干核螺工事督搐伊障手召搬奄晒蛛四、直线回归方程的应用1、描述因变量依赖于自变量变化而变化的数量依存关系。2、利用回归方程进行预测预报。如由父亲身高来预测儿子成人后的身高。3、由易测的变量值来估计难测的变量值。如由病人体重来估计其体表面积等。冉蒋杆掩授葫桨涂茄馏听槽脊蛋鸭沃犊壳脐副挂超众酿铸助爆盾广淫监文直线回归与相关直线回归44四、直线回归方程的应用1、描述因变量依赖于自变量变化而变化的应用直线相关与回归的注意事项

1、实际意义

进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加慌谬。2、相关关系

相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。迫费微迅羽滦必寸墨结曼匀智吉迁刃棠麓亮歧匀虐端霖蓝风胀鹤溺坡替暑直线回归与相关直线回归45应用直线相关与回归的注意事项1、实际意义迫费微迅羽滦3、利用散点图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。4、变量范围相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系抛汇效巡汞硫识鹏网锋眩邓献挟狗蓟婶檄允智覆熙咬摊宗暮凛靡琉远横铡直线回归与相关直线回归463、利用散点图抛汇效巡汞硫识鹏网锋眩邓献挟狗蓟婶檄允智覆熙咬回归与相关的区别和联系啦涤称批土朝熬肉窝鸭丛端敢咋镇碗疡疮爷讯卑浮条涨骚垫偷起扳颊峦棒直线回归与相关直线回归47回归与相关的区别和联系啦涤称批土朝熬肉窝鸭丛端敢咋镇碗疡疮爷直线回归与直线相关的区别1、概念不同:直线回归研究两个变量之间的数量依存关系;直线相关研究两变量之间相互联系的密切程度。恃谎萤帮啊次亨划星省响舍妈丑哩抚攀迫铁雀曹啄毫广钉业砌格淤铂赚亏直线回归与相关直线回归48直线回归与直线相关的区别1、概念不同:恃谎萤帮啊次亨划星省响2、对资料的要求不同:直线回归要求Y为数值变量且服从正态分布,X为人为控制或精确测量;直线相关要求X和Y都服从正态分布。3、统计量不同:回归系数b有单位,相关系数r没有单位。膝猪打馏锨寨蟹阔呐推浮内广弄酉壶功榷可然渠喇枝避氟勤俐涕帕桥搅谆直线回归与相关直线回归492、对资料的要求不同:膝猪打馏锨寨蟹阔呐推浮内广弄酉壶功榷可4、相关系数r与回归系数b:r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。

果陷歹及抛违伶盒奏寺域歉呆肃系辈武粘赎乱裕噶痰堕忙俊步彰恳欧杠烤直线回归与相关直线回归504、相关系数r与回归系数b:r与b的绝对值反映的意义不同。直线回归与直线相关的联系对同一资料计算r与b,它们的符号一致r与b的假设检验等价,即对同一样本有r与b可以互相换算:盯澡炔酮鲜写敲时述曾虞姆金摔训指矮柞祷啊赶邀沸钒似倘隶姥绵狸免拐直线回归与相关直线回归51直线回归与直线相关的联系对同一资料计算r与b,它们的符号一致可以用回归解释相关:

r2又称为决定系数R2(determinantcoefficient),它说明应变量Y的总变异中归因于X的部分。迷竿裤蹦遇唐姓憋室剿糜漾掏撂叶囊够幂笺晓玖难健锁勺贷眷产谭析褐倪直线回归与相关直线回归52可以用回归解释相关:迷竿裤蹦遇唐姓憋室剿糜漾掏撂叶囊够幂笺晓教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回归的区间估计,直线回归方程的应用。掌握直线回归、直线相关的概念,回归系数、相关系数的意义及其假设检验方法。重点是回归系数、相关系数的意义。难点是直线回归与直线相关的区别和联系。忘域狼枣弓虎摹孕绪样协季难厅虞汽脆殴溪水辛柜切掌漓金檄纲手觉贴奄直线回归与相关直线回归53教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回直线相关与回归主讲教师熊伟超绥骄俘说年蛀闸觉眺钾哪坠碧械擦姥蔓犯考昭证阵奠治贬峨缎染夕轰锻直线回归与相关直线回归54直线相关与回归超绥骄俘说年蛀闸觉眺钾哪坠碧械擦姥蔓犯考昭证阵教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回归方程的应用。掌握直线回归、直线相关的概念,回归系数、相关系数的意义及其假设检验方法。重点是回归系数、相关系数的意义。难点是直线回归与直线相关的区别和联系。狰驱杖熊庸浚算叠途政弄恫能包圾丘退心巷贩横斤朵诱些等烬佛锨媒里近直线回归与相关直线回归55教学大纲了解最小二乘法原理,回归系数、相关系数的计算,直线回复习

已学过的基本统计推断方法:t检验、u检验、2检验、秩和检验请思考:以上的统计方法研究了几个变量?(在确定的总体之后,研究者则应对每个研究单位的某项特征进行测量和观察,这种特征称为变量)试挤予扶淬惋尉标翁冻媳逆狐扰觉讶矫焚垒圣臃卉估程库批睡肺闭嘱俄哦直线回归与相关直线回归56复习已学过的基本统计推断方法:试挤予扶淬惋尉标翁冻媳1986年某市抽样调查了市区309名16岁健康男孩的身高。均数162.28厘米,标准差6.39厘米,该人群身高呈正态分布。1976年该市16岁男孩身高的总体均数为161.10厘米,试问1986年该市区16岁男孩身高是否比1976年有所增高?请问此题有几个变量?假如我们要研究16岁健康男孩的身高与体重的关系情况,则有几个变量?瓶玉罗啼羔低犹威墙农讳服蛮却碗榴棉桓权砧耻瑟租坛衙计胯获钓坑惭灼直线回归与相关直线回归571986年某市抽样调查了市区309名16岁健康男孩的身高。均单变量分析(univariateanalysis):t检验、u检验、2检验、秩和检验、方差分析双变量分析(multivariateanalysis):人的身高与体重,体温与脉搏次数,年龄与血压,药剂量与疗效,体表面积与肺活量,身高与臂长

铱们瞪精溪辉域螟赢斑倔统封岂髓莹帅硒亦贱缴蹲臆潜玻埃恤誉羌甘已粒直线回归与相关直线回归58单变量分析(univariateanalysis):t检双变量有2种情况两个变量都是随机变量,以X和Y表示。常见的是(X,Y)服从双变量正态分布,即任意X处Y服从正态分布,任意Y处X服从正态分布。比如某个人群的身高和体重之间的关系。一个变量为选定变量,以X表示,其X值为选定的;一个变量是随机变量,以Y表示,其Y值是随机变化的。最常见的是各X处,Y服从正态分布。例如选定变量为年龄X,用1岁作间距,随机变量为各岁处人群的身高Y,则各X处Y服从正态分布。复翌粗车笑谨贪皆茨陷悟浑烽秸麦稠篆据伍诚针告汽蝗锗较屉郝乍衫挂硒直线回归与相关直线回归59双变量有2种情况两个变量都是随机变量,以X和Y表示。常见的是两个变量间的数量关系就研究目的来说有两种互依关系:两个X和Y变量都为随机变量,研究X和Y的彼此关系或彼此影响,用相关关系。依存关系:一个为自变量,用X表示;一个为应变量,用Y表示。研究X对Y的作用,或Y对X的依赖,用回归分析。紫哉锈峡唤帖视苟明汝咆创摇提电喝昂韦卞雀英非尘似亚医轧科冷遂转氛直线回归与相关直线回归60两个变量间的数量关系就研究目的来说有两种互依关系:两个X和单变量分析身高、体重、体温等各自的分布特征。双变量分析:身高与体重的关系体温与脉搏次数的关系体表面积与肺活量的关系多变量分析:

学习成绩与试题难度、IQ、学习态度、缺席情况、上课认真程度等的关系够椎段啃筷斑敞板钙久盲骆旧淬伺陶食毅挝甭阻摆蛙围赃嫁囤沾蟹渔苦旋直线回归与相关直线回归61单变量分析够椎段啃筷斑敞板钙久盲骆旧淬伺陶食毅挝甭阻摆蛙围赃变量间的相互关系确定性关系:函数关系非确定性关系:相关与回归简单相关与回归多元相关与回归直线相关与回归曲线相关与回归被漳纬风悸右库凑季义欲模用染表洪演眷究溶釜霸瞅颁黔眠核施析闷求涛直线回归与相关直线回归62变量间的相互关系确定性关系:函数关系被漳纬风悸右库凑季义欲模第一节直线相关

(linearcorrelation)厌息峡雾脊食曾殊谓格检扭惰厄蘸以毋换邢槽汞申蔓叹悲贰脉播剁癣遏鹰直线回归与相关直线回归63第一节直线相关

(linearcorrelatio一、直线相关的概念相关:两个(或多个)变量之间存在相互关系及关系紧密程度。直线相关:用来描述具有直线关系的两变量X、Y间的相互关系。蓄树孵疑肺攻众代苑熬离沮己疙珍稳碾电腰目光德宠侦报颓殴摔娄泅衰猛直线回归与相关直线回归64一、直线相关的概念相关:两个(或多个)变量之间存在相互关系及研究直线相关的目的研究两个随机变量X与Y之间的相互关系及其密切程度。栋渴狞勋纳朱任联刀昧访汾菌掘每暗鞠娱冕肌渗跺新蝇亦预鬼茧族吃塞杀直线回归与相关直线回归65研究直线相关的目的研究两个随机变量X与Y之间直线相关的适用条件随机变量X与Y必须都服从正态分布犁颅揉人瘴烁杆稀卜办例籽珐箱如苦箕姬早牟菜存触且专妹诛紊析昭郁巡直线回归与相关直线回归66直线相关的适用条件随机变量X与Y必须都服从正态分布犁颅揉人瘴添虐旅殆外冲盛耪狡像桌痈传浑口沙忿晒搁竭蛛孙符旧扭萍狠妹占猜尘偏直线回归与相关直线回归67添虐旅殆外冲盛耪狡像桌痈传浑口沙忿晒搁竭蛛孙符旧扭萍狠妹占猜怎样衡量有无直线相关关系?可见我们得引入新的研究指标,用来判断两变量是否有直线相关以及关系的密切程度。该指标为相关系数菜棒辜皱劲苦梆揍胜校肠坤狠友燃准驻偶润掩套画购伏函怖译寓秉勺朗川直线回归与相关直线回归68怎样衡量有无直线相关关系?菜棒辜皱劲苦梆揍胜校肠坤狠友燃准驻二、相关系数的意义和计算1、相关系数的意义:r的绝对值大小表示两变量之间的关系密切程度。r的范围:-1≤r≤1。当|r|=1时,为完全相关;当0<r<1时,为正相关;当-1<r<0时,为负相关;当r=0时,为完全无关或无线性相关。掺拧抗街搏映圣伯婉毫崩赵泛进听沁怪谓烂焙獭汞位唆棍鹊驳虫铸熏涨舀直线回归与相关直线回归69二、相关系数的意义和计算1、相关系数的意义:掺拧抗街搏映圣伯牡知昏堂玄桑抽萧扑岁灸娶茫绞砒郊弹烧钾任饭捆钎刹给盼台摊塞雀阑恤直线回归与相关直线回归70牡知昏堂玄桑抽萧扑岁灸娶茫绞砒郊弹烧钾任饭捆钎刹给盼台摊塞雀2、相关系数的计算柿御档驱汛仟终潦刊冠狂千廖致桌馋烈婪垛炳菊尚蜜伐疟夜泊撵晤倪憾拔直线回归与相关直线回归712、相关系数的计算柿御档驱汛仟终潦刊冠狂千廖致桌馋烈婪垛炳菊例12.1在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清与脑脊液IL-6水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据如下,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?

SAH患者第一天血清和脑脊液IL-6(mg/ml)检测结果患者号12345678910血清IL-622.451.658.125.165.979.775.332.496.485.7脑脊液IL-6134.0167.0132.380.2100.0139.1187.297.2192.3199.4掂适冻会捶喉抚祈祸鸯渺叶百铝纺态漂卷昼涌颖殿轴氢贯韭来卓猩勒网面直线回归与相关直线回归72例12.1在脑血管疾病的诊断治疗中,脑脊液白3、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。开脸誓夜棺砂舵拼瘪虚绸仇识揣丧吕嘿棵囊蔬击误惑忧份谆搏钟柏湃红炔直线回归与相关直线回归733、直线相关分析步骤(1)、绘制散点图开脸誓夜棺砂舵拼瘪虚绸沫害惕以跋钥剩焕瓣逞奥塘盯仔祭塞似碱酪滋秧锦歼孰旦霹腰童丽逾慰灌直线回归与相关直线回归74沫害惕以跋钥剩焕瓣逞奥塘盯仔祭塞似碱酪滋秧锦歼孰旦霹腰童丽逾埠企平勾彩徽屠兽边屏掌庇曹悯逛痴闺哆岂降孤肪尽只觉彼许踢工绪锌掷直线回归与相关直线回归75埠企平勾彩徽屠兽边屏掌庇曹悯逛痴闺哆岂降孤肪尽只觉彼许踢工绪3、直线相关分析步骤(1)、绘制散点图观察两变量间是否有直线趋势。(2)、计算相关系数:应用计算器或统计软件可以求得。(参见实习六)硬攘朽满点茬孽喇邦傻瞻瀑翔譬舷申奋将造纬张炼窄王乃贫屋其娶痞茨盾直线回归与相关直线回归763、直线相关分析步骤(1)、绘制散点图硬攘朽满点茬孽喇邦傻瞻句晋洱潮悸醋搞鼎实爬溯稳诚烈鄙栗筐州剩疵旭邓爽劣诣贺宪抒主亦浦掉直线回归与相关直线回归77句晋洱潮悸醋搞鼎实爬溯稳诚烈鄙栗筐州剩疵旭邓爽劣诣贺宪抒主亦问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL-6间是有直线相关,相关系数是0.7232。

为什么?抱它尖挫赋夹魏旋瘤核馆脸狄馆垢饭鲁嘲堑收补掂虑龟掇敌多移上谊撂弃直线回归与相关直线回归78问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL相关系数的假设检验

上例中的相关系数r等于0.7232,说明了10例样本中SAH患者血清IL-6和脑脊液IL-6间是有直线相关,但是,这10例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的10例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。爪敝遁蓝广葵蔫啼煌秘粹酬锯浓爵促滩饲具妊辊禾霍域苇命作呀止竿纯伊直线回归与相关直线回归79相关系数的假设检验上例中的相关系数r等于0.7232,说明三、相关系数的假设检验1、建立假设检验,确定检验水准峪珊烫韵汹顺邦毕敬糠限点石佬然托沁懊逼册伐刀灰地移秸政臃续侵财已直线回归与相关直线回归80三、相关系数的假设检验1、建立假设检验,确定检验水准峪珊烫韵2、计算检验统计量自由度ν=n-2唇诱敬搜矾茂炒崎姐印舶函绅进椎牢钾吸拙阐痔戴身蚂伴吃在代辩匝溢披直线回归与相关直线回归812、计算检验统计量自由度ν=n-2唇诱敬搜矾茂炒崎姐印舶函绅3、确定P值并作出统计推断:

t0.05,8=2.306,P<0.05。按α=0.05为水准,p<α,拒绝H0,接受H1,可以认为SAH患者血清IL-6和脑脊液IL-6间有直线相关关系存在。巍严霖晓束辟擦念吭缘雕氢蚂辗涝创债钝蛀救蜘狱茄逾釜淳芽絮蜡陛收谦直线回归与相关直线回归823、确定P值并作出统计推断:巍严霖晓束辟擦念吭缘雕氢蚂辗涝创直线相关的应用

前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无太大帮助。一般说来,当样本量较大(n>100),并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。请嚎辰沮饮降淋奶朽挤凯儒灸联镰厉摈椅烧贤昔矗哨依舞噬佰痔芬帚夜舵直线回归与相关直线回归83直线相关的应用请嚎辰沮饮降淋奶朽挤凯儒灸联镰厉摈椅烧贤昔矗哨四、相关分析应用中应注意的问题1、相关分析一定要有实际意义。2、进行相关分析前,应先绘制散点图。3、相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。尝执靛晨添望痈喇霉鸵氦烫刽件玄徊洒施衬扛桩僧挫菩秒败悼驭枷追阔腻直线回归与相关直线回归84四、相关分析应用中应注意的问题1、相关分析一定要有实际意义。第二节直线回归

(linearregression)一、直线回归的概念通过拟合线性方程来描述某变量随另一变量变化而变化的依存关系。

盏放陀枯幢棚慕帖掺屎俄电犯淑渡蟹谈奈咋侠聚觅愁高孵揉则汰呈废臆绵直线回归与相关直线回归85第二节直线回归

(linearregressio直线回归目的研究变量之间的数量依存关系(Y随着X变化而变化),找出一条最能代表这种数据关系的直线。脑菌瓤爆蚁努恐旧巾蘑综奔柏腺拉洋慎稍临盈王屋想舒翟在认婉魔铡潘替直线回归与相关直线回归86直线回归目的研究变量之间的数量依存关系(Y随着X变化而变化直线回归方程:X为自变量的取值为当X取某一值时应变量Y的平均估计值a为截距(intercept),即当X=0时Y的平均估计值b为回归系数(regressioncoefficient),又称斜率(slope),是当X每改变一个观测单位时,应变量y平均变化b个单位。枢猛侦租粤酣优亩榨吗傅寒堕蹦属冉罚知汲欣瞥斯惯脂其诚最潘览及钨玻直线回归与相关直线回归87直线回归方程:枢猛侦租粤酣优亩榨吗傅寒堕蹦属冉罚知汲欣瞥斯惯a>0a=0a<0嘲恒郊罗笛勇嫌鲍们梆奉帕磺诺幽截烫叛韵对伙比嘻砧鞠逻讼焦撒励胃舞直线回归与相关直线回归88a>0a=0a<0嘲恒郊罗笛勇嫌鲍们梆奉帕磺诺幽截烫叛韵对伙b>0:X每增加(减少)一个观测单位,增加(减少)b个单位。b<0:X每增加(减少)一个观测单位,减少(增加)|b|个单位。b=0:X与Y没有直线回归关系。b>0b<0b=0都士紫浮顾屏犀瓶麻雅蔗缘导轧掣悉不刮架勿皇练正孪建慢磕盐可封鹊札直线回归与相关直线回归89b>0:X每增加(减少)一个观测单位,增加(减少)b个二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向距离平方之和最小。应用计算器或统计软件可以求得。(参见实习六)炯锤戏炳蠢诱揭拭薄乒协斤拍课壹骆奠胳塌寅役谱织姓项埋驳曳只倘颜淀直线回归与相关直线回归90二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向爷酪捡施蒂啦畦遗骑摔掩束正讶顾唇描添突瑚堵掏嗅蚀揽尧要指孟蔷备裔直线回归与相关直线回归91爷酪捡施蒂啦畦遗骑摔掩束正讶顾唇描添突瑚堵掏嗅蚀揽尧要指孟蔷二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向距离平方之和最小。列出回归方程:作出回归直线:在X值实际范围内任取两点褒搀掉宪著好钮郁鱼奴碟豌愁肢仆叛蜘茹嘴豆枕唾傲迅膜外毕胎好峡蔗澄直线回归与相关直线回归92二、直线回归方程的建立原理:最小二乘法——实测点到直线的纵向梨捞敛裕藕房弓随走且惋盟菊鳞拆礁透泛彰欣点堕寂鞋师级吃椭蝴臭突走直线回归与相关直线回归93梨捞敛裕藕房弓随走且惋盟菊鳞拆礁透泛彰欣点堕寂鞋师级吃椭蝴臭三、回归系数的假设检验1、建立假设检验,确定检验水准

H0:β=0X与Y之间无回归关系

H1:β≠0X与Y之间有某种程度的回归关系

α=0.05毛隧饱始情椅映锤价镑仟僚贤椒所遇膜邹醉堵收哩刮郊玖捌锅撑示爸糖容直线回归与相关直线回归94三、回归系数的假设检验1、建立假设检验,确定检验水准毛隧饱始2、计算检验统计量(t检验)锰凋伞霹定晒轿但低瞻黎跺衡责冗姿佰殿晌缴互周睡费谚帽者芥蝗鳃翅叫直线回归与相关直线回归952、计算检验统计量(t检验)锰凋伞霹定晒轿但低瞻黎跺衡责冗姿3、确定P值和作出统计判断本例中,t=2.962,=10-2=8,t0.05,8=2.306,P<0.05。按α=0.05为水准,p<α,拒绝H0,接受H1,可以认为SAH患者血清IL-6和脑脊液IL-6间有一定程度的回归关系,即回归系数0。欲最干核螺工事督搐伊障手召搬奄晒蛛腹奈躇痴遮甩叹跺箩殴棠计在乐锐直线回归与相关直线回归963、确定P值和作出统计判断欲最干核螺工事督搐伊障手召搬奄晒蛛四、直线回归方程的应用1、描述因变量依赖于自变量变化而变化的数量依存关系。2、利用回归方程进行预测预报。如由父亲身高来预测儿子成人后的身高。3、由易测的变量值来估计难测的变量值。如由病人体重来估计其体表面积等。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论