版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计案例回归分析的基本思想及其初步应用第2课时残差分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁rm106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲 B.乙C.丙 D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.为了表示n个点与相应直线在整体上的接近程度,我们常用的表示法为()解析:由回归直线方程可知,为一个量的估计值,而yi为它的实际值,在最小二乘估计中(yi-a-bxi)2,即(yi-)2.答案:C3.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和如下表所示:分类甲乙丙丁散点图残差平方和115106124103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高()A.甲 B.乙C.丙 D.丁解析:根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.答案:D4.通过残差图我们发现在采集样本点过程中,样本点数据不准确的是()A.第四个 B.第五个C.第六个 D.第八个解析:由题图可知,第六个的数据偏差最大,所以第六个数据不准确.答案:C5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.解析:由ei恒为0,知yi=eq\o(y,\s\up12(^))i,即yi-eq\o(y,\s\up12(^))i=0,答案:17.x,y满足如下表的关系:xy1则x,y之间符合的函数模型为________.解析:通过数据发现y的值与x的平方值比较接近,所以x,y之间的函数模型为y=x2.答案:y=x28.关于x与y,有如下数据:x24568y3040605070有如下的两个模型:(1)eq\o(y,\s\up12(^))=+;(2)eq\o(y,\s\up12(^))=7x+17.通过残差分析发现第(1)个线性回归模型比第(2)个拟合效果好.则Req\o\al(2,1)________Req\o\al(2,2),Q1________Q2(用大于,小于号填空,R,Q分别是相关指数和残差平方和).解析:根据相关指数和残差平方和的意义知Req\o\al(2,1)>Req\o\al(2,2),Q1<Q2.答案:><三、解答题9.在实验中得到变量y与x的数据如下表所示:x78335y由经验知,y与eq\f(1,x)之间具有线性相关关系,试求y与x之间的回归曲线方程,并预测x0=时,y0的值.解:令u=eq\f(1,x),由题目所给数据可得下表所示的数据:序号uiyiueq\o\al(2,i)uiyi12255912139001230411512合计56计算得eq\o(b,\s\up12(^))=,eq\o(a,\s\up12(^))=.所以eq\o(y,\s\up12(^))=+.所以试求回归曲线方程为eq\o(y,\s\up12(^))=+eq\f,x).当x0=时,y0=+eq\f,≈.10.关于x与y有以下数据:x24568y3040605070已知x与y线性相关,由最小二乘法得eq\o(b,\s\up12(^))=.(1)求y与x的线性回归方程;(2)现有第二个线性模型:eq\o(y,\s\up12(^))=7x+17,且R2=.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.解:(1)依题意设y与x的线性回归方程为eq\o(y,\s\up12(^))=+eq\o(a,\s\up12(^)).eq\o(\s\up7(—),\s\do3(x))=eq\f(2+4+5+6+8,5)=5,eq\o(\s\up7(—),\s\do3(y))=eq\f(30+40+60+50+70,5)=50,因为eq\o(y,\s\up12(^))=+eq\o(a,\s\up12(^))经过(eq\o(\s\up7(—),\s\do3(x)),eq\o(\s\up7(—),\s\do3(y))),所以y与x的线性回归方程为eq\o(y,\s\up12(^))=+.所以50=×5+eq\o(a,\s\up12(^)).所以eq\o(a,\s\up12(^))=.(2)由(1)的线性模型得yi-yi与yi-eq\o(\s\up7(—),\s\do3(y))的关系如下表所示:yi-yi--10-yi-eq\o(\s\up7(—),\s\do3(y))-20-1010020由于Req\o\al(2,1)=,R2=知Req\o\al(2,1)>R2,所以(1)的线性模型拟合效果比较好.B级能力提升1.在研究身高和体重的关系时,得到的结论是“身高解释了64%的体重变化,而随机误差贡献了剩余的36%,所以身高对体重的效应比随机误差的效应大得多”,则求得的相关指数R2≈()A. B.C. D.解析:根据相关指数的意义知R2≈.答案:B2.若某函数型相对一组数据的残差平方和为89,其相关指数为,则总偏差平方和为________,回归平方和为________.解析:因为R2=1-eq\f(残差平方和,总偏差平方和),0.95=1-eq\f(89,总偏差平方和),所以总偏差平方和为1780;回归平方和=总偏差平方和-残差平方和=1780-89=1691.答案:178016913.某运动员训练次数与成绩之间的数据关系如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数R2;(5)试预测该运动员训练47次及55次的成绩.解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)eq\o(\s\up7(—),\s\do3(x))=,eq\o(\s\up7(—),\s\do3(y))=,=13180,eq\o(a,\s\up12(^))=eq\o(\s\up7(—),\s\do3(y))-eq\o(b,\s\up12(^))eq\o(\s\up7(—),\s\do3(x))=-88.所以回归方程为eq\o(y,\s\up12(^))=-88.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论