线性回归方程分析报告_第1页
线性回归方程分析报告_第2页
线性回归方程分析报告_第3页
线性回归方程分析报告_第4页
线性回归方程分析报告_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用标准文案精彩文档环球雅思学科教师辅导讲义讲义编号: _组长签字: _签字日期:_学员编号:年级:高二课时数:3学员姓名:辅导科目: 数学学科教师:闫建斌课题线性回归方程授课日期及时段2014-2-1118:00-20:00教学目标线性回归方程基础重点、难点教学内容1、本周错题讲解2、知识点梳理1 .线性回归方程1变量之间的两类关系:函数关系与相关关系2制作散点图,判断线性相关关系3线性回归方程:y bx a (最小二乘法)最小二乘法:求回归直线,使得样本数据的点到它的距离的平方最小的方法实用标准文案精彩文档nXiynx yi 1bn2Xii 12nx注意:线性回归直线经过定点(x, y)2

2、 相关系数注:r0bx(判定两个变量线性相关性)n(Xix)(y,y)i 1nn_ 2 _ 2(Xix)(Yiy)i 1i 1时,变量x, y正相关;r0 时,变量x, y负相关;|r |越接近于 1,两个变量的线性相关性越强;| r |接近于 0 时,两个变量之间几乎不存在线性相关关系。3 线形回归模型:随机误差 e :我们把线性回归模型y bx a e,其中a,b为模型的未知参数,e 称为随机误:随机误差eiyibXia残差?:我们用回归方程ybx a?中的?估计bx a,随机误差ey (bx a),所以e y?是 e 的估计量,故& yi?iyiibxia,e?称为相应于点(Xi

3、,yj的残差。回归效果判定相关指数(解释变量对于预报变量的贡献率)R2 * 4n(% yj21in1(yiyi)2i 1实用标准文案精彩文档对于2 2列联表:K2的观测值k(a b)(n(ad)(aC)c)(b d)。临界值ko表:P (k2ko)0.500.400.250.150.100.050.0250.0100.0050.001ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果k ko,就推断“X,Y有关系”,这种推断犯错误的概率不超过;否则,在样本数据中没有发现足够证据支持结论“X,Y有关系”。(5)反证法与独立性检验原理的比

4、较:反证法原理在假设H。下,如果推出矛盾,就证明了H。不成立。独立性检在假设H。下,如果出现一个与H。相矛盾的小概率事件,就推断H。不成立,且该推断验原理犯错误的概率不超过这个小概率。典型例题1. (2011 山东某产品的广告费用x与销售额y的统计数据如下表:广告费用X/万元4235销售额y/万兀49263954根据上表可得回归方程 y =bx+a中的b为 9.4 ,据此模型预报广告费用为 6 万元时销售额为( ).A. 63.6力兀B. 65.5 万元C. 67.7力兀D. 72.0 力兀4 + 2 + 3 + 5749 + 26 + 39 + 54解析X=y= 42 ,42,y4实用标准文

5、案精彩文档A AA_7A A又y=bx+a必过(x,y), 42 = 3 X9.4+a,:a= 9.1.线性回归方程为 = 9.4x+ 9.1.当x= 6 时,y= 9.4 X6 + 9.1 = 65.5(万元).答案 B2 . (2011 江西为了解儿子身高与其父亲身高的关系,随机抽取5 对父子的身高数据如下:父亲身高x/cm174176176176178儿子身高y/cm175175176177177则y对x的线性回归方程为().A.y=x 1A1C.y= 88 +x2175 + 175 + 176 + 177 + 177=1765又y对x的线性回归方程表示的直线恒过点(_ , _),所以将

6、(176,176)代入 A、B、C、D 中检验知选 C.答案 C3.(2011 陕西设(X1,y1), (X2,y2),(xn,yn)是变量x和y的n由这些样本点通过最小二乘法得到的线性回归直线(如图),以下( ).A .x和y的相关系数为直线I的斜率B.x和y的相关系数在 0 到 1 之间C.当n为偶数时,分布在I两侧的样本点的个数一定相同B.y=x+ 1D】=176174 + 176 + 176 + 176 + 178解析因为_=176 ,个样本点,直线结论中正确实用标准文案精彩文档D .直线I过点(x,y)解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近 1

7、,两个变量的线性相关程度越强,所以A、B 错误.C 中n为偶数时,分布在I两侧的样本点的个数可以不相同,所以C 错误根据回归直线方程一定经过样本中心点可知D 正确,所以选 D.答案 D4.(2011 广东为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1 号到 5 号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这 5 天的平均投篮命中率为 _ _ _ 预测小李该月 6 号打 6 小时篮球的投篮命中率为_解析小李这 5 天的平均投篮命中率0.4 + 0.5 + 0.6 + 0.6 + 0.4y=

8、0.5 ,5可求得小李这 5 天的平均打篮球时间x= 3.根据表中数据可求得b= 0.01 ,;=0.47,故回归直线方程为 勺=0.47 + 0.01X,将x= 6 代入得 6 号打 6 小时篮球的投篮命中率约为 0.53.答案 0.50.535.(2011 辽宁调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: = 0.254x+ 0.321.由回归直线方程可知,家庭年收入每增加1 万元,年饮食支出平均增加 _ 元.解析 由题意知0.254(x+ 1) + 0.321 (0.254

9、x+ 0.321) = 0.254.答案 0.254实用标准文案精彩文档6.(2011 安徽谋地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2) 利用(1)中所求出的直线方程预测该地2012 年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理 如下:年份200642024需求量257211101929对预处理后的数据,容易算得x= 0 , 丁 = 3.2.人人4X 21+-2

10、X 11+2X19+4X295X0X3.2b=42+ 22+ 22+ 42 5 X02260A6.5 ,a=yb x= 3.40由上述计算结果,知所求回归直线方程为 257 =b(x 2 006) +a= 6.5(x 2 006) + 3.2 ,即 = 6.5(x 2 006) + 260.2.(2)利用直线方程,可预测 2012 年的粮食需求量为6 . 5X(2012 2006) + 260.2 = 6.5X6 + 260.2 = 299.2(万吨).课堂练习1.实验测得四组(x, y)的值为(1,2) , (2,3) , (3,4) , (4,5),则 y 与 x 之间的回归直线方程为()

11、AAAAA.y = x + 1B.y = x + 2C.y = 2x + 1 D.y = x 12 .在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为 0.96 和 0.85,则拟合效果好的模型是()A .甲 B.乙 C.甲、乙相同 D .不确定实用标准文案精彩文档3某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x 之间的相关关系,现取 88 8 8 8对观测值,计算,得刀尸1xi= 52“u2281x2二 478,=1xiyi= 1849,则其线性回归方程为()AAA.y = 11.47 + 2.62 x B.y = 11.47 + 2.62xAAC.y =

12、2.62 + 11.47 x D.y = 11.47 2.62x4 下表是某厂 14 月份用水量(单位:百吨)的一组数据:月份 x1234用水量 y4.5432.5由散点图可知,用水量 y 与月份 x 之间有较好的线性相关关系,其线性回归直线方程是y 二一0.7x + a,贝 U a 等于_5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据 如下:零件的个数 x(个)2345加工的时间 y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;实用标准文案精彩文档求出 y 关于 x 的线性回归方程 y = bx + a,并在坐标系中画出回归直线;

13、(3)试预测加工 10 个零件需要多少小时?课后练习一、选择题1 .实验测得四组(x , y)的值为(1,2) , (2,3) , (3,4) , (4,5),则 y 与 x 之间的回归直线方程为()AAA. y = x + 1B.y = x+ 2AAC.y = 2x + 1 D.y = x 1答案 A解析画出散点图,四点都在直线 y = x + 1.2 下列有关样本相关系数的说法不正确的是()A 相关系数用来衡量变量 x 与 y 之间的线性相关程度B.|r|1 ,且|r|越接近于 1,相关程度越大C.|r|1,且|r|越接近 1,相关程度越小答案 D实用标准文案精彩文档A3 .由一组样本(X

14、1, y1),(X2, y2),,(xn, yn)得到的回归直线方程 y = a + bx,下面有四种关实用标准文案精彩文档至少经过点(xi, yi), (X2, y2),,(Xn, yn)中的一个点;n耳=iXiyi n x y的斜率是- 二一;片=1x2 n x2直线 y = a + bx 和各点(xi, yi),(X2, y2),,(xn, yn)的偏差乙=1(yi a bxi)2是该坐标平面上所有的直线与这些点的偏差中最小的直线. 其中正确的论述有()A. 0 个 B. i 个C. 2 个 D . 3 个答案 D解析线性回归直线不一定过点(xi, yi), (X2,y2),,(Xn,y

15、n) 中的任何一点;b =n耳=iXiyi n x y回归直线是平面上所有直线中偏差刀n匸i(yi a bxi)2取得最小的那一条.故有三种论述是正确的, 选D.4 .设两个变量 x 和 y 之间具有线性相关关系,它们的相关系数是 r , y 关于 x 的回归直线的斜率是 b ,纵截距是 a,那么必有()A. b 与 r 的符号相同B. a 与 r 的符号相同C. b 与 r 的符号相反D . a 与 r 的符号相反答案 A5 .在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为 0.96 和 0.85,则拟合效果好的模型是()A .甲 B.乙C.甲、乙相同 D .不确定答案

16、 A于回归直线方程的论述:A(1) 直线 y = a + bxA直线 y = a + bxA直线 y = a + bx 必过(x , y )点;n片=ix2 n x就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x , y );线性实用标准文案精彩文档6.某化工厂为预测产品的回收率 y ,需要研究它和原料有效成分含量 x 之间的相关关系,现取8 8 8 88 对观测值,计算,得刀i=iXi= 52, Z;=iyi= 228 ,羞ixi2= 478 ,羞iXiyi= 1849 ,则其线性回归方 程为()AAA.y = 11.47 + 2.62 x B.y = 11.47 + 2.62x

17、AAC.y = 2.62 + 11.47 x D.y = 11.47 2.62x答案 AA解析 利用回归系数公式计算可得 a= 11.47 , b = 2.62,故 y = 11.47 + 2.62x.二、填空题7 下表是某厂 14 月份用水量(单位:百吨)的一组数据:月份 x1234用水量 y4.5432.5由散点图可知,用水量 y 与月份 x 之间有较好的线性相关关系,其线性回归直线方程是y 二一0.7x + a,贝Ua 等于_解析 x = 2.5,y = 3.5回归直线方程过定点(x, y),:3.5 = 0.7X2.5 + a.a = 5.25.8 .某服装商场为了了解毛衣的月销售量

18、y(件)与月平均气温 x(C)之间的关系,随机统计了某 4 个月的月销售量与当月平均气温,其数据如下表:月平均气温 x(C)171382月销售量 y(件)24334055由表中数据算出线性回归方程 y 二 bx + a 中的 b -2,气象部门预测下个月的平均气温约为 6C,据此估计,该商场下个月毛衣的销售量约为 _ .nXiyi n x yi=1(参考公式:b =,a = y b x )nx2 n x2答案 46解析 由所提供数据可计算得出 x = 10, y = 38,又 b-2 代入公式 a = y b x 可得 a实用标准文案精彩文档=58,即线性回归方程 y = 2x + 58,将

19、x = 6 代入可得.9 .对 196 个接受心脏搭桥手术的病人和 196 个接受血管清障手术的病人进行了 3 年的跟踪研 究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算 K2二_ .比较这两种手术对病人又发作心脏病的影响有没有差别. _ .392X39X16729X1572答案-1.7868X324X196X196不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析 提出假设 Ho:两种手术对病人又发作心脏病的影响没有差别.392X39X16729X157

20、2根据列联表中的数据,可以求得 K2二- -1.78.68X324X196X196当 Ho成立时 K2-1.78,而 K2V2.072 的概率为 0.85.所以,不能否定假设 Ho.也就是不能作出 这两种手术对病人又发作心脏病的影响有差别的结论.三、解答题10 .某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他 们分别记录了 2010 年 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每100 颗种子中的发芽数,得到如下表:日期12 月 1 日12 月 2 日12 月 3 日12 月 4 日12 月 5 日温差 x(C)101113128发芽数 y

21、(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求线性回归方程,再对被选取的 2 组数据进行检验.(1) 求选取的 2 组数据恰好是不相邻的 2 天数据的概率;(2) 若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求 出 y 关于 x 的线性回归方程 y = bx + a;(3) 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2 颗,则认为得到的实用标准文案精彩文档线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?解析(1)设抽到不相邻的两组数据

22、为事件 A,因为从 5 组数据中选取 2 组数据共有 10 种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)其中数据为 12 月份的日期数. 每种情况都是可能出现的,事件 A 包括的基本事件有 6 种:633所以 P(A) = = 所以选取的 2 组数据恰好是不相邻 2 天数据的概率是.10 55由数据,求得 x = 12 , y = 27.5由公式,求得 b = , a= y b x =一 3.A5所以 y 关于 x 的线性回归方程为 y=-x 3.2A5(3)当 x=10,y=2103=22,|2223|V2;A

23、5同样,当 x= 8 时,y = 28 3 = 17 , |17 16|V2;所以,该研究所得到的回归方程是可靠的.11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的 数据如下:零件的个数 x(个)2345加工的时间 y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;求出 y 关于 x 的线性回归方程 y = bx + a,并在坐标系中画出回归直线; (3)试预测加工 10 个零件实用标准文案精彩文档需要多少小时?n若“xiyi n x y (注:b =n= ,a = y b x )+=1x2 n x2解析(1)散点图如图.由表中数据得:刀

24、匸1xiyi= 52.5 ,4x = 3.5 , y = 3.5,斗=1x2= 54 ,.b = 0.7 ,-a= 1.05 ,y = 0.7x + 1.05.回归直线如图所示.A实用标准文案精彩文档(3)将 x = 10 代入回归直线方程,得 y = 0.7X10 + 1.05 = 8.05(小时).预测加工 10 个零件需要 8.05 小时.12 . (2010 辽宁卷为了比较注射 A, B 两种药物后产生的皮肤疱疹的面积,选200 只家兔做试验,将这 200 只家兔随机地分成两组,每组 100 只,其中一组注射药物 A,另一组注射药物 B.下表 1 和表 2 分别是注射药物 A 和 B 后的试验结果.(疱疹面积单位:mm2)实用标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论