第4课时线性回归分析与统计案例_第1页
第4课时线性回归分析与统计案例_第2页
第4课时线性回归分析与统计案例_第3页
第4课时线性回归分析与统计案例_第4页
第4课时线性回归分析与统计案例_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、专业文档珍贵文档第4课时线性回归分析与统计案例1甲、乙、丙、丁四位同学各自对A , B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:甲乙丙丁r0.820.780.690.85则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A .甲B .乙C.丙D .丁答案 D2. (2018湖北七市联考)广告投入对商品的销售额有较大影响某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):广告费x23456销售额y2941505971由上表可得回归方程为y=io.2x+a,据此模型,预测广告费为io万元时销售额约为()A. 101.2 万元C. 1

2、11.2 万元答案 CB . 108.8 万元D . 118.2 万元一 1一 1A解析 根据统计数据表,可得x =-x (2 + 3+ 4 + 5+ 6) = 4, y =-x (29+ 41 + 50 + 59+ 71) = 50,而回归直线y55=10.2x+ a经过样本点的中心 (4, 50) , 50 = 10.2 X 4+ ;,解得;=9.2,二回归方程为 b= 10.2x + 9.2,二当 x=10 时,y= 10.2X 10 + 9.2= 111.2,故选 C.3. (2018赣州一模)以下四个命题: 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检

3、测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在回归直线方程y= 0.2x + 12中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位; 分类变量X与Y,对它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中真命题为()A .B .C.答案 DD .解析 为系统抽样;分类变量X与Y,对它们的随机变量 K2的观测值k来说,k越大,“X与Y有关系的把握程度越大.4 .下面是一个2X 2列联表y1y2总计X1a2173X2222547合计b46120其中a, b处填的值分别为()B. 5250D. 7452A. 9472C.

4、 5274答案 C解析 由 a+ 21= 73,得 a= 52, a+ 22= b,得 b = 74故选 C.5. (2018湖南衡阳联考)甲、乙、丙、丁四位同学各自对A , B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r与残差平方和 m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A , B两变量有更强的线性相关性 ()A .甲B .乙C.丙D .丁答案 D解析r越大,m越小,线性相关性越强.故选D.6. (2018衡水中学调研)以下四个命题中,真命题是 ()A 对分类变量x与y的随机变量K2的观测值k来说,k越小,

5、判断“ x与y有关系”的把握程度越大B. 两个随机变量的线性相关性越强,相关系数的绝对值越接近于0C. 若数据X1,X2,X3, ,Xn的方差为1,则2X!,2x?,2X3, ,2x“的方差为2D .在回归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好答案 D解析 对于A,对分类变量x与y的随机变量K2的观测值k来说,k越大,判断“x与y有关系”的把握程度 越大,故A错误;对于B,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故B错误;对于C,若数据X1, X2, X3, , , Xn的方差为1,贝U 2X1, 2X2, 2X3 , , , 2Xn的方

6、差为4,故C错误;对于 D , 根据离散变量的线性相关及相关指数的有关知识可知D正确.7. 2015年年度史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传.某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在10 , 14, 15 ,19, 20 , 24, 25 ,2930, 34的爱看比例分别为 10%, 18% , 20%, 30% , t%.现用这5个年龄段的中间值代表年龄段,女口 12代 表10 , 14 , 17代表15 , 19,根据前四个数据求得爱看比例y关于x的线性回归方程为y = (kx 4.68)% ,由此可推测t的值为()A. 33B.

7、 35D . 39C. 37答案 B1 解析 依题意,X=:x (12+ 17+ 22 + 27) = 19.5,41 y=(10% + 18% + 20% + 30%) = 19.5% ,又/回归直线必过点(x, y),2 41819.5%= (kX 19.5 4.68)% ,解得 k =-,1 9502 418当x=32 时,(贡X 32468)%& (2018广西南宁月考)某同学寒假期间对其 30位亲属的饮食习惯进行了一次调查,列出了如下列联表:偏爱蔬菜偏爱肉类合计50岁以下481250岁以上16218合计201030则可以说其亲属的饮食习惯与年龄有关的把握为()附: k2= (a+b)

8、( n+d)d(ba+ c)( b+d)2P(K k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828A.90%B . 95%D . 99.9%C. 99%答案 C解析由2X 2列联表知,K2=30X (4X 2 16X 8)12X 18X 20X 10210.T K 6.635,K2 k0)0.150.100.050.0250.0100.0050.001答案 Dk2.0722.7063.8415.0246.6357.87910.8282解析 将2X2列联表中的数据代入计算,得k2=100 X ( 3

9、0X 10 45X 15)45 X 55 X 75 X 253.030,/ 2.7063.0303.841 ,在犯错误的概率不超过0.1的前提下,10 某研究机构对高三学生的记忆力 x则y对x的线性回归直线方程为()A y = 2.3x 0.7X681012y2356可以认为 “赞成自助游与性别有关 和判断力y进行统计分析,所得数据如下表:B y = 2.3x + 0.7C. y = 0.7x 2.3D . y = 0.7x + 2.3ny 君 xiy nxy y y(相关公式: b= n, a= y bx)Exi2 nx2i = 1答案 C解析4vE xiyi = 6X 2+ 8X 3+ 1

10、0X 5 + 12X 6 = 158,6+ 8 +10+12小x = 9, y=42 + 3 + 5+ 6 = 4.4158 4X 9X 436 + 64 + 100 + 144 4 X 81a= 4 0.7X 9= 2.3.现已知其线性回归方程为y=0.36x+a,则根据此线性回归方程估计数学得90分的同学的物理成绩为(四舍五入到整数).答案 73解析60 + 65+ 70+ 75 + 805=70,62+ 64+ 66+ 68 + 705=66,所以 66= 0.36 X 70 + 彳,解得 a= 40.8.所以 0.36X 90 + 40.8 = 73.2 73.12.某工厂为了对一种新

11、研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为y=4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为1答案3 解析 由表中数据得x = 6.5, y= 80,由y= 4x +彳,得a= 106,故线性回归方程为y =- 4x + 106将(4,90),(5, 84), (6, 83), (7, 80), (8, 75), (9, 68)分别代入回归方程,可知有 6个基本事件,因 84 4X 5+ 1062 1=86, 68 k0)0.150.100.050.0250

12、.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828(a+ b)( e + d)( a+ e)( b + d),其中 n= a+ b+ e+d.答案(1)见解析(2)有关解析(1)根据频率分布直方图可知,前两组的学生总数为(0.032 + 0.08) X 5X 50= 10,又前两组的学生中体育生有8名,所以前两组的学生中艺术生有2名,故2X 2列联表如下:心率小于60次/分心率不小于60次/分合计体育生81220艺术生22830合计104050由中数据知,K2 =二黑/。2;2) 8.3337.879,故有995%的把握认为“心率小于60次

13、/分与常年进行系统的身体锻炼有关”.14. (2018山东日照一模)某学校高三年级有学生500人,其中男生300人,女生200人.为了研究学生的数学体育生常年进行系统的身体锻炼,艺术生则很少进行系统的身体锻炼,若前两组的学生中体育生有成绩是否与性别有关,现采用分层抽样的方法,从中抽取了100名学生,先统计了他们期中考试的数学分数,然后按性别分为男、 女两组,再将两组学生的分数分成5组:100, 110), 110,120),120,130),130, 140),140, 150分别加以统计,得到如图所示的频率分布直方图.(1) 从样本中分数低于110分的学生中随机抽取两人,求这两人恰好为一男一

14、女的概率;(2) 若规定分数不低于130分的学生为“数学尖子生”, 请你根据已知条件完成 2X 2列联表,并判断是否有90% 的把握认为“数学尖子生与性别有关”.2附:k2=n( ad be)附(a+ b)( e + d)( a+ e)( b + d)2P(K k)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828答案(1)3有关5解析(1)由已知得,抽取的100名学生中,男生60名,女生40名.分数低于110分的学生中,男生有 60X 0.05= 3(人),记为A1, A2, A3;女生有40X 0.05= 2(人),记为B-B2.从中随机

15、抽取两名学生,所有的可能结果共有 10种,它们是(A1 , A2), (A1, A3), (A2, A3), (A1, B1), (A1,B2), (A 2, B1), (A2, B2), (A3, B1), (A3, B2)(B1, B2);其中两名学生恰好为一男一女的可能结果共有6种,它们是(A1, B1), (A1, B2), (A2, B1), (A2, B2), (A3,B1), (A3, B0.所求概率为p=即|.由频率分布直方图可知,低于130分的女生人数为在抽取的100名学生中,分数不低于130分的男生人数为 60X 0.25= 15,分数不40X 0.4= 16,据此可得2X

16、 2列联表如下:数学尖子生非数学尖子生合计男生154560女生162440合计3169100260 X 40 X 31 X 69.k2= 100 X( 15X 24二 16X 45) 2.5252.706 , 没有90%的把握认为“数学尖子生与性别有关15. (2017四川广元二诊)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数, 得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x( C)101113128发芽数y(颗)2325302616该农科所确定

17、的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1) 求选取的2组数据恰好是不相邻两天数据的概率;若选取的是12月1日与12月5日的数据,请根据12月2日至12月4日的数据,求出y关于x的线性回 归方程y = bx + a;2颗.则认为得到的线性回归方程(3) 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 是可靠的试问(2)中所得到的线性回归方程是可靠的吗?附:回归直线的斜率和截距的最小二乘估计公式分别为:3 a 5答案(1)5 (2) y = ?X 3可靠解析(1)设“选取的2组数据恰好是不相邻两天的数据”为事件A.从

18、 5 组数据中选取 2 组数据共有 10 种情况:(1 , 2), (1 , 3), (1 , 4), (1 , 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5),其中数据为12月份的日期数.每种情况都是等可能出现的,事件A包括的基本事件有 6种.P(A)=走35.选取的2组数据恰好是不相邻两天数据的概率是3.5(2)由数据可得25+ 30+ 263=27.人_ (11 12)X( 25 27) + ( 13 12)X( 30 27) + ( 12 12)X( 26 27)5b=( 11 12) 2+( 13 12) 2+( 12 12) 2

19、= 2,A A 5a= y b x = 27 尹 12= 3.A 5 y关于x的线性回归方程为y = |x 3.5当 x= 10 时,y = |x 10 3= 22 , |22 23|2;A 5同理,当 x= 8 时,y = X 8 3= 17, |17 16|2. (2)中所得到的线性回归方程是可靠的.16. (2018河北唐山模拟)某市春节期间7家超市的广告费支出 xi(万元)和销售额yi(万元)数据如下:超市ABCDEFG广告费支出Xi1246111319销售额yi19324044525354若用线性回归模型拟合 y与x的关系,求y关于x的线性回归方程;用二次函数回归模型拟合y与x的关系

20、,可得回归方程:y A = - 0.17x2+ 5x + 20,经计算二次函数回归模型和线性回归模型的R2分别约为0.92和0.75,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出3万元时的销售额.n77 2 a jt/iyi-n - y a a参考数据及公式:x= 8, y = 42,12 xiyi = 2 794,12 xi = 708, b = n, a= y bx.i=1 i=1厂 22t xi nxi = 1答案(1) y = 1.7x + 28.4(2)33.47解析7,八atxiyi 7xy2794 7 X 8 X 42aa(1)b=27 2=708 7XX

21、=也 a=y bx=42 8 =昭t Xi 7X y关于x的线性回归方程是y = 1.7x + 28.4./ 0.75 k)0.50.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828答案 B解析 只有错误,应该是y平均减少5个单位.3. (2018湖南衡阳模拟)根据“ 2015年国民经济和社会发展统计公报”中公布的数据,从 2011年到2015 年,我国的第三产业在 GDP中的比重如下:年份20112012201320142015年份代码x12345第三产业比重y

22、/%44.345.546.948.150.5(1)在所给坐标系中作出数据对应的散点图;50.750J-49.949.549. L -48”48 J 47,947.547.1阪34245,5 -45.1 -44.7-44一茶建立第三产业在 GDP中的比重y关于年份代码x的回归方程;按照当前的变化趋势,预测 2018年我国第三产业在 GDP中的比重.附:回归直线y= a + bx的斜率和截距的最小二乘估计分别为nA 君(x x)( yi y)A Ab n:, a y bx.ng ( Xi X) 2I 1答案 见解析 (2) A 1.5x + 42.56(3)54.56%解析(1)数据对应的散点图如

23、图所示.$T - - -IIIO 23456 -V5A 君(X x)( y y)15 一 A A(2) x 3, y 47.06, b51.5, a y bx 42.56,占(xi -x) 210所以回归直线方程为y 1.5x + 42.56.代入2018年的年份代码x 8,得y 1.5X 8 + 42.56 54.56,所以按照当时的变化趋势,预计到 2018年,我国第三产业在 GDP中的比重将达到 54.56%.4. 假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如以下的统计数据;x(年)23456y(万元)2.23.85.56.57.0求x , y ;(2) 对x, y进行线性相关性检验;(3) 如果x与y具有线性相关关系,求出回归直线方程;估计使用年限为10年时,维修费用约是多少?答案 x = 4, y = 5(2)略 (3) y = 1.23x+ 0.08(4)12.38 万元解析(1) x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论