版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2课时Gj措攵相关系数与非线性回归学习目标核心素养1. 了解两个变量间的线性相关系数r,并能利用公式 求相关系数r.(重点)1.通过学习相关系数,培养数学运算的素养.2,能利用相关系数r判断两个变量线性相关程度的大小,从而判断回归直线方程拟合的效果.(重点)3.掌握非线性回归转化为线性回归的方法,会求非线性回归方程,并作出预测.(难点)2 .借助非线性回归方程 的学习,提升数据分析和 数学建模的素养.情壮味导学 情境导学。探新知 换印京卷影W心情境羽人助学助效据隆众资讯数据统计,20172019年截止到10月底的数据显示,聚丙烯期货价格及现货价格二者相关系数为88.70%,其中2017年二者
2、相关系数高达90.86%,2018年降至83.97%,2019年截止到10月底二者相关系数为65.23%.问题:什么是相关系数,如何计算,它有什么作用?I .新知初探.I.相关系数(1)定义:统计学里一般用r 二来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系 数).(2)性质|r|01,且y与x正相关的充要条件是r0, y与x负相关的充要条件是r 0)B 散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.4.在一次试验中,测得(x, y)的四组值分别为(1,2), (2,0), (4, 4), ( 1,6), 则y与x的相关系数为.20 4X1.5X 1-
3、1 法一:x =1.5, y = 1, )x2= 22,国y2= 56, i与xiyi = 20,相关系数r=f=一1.7 224X 1.5C. y=x+1D . y= x(2)设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x 一一. A. 一 A_.的回归直线方程的回归系数为b,回归截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相同(1)A (2)A (1) v这组样本数据的相关系数为一1,这一组数据(x,y1), (x2, y2),的,yn)线性相关,且是负相关, 56-4X 12法二:观察四个点,发现其在一条单调递减的
4、直线上,故 y与x的相关系数为1.睫畔同厩韩6 合作探究。释疑难 学科木艮町鼠要M 1相关系数的性质【例 1】(1)在一组数据为(xi ,y1),(x2,y2),,(xn,yn)(n2,xi,x2,,xn不全相等)的散点图中,若这组样本数据的相关系数为一1,则所有的样本点(xi, yi)(i=1,2,n)满足的方程可以是().1 一一A . y= 2x+1B . y=x10优教可排除D, B, C,故选A.由公式可知b与r的符号相同.1*,*规法线性相关强弱的判断方法:.散点图(越接近直线,相关性越强);.相关系数(绝对值越大,相关性越强).跟进训练1 .如图是具有相关关系的两个变量的一组数据
5、的散点图和回归直线,若去掉一个点使得余下的()5个点所对应的数据的相关系数最大,则应当去掉的点是B. ED. AA. DC. F因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点 E,余下的5个点所对应的数据的相关系数最大.相关系数的计算及应用【例2】 假设关于某种设备的使用年限 x(单位:年)与所支出的维修费用 y(单位:万元)有如下统计资料:x23456y2.23.85.56.57.09例教555已知户 1x2 = 90, 总黄=140.8,*xiyi = 112.3,甲能 8.9,g=1.4.计算y与x之间的相关系数(精确到0.001)
6、,并求出回归直线方程;根据回归方程,预测假设使用年限为 10年时,维修费用约是多少万元?解(1) v x2+3+4+ 5+ 6=4,2.2 + 3.8+5.546.5+7.0 TOC o 1-5 h z y = 5.? ,Li Zxiyi 5 x y = 112.3 5X4X5=12.3, o -ooi*25x2=90 5X42=10, -oi与y2 5 y 2= 140.8- 125= 15.8,0.987.12.312.312.312.3#10X15.8 V158 2XV79 1.4X 8.91.23.人 Ixiyi-5x k 112.35X4X5Ex2-5x2 =90-5X42;i =
7、1a= y bx = 5 1.23X 4 = 0.08.所以回归直线方程为y=1.23x+ 0.08.(2)当 x=10 时,y= 1.23 0+0.08=12.38(万元),即假设使用10年时,维修费用约为12.38万元.跟进训练2.某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有 如下的对应关系:x2468y30405070计算x与y之间的相关系数,并求其回归直线方程;(2)若实际销售额不少于80百万元,则原料耗费应该不少于多少?解(1)画出(x, y)的散点图如图所示,由图可知x, y有线性关系.46 K再4X=5, y=47.5, Ex2=120, Eiy2=9 9
8、00, )xiy = 1 080,故相关系数r =,xyi 4 x y4411x24二方y、4歹2_1 0804X5X47.50982 70 120-4X52 9 900-4X47.52 .4i 中yi 4 x y 1 080 4X5X47.5b - -4Ex2-4 x2 i = 1120 4X52= 6.5,a= y -bx =47.56.5X5=15.故回归直线方程为y=6.5x+15.(2)由回归直线方程知,A一一.当y80即6.5x+1580l寸,x10.故原料耗费应不少于10百万元.M5TB非线性回归方程探究问题已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?x1
9、23y35.9912.01y=3X2x1;y=log2x;、=4x;y=x2.提示作出散点图(图略),观察散点图中样本点的分布规律可判断样本点分布在曲线y=3X2x-1附近.作为回归模型最好.si优教【例3】 某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得 到如下数据:x12345678y1126144.53530.5282524根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+b和指数函数模型v= 06dx分别对两个变量的关系进行拟合.已求得用指数函 x.数
10、模型拟合的回归方程为,=96.54e 0.2x, In y与x的相关系数ri= 0.94.1参考数据其中Ui =:xi8Ruiyi一u一2 U8Eu2 i=18Eyi i = 1 J8耳y2 i =v0.61X6 185.52 e183.40.340.1151.5336022 385.561.40.135(1)用反比例函数模型求y关于x的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根 据市场调研数据,若该产品单价定为100元,则签订9千件订单
11、的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为 0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2) 的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理0优教由.参考公式:对于一组数据(U1 , 5),(U2,明 ,(un, in),其回归直线u= a工 -ui n u u+ B u的斜率和截距的最小二乘估计分别为: 片一n, a= u 0u ,斗2 nU2工 -3ui 如一n u ui = 1相关系数r= nnEu2 nH2 i5一nJ21 . . b.思路点拨(1)首先可令u = X并将y=a
12、 + b转化为v= a+ bu,然后根据题目所给数据以及线性回归方程的相关公式计算出 b以及a,即可得出结果;计算出反比例函数模型的相关系数 r并通过对比即可得出结果;(3)可分别计算出单价为100元和90元时产品的利润,通过对比即可得出结果.爸 一a 占Uy 8uy b;.u2 8-u2 i=1 TOC o 1-5 h z 解(1)令u=1,则y=a + b可转化为y=a+bu,因为刀M等MdS,所以 人入183.4-8X0.34X45611008X0.115O.61则a=一b u =45 100X0.34= 11,a所以丫= 11 + 100u,a 100所以y关于x的回归方程为y= 11
13、 + .1(2)y与;的相关系数为: x2 =工 2 1uiyi n u y612 - 2二一10.61X6 185.5 i? 1吁 8ui?8y= 0.99.j怪因为|ri|0.711 附,e 0.36x+ 32 0.711 8= eln 0711 8= e a34,所以0.36x+3.62 d0.34,解得x11因此预测在收购该型号二手车时车 辆的使用年数不得超过11年.课堂知汉卦实 课堂小结”提素养 风基盲在扫除口必备素养口.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r,前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强 弱.只有当两变量间呈线性相关关
14、系时,才可以求回归系数,得到回归直线、一 A A A 一.方程y=bx+a;若两变量间的关系不是线性相关关系,应观察分析其散点图,找 出拟合函数,通过变量代换把非线性回归问题转化为线性回归问题.匚j学以致用.两个变量之间的线性相关程度越低,其线性相关系数的数值()A.越接近于1B.越接近于0C,越接近于1D.越小B 由相关系数的含义可得:两个变量之间的线性相关程度越低,其线性相 关系数的数值越接近于0.故选B.如图所示,给出了样本容量均为 7的A, B两组样本数据的散点图,已知A组样本数据的相关系数为 门,B组数据的相关系数为r2,则( B. r1r2D.无法判定C 根据A, B两组样本数据的
15、散点图知,A组样本数据几乎在一条直线上,且成正相关,相关系数为ri应最接近1, B组数据分散在一条直线附近,也成正相关,:相关系数为2,满足r2V门,即rir2,故选C.3.对于线性相关系数r,叙述正确的是()A. rC(oo, +oo),且r越大,相关程度越大B . r C ( 00, + 00 ), 且|r整大,相关程度越大r-1,1,且r越大,相关程度越大r-1,1,且|r|越大,相关程度越大D 相关系数r是来衡量两个变量之间的线性相关程度的,线性相关系数是 一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大.故选D.若回归直线方程中的回归系数b = 0,则相关系数r =相关
16、系数nn国 xi又 2i51 yi-Vn百1 xi x yi yn耳Ai= 1h 与 b=一2xi x yi y二的分子E xi- x 2i = 1相同,故r=0.根据统计,某蔬菜基地西红柿亩产量的增加量 y(百千克)与某种液体肥料 每亩使用量x(千克)之间的对应数据的散点图如图所示.m 二一t八Q 24 5 68可千克)(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计 算相关系数r并加以说明(若|r|0.75,则线性相关程度很高,可用线性回归模型 拟合);12千克时,西红(2)求y关于x的回归方程,并预测液体肥料每亩使用量为13必措攵柿亩产量的增加量y约为多少?附:相关
17、系数公式nn0.9=0.95.0.3=0.55,=3+4+4+4+5=4.回归方程y = bx + a中斜率和截距的最小二乘估计公式分别为:b =nn方 xi- x y- y 斗yi nx y二 xi-占15春=注0.95一一一3所以与(xi- x)(yi- y) = ( 3)X(1)+(1)X0+0X0+1X0+3X 1 = 6, x a= y b x .=V -32+ -1 2+02+12+32 =廓,因为r0.75,所以可用线性回归模型拟合y与x的关系.5人i =1(2)b= xi x yi y5E i=1一 2 xi x6 20=0.3.14e危攵人那么 a = 4 5X0.3 = 2.5.所以回归方程为y=0.3x+ 2.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑工程人员聘用合同修订版
- 物流公司员工试用期评估准则
- 银行内部竞聘述职报告
- 用电安全家长会
- 体育馆装修工程施工合同
- 【初中历史】夏商周时期的科技与文化课件++2023-2024学年统编版七年级历史上册
- 听神经瘤围手术期护理
- 糖尿病足部坏疽护理
- 电影院的营销活动策划
- 河北省邢台市威县2024-2025学年七年级上学期期中生物试题(含答案)
- 半导体芯片项目商业计划书范文参考
- 邯郸市政府采购办事指南
- 智能交通控制的课程设计
- 城市初期雨水污染治理
- 在护林员培训班上的讲话护林员会议讲话稿.doc
- 材料科学基础-第7章-三元相图
- (完整word版)高频变压器的设计
- 公路工程2018各项费用的计算程序及计算方式
- 户外急救知识(必备)
- 新浙摄版(2020)五年级下册信息技术全册教案
- 中国中国鲜红的太阳永不落-合唱简谱-歌词
评论
0/150
提交评论