2018-2019学年北师大版数学选修1-2同步学案:第一章 1.2-1.3 相关系数 可线性化的回归分析_第1页
2018-2019学年北师大版数学选修1-2同步学案:第一章 1.2-1.3 相关系数 可线性化的回归分析_第2页
2018-2019学年北师大版数学选修1-2同步学案:第一章 1.2-1.3 相关系数 可线性化的回归分析_第3页
2018-2019学年北师大版数学选修1-2同步学案:第一章 1.2-1.3 相关系数 可线性化的回归分析_第4页
2018-2019学年北师大版数学选修1-2同步学案:第一章 1.2-1.3 相关系数 可线性化的回归分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精1.2相关系数1。3可线性化的回归分析学习目标1。了解线性相关系数r的求解公式,并会初步应用.2.理解回归分析的基本思想.3.通过可线性化的回归分析,判断几种不同模型的拟合程度.知识点一相关系数1.相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r=eq\f(lxy,\r(lxxlyy))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2))。2.相关系数r的性质(1)r的取值范围为[-1,1].(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高.(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关.(2)当r〈0时,两个变量负相关.(3)当r=0时,两个变量线性不相关.知识点二可线性化的回归分析曲线方程曲线图形变换公式变换后的线性函数幂函数曲线y=axbc=lnav=lnxu=lnyu=c+bv指数曲线y=aebxc=lnau=lnyu=c+bx倒指数曲线c=lnav=eq\f(1,x)u=lnyu=c+bv对数曲线y=a+blnxv=lnxu=yu=a+bv1.回归分析中,若r=±1说明x,y之间具有完全的线性关系.(√)2.若r=0,则说明两变量是函数关系.(×)3.样本相关系数的范围是r∈(-∞,+∞).(×)类型一线性相关系数及其应用例1下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0。01),预测2020年我国生活垃圾无害化处理量.附注:参考数据:eq\i\su(i=1,7,y)i=9.32,eq\i\su(i=1,7,t)iyi=40。17,eq\r(\i\su(i=1,7,)yi-\x\to(y)2)=0.55,eq\r(7)≈2.646。参考公式:相关系数r=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\r(\i\su(i=1,n,)ti-\x\to(t)2\i\su(i=1,n,)yi-\x\to(y)2)),回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:b=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,n,)ti-\x\to(t)2),a=eq\x\to(y)-beq\x\to(t).解(1)由折线图中数据和附注中参考数据得eq\x\to(t)=4,eq\i\su(i=1,7,)(ti-eq\x\to(t))2=28,eq\r(\i\su(i=1,7,)yi-\x\to(y)2)=0.55。eq\i\su(i=1,7,)(ti-eq\x\to(t))(yi-eq\x\to(y))=eq\i\su(i=1,7,t)iyi-eq\x\to(t)eq\i\su(i=1,7,y)i=40。17-4×9。32=2.89,r≈eq\f(2。89,0。55×2×2。646)≈0。99。因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由eq\x\to(y)=eq\f(9。32,7)≈1。331及(1)得b=eq\f(\i\su(i=1,7,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,7,)ti-\x\to(t)2)=eq\f(2.89,28)≈0.103,a=eq\x\to(y)-beq\x\to(t)≈1.331-0。103×4≈0。92。所以y关于t的回归方程为y=0。92+0。10t.将2020年对应的t=9代入回归方程得y=0.92+0。10×9=1。82。所以预测2020年我国生活垃圾无害化处理量将约为1.82亿吨.反思与感悟(1)散点图只能直观判断两变量是否具有相关关系.(2)相关系数能精确刻画两变量线性相关关系的强弱.跟踪训练1变量x,y的散点图如图所示,那么x,y之间的相关系数r的最接近的值为()A.1B.-0。5C.0D.0.5考点题点答案C解析从散点图中,我们可以看出,x与y没有线性相关关系,因而r的值接近于0。类型二可线性化的回归分析例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)的数据作了初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(wi-eq\x\to(w))2eq\i\su(i=1,8,)(xi-eq\x\to(x))·(yi-eq\x\to(y))eq\i\su(i=1,8,)(wi-eq\x\to(w))·(yi-eq\x\to(y))46.65636.8289.81。61469108.8表中wi=eq\r(xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)当年宣传费x=49时,年销售量的预报值是多少?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=eq\f(\i\su(i=1,n,)ui-\x\to(u)vi-\x\to(v),\i\su(i=1,n,)ui-\x\to(u)2),α=eq\x\to(v)-βeq\x\to(u).考点非线性回归分析题点非线性回归分析解(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于d=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f(108.8,1.6)=68,c=eq\x\to(y)-deq\x\to(w)=563-68×6。8=100.6,所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100。6+68eq\r(x).(3)由(2)知,当x=49时,年销售量y的预报值y=100。6+68eq\r(49)=576。6。反思与感悟由样本数据先作散点图,根据散点图的分布规律选择合适的函数模型.如果发现具有线性相关头系,可由公式或计算器的统计功能,求得线性回归方程的两个参数.如果发现是指数型函数或二次函数,可以通过一些代数变换,转化为线性回归模型.跟踪训练2在一次抽样调查中测得样本的5个样本点,数值如下表:x0。250.5124y1612521求y关于x的回归方程.考点非线性回归分析题点非线性回归分析解由数值表可作散点图如图,根据散点图可知y与x近似地呈反比例函数关系,设y=eq\f(k,x),令t=eq\f(1,x),则y=kt,原数据变为:t4210。50。25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系,列表如下:itiyitiyiteq\o\al(2,i)1416641622122443155140。5210。2550.2510。250。0625∑7。753694。2521.3125所以eq\x\to(t)=1.55,eq\x\to(y)=7。2.所以b=eq\f(\i\su(i=1,5,t)iyi-5\x\to(t)\x\to(y),\i\su(i=1,5,t)\o\al(2,i)-5\x\to(t)2)≈4。1344,a=eq\x\to(y)-beq\x\to(t)≈0.8.所以y=4.1344t+0.8.所以y与x之间的回归方程是y=eq\f(4.1344,x)+0.8.1.给定y与x是一组样本数据,求得相关系数r=-0。690,则()A.y与x的线性相关性很强B.y与x线性不相关C.y与x正线性相关D.y与x负线性相关考点线性相关系数题点线性相关系数的应用答案D解析因为|r|=|-0。690|〈0.75,所以y与x的线性相关性一般,又因为r=-0。690〈0,所以y与x负线性相关.2.某种细胞在培养正常的情况下,时刻t(单位:分)与细胞数n(单位:个)的部分数据如下:t02060140n128128根据表中的数据,推测繁殖到1000个细胞时的时刻t最接近于()A.200B.220C.240D.260考点非线性回归分析题点非线性回归分析答案A解析由表可得时刻t(单位:分)与细胞数n满足回归方程n=,由此可知n=1000时,t接近200.3.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)考点线性相关系数题点线性相关系数的应用答案D解析∵相关系数|r|≤1,∴D错误.4.由两个变量x与y的散点图可看出样本点分布在一条曲线y=x2的附近,若要将其线性化,则只需要设________即可.考点非线性回归分析题点非线性回归分析答案t=x2解析设t=x2,则y=t为线性回归方程.5.一唱片公司研究预支出费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得到如下的资料:eq\i\su(i=1,10,x)i=28,eq\i\su(i=1,10,x)eq\o\al(2,i)=303。4,eq\i\su(i=1,10,y)i=75,eq\i\su(i=1,10,y)eq\o\al(2,i)=598.5,eq\i\su(i=1,10,x)iyi=237,则y与x的相关系数r的绝对值为________.考点线性相关系数题点线性相关系数的应用答案0.3解析根据公式得相关系数r=eq\f(\i\su(i=1,10,x)iyi-10\x\to(x)\x\to(y),\r(\i\su(i=1,10,x)\o\al(2,i)-10\x\to(x)2\i\su(i=1,10,y)\o\al(2,i)-10\x\to(y)2))=eq\f(237-10×2。8×7.5,\r(303。4-10×2。82598.5-10×7。52))=0。3,所以|r|=0。3.1.散点图的优点是直观.但是有时不能准确判断,尤其数据较多时,不易作出散点图.这时可根据线性相关系数r来判断.2.对于具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决。一、选择题1.若两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归方程为y=bx+a,那么()A.b·r〉0 B.b·r<0C.a·r>0 D.a·r〈0考点线性相关系数题点线性相关系数的应用答案A解析对于回归方程y=bx+a,当b〉0时,x和y正相关,则r>0;当b<0时,x和y负相关,则r<0.综上所述,b·r〉0。2.关于两个变量x,y与其线性相关系数r,有下列说法:①若r>0,则x增大时,y也相应增大;②若|r|越趋近于1,则x与y的线性相关程度越强;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A.①② B.②③C.①③ D.①②③考点线性相关系数题点线性相关系数的应用答案D解析根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.故可知①②③正确.3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并用回归分析方法分别求得相关系数r如表:甲乙丙丁r0。820。780.690。85则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是()A.甲B.乙C.丙D.丁考点线性相关系数题点线性相关系数的应用答案D解析由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性更强,故选D.4.若一函数模型为y=ax2+bx+c(a≠0),为将y转化为关于t的线性回归方程,则需作变换t等于()A.x2 B.(x+a)2C.eq\b\lc\(\rc\)(\a\vs4\al\co1(x+\f(b,2a)))2 D.以上都不对考点非线性回归分析题点非线性回归分析答案C解析y关于t的线性回归方程,实际上就是y关于t的一次函数,因为y=aeq\b\lc\(\rc\)(\a\vs4\al\co1(x+\f(b,2a)))2+eq\f(4ac-b2,4a)(a≠0),故选C.5.对于指数曲线y=aebx,令u=lny,c=lna,经过非线性化回归分析之后,可以转化成的形式为()A.u=c+bx B.u=b+cxC.y=b+cx D.y=c+bx考点非线性回归分析题点非线性回归分析答案A解析对方程y=aebx两边同时取对数,然后将u=lny,c=lna代入,不难得出u=c+bx.6.某奶茶店为了了解奶茶销售量与气温之间的关系,随机统计并制作了6天卖出的奶茶的杯数与气温的对照表:气温x(℃)261914104-1杯数y201242339383505640经检验,这组样本数据具有线性相关关系,那么,对于气温x(℃)与奶茶销售量y(杯)这两个变量,下列判断正确的是()A.呈正相关,其回归直线经过点(12,385)B.呈负相关,其回归直线经过点(12,385)C.呈正相关,其回归直线经过点(12,386)D.呈负相关,其回归直线经过点(12,386)考点线性回归直线方程题点样本点中心的应用答案B解析画出散点图(图略)可知成负相关,又根据表中数据可得eq\x\to(x)=eq\f(26+19+14+10+4+-1,6)=12,eq\x\to(y)=eq\f(201+242+339+383+505+640,6)=385,故选B。7.有一组数据如下表:X1。9933.0024。0015.0326.121Y1。5014。4137。49812.0417.93现准备从以下函数中选择一个能够近似地表示这组数据满足的规律,其中拟合最好的是()A.y=-2x-2 B.y=eq\f(3,2)log2xC.y=2x-1+1 D.y=eq\f(1,2)x2-eq\f(1,2)考点非线性回归分析题点非线性回归分析答案D解析把X看作自变量,Y看作其函数值,从表中数据的变化趋势看,函数递增的速度不断加快.A选项中一次函数是以一个恒定的幅度变化,其图像是直线,不符合本题的变化规律.B选项为对数型函数,随着X的增大Y的递增速度不断变慢,不符合本题的变化规律.C选项为指数型函数,随着X的增大Y的递增速度不断变快,但增长速度超出题目中Y的增长速度,不符合本题的变化规律.D选项是二次函数,对比数据知,其最接近这组数据的变化趋势.故选D.8。设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图,以下说法正确的是()A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.由直线l可知,r一定小于0考点线性相关系数题点线性相关系数的应用答案D解析因为r的符号与线性回归方程y=a+bx斜率符号相同,故r一定小于0。二、填空题9.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为________.考点线性相关系数题点线性相关系数的应用答案1解析根据样本相关系数的定义可知,当所有样本点都在直线y=eq\f(1,2)x+1上时,相关系数为1。10.若已知eq\i\su(i=1,n,)(yi-eq\x\to(y))2是eq\i\su(i=1,n,)(xi-eq\x\to(x))2的4倍,eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))是eq\i\su(i=1,n,)(xi-eq\x\to(x))2的1。5倍,则相关系数r的值为________.考点线性相关系数题点线性相关系数的应用答案eq\f(3,4)解析由r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)),得r=eq\f(3,4)。11.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围.令z=lny,求得线性回归方程为z=0。25x-2.58,则该模型的回归方程为______.考点非线性回归分析题点非线性回归分析答案y=e0.25x-2.58解析因为z=0.25x-2.58,z=lny,所以y=e0.25x-2.58.三、解答题12.噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量I(单位:W/cm2)之间的关系,将测量得到的声音强度Di和声音能量Ii(i=1,2,…,10)数据做了初步处理,得到下面的散点图及一些统计量的值.(数据:eq\x\to(I)=3。16×10-12,eq\x\to(D)=45。7,eq\x\to(W)=-11。5,eq\i\su(i=1,10,)(Ii-eq\x\to(I))2=1.56×10-11,eq\i\su(i=1,10,)(Wi-eq\x\to(W))2=0。51,eq\i\su(i=1,10,)(Ii-eq\x\to(I))(Di-eq\x\to(D))=6.88×10-11,eq\i\su(i=1,10,)(Wi-eq\x\to(W))(Di-eq\x\to(D))=5.1,其中Wi=lgIi,eq\x\to(W)=eq\f(1,10)eq\i\su(i=1,10,W)i)根据给出的数据,求声音强度D关于声音能量I的回归方程D=a+blgI;附:对于一组数据(μ1,υ1),(μ2,υ2),…,(μn,υn),其回归直线υ=α+βμ的斜率和截距的最小二乘估计分别为β=eq\f(\i\su(i=1,n,)ui-\x\to(u)υi-\x\to(υ),\i\su(i=1,n,)ui-\x\to(u)2),α=eq\x\to(v)-βeq\x\to(u)。考点非线性回归分析题点非线性回归分析解令Wi=lgIi,先建立D关于W的线性回归方程,由于b=eq\f(\i\su(i=1,10,)Wi-\x\to(W)Di-\x\to(D),\i\su(i=1,10,)Wi-\x\to(W)2)=eq\f(5.1,0.51)=10,∴a=eq\x\to(D)-beq\x\to(W)=160。7,∴D关于W的线性回归方程为D=10W+160。7,∴D关于I的回归方程为D=10lgI+160.7。四、探究与拓展13.已知某个样本点中的变量x,y线性相关,相关系数r〉0,平移坐标系,则在以(e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论