数学北师大版选修1-2学案第一章第1节回归分析(第2课时)_第1页
数学北师大版选修1-2学案第一章第1节回归分析(第2课时)_第2页
数学北师大版选修1-2学案第一章第1节回归分析(第2课时)_第3页
数学北师大版选修1-2学案第一章第1节回归分析(第2课时)_第4页
数学北师大版选修1-2学案第一章第1节回归分析(第2课时)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2相关系数1.了解回归分析的概念和最小二乘法的求法及作用.2.理解相关系数的含义及求法.3.了解回归分析的基本思想.会建立回归模型,并能利用回归分析进行有效预测.1.变量间的关系往往会表现出某种不确定性,________就是研究这种变量之间的关系的一种方法,通过对变量之间关系的研究,从而发现蕴涵在事物或现象中的某些规律.【做一做1】下列两变量中具有相关关系的是().A.正方体的体积与边长 B.人的身高与体重C.匀速行驶的车辆的行驶距离与时间 D.球的半径与体积2.假设样本点为(x1,y1),(x2,y2),…,(xn,yn),我们可用____________求变量之间的线性回归方程y=a+bx,即求a,b,使这n个点与直线y=a+bx的“距离”平方之和最小,即使得Q(a,b)=(y1-a-bx1)2+(y2-a-bx2)2+…+(yn-a-bxn)2达到最小.3.Q(a,b)=lyy+n[eq\x\to(y)-(a+beq\x\to(x))]2+lxxeq\b\lc\(\rc\)(\a\vs4\al\co1(b-\f(lxy,lxx)))2-.其中eq\x\to(x)=eq\f(x1+x2+…+xn,n)=eq\f(1,n)eq\i\su(i=1,n,x)i,eq\x\to(y)=eq\f(y1+y2+…+yn,n)=eq\f(1,n)eq\i\su(i=1,n,y)i,lxx=eq\i\su(i=1,n,)(xi-eq\x\to(x))2=eq\i\su(i=1,n,x)eq\o\al(2,i)-neq\x\to(x)2,lxy=eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))=eq\i\su(i=1,n,x)iyi-neq\x\to(x)eq\x\to(y),lyy=eq\i\su(i=1,n,)(yi-eq\x\to(y))2=eq\i\su(i=1,n,y)eq\o\al(2,i)-neq\x\to(y)2.当Q(a,b)取最小值时,b=____________,a=________.y对x的线性回归方程为__________,此直线一定过点______.公式比较复杂难记,只需记住a,b的求值公式即可.做题要细心,不可遗漏数据,使用公式计算时,可通过列出表格,进行计算,表格如下:ixiyixeq\o\al(2,i)xiyi123…n∑eq\i\su(i=1,n,x)ieq\i\su(i=1,n,y)ieq\i\su(i=1,n,x)eq\o\al(2,i)eq\i\su(i=1,n,x)iyi【做一做2-1】已知x与y之间的一组数据如下表,则y与x的线性回归方程y=bx+a必过点__________.x0123y1357【做一做2-2】已知三个样本点(3,10),(7,20),(11,24),求出其线性回归方程.4.判断两个变量之间的线性相关关系的方法有(1)________________________;(2)______________________.两个变量之间是否有线性相关关系,可以通过画散点图直观判断,但是在某些情况下,从散点图中不容易判断变量之间的线性相关关系,特别是当数据量较大时,画散点图比较麻烦,此时就可以通过计算,用线性相关系数r来作出判断,比较容易实施.5.假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r的计算公式为r=__________________.线性相关系数|r|≤1,|r|越大,变量之间的线性相关程度越高,用直线拟合的效果就越好.线性相关系数r的计算公式虽然比较复杂,但是可以分开计算.因为在求线性回归方程时,也要计算eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)iyi和eq\i\su(i=1,n,x)eq\o\al(2,i)等量,只需再把eq\i\su(i=1,n,y)eq\o\al(2,i)计算出来即可.通常是通过列表格来完成上述各项的计算.【做一做3】在建立两个变量y与x的线性回归模型中,分别选择了4个不同的模型,它们的相关系数r如下,其中拟合得最好的模型是().A.模型1的相关系数rB.模型2的相关系数rC.模型3的相关系数rD.模型4的相关系数r答案:1.回归分析【做一做1】B选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶的车辆的行驶距离与时间成正比,也有函数关系;选项D中球的体积是eq\f(4,3)π与半径的立方相乘,有固定的函数关系.所以只有选项B中人的身高与体重具有相关关系.2.最小二乘法3.eq\f(lxy,lxx)=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)eq\x\to(y)-beq\x\to(x)y=a+bx(eq\x\to(x),eq\x\to(y))【做一做2-1】eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,2),4))线性回归方程一定过点(eq\x\to(x),eq\x\to(y)),又eq\x\to(x)=eq\f(1,4)×(0+1+2+3)=eq\f(3,2),eq\x\to(y)=eq\f(1,4)×(1+3+5+7)=4,∴线性回归方程必过点eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,2),4)).【做一做2-2】分析:样本点共有三个,可以直接计算.解:由所给数据可得:eq\x\to(x)=7,eq\x\to(y)=18,eq\i\su(i=1,3,x)iyi=434,=179,进而可以求得b=eq\f(\i\su(i=1,3,x)iyi-3\x\to(x)\x\to(y),\i\su(i=1,3,x)\o\al(2,i)-3\x\to(x)2)=eq\f(434-3×7×18,179-3×49)=1.75,a=eq\x\to(y)-beq\x\to(x)×7=5.75.∴线性回归方程为yx.4.(1)画散点图(2)计算线性相关系数5.eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2))【做一做3】A1.求线性回归方程的一般步骤剖析:(1)作散点图:对于样本点(x1,y1),(x2,y2),…,(xn,yn),在坐标系内作出散点图,并观察各样本点是否呈条状分布,是否都分布在一条直线的两侧.若是,则可设其线性回归方程为y=a+bx.(2)列表:对于所给出的数据x,y列成相应的表格.ixiyixeq\o\al(2,i)xiyi1x1y1xeq\o\al(2,1)x1y12x2y2xeq\o\al(2,2)x2y2……………nxnynxeq\o\al(2,n)xnyn∑eq\o(∑,\s\up6(n),\s\do4(i=1))xieq\o(∑,\s\up6(n),\s\do4(i=1))yieq\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)eq\o(∑,\s\up6(n),\s\do4(i=1))xiyi(3)计算:eq\x\to(x)=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))xi,eq\x\to(y)=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))yi,b=,a=eq\x\to(y)-beq\x\to(x).(4)写出回归方程:y=a+bx.2.样本的选取是否影响两个变量的线性回归方程剖析:会影响.这是因为我们所采集的样本只是两个变量之间的部分数据的关系,而且它们的散点图分布在某一条直线的附近,不一定就在直线上,所以不能用某个一次函数y=a+bx来准确地表达它们之间的关系,我们只能近似地看作两个变量之间满足线性关系,符合一个一次函数y=a+bx,而将x=xi代入时,得到y的值与所测得的yi之间存在着一定的误差,误差为yi-y=yi-(a+bxi)=yi-a-bxi(i=1,2,…,n),那么,我们要想用y=a+bx拟合得好一点,就要使误差小一点.但不能把这些误差直接相加,这是因为它们有正有负,相加可能抵消一部分,为了不使误差之和正负抵消,我们可设全部误差的平方和为Q(a,b),即Q(a,b)=eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-a-bxi)2,用Q的大小来度量总的误差大小,Q是a,b的二元函数.当b=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2)时,Q(a,b)最小,此时a=eq\x\to(y)-beq\x\to(x).由此看来,所取的样本点不同,有可能得到的线性回归方程不同.题型一求线性回归方程【例题1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下表所示:零件数x/个102030405060708090100加工时间y/分626875818995102108115122(1)求y对x的线性回归方程;(2)据此估计加工200个零件所用的时间是多少?反思:计算线性回归方程比较麻烦,对于样本点较少的情况可直接代入公式计算求值.实际问题中的数据都不好算,一般要借助计算器来完成.题型二计算线性相关系数【例题2】某工厂有一大型机器设备,其使用年限x(年)与所支出的维修费用y(万元)有如下的统计资料:使用年限x/年2345678维修费用y/万元请问维修费用y与使用年限x之间是否具有线性相关关系?如果具有,请求出线性回归方程.分析:本题为探索两个变量之间是否具有线性相关关系的题型,可通过计算线性相关系数来加以判断,因为数据比较多,可列表分项计算.反思:对于数量比较多的数据判断它们相应的变量是否线性相关,可通过计算线性相关系数来判断.题型三利用回归分析进行有效预测【例题3】为了了解某地母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:母亲身高x/cm159160160163159154159158159157女儿身高y/cm158159160161161155162157162156(1)试对x与y进行线性回归分析,并预测当母亲身高为161cm时,(2)求相关系数r,并分析模型的拟合效果.分析:通过观察两变量对应的数据,可判断x与y之间存在线性相关关系,通过列表计算,求出回归方程,并通过计算线性相关系数来判断两变量的线性相关程度.反思:一个模型拟合得好不好,可通过计算线性相关系数r来判断,|r|的值越接近于1,变量之间的线性相关程度越高,拟合得越好.答案:【例题1】解:(1)列出下表,并用科学计算器进行计算.i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200eq\x\to(x)=55,eq\x\to(y)=91.7,eq\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,i)=38500,eq\o(∑,\s\up6(10),\s\do4(i=1))xiyi=55950设所求的回归直线方程为y=bx+a.同时,利用上表可得b=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)=eq\f(55950-10×55×,38500-10×552)≈,a=eq\x\to(y)-beq\x\to(x)≈-×55=,即所求的线性回归方程为y=x+54.96.(2)这个线性回归方程的意义是当x增大1时,y,y不随x增大而变化的部分.因此当x=200时,y的估计值为y=+×200=≈189.故加工200个零件时所用的时间约为189分.【例题2】解:列表:ixiyixeq\o\al(2,i)yeq\o\al(2,i)xiyi12423934164525563667497864∑35203由此可得:eq\x\to(x)=5,eq\x\to(y)≈7,eq\i\su(i=1,7,x)iyi=251.1,eq\i\su(i=1,7,x)eq\o\al(2,i)=203,eq\i\su(i=1,7,y)eq\o\al(2,i)=311.51.∴线性相关系数r=eq\f(\i\su(i=1,7,x)iyi-7\x\to(x)\x\to(y),\r(\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)\r(\i\su(i=1,7,y)\o\al(2,i)-7\x\to(y)2))≈eq\f(251.1-7×5×7,\r(203-7×52)×\r(311.51-7×72))≈5.∴维修费用与使用年限之间存在线性相关关系.b=eq\f(\i\su(i=1,7,x)iyi-7\x\to(x)\x\to(y),\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)≈eq\f(251.1-7×5×7,203-7×52)≈7,a=eq\x\to(y)-beq\x\to(x)≈7×52,∴线性回归方程为y7x.【例题3】解:列表:ixiyixeq\o\al(2,i)yeq\o\al(2,i)xiyi11591582528124964251222160159256002528125440316016025600256002560041631612656925921262435159161252812592125599615415523716240252387071591622528126244257588158157249642464924806915916225281262442575810157156246492433624492∑15881591252222253185252688(1)由表可得eq\x\to(x)=158.8,eq\x\to(y)=159.1,eq\i\su(i=1,10,x)eq\o\al(2,i)=252222,eq\i\su(i=1,10,y)eq\o\al(2,i)=253185,eq\i\su(i=1,10,x)iyi=252688,进而可以求得b=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)=eq\f(252688-10××,252222-10×2)≈0.78,a=eq\x\to(y)-beq\x\to(x)×≈35,∴线性回归方程为yx.当x=161cm时,y=cm(2)r=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\r(\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)\r(\o(∑,\s\up6(10),\s\do4(i=1))y\o\al(2,i)-10\x\to(y)2))=eq\f(252688-10××,\r(252222-10×2)×\r(253185-10×2))≈0.715,说明模型拟合得效果较好.1由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的线性回归方程为y=a+bx,则下列说法正确的是().A.直线y=a+bx必过点(,)B.直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一点C.直线y=a+bx是由(x1,y1),(x2,y2),…,(xn,yn)中的两点确定的D.(x1,y1),(x2,y2),…,(xn,yn)这n个点到直线y=a+bx的距离之和最小答案:A正确理解线性回归方程的含义,所求的线性回归方程并不一定要经过这n个样本点中的某些点,而是这n个点到直线的距离的平方和最小,即用最小二乘法求出线性回归方程中a,b的值,由于a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论