高中数学人教B版第二章统计2.3变量的相关性 2023版第2章变量的相关性_第1页
高中数学人教B版第二章统计2.3变量的相关性 2023版第2章变量的相关性_第2页
高中数学人教B版第二章统计2.3变量的相关性 2023版第2章变量的相关性_第3页
高中数学人教B版第二章统计2.3变量的相关性 2023版第2章变量的相关性_第4页
高中数学人教B版第二章统计2.3变量的相关性 2023版第2章变量的相关性_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变量的相关性变量间的相关关系两个变量的线性相关1.理解两个变量的相关关系的概念.(重点)2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点)3.能根据给出的线性回归方程系数公式求回归直线方程.(重点)4.对最小二乘法原理的理解及应用.(难点)[基础·初探]教材整理1变量间的相关关系阅读教材P73,完成下列问题.1.两个变量的关系分类函数关系相关关系特征两变量关系确定两变量关系带有随机性2.散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.如图2­3­1所示的两个变量不具有相关关系的有________.图2­3­1【解析】①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.【答案】①④教材整理2两个变量的线性相关阅读教材P74~P76,完成下列问题.1.最小二乘法设x、Y的一组观察值为(xi,yi),i=1,2,…,n,且回归直线方程为eq\o(y,\s\up6(^))=a+bx.当x取值xi(i=1,2,…,n)时,Y的观察值为yi,差yi-eq\o(y,\s\up6(^))i(i=1,2,…,n)刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q=eq\i\su(i=1,n,)(yi-a-bxi)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.2.回归直线方程的系数计算公式回归直线方程回归系数系数eq\o(a,\s\up6(^))的计算公式方程或公式eq\o(y,\s\up6(^))=a+bxeq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(\x\to(x))\o(\x\to(y)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))x上方加记号“^”的意义区分y的估计值eq\o(y,\s\up6(^))与实际值ya、b上方加“^”表示由观察值按最小二乘法求得的估计值1.判断(正确的打“√”,错误的打“×”)(1)回归直线方程中,由x的值得出的y值是准确值.()(2)回归直线方程一定过样本点的中心.()(3)回归直线方程一定过样本中的某一个点.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()【答案】(1)×(2)√(3)×(4)×2.过(3,10),(7,20),(11,24)三点的回归直线方程是()A.eq\o(y,\s\up6(^))=+ B.eq\o(y,\s\up6(^))=-+C.eq\o(y,\s\up6(^))=+ D.eq\o(y,\s\up6(^))=-【解析】求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得eq\o(b,\s\up6(^))=,eq\o(a,\s\up6(^))=.代入直线方程,求得eq\o(y,\s\up6(^))=+.故选C.【答案】C[小组合作型]相关关系的判断(1)下列两个变量之间的关系,哪个不是函数关系()A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高(2)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2­3­2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【精彩点拨】结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.【尝试解答】(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.(2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.【答案】(1)D(2)C判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[再练一题]1.某公司2023~2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:年份202320232023202320232023利润x1618支出y1A.利润中位数是16,x与y有正线性相关关系B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系【解析】由表知,利润中位数是eq\f(1,2)(16+18)=17,且y随x的增大而增大,故选C.【答案】C求回归直线方程一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.【精彩点拨】eq\x(画散点图)→eq\x(确定相关关系)→eq\x(求回归直线系数)→eq\x(写回归直线方程)【尝试解答】(1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200eq\x\to(x)=55,eq\x\to(y)=,eq\i\su(i=1,10,=)xeq\o\al(2,i)=38500,eq\i\su(i=1,10,y)eq\o\al(2,i)=87777,eq\i\su(i=1,10,x)iyi=55950eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,10,x)iyi-10\o(\x\to(x))\o(\x\to(y)),\i\su(i=1,10,x)\o\al(2,i)-10\o(\x\to(x))\s\up10(2))=eq\f(55950-10×55×,38500-10×552)≈,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-×55=.即所求的回归直线方程为:eq\o(y,\s\up6(^))=+.用公式求回归直线方程的一般步骤:1列表xi,yi,xiyi;2计算eq\x\to(x),eq\x\to(y),eq\o(∑,\s\up7(n),\s\do7(i=1))x\o\al(2,i),eq\o(∑,\s\up6(n),\s\do7(i=1))xiyi;3代入公式计算eq\o(b,\s\up6(^))、eq\o(a,\s\up6(^))的值;4写出回归直线方程.[再练一题]2.已知变量x,y有如下对应数据:x1234y1345(1)作出散点图;(2)用最小二乘法求关于x,y的回归直线方程.【解】(1)散点图如图所示:(2)eq\x\to(x)=eq\f(1+2+3+4,4)=eq\f(5,2),eq\x\to(y)=eq\f(1+3+4+5,4)=eq\f(13,4),eq\i\su(i=1,4,x)iyi=1+6+12+20=39.eq\i\su(i=1,4,x)eq\o\al(2,i)=1+4+9+16=30,eq\o(b,\s\up6(^))=eq\f(39-4×\f(5,2)×\f(13,4),30-4×\b\lc\(\rc\)(\a\vs4\al\co1(\f(5,2)))\s\up6(2))=eq\f(13,10),eq\o(a,\s\up6(^))=eq\f(13,4)-eq\f(13,10)×eq\f(5,2)=0,所以eq\o(y,\s\up6(^))=eq\f(13,10)x为所求回归直线方程.利用回归方程对总体进行估计下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y34(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【导学号:00732062】【精彩点拨】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的值;(3)实际上就是求当x=100时,对应的v的值.【尝试解答】(1)散点图,如图所示:(2)由题意,得eq\i\su(i=1,4,x)iyi=3×+4×3+5×4+6×=,eq\x\to(x)=eq\f(3+4+5+6,4)=,eq\x\to(y)=eq\f+3+4+,4)=,eq\i\su(i=1,4,x)eq\o\al(2,i)=32+42+52+62=86,∴eq\o(b,\s\up6(^))=eq\f-4××,86-4×=eq\f-63,86-81)=,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-×=,故线性回归直线方程为eq\o(y,\s\up6(^))=+.(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤为×100+=(吨),故耗能减少了90-=(吨)标准煤.回归分析的三个步骤:1判断两个变量是否线性相关:可以利用经验,也可以画散点图;2求线性回归直线方程,注意运算的正确性;3根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.[再练一题]3.某种产品的广告费支出y(百万元)与销售额x(百万元)之间的关系如下表所示.x8121416y58911(1)假定y与x之间存在线性相关关系,求其回归直线方程.(2)若广告费支出不少于60百万元,则实际销售额应不少于多少?【解】(1)设回归直线方程为eq\o(y,\s\up6(^))=bx+a,则eq\o(b,\s\up6(^))=eq\f(8×5+12×8+14×9+16×11-4×\f(8+12+14+16,4)×\f(5+8+9+11,4),82+122+142+162-4×\b\lc\(\rc\)(\a\vs4\al\co1(\f(8+12+14+16,4)))2)=eq\f(438-,660-625)=eq\f,35)=eq\f(51,70),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=eq\f(5+8+9+11,4)-eq\f(51,70)×eq\f(8+12+14+16,4)=eq\f(33,4)-eq\f(51,70)×eq\f(25,2)=-eq\f(6,7),则所求回归直线方程为eq\o(y,\s\up6(^))=eq\f(51,70)x-eq\f(6,7).(2)由eq\o(y,\s\up6(^))=eq\f(51,70)x-eq\f(6,7)≥60,得x≥eq\f(4260,51)≈84,所以实际销售额不少于84百万元.[探究共研型]散点图的特征探究1任意两个统计数据是否均可以作出散点图?怎么根据散点图判断变量之间的关系?【提示】任意两个统计数据均可以作出散点图,对于作出的散点图,如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.特别地,若所有的样本点都落在某一直线附近,变量之间就具有线性相关关系;如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系;如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系.回归直线的特征探究2如何画回归直线?【提示】(1)建立直角坐标系,两轴的长度单位可以不一致.(2)将n个数据点描在平面直角坐标系中.(3)画回归直线时,一定要画在多数点经过的区域,可以先观察有哪两个点在直线上.探究3回归系数eq\o(b,\s\up6(^))的含义是什么?【提示】(1)eq\o(b,\s\up6(^))代表x每增加一个单位,y的平均增加单位数,而不是增加单位数.(2)当eq\o(b,\s\up6(^))>0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加eq\o(b,\s\up6(^))个单位数;当eq\o(b,\s\up6(^))<0时,两个变量呈负相关关系,含义为:x每增加一个单位,y平均减少eq\o(b,\s\up6(^))个单位数.探究4回归直线方程与直线方程的区别是什么?【提示】线性回归直线方程中y的上方加记号“^”是与实际值y相区别,因为线性回归方程中的“eq\o(y,\s\up6(^))”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,eq\o(y,\s\up6(^))的值只是比较接近,但存在一定的误差,即y=eq\o(y,\s\up6(^))+e(其中e为随机变量),预测值eq\o(y,\s\up6(^))与实际值y的接近程度由随机变量e的标准差决定.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为eq\o(y,\s\up6(^))=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))>a′ B.eq\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))<a′C.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))>a′ D.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))<a′【精彩点拨】先由已知条件分别求出b′,a′的值,再由eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的计算公式分别求解eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的值,即可作出比较.【尝试解答】根据所给数据求出直线方程y=b′x+a′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b′,a′.b′=eq\f(2-0,2-1)=2,a′=0-2×1=-2.求eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))时,eq\i\su(i=1,6,x)iyi=0+4+3+12+15+24=58,eq\x\to(x)=,eq\x\to(y)=eq\f(13,6),eq\i\su(i=1,6,x)eq\o\al(2,i)=1+4+9+16+25+36=91,∴eq\o(b,\s\up6(^))=eq\f(58-6××\f(13,6),91-6×=eq\f(5,7),eq\o(a,\s\up6(^))=eq\f(13,6)-eq\f(5,7)×=eq\f(13,6)-eq\f(5,2)=-eq\f(1,3),∴eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))>a′.【答案】C求回归直线方程时应注意的问题:(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,即使求出回归方程也是毫无意义的.(2)用公式计算eq\o(a,\s\up6(^))、eq\o(b,\s\up6(^))的值时,要先算出eq\o(b,\s\up6(^)),然后才能算出eq\o(a,\s\up6(^)),由eq\o(a,\s\up6(^))=eq\o(y,\s\up6(^))-eq\o(b,\s\up6(^))eq\x\to(x)知回归直线必经过点(eq\x\to(x),eq\x\to(y)).(3)利用回归直线方程,我们可以进行估计和预测.若回归直线方程为eq\o(y,\s\up6(^))=bx+a,则x=x0处的估计值为eq\o(y,\s\up6(^))=bx0+a.[再练一题]4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归直线方程为eq\o(y,\s\up6(^))=-,则下列结论中不正确的是()与x具有正的线性相关关系B.回归直线过样本点的中心(eq\x\to(x),eq\x\to(y))C.若该大学某女生身高增加1cm,则其体重约增加kgD.若该大学某女生身高为170cm,则可断定其体重必为kg【解析】eq\o(b,\s\up6(^))为正数,所以两变量具有正的线性相关关系,故A正确;B,C显然正确;若该大学某女生身高为170cm,则可估计其体重为kg.【答案】D1.设一个回归方程eq\o(y,\s\up6(^))=3+,则变量x增加一个单位时()平均增加个单位平均增加3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论