高中数学北师大版2第一章统计回归分析 第1章1回归分析_第1页
高中数学北师大版2第一章统计回归分析 第1章1回归分析_第2页
高中数学北师大版2第一章统计回归分析 第1章1回归分析_第3页
高中数学北师大版2第一章统计回归分析 第1章1回归分析_第4页
高中数学北师大版2第一章统计回归分析 第1章1回归分析_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§1回归分析1.1回归分析1.2相关系数1.3可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1回归分析阅读教材P3~P6“练习”以上部分,完成下列问题.设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:b=eq\f(lxy,lxx)=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(\x\to(x))\a\vs4\al(\x\to(y)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),a=eq\x\to(y)-beq\x\to(x).某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为,据此模型预报广告费用为6万元时,销售额为()【导学号:67720000】A.万元 B.万元C.万元 D.万元【解析】eq\x\to(x)=eq\f(4+2+3+5,4)=,eq\x\to(y)=eq\f(49+26+39+54,4)=42,∴a=eq\x\to(y)-beq\x\to(x)=42-×=,∴回归方程为y=+,∴当x=6时,y=×6+=,故选B.【答案】B教材整理2相关系数阅读教材P6“练习”以下至P9“练习”以上部分,完成下列问题.1.相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r=eq\f(lxy,\r(lxxlyy))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(\x\to(x))\a\vs4\al(\x\to(y)),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2)).2.相关系数r与线性相关程度的关系(1)r的取值范围为[-1,1];(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高;(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关;(2)当r<0时,两个变量负相关;(3)当r=0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r>0,则两个变量正相关.()(2)两个变量的相关系数越大,它们的相关程度越强.()(3)若两个变量负相关,那么其回归直线的斜率为负.()【答案】(1)√(2)×(3)√教材整理3可线性化的回归分析阅读教材P9~P13“练习”以上部分,完成下列问题.1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程曲线方程曲线图形变换公式变换后的线性函数y=axb(a=1,b>0)(a=1,b<0)c=lnav=lnxu=lnyu=c+bvy=aebx(a>0,b>0)(a>0,b<0)c=lnau=lnyu=c+bx曲线方程曲线图形变换公式变换后的线性函数y=aeeq\f(b,x)(a>0,b>0)(a>0,b<0)c=lnav=eq\f(1,x)u=lnyu=c+bvy=a+blnx(b>0)(b<0)v=lnxu=yu=a+bv下列数据x,y符合哪一种函数模型()x12345678910y234A.y=2+eq\f(1,3)x B.y=2exC.y=2eeq\f(1,x) D.y=2+lnx【解析】分别将x的值代入解析式判断知满足y=2+lnx.【答案】D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:___________________________________________解惑:_____________________________________________________疑问2:_____________________________________________________解惑:_____________________________________________________疑问3:_____________________________________________________解惑:___________________________________________[小组合作型],变量间的相关关系及判定(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1­1­1①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图1­1­1②.由这两个散点图可以判断()图1­1­1A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有()A.①② B.②③C.①③ D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是()A.①③ B.②④C.②⑤ D.④⑤【精彩点拨】可借助于线性相关概念及性质作出判断.【自主解答】(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.【答案】(1)C(2)C(3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r来检验线性相关显著性水平时,通常与作比较,若r>,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是()A.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积【解析】选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的体积是eq\f(4,3)π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.【答案】B,求线性回归方程某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x(℃)171382月销售量y(件)24334055(1)算出线性回归方程y=bx+a(a,b精确到;(2)气象部门预测下个月的平均气温约为6℃【精彩点拨】(1)可利用公式求解;(2)把月平均气温代入回归方程求解.【自主解答】(1)由散点图易判断y与x具有线性相关关系.eq\x\to(x)=(17+13+8+2)÷4=10,eq\x\to(y)=(24+33+40+55)÷4=38,eq\o(∑,\s\up6(4))eq\o(,\s\do4(i=1))xiyi=17×24+13×33+8×40+2×55=1267,eq\o(∑,\s\up6(4))eq\o(,\s\do4(i=1))xeq\o\al(2,i)=526,b=eq\f(\o(∑,\s\up6(4))\o(,\s\do4(i=1))xiyi-4\a\vs4\al(\x\to(x))\a\vs4\al(\x\to(y)),\o(∑,\s\up6(4))\o(,\s\do4(i=1))x\o\al(2,i)-4\x\to(x)2)=eq\f(1267-4×10×38,526-4×102)≈-,a=eq\x\to(y)-beq\x\to(x)≈38-(-×10=,所以线性回归方程为y=-+.(2)气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量为y=-+=-×6+≈1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得到下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.【导学号:67720001】【解】(1)如图:(2)eq\o(∑,\s\up6(n))eq\o(,\s\do4(i=1))xiyi=6×2+8×3+10×5+12×6=158,eq\x\to(x)=eq\f(6+8+10+12,4)=9,eq\x\to(y)=eq\f(2+3+5+6,4)=4,eq\o(∑,\s\up6(n))eq\o(,\s\do4(i=1))xeq\o\al(2,i)=62+82+102+122=344,b=eq\f(158-4×9×4,344-4×92)=eq\f(14,20)=,a=eq\x\to(y)-beq\x\to(x)=4-×9=-,故线性回归方程为y=-.(3)由(2)中线性回归方程知当x=9时,y=×9-=4,预测记忆力为9的同学的判断力约为4.[探究共研型],可线性化的回归分析探究1如何解答非线性回归问题?【提示】非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y3①y=3×2x-1;②y=log2x;③y=4x;④y=x2.【提示】观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重y(kg)身高x(cm)120130140150160170体重y(kg)(1)试建立y与x之间的回归方程;(2)如果一名在校男生身高为168cm,预测他的体重约为多少?【精彩点拨】先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】(1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=lny,列表如下:x60708090100110zx120130140150160170z作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为z=+,则有y=+.(2)由(1)知,当x=168时,y=+×168≈,所以在校男生身高为168cm,预测他的体重约为57.57kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:x124y1612521试建立y与x之间的回归方程.【解】作出变量y与x之间的散点图如图所示.由图可知变量y与x近似地呈反比例函数关系.设y=eq\f(k,x),令t=eq\f(1,x),则y=kt.由y与x的数据表可得y与t的数据表:t421y1612521作出y与t的散点图如图所示.由图可知y与t呈近似的线性相关关系.又eq\x\to(t)=,eq\x\to(y)=,eq\i\su(i=1,5,t)iyi=,eq\i\su(i=1,5,t)eq\o\al(2,i)=5,b=eq\f(\i\su(i=1,5,t)iyi-5\a\vs4\al(\x\to(t))\a\vs4\al(\x\to(y)),\i\su(i=1,5,t)\o\al(2,i)-5\x\to(t)2)=eq\f-5××,5-5×≈4,a=eq\x\to(y)-beq\x\to(t)=-4×≈,∴y=4t+.所以y与x的回归方程是y=eq\f4,x)+.[构建·体系]1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③C.①②④ D.①②③④【解析】函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】C2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点()x1234y1357A.(2,3) B.,4)C.,4) D.,5)【解析】线性回归方程必过样本点的中心(eq\x\to(x),eq\x\to(y)),即,4),故选C.【答案】C3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为,且恒过(2,3)点,则这条回归直线的方程为________.【解析】由题意知eq\x\to(x)=2,eq\x\to(y)=3,b=,所以a=eq\x\to(y)-beq\x\to(x)=3-×2=-10,即回归直线的方程为y=-10.【答案】y=-104.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资产价值33566789910工业增加值15172528303637424045根据上表资料计算的相关系数为________.【解析】eq\x\to(x)=eq\f(3+3+5+6+6+7+8+9+9+10,10)=.eq\x\to(y)=eq\f(15+17+25+28+30+36+37+42+40+45,10)=.所以r=eq\f(\o(eq\i\su(i=1,10,)\s\up6())\o()xi-\x\to(x)yi-\x\to(y),\r(\o(eq\i\su(i=1,10,))xi-\x\to(x)2\o(eq\i\su(i=1,10,))yi-\x\to(y)2))≈8.【答案】85.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20232023202320232023时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程y=bt+a;(2)用所求回归方程预测该地区2023年(t=6)的人民币储蓄存款.附:回归方程y=bt+a中,b=eq\f(\i\su(i=1,n,t)iyi-n\x\

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论