2018届数学复习第九章算法初步、统计、统计案例第四节变量间的相关关系、统计案例学案文_第1页
2018届数学复习第九章算法初步、统计、统计案例第四节变量间的相关关系、统计案例学案文_第2页
2018届数学复习第九章算法初步、统计、统计案例第四节变量间的相关关系、统计案例学案文_第3页
2018届数学复习第九章算法初步、统计、统计案例第四节变量间的相关关系、统计案例学案文_第4页
2018届数学复习第九章算法初步、统计、统计案例第四节变量间的相关关系、统计案例学案文_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精PAGE19-学必求其心得,业必贵于专精eq\o(\s\up7(第四节),\s\do5())eq\o(\s\up7(变量间的相关关系、统计案例),\s\do5())1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.知识点一两个变量的相关关系1.相关关系的分类(1)正相关:从散点图上看,点散布在从________到______的区域内;(2)负相关:从散点图上看,点散布在从左上角到________的区域内.2.线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫________.答案1.(1)左下角右上角(2)右下角2.回归直线1.根据两个变量x,y之间的观测数据画成散点图如图所示,则这两个变量________线性相关关系.(填“具有”或“不具有”)解析:图中的点分布零散,不在一条直线附近,所以不具有线性相关关系.答案:不具有2.(2017·泉州模拟)下列四个图象中,两个变量具有正相关关系的是()解析:A中两个变量之间是函数关系,不是相关关系;在两个变量的散点图中,若样本点呈直线形带状分布,则两个变量具有相关关系,对照图形:B,D样本点呈直线形带状分布,B是负相关,D是正相关,C样本点不呈直线形带状分布.所以两个变量具有正相关关系的图是D。答案:D知识点二回归分析1.回归方程(1)最小二乘法:使得样本数据的点到回归直线的______最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^)),则eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(x),其中,eq\o(b,\s\up15(^))是回归方程的______,eq\o(a,\s\up15(^))是在y轴上的截距.2.样本相关系数r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2\i\su(i=1,n,)yi-\x\to(y)2)),用它来衡量两个变量间的线性相关关系的强弱.(1)当r〉0时,表明两个变量________;(2)当r〈0时,表明两个变量________;(3)r的绝对值越接近1,表明两个变量的线性相关性__________;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|〉0。75时,认为两个变量有很强的线性相关关系.答案1.(1)距离的平方和(2)斜率2.(1)正相关(2)负相关(3)越强3.最小二乘法的原理是()A.使得eq\i\su(i=1,n,[)yi-(a+bxi)]最小B.使得eq\i\su(i=1,n,[)yi-(a+bxi)2]最小C.使得eq\i\su(i=1,n,[)yeq\o\al(2,i)-(a+bxi)2]最小D.使得eq\i\su(i=1,n,[)yi-(a+bxi)]2最小解析:根据回归方程表示到各点距离之和最小的直线方程,即总体偏差最小,亦即eq\i\su(i=1,n,[)yi-(a+bxi)]2最小.答案:D4.当我们建立多个模型拟合某一数据组时,为了比较各个模型的拟合效果,我们可通过计算下列()量来确定①残差平方和②回归平方和③相关指数R2④相关系数rA.①B.①③C.①②③D.③④解析:残差平方和越小,相关指数R2越大,拟合的效果越好.答案:B知识点三独立性检验1.分类变量:变量的不同“值"表示个体所属的________,像这类变量称为分类变量.2.列联表:列出两个分类变量的________,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=eq\f(nad-bc2,a+ba+cb+dc+d)(其中n=a+b+c+d为样本容量),则利用独立性检验判断表来判断“X与Y的关系”.答案1.不同类型2.频数表5.在性别与吃零食这两个分类变量的计算中,下列说法正确的是________.①若K2的观测值为k=6.635,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.解析:由独立性检验的基本思想可得,只有③正确.答案:③热点一相关关系的判断【例1】(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.eq\f(1,2)D.1(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.①x,y是负相关关系;②在该相关关系中,若用y=c1ec2x拟合时的相关系数的平方为req\o\al(2,1),用eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))拟合时的相关系数的平方为req\o\al(2,2),则req\o\al(2,1)〉req\o\al(2,2);③x、y之间不能建立线性回归方程.【解析】(1)所有点均在直线上,则样本相关系数最大即为1,故选D.(2)①显然正确;由散点图知,用y=c1ec2x拟合的效果比用eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))拟合的效果要好,故②正确;x,y之间能建立线性回归方程,只不过预报精度不高,故③不正确.【答案】(1)D(2)①②【总结反思】判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r〉0时,正相关;r<0时,负相关.(3)线性回归方程中:eq\o(b,\s\up15(^))>0时,正相关;eq\o(b,\s\up15(^))<0时,负相关.(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y与x负相关且eq\o(y,\s\up15(^))=2。347x-6。423;②y与x负相关且eq\o(y,\s\up15(^))=-3。476x+5。648;③y与x正相关且eq\o(y,\s\up15(^))=5.437x+8。493;④y与x正相关且eq\o(y,\s\up15(^))=-4.326x-4.578。其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④(2)变量X与Y相对应的一组数据为(10,1),(11。3,2),(11。8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11。3,4),(11.8,3),(12。5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1〈0 B.0〈r2〈r1C.r2<0〈r1 D.r2=r1解析:(1)由回归方程eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))知当eq\o(b,\s\up15(^))〉0时,y与x正相关,当eq\o(b,\s\up15(^))〈0时,y与x负相关,∴①④一定错误.(2)对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1〉0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以选C。答案:(1)D(2)C热点二,线性回归分析【例2】(2016·新课标全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0。01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:eq\i\su(i=1,7,y)i=9.32,eq\i\su(i=1,7,t)iyi=40。17,eq\r(\i\su(i=1,7,)yi-\x\to(y)2)=0。55,eq\r(7)≈2.646。参考公式:相关系数r=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\r(\i\su(i=1,n,)ti-\x\to(t)2\i\su(i=1,n,)yi-\x\to(y)2)),回归方程eq\o(y,\s\up15(^))=eq\o(a,\s\up15(^))+eq\o(b,\s\up15(^))t中斜率和截距的最小二乘估计公式分别为:eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,n,)ti-\x\to(t)2),eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(t).【解】(Ⅰ)由折线图中数据和附注中参考数据得eq\x\to(t)=4,eq\i\su(i=1,7,)(ti-eq\x\to(t))2=28,eq\r(\i\su(i=1,7,)yi-\x\to(y)2)=0.55,eq\i\su(i=1,7,)(ti-eq\x\to(t))(yi-eq\x\to(y))=eq\i\su(i=1,7,t)iyi-eq\x\to(t)eq\i\su(i=1,7,y)i=40.17-4×9.32=2。89,r≈eq\f(2.89,0。55×2×2。646)≈0。99。因为y与t的相关系数近似为0。99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(Ⅱ)由eq\x\to(y)=eq\f(9.32,7)≈1。331及(Ⅰ)得eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,7,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,7,)ti-\x\to(t)2)=eq\f(2。89,28)≈0。103,eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(t)≈1.331-0.103×4≈0。92。所以,y关于t的回归方程为eq\o(y,\s\up15(^))=0.92+0。10t.将2016年对应的t=9代入回归方程得eq\o(y,\s\up15(^))=0。92+0。10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1。82亿吨。【总结反思】(1)正确理解计算eq\o(b,\s\up15(^)),eq\o(a,\s\up15(^))的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))必过样本点中心(eq\x\to(x),eq\x\to(y)).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测。(1)(2017·江西南昌十所省重点中学一模)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表所示,根据表中数据可得回归方程eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))中的eq\o(b,\s\up15(^))=10.6.据此模型预测广告费用为10万元时的销售额为()广告费用x(万元)4235销售额y(万元)49263958A.112.1万元 B.113。1万元C.111.9万元 D.113。9万元(2)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得eq\i\su(i=1,10,x)i=80,eq\i\su(i=1,10,y)i=20,eq\i\su(i=1,10,x)iyi=184,eq\i\su(i=1,10,x)eq\o\al(2,i)=720.①求家庭的月储蓄y对月收入x的线性回归方程eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^));②判断变量x与y之间是正相关还是负相关;③若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))中,eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(x),其中eq\x\to(x),eq\x\to(y)为样本平均值.解析:(1)由题表中数据得eq\x\to(x)=3。5,eq\x\to(y)=43。由于回归直线eq\o(y,\s\up15(^))=eq\o(b,\s\up15(^))x+eq\o(a,\s\up15(^))过点(eq\x\to(x),eq\x\to(y)),且eq\o(b,\s\up15(^))=10.6,解得eq\o(a,\s\up15(^))=5。9,所以线性回归方程为eq\o(y,\s\up15(^))=10.6x+5.9,于是当x=10时,eq\o(y,\s\up15(^))=111。9。(2)解:①由题意知n=10,eq\x\to(x)=eq\f(1,10)eq\i\su(i=1,10,x)i=eq\f(80,10)=8,eq\x\to(y)=eq\f(1,10)eq\i\su(i=1,10,y)i=eq\f(20,10)=2,又eq\i\su(i=1,10,x)eq\o\al(2,i)-10eq\x\to(x)2=720-10×82=80。eq\i\su(i=1,10,x)iyi-10eq\x\to(x)eq\x\to(y)=184-10×8×2=24。由此得eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,10,x)iyi-10\x\to(x)\x\to(y),\i\su(i=1,10,x)\o\al(2,i)-10\x\to(x)2)=eq\f(24,80)=0.3,eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(x)=2-0.3×8=-0.4,故所求回归方程为eq\o(y,\s\up15(^))=0.3x-0.4。②由于变量y的值随x值的增加而增加(eq\o(b,\s\up15(^))=0.3>0),故x与y之间是正相关.③将x=7代入回归方程可以预测该家庭的月储蓄为eq\o(y,\s\up15(^))=0.3×7-0。4=1。7(千元).答案:(1)C热点三独立性检验【例3】某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:如图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成如下表所示的2×2列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.【解】(1)30位亲属

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论