人教A版(新教材)高中数学选择性必修第三册第八章成对数据的统计分析教学设计3:章末复习课_第1页
人教A版(新教材)高中数学选择性必修第三册第八章成对数据的统计分析教学设计3:章末复习课_第2页
人教A版(新教材)高中数学选择性必修第三册第八章成对数据的统计分析教学设计3:章末复习课_第3页
人教A版(新教材)高中数学选择性必修第三册第八章成对数据的统计分析教学设计3:章末复习课_第4页
人教A版(新教材)高中数学选择性必修第三册第八章成对数据的统计分析教学设计3:章末复习课_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1章末复习课知识网络教学突破一、变量的相关性1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.2.在学习该部分知识时,体会直观想象和数学运算的素养.例1.下列两个变量之间的关系是相关关系的为()A.正方体的体积与棱长的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量〖答案〗C〖解析〗A中,由正方体的棱长和体积的公式知,V=a3(a>0),是确定的函数关系,故A错误;B中,学生的成绩和体重,没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关性,故C正确;D中,水的体积V和重量x的关系为V=k·x,是确定的函数关系,故D错误.反思感悟变量相关性的判断的两种方法(1)散点图法:直观形象.(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.跟踪训练1.有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是()A.①③ B.②④C.②⑤ D.④⑤〖答案〗D〖解析〗对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系;对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.二、一元线性回归模型及其应用1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.2.主要培养数学建模和数据分析的素养.例2.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20102012201420162018需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^));(2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.解:(1)由所给数据看出,把年份看作点的横坐标,对应的需求量看作点的纵坐标,画出散点图草图(图略),通过观察知这些点大致分布在一条直线附近,下面求回归直线方程,为此对数据预处理如下:年份—2014-4-2024需求量—257-21-1101929对预处理后的数据,容易算得eq\x\to(x)=0,eq\x\to(y)=3.2,eq\o(b,\s\up8(^))=eq\f(-4×-21+-2×-11+2×19+4×29-5×0×3.2,-42+-22+22+42-5×02)=eq\f(260,40)=6.5,eq\o(a,\s\up8(^))=eq\x\to(y)-eq\o(b,\s\up8(^))eq\x\to(x)=3.2,由上述计算结果,知所求回归直线方程为eq\o(y,\s\up8(^))-257=eq\o(b,\s\up8(^))(x-2012)+eq\o(a,\s\up8(^))=6.5(x-2012)+3.2,即eq\o(y,\s\up8(^))=6.5(x-2012)+260.2.(*)(2)利用直线方程(*),可预测2020年的粮食需求量为6.5×(2018-2012)+260.2=6.5×6+260.2=299.2(万吨).反思感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的经验回归方程解决实际问题.跟踪训练2.测得某国10对父子身高(单位:英寸)如下:父亲身高(x)6062646566儿子身高(y)63.665.26665.566.9父亲身高(x)6768707274儿子身高(y)67.167.468.370.170(1)画出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高.解:(1)(2)从散点图看出,样本点散布在一条直线附近,因此两个变量呈线性相关关系.设回归方程为eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^)).eq\o(x,\s\up8(-))=66.8,eq\o(y,\s\up8(-))=67.01,eq\o(x,\s\up8(-))2=4462.24,eq\o(y,\s\up8(-))2≈4490.34,eq\o(∑,\s\up8(10),\s\do14(i=1))xeq\o\al(2,i)=44794,eq\o(∑,\s\up8(10),\s\do14(i=1))yeq\o\al(2,i)=44941.93,eq\o(∑,\s\up8(10),\s\do14(i=1))xiyi=44842.4,由eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(10),\s\do14(i=1))xiyi-10\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(10),\s\do14(i=1))x\o\al(2,i)-10\o(x,\s\up8(-))2)=eq\f(44842.4-44762.68,44794-44622.4)=eq\f(79.72,171.6)≈0.4646.eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-))=67.01-0.4646×66.8≈35.97.故所求的回归方程为eq\o(y,\s\up8(^))=0.4646x+35.97.(3)当x=73时,eq\o(y,\s\up8(^))=0.4646×73+35.97≈69.9.所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.三、非线性经验回归方程1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.2.体现数学建模的优劣,提升数据分析的素养.例3.下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,a=lnc1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为eq\o(z,\s\up6(^))=0.272x-3.849,∴eq\o(y,\s\up6(^))=e0.272x-3.849.残差列表如下:yi711212466115325eq\o(y,\s\up6(^))i6.44311.10119.12532.95056.770128.381290.325eq\o(e,\s\up6(^))i0.557-0.1011.875-8.9509.23-13.38134.675(3)当x=40时,eq\o(y,\s\up6(^))=e0.272x-3.849≈1131.反思感悟非线性经验回归方程的求解策略(1)本例中,y与x不是线性相关关系,但通过wi=eq\r(xi),转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪训练3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^)),并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:eq\o(b,\s\up8(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up8(-))\o(y,\s\up8(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up8(-))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)))解:(1)散点图如图.(2)由表中数据得:eq\i\su(i=1,4,x)iyi=52.5,eq\o(x,\s\up8(-))=3.5,eq\o(y,\s\up8(-))=3.5,eq\i\su(i=1,4,x)eq\o\al(2,i)=54,∴eq\o(b,\s\up8(^))=0.7,∴eq\o(a,\s\up8(^))=1.05,∴eq\o(y,\s\up8(^))=0.7x+1.05,回归直线如图所示.(3)将x=10代入线性回归方程,得eq\o(y,\s\up8(^))=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.四、独立性检验1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.例4.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:常饮酒不常饮酒合计患肝病2不患肝病18合计30已知在全部30人中随机抽取1人,抽到肝病患者的概率为eq\f(4,15).(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解:(1)设患肝病中常饮酒的人有x人,eq\f(x+2,30)=eq\f(4,15),x=6.常饮酒不常饮酒合计患肝病628不患肝病41822合计102030由已知数据可求得K2=eq\f(30×(6×18-2×4)2,10×20×8×22)≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种,且每种发生的概率是相等的.其中一男一女有(A,E),(A,F),(B,E),(B,F),(C,E),(C,F),(D,E),(D,F),共8种.故抽出一男一女的概率是P=eq\f(8,15).反思感悟独立性检验问题的求解策略(1)等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两个变量的相关性.(2)通过公式χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))先计算χ2,再与临界值表作比较,最后得出结论.跟踪训练4.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:种子灭菌种子未灭菌合计黑穗病214175389无黑穗病4515971048合计6657721437能否在犯错误的概率不超过0.001的前提下认为种子灭菌与小麦黑穗病有关系?解:提出假设H0:假设种子灭菌与黑穗病没有关系.根据列联表中的数据知,a=214,b=175,c=451,d=597,a+b=389,c+d=1048,a+c=665,b+d=772,n=1437,代入公式求得χ2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(1437×214×597-175×4512,389×1048×665×772)≈16.373,由于16.373>10.828,所以能够在犯错误的概率不超过0.001的条件下,认为种子灭菌与小麦黑穗病有关系.当堂检测1.每一吨铸铁成本y(元)与铸件废品率x%建立的经验回归方程为eq\o(y,\s\up6(^))=56+8x,下列说法正确的是()A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元〖答案〗C2.对于给定的两个变量的统计数据,下列说法正确的是()A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系〖答案〗C〖解析〗给出一组样本数据,总可以作出相应的散点图,故C正确;但不一定能分析出两个变量的关系,故A错误;更不一定符合线性相关,不一定能用一条直线近似的表示,故B错误;两个变量的统计数据不一定具有函数关系,故D错误.3.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=eq\o(b,\s\up6(^))xi+eq\o(a,\s\up6(^))+ei(i=1,2,…,n),且ei=0,则R2为________.〖答案〗1〖解析〗由ei=0,知yi=eq\o(y,\s\up6(^))i,即yi-eq\o(y,\s\up6(^))i=0,故R2=1-eq\f(\i\su(i=1,n,)(yi-\o(y,\s\up6(^))i)2,\i\su(i=1,n,)(yi-\x\to(y))2)=1-0=1.4.已知一个经验回归方程为eq\o(y,\s\up6(^))=1.5x+45,x∈{1,5,7,13,19},则eq\x\to(y)=________.〖答案〗58.5〖解析〗∵eq\x\to(x)=eq\f(1+5+7+13+19,5)=9,且eq\o(y,\s\up6(^))=1.5x+45,∴eq\x\to(y)=1.5×9+45=58.5.5.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,经验回归方程为eq\o(y,\s\up6(^))=10.47-1.3x,估计该台机器使用________年最合算.〖答案〗8〖解析〗只要预计利润不为负数,使用该机器就算合算,即eq\o(y,\s\up6(^))≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.6.在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数为110,其中男性、女性各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.(1)请根据题目所提供的调查结果填写下列2×2列联表;性别休闲方式合计看电视运动女男合计(2)依据小概率值α=0.05的独立性检验,是否可以推断“性别与休闲方式有关系”?附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(其中n=a+b+c+d为样本容量).α0.100.050.010xα2.7063.8416.635解:(1)根据题目所提供的调查结果,可得下列2×2列联表:性别休闲方式合计看电视运动女302555男203555合计5060110(2)零假设H0:性别与休闲方式无关.χ2=eq\f(110×(30×35-20×25)2,50×60×55×55)≈3.667<3.841=x0.05,依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.7.某车间为了规定工时定额,需要确定加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论