高考数学(理创新大一轮人教B全国通用课件统计与统计案例第3节_第1页
高考数学(理创新大一轮人教B全国通用课件统计与统计案例第3节_第2页
高考数学(理创新大一轮人教B全国通用课件统计与统计案例第3节_第3页
高考数学(理创新大一轮人教B全国通用课件统计与统计案例第3节_第4页
高考数学(理创新大一轮人教B全国通用课件统计与统计案例第3节_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3节变量的相关性最新考纲1 会作两个有关联变量的数据的散点图,会利用散 点图认识变量间的相关关系;2.了解最小二乘法的思想,能根 据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2X2列 本思想、方法及其简单应用.联表)的基本思想、方法及其简单应用;4了解归分析的基im知识梳i.变量间的相关关系理(1)常见的两变量之间的关系有两类:一类是函数据亲关啄一类是 关龜数关系不同,是_种非确定性关系.从飯勲罄上看,点散布在从左下角到右上角的区域内,两个变矍睐送种相关关系称为点散布在左上角到右下角的区域内,两个变量的相关关系为2 回归分析对具有

2、札I关关痢个变量进行统计分析的方法叫回归分析其基本步骤是:(i) 画散点图;(ii)求冋归直线方程)用回归直线方程作预报.回归直线:如果散点图中点的分布从整体上看大致在近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2) 回归直线方程的求法最小二乘法.设具有线性相关关系的两个变量%,y的一组观察值为(期,)#-1,2, ,“),则回归直线方 程侬的系数为:t(x-x)(y-y)护厂心 $= (兀厂亍):=1fl=ybx.1 n1 n亠、其中了=;冷J=-E) (x,刃称为样本点的7/=1 /=1(3)相关系数 计算相关系数厂,厂有以下性质:国1,并且制越接槪虽线性相关程度;越極

3、接近0,线性相关程度lrlr0.05 ,表明有95%的把握认为变量x与y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直3独立性检验(1)2X2列联表BB合计Aiinn1+A2122“2+合计n+in+2n其中 +=+2,n2+=ri2 + 2 3.841 ,有95%的把握认为选修文科与性 别有关系.答案95% I;:;:;:;:; 分类换以淋法1鑫考点一相关关系的判断【例1】(1)已知变量x和y近似满足关系式=0.1%+1 变量y与 z正相关下列结论中正确的是()Ax与y正相关,x与z负相关B. x与y正相关,与z正相关C. x与y负相关,兀与z负相关Dx与y负相关,x与z正相关(2

4、)甲、乙、丙、丁四位同学各自对久B两变量的线性相关性 做试验,并用回归分析方法分别求得相关系数厂与残差平方和卜表:甲乙丙Tr0.820.780.690.85m106115124103加如则哪位同学的试验结果体现4, B两变量有更强的线性相关性 解析(1)由y二-0.1x+ 1 ,知x与y负相关,即y随x的增大而减 小,又y与z正相关,所以z随y的增大而增大,减小而减小,所 以z随无的增大而减小,%与z负相关.A.甲BZC.丙D.T(2)在验证两个变量之间的线性相关关系时,相关系数的绝对 值越接近于1 ,相关性越强,在四个选项中只有丁的相关系数 最大;残差平方和越小,相关性越强,只有丁的残差平方

5、和 最小,综上可知丁的试验结果体现了4 , B两变量有更强的线 性相关性.答案(1)C (2)D规律方法1 散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就 有相关关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 若点散布在从左下角到右上角的区域,则正相关.2.利用相关系数判定,当M越趋近于1相关性越强.当残差平方和越小,相关指数卅 越大,相关性越强若Q0,则正相关;Y0时,则负相关.3线性回归直线方程中:$0时,正相关;很0时,负相关.【训练1】某公司在2018年上半年的收入双单位:万元)与 月支岀y(单位:万元)的统计资料如下表所示:月份1月份2月份3月份4月

6、份5月份6月份收入X12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,贝)A.月收入的中位数是15,x与y有正线性相关关系B月收入的中位数是17, x与y有负线性相关关系C. 月收入的中位数是16, X与y有正线性相关关系D.月收入的中位数是16,兀与y有负线性相关关系号为(2)x和y的散点图如图所示,则下列说法中所有正确命题的序3 ()00 2 50() - *2 ()00 *1 50() -1 000 - * .500-.II1I III IY0 1234 567 8910% 劝y是负相关关系; 在该相关关系中,若用)尸虫呀

7、拟合时的相关指数为用,用y=M拟合时的相关指数为用,则用疋; x, y之间不能建立线性回归方程.解析从统计图表中看出,月收入的中位数是(15+17)=16,收入增加,则支岀也增加,兀与y正线性相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x, y是负相关关系,故正确;由散点图知用拟合比用f二济+2拟合效果要好,则用用,故 正确;X, y之间可以建立线性回归方程,但拟合效果不好,故错误.答案(1)C (2)考点二线性回归方程及应用【例2】(2015-全国I卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费班单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响

8、,对近8年的年宣传费石和年销售量升(=1, 2,,8)数据作了初步处理,得到下面的散点图及ofW计量的值.60058()56054052050048()年宣传费/千元34 36 38 40424446 48 5() 52 54 56Xy(眄一不)1=18S(w;W)2 / = !8S z) i=l(y-y)gw) *f=ibF)46.6563289.81.61469108.8,r._1 8表中网二応五=云丫谒.0 2=1根据散点图判断,y=a+bx与尸c+d&哪-个适宜作为年销售量关于年宣传 费兀的回归方程类型(给岀判断即可,不必说明理由)?(2) 根据(1)的判断结果及表中数据,建立y关于兀

9、的回归方程;(3) 已知这种产品的年利润z与x, y的关系为z=0.2yx.根据(2)的结果回答下列问 题: 年宣传费尤=49时,年销售量及年利润的预报值是多少? 年宣传费兀为何值时,年利润的预报值最大?附:对于一组数据仙,5),伽。2),(妬,),其回归直线o=a+0u的斜率 和截距的最小二乘估计分别为:nL=1解由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费兀的回归 方程类型.(2)令w=x,先建立y关于“的线性回归方程,由于8 丄百伽亦y)08.8_“ d 8一 1 c 一2(w.w)2*i=lc=y=56368X6.8=100.6,所以y关于的线性回归方程为y = 100.

10、6+68劝因此y关于x的回归方程为$ =100.6+68&.(3)由(2)知,当x=49时,年销售量y的预报值$= 100.6+68涵=5766年利润z的预报值尸576.6X0.249=66.32.根据(2)的结果知,年利润扌的预报值 z=02(1006+68k)x+136/;+2012 所以当&=晋=6.8,即x=46.24时,;取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【训练2】(2018-0照调硏)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年年份兀20132014201520162017储蓄存款y(千亿元)567810表1为了研究计

11、算的方便,工作人员将上表的数据进行了处理, t=x2 012, z=y5得到下表2:时间代号T12345z01235表2(1) 求Z关于T的线性回归方程;通过中的方程,求出y关于兀的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达 醐少瞅于线性回归方程i = h + a,其中b =9a=y-bx)I= 1.2,45-5X3X2.2555X9S=z-T=2.2-3X1.2=-1.4,所以?=12/-14(2) 将 t=x 2012,5,代入z=1.2L1.4,得 y-5=1.2(x-2012)-1.4, BPy=1.2x-2 410.8.(3) 0 =1.2X2022-24

12、10.8=15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.考点三独立性检验【例3】某高校共有学生15 000人,其中男生10 500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:小时).(1) 应收集多少位女生的样本数据?(2) 根据这300个样本数据,得到学生每周平均体育运动时间 的频率分布直方图(如图所示),其中样本数据的分组区间为:0, 2, (2, 4, (4, 6, (6, 8, (8, 10, (10, 12.估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样

13、本数据中,有60位女生的每周平均体育运动时间超过4 小时,请完成每周平均体育运动时间与性别列联表,并判断 是否有95%的把握认为“该校学生的每周平均体育运动时间与 性别有关”解利用分层抽样,300X=90,所以应收集90位女生的样本数据.(2) 由频率分布直方图得12X(0.100+0.025)=075.所以该校学生每周平均体育运 动时间超过4小时的概率的估计值为0.75.(3) 由知,300位学生中有300X0.75=225人的每周平均体育运动时间超过4小时, 75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别

14、列联表如下:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300将2X2列联表中的数据代入公式计算,得用的观测值300X (45X60-165X30) 2 100k=4 76?3 S4175X225X210X9021所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”规律方法1 在2X2列联表中,如果两个变量没有关系,则应满足1122 沟22仟0血1讥22一沟2211越小,说明两个变量之间关系越弱;11122_12211越大, 说明两个变量之间关系越强.2解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.【训练3】(2018-潍坊质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取18

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论