适用于新高考新教材广西专版2024届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件_第1页
适用于新高考新教材广西专版2024届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件_第2页
适用于新高考新教材广西专版2024届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件_第3页
适用于新高考新教材广西专版2024届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件_第4页
适用于新高考新教材广西专版2024届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二节成对数据的统计分析第十章内容索引0102强基础增分策略增素能精准突破课标解读衍生考点核心素养1.了解样本相关系数的统计意义,了解样本相关系数与标准化数据向量夹角的关系.会通过样本相关系数比较多组成对数据的相关性.2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计,会用一元线性回归模型进行预测.3.理解2×2列联表的统计意义,了解独立性检验及其应用.1.数据的相关性2.一元线性回归模型及其应用3.列联表与独立性检验数据分析数学运算强基础增分策略知识梳理1.变量的相关关系(1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.是一种非确定的关系,不是函数关系

(2)正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_______的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现

的趋势,则称这两个变量负相关.

增加

减小

(3)线性相关、非线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条

附近,我们就称这两个变量线性相关.

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.直线

微点拨由散点图判断两个变量正相关、负相关的方法:当散点图中的点散布在平面直角坐标系中从左下角到右上角的区域时,两个变量正相关;当散点图中的点散布在平面直角坐标系中从左上角到右下角的区域时,两个变量负相关.2.样本相关系数

微点拨当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.微思考成对样本数据的线性相关程度的强弱与样本相关系数r有怎样的关系?提示

样本相关系数r的取值范围为[-1,1],当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型

(1)数学表述式:如果两个变量之间的关系可以表示为

我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.(2)经验回归方程

(3)利用R2刻画回归效果

微点拨经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.4.列联表与独立性检验(1)2×2列联表如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d(2)独立性检验

利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.常用的小概率值和临界值表α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828作为判断χ2大小的标准

对点演练1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)利用散点图可以直观判断两个变量是否具有线性相关关系.(

)(2)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.(

)(4)两个变量的样本相关系数的绝对值越接近于1,它们的线性相关程度越强.(

)√√×√2.(多选)下列说法不正确的有(

)A.经验回归方程适用于一切样本和总体B.经验回归方程一般都有局限性C.样本取值的范围会影响经验回归方程的适用范围D.经验回归方程得到的预测值是响应变量的精确值答案

AD

解析

样本或总体具有线性相关关系时,才可求经验回归方程,而且由经验回归方程得到的函数值是近似值,而非精确值,因此经验回归方程有一定的局限性,所以A,D错误.故选AD.3.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:性别做不到“光盘”能做到“光盘”男4510女3015附:α0.100.050.005xα2.7063.8417.879参照附表,得到的正确结论是(

)A.依据小概率值α=0.01的独立性检验,认为该市居民能否做到“光盘”与性别有关联B.依据小概率值α=0.01的独立性检验,认为该市居民能否做到“光盘”与性别无关联C.依据小概率值α=0.10的独立性检验,认为该市居民能否做到“光盘”与性别有关联D.依据小概率值α=0.10的独立性检验,认为该市居民能否做到“光盘”与性别无关联答案

C

解析

零假设为H0:该市居民能否做到“光盘”与性别无关联.由表计算得χ2=

≈3.03>2.706=x0.10,依据α=0.10的独立性检验,我们推断H0不成立,即认为该市居民能否做到“光盘”与性别有关联,并且该推断犯错误的概率不超过0.10.故选C.增素能精准突破考点一数据的相关性典例突破例1.(1)(多选)有一散点图如图所示,在5组(x,y)数据中去掉D(3,10)后,下列说法正确的是(

)A.经验回归方程不变B.样本相关系数r变大C.各组数据对应的点到经验回归直线的距离的平方和变小D.变量x与变量y的相关程度变强(2)上图是具有相关关系的两个变量的一组数据的散点图和经验回归直线,若去掉一个点使得余下的5个点所对应的数据的样本相关系数最大,则应当去掉的点是(

)A.DB.EC.FD.A答案

(1)BCD

(2)B

解析

(1)根据D点在散点图中的位置可知,D比较偏离经验回归直线,故去掉D(3,10)后,数据比原来集中,相关程度变强,经验回归方程有所改变,A错误,B,C,D都正确.故选BCD.(2)因为样本相关系数的绝对值越大,|r|越接近于1,则说明两个变量的线性相关程度越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的样本相关系数最大,故选B.方法总结判断成对数据的相关关系的三种方法

A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0答案

D

解析

由散点图得两个变量负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下数据线性相关程度更强,|r|更接近于1,所以-1<r2<r1<0.故选D.考点二一元线性回归模型及其应用(多考向探究)考向1.经验回归方程及应用典例突破例2.如图是2016~2020年全国硕士研究生报考人数的折线图.注:年份代码1~5分别对应年份2016~2020(1)建立y关于t的经验回归方程;(2)根据(1)中的经验回归方程,预测2022年全国硕士研究生报考人数.方法总结求经验回归方程的步骤

对点训练2(2022山东济南一中高三检测)某滑雪场开业,下表统计了该滑雪场开业第x天的滑雪人数y(单位:百人)的数据.天数代码x1234567滑雪人数y(百人)11131615202123(1)根据第1至7天的数据分析,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明(保留两位有效数字);(2)经过测算,若一天中滑雪人数超过3000人时,当天滑雪场可实现盈利,请建立y关于x的经验回归方程,并预测该滑雪场开业的第几天开始盈利.因为样本相关系数|r|接近于1,所以可以推断x和y这两个变量线性相关,且相关程度很强.因为一天中滑雪人数超过3000人时,当天滑雪场可实现盈利,即2x+9>30时,可实现盈利,解得x>10.5,所以根据经验回归方程预测,该滑雪场开业的第11天开始盈利.考向2.非线性经验回归方程及应用典例突破例3.已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:且(si,yi)与(ti,yi)(i=1,2,3,…,13)的样本相关系数分别为r1,r2,且r2≈-0.9953.(1)用样本相关系数说明用哪种模型建立y关于x的经验回归方程更合适;(2)根据(1)的结果及表中数据,建立y关于x的经验回归方程;名师点析解决非线性经验回归分析问题的一般思路是换元,化非线性为线性,再用经验回归方程的方法求解.对点训练3近期,某公交公司分别推出A和B两种扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(计10人次为1个单位,例如y=6表示60人次),统计数据如表所示:x1234567y611213466101196根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中的数据,建立y关于x的经验回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:解

(1)根据散点图判断,y=c·dx适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型.考点三列联表与独立性检验典例突破例4.(2022全国甲,文17)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:公司次数准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)试根据小概率值α=0.10的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车所属公司有没有关系.α0.100.050.01xα2.7063.8416.635(2)根据已知数据得到列联表如下:公司次数合计准点班次数未准点班次数A24020260B21030240合计45050500零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司有关.≈3.205>2.706=x0.10.根据小概率值α=0.10的独立性检验,推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关,此推断犯错误的概率不大于0.10.方法总结独立性检验的一般步骤

对点训练4某校组织了全体学生参加“建党100周年”知识竞赛,从高一、高二年级各随机抽取50名学生的竞赛成绩(满分100分),统计如下表:分数段[50,60)[60,70)[70,80)[80,90)[90,100]高一年级310121510高二年级46101812(1)分别估计高一、高二年级竞赛成绩的平均值(同一组中的数据以该组数据所在区间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论