2021届全国新高考数学备考复习-统计与统计案例课件_第1页
2021届全国新高考数学备考复习-统计与统计案例课件_第2页
2021届全国新高考数学备考复习-统计与统计案例课件_第3页
2021届全国新高考数学备考复习-统计与统计案例课件_第4页
2021届全国新高考数学备考复习-统计与统计案例课件_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021届全国新高考数学备考复习统计与统计案例2021届全国新高考数学备考复习真题自测考向速览必备知识整合提升考点精析考法突破统计与统计案例真题自测考向速览必备知识整合提升考点精析考法突破1.[四川广元2019统考]下列四个图各反映了两个变量的某种关系,其中可以看作具有线性相关关系的是()A.①③B.①④C.②③D.①②第5节统计与统计案例真题自测考向速览考点1变量的相关性【答案】B【解析】∵对两个变量的散点图而言,若样本点成带状分布,则两个变量具有线性相关关系,∴两个变量具有线性相关关系的图是①和④.1.[四川广元2019统考]下列四个图各反映了两个变量的某种2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()A.r4<r2<0<r1<r3B.r2<r4<0<r1<r3C.r2<r4<0<r3<r1D.r4<r2<0<r3<r1第5节统计与统计案例2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行第5节统计与统计案例【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中分布在一条线附近,说明相关性越强.由题中数据,可知图(1)(3)为正相关,图(2)(4)为负相关,故r1>0,r3>0,r2<0,r4<0.又图(1)与(2)中的点更集中分布于一条直线附近,故r1>r3,r2<r4.因此r2<r4<0<r3<r1.【答案】C第5节统计与统计案例【解析】根据散点图的特征,数据大致呈第5节统计与统计案例3.[课标全国Ⅱ2018·18]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.考点2回归分析第5节统计与统计案例3.[课标全国Ⅱ2018·18]下图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.ˆyyˆ【解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为

(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为(亿元).第5节统计与统计案例为了预测该地区2018年的环境基础设施投资额,建立了y与时间(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.第5节统计与统计案例(2)利用模型②得到的预测值更可靠.第5节统计与统计案例(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(给出了2种理由,答出其中任意一种或其他合理理由均可)第5节统计与统计案例(ii)从计算结果看,相对于2016年的环境基础设施投资额24.[山东省2020届一模]如图给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x为1~7).第5节统计与统计案例4.[山东省2020届一模]如图给出了根据我国2012年~2第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例考点3独立性检验第5节统计与统计案例考点3独立性检验第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例必备知识整合提升1.散点图

将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图,如图所示.第5节统计与统计案例必备知识整合提升1.散点图将样本中n个数据点(xi

利用散点图识别两个变量之间的关系①如果所有的样本点都落在某一直线附近,两变量之间就有线性相关关系,如图(1).②如果所有的样本点都落在某一函数曲线(不是一条直线)附近,两变量之间就有非线性相关关系,如图(2).③如果散点图中的点的分布几乎没有什么规则,这两个变量之间就不具有相关关系,即两个变量之间是相互独立的,如图(3).第5节统计与统计案例利用散点图识别两个变量之间的关系第5节统2.两个变量线性相关的类型①正相关:如果两个变量的散点图中的点散布在从________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关:如果两个变量的散点图中的点散布在从________到________的区域,对于两个变量的这种相关关系,我们将它称为负相关.左下角右上角左上角右下角第5节统计与统计案例2.两个变量线性相关的类型①正相关:如果两个变量的散点图中的3.回归直线和回归方程(1)如果散点图中点的分布从整体上看大致在__________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.这条回归直线的方程简称回归方程.(2)使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.利用最小二乘法求回归方程:这样,回归直线的斜率为,截距为,即回归方程为回归直线一定经过样本点的中心,据此性质可以解决有关的计算问题.同时可以应用回归方程作出预测.第5节统计与统计案例3.回归直线和回归方程(1)如果散点图中点的分布从整体上看大4.相关系数r

①|r|≤1,当r>0时,两个变量________;当r<0时,两个变量负相关.②|r|越接近于1,两个变量的线性相关关系________;|r|越接近于0,两个变量的线性相关关系_________.通常当|r|>________时,我们认为两个变量之间存在较强的线性相关关系.当|r|=1时,所有点均在直线上.第5节统计与统计案例4.相关系数r①|r|≤1,当r>0时,两个5.相关指数R2R2表达式中的为确定的数,因此R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.R2越接近于1,表示回归的效果越好.第5节统计与统计案例5.相关指数R2R2表达式中的6.独立性检验

(1)2×2列联表列出的两个分类变量的________表称作列联表.假设有两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:构造随机变量K2=________________________.第5节统计与统计案例6.独立性检验(1)2×2列联表构造随机变量K(2)判断两个分类变量X和Y是否有关系的方法利用随机变量________来确定在多大程度上可以认为“两个分类变量________”的方法称为两个分类变量的独立性检验.第5节统计与统计案例(2)判断两个分类变量X和Y是否有关系的方法第5节统计与(3)独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中没有发现足够证据支持结论“两个分类变量有关系”.第5节统计与统计案例(3)独立性检验的基本步骤②利用公式计算随机变量K2的观测值考点精析考法突破考点1变量的相关性判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:b>0时,正相关;b<0时,负相关.^^第5节统计与统计案例考点精析考法突破考点1变量的相关性判定两个变量相关[四川名校2020届联合测评]根据最小二乘法由一组样本点(xi,yi)(其中i=1,2,…,300)求得的回归方程是,则下列说法正确的是()A.至少有一个样本点落在回归直线上B.若所有样本点都在回归直线上,则两个变量之间的相关系数为1C.对所有的解释变量xi(i=1,2,…,300),的值一定与yi有误差D.若回归直线的斜率,则变量x与y正相关第5节统计与统计案例[四川名校2020届联合测评]根据最小二乘法【解析】回归直线必过样本数据点的中心,但样本点可能全部不在回归直线上,故A错误;若所有样本点都在回归直线上,则变量间的相关系数为±1,故B错误;若所有的样本点都在回归直线上,则的值与yi相等,故C错误;相关系数r与符号相同,若回归直线的斜率>0,则r>0,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.第5节统计与统计案例【答案】D【解析】回归直线必过样本数据点的中心,但样本点可能全部不在回1.对两个变量x,y进行线性相关检验,得相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得相关系数r2=-0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强【解析】由线性相关系数r1=0.7859>0知x与y正相关.由线性相关系数r2=-0.9568<0知u与v负相关.又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.【答案】C第5节统计与统计案例1.对两个变量x,y进行线性相关检验,得相关系数r1=0.7考点2回归分析(1)求回归方程:利用公式,求出回归系数,,或者利用回归直线一定经过样本点的中心来求系数.(2)预测变量值:①若已知回归方程(方程中无参数)进行预测时,可以直接将数值代入求得特定要求下的预测值;②若线性回归方程中有参数,则可以根据回归直线一定经过样本点的中心求出参数值,得到回归方程,进而完成预测.1.线性回归分析第5节统计与统计案例考点2回归分析(1)求回归方程:利用公式,求出回归系

非线性回归分析:当两个变量之间不具有线性相关关系时,即是非线性相关关系.此时建立回归模型的基本步骤:①根据原始数据作出散点图;②根据散点图上点的分布选取可能符合的函数模型;③将非线性函数转化为线性函数后,再作出散点图或计算线性相关系数,判断哪一种拟合效果最好.2.非线性回归分析第5节统计与统计案例非线性回归分析:当两个变量之间不具有线性相关

[江西南昌七校2019期末联考]某学校开展研究性学习活动,某同学获得一组实验数据如下表:【解析】根据实验数据可以得出,x近似增加一个单位时,y的增量近似为2.5,3.5,4.5,6,比较接近y=,故选D.【答案】DA.y=2x-2B.y=C.y=log2xD.y=

第5节统计与统计案例对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是()[江西南昌七校2019期末联考]某学校开展研

[陕西2019第三次联考]某工厂某产品近几年的产量统计如下表:(1)根据表中数据,求y关于t的线性回归方程(2)若近几年该产品每千克的价格v(单位:元)与年产量y满足的函数关系式为v=4.5-0.3y,且每年该产品都能售完.(ⅰ)根据(1)中所建立的回归方程预测该地区2019年该产品的产量.(ⅱ)当t(1≤t≤7)为何值时,销售额S最大?附:对于一组数据(t1,y1),(t2,y2),…,(tn,yn),其回归直线的斜率和截距的最小二乘估计分别为第5节统计与统计案例[陕西2019第三次联考]某工厂某产【解】(1)由题意,得由,得又得所以y关于t的线性回归方程为第5节统计与统计案例【解】(1)由题意,得第5节统计与统计案例(2)(ⅰ)由(1)知,当t=7时,=0.16×7+6.44=7.56,所以预测该地区2019年该产品的产量为7.56万吨.(ⅱ)当年产量为y时,销售额S=(4.5-0.3y)y×107=(-0.3y2+4.5y)×107,当y=7.5时,函数S取得最大值.又因为y∈{6.6,6.7,7,7.1,7.2,7.4,7.56},计算得当y=7.56,即t=7时,销售额最大.第5节统计与统计案例(2)(ⅰ)由(1)知2.[云南师大附中2020届月考]2019年9月24日国家统计局在庆祝中华人民共和国成立70周年活动新闻中心举办新闻发布会指出,1952年~2018年,我国GDP从679.1亿元跃升至90.03万亿元,实际增长174倍;人均GDP从119元提高到6.46万元,实际增长70倍.全国各族人民,砥砺奋进,顽强拼搏,实现了经济社会的跨越式发展.如图是全国2010年至2018年GDP总量y(万亿元)的折线图.第5节统计与统计案例2.[云南师大附中2020届月考]2019年9月24日国家统(1)由折线图看出,可用线性回归模型拟合y与年份代码t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年全国GDP的总量.参考数据:参考公式:相关系数回归方程中斜率和截距的最小二乘估计分别为第5节统计与统计案例(1)由折线图看出,可用线性回归模型拟合y与年份代码t的关系【解】(1)由折线图中的数据和参考数据得所以因为y与t的相关系数近似为0.997,说明y与t之间具有较强的线性相关关系,从而可以用线性回归模型拟合y与t的关系.(2)由已知及(1)得=所以y关于t的回归方程为=35.92+5.75t.将2019年对应的代码t=10代入回归方程得=35.92+5.75×10=93.42.所以预测2019年全国GDP总量约为93.42万亿元.第5节统计与统计案例【解】(1)由折线图中的数据和参考数据得第5节统计与统计考点3独立性检验(1)根据样本数据制成2×2列联表.(2)根据公式K2=计算K2的观测值k.(3)比较k与临界值k0的大小关系,作统计推断.1.独立性检验的一般步骤第5节统计与统计案例考点3独立性检验(1)根据样本数据制成2×2列联表.①当K2≤2.706时,没有充分的证据判定变量A,B有关系,可以认为变量A,B没有关系;②当K2>2.706时,有90%的把握判定变量A,B有关系;③当K2>3.841时,有95%的把握判定变量A,B有关系;④当K2>6.635时,有99%的把握判定变量A,B有关系;⑤当K2>10.828时,有99.9%的把握判定变量A,B有关系.2.两个分类变量A和B是否有关系的判断方法第5节统计与统计案例①当K2≤2.706时,没有充分的证据判定变量A,B有关系,

为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了数据.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.第5节统计与统计案例为了调查某地区成年人血液的一项指标,现随机(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标正常的人数X的分布列及数学期望.附:K2=,其中n=a+b+c+d.第5节统计与统计案例(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×【解】(1)由样本数据可得2×2列联表如下:K2的观测值所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系.第5节统计与统计案例【解】(1)由样本数据可得2×2列联表如下:K2的观测值第(2)由样本数据可知,男性此项血液指标正常的概率为,女性此项血液指标正常的概率为.此项血液指标正常的人数X的可能取值为0,1,2,3,4.则第5节统计与统计案例(2)由样本数据可知,男性此项血液指标正常的概率为所以X的分布列为所以此项血液指标正常的人数X的数学期望为2.8.,第5节统计与统计案例所以X的分布列为所以第5节统计与统计案例3.[湖北鄂南高中2020届月考]垃圾种类可分为可回收垃圾、干垃圾、湿垃圾、有害垃圾,为调查中学生对垃圾分类的了解程度,某调查小组随机抽取了某市的100名高中生,请他们指出生活中若干项常见垃圾的种类,把能准确分类不少于3项的称为“比较了解”,少于3项的称为“不太了解”.调查结果如下:第5节统计与统计案例3.[湖北鄂南高中2020届月考]垃圾种类可分为可回收垃圾、(1)完成如下2×2列联表并判断是否有99%的把握认为了解垃圾分类与性别有关?第5节统计与统计案例(1)完成如下2×2列联表并判断是否有99%的把握认为了解垃【解】(1)根据题意填得列联表如下,计算K2的观测值K=6.635,所以没有99%的把握认为了解垃圾分类与性别有关.第5节统计与统计案例【解】(1)根据题意填得列联表如下,计算K2的观测值K=(2)抽取的100名高中生中按照男、女生采用分层抽样的方法抽取10人的样本.(i)求抽取的女生和男生的人数;(ii)从10人的样本中随机抽取两人,求两人都是女生的概率.参考数据:第5节统计与统计案例(2)抽取的100名高中生中按照男、女生采用分层抽样的方法抽【解】(2)(i)抽取的女生人数是10×=3,男生人数是10×=7.(ii)记样本中的3名女生分别为A,B,C,7名男生分别为a,b,c,d,e,f,g.从这10人中随机抽取两人,总的基本事件为“两人都是女生”的基本事件为AB,AC,BC,共3种.故所求的概率第5节统计与统计案例【解】(2)(i)抽取的女生人数是10×=3,2021届全国新高考数学备考复习统计与统计案例2021届全国新高考数学备考复习真题自测考向速览必备知识整合提升考点精析考法突破统计与统计案例真题自测考向速览必备知识整合提升考点精析考法突破1.[四川广元2019统考]下列四个图各反映了两个变量的某种关系,其中可以看作具有线性相关关系的是()A.①③B.①④C.②③D.①②第5节统计与统计案例真题自测考向速览考点1变量的相关性【答案】B【解析】∵对两个变量的散点图而言,若样本点成带状分布,则两个变量具有线性相关关系,∴两个变量具有线性相关关系的图是①和④.1.[四川广元2019统考]下列四个图各反映了两个变量的某种2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()A.r4<r2<0<r1<r3B.r2<r4<0<r1<r3C.r2<r4<0<r3<r1D.r4<r2<0<r3<r1第5节统计与统计案例2.[湖南长沙长郡中学2019二模]某统计部门对四组数据进行第5节统计与统计案例【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中分布在一条线附近,说明相关性越强.由题中数据,可知图(1)(3)为正相关,图(2)(4)为负相关,故r1>0,r3>0,r2<0,r4<0.又图(1)与(2)中的点更集中分布于一条直线附近,故r1>r3,r2<r4.因此r2<r4<0<r3<r1.【答案】C第5节统计与统计案例【解析】根据散点图的特征,数据大致呈第5节统计与统计案例3.[课标全国Ⅱ2018·18]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.考点2回归分析第5节统计与统计案例3.[课标全国Ⅱ2018·18]下图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.ˆyyˆ【解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为

(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为(亿元).第5节统计与统计案例为了预测该地区2018年的环境基础设施投资额,建立了y与时间(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.第5节统计与统计案例(2)利用模型②得到的预测值更可靠.第5节统计与统计案例(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(给出了2种理由,答出其中任意一种或其他合理理由均可)第5节统计与统计案例(ii)从计算结果看,相对于2016年的环境基础设施投资额24.[山东省2020届一模]如图给出了根据我国2012年~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x为1~7).第5节统计与统计案例4.[山东省2020届一模]如图给出了根据我国2012年~2第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例考点3独立性检验第5节统计与统计案例考点3独立性检验第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例第5节统计与统计案例必备知识整合提升1.散点图

将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图,如图所示.第5节统计与统计案例必备知识整合提升1.散点图将样本中n个数据点(xi

利用散点图识别两个变量之间的关系①如果所有的样本点都落在某一直线附近,两变量之间就有线性相关关系,如图(1).②如果所有的样本点都落在某一函数曲线(不是一条直线)附近,两变量之间就有非线性相关关系,如图(2).③如果散点图中的点的分布几乎没有什么规则,这两个变量之间就不具有相关关系,即两个变量之间是相互独立的,如图(3).第5节统计与统计案例利用散点图识别两个变量之间的关系第5节统2.两个变量线性相关的类型①正相关:如果两个变量的散点图中的点散布在从________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关:如果两个变量的散点图中的点散布在从________到________的区域,对于两个变量的这种相关关系,我们将它称为负相关.左下角右上角左上角右下角第5节统计与统计案例2.两个变量线性相关的类型①正相关:如果两个变量的散点图中的3.回归直线和回归方程(1)如果散点图中点的分布从整体上看大致在__________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.这条回归直线的方程简称回归方程.(2)使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.利用最小二乘法求回归方程:这样,回归直线的斜率为,截距为,即回归方程为回归直线一定经过样本点的中心,据此性质可以解决有关的计算问题.同时可以应用回归方程作出预测.第5节统计与统计案例3.回归直线和回归方程(1)如果散点图中点的分布从整体上看大4.相关系数r

①|r|≤1,当r>0时,两个变量________;当r<0时,两个变量负相关.②|r|越接近于1,两个变量的线性相关关系________;|r|越接近于0,两个变量的线性相关关系_________.通常当|r|>________时,我们认为两个变量之间存在较强的线性相关关系.当|r|=1时,所有点均在直线上.第5节统计与统计案例4.相关系数r①|r|≤1,当r>0时,两个5.相关指数R2R2表达式中的为确定的数,因此R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.R2越接近于1,表示回归的效果越好.第5节统计与统计案例5.相关指数R2R2表达式中的6.独立性检验

(1)2×2列联表列出的两个分类变量的________表称作列联表.假设有两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:构造随机变量K2=________________________.第5节统计与统计案例6.独立性检验(1)2×2列联表构造随机变量K(2)判断两个分类变量X和Y是否有关系的方法利用随机变量________来确定在多大程度上可以认为“两个分类变量________”的方法称为两个分类变量的独立性检验.第5节统计与统计案例(2)判断两个分类变量X和Y是否有关系的方法第5节统计与(3)独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中没有发现足够证据支持结论“两个分类变量有关系”.第5节统计与统计案例(3)独立性检验的基本步骤②利用公式计算随机变量K2的观测值考点精析考法突破考点1变量的相关性判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:b>0时,正相关;b<0时,负相关.^^第5节统计与统计案例考点精析考法突破考点1变量的相关性判定两个变量相关[四川名校2020届联合测评]根据最小二乘法由一组样本点(xi,yi)(其中i=1,2,…,300)求得的回归方程是,则下列说法正确的是()A.至少有一个样本点落在回归直线上B.若所有样本点都在回归直线上,则两个变量之间的相关系数为1C.对所有的解释变量xi(i=1,2,…,300),的值一定与yi有误差D.若回归直线的斜率,则变量x与y正相关第5节统计与统计案例[四川名校2020届联合测评]根据最小二乘法【解析】回归直线必过样本数据点的中心,但样本点可能全部不在回归直线上,故A错误;若所有样本点都在回归直线上,则变量间的相关系数为±1,故B错误;若所有的样本点都在回归直线上,则的值与yi相等,故C错误;相关系数r与符号相同,若回归直线的斜率>0,则r>0,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.第5节统计与统计案例【答案】D【解析】回归直线必过样本数据点的中心,但样本点可能全部不在回1.对两个变量x,y进行线性相关检验,得相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得相关系数r2=-0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强【解析】由线性相关系数r1=0.7859>0知x与y正相关.由线性相关系数r2=-0.9568<0知u与v负相关.又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.【答案】C第5节统计与统计案例1.对两个变量x,y进行线性相关检验,得相关系数r1=0.7考点2回归分析(1)求回归方程:利用公式,求出回归系数,,或者利用回归直线一定经过样本点的中心来求系数.(2)预测变量值:①若已知回归方程(方程中无参数)进行预测时,可以直接将数值代入求得特定要求下的预测值;②若线性回归方程中有参数,则可以根据回归直线一定经过样本点的中心求出参数值,得到回归方程,进而完成预测.1.线性回归分析第5节统计与统计案例考点2回归分析(1)求回归方程:利用公式,求出回归系

非线性回归分析:当两个变量之间不具有线性相关关系时,即是非线性相关关系.此时建立回归模型的基本步骤:①根据原始数据作出散点图;②根据散点图上点的分布选取可能符合的函数模型;③将非线性函数转化为线性函数后,再作出散点图或计算线性相关系数,判断哪一种拟合效果最好.2.非线性回归分析第5节统计与统计案例非线性回归分析:当两个变量之间不具有线性相关

[江西南昌七校2019期末联考]某学校开展研究性学习活动,某同学获得一组实验数据如下表:【解析】根据实验数据可以得出,x近似增加一个单位时,y的增量近似为2.5,3.5,4.5,6,比较接近y=,故选D.【答案】DA.y=2x-2B.y=C.y=log2xD.y=

第5节统计与统计案例对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是()[江西南昌七校2019期末联考]某学校开展研

[陕西2019第三次联考]某工厂某产品近几年的产量统计如下表:(1)根据表中数据,求y关于t的线性回归方程(2)若近几年该产品每千克的价格v(单位:元)与年产量y满足的函数关系式为v=4.5-0.3y,且每年该产品都能售完.(ⅰ)根据(1)中所建立的回归方程预测该地区2019年该产品的产量.(ⅱ)当t(1≤t≤7)为何值时,销售额S最大?附:对于一组数据(t1,y1),(t2,y2),…,(tn,yn),其回归直线的斜率和截距的最小二乘估计分别为第5节统计与统计案例[陕西2019第三次联考]某工厂某产【解】(1)由题意,得由,得又得所以y关于t的线性回归方程为第5节统计与统计案例【解】(1)由题意,得第5节统计与统计案例(2)(ⅰ)由(1)知,当t=7时,=0.16×7+6.44=7.56,所以预测该地区2019年该产品的产量为7.56万吨.(ⅱ)当年产量为y时,销售额S=(4.5-0.3y)y×107=(-0.3y2+4.5y)×107,当y=7.5时,函数S取得最大值.又因为y∈{6.6,6.7,7,7.1,7.2,7.4,7.56},计算得当y=7.56,即t=7时,销售额最大.第5节统计与统计案例(2)(ⅰ)由(1)知2.[云南师大附中2020届月考]2019年9月24日国家统计局在庆祝中华人民共和国成立70周年活动新闻中心举办新闻发布会指出,1952年~2018年,我国GDP从679.1亿元跃升至90.03万亿元,实际增长174倍;人均GDP从119元提高到6.46万元,实际增长70倍.全国各族人民,砥砺奋进,顽强拼搏,实现了经济社会的跨越式发展.如图是全国2010年至2018年GDP总量y(万亿元)的折线图.第5节统计与统计案例2.[云南师大附中2020届月考]2019年9月24日国家统(1)由折线图看出,可用线性回归模型拟合y与年份代码t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年全国GDP的总量.参考数据:参考公式:相关系数回归方程中斜率和截距的最小二乘估计分别为第5节统计与统计案例(1)由折线图看出,可用线性回归模型拟合y与年份代码t的关系【解】(1)由折线图中的数据和参考数据得所以因为y与t的相关系数近似为0.997,说明y与t之间具有较强的线性相关关系,从而可以用线性回归模型拟合y与t的关系.(2)由已知及(1)得=所以y关于t的回归方程为=35.92+5.75t.将2019年对应的代码t=10代入回归方程得=35.92+5.75×10=93.42.所以预测2019年全国GDP总量约为93.42万亿元.第5节统计与统计案例【解】(1)由折线图中的数据和参考数据得第5节统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论