2023版高三一轮数学复习课件(新高考人教版):第9章 第3讲 成对数据的统计分析_第1页
2023版高三一轮数学复习课件(新高考人教版):第9章 第3讲 成对数据的统计分析_第2页
2023版高三一轮数学复习课件(新高考人教版):第9章 第3讲 成对数据的统计分析_第3页
2023版高三一轮数学复习课件(新高考人教版):第9章 第3讲 成对数据的统计分析_第4页
2023版高三一轮数学复习课件(新高考人教版):第9章 第3讲 成对数据的统计分析_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章统计成对数据的统计分析第三讲成对数据的统计分析知识梳理双基自测考点突破互动探究名师讲坛素养提升知识梳理双基自测知识点一变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个_另一个的程度,这种关系称为相关关系(2)散点图每一个序号下的成对样本数据都可用直角坐标系中的_表示出来,由这些点组成的统计图称为散点图去精确地决定点(3)正相关、负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现_的趋势,则称这两个变量负相关(4)变量的线性相关如果两个变量的取值呈现_,而且散点落在

2、_附近,我们就称这两个变量线性相关一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量_.增加减小正相关或负相关一条直线非线性相关或曲线相关(5)样本相关系数称r_为变量x和变量y的相关系数r1,1,当r0时,成对样本数据_;当r0时,成对样本数据_;当|r|接近1时,成对样本数据的线性相关程度_;当|r|接近0时,成对样本数据的线性相关程度_.正相关负相关越强越弱bxae02因变量或响应变量自变量或解释变量经验回归直线最小二乘法最小二乘估计观测值预测值残差残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称

3、为_.残差的散点图残差比较均匀地集中分布在以横轴为对称轴的水平带状区域内,则满足一元线性回归模型对随机误差的假设残差分析小好大差知识点三独立性检验(1)分类变量:用以区别不同的现象或性质的随机变量(2)22列联表设X,Y为两个分类变量,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)如下:abbdabcd(3)独立性检验零假设(或原假设)以为样本空间的古典概型设X和Y为定义在上,取值于0,1的成对分类变量H0:_称为零假设临界值2_.P(Y1|X0)P(Y1|X1)临界值对于任何小概率值,可以找到相应的正实数x,使得下面关系成立:P(2x).称x为的_,这个临界值就可作为

4、判断2大小的标准概率值越小,临界值x越大独立性检验基于小概率值的检验规则是:当2xa时,我们就推断H0不成立,即认为X和Y_,该推断犯错误的概率不_;不独立超过当2x时,我们没有充分证据推断H0不成立,可以认为X和Y _.这种利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验独立(4)独立性检验解决实际问题的一般步骤:提出零假设H0:X与Y相互独立,并给出在问题中的解释根据抽样数据整理出22列联表,计算2值,并与临界值x比较根据经验规则得出推断结论在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律1回归分析是对具有相关

5、关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的经验回归方程才有实际意义,否则,求出的经验回归方程毫无意义根据经验回归方程进行预报,仅是一个预报值,而不是真实发生的值题组一走出误区1判断下列结论是否正确(请在括号中打“”或“”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()BD3(选择性必修3P132例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受

6、甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名试根据小概率值0.005的独立性检验,分析甲、乙两种疗法的效果,结论为_.附:两种疗法效果没有差异C5(2019高考全国卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?考点突破互动探究(1)(2021江西省南昌二中高二期末)如图是具有相关关系的两个变量的一组数据的

7、散点图的回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是_.例1E考点一相关关系的判断自主练透(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是()Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r1r3解析(1)由于点越靠近回归直线,则相关性越强,相关系数越大,又由于点E到回归直线的距离最大,所以要去掉点E.(2)由相关系数的定义及散点图所表达的含义,可知r2r40r30,d0)对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量x与年使用人次y的经验回归方程类型(给出判断即可,不必说明理由),并求出y关于x的经验回归

8、方程;(2)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8 000辆单车,则几年后可实现盈利?(2)投入8千辆单车,则年使用人次为3.47100.258347千人次,每年的收益为347(10.2)277.6(千元),总投资8 0002001 600 0001 600千元,假设需要n年开始盈利,则n277.61 600,即n5.76,故需要6年才能开始盈利非线性相关问题一般通过换元法转化为线性相关(线性回归分析)问题解决变式训练2(2020课标)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20

9、个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是()AyabxByabx2CyabexDyabln x解析观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象,故选DD(1)(2021全国高考)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:例4考点四独立性检验师生共研一级品二级品合计甲机床15050200乙机床12080200合

10、计270130400(2) (2021四川大学附中期中)2020年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为32)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85.估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)结合频率分布直方图,请完成以下22列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;(

11、2)由已知得(0.015b0.03)100.85,解得b0.04,又(0.005a)1010.85,解得a0.01,评分的平均值为550.05650.1750.3850.4950.1580.完成22列联表如下表:态度性别满意不满意合计男生253560女生301040合计5545100解独立性检验的应用问题的关注点(1)两个明确:明确两类主体明确研究的两个问题(2)两个关键:准确列出22列联表:准确理解2.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的x值与求得的2相比较另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1p

12、.变式训练3(2021广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:使用寿命年数4年5年6年7年总计A型出租车(辆)10204525100B型出租车(辆1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?使用寿命不高于5年使用寿命不低于6年总计A型B型总计P(2x)0.050.0100.001x3.8416.63510.828解析(1)根据题目所给数据得到如下22的列联考:使用寿命不高于5年使用寿命不低于6年总计A型30

13、70100B型5050100总计80120200名师讲坛素养提升重温高考(2020全国)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,例5(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i1,2,20)的相关系数(精确到0.01);(3)根据现有

14、统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样,先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样方法抽取样本即可(2020课标全国)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):例6(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论