新教材适用2024版高考数学一轮总复习第9章统计成对数据的统计分析第3讲成对数据的统计分析课件_第1页
新教材适用2024版高考数学一轮总复习第9章统计成对数据的统计分析第3讲成对数据的统计分析课件_第2页
新教材适用2024版高考数学一轮总复习第9章统计成对数据的统计分析第3讲成对数据的统计分析课件_第3页
新教材适用2024版高考数学一轮总复习第9章统计成对数据的统计分析第3讲成对数据的统计分析课件_第4页
新教材适用2024版高考数学一轮总复习第9章统计成对数据的统计分析第3讲成对数据的统计分析课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计成对数据的统计分析第三讲成对数据的统计分析知识梳理·双基自测名师讲坛·素养提升考点突破·互动探究知识梳理·双基自测知识点一变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个_______________另一个的程度,这种关系称为相关关系.(2)散点图每一个序号下的成对样本数据都可用直角坐标系中的_____表示出来,由这些点组成的统计图称为散点图.去精确地决定点(3)正相关、负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_______的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现_______的趋势,则称这两个变量负相关.(4)变量的线性相关如果两个变量的取值呈现_________________,而且散点落在___________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量_______________________.增加减小正相关或负相关一条直线非线性相关或曲线相关正相关负相关越强越弱bx+a+e0σ2因变量或响应变量自变量或解释变量经验回归直线最小二乘法最小二乘法观测值预测值残差残差分析小好大差知识点三独立性检验(1)分类变量:用以区别不同的现象或性质的随机变量.(2)2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:

y1y2总计x1ab_________x2cdc+d总计a+c_______________________a+bb+da+b+c+d(3)独立性检验①零假设(或原假设)以Ω为样本空间的古典概型.设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.H0:_______________________________________称为零假设.P(Y=1|X=0)=P(Y=1|X=1)②临界值

2=_________________________.对于任何小概率值α,可以找到相应的正实数xα,使得下面关系成立:P(

2≥xα)=α.称xα为α的_________,这个临界值就可作为判断

2大小的标准.概率值α越小,临界值xα越大.临界值③独立性检验基于小概率值α的检验规则是:当

2≥xα时,我们就推断H0不成立,即认为X和Y_________,该推断犯错误的概率不_________;当

2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y_______.这种利用

2的取值推断分类变量X和Y是否独立的方法称为

2独立性检验,读作“卡方独立性检验”,简称独立性检验.不独立超过α独立(4)独立性检验解决实际问题的一般步骤:①提出零假设H0:X与Y相互独立,并给出在问题中的解释.②根据抽样数据整理出2×2列联表,计算

2值,并与临界值xα比较.③根据经验规则得出推断结论.④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的经验回归方程才有实际意义,否则,求出的经验回归方程毫无意义.根据经验回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.独立性检验是对两个变量的关系的可信程度的判断,而不是对其是否有关系的判断.根据

2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活.题组一走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(

)(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.(

)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(

)√×√×√×BD3.(选择性必修3P132例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析甲、乙两种疗法的效果,结论为_______________________.附:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828两种疗法效果没有差异[解析]

由题意的两种疗法数据的列联表疗法疗效合计未治愈治愈甲155267乙66369合计21115136C5.(2022·全国高考甲卷(节选))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?

准点班次数未准点班次数A24020B21030P(

2≥xα)0.1000.0500.010xα2.7063.8416.635[解析]

根据已知数据得到列联表如下:公司准点班次数未准点班次数合计A24020260B21030240合计45050500考点突破·互动探究(1)(2022·江西省南昌二中期末)如图是具有相关关系的两个变量的一组数据的散点图的回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是_____.例1考点一相关关系的判断——自主练透E(2)(多选题)(2022·山东临沂二模)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是()A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|AC[解析]

(1)由于点越靠近回归直线,则相关性越强,相关系数越大,又由于点E到回归直线的距离最大,所以要去掉点E.(2)由散点图可知,线性相关系数r1的图象表示y与x成负相关,故-1<r1<0,故A正确;线性相关系数r2的图象表示y与x正相关,故1>r2>0,故B错误;∵线性相关系数r2的点较线性相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.故选AC.(1)(2022·江西南昌模拟)某工厂研究某种产品的产量x(单位:吨)与某种原材料的用量y(单位:吨)之间的相关关系,在生产过程中收集了4组数据如表所示:例2考点二一元线性回归模型——师生共研x3467y2.5345.9C(2)(2023·河南安阳开学考)2022年6月某一周,“东方甄选”直播间的交易额共计3.5亿元,数据统计如下表:①通过分析,发现可用线性回归模型拟合交易额y与t的关系,请用相关系数(系数精确到0.01)加以说明;②利用最小二乘法建立y关于t的经验回归方程(系数精确到0.1),并预测下一周的第一天(即第8天)的交易额.第t天1234567交易额y/千万元y1y2y3y4y5y6y7因为交易额y与t的相关系数近似为0.98,说明交易额y与t具有很强的正线性相关关系,从而可用线性回归模型拟合交易额y与t的关系.〔变式训练1〕(2021·安徽六校教育研究会素质测试)某商场近5个月的销售额和利润额如表所示:(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系?(2)求出利润额y关于销售额x的经验回归直线方程;销售额x/千万元35679利润额y/百万元13345[解析]

(1)散点图如图所示:两个变量正相关,且具有线性相关关系.(2021·河南驻马店期末)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数据如下表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.例3考点三非线性经验回归问题——师生共研x1234567y611213466101196(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型y=a+blgx或指数函数模型y=c·dx(c>0,d>0)对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量x与年使用人次y的经验回归方程类型(给出判断即可,不必说明理由),并求出y关于x的经验回归方程;(2)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,则几年后可实现盈利?参考数据:(2)投入8千辆单车,则年使用人次为3.47×100.25×8=347千人次,每年的收益为347×(1-0.2)=277.6(千元),总投资8000×200=1600000=1600千元,假设需要n年开始盈利,则n×277.6>1600,即n>5.76,故需要6年才能开始盈利.非线性相关问题一般通过换元法转化为线性相关(线性回归分析)问题解决.ABD(1)(2021·全国高考)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:例4考点四独立性检验——师生共研

一级品二级品合计甲机床15050200乙机床12080200合计270130400P(

2≥xα)0.0500.0100.001xα3.8416.63510.828(2)(2022·四川大学附中期中)2020年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施.为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为32)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85.①估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)②结合频率分布直方图,请完成以下2×2列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;P(

2≥xα)0.100.050.0250.0100.005xα2.7063.8415.0246.6357.879(2)①由已知得(0.015+b+0.03)×10=0.85,解得b=0.04,又(0.005+a)×10=1-0.85,解得a=0.01,评分的平均值为55×0.05+65×0.1+75×0.3+85×0.4+95×0.15=80.解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体.②明确研究的两个问题.(2)两个关键:①准确列出2×2列联表.②准确理解

2.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的xα值与求得的

2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.A.25 B.45C.60 D.40P(

2≥xα)0.0500.010xα3.8416.635使用寿命年数4年5年6年7年总计A型出租车(辆)10204525100B型出租车(辆2)(2023·广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:①填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?

使用寿命不高于5年使用寿命不低于6年总计A型

B型

总计

P(

2≥xα)0.050.0100.001xα3.8416.63510.828[解析]

(1)由题意被调查的男女生人数相同,设男生的人数为:5n(n∈N*),由题意可列出2×

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论