




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四讲变量间的相关关系、统计案例知识梳理双基自测知识点一回归分析(1)相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系与函数关系不同,相关关系是一种_非确定性关系_(2)散点图:表示具有_相关_关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两变量的关系是否可以用线性关系表示若这些散点有y随x增大而增大的趋势,则称两个变量_正相关_;若这些散点有y随x增大而减小的趋势,则称两个变量_负相关_(3)回归方程:x,其中,_,它主要用来估计和预测取值,从而获得对这两个变量之间整体关系的了解(4)相关系数:r它主要用于相关量的显著性检验,以衡量它们之间的
2、线性相关程度当r0时表示两个变量正相关,当r0时表示两个变量负相关|r|越接近1,表明两个变量的线性相关性_越强_;当|r|接近0时,表明两个变量间几乎不存在相关关系,相关性_越弱_知识点二独立性检验(1)22列联表设X,Y为两个分类变量,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)如下:y1y2总计x1ababx2cdcd总计acbdabcd(2)独立性检验利用随机变量K2(也可表示为X2)(其中nabcd为样本容量)来判断“两个变量有关系”的方法称为独立性检验(3)独立性检验的一般步骤根据样本数据列出22列联表;计算随机变量K2的观测值k,查表确定临界值k0:如果
3、kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关”1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值2独立性检验是对两个变量的关系的可信程度的判断,而不是对其是否有关系的判断根据K2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活题组一走出误区1判断下列结论是否正确(请在括号中打“”或“”)(1)“名师出高徒”可以解释为教师的
4、教学水平与学生的水平成正相关关系()(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2 时,一定可卖出143杯热饮()(5)事件x,y关系越密切,则由观测数据计算得到的K2的观测值越大()(6)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()题组二走进教材2(P97T2)为调查中学生近视情况,测得某校男生150名中有80名近视,在14
5、0名女生中有70名近视在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(C)A回归分析B均值与方差C独立性检验D概率解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断3(P81例1)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_68_解析由30,得0.673054.975设表中的“模糊数字”为a,则62a758189755,a68题组三走向高考4(2
6、017山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x,已知xi225,yi1 600,4该班某学生的脚长为24,据此估计其身高为(C)A160B163C166D170解析由题意知4x又22.5,160,因此16022.54,70,因此4x70,当x24时,42470166,故选C5(2019高考全国卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1
7、)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2P(K2k)0.0500.0100.001k3.8416.63510.828解析(1)由调查数据,男顾客中对该商场服务满意的比率为0.8,因此男顾客对该商场服务满意的概率的估计值为0.8女顾客中对该商场服务满意的比率为0.6,因此女顾客对该商场服务满意的概率的估计值为0.6(2)由题可得K24.762由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异考点突破互动探究考点一相关关系的判断自主练透例1 (1)(2021四川资阳模拟)在一次对人体脂肪含量和
8、年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图根据该图,下列结论中正确的是(B)A人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是(A)Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r1r3解析(1)观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B(2)由相关
9、系数的定义及散点图所表达的含义,可知r2r40r3r1故选A名师点拨判断两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,负相关(3)线性回归直线方程中:0时,正相关;0时负相关考点二线性回归分析师生共研例2 (1)(2021湖湘名校教育联合体联考)2020年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:价格x99.51010.511销售量y1110865按公式计算,y与x的回归直线方程是:3.
10、2x,相关系数|r|0.986,则下列说法不正确的是(D)A变量x,y线性负相关且相关性较强B40C当x8.5时,y的估计值为12.8D相应于点(10.5,6)的残差约为0.4(2)(2020全国)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i60,i1 200,(xi)280,(yi)29 000,(xi)(yi)800求
11、该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);求样本(xi,yi)(i1,2,20)的相关系数(精确到0.01);根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由附:相关系数r,1.414解析(1)对A,由表可知y随x增大而减少,可认为变量x,y线性负相关,且相关性强,故A正确对B,价格平均(99.51010.511)10,销售量(1110865)8故回归直线恒过定点(10,8),故83.21040,故B正确对C,当x8.5时,3.28.
12、54012.8,故C正确对D,相应于点(10,8)的残差约为6(3.210.540)0.4,故D不正确故选D(2)样区野生动物平均数为i1 20060,地块数为200,该地区这种野生动物的估计值为2006012 000样本(xi,yi)的相关系数为r0.94由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样,先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样方法抽取样本即可名师点拨线性回归分析问题的类型及解题方法(1)求线性回归方程:利用公式,求出回归系数,待定系数法:利用回归直线过样本点中心求系数(2)利用回归方程进行预测:把回归直线方程看
13、作一次函数,求函数值(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数变式训练1(2021安徽六校教育研究会素质测试)某商场近5个月的销售额和利润额如表所示:销售额x/千万元35679利润额y/百万元13345(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系;(2)求出利润额y关于销售额x的回归直线方程;(3)当销售额为4千万元时,利用(2)的结论估计该商场的利润额(百万元),b解析(1)散点图如图所示:两个变量正相关,且具有线性相关关系(2)易求6,3.2,由公式有0.65,且3.20.6560.7,则线性回归方程为0.65x0.7,(3)当x4时,由(1)可求得1.9
14、,即利润额约为1.9百万元考点三,独立性检验师生共研例3 (1)(2020新高考,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表:SO2PM2.50,50(50,150(150,4750,3532184(35,756812(75,1153710估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;根据所给数据,完成下面的22列联表:SO2PM2.50,150(150,4750,75(75,115根据中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与
15、SO2浓度有关附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828(2) (2021四川大学附中期中)2020年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为32)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)结合频率分布直方图,请完成以
16、下22列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;态度性别满意不满意合计男生女生10合计100K2,其中P(K2k0)0.100.050.0250.0100.005k02.7063.8415.0246.6357.879nabcd解析(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32186864,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为0.64根据抽查数据,可得22列联表:SO2PM2.50,150(150,4750,756416(75,1151010根据的列联表得K27.
17、484由于7.4846.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关(2)由已知得(0.015b0.03)100.85,解得b0.04,又(0.005a)1010.85,解得a0.01,评分的平均值为550.05650.1750.3850.4950.1580完成22列联表如下表:态度性别满意不满意合计男生253560女生301040合计5545100K210.7746.635,有99%的把握认为对“线上教学是否满意与性别有关”名师点拨解独立性检验的应用问题的关注点(1)两个明确:明确两类主体明确研究的两个问题(2)两个关键:准确列出22列联表:准确理解K2注意:查表
18、时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2相比较另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1p变式训练2(2021广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:使用寿命年数4年5年6年7年总计A型出租车(辆)10204525100B型出租车(辆1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?使用寿命不高于5年使用寿命不低于6年总
19、计A型B型总计(2)司机师傅小李准备在一辆开了3年的A型车和一辆开了3年的B型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明,他应如何选择参加公式:K2,其中nabcd参考数据:P(K2k0)0.050.0100.001k03.8416.63510.828解析(1)根据题目所给数据得到如下22的列联考:使用寿命不高于5年使用寿命不低于6年总计A型3070100B型5050100总计80120200由列联表可知:K28.336.635,所以有99%的把握认为出租车的使用寿命年数与汽车车型有关;(2)记事件A1,A2分别表示小李选择A型出租车和B型出租车时,3年内(含3年)换车
20、,由表知P(A1)0.75,P(A2)0.9,因为P(A1)P(A2),所以小李应选择A型出租车名师讲坛素养提升非线性回归问题例4(2020内蒙古乌兰察布等五市调研)一个调查学生记忆的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间t(分钟)和答对人数y的统计表格如下:时间t(分钟)102030405060708090100答对人数y987052363020151155lg y1.991.851.721.561.481.301.181.040.70.7时间t与答对人数y的散点图如图:附:38 500,i342,g yi13.5,iyi10 960,ilg
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人借款合同民间借贷
- 有关房屋出售委托合同年
- 湖北房屋租赁合同
- 租赁房屋合同协议书
- 消防工程专业分包工程合同
- 建筑施工发包合同
- 电器售后服务合同书
- 事业单位聘用合同文本
- 产品购销合同的细节条款修订书
- 重庆水利电力职业技术学院《建筑结构抗震设计实验》2023-2024学年第二学期期末试卷
- GN汽车吊吊装专项安全方案讲义
- 初中历史-《开元盛世 》教学课件设计
- 中小学心理健康教育指导纲要(教育部2012年修订)
- 教育:创造无限可能
- 风电场工程强制性条文执行计划
- 茶叶的起源与发展
- 二年级下册美术教案-第19课 剪窗花丨赣美版
- 人保理赔员试题车险查勘定损
- 罗姓姓氏源流和迁徙分布
- 发展经济学 马工程课件 1.第一章 发展中国家与发展经济学
- GB/T 25775-2010焊接材料供货技术条件产品类型、尺寸、公差和标志
评论
0/150
提交评论