




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【解析版】8.1成对数据的相关分析选择性必修第二册第8章成对数据的统计分析初中学习的平面几何,研究的是平面上的一些简单图形及其几何性质;从本章开始,我们将把视野从二维的平面拓展到三维的空间;在三维空间中的图形统称为空间图形或立体图形;立体几何所研究的就是一些简单的空间图形及其几何性质;从平面几何到立体几何,我们要注意借鉴平面几何中已有的一些概念、方法和结论,更要特别注意立体几何和平面几何之间的区别;以本章学习的空间直线与平面为例,我们不仅要研究平面这类典型的空间图形,而且要对“直线”有更为深刻的认识;我们生活在一个三维世界中,立体几何的学习有助于我们从几何的角度更好地理解现实的世界,并且锻炼我们的几何直观想象能力;因此,在学习中,要着重注意几何的直观和内涵,不要仅仅停留在表面上的严格推导和论证,还要多画一些示意图来帮助理解,这样才能更好地掌握几何的实质,逐步培养自己的立体感和空间想象能力;在必修课程第13章“统计”中,我们主要研究了来自单一变量数据的一些统计特征,如集中趋势、离散程度、分布等.但现实世界中许多事物和现象之间都是有联系的;在本章中,我们将主要学习来自两个变量的成对数据的相关分析和回归分析,掌握它们之间的统计规律;本章将要学习的相关分析、回归分析及检验都属于推断性统计方法,它们在构建统计模型、预测结果和因果分析等方面有许多应用;在必修课程中学过的散点图是进行成对数据统计分析的基础,通过观察散点图可以大致了解数据的整体形态和偏离情况,发现两组数据之间的变化规律,构建适当的统计模型.统计图表不仅可以直观地表示数据及其规律,也是建立统计直觉的重要途径;【本章教材目录】第8章成对数据的统计分析8.1成对数据的相关分析8.1.1成对数据间的关系;8.1.2相关系数8.2一元线性回归分析8.2.1一元线性回归分析的基本思想;8.2.2一元线性回归分析的应用举例8.32x2列联表8.3.12x2列联表独立性检验;8.3.2独立性检验的具体应用【本章内容提要】相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的;1、为了得到两个变量之间是否具有一定关系的直观印象,可以用散点图来描述这些数据;2、相关系数可以度量两个随机变量之间的线性关系;相关系数的值满足,且越接近1,两个随机变量的线性关系越密切;3、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大;4、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计;5、2×2列联表描述两个分类变量所有值的组合数据是如何分布的.判断2×2列联表中出现的两个分类变量是否独立可采用检验;检验的一般步骤是:(1)提出原假设;(2)确定显著性水平;(3)计算统计量的值;(4)统计决断:当≥时,拒绝原假设,推断两个变量相关,否则,接受原假设,推断两个变量不相关(即两个变量是独立的);在实际情况下,是否完全拒绝原假设,还需要考虑样本量的大小;【要点方法解读】解读点001变量的相关关系1、相关分析把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析;2、变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;(2)相关关系的分类:正相关和负相关;①正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;②负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关;(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;例1、下列命题中,两个变量存在相关关系的序号为=1\*GB3①扇形的半径与面积之间的关系=2\*GB3②降雪量与交通事故的发生率之间的关系=3\*GB3③人的身高与体重之间的关系=4\*GB3④家庭的支出与收入之间的关系【提示】理解相关关系与函数关系的区别;【答案】=2\*GB3②=3\*GB3③=4\*GB3④【解析】扇形的半径与面积之间的关系是函数关系,其余均为相关关系;【说明】函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系;函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随变化而已;解读点002用散点图观察两个变量之间的相关性在必修课程第13章中,我们曾经用散点图观察两个变量之间的相关性;将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图;利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关;例2、某种树木体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能由散点图发现树木体积与树木的树龄近似呈什么关系吗?【提示】主要规范描点与分析;【解析】(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示.(2)由散点图发现树木体积随着树龄的增加呈现增加的趋势,且散点大致落在一条直线附近,所以树木的体积与树龄近似呈线性相关关系;【说明】判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响;解读点003相关系数(1)设由变量x和y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和y之间线性相关程度的统计量,其计算公式为:;其中,;它们分别是这两组数据的算术平均数;线性相关系数常常简称相关系数;也称为皮尔逊系数;(2)样本相关系数r的取值范围为[-1,1].①若r>0时,成对样本数据正相关;②若r<0时,成对样本数据负相关;③当|r|越接近1时,成对样本数据的线性相关程度越强;④当|r|越接近0时,成对样本数据的线性相关程度越弱;题型一、相关系数的计算例3、某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:产量x(件)12345生产总成本y(万元)3781012试求y与x的样本相关系数r.(结果保留两位小数)参考公式:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2)\r(\i\su(i=1,n,)(yi-\x\to(y))2)).参考数据:eq\r(115)≈10.7.【提示】注意正确使用公式与正确计算公式中的相关数据;【解析】eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(3+7+8+10+12,5)=8,eq\r(\o(∑,\s\up8(5),\s\do10(i=1))(xi-\x\to(x))2)=eq\r(10),eq\r(\o(∑,\s\up8(5),\s\do10(i=1))(yi-\x\to(y))2)=eq\r(46),eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=21.故样本相关系数r=eq\f(21,\r(10)×\r(46))≈0.98;【说明】利用样本相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,有时需要借助计算器.题型二、相关系数的性质例4、甲、乙、丙、丁四位同学各自对a,b两变量的线性相关性做试验,并分别求得样本相关系数r如下表:甲乙丙丁r-0.82-0.78-0.69-0.85则________同学的试验结果体现a,b两变量有更强的线性相关性.【提示】注意理解相关系数及其性质;【答案】丁;【解析】因为0.85>0.82>0.78>0.69,已知相关系数的绝对值越接近1,则两个变量的线性相关性越强,所以能体现出a,b两变量有更强的线性相关性的是丁同学的试验结果;【说明】样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强;题型三、判断相关的强弱例5、近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:城市1城市2城市3城市4城市5A指标数x24568B指标数y34445经计算得eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=2eq\r(5),eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)=eq\r(2),试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.附:样本相关系数公式r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),参考数据:eq\r(0.3)≈0.55,eq\r(0.9)≈0.95.【解析】eq\o(x,\s\up6(-))=eq\f(2+4+5+6+8,5)=5,eq\o(y,\s\up6(-))=eq\f(3+4+4+4+5,5)=4,eq\o(∑,\s\up6(5),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=6,故r=eq\f(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(6,2\r(5)×\r(2))=eq\r(\f(9,10))≈0.95.因为r≈0.95,所以可以推断y与x线性正相关,且具有较强的线性相关关系;【说明】线性相关强弱的判断方法;1、散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强;2、样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强;题型四、相关系数的实际应用例6、以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;(2)求样本相关系数r,并作出评价.(精确到0.01,已知eq\i\su(i=1,5,x)eq\o\al(2,i)=60975,eq\i\su(i=1,5,y)eq\o\al(2,i)=2756.8,eq\i\su(i=1,5,x)iyi=12952)【解析】(1)画出散点图如图所示.(2)eq\x\to(x)=eq\f(545,5)=109,eq\x\to(y)=eq\f(116,5)=23.2,r=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\r(\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)\r(\i\su(i=1,5,y)\o\al(2,i)-5\x\to(y)2))=eq\f(12952-5×109×23.2,\r(60975-5×1092)×\r(2756.8-5×23.22))=eq\f(308,\r(1570)×\r(65.6))≈0.96,由此可知,新房屋的销售价格和房屋的大小这两个变量正线性相关,且相关程度很强;【说明】求成对样本数据的样本相关系数时,可列表计算出样本相关系数所需数据,代入公式即可求出样本相关系数r,对于样本相关系数r,要理解其范围和意义,当r为正数时,表示成对数据正相关,当r为负数时,表示成对数据负相关;另外注意|r|的大小,|r|越大,线性相关程度越高.题型五、【真题体验】例7、(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):x1234567y12151618212427参考数据:eq\o(x,\s\up6(-))=4,eq\o(y,\s\up6(-))=19,eq\o(∑,\s\up6(7),\s\do4(i=1))xeq\o\al(2,i)=140,eq\o(∑,\s\up6(7),\s\do4(i=1))yeq\o\al(2,i)=2695,eq\o(∑,\s\up6(7),\s\do4(i=1))xiyi=600,eq\r(6)≈2.45,相关系数r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).【答案】正0.99【解析】由表中数据知,y随x的增大而增大,所以该老师每天一次最多答对题数y与天数x之间是正相关;计算相关系数为r=eq\f(\o(∑,\s\up6(7),\s\do4(i=1))xiyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(7),\s\do4(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(7),\s\do4(i=1))yeq\o\al(2,i)-7\o(y,\s\up6(-))2))=eq\f(600-7×4×19,\r(140-7×42)×\r(2695-7×192))=eq\f(68,2\r(7)×2\r(42))≈eq\f(17,7×2.45)≈0.99.例8、(
2024年天津市蓟州区高三校考开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是(
)A.变量与正相关,变量与负相关,变量与的线性相关性较强B.变量与负相关,变量与正相关,变量与的线性相关性较强C.变量与正相关,变量与负相关,变量与的线性相关性较强D.变量与负相关,变量与正相关,变量与的线性相关性较强【提示】根据相关系数的概念与性质分析判断;【答案】C【解析】因为线性相关系数,所以,正相关,因为线性相关系数,所以,负相关,又因为,所以变量,的线性相关性比,的线性相关性强,故A、B、D错误,C正确.故选:C.例9、(2022年高考全国乙卷数学(理))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.【提示】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值;【答案】(1);;(2);(3)【解析】(1)样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为(2)则(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得.则该林区这种树木的总材积量估计为【针对性即时练】1、下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③圆的面积和半径是相关关系.其中正确的是(将所有正确的序号都填上);【答案】①②;【解析】根据函数关系及相关关系的定义,①函数关系是一种确定性关系;②相关关系是一种非确定性关系,是正确的;③圆的面积和半径是函数关系,故错误;2、命题①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图可以大致判断两个相关变量是正相关还是负相关.其中正确的命题是【答案】③④;【解析】客观现象之间存在的相互依存关系叫相关关系,是一种不确定的关系,函数关系是一种确定的关系.①任何两个变量不一定都具有相关关系,故①错误;②圆的周长与该圆的半径是函数关系,而不是具有相关关系,故②错误;③某商品的需求量与该商品的价格是一种非确定性关系,故③正确;④根据散点图可以大致判断两个相关变量是正相关还是负相关.上升趋势就是正相关,下降趋势就是负相关.故④正确.3、5名学生的数学和物理成绩(单位:分)如下:ABCDE数学成绩8075706560物理成绩7066686462判断数学成绩与物理成绩是否具有线性相关关系;(填:“有”与“无”)【提示】根据散点图判断;【答案】有;【解析】以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系;【说明】本题考查利用散点图判断两个变量是否线性相关,同时考查了数据分析与数学抽象的核心素养;4、两个变量的相关关系有①正相关、②负相关、③不相关,则下列散点图从左到右分别反映的变量间的相关关系的序号依次是【答案】①③②;【解析】对于(1),图中的点成带状分布,且从左到右上升,是正相关关系;对于(2),图中的点没有明显的带状分布,是不相关的;对于(3),图中的点成带状分布,且从左到右是下降的,是负相关关系.5、如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________组数据后剩下的4组数据的线性相关系数最大.【答案】C【解析】仔细观察点A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),可知点A,B,D,E在一条直线附近,而C点明显偏离此直线上,由此可知去掉点C后,使剩下的四点组成的数组相关关系数最大.6、变量、的散点图如图所示,那么、之间的样本相关系数最接近的值为【答案】0;【解析】根据变量、的散点图,得、之间的样本相关关系非常不明显,所以,相关系数最接近的值应为0.7、若已知eq\i\su(i=1,n,)(xi-eq\x\to(x))2是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的两倍,eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的1.2倍,则样本相关系数r的值为()A.eq\f(\r(2),1.2)B.eq\f(1.2,\r(2))C.0.92D.0.65【答案】B【解析】r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)·\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(1.2\i\su(i=1,n,)yi-\x\to(y)2,\r(2)·\i\su(i=1,n,)yi-\x\to(y)2)=eq\f(1.2,\r(2)),故选B.8、为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则()A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱【答案】D;【解析】因为样本相关系数的绝对值越大则线性相关性越强,所以丙组数据的线性相关性最强,乙组数据的线性相关性最弱.故选D;9、从某地区12~30岁的居民中随机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目共建合同协议
- 严琦的离婚赔偿合同
- 智能办公设备采购合同书
- 建筑设计委托合同范本
- 建筑设计服务合同条款
- 【安永】2025灵活应对变局重新平衡风险管理优先事项研究报告
- Brand KPIs for pet supply online shop Time for Paws in the United Kingdom-外文版培训课件(2025.2)
- 幼儿表演性舞蹈《边走边唱》
- 人教版数学一年级下册-05认识人民币-01简单的计算-教学反思03(4篇)教案
- 2025年深圳地铁某区间土建工程劳务分包总价承包合同
- 无机保温砂浆外墙外保温系统施工工艺课件
- 产品追溯记录表
- 高三二轮复习:产业转移以富士康的企业转移为例课件
- 政府信息资源管理
- 中小微企业划型证明
- 西南交大区段站工作组织课程设计2018
- 《监察机关监督执法工作规定》测试题试题含答案
- Q∕GDW 12154-2021 电力安全工器具试验检测中心建设规范
- 初中文言文专项训练十篇(含答案)
- 煤矿顶板事故防治(1)
- 漏电保护器试跳记录表
评论
0/150
提交评论