




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【原卷版】8.1成对数据的相关分析选择性必修第二册第8章成对数据的统计分析初中学习的平面几何,研究的是平面上的一些简单图形及其几何性质;从本章开始,我们将把视野从二维的平面拓展到三维的空间;在三维空间中的图形统称为空间图形或立体图形;立体几何所研究的就是一些简单的空间图形及其几何性质;从平面几何到立体几何,我们要注意借鉴平面几何中已有的一些概念、方法和结论,更要特别注意立体几何和平面几何之间的区别;以本章学习的空间直线与平面为例,我们不仅要研究平面这类典型的空间图形,而且要对“直线”有更为深刻的认识;我们生活在一个三维世界中,立体几何的学习有助于我们从几何的角度更好地理解现实的世界,并且锻炼我们的几何直观想象能力;因此,在学习中,要着重注意几何的直观和内涵,不要仅仅停留在表面上的严格推导和论证,还要多画一些示意图来帮助理解,这样才能更好地掌握几何的实质,逐步培养自己的立体感和空间想象能力;在必修课程第13章“统计”中,我们主要研究了来自单一变量数据的一些统计特征,如集中趋势、离散程度、分布等.但现实世界中许多事物和现象之间都是有联系的;在本章中,我们将主要学习来自两个变量的成对数据的相关分析和回归分析,掌握它们之间的统计规律;本章将要学习的相关分析、回归分析及检验都属于推断性统计方法,它们在构建统计模型、预测结果和因果分析等方面有许多应用;在必修课程中学过的散点图是进行成对数据统计分析的基础,通过观察散点图可以大致了解数据的整体形态和偏离情况,发现两组数据之间的变化规律,构建适当的统计模型.统计图表不仅可以直观地表示数据及其规律,也是建立统计直觉的重要途径;【本章教材目录】第8章成对数据的统计分析8.1成对数据的相关分析8.1.1成对数据间的关系;8.1.2相关系数8.2一元线性回归分析8.2.1一元线性回归分析的基本思想;8.2.2一元线性回归分析的应用举例8.32x2列联表8.3.12x2列联表独立性检验;8.3.2独立性检验的具体应用【本章内容提要】相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的;1、为了得到两个变量之间是否具有一定关系的直观印象,可以用散点图来描述这些数据;2、相关系数可以度量两个随机变量之间的线性关系;相关系数的值满足,且越接近1,两个随机变量的线性关系越密切;3、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大;4、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计;5、2×2列联表描述两个分类变量所有值的组合数据是如何分布的.判断2×2列联表中出现的两个分类变量是否独立可采用检验;检验的一般步骤是:(1)提出原假设;(2)确定显著性水平;(3)计算统计量的值;(4)统计决断:当≥时,拒绝原假设,推断两个变量相关,否则,接受原假设,推断两个变量不相关(即两个变量是独立的);在实际情况下,是否完全拒绝原假设,还需要考虑样本量的大小;【要点方法解读】解读点001变量的相关关系1、相关分析把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析;2、变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;(2)相关关系的分类:正相关和负相关;①正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;②负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关;(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;例1、下列命题中,两个变量存在相关关系的序号为=1\*GB3①扇形的半径与面积之间的关系=2\*GB3②降雪量与交通事故的发生率之间的关系=3\*GB3③人的身高与体重之间的关系=4\*GB3④家庭的支出与收入之间的关系解读点002用散点图观察两个变量之间的相关性在必修课程第13章中,我们曾经用散点图观察两个变量之间的相关性;将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图;利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关;例2、某种树木体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能由散点图发现树木体积与树木的树龄近似呈什么关系吗?解读点003相关系数(1)设由变量x和y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和y之间线性相关程度的统计量,其计算公式为:;其中,;它们分别是这两组数据的算术平均数;线性相关系数常常简称相关系数;也称为皮尔逊系数;(2)样本相关系数r的取值范围为[-1,1].①若r>0时,成对样本数据正相关;②若r<0时,成对样本数据负相关;③当|r|越接近1时,成对样本数据的线性相关程度越强;④当|r|越接近0时,成对样本数据的线性相关程度越弱;题型一、相关系数的计算例3、某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:产量x(件)12345生产总成本y(万元)3781012试求y与x的样本相关系数r.(结果保留两位小数)参考公式:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2)\r(\i\su(i=1,n,)(yi-\x\to(y))2)).参考数据:eq\r(115)≈10.7.题型二、相关系数的性质例4、甲、乙、丙、丁四位同学各自对a,b两变量的线性相关性做试验,并分别求得样本相关系数r如下表:甲乙丙丁r-0.82-0.78-0.69-0.85则________同学的试验结果体现a,b两变量有更强的线性相关性.题型三、判断相关的强弱例5、近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:城市1城市2城市3城市4城市5A指标数x24568B指标数y34445经计算得eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=2eq\r(5),eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)=eq\r(2),试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.附:样本相关系数公式r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),参考数据:eq\r(0.3)≈0.55,eq\r(0.9)≈0.95.题型四、相关系数的实际应用例6、以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;(2)求样本相关系数r,并作出评价.(精确到0.01,已知eq\i\su(i=1,5,x)eq\o\al(2,i)=60975,eq\i\su(i=1,5,y)eq\o\al(2,i)=2756.8,eq\i\su(i=1,5,x)iyi=12952)题型五、【真题体验】例7、(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):x1234567y12151618212427参考数据:eq\o(x,\s\up6(-))=4,eq\o(y,\s\up6(-))=19,eq\o(∑,\s\up6(7),\s\do4(i=1))xeq\o\al(2,i)=140,eq\o(∑,\s\up6(7),\s\do4(i=1))yeq\o\al(2,i)=2695,eq\o(∑,\s\up6(7),\s\do4(i=1))xiyi=600,eq\r(6)≈2.45,相关系数r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).例8、(
2024年天津市蓟州区高三校考开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是(
)A.变量与正相关,变量与负相关,变量与的线性相关性较强B.变量与负相关,变量与正相关,变量与的线性相关性较强C.变量与正相关,变量与负相关,变量与的线性相关性较强D.变量与负相关,变量与正相关,变量与的线性相关性较强例9、(2022年高考全国乙卷数学(理))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.【针对性即时练】1、下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③圆的面积和半径是相关关系.其中正确的是(将所有正确的序号都填上);2、命题①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图可以大致判断两个相关变量是正相关还是负相关.其中正确的命题是3、5名学生的数学和物理成绩(单位:分)如下:ABCDE数学成绩8075706560物理成绩7066686462判断数学成绩与物理成绩是否具有线性相关关系;(填:“有”与“无”)4、两个变量的相关关系有①正相关、②负相关、③不相关,则下列散点图从左到右分别反映的变量间的相关关系的序号依次是5、如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________组数据后剩下的4组数据的线性相关系数最大.6、变量、的散点图如图所示,那么、之间的样本相关系数最接近的值为7、若已知eq\i\su(i=1,n,)(xi-eq\x\to(x))2是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的两倍,eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的1.2倍,则样本相关系数r的值为()A.eq\f(\r(2),1.2)B.eq\f(1.2,\r(2))C.0.92D.0.658、为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则()A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱9、从某地区12~30岁的居民中随机抽测了10个人的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新工科规划课题申报书
- 微生物检验技师证书考试经典试题及答案
- 2025年特许金融分析师考试详细介绍试题及答案
- 项目管理中的文化与价值观试题及答案
- 注册会计师财务报告解读试题及答案
- 2023年国家公务员考试银保监会财经岗考试真题及答案
- 福州第三中学2024-2025学年高考语文全真模拟密押卷含解析
- 成功秘诀2025年注册会计师考试试题及答案
- 注册会计师职业发展路径试题及答案
- 辽宁省沈阳市第一七O中学2024-2025学年高三一诊考试语文试卷含解析
- 网络存储技术应用项目化教程
- 2023年安全员-A证(江苏省)历年真题附答案(难、易错点剖析)
- 全国优质课说课比赛一等奖高中化学《苯酚》说课课件
- 幼儿园废旧材料的研究 论文
- 产能分析报告模板及指标明细
- 张力放线工器具配备表
- 食品小摊贩备案卡(样式)及说明
- 沥青混凝土面板单元工程质量评定表
- 针刀操作安全区带
- THBFIA 0004-2020 红枣制品标准
- GB/T 6072.1-2000往复式内燃机性能第1部分:标准基准状况,功率、燃料消耗和机油消耗的标定及试验方法
评论
0/150
提交评论