北师大版选择性必修第一册7.2.1-7.2.2相关系数成对数据的线性相关性分析学案_第1页
北师大版选择性必修第一册7.2.1-7.2.2相关系数成对数据的线性相关性分析学案_第2页
北师大版选择性必修第一册7.2.1-7.2.2相关系数成对数据的线性相关性分析学案_第3页
北师大版选择性必修第一册7.2.1-7.2.2相关系数成对数据的线性相关性分析学案_第4页
北师大版选择性必修第一册7.2.1-7.2.2相关系数成对数据的线性相关性分析学案_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§2成对数据的线性相关性2.1相关系数2.2成对数据的线性相关性分析学习目标1.能结合向量共线与夹角来理解相关系数公式,进一步了解样本相关系数的统计含义,培养直观想象和数学建模能力.2.会计算样本相关系数,并能根据相关系数的大小判断变量之间相关程度的强弱,提升数据分析和数学运算素养.问题1:如图是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?提示:图(1)中两个变量线性相关性很弱,求出的线性回归方程不能用作预测和估计;图(2)中两个变量线性相关性很强,求出的线性回归方程能用作预测和估计.1.相关系数一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r=(x称r为随机变量X和Y的样本(线性)相关系数.r还可以表示为r=(xr=∑i=1n问题2:两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是哪一个?模型模型1模型2模型3模型4相关系数r0.150.480.960.50提示:模型3.2.相关系数r的性质(1)r的取值范围为[-1,1];(2)|r|值越接近1,随机变量之间的线性相关程度越强;|r|值越接近0,随机变量之间的线性相关程度越弱;(3)当r>0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量正相关;(4)当r<0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量负相关;(5)当r=0时,此时称两个随机变量线性不相关.相关系数[例1](1)某相关变量X,Y的散点图如图所示,现对这两个变量进行回归分析,方案一,根据图中所有数据分析,可得到线性回归方程Y=1X+1,样本相关系数为r1;方案二,剔除点(10,32),根据剩下数据分析,可得到线性回归方程Y=2X+2,样本相关系数为r2.则()

A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0D.-D.-1<r2<r1<0(2)(2021·山东威海第一中学月考)对变量X,Y有观测数据(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)对变量U,V有观测数据(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),r1表示变量X,Y之间的线性相关系数,r2表示变量U,V之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r1<0<r2 D.r2=r1解析:(1)由题中散点图可知,变量X和Y成正相关,故0<r1<1,0<r2<1,在剔除点(10,32)之后,可看出X与Y之间的线性相关程度更强,故r1<r2.所以0<r1<r2<1.故选A.(2)由条件可知,第一组中的数据负相关,相关系数小于零;第二组中的数据正相关,相关系数大于零,所以有r1<0<r2.故选C.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多.[针对训练](多选题)(2021·湖北十堰高二期末)相关变量X,Y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到线性回归方程Y=1X+1,相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到线性回归方程Y=2X+2,相关系数为r2.则()A.r1=r2 B.r1<r2C.r1>r2 D.r1,r2∈(-1,0)解析:由散点图可知这两个变量为负相关,所以r1,r2<0.因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r2|更接近1,所以-1<r2<r1<0.故选CD.成对数据的相关性[例2](2021·山东菏泽期中)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近),采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价X(单位:元/月)和购买人数Y(单位:万人)的关系如表:X3035404550Y18141085(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合Y与X的关系?并指出Y与X是正相关还是负相关.(2)①求出Y关于X的回归方程;②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回归方程预测该市一个月内购买该流量包的人数能否超过20万.附:25000≈158,26000≈161,=∑i=1n(xi-x)(解:(1)根据题意,得x=15×(30+35+40+45+50)=40,y=15可列表:i12345xi-x-10-50510yi-y73-1-3-6(xi-x)(yi-y)-70-150-15-60则∑i=15(xi-x)(yi∑i=15因此相关系数r=∑i=15(2)①由(1)得Y与X线性相关,设回归直线方程为Y=X+,则=∑i=15(xi-x)(y②由①知,若X=25,则Y=-0.64×25+36.6=20.6,故若将流量包的价格定为25元/月,则预测该市一个月内购买该流量包的人数能超过20万.(1)散点图可以直观地判断两变量是否具有线性关系.(2)相关系数的计算运算量较大,注意运算的准确性.[针对训练](2021·陕西二模)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:X(年龄/岁)26273941495356586061Y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据表中数据得到如图所示的散点图.(1)根据表中的样本数据及其散点图,计算样本相关系数(精确到0.01),并刻画它们的相关程度;(2)若Y关于X的线性回归方程为Y=1.56+X,求的值(精确到0.01),并根据回归方程估计年龄为50岁时人体的脂肪含量.附:y=27,∑i=110xiyi=13527.8,∑i=110x相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n解:(1)根据题表中的样本数据及其散点图知,x=26+27+39+41+49+53+56+58+60+6110相关系数r=∑=13=13=837.所以r=837.由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.(2)因为回归方程为Y=1.56+X,即=1.56,所以=y-∧ax所以Y关于X的线性回归方程为Y=0.54X+1.56,将X=50代入线性回归方程得Y=0.54×50+1.56=28.56.所以根据回归方程估计年龄为50岁时人的脂肪含量为28.56%.1.(2021·天津高二期末)对变量X,Y由观测数据得散点图1,对变量U,V由观测数据得散点图2,由这两个散点图可以推断(D)A.X与Y正相关,U与V正相关B.X与Y正相关,U与V负相关C.X与Y负相关,U与V负相关D.X与Y负相关,U与V正相关解析:题图1中的点分布在从左上角到右下角的带状区域内,所以X与Y负相关;题图2中的点分布在从左下角到右上角的带状区域内,所以U与V正相关.故选D.2.(2022·山东聊城一中期中)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(A)A.r1<r4<0<r3<r2 B.r4<r1<0<r3<r2C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3解析:由题图可知,题图2和题图3是正相关,题图1和题图4是负相关,题图1和题图2的点相对更加集中,所以相关性更强,所以r1接近于-1,r2接近于1,所以r1<r4<0<r3<r2.故选A.3.(2021·广西玉林育才中学月考)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=-0.957,则(C)A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性解析:因为线性相关系数r1=0.837,r2=-0.957,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,X与Y之间的相关性弱于U与V之间的相关性.故选C.[例1](2021·浙江丽水期末)甲、乙、丙、丁四名同学各自对A,B两变量的线性相关性做试验,并用回归分析的方法分别求得相关系数r如表:甲乙丙丁r-0.82-0.78-0.69-0.85则哪名同学的试验结果体现A,B两变量有更强的线性相关性()A.甲 B.乙 C.丙 D.丁解析:因为0.85>0.82>0.78>0.69,且相关系数的绝对值越接近于1,则两个变量的线性相关性越强,所以能体现出A,B两变量有更强的线性相关性的是丁.故选D.[例2](2021·江西吉安期末)某商场五天内T恤衫的销售情况如表:第X天12345销售量Y/件19395979104则下列说法正确的是()A.Y与X负相关 B.Y与X正相关C.Y与X不相关 D.Y与X成正比例关系解析:根据表格中的数据作出散点图,可知所有点都在一条直线附近波动,是线性相关的,且Y值随着X值的增大而增大,即Y与X正相关.故选B.[例3](多选题)以下是某小区5套房成交价格Y(单位:万元)与住房面积X(单位:m2)之间的统计数据.(成交价格受面积、楼层、位置等因素影响)面积X/m28095105110125价格Y/万元120142161171186若Y与X之间具有线性相关关系,根据表中数据可求得Y关于X的回归方程为Y=1.52X+,则下列说法正确的是()A.=55.66B.变量X与Y具有负相关关系C.当住房面积增加1m2时,其价格增加约1.52万元D.根据回归方程估计,若住房面积为150m2,则成交价格约为227.44万元解析:根据表中数据可求得x=80+95+105+110+1255y=120+142+161+171+1865将点(103,156)代入回归方程解得=-0.56,故A错误;由回归方程为Y=1.52X+,可知变量X与Y具有正相关关系,故B错误;因为Y=1.52X+,故X增加1时,Y大约增加1.52,故C正确;将X=150代入方程求得Y=1.52×150-0.56=227.44,故D正确.故选CD.[例4]随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.如表是某购物网站2020年1—8月促销费用(单位:万元)和产品销量(单位:万件)的具体数据:月份12345678促销费用X/万元2361013211518产品销量Y/万件11233.5544.5(1)根据数据散点图能够看出可用线性回归模型拟合Y与X的关系,请用相关系数r加以说明(系数精确到0.001);(2)建立Y关于X的线性回归方程Y=X+(系数精确到0.001);如果该公司在9月份实现产品销量超6万件,预测至少需要投入促销费用多少万元(结果精确到0.01).参考数据:∑i=18(xi-11)(yi-3)=74.5,∑i=18(xi-11)2=340,∑i=18(yi-3)2=16.5,参考公式:①样本(xi,yi)(i=1,2,…,n)的相关系数r=∑i②对于一组数据(x1,y1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论