2024-2025学年新教材高中数学第七章统计案例2成对数据的线性相关性学案北师大版选择性必修第一册_第1页
2024-2025学年新教材高中数学第七章统计案例2成对数据的线性相关性学案北师大版选择性必修第一册_第2页
2024-2025学年新教材高中数学第七章统计案例2成对数据的线性相关性学案北师大版选择性必修第一册_第3页
2024-2025学年新教材高中数学第七章统计案例2成对数据的线性相关性学案北师大版选择性必修第一册_第4页
2024-2025学年新教材高中数学第七章统计案例2成对数据的线性相关性学案北师大版选择性必修第一册_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE§2成对数据的线性相关性必备学问·自主学习导思1.什么叫样本的线性相关系数?2.相关系数的大小与线性相关之间有怎样的联系?相关系数一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r=,称r为随机变量X和Y的样本(线性)相关系数.为了计算便利,我们再给出如下式子:r=.相关系数有哪些性质?提示:1.样本(线性)相关系数r的取值范围为[-1,1].2.|r|值越接近1,随机变量之间的线性相关程度越强;|r|值越接近0,随机变量之间的线性相关程度越弱.3.当r>0时,两个随机变量的值总体上改变趋势相同,此时两个随机变量正相关;当r<0时,两个随机变量的值总体上改变趋势相反,此时两个随机变量负相关;当r=0时,此时称两个随机变量线性不相关.1.辨析记忆(对的打“√”,错的打“×”)(1)求线性回来方程前可以不进行相关性检验.()(2)相关系数为0时,两个变量的相关性最强.()(3)相关系数的取值范围为[0,1].()提示:(1)×.因为假如两个变量之间不具有线性相关关系,就不用求线性回来方程了,求出的回来直线方程当然也不能很好地反映两变量之间的关系.(2)×.当相关系数r=0时,两个随机变量不线性相关.(3)×.相关系数r的取值范围为[-1,1].2.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则()A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱【解析】选D.因为线性相关系数的肯定值越大,则线性相关性越强,所以丙组数据的线性相关性最强,乙组数据的线性相关性最弱.3.已知数据点(xi,yi)(i=1,2,3,…,n)在一条直线上,则相关系数r=________.【解析】由题意知,相关系数r=±1.答案:±1

关键实力·合作学习类型一相关关系的推断(逻辑推理)1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若全部样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.eq\f(1,2)D.12.(2024·西安高二检测)变量y与x的回来模型中,它们对应的相关系数r的值如下,其中拟合效果最好的模型是()模型1234r0.480.150.960.30A.模型1 B.模型2C.模型3 D.模型43.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1【解析】1.选D.全部点均在直线y=eq\f(1,2)x+1上且斜率大于0,则样本相关系数为1.2.选C.线性回来分析中,相关系数为r,eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越接近于1,相关程度越大;eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越小,相关程度越小,因为模型3的|r|最大,所以模拟效果最好.3.选C.对于变量Y与X而言,Y随X的增大而增大,故Y与X呈正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U呈负相关,即r2<0.判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:当r>0时,正相关;当r<0时,负相关.(3)线性回来方程中:当>0时,正相关;当<0时,负相关.类型二相关系数的综合应用(数学运算)【典例】(2024·南昌高二检测)随着网络的发展,网上购物越来越受到人们的宠爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,如表是某购物网站2024年1-8月促销费用(万元)和产品销量(万件)的详细数据:月份12345678促销费用x2361013211518产品销量y11233.5544.5(1)依据数据绘制的散点图能够看出可用线性回来模型y与x的关系,请用相关系数r加以说明(系数精确到0.001);(2)建立y关于x的线性回来方程=x+(系数精确到0.001);假如该公司安排在9月份实现产品销量超6万件,预料至少须要投入促销费用多少万元(结果精确到0.01).参考数据:QUOTE=74.5,QUOTE=340,QUOTE=16.5,QUOTE≈18.44,QUOTE≈4.06,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.参考公式:①样本QUOTE(i=1,2,…,n)相关系数r=QUOTE;②对于一组数据QUOTE,QUOTE,…,QUOTE,其回来方程=x+的斜率和截距的最小二乘估计分别为=QUOTE,=QUOTE-QUOTE.【思路导引】(1)依据数据绘制散点图,从散点图看出这些点是否大致分布在一条直线旁边即可;计算eq\x\to(x),eq\x\to(y),求出相关系数,推断两变量线性相关性的强弱;(2)计算求出回来方程,利用方程求出对应x的取值范围即可.【解析】(1)依据数据绘制散点图如图,从散点图可以看出这些点大致分布在一条直线旁边,并且在逐步上升,所以可用线性回来模型拟合y与x的关系;计算eq\x\to(x)=eq\f(1,8)×(2+3+6+10+13+21+15+18)=11,eq\x\to(y)=eq\f(1,8)×(1+1+2+3+3.5+5+4+4.5)=3,所以相关系数r==eq\f(74.5,\r(340)×\r(16.5))=eq\f(74.5,18.44×4.06)≈0.995,因为相关系数的值接近于1,所以变量y与x的线性相关性很强;(2)计算==eq\f(74.5,340)≈0.219,=eq\x\to(y)-eq\x\to(x)=3-0.219×11=0.591,所以y关于x的回来方程为=0.219x+0.591.令=0.219x+0.591≥6,解得x≥24.70,即实现产品销量超6万件,预料至少须要投入促销费用24.70万元.线性回来分析的关注点(1)回来直线=x+必过样本点的中心(eq\x\to(x),eq\x\to(y)).(2)正确运用计算,的公式和精确地计算,是求线性回来方程的关键.(3)分析两变量的相关关系,可由散点图或相关系数公式作出推断,若具有线性相关关系,则可通过线性回来方程估计和预料变量的值.(2024·成都高二检测)某中学高三学生摸底考试后,从全体考生中随机抽取44名,获得他们本次考试的数学成果(x)和物理成果(y),绘制成如图散点图:依据散点图可以看出y与x之间有线性相关关系,但图中有两个异样点A,B.经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参与物理考试.为了使分析结果更科学精确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:QUOTExi=4620,QUOTEyi=3108,QUOTExiyi=350350,QUOTE=16940,QUOTE=5250,其中xi,yi分别表示这42名同学的数学成果、物理成果,i=1,2,3,…,42,y与x的相关系数r=0.82.(1)若不剔除A,B两名考生的数据,用44组数据作回来分析,设此时y与x的相关系数为r0.试推断r0与r的大小关系(不必说理由);(2)求y关于x的线性回来方程,并估计假如B考生参与了这次物理考试(已知B考生的数学成果为125分),物理成果是多少?附:回来方程=+x中=QUOTE=QUOTE,=eq\x\to(y)-eq\x\to(x).【解析】(1)由题意y与x成正相关关系,异样点A,B会降低变量之间的线性相关程度,所以r0<r;(2)由题中数据可得QUOTE=QUOTExi=110,QUOTE=QUOTEyi=74,所以QUOTE=QUOTExiyi-42eq\x\to(x)·eq\x\to(y)=350350-42×110×74=8470.又因为=16940,所以==eq\f(8470,16940)=0.5,=eq\x\to(y)-eq\x\to(x)=74-0.5×110=19,所以=0.5x+19,将x=125代入,得y=81.5,所以估计B同学的物理成果为81.5分.课堂检测·素养达标1.在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则全部的样本点(xi,yi)(i=1,2,…,n)满意的方程可以是()A.y=-eq\f(1,2)x+1 B.y=x-1C.y=x+1 D.y=-x2【解析】选A.若这组样本数据的相关系数为-1,则样本数据为线性相关,解除D,又相关系数为-1,所以样本数据为负相关,解除B,C(B,C为正相关).2.对于相关系数r,下列描述正确的是()A.r>0表明两个变量线性相关性很强B.r<0表明两个变量无关C.eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越接近1,表明两个变量线性相关性越强D.r越小,表明两个变量线性相关性越弱【解析】选C.相关系数r为正,两个变量呈正相关,r为负,两个变量呈负相关;eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越接近1,表明两个变量线性相关性越强;eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越接近0,表明两个变量线性相关性越弱,所以只有C正确.3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为()A.1B.-0.5C.0D.0.5【解析】选C.依据变量x,y的散点图,得x,y之间的样本相关关系特别不明显,所以相关系数r最接近的值应为0.4.第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其次组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9),第一组变量的线性相关系数为r1,其次组变量的线性相关系数为r2,则()A.r1>0>r2 B.r2>0>r1C.r1<r2<0 D.r2>r1>0【解析】选A.依据题意,第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论