版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§2成对数据的线性相关性2.1相关系数2.2成对数据的线性相关性分析学习目标1.能结合向量共线与夹角来理解相关系数公式,进一步了解样本相关系数的统计含义,培养直观想象和数学建模能力.2.会计算样本相关系数,并能根据相关系数的大小判断变量之间相关程度的强弱,提升数据分析和数学运算素养.知识梳理·自主探究师生互动·合作探究知识梳理·自主探究知识探究问题1:如图是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?提示:图(1)中两个变量线性相关性很弱,求出的线性回归方程不能用作预测和估计;图(2)中两个变量线性相关性很强,求出的线性回归方程能用作预测和估计.问题2:两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是哪一个?模型模型1模型2模型3模型4相关系数r0.150.480.960.50提示:模型3.2.相关系数r的性质(1)r的取值范围为
;(2)|r|值越接近1,随机变量之间的线性相关程度
;|r|值越接近0,随机变量之间的线性相关程度
;(3)当r>0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量
;(4)当r<0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量
;(5)当r=0时,此时称两个随机变量
.[-1,1]越强越弱正相关负相关线性不相关师生互动·合作探究探究点一相关系数解析:(1)由题中散点图可知,变量X和Y成正相关,故0<r1<1,0<r2<1,在剔除点(10,32)之后,可看出X与Y之间的线性相关程度更强,故r1<r2.所以0<r1<r2<1.故选A.解:(2)由条件可知,第一组中的数据负相关,相关系数小于零;第二组中的数据正相关,相关系数大于零,所以有r1<0<r2.故选C.方法总结线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多.解:由散点图可知这两个变量为负相关,所以r1,r2<0.因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r2|更接近1,所以-1<r2<r1<0.故选CD.探究点二[例2](2021·山东菏泽期中)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近),采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价X(单位:元/月)和购买人数Y(单位:万人)的关系如表:成对数据的相关性X3035404550Y18141085(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合Y与X的关系?并指出Y与X是正相关还是负相关.[例2](2021·山东菏泽期中)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近),采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价X(单位:元/月)和购买人数Y(单位:万人)的关系如表:X3035404550Y18141085(2)①求出Y关于X的回归方程;[例2](2021·山东菏泽期中)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近),采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价X(单位:元/月)和购买人数Y(单位:万人)的关系如表:X3035404550Y18141085解:②由①知,若X=25,则Y=-0.64×25+36.6=20.6,故若将流量包的价格定为25元/月,则预测该市一个月内购买该流量包的人数能超过20万.方法总结(1)散点图可以直观地判断两变量是否具有线性关系.(2)相关系数的计算运算量较大,注意运算的准确性.[针对训练](2021·陕西二模)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:X(年龄/岁)26273941495356586061Y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据表中数据得到如图所示的散点图.(1)根据表中的样本数据及其散点图,计算样本相关系数(精确到0.01),并刻画它们的相关程度;[针对训练](2021·陕西二模)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:X(年龄/岁)26273941495356586061Y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据表中数据得到如图所示的散点图.当堂检测1.(2021·天津高二期末)对变量X,Y由观测数据得散点图1,对变量U,V由观测数据得散点图2,由这两个散点图可以推断(
)A.X与Y正相关,U与V正相关B.X与Y正相关,U与V负相关C.X与Y负相关,U与V负相关D.X与Y负相关,U与V正相关D解析:题图1中的点分布在从左上角到右下角的带状区域内,所以X与Y负相关;题图2中的点分布在从左下角到右上角的带状区域内,所以U与V正相关.故选D.解析:由题图可知,题图2和题图3是正相关,题图1和题图4是负相关,题图1和题图2的点相对更加集中,所以相关性更强,所以r1接近于-1,r2接近于1,所以r1<r4<0<r3<r2.故选A.A解析:因为线性相关系数r1=0.837,r2=-0.957,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,X与Y之间的相关性弱于U与V之间的相关性.故选C.C备用例题[例1](2021·浙江丽水期末)甲、乙、丙、丁四名同学各自对A,B两变量的线性相关性做试验,并用回归分析的方法分别求得相关系数r如表:甲乙丙丁r-0.82-0.78-0.69-0.85则哪名同学的试验结果体现A,B两变量有更强的线性相关性(
)A.甲 B.乙 C.丙 D.丁解析:因为0.85>0.82>0.78>0.69,且相关系数的绝对值越接近于1,则两个变量的线性相关性越强,所以能体现出A,B两变量有更强的线性相关性的是丁.故选D.[例2](2021·江西吉安期末)某商场五天内T恤衫的销售情况如表:第X天12345销售量Y/件19395979104则下列说法正确的是(
)A.Y与X负相关 B.Y与X正相关C.Y与X不相关 D.Y与X成正比例关系解析:根据表格中的数据作出散点图,可知所有点都在一条直线附近波动,是线性相关的,且Y值随着X值的增大而增大,即Y与X正相关.故选B.[例4]随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.如表是某购物网站2020年1—8月促销费用(单位:万元)和产品销量(单位:万件)的具体数据:月份12345678促销费用X/万元2361013211518产品销量Y/万件11233.5544.5(1)根据数据散点图能够看出可用线性回归模型拟合Y与X的关系,请用相关系数r加以说明(系数精确到0.001);[例4]随
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度房产交易合同templateincluding交易方式与支付方式
- 2024年度淘宝店铺代管理服务合同
- 运动激活照相机市场环境与对策分析
- 2024年度版权转让合同:音乐作品版权出售与授权协议
- 运载工具座椅用安全带市场发展现状调查及供需格局分析预测报告
- 石蜡纸市场需求与消费特点分析
- 贴纸文具市场发展预测和趋势分析
- 2024年度农产品采购合同模板及质量要求
- 计算机游戏卡市场发展预测和趋势分析
- 2024年度教育培训合作与发展合同
- 某医院拆除施工方案
- 银行培训手册:流动性覆盖率(LCR)
- 小学三年级上册道德与法治课件-9.心中的110-部编版(12张)ppt课件
- 《蓝色的雅德朗》教案
- 《加盟申请表》word版
- profibus现场总线故障诊断与排除
- 当前住房公积金管理中存在的问题和解决建议
- 高考数学立体几何中的翻折、轨迹及最值(范围)问题
- 光伏土建工程监理实施细则
- 药品GMP自检检查表
- 从教学原点解读有效教学和教学深化改革
评论
0/150
提交评论