版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第46讲
数据分析——一元线性回归模型及其应用第九章
统计1.5位学生的数学成绩和物理成绩如下表:激活思维
ABCDE数学8075706560物理7066686462则数学成绩与物理成绩之间 (
)A.是函数关系
B.是相关关系,但相关性很弱C.具有较好的相关关系,且是正相关
D.具有较好的相关关系,且是负相关C2.已知两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系依次是 (
)A.①②③
B.②③①C.②①③
D.①③②D【解析】第一个散点图中的点是从左下角区域分布到右上角区域,是正相关;第三个散点图中的点是从左上角区域分布到右下角区域,是负相关;第二个散点图中的点的分布没有什么规律,是不相关.A.满足一元线性回归模型的所有假设B.不满足一元线性回归模型的E(e)=0的假设C.不满足一元线性回归模型的D(e)=σ2的假设D.不满足一元线性回归模型的E(e)=0和D(e)=σ2的假设【解析】【答案】C【解析】168cm5.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t)的几组对应数据:【解析】x3456y2.5t44.531.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在____________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.一条直线聚焦知识2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:(2)相关系数r的性质当r______0时,称成对样本数据______相关;当r______0时,称成对样本数据______相关;当r=0时,称成对样本数据间没有线性相关关系.>正<负Y与bx+a之间观测值减去预测值大第1课时
变量的相关关系及线性回归模型某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:变量的相关关系举题说法1月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是
(
)A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系【解析】由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.A变式在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图.下列结论正确的是 (
)【解析】观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%B某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如右数据:样本相关系数2样本号i123456根部横截面积xi0.040.060.040.080.080.05材积量yi0.250.400.220.540.510.34样本号i78910总和
根部横截面积xi0.050.070.070.060.6
材积量yi0.360.460.420.403.9
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
【解答】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如右数据:2样本号i123456根部横截面积xi0.040.060.040.080.080.05材积量yi0.250.400.220.540.510.34样本号i78910总和
根部横截面积xi0.050.070.070.060.6
材积量yi0.360.460.420.403.9
【解答】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如右数据:2样本号i123456根部横截面积xi0.040.060.040.080.080.05材积量yi0.250.400.220.540.510.34样本号i78910总和
根部横截面积xi0.050.070.070.060.6
材积量yi0.360.460.420.403.9
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比,利用以上数据给出该林区这种树木的总材积量的估计值.【解答】某市航空公司为了解每年航班正点率x%对每年乘客投诉次数y(单位:次)的影响,对近8年(2015年~2022年)每年航班正点率x%和每年乘客投诉次数y的数据作了初步处理,得到下面的一些统计量的值.线性经验回归方程3(1)求y关于x的经验回归方程;【解答】某市航空公司为了解每年航班正点率x%对每年乘客投诉次数y(单位:次)的影响,对近8年(2015年~2022年)每年航班正点率x%和每年乘客投诉次数y的数据作了初步处理,得到下面的一些统计量的值.3(2)该市航空公司预计2024年航班正点率为84%,利用(1)中的回归方程,估算2024年乘客对该市航空公司投诉的次数.【解答】变式根据国家统计局公布的数据,对2013~2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:年份20132014201520162017201820192020年份代码x12345678垃圾焚烧无害化处理厂的个数y166188220249286331389463(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);【解答】因为y与x的样本相关系数r=0.98,接近1,所以y与x的线性相关程度很高,可用线性回归模型拟合y与x的关系.变式根据国家统计局公布的数据,对2013~2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:年份20132014201520162017201820192020年份代码x12345678垃圾焚烧无害化处理厂的个数y166188220249286331389463(2)求y关于x的经验回归方程,并预测2024年全国生活垃圾焚烧无害化处理厂的个数.
【解答】随堂练习1.已知某设备的使用年限x(单位:年)与年维护费用y(单位:千元)的对应数据如右表:x24568y34.56.57.59B【解析】2.已知x与y的数据如下表所示,根据表中数据,利用最小二乘法求得y关于x的经验回归方程为y=0.7x+1.05,则m的值是 (
)【解析】x2345y2.53.0m4.5A.3.8 B.3.85C.3.9 D.4.0D【解析】【答案】D根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值.方案一中,没剔除离群值,线性相关性弱些;方案二中,剔除离群值,线性相关性强些,所以样本相关系数-1<r2<r1<0.198【解析】由题意可得该车间上半年的总销售额约为1.21×(1+2+3+4+5+6)+28.765×6=25.41+172.59=198(万元).配套精练A组夯基精练一、
单项选择题1.调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是
(
)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245【解析】【答案】C根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故A错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,故B错误,C正确;由于r=0.8245是全部数据的相关系数,取出来一部分数据,相关性可能变强,也可能变弱,即取出的数据的相关系数不一定是0.8245,故D错误.2.某产品的宣传费用x(单位:万元)与销售额y(单位:万元)的统计数据如右表所示:B【解析】宣传费用x/万元2345销售额y/万元24304250A.55万元 B.60万元
C.62万元 D.65万元3.我国西北某地区开展改造沙漠的巨大工程,该地区对近5年投入的沙漠治理经费x(单位:亿元)和沙漠治理面积y(单位:万亩)的相关数据统计如下表所示.【解析】治理经费x/亿元34567治理面积y/万亩1012111220CA.1 B.2 C.3 D.44.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x/月份12345y/万盒56568【解析】【答案】C由点分布在经验回归直线附近或在直线上,x增加1个单位,则y可能增加0.7个单位,x减少1个单位,则y可能减少0.7个单位,故A,B错误;二、
多项选择题5.对两组数据进行统计后得到的散点图如图,关于其样本相关系数的结论正确的是
(
)A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|AC【解析】由散点图可知,样本相关系数r1的图象表示y与x负相关,故-1<r1<0,故A正确;样本相关系数r2的图象表示y与x正相关,故1>r2>0,故B错误;因为样本相关系数r2的点较样本相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.【解析】【答案】ABD三、
填空题7.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),则成对样本数据的样本相关系数是_______.-1【解析】【解析】5【解析】54.5(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);【解答】【解答】(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.【解答】由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.11.随着科技的发展,网购成了人们购物的重要选择,并对实体经济产生了一定影响.为了解实体经济的现状,某研究机构统计了一个大商场2018~2022年的线下销售额如下:年份编号x12345年份20182019202020212022销售额y(单位:万元)1513146512021060860(1)由表中数据可以看出,可用线性回归模型拟合销售额y与年份编号x的关系,请用相关系数加以说明;【解答】11.随着科技的发展,网购成了人们购物的重要选择,并对实体经济产生了一定影响.为了解实体经济的现状,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024双人合伙商业店铺协议模板
- 2024年企业工程承包详细协议细则
- 德邦物流2024年专项快递服务协议
- 2024年度供应商保密义务协议
- 2023-2024学年浙江省嘉兴市高考数学试题考前三个月(江苏专版)
- 2024年战略采购合作协议模板
- 2024房屋权属更名补充协议
- 2024年产品委托加工协议文本
- 6.1圆周运动(含答案)-2022-2023学年高一物理同步精讲义(人教2019必修第二册 )
- 2024年制造业劳务承包基本协议格式
- 绵阳市高中2022级(2025届)高三第一次诊断性考试(一诊)语文试卷(含答案)
- 自然资源调查监测劳动和技能竞赛
- 2 0 2 4 年 7 月 国开专科《法理学》期末纸质考试 试题及答案
- 6.1 我对谁负责 谁对我负责 课件-2024-2025学年统编版道德与法治八年级上册
- 2023-2024学年天津市经开区国际学校八年级(上)期末物理试卷
- DB23T 3842-2024 一般化工企业安全生产标准化评定规范
- 期中模拟押题卷(1-3单元)(试题)-2024-2025学年苏教版数学六年级上册
- 环氧树脂项目可行性研究报告项目报告
- 公共政策分析第一章
- 2024-2025学年人教版数学三年级上册 第三单元 测量 单元测试卷(含答案)
- 2024新信息科技三年级第四单元:创作数字作品大单元整体教学设计
评论
0/150
提交评论