




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
10.4
变量间的相关关系、
统计案例-2-知识梳理双基自测234151.变量间的相关关系(1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种
.
(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量
;若这些点分布在从左上角到右下角的区域,则称两个变量
.
(3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在
,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
非确定性关系
正相关
负相关
一条直线附近
-3-知识梳理双基自测23415(4)非线性相关:若散点图上所有点看上去都在
附近波动,则称这两个变量为非线性相关.此时,可以用
来拟合.
(5)不相关:如果所有的点在散点图中
,则称这两个变量是不相关的.
某条曲线(不是一条直线)一条曲线
没有显示任何关系
-4-知识梳理双基自测234152.回归分析对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为
,因变量y称为
.
解释变量
预报变量
-5-知识梳理双基自测23415-6-知识梳理双基自测234154.相关系数
,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r>0时表示两个变量正相关,当r<0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性
;当|r|接近0时,表明两个变量间几乎不存在
.
越强
线性相关性
-7-知识梳理双基自测234155.独立性检验(1)分类变量:变量的不同“值”表示个体所属的
,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的
,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表不同类别
频数表
-8-知识梳理双基自测23415(3)独立性检验:利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.a+b+c+d2-9-知识梳理双基自测34151.下列结论正确的打“√”,错误的打“×”.(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(
)(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.(
)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(
)(4)若事件X,Y的关系越密切,则由观测数据计算得到的K2的观测值越大.(
)答案答案关闭(1)×
(2)√
(3)√
(4)√
(5)√-10-知识梳理双基自测23415答案解析解析关闭答案解析关闭-11-知识梳理双基自测234153.(2017辽宁葫芦岛一模)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):万元时的销售额约为(
)A.101.2万元 B.108.8万元C.111.2万元 D.118.2万元答案解析解析关闭答案解析关闭-12-知识梳理双基自测234154.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是
;
(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是
.
答案解析解析关闭
(1)由题图可知,甲的语文成绩名次比总成绩名次靠后;而乙的语文成绩名次比总成绩名次靠前.故填乙.(2)由题图可知,比丙的数学成绩名次还靠后的人比较多;而总成绩名次中比丙名次靠后的人数比较少,所以丙的数学成绩名次更靠前.故填数学.答案解析关闭(1)乙
(2)数学-13-知识梳理双基自测23415答案解析解析关闭答案解析关闭-14-考点1考点2考点3例1(1)(2017河南洛阳模拟)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程
近似地刻画其相关关系,根据图形,以下结论最有可能成立的是(
)A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值-15-考点1考点2考点3(2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现A,B两个变量有更强的线性相关性(
)A.甲 B.乙 C.丙 D.丁思考如何判断两个变量有无相关关系?答案解析解析关闭(1)由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.(2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性,故选D.答案解析关闭(1)B
(2)D-16-考点1考点2考点3解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.-17-考点1考点2考点3对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(
)A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3-18-考点1考点2考点3(2)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:其中一定不正确的结论的序号是(
)A.①② B.②③ C.③④ D.①④答案解析解析关闭(1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,故r2<r4<0<r3<r1.(2)正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.答案解析关闭(1)A
(2)D-19-考点1考点2考点3例2(2017四川成都诊断)PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少.-20-考点1考点2考点3思考对已知的两个变量的一组数据如何做回归分析?-21-考点1考点2考点3-22-考点1考点2考点3所以可以预测此时PM2.5的浓度为150.24微克/立方米.解题心得1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系;若具有线性相关关系,则可通过线性回归方程来估计和预测.-23-考点1考点2考点3对点训练2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)-24-考点1考点2考点3-25-考点1考点2考点3-26-考点1考点2考点3例3为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:-27-考点1考点2考点3(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.思考独立性检验得出的结论是什么?它对我们日常生活有什么帮助?-28-考点1考点2考点3
解
(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本.可知分层抽样的方法比采用简单随机抽样方法更好.-29-考点1考点2考点3解题心得独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度;具体做法是根据公式
计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.-30-考点1考点2考点3对点训练3某学校为了研究学情,从高三年级中抽取了20名学生三次测试的数学成绩和物理成绩,计算出了他们三次成绩的平均名次如下表:-31-考点1考点2考点3学校规定平均名次小于或等于40.0为优秀,大于40.0为不优秀.(1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,求这两名学生数学和物理都优秀的概率.(2)根据这次抽查数据,列出2×2列联表,能否在犯错误的概率不超过0.025的前提下认为物理成绩和数学成绩有关?(下面的临界值表和公式可供参考:解
(1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,共有15种情况,数学和物理都优秀的有4名学生,从中随机抽取2名有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年国际物流师考试的准备建议及试题及答案
- CPSM考试发展历程试题与答案
- 供应链中的需求管理策略试题及答案
- 遗传变异在进化中的作用试题及答案
- 为何选择国际物流师作为职业试题及答案
- 2024年CPMM考生备战分享会试题及答案
- 2024年物流行业职业认证试题及答案
- 2024国际物流师考试难题解答试题及答案
- 中国诗词大会:唐诗文学常识选择题
- 动植物国际合作与保护:试题及答案
- 简约中国戏曲文化鉴赏工作汇报工作总结PPT模板
- 一文读懂泡泡玛特
- 招收士官学历专业审定表
- 社区卫生服务站管理制度管理办法
- 大型活动报备申请表(样本)
- 品质异常奖罚规定001
- 2006年上海市中考数学试题及答案(共10页)
- 扁桃体癌的护理查房
- SF6气体检漏仪说明书
- 最新高人总结长期股权投资-通俗易懂式讲解资料
- 离心泵设计计算说明书
评论
0/150
提交评论