版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§10.3
变量间的相关关系、统计案例基础知识
自主学习课时作业题型分类深度剖析内容索引基础知识自主学习1.两个变量的线性相关知识梳理(1)正相关在散点图中,点散布在从
到
的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从
到
的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在
,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.左下角右上角左上角右下角一条直线附近2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的
的方法叫做最小二乘法.(2)回归方程
是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中
,
是待定参数.距离的平方和最小3.回归分析(1)定义:对具有
的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中
称为样本点的中心.(3)相关系数当r>0时,表明两个变量
;当r<0时,表明两个变量
.相关关系正相关负相关r的绝对值越接近于1,表明两个变量的线性相关性
.r的绝对值越接近于0,表明两个变量之间
.通常|r|大于
时,认为两个变量有很强的线性相关性.越强几乎不存在线性相关关系0.754.独立性检验(1)分类变量:变量的不同“值”表示个体所属的
,像这类变量称为分类变量.(2)列联表:列出两个分类变量的
,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为不同类别频数表2×2列联表构造一个随机变量K2=
,其中n=
为样本容量.
y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+da+b+c+d(3)独立性检验利用随机变量
来判断“两个分类变量
”的方法称为独立性检验.K2有关系判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(
)(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(
)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(
)思考辨析×√√(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程
=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.(
)(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.(
)(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(
)×√×
考点自测1.(2015·湖北)已知变量x和y满足关系
=-0.1x+1,变量y与z正相关.下列结论中正确的是A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案解析所以x与y负相关.又y与z正相关,所以x与z负相关.故选C.
2.(教材改编)下面是2×2列联表:则表中a,b的值分别为答案解析A.94,72 B.52,50 C.52,74 D.74,52∵a+21=73,∴a=52.又a+22=b,∴b=74.
y1y2合计x1a2173x2222547合计b46120
因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.答案解析
4.(2017·湖南三校联考)某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:答案解析x16171819y50344131由上表可得线性回归方程
,据此模型预测零售价为15元时,每天的销售量为A.51个
B.50个
C.49个
D.48个5.(2016·玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得K2≈3.855,那么就有________%的把握认为用电脑时间与视力下降有关系.答案解析根据表格发现3.855>3.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.95P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828题型分类深度剖析
题型一相关关系的判断例1
(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:其中一定不正确的结论的序号是答案解析A.①② B.②③
C.③④
D.①④∴①④一定错误.(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为_____.答案解析①x,y是负相关关系;③x、y之间不能建立线性回归方程.①②①显然正确;判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.思维升华
跟踪训练1
(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
x+1上,则这组样本数据的样本相关系数为A.-1 B.0 C. D.1所有点均在直线上,则样本相关系数最大,即为1,故选D.答案解析
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则A.r2<r1<0 B.0<r2<r1C.r2<0<r1
D.r2=r1对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,故选C.答案解析题型二线性回归分析例2
(2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;注:年份代码17分别对应年份2008-2014.解答由折线图中数据和附注中参考数据得因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:解答所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.线性回归分析问题的类型及解题方法(1)求线性回归方程①利用公式,求出回归系数
②待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数
.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.思维升华跟踪训练2
(2015·课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.46.65636.8289.81.61469108.8解答(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;解答(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?解答②年宣传费x为何值时,年利润的预报值最大?解答根据(2)的结果知,年利润z的预报值故年宣传费为46.24千元时,年利润的预报值最大.题型三独立性检验例3
(2016·福建厦门三中模拟)某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中,工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的有15人.(1)根据以上数据建立一个2×2列联表;
解答根据题设条件,得2×2列联表如下:
支持企业改革不太赞成企业改革总计工作积极46450工作一般351550总计8119100(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?解答P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828提出假设:企业的全体员工对待企业改革的态度与其工作积极性无关.根据(1)中的数据,可以求得所以有99%的把握认为抽样员工对待企业改革的态度与工作积极性有关,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关.(1)比较几个分类变量有关联的可能性大小的方法①通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.②通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.(2)独立性检验的一般步骤①根据样本数据制成2×2列联表.思维升华③比较k与临界值的大小关系,作统计推断.跟踪训练3
(2017·衡阳联考)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名.(1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?解答由题意可得2×2列联表如下:根据2×2列联表中数据,得K2的观测值为
不常吃零食常吃零食总计不患龋齿60100160患龋齿140500640总计200600800∴能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系.(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率.解答P(K2≥k0)0.0100.0050.001k06.6357.87910.828设其他工作人员为丙和丁,4人分组的所有情况如下表.由表可知,分组的情况共有6种,工作人员甲负责收集数据且工作人员乙负责处理数据的有2种,小组123456收集数据甲乙甲丙甲丁乙丙乙丁丙丁处理数据丙丁乙丁乙丙甲丁甲丙甲乙典例
(12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:思想方法指导
规范解答
求线性回归方程的方法技巧思想与方法系列21年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程
;(2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程。
返回解
(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.年份-2010-4-2024需求-257-21-1101929由上述计算结果,知所求线性回归方程为(2)利用所求得的线性回归方程,可预测2016年的粮食需求量大约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2(万吨).[12分]
返回课时作业1.(2016·衡水质检)具有线性相关关系的变量x,y满足一组数据如下表所示.若y与x的线性回归方程为
,则m的值是12345678910答案解析x0123y-11m8√2.(2016·湖南师大附中月考)已知x,y的取值如下表:12345678910x014568y1.31.85.66.17.49.3答案解析A.1.45 B.13.8 C.13 D.12.8√12345678910从而当x=13时,有y=13.8.故选B.3.(2017·泰安月考)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:
优秀非优秀总计A班14620B班71320总计21194012345678910附:参考公式及数据:(2)独立性检验的临界值表:P(K2≥k0)0.0500.010k03.8416.63512345678910则下列说法正确的是A.有99%的把握认为环保知识测试成绩与专业有关B.有99%的把握认为环保知识测试成绩与专业无关C.有95%的把握认为环保知识测试成绩与专业有关D.有95%的把握认为环保知识测试成绩与专业无关答案解析√3.841<K2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关.1234567891012345678910答案解析√∵0.85>0,∴y与x正相关,∴A正确;12345678910∵Δy=0.85(x+1)-85.71-(0.85x-85.71)=0.85,∴C正确.故选D.5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀非优秀总计甲班10b
乙班c30
合计
附:
P(K2≥k0)0.050.0250.0100.005k03.8415.0246.6357.87912345678910A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与
班级有关系”D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩
与班级有关系”√答案解析12345678910由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,因此有97.5%的把握认为“成绩与班级有关系”.12345678910A.充分不必要条件
B.必要不充分条件C.充要条件
D.既不充分也不必要条件12345678910答案解析√7.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程
=0.2x+12中,当解释变量x每增加一个单位时,预报变量
平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.答案解析②③①是系统抽样;对于④,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.1234567891012345678910答案解析9.某百货公司1~6月份的销售量x与利润y的统计数据如下表:12345678910月份123456销售量x(万件)1011131286利润y(万元)222529261612解答根据表中2~5月份的数据作出散点图,如图所示:12345678910(2)若由线性回归方程得到的估计数据与剩
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- PEP人教版小学四年级上册Unit 1 My classroom PartC Story time课件
- 农村个人房屋买卖合同协议书范本
- (立项备案方案)椰雕项目立项申请报告
- 古代建筑行业中的追踪和定位- 王姣27课件讲解
- 山东省菏泽市郓城县第一中学2023-2024学年七年级上学期第一次月考生物试题(解析版)-A4
- 湖南省娄底市新化县2024-2025学年八年级上学期12月月考道德与法治试题-A4
- 兽医寄生虫题库与参考答案
- 养老院老人心理关爱制度
- 养老院老人紧急救援人员职业道德制度
- 房屋建筑项目工程总承包合同(2篇)
- 企业发展未来5年规划
- 第六单元 除法(单元测试)(含答案)-2024-2025学年四年级上册数学北师大版
- 2024年统编版七年级语文上册期末测试卷(附答案)
- 国开(河北)2024年秋《现代产权法律制度专题》形考作业1-4答案
- 2024年消防月全员消防安全知识培训
- 外研版(2024新版)七年级上册英语期末(Units 1~6)学业质量测试卷(含答案)
- 2024-2025学年四年级科学上册第一单元《声音》测试卷(教科版)
- 2024中国南水北调集团水网智慧科技有限公司招聘笔试参考题库含答案解析
- EPC项目投标人承包人工程经济的合理性分析、评价
- 六年级上册《道德与法制》期末复习计划
- 劳动技能实操指导(劳动教育)学习通课后章节答案期末考试题库2023年
评论
0/150
提交评论