版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第56讲变量的相关性、统计(tngj)案例知识(zh shi)梳理一、变量间的相关(xinggun)关系1常见的两变量之间的关系有两类:一是函数关系,另一类是_;与函数关系不同,_是一种非确定性关系2从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_,点散布在左上角到右下角的区域内,两个变量的相关关系为_二、回归分析对具有_的两个变量进行统计分析的方法叫回归分析其基本步骤是:(1)画散点图,(2)求_,(3)用回归直线方程作预报1回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在_附近,我们就称这两个变量之间具有_关系,这条直线叫做_2回归直线方程的求法
2、最小二乘法设具有线性相关关系的两个变量x,y的一组观察值为(xi,yi)(i1,2,n),则回归直线方程eq o(y,sup6()eq o(a,sup6()eq o(b,sup6()x的系数为:其中xeq f(1,n)eq isu(i1,n,x)i,yeq f(1,n)eq isu(i1,n,y)i,(x,y)称为样本点的_3相关系数:(1)当r0时,表明两个变量_;当r0时,表明两个变量_(2)r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系;通常|r|大于0.75时,认为两个变量有很强的线性相关性三、独立性检验1若变量的不同“值”表示_,则这类变量称为分类变量2列出的两个分类
3、变量的_表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为 Y X y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 3.利用随机变量K2来判断“两个分类变量有关系”的方法称为_独立性检验_独立性检验公式K2 其中nabcd.疑难辨析1变量间的相关关系(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)如果散点图中的点的分布几乎没有什么规则,则两个变量之间不具有相关关系()(4)散点图是判断两个变量
4、是否相关的一种重要方法和手段()2回归分析(1)回归分析就是研究两个相关事件的独立性()(2)回归模型都是确定性的函数,且回归模型都是线性的()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)任何一组数据都对应着一个回归直线方程()(5)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程eq o(y,sup6()2.352x147.767,则气温为2时,一定可卖出143杯热饮()3独立性检验(1)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大()(2)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能
5、物理优秀()考点一变量相关关系的判断例1 (1)2012课程标准卷 在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yeq f(1,2)x1上,则这组样本数据的样本相关系数为()A1 B0 C.eq f(1,2) D1(2)2012焦作质检 对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图 (1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图 (2),由这两个散点图可以判断()A变量(binling)x与y正相关(xinggun),u与v正相关(xin
6、ggun) B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关 D变量x与y负相关,u与v负相关eq avs4al(归纳总结) 对两个变量的相关关系的判断有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关,线性回归分析以散点图为基础,拟合效果的好坏可由直观性直接判断;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的,相关性有正相关和负相关,强相关和弱相关变式题 2012东莞调研 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13
7、,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10 B0r2r1 C.r20k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.82852013湖南卷 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程
8、为eq o(y,sup6()0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(x,y)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg6对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()图K561Ar2r40r3r1 Br4r20r1r3Cr4r20r3r1 Dr2r40r13.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_14(10分)2013保定二模 某空调生产部门为了提高工效,需分析该部门的产量x(台)与所用时间
9、y(小时)之间的关系,为此做了4次统计,所得数据如下:生产空调的台数x(台)2345所用的时间y(小时)2.5344.5图K562(1)在所给的坐标系中画出表中数据的散点图与回归直线;(2)求出y关于x的线性回归方程eq o(y,sup6()eq o(b,sup6()xeq o(a,sup6(),并据此预测生产10台空调需要多少时间?参考公式:eq o(b,sup6()x15(13分)2013吉林质检 户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动合计男
10、性5女性10合计50已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是eq f(3,5).(1)请将上面的列联表补充完整;(2)求该公司男、女员工各多少名;(3)是否有99.5%的把握认为喜欢户外运动与性别有关?并说明你的理由下面的临界值表仅供参考:P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:K2eq f(n(adbc)2,(ab)(cd)(ac)(bd)),其中nabcd16(12分)2013福建卷 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行
11、试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程eq o(y,sup6()bxa,其中b20,aybx;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)课后习题答案(d n)(变量的相关性、统计案例)1C解析(ji x) 都是函数(hnsh)关系,是相关关系,故选C.2C解析 因回归直线方程必过样本点的中心(x,y),将点(4,5)代入A,B,C检验可知,故选C.3D解析 样本相关系数r1,1,所以D错495解析 由附表可
12、得知当K23.841时,有概率P1P0.95,而此时的K23.8553.841,则可以得到有95%以上的根据认为用电脑时间与视力下降有关系【能力提升】5D解析 由线性回归方程的特征与性质,得A,B,C均正确,D选项是错误的,线性回归方程只能预测学生的体重选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”6A解析 由散点图得,图1与图3是正相关,图2与图4是负相关,且图1与图2中的样本点较集中分布在一条直线附近,由相关系数的定义可知,故选A.7C解析 根据独立性检验的思想知,某人吸烟,只能说其患肺病的可能性较大,有99%的把握认为吸烟与患肺病有关系,但并没有理由
13、认为吸烟者有99%的可能患肺病,故选C.8C解析 由回归直线方程为eq o(y,sup6()80 x50,得劳动生产率为1千元时,工资约为130元,故正确;当x增加1时,y要增加80元,则劳动生产率每提高1千元时,工资平均提高80元,故正确,错误;当月工资为210元时,即80 x50210,解得x2,即劳动生产率约为2千元,故正确综上知,正确的有,故选C.9B解析 根据变量的相关关系的概念知选项A正确;根据残差的概念和相关系数的概念知选项C,D正确;线性回归方程经过样本点中心(x,y),B错1013正解析 将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统
14、计资料可以看出,中位数为13万元,且年平均收入增多时,年平均支出也增多,因此两者正相关110.245解析 家庭年收入每增加1万元,即x变为x1,则eq o(y,sup6()0.245(x1)0.3210.245x0.3210.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元1283解析 依题意得,当y7.675时,有0.66x1.5627.675,x9.262.因此,可以估计该城市人均消费额占人均工资收入的百分比为eq f(7.675,9.262)83%.135%解析 k3.841,查临界值表,得P(K23.841)0.05,故这种判断出错的可能性为5%.14解:(1)由表
15、中的数据,画出散点图与回归直线如图所示(2)由表中数据,得2232425254,xeq f(2345,4)3.5,yeq f(2.5344.5,4)3.5,所以eq o(b,sup6()0.7,eq o(a,sup6()yeq o(b,sup6()x3.50.73.51.05,所以y关于x的回归直线方程为eq o(y,sup6()0.7x1.05.将x10代入方程,得eq o(y,sup6()0.7101.058.05,故预测生产10台空调需要8.05小时15解:(1)在全部50人中随机抽取1人抽到喜欢户外运动的概率是eq f(3,5),喜欢户外运动的男女员工共30,其中,男员工20人,列联表补充如下:喜欢户外运动不喜欢户外运动合计男性20525女性101525合计302050(2)该公司男员工人数为eq f(25,50)650325,则女员工325人(3)将22列联表中的数据代入公式计算,得K2eq f(50(2015105)2,30202525)8.3337.879,有99.5%的把握认为喜欢户外运动与性别有关【难点突破】16解:(1)由于xeq f(1,6)(x1x2x3x4x5x6)8.5,yeq f(1,6)(y1y2y3y4y5y6)80.所以ay
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022~2023执业兽医考试题库及答案参考
- 学前教育的表达能力培养考核试卷
- 玻璃制造中的生态设计和绿色建筑考核试卷
- 白酒的酿造技术与产品质量控制策略研究考核试卷
- 木材与医药行业的合作与创新考核试卷
- 城市轨道交通的容量与拥堵研究考核试卷
- 动漫游戏产业法律事务考核试卷
- 摩托车天气与路况应对策略考核试卷
- DB11T 303-2014 养老机构服务标准体系建设指南
- DB11∕T 1827-2021 粉尘防爆安全管理规范
- 人教版三年级英语上册期中模拟考试【带答案】
- MOOC 药物代谢动力学-中国药科大学 中国大学慕课答案
- 供应链协同规划:整合供应链资源、提高供应链效率
- 水利工程运维水利工程运行和日常维修养护方案
- 2024上海市标准房屋租赁合同官方版
- (易错笔记)第五单元 周长 常考易错题汇编(单元测试)小学数学三年级上册(北师大版含答案)
- 2024年济宁农村干部学院(校)招生历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 股权优先优先回购权协议书
- 供应商调查表模板及范文大全
- 浙江省绍兴市诸暨市2023-2024学年七年级上学期期末语文试题
- 一鼓作气成语故事ppt
评论
0/150
提交评论