




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE10-第四节变量间的相关关系与统计案例[考纲传真]1.会做两个有关联变量的数据的散点图,并利用散点图相识变量间的相关关系.2.了解最小二乘法的思想,能依据给出的线性回来方程系数公式建立线性回来方程(线性回来系数公式不要求记忆).3.了解回来分析的基本思想、方法及其简洁应用.4.了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回来直线假如散点图中点的分布从整体上看大致在一条直线旁边,就称这两个变量之间具有线性相关关系,这条直线叫做回来直线.2.回来方程(1)最小二乘法:使得样本数据的点到回来直线的距离的平方和最小的方法叫做最小二乘法.(2)回来方程:方程eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回来方程,其中eq\o(a,\s\up12(^)),eq\o(b,\s\up12(^))是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up12(^))=\f(\o(∑,\s\up12(n),\s\do10(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up12(n),\s\do10(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up12(n),\s\do10(i=1))xiyi-n\o(x,\s\up12(-))\o(y,\s\up12(-)),\o(∑,\s\up12(n),\s\do10(i=1))x\o\al(2,i)-n\x\to(x)2),\o(a,\s\up12(^))=\x\to(y)-\o(b,\s\up12(^))\x\to(x).))3.回来分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(eq\o(x,\s\up12(-)),eq\o(y,\s\up12(-)))称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的肯定值越接近于1,表明两个变量的线性相关性越强.r的肯定值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=eq\f(nad-bc2,a+ba+cb+dc+d),其中n=a+b+c+d为样本容量.[常用结论]1.回来直线必过样本点的中心(eq\x\to(x),eq\x\to(y)).2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.[基础自测]1.(思索辨析)推断下列结论的正误.(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以说明为老师的教学水平与学生的水平成正相关关系.()(2)通过回来直线方程eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^))可以估计预报变量的取值和改变趋势.()(3)因为由任何一组观测值都可以求得一个线性回来方程,所以没有必要进行相关性检验.()(4)事务X,Y关系越亲密,则由观测数据计算得到的K2的观测值越大.()[答案](1)√(2)√(3)×(4)√2.在两个变量y与x的回来模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R3为0.50D.模型4的相关指数R2为0.25A[R2越接近于1,其拟合效果越好.]3.已知回来直线的斜率的估计值是1.23,样本点的中心为(4,5),若自变量的值为10,则因变量的值约为()A.16.3 B.17.3C.12.38 D.2.03C[设回来直线方程为eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^)),依据已知得5=1.23×4+eq\o(a,\s\up12(^)),所以eq\o(a,\s\up12(^))=0.08,所以当x=10时,eq\o(y,\s\up12(^))=1.23×10+0.08=12.38.]4.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46则表中a,b处的值分别为________.52,54[因为a+21=73,所以a=52.又因为a+2=b,所以b=54.]5.为了推断中学三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.依据表中数据,得到K2的观测值k=eq\f(50×13×20-10×72,23×27×20×30)≈4.844.则认为选修文科与性别有关系出错的可能性为________.5%[K2的观测值k≈4.844,这表明小概率事务发生.依据假设检验的基本原理,应当断定“是否选修文科与性别之间有关系”成立,并且这种推断出错的可能性约为5%.]相关关系的推断1.已知变量x和y近似满意关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关C[由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关.]2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3A[由相关系数的定义以及散点图可知r2<r4<0<r3<r1.]3.x和y的散点图如图所示,则下列说法中全部正确命题的序号为________.①x,y是负相关关系;②在该相关关系中,若用y=c1ec2x拟合时的相关指数为Req\o\al(2,1),用eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^))拟合时的相关指数为Req\o\al(2,2),则Req\o\al(2,1)>Req\o\al(2,2);③x,y之间不能建立线性回来方程.①②[在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1ec2x拟合比用eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^))拟合效果要好,则Req\o\al(2,1)>Req\o\al(2,2),故②正确;x,y之间可以建立线性回来方程,但拟合效果不好,故③错误.][规律方法]判定两个变量正、负相关性的方法1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.2相关系数:r>0时,正相关;r<0时,负相关.3线性回来直线方程中:eq\o(b,\s\up12(^))>0时,正相关;\o(b,\s\up12(^))<0时,负相关.回来分析【例1】(2024·广州一模)某地1~10岁男童年龄xi(岁)与身高的中位数yi(cm)(i=1,2,…,10)如下表:x/岁12345678910y/cm76.588.596.8104.1111.3117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\o(∑,\s\up12(10),\s\do10(i=1))(xi-eq\x\to(x))2eq\o(∑,\s\up12(10),\s\do10(i=1))(yi-eq\x\to(y))2eq\o(∑,\s\up12(10),\s\do10(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))5.5112.4582.503947.71566.85(1)求y关于x的线性回来方程(回来方程系数精确到0.01);(2)某同学认为,y=px2+qx+r更相宜作为y关于x的回来方程类型,他求得的回来方程是eq\o(y,\s\up12(^))=-0.30x2+10.17x+68.07.经调查,该地11岁男童身高的中位数为145.3cm.与(1)中的线性回来方程比较,哪个回来方程的拟合效果更好?附:回来方程eq\o(y,\s\up12(^))=eq\o(a,\s\up12(^))+eq\o(b,\s\up12(^))x中的斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up12(^))=eq\f(\o(∑,\s\up12(n),\s\do10(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up12(n),\s\do10(i=1))xi-\x\to(x)2),eq\o(a,\s\up12(^))=eq\x\to(y)-eq\o(b,\s\up12(^))eq\x\to(x).[解](1)eq\o(b,\s\up12(^))=eq\f(\o(∑,\s\up12(10),\s\do10(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up12(10),\s\do10(i=1))xi-\x\to(x)2)=eq\f(566.85,82.50)≈6.87,eq\o(a,\s\up12(^))=eq\x\to(y)-eq\o(b,\s\up12(^))eq\x\to(x)≈112.45-6.87×5.5≈74.67,所以y关于x的线性回来方程为eq\o(y,\s\up12(^))=6.87x+74.67.(2)若回来方程为eq\o(y,\s\up12(^))=6.87x+74.67,当x=11时,eq\o(y,\s\up12(^))=150.24.若回来方程为eq\o(y,\s\up12(^))=-0.30x2+10.17x+68.07,当x=11时,eq\o(y,\s\up12(^))=143.64.因为|143.64-145.3|=1.66<|150.24-145.3|=4.94,所以回来方程eq\o(y,\s\up12(^))=-0.30x2+10.17x+68.07对该地11岁男童身中学位数的拟合效果更好.[规律方法]1.求回来直线方程的步骤2.(1)若已知回来直线方程(方程中无参数)进行预料时,把变量x代入回来直线方程即可对变量y进行估计.(2)若回来直线方程中有参数,则依据回来直线肯定经过点(eq\x\to(x),eq\x\to(y))求出参数值,得到回来直线方程,进而完成预料.(1)(2024·山东高考)为了探讨某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,依据测量数据的散点图可以看出y与x之间有线性相关关系.设其回来直线方程为eq\o(y,\s\up12(^))=eq\o(b,\s\up12(^))x+eq\o(a,\s\up12(^)).已知eq\o(∑,\s\up12(10))eq\o(,\s\do10(i=1))xi=225,eq\o(∑,\s\up12(10))eq\o(,\s\do10(i=1))yi=1600,eq\o(b,\s\up12(^))=4.该班某学生的脚长为24,据此估计其身高为()A.160 B.163C.166 D.170(2)某产品的广告费用x万元与销售额y万元的统计数据如表:广告费用x(万元)2345销售额y(万元)26m4954依据上表可得回来方程eq\o(y,\s\up12(^))=9x+10.5,则m的值为()A.36 B.37C.38 D.39(1)C(2)D[(1)∵eq\o(∑,\s\up12(10),\s\do10(i=1))xi=225,∴eq\x\to(x)=eq\f(1,10)eq\o(∑,\s\up12(10),\s\do10(i=1))xi=22.5.∵eq\o(∑,\s\up12(10),\s\do10(i=1))yi=1600,∴eq\x\to(y)=eq\f(1,10)eq\o(∑,\s\up12(10),\s\do10(i=1))yi=160.又eq\o(b,\s\up12(^))=4,∴eq\o(a,\s\up12(^))=eq\x\to(y)-eq\o(b,\s\up12(^))eq\x\to(x)=160-4×22.5=70.∴回来直线方程为eq\o(y,\s\up12(^))=4x+70.将x=24代入上式得eq\o(y,\s\up12(^))=4×24+70=166.故选C.(2)由回来方程的性质,线性回来方程过样本点的中心,则:eq\f(26+m+49+54,4)=eq\f(2+3+4+5,4)×9+10.5,解得m=39.故选D.]独立性检验【例2】(2024·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,其次组工人用其次种生产方式.依据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:(1)依据茎叶图推断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式其次种生产方式(3)依据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828[解](1)其次种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用其次种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此其次种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用其次种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此其次种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用其次种生产方式的工人完成生产任务平均所需时间低于80分钟.因此其次种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用其次种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用其次种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此其次种生产方式的效率更高.(以上给出了4种理由,答出其中随意一种或其他合理理由均可)(2)由茎叶图知m=eq\f(79+81,2)=80.列联表如下:超过m不超过m第一种生产方式155其次种生产方式515(3)由于K2=eq\f(4015×15-5×52,20×20×20×20)=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.[规律方法]1.在2×2列联表中,假如两个变量没有关系,则应满意ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,肯定要依据独立性检验的步骤得出结论.独立性检验的一般步骤:1依据样本数据制成2×2列联表;2依据公式EQK2=\f(nad-bc2,a+ba+cb+dc+d)计算K2的观测值k;3比较观测值k与临界值的大小关系,作统计推断.某探讨型学习小组调查探讨学生运用智能手机对学习的影响.部分统计数据如下表:运用智能手机不运用智能手机合计学习成果优秀4812学习成果不优秀16218估计201030附表:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828经计算K2的观测值为10,则下列选项正确的是()A.有99.5%的把握认为运用智能手机对学习有影响B.有99.5%的把握认为运用智能手机对学习无影响C.有99.9%的把握认为运用智能手机对学习有影响D.有99.9%的把握认为运用智能手机对学习无影响A[依题意,留意到7.879<10<10.828,因此有99.5%的把握认为运用智能手机对学习有影响,故选A.]1.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣扬费,需了解年宣扬费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣扬费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\o(∑,\s\up12(8),\s\do10(i=1))(xi-eq\x\to(x))2eq\o(∑,\s\up12(8),\s\do10(i=1))(wi-eq\x\to(w))2eq\o(∑,\s\up12(8),\s\do10(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))eq\o(∑,\s\up12(8),\s\do10(i=1))(wi-eq\x\to(w))·(yi-eq\x\to(y))46.65636.8289.81.61469108.8表中wi=eq\r(xi),w]=eq\f(1,8)eq\o(∑,\s\up12(8),\s\do10(i=1))wi.(1)依据散点图推断,y=a+bx与y=c+deq\r(x)哪一个相宜作为年销售量y关于年宣扬费x的回来方程类型?(给出推断即可,不必说明理由)(2)依据(1)的推断结果及表中数据,建立y关于x的回来方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.依据(2)的结果回答下列问题:①年宣扬费x=49时,年销售量及年利润的预报值是多少?②年宣扬费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回来直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up12(^))=eq\f(\o(∑,\s\up12(n),\s\do10(i=1))ui-\x\to(u)vi-\x\to(v),\o(∑,\s\up12(n),\s\do10(i=1))ui-\x\to(u)2),eq\o(α,\s\up12(^))=eq\x\to(v)-eq\o(β,\s\up12(^))eq\x\to(u).[解](1)由散点图可以推断,y=c+deq\r(x)相宜作为年销售量y关于年宣扬费x的回来方程类型.(2)令w=eq\r(x),先建立y关于w的线性回来方程.由于eq\o(d,\s\up12(^))=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up12(^))=eq\x\to(y)-eq\o(d,\s\up12(^))eq\x\to(w)=563-68×6.8=100.6,所以y关于w的线性回来方程为eq\o(y,\s\up12(^))=100.6+68w,因此y关于x的回来方程为eq\o(y,\s\up12(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up12(^))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up12(^))=576.6×0.2-49=66.32.②依据(2)的结果知,年利润z的预报值eq\o(z,\s\up12(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省连云港市赣榆区2025届高三3月6、7日周考第二次周练化学试题含解析
- 辽宁中医药大学《工程制图A》2023-2024学年第二学期期末试卷
- 山东工艺美术学院《视听说(俄)(二)》2023-2024学年第一学期期末试卷
- 新疆工程学院《材料性能研究技术》2023-2024学年第二学期期末试卷
- 江苏省无锡市江阴市长泾片重点名校2025年初三年级三模语文试题试卷含解析
- 天津理工大学《文献检索与实践》2023-2024学年第二学期期末试卷
- 主讲平面广告设计
- 2024北京四中初二(下)期中语文试题及答案
- DB5108T60-2025农产品质量安全现场检查规范
- 邯郸市高三上学期摸底考试历史试题
- 班组长报·联·商课件
- 项目经理变更说明(申请)
- 《将进酒》课件23张
- 机房动力环境监控课件
- 医疗垃圾收集流程及鹅颈式打结方法考评标准
- 油气管道高后果区管段识别分级表
- 班前安全活动记录(真石漆班组)
- 县级城投公司人事管理制度
- 无损检测超声波检测课件
- 生产中断影响及生产组织管理考核办法
- 【图文】GB8624-2012建筑材料及制品燃烧性能分级(精)
评论
0/150
提交评论