高考数学一轮复习 第十章 概率与统计 第六节 变量的相关关系、统计案例课件 文_第1页
高考数学一轮复习 第十章 概率与统计 第六节 变量的相关关系、统计案例课件 文_第2页
高考数学一轮复习 第十章 概率与统计 第六节 变量的相关关系、统计案例课件 文_第3页
高考数学一轮复习 第十章 概率与统计 第六节 变量的相关关系、统计案例课件 文_第4页
高考数学一轮复习 第十章 概率与统计 第六节 变量的相关关系、统计案例课件 文_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六节变量的相关关系、统计案例总纲目录教材研读1.两个变量的线性相关考点突破2.回归分析3.独立性检验考点二线性回归方程的求解与应用考点一相关关系的判断考点三相关系数的意义考点四独立性检验1.两个变量的线性相关两个变量的线性相关(1)正相关在散点图中,点散布在从左下角左下角到右上角右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角左上角到右下角右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关.教材研读教材研读(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近一条直线附近,就称这两个变量之间具有线性相关关系

2、,这条直线叫做回归直线.(4)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小距离的平方和最小的方法叫做最小二乘法.(5)回归方程方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数.ybaab 1122211()(),().nniiiiiinniiiixxyyx ynxybxxxnxaybx2.回归分析回归分析(1)回归分析是对具有相关关系相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),我们知道=(,) 称为样本点的中

3、心.(3)相关系数:.当r0时,表明两个变量正相关正相关;当r0,0,0 C.0,0 D.0ybaababababD答案答案 D由题图可知,回归直线的斜率是正数,即0;回归直线在y轴上的截距是负数,即0时,y与x正相关;当0时,y与x负相关.一定不正确.故选D.ybabb4.已知x,y的对应取值如下表,从散点图可以看出y与x线性相关,且回归方程为=0.95x+,则=()A.3.25 B.2.6 C.2.2 D.0 x0134y2.24.34.86.7yaaB答案答案 B由题意知=2,=4.5,因为回归直线经过点(,),所以=4.5-0.952=2.6,故选B.xyxya5.某校为了研究学生的性

4、别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是有 的把握认为“学生性别与支持该活动有关系”.()附:P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1% B.1% C.99% D.99.9%C答案答案 C因为7.069与附表中的6.635最接近,所以得到的统计学结论是有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.6.下面是一个22列联表则表中a、b处的值分别为 . y1y2总计x1a2173x22252

5、7总计b46 52、54答案答案52、54解析解析因为a+21=73,所以a=52.又因为a+2=b,所以b=54.典例典例1(1)(2018湖南长沙质检)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()考点一相关关系的判断考点一相关关系的判断考点突破考点突破A.r2r40r3r1 B.r4r20r1r3C.r4r20r3r1 D.r2r40r1r3 (2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()答案答案(1)D(2)A解析解析(1)观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.(2)由相关系数的意义,结合散点图可知r2

6、r40r3r1,故选A.1-1在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本数据的样本相关系数为()A.-1 B.0 C. D.11212D答案答案 D所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1,故选D.1-2变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y

7、与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10 B.0r2r1C.r200;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).yx典例典例3 (2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:考点三相关系数的意义考点三相关系数的意义抽取次序12345678零件尺寸9.9510.12

8、9.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得=xi=9.97,s=0.212,18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16.(1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认

9、为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.x116161i16211()16iixx162211(16)16iixx1621(8.5)ii161ixxx(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,n)的相关系数r=;0.09.xx12211()()()()niiinniiiixxyyxxyy0.008解析解析(1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r=-0.

10、18.由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于=9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为(169.97-9.22)=10.02,16116162211()(8.5)()(8.5)iiiiixx ixxi2.780.21216 18.439xxx115故这条生产线当天生产的零件尺寸的均值的估计值为10.02.=160.2122+169.9721 591.134,剔除第13个数据,剩下数据的样本方

11、差为161i2ix(1 591.134-9.222-1510.022)0.008,故这条生产线当天生产的零件尺寸的标准差的估计值为0.09.1150.0082.线性相关系数是从数值上来判断变量间的线性相关程度,若|r|的值越接近于1,说明变量间的线性相关程度越高;|r|的值越接近于0,说明变量间的线性相关程度越低.当两个变量间的关系可用一次函数表示时,r=1,若斜率为正,r=1,否则r=-1,r为正时表示正相关,r为负时表示负相关.1.样本数据的相关系数rr= 12211()().()()niiinniiiixxyyxxyy规律总结规律总结3-1 (2016课标全国,18,12分)下图是我国2

12、008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40.17,=0.55,2.646.参考公式:相关系数r=,回归方程=+t中斜率和截距最小二乘估计公式分别为=,=-.71i71i721()iiyy712211()()()()niiinniiiittyyttyyyabb121()()()niiiniittyyttaybt解析解析(1)由折线图中数据和附注中参考数据得=4,(

13、ti-)2=28,=0.55,(ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.t71it721()iiyy71ity71it71i2.890.55 2 2.646 (2)由=1.331及(1)得=0.10,=-=1.331-0.1040.93.所以y关于t的回归方程为=0.93+0.10t.将2016年对应的t=9代入回归方程得:=0.93+0.109=1.83.所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨. y9.327b71721(

14、)()()iiiiittyytt2.8928aybtyy典例典例4 (2017课标全国,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:考点四独立性检验考点四独立性检验(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量50 kg箱产量50 kg旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:,K2=.2()()()()()n adbcab

15、 cd ac bd解析解析(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表: 箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.2200 (62 6

16、634 38)100 100 96 1041.比较几个分类变量有关联的可能性大小的方法(1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.(2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.规律总结规律总结2.独立性检验的一般步骤(1)根据样本数据制成22列联表.(2)根据公式K2=计算K2的观测值k.(3)比较k与临界值的大小关系,作统计推断.2()()()()()n adbcab ac bd cd4-1 (2017广东惠州第三次调研)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1 3,且成绩分布在40,100,分数在80以上(含80)的同学获奖.按文理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如下.(1)求a的值,并计算所抽取样本的平均值(同一组中的数据用该组区间的中点值作代表);(2)填写下面的22列联表,是否有超过95%的把握认为“获奖与学生的文理科有关”?x 文科生理科生合计获奖5 不获奖 合计 200附表及公式:K2=,其中n=a+b+c+d.2()()()()()n adbcab cd ac bdP(K2k)0.150.100.050.0250.0100.0050.001k2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论