4.1成对数据的统计相关性课件高二下学期数学选择性_第1页
4.1成对数据的统计相关性课件高二下学期数学选择性_第2页
4.1成对数据的统计相关性课件高二下学期数学选择性_第3页
4.1成对数据的统计相关性课件高二下学期数学选择性_第4页
4.1成对数据的统计相关性课件高二下学期数学选择性_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章统计

4.1成对数据的统计相关性湘教版

数学

选择性必修第二册课标要求1.理解散点图,会结合散点图直观认识两个变量之间的线性相关性.2.理解样本相关系数的统计含义、计算公式及性质,会通过相关系数比较多组成对数据的相关性.基础落实·必备知识全过关重难探究·能力素养全提升目录索引

成果验收·课堂达标检测基础落实·必备知识全过关知识点1变量间的关系、散点图1.两变量之间的关系:(1)函数关系:两个变量之间具有确定性的对应关系.(2)相关关系:两变量所取的值之间存在着既有某种规律性而又不十分确定的关系.2.相关关系的分类,按变量间的增减性分为正相关和负相关.(1)正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;(2)负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.3.散点图:(1)定义:为了研究两变量之间的关系,将以一个变量的取值为横坐标x,以另一个变量的取值为纵坐标y,建立直角坐标系,则每对数据(x,y)都可在直角坐标系中用一个点表示,这些点称为散点,由坐标系及散点形成的数据图叫作散点图.其作用是粗略判断变量是否线性相关

(2)利用散点图对样本数据作判断的方法:①如果两个变量之间的关系近似地表现为一条直线,则称它们有线性相关关系;②如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则它们就是函数关系.过关自诊1.判断正误.(正确的画“√”,错误的画“×”)(1)相关关系是两个变量之间的一种确定的关系.(

)(2)散点图直观地描述了变量之间的关系形态.(

)(3)若两变量之间是正相关,则从散点图上可以看出两变量之间有相同的变化趋势.(

)×√√2.如果x与y线性相关,那么y与x也线性相关吗?为什么?提示

∵x与y线性相关,∴点(xi,yi)(i=1,2,…,n)大致分布在一条直线附近,则点(yi,xi)(i=1,2,…,n)也大致分布在一条直线附近,故y与x也线性相关.知识点2相关系数为变量x和变量y的相关系数.相关系数具有以下性质:(1)rxy的取值范围是[-1,1].当0<rxy≤1时,称变量x和变量y正相关;当-1≤xxy<0时,称变量x和变量y负相关.(2)|rxy|越接近于1,变量x,y的线性相关程度越高,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.(3)|rxy|越接近于0,变量x,y的线性相关程度越低.(4)rxy具有对称性,即rxy=ryx.(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.名师点睛当rxy>0.8时,变量x和变量y是高度正相关的;当rxy<-0.8时,变量x和变量y是高度负相关的.过关自诊1.判断正误.(正确的画“√”,错误的画“×”)(1)若成对数据(xi,yi)(i=1,2,…,n)构成的点都在一条直线上,则rxy=1.(

)(2)rxy越小,说明两个变量之间的线性相关程度越弱.(

)××2.5个学生的数学成绩和物理成绩如下表:科目ABCDE数学8075706560物理7066656462则数学成绩与物理成绩之间(

)A.是函数关系B.没有相关关系C.具有相关关系,且是正相关D.具有相关关系,且是负相关C解析

作出散点图(图略),从图上可以看出数学成绩和物理成绩具有相关关系,且是正相关.知识点3相关系数与向量夹角1.我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),将向量的每个元素都减去均值,形成两向量分别由观测数据的横坐标与纵坐标构成

该公式本质上就是相关系数公式

2.两向量的夹角与数据之间的相关性:(1)当<a,b>∈[0,)时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度

,余弦值越小表示两个向量的夹角越大,两组数据的正相关程度

.

(2)当<a,b>∈(,π]时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度

,余弦值越小表示两个向量的夹角越大,两组数据的负相关程度

.

(3)当<a,b>=时,余弦值为0,说明两组数据

.

越高

越低越低越高

不相关过关自诊当样本点(xi,yi)(i=1,2,3,…,n)都在一条直线上时,如何用向量夹角刻画其相关程度?重难探究·能力素养全提升探究点一两变量之间的关系【例1】

(多选题)下列两个变量具有相关关系且不是函数关系的是(

)A.圆的半径与面积B.平均日学习时间和平均学习成绩C.人的身高与体重D.人的身高与视力BC解析

由圆的面积公式知S=πr2,故A不符合题意;平均日学习时间与平均学习成绩是相关关系且不是函数关系,故B符合题意;人的身高会影响体重,故有相关关系,但身高与体重间无函数关系,故C符合题意;人的身高与视力无任何关系,故D不符合题意.故选BC.规律方法

(1)相关关系可以理解为两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度.(2)相关关系与函数关系的异同点:①相同点:均是指两个变量的关系.②不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系.相关关系中两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响.变式训练1(多选题)从统计学的角度看,下列关于变量间的关系说法正确的是(

)A.人体的脂肪含量与年龄之间没有相关关系B.汽车的重量和汽车每消耗1L汽油所行驶的平均路程负相关C.单位土地面积上粮食的产量为常数时,土地面积与粮食总产量不是相关关系D.气温与热饮销售好不好正相关BC解析

从统计学的角度看:在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,故A错误;汽车的重量和汽车每消耗1

L汽油所行驶的平均路程是负相关关系,故B正确;单位土地面积上粮食的产量为常数时,土地面积与粮食总产量是函数关系,故C正确;气温与热饮销售好不好是负相关关系,故D错误.故选BC.探究点二散点图的应用【例2】

某公司2017~2022年的年利润x与年广告支出y的统计资料如表所示:年份201720182019202020212022利润x/百万元12.214.6161820.422.3支出y/百万元0.620.740.810.8911.11判断x与y是否线性相关.若是线性相关,试判断是正相关还是负相关?解

作出散点图(图略),由散点图可知,各点分布在一条直线附近,故x与y之间线性相关,且y随x的增加呈现增加的趋势,是正相关.规律方法

判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的.注意不要受个别点的位置的影响.变式训练2对变量x,y由观测数据得散点图(1),对变量y,z由观测数据得散点图(2).由这两个散点图可以判断(

)A.变量x与y正相关,y与z正相关B.变量x与y正相关,y与z负相关C.变量x与y负相关,y与z正相关D.变量x与y负相关,y与z负相关C解析

通过观察散点图可以知道,y有随x的增大而减小的趋势,x与y负相关,z有随y的增大而增大的趋势,y与z正相关.探究点三相关系数角度1.相关系数的理解【例3】

对两个变量x,y进行线性相关检验,得线性相关系数rxy=0.7859,对两个变量u,v进行线性相关检验,得线性相关系数ruv=-0.9568,则下列判断正确的是(

)A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强C解析

由线性相关系数rxy=0.785

9>0知x与y正相关,由线性相关系数ruv=-0.956

8<0知u,v负相关,又|rxy|<|ruv|,∴变量u与v的线性相关性比x与y的线性相关性强.故选C.规律方法

根据两变量间的相关系数判断两变量相关性的方法根据线性相关系数的正负判断两变量正负相关性,根据线性相关系数的绝对值大小判断两变量相关性的强弱.一般地,相关系数绝对值越大,线性相关性越强.变式训练3变量x,y的线性相关系数为rxy,变量m,n的线性相关系数为rmn,下列说法错误的是(

)A.若|rxy|=0.96,则说明变量x,y之间线性相关性强B.若rxy>rmn,则说明变量x,y之间的线性相关性比变量m,n之间的线性相关性强C.若0<rxy<1,则说明变量x,y之间的相关性为正相关D.若rxy=0,则说明变量x,y之间不存在线性相关关系B解析

∵|rxy|=0.96接近于1,∴变量x,y之间的线性相关性强,故A选项正确;若rxy=0.8,rmn=-0.9,满足rxy>rmn,但是不能说明变量x,y之间的线性相关性比变量m,n之间的线性相关性强,故B选项错误;当0<rxy<1时,变量x,y之间的相关性为正相关,故C选项正确;当rxy=0时,变量x,y之间不存在线性相关关系,故D选项正确.故选B.角度2.相关系数的计算【例4】

为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序x12345678零件尺寸y9.9510.129.969.9610.019.929.9810.04抽取次序x910111213141516零件尺寸y10.269.9110.1310.029.2210.0410.059.95(1)求y与x的样本相关系数rxy,并回答是否可以认为这一天生产的零件的尺寸不随生产过程的进行而系统地变大或变小(若|rxy|<0.2,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).这条生产线在这一天的生产过程中可能出现了异常情况,需对当天生产的所有零件进行检查.从这一天抽检的结果看,是否需对当天生产的所有零件进行检查?由于|rxy|<0.2,因此可以认为这一天生产的零件的尺寸不随生产过程的进行而系统地变大或变小.规律方法

样本相关系数的计算方法求样本相关系数首先要明确样本相关系数的计算公式.由于样本相关系数的计算公式有两个,因此要选择恰当的公式求解.此类问题由于涉及的计算量较大,因此题目中会给出部分数据,可以结合题目中给出的数据特征选择公式求解.变式训练4某地市响应“节能减排,低碳生活”的号召,近5年来开展一系列的措施控制碳排放.环保部门收集到这5年内新增碳排放数量,表中x代表年份,y代表新增碳排放量.x12345y6.15.24.943.8求相关系数,并分析x与y之间是否具有较强的线性相关性.因为0.8<|rxy|<1,所以x与y之间具有较强的线性相关性.本节要点归纳1.知识清单:(1)散点图;(2)相关系数;(3)多组成对数据的相关性;(4)相关系数与向量夹角.2.方法归纳:利用散点图判断两变量之间的关系;利用n个成对观测数据的相关系数公式求相关系数,并根据相关系数的值判断两变量之间相关关系的强弱;利用n个成对观测数据(xi,yi)(i=1,2,3,…,n)构成的向量(x1,x2,…,xn),(y1,y2,…,yn)的夹角的大小判断两变量之间的相关关系.3.特别提示:利用散点图不能准确反映两变量之间的相关关系,计算相关系数时要注意准确计算,由相关系数的正负确定两变量之间的正负相关性,由相关系数的绝对值的大小确定变量相关性的强弱.成果验收·课堂达标检测1234567891011121314A级必备知识基础练1.对两个变量y与x进行相关性研究,分别选择不同的模型,它们的相关系数rxy如下,其中拟合效果最好的模型是(

)①模型Ⅰ的相关系数rxy为-0.90;②模型Ⅱ的相关系数rxy为0.80;③模型Ⅲ的相关系数rxy为-0.50;④模型Ⅳ的相关系数rxy为0.25.A.Ⅰ

B.Ⅱ

C.Ⅲ

D.ⅣA解析

因为|r|越趋近于1,相关性越强,模型拟合效果越好,所以拟合效果最好的模型是Ⅰ.故选A.12345678910111213142.观察下列散点图,其中两个变量的相关关系判断正确的是(

)A.a为正相关,b为负相关,c为不相关B.a为负相关,b为不相关,c为正相关C.a为负相关,b为正相关,c为不相关D.a为正相关,b为不相关,c为负相关D12345678910111213143.在下列4组样本数据的散点图中,样本相关系数最大的是(

)A.r1

B.r2

C.r3

D.r4A解析

由散点图变化趋势可知,r1>0,r3>0,r2<0,r4<0,又r1对应的图中的散点更集中,更接近于一条直线,所以r1>r3,故样本相关系数最大的是r1.故选A.12345678910111213144.如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一,根据图中所有数据,得到相关系数为r1;方案二,剔除点(10,21),根据剩下数据得到相关系数为r2,则(

)A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0D解析

根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值.方案一中,没剔除离群值,线性相关性弱些,是负相关;方案二中,剔除离群值,线性相关性强些,也是负相关,所以相关系数-1<r2<r1<0.故选D.12345678910111213145.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为(

)B解析

因为过点(1,2),(2,0)的直线的斜率为k==-2,所以过点(1,2),(2,0)的直线的方程为y=-2(x-2),即y=4-2x,经检验点(4,-4),(-1,6)都在直线y=4-2x,所以y与x是函数关系,又因为y随x的增大而减小,所以y与x的相关系数为-1.故选B.12345678910111213146.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9),其变量间的相关系数为r2.r1,r2的大小关系为

.

r1>r2解析

由第1组数据可知,两变量间是正相关,故r1>0,由第2组数据可知,两变量间是负相关,故r2<0,故r1>0>r2.12345678910111213147.近年来,随着社会对教育的重视,家庭的平均教育支出增长较快.随机抽样调查某市2015~2021年的家庭平均教育支出,得到如下折线图.(附:年份代1234567891011121314(1)求出相关系数rty(精确到0.01);(2)若相关系数|r|∈[0.8,1]时相关性较强,|r|∈[0.2,0.8]时相关性一般,|r|∈[0,0.2]时相关性较弱,请指出t与y是哪一层次的相关性.1234567891011121314(2)由于0.88∈[0.8,1],因此t与y的相关性较强.12345678910111213148.为比较相关变量的线性相关程度,5位同学各自研究一组数据,并计算各自数据的横纵坐标构成的两个向量夹角的余弦值,如下表所示:同学甲乙丙丁戊夹角余弦值0.45-0.690.74-0.980.82由表可知(

)A.乙研究的那组数据线性相关程度最低,戊研究的那组数据线性相关程度最高B.甲研究的那组数据线性相关程度最低,丁研究的那组数据线性相关程度最高C.乙研究的那组数据线性相关程度最低,丁研究的那组数据线性相关程度最高D.甲研究的那组数据线性相关程度最低,丙研究的那组数据线性相关程度最高B级关键能力提升练B12345678910111213149.(多选题)为了检验变量x与y的线性相关程度,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的相关系数为rxy,则下列说法错误的是(

)A.若所有样本点都在直线y=-2x+1上,则rxy=1B.若所有样本点都在直线y=-2x+1上,则rxy=-1C.若|rxy|越大,则变量x与y的线性相关程度越强D.若|rxy|越小,则变量x与y的线性相关程度越强AD解析

若所有样本点都在直线y=-2x+1上,且直线斜率为负数,则rxy=-1,故A说法错误,B说法正确;若|rxy|越大,则变量x与y的线性相关程度越强,故C说法正确,D说法错误.故选AD.123456789101112131410.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线

上,则n维空间的两向量(x1,x2,…,xn),(y1,y2,…,yn)的夹角的余弦值为(

)D解析

由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+2上,∴这组样本数据有函数关系,故其相关系数为1,因此两向量同向共线,所以向量的夹角为0,其余弦值为1.故选D.123456789101112131411.(多选题)下面的各图中,散点图与相关系数r符合的是(

)ACD1234567891011121314解析

对于A,变量x,y组成的点在一条斜率小于0的直线上,所以相关系数r=-1,故A正确;对于B,变量x,y组成的点在一条斜率大于0的直线上,所以相关系数r=1,故B错误;对于C,变量x,y的散点图从左到右是向下的带状分布,所以相关系数-1<r<0,故C正确;对于D,变量x,y的散点图中,x,y之间的样本相关关系非常不明显,所以相关系数r最接近0,D正确.应选ACD.123456789101112131412.对下面这组数据:x12341011y1335111计算相关系数,大概在0.5左右.对这组数据大部分点来说,x与y之间有很强的线性相关关系.是什么因素导致相关系数只有0.5左右?解

根据x,y作出散点图.这组数据中共6对数据,第1,2,3,4,6对数据相关性很强,这几对数据对应的点几乎在一条直线附近,而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论