




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《8.1成对数据的相关关系》教案
【教材分析】
本节课选自《2019人教A版高中数学选择性必修第三册》,第七章《随机变量及其分布
列》,本节课主本节课主要学习成对数据的相关关系
本章主要学习统计方面知识,在之前学生已经对统计相关的知识做了大概的了解,本节学
生要继续探讨的是变量之间的相关关系,变量之间有两类关系;函数关系和相关关系,它
们的联系与区别;并了解线性相关及相关系数,为了解线性回归的基本思想和方法以及求
回归直线的方程和相关性检验做准备。
【教学目标与核心素养】
课程目标学科素养
A.理解两个变量的相关关系的概念;1.数学抽象:相关关系
B.会作散点图,并利用散点图判断两个变量之间是2.逻辑推理:相关系数公式推导
否具有相关关系;3.数学运算:求相关系数
D.会根据相关系数判断两个变量的相关程度.4.数学建模:模型化思想
【重点与难点】
重点:相关关系的概念及利用散点图判断两个变量之间是否具有相关关系
难点:根据相关系数判断两个变量的相关程度
【教学过程】
教学过程教学设计
一、问题导学
我们知道,如果变量y是变量工的函数,那么由X就可以唯一确定y.
然而,现实世界中还存在这样的情况:两个变量之间有关系,但密切程
度又达不到函数关系的程度.例如,人的体重与身高存在关系,但由一
个人的身高值并不能确定他的体重值,那么,该如何刻画这两个变量通过具体的问题情
之间的关系呢?下面我们就来研究这个问题.境,引发学生思考
二、探究新知积极参与互动,说
我们知道,一个人的体重与他的身高有关系,一般而言,个子高的人往出自己见解。从而
往体重值较大,个子矮的人往往体重值较小,但身高并不是决定体重引入相关关系的概
的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传念,发展学生逻辑
因素等也是影响体重的重要因素,像这样,两个变量有关系,但又没有推理、数学运算、
确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相数学抽象和数学建
关关系(correlation).模的核心素养。
两个变量具有相关关系的事例在现实中大量存在,例如:
1.子女身高y与父亲身高x之间的关系,一般来说,父亲的个子高,其
子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮,但影
响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮
食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.
2.商品销售收人y与广告支出x之间的关系,一般来说,广告支出越
多,商品销售收入越高,但广告支出并不是决定商品销售收入的唯一
因素,商品销售收入还与商品质量、居民收入等因素有关。
3.空气污染指数y与汽车保有量x之间的关系,一般来说,汽车保有
量增加,空气污染指数会上升,但汽车保有量并不是造成空气污染的
唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等
都是影响空气污染指数的因素。
4.粮食亩产量y与施肥量x之间的关系,在一定范围内,施肥量越大,
粮食亩产量就越高,但施肥量并不是决定粮食亩产量的唯一因索,粮
食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影
响。
变量的相关关系
相关关系是一种不确定性关系;相关关系是相对于函数关系而言的.
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确
地决定另一个的程度,这种关系称为相关美系、
相关关系与函数关系的异同点
关系函数关系相关关系
项目
相同点都是两个变量间的关系
不同点是一种确定关系是一种非确定关系
是一种因果关系不一定是因果关系,也可能是伴
随关系
1.下列关系是相关关系的是_______.(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
②③解析:利用相关关系的概念进行判断.①④中两个变量之间
的关系是一种确定性关系,而②③中的两个变量之间的关系是不确
定的,所以它们具有相关关系.
探窕1:在对人体的脂肪的含量和年龄之间关系的研究中,科研人员
获得了一些年龄和脂肪含量的简单P逍机样本数据,如表所示,表中每
个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构
成了成对数据。
编号1234567
年龄23273941454950
脂肪9.517.821.225.927.526.328.2
编号891011121314
年龄53545657586061
脂肪29.630.231.430.833.535.234.6
根据以上数据,你能推新人体的脂肪含量与年龄之间存在怎样的关系通过问题分析,让
吗?学生掌握判断相关
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了关系与函数关系的
统计图.我们我们把这样的统计图叫做散点图区别与联系。发展
学生逻辑推理,直
40
35
观想象、数学抽象
30
25
和数学运算的核心
20
15
10素养。
5
O
1
由散点图可以发现,这些散点大致落在一条从左下角到右上角的直
线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.
这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和
年龄变量之间存在着相关关系.
变量相关关系的分类
(1)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也
呈现增加的趋势,
我们就称这两个变量正棉关、当一个变量的值增加时,
另一个变量的相应值也呈现减少的趋势,称这两个变量线棚关、
正相关:根据样本数据所作得散点图中,若点散布在从左下角到右
上角的区域。对于两个变量的这种相关关系,我们称之为正相关。
负相关:根据样本数据所作得散点图中,若点散布在从左上角到右
下角的区域。对于两个变量的这种相关关系,我们称之为负相关。
①线性相关:散点图是描述成对数据之间关系的一种直观方法.一般
地,如果两个变量的取值呈现正相关或负相关,而且散点落在一一
条直线附近,我们就称这两个变量线性相关;
O
5
O
1
年龄/岁
②非线性相关:一般地,如果两个变量具有相关性,但不是线性相
关,那么我们就称这两个变量非线性相关或曲线相关.
X兄
1212
1010
8」・8.
6,
6••,.
4.•・•4*:.
22,
°0246810121,4i002468101214X
(2)(3)
探究2.通过观察散点图中成对样本数据的分布规律,我们可以大致
推断两个变量是否存在相关关系、是正相关还是负相关、是线性相
关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本
数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否
像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入
一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析
呢?通过具体的问题情
境中的分析,深化
对于变量X和变量y,设经过随机抽样得到的成对数据为对相关系数的理
(x,y),(x,y),(x,y),解。发展学生逻辑
1122nn
推理,直观想象、
।eq,-_尤1+&+…+Xn__月+丫2+…+%
Xn/n
数学抽象和数学运
将数据以(元力为零点进行平移,得到平移后的成对数据为:
算的核心素养。
(%1-元月-y),(x2-x,y2-y),…,(xn-x,yn-y)
绘制散点图为
40f脂肪含量/%>
35
30
25
20
15
10
5
O
1
20253035404550556065年龄/岁
这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵
坐标同号,显然,这样的规律是由人体脂肪含量与年龄正相关所决定
的。
探究3:根据上述分析,你能利用正相关变量和负相关变量的成对样
本数据平移后星现的规律,构造一个度量成对样本数据是正相关还是
负相关的数字特征吗?
根据散点图特征,初步构造统计量.利用散点(%-元-y),。=
1,2,...n)的
横纵坐标是否同号,可以构造一个量
4=:[(x「x)(x-小12-x)(%-y)+…+(x“-X)(y“-y)]
一般情形下,L>0表明成对样本数据正相关;L<0表明成对样本数
xyxy
据负相关.
问题1:L的大小一定能度量出成对样本数据的相关程度吗?
xy
我们发现,L的大小与数据的度量单位有关,所以不能直接用它度
xy
量成对样本数据相关程度的大小.
“以叫-叫(3-州岭-叫(左肛”由叭-叫值班t吗
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高
单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程
度.
为了消除单位的影响,进一步做“标准化”处理为简单起见,把上述
“标准化”处理后的成对数据分别记为
(xJ%'),(X2','),…,(Xn',yn')
仿照L的构造,可以得到
xy
4KI;)(弘切+12:)(%切+…+(%-,(以切]
分别除%-元和%-双i=1,2,3,…,n)得
(石一文。]一3、(%2一%力一g)一%Pn一歹]
f1
ISN,SyXS%SySxSy)
rin
用Sx='W®_三)2,Sy=,W(%_^2
Ji=l[i=l
样本相关系数r是一个描述成对样本数据的数字特征,
它的正负和绝对值的大小可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另
一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据
的值通常也变大。
当r<0时,称成对样本数据负相关;当其中一个数据的值变小时,另
一个数据的值通常会变大:当其中一个数据的值变大时,另一个数据通过典型例题的分
的值通常会变小。析解决,提升学生
样本相关系数对相关系数的理解
和运用。发展
ExiVi-n^y
j=l_学生逻辑推理,直
*x「-nx*y「-ny观想象、数学抽象
i=lYi=l
和数学运算的核心
我们称r为变量x和变量y的样本相关系数.
素养。
样本相关系数r的取值范围为[T,1],样本相关系数r的绝对值大
小可以反映成对样本数据之间线性相关的程度:
当Ir越接近1时,成对样本数据的线性相关程度越强;
当Ir越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中
于某条直线的程度.当r=0
时,只表明成对样本数据间没有线性相关关系,但不排除它们之间
有其他相关关系.
3
2
E-0.05
(4)
二、典例解析
例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线
性相关,计算样本相关系数,并推断它们的相关程度.
年龄23273941454950
脂肪9.517.821.225.927.26.28.
532
年龄53545657586061
脂肪29.30.231.430.833.35.34.
6526
参考数据:
_141414
x«48.07,SX27.26,Z天为=19403.2,2=34181,^y,2=11051.77
i=li=li=l
解:先画出散点图,如右图所示观察散点图,
可以看出样本点都集中在一条直线附近,
由此推断脂肪含量和年龄线性相关.
40
35
30
25
20
15
10
5
0
1
1414
E(xi-^)(yi-y)^XjYi-Uxy
••f—i=l—
请(力同摩行辱2
-14y2
图xE
19403.2-14x48.07X27.26
«0.97
V34181-14x48.072XV11051.77-14x27.262
由样本相关系数r^O.97,可以推断脂肪含量和年龄这两个变量正线
性相关,且相关程度很强。脂肪含量与年龄变化趋势相同
归纳总结
1.线性相关系数是从数值上来判断变量间的线性相关程月乏,是定量
的方法.与散点图相比较,线性相关系数要精细得多,需要注意的
是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一
定不相关,可能是非线性相关.
2.利用相关系数r来检验线性相关显著性水平时,通常匕30.75作
比较,若>0.75,则线性相关较为显著,否则不显著.
例2.有人收集了某城市居民年收入(所有居民在一年内收:入的总
和)与A商品销售额的10年数据,如表所示.画出散点图,判断成对
样本数据是否线性相关,并通过样本相关系数推断居民年收入与A
商品销售额的相关程度和变化趋势的异同.
第n1
123456789
年0
居民
年收3132353734444
32.238
入/亿.1.9.8.193.66
元
A商445
品销303437394124481
25.0
售额/.0.0.0.0.0.0
万元000
解:从散点图看,A商品销售额与居民年收入的样本数据呈现线性
相关关系.
x=38,y=39,
101010
Zxj2=14665,=15835,2xjj=15170,
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体
重、臂展等数据,如下表所示.
解:通过计算得到体重与身高、臂展与身高的样本相关系数分别约为
0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.
■■■■E■•on・号E«>•H
161
1171l«9U1"
217971170ISI7«IM
317517216I7S145
4179ITf17ITS173
IC?82mIBl«91«2
6173IM19IM189
?ISOSS174149IM
8170811«9182l70
9l*»S4IM]7t164
10177M17<1”173
11in69170173ICS
1217B«7inI1731<9
13174170
体重与身高、臂展与身高分别具有怎样的相关性?
跟踪训练1.由于往届高三年级数学学科的学习方式大都是“刷题一
一讲题一一再刷题”的模式,效果不理想.某市一中的数学课堂教
改采用了“记题型一一刷题一一检测效果”的模式,并记录了某学
生的记题型时间1(单位:h)与检测效果y的数据如表所示.
t123456r
r93.33.64.44.85.2j.9
据统计表明,y与t之间具有线性相关关系,请用相关系数r加以
说明(若|r|20.75,则认为y与t有很强的线性相关关系,否则认
为没有很强的线性相关关系).
参考公式及数据:相关系数==
n______
Z(ti-t)(yi-y)
3—y尸
=7.08,Z(ti-t)(yi-y)=14,[198.24^14.08.
i=l
1+2+3+4+5+6+7
解:由题得t==4,
7
X(t.-t产=9+4+1+0+1+4+9=28,
i=l
3060
2550
40
1530
102叶••
510p,
01234567%01234567〃
图1图2
A.x与y正相关,u与v正相关B.x与y正相关,u与v负相关
C.x与y负相关,u与v正相关D.x与y负相关,u与v负相关
C解析:由题图1可知,点散布在从左上角到右下角的区域,各点
整体呈递减趋势,故x与y负相关;
由题图2可知,点散布在从左下角到右上角的区域,各点整体呈递
增趋势,故u与v正相关.
4.在建立两个变量y与x的回归模型中,分别选择了4个不同模
型,它们的相关系数r有如下四个选项,其中拟合得最好的模型为
()
A.模型1的相关系数r为0.75
B.模型2的相关系数r为0.55
C.模型3的相关系数r为。.25
D.模型4的相关系数r为0.90
D解析:D中相关系数r的绝对值最接近1,相关性最强,故选D.
5.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用
y(单位:万元)有如下统计资料:
X23456
y2.23.85.56.57.0
已知»;=90,23弋140.8,2>佻=112.3,乖七8.9,小
比1.4.
⑴求x,y;
(2)对x,y进行线性相关性检验.
2+3+4+5+6
解:⑴x
—2.2+3.8+5.5+6.5+7.0
y-5f
5______
(2)Xxiyi-5-7=112.3—5X4X5=12.3,
i=l
5_
Zx:-5x2=90—5X42=10,
i=j
5_
Xy?~5y2=140.8-125=15.8,
i=l
12.312.312.3八…
所以rt1—i—I—〜0.987.
^/10X15.8寸158
所以有把握认为x与y之间具有线性相关关系,去求回归直线方程
是有意义的.
四、小结
判断变量的相关性通常有两种方式:通过总结,让学生
1.散点图;
进一步巩固本节所
2.相关系数r,
学内容,提高概括
前者只能粗略地说明变量间具有相关性,而后者可以从定量的角度
能力。
分析变量相关性的强弱.
【教学反思】
课后通过对教学过程的反思与研究,才能不断完善教学设计中的不足,才能提升教材分析
的能力和课堂教学实效.
1.多元展示,多方评价.在教学过程中我借问题牵引,保证了课堂教学的顺利实施;而在
整个过程中,我对学生所作练习、疑问及时解析评价;学生之间、小组之间的互相评价补
充,使学生共享成果分享喜悦,坚定了学好数学的信念,实现了预期目标.
2.创造性的使用教材.有别于教材,我在教学中,让学生考察了分别考察了两类题型之后
再引导学生进行归纳,这样更贴近学生的认知水平,学生课后反馈,效果较为理想.
<8.1成对数据的相关关系》导学案
【学习目标】
1.理解两个变量的相关关系的概念;
2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系;
3.会根据相关系数判断两个变量的相关程度.
【重点与难点】
重点:相关关系的概念及利用散点图判断两个变量之间是否具有相关关系
难点:根据相关系数判断两个变量的相关程度
【知识梳理】
1.变量的相关关系
相关关系是一种不确定性关系;相关关系是相对于函数关系而言的.
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,
这种关系称为相关关系、
相关关系与函数关系的异同点
关系函数关系相关关系
项目
相同点都是两个变量间的关系
不同点是一种确定关系是一种非确定关系
是一种因果关系不一定是因果关系,也可能是伴随关系
2.散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们
我们把这样的统计图叫做散点图。
3.正相关与负相关
(1)正相关:根据样本数据所作得散点图中,若点散布在从左下角到右上角的区域。对于
两个变量的这种相关关系,我们称之为正相关。
(2)负相关:根据样本数据所作得散点图中,若点散布在从左上角到右下角的区域。对于
两个变量的这种相关关系,我们称之为负相关。
3.线性相关与非线性相关
①线性相关:散点图是描述成对数据之间关系的一种直观方法.一般地,如果两个变量的取
值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关;
但不是线性相关,那么我们就称这两个
变量非线性相关或曲线相关.
y
12
1010
88•,.
66••,.
44':.
22,
002468101214x002468101214x
(2)(3)
4.样本相关系数
我们称r为变量x和变量y的样本相关系数.
1.下列关系是相关关系的是.(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【学习过程】
一、问题探究
我们知道,如果变量y是变量工的函数,那么由x就可以唯一确定y.然而,现实世界中还存
在这样的情况:两个变量之间有关系,但密切程度又达不到函数关系的程度.例如,人的体重
与身高存在关系,但由一个人的身高值并不能确定他的体重值,那么,该如何刻画这两个变量
之间的关系呢?下面我们就来研究这个问题.
我们知道,一个人的体重与他的身高有关系,一般而言,个子高的人往往体重值较大,个子矮
的人往往体重值较小,但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻
炼、睡眠时间以及遗传因素等也是影响体重的重要因素,像这样,两个变量有关系,但又没有
确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(correlation).
两个变量具有相关关系的事例在现实中大量存在,例如:
1.子女身高y与父亲身高x之间的关系,一般来说,父亲的个子高,其子女的个子也会比较
高;父亲个子矮,其子女的个子也会比较矮,但影响子女身高的因素,除父亲身高外还有其他
因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.
2.商品销售收人y与广告支出x之间的关系,一般来说,广告支出越多,商品销售收入越高,
但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质量、居民收入等
因素有关。
3.空气污染指数y与汽车保有量x之间的关系,一般来说,汽车保有量增加,空气污染指数会
上升,但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活
和取暧、垃圾焚烧等都是影响空气污染指数的因素。
4.粮食亩产量y与施肥量x之间的关系,在一定范围内,施肥量越大,粮食亩产量就越高,但
施肥量并不是决定粮食亩产量的唯一因索,粮食亩产量还要受到土壤质量、降水量、田间管
理水平等因素的影响。
探究1:在对人体的脂肪的含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪
含量的简单随机样本数据,如表所示,表中每个编号下的年龄和脂肪含量数据都是对同一个
体的观测结果,它们构成了成对数据。
编号1234567
年龄23273941454950
脂肪9.517.821.225.927.526.328.2
编号891011121314
年龄53545657586061
脂肪29.630.231.430.833.535.234.6
根据以上数据,你能推新人体的脂肪含量与年龄之间存在怎样的关系吗?
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们我们把这样
的统计图叫做散点檄
40
35
30
25
20
15
10
5
O
1
20253035404550556065年龄/岁
由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值
的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以
推断脂肪含量变量和年龄变量之间存在着相关关系.
变量相关关系的分类
(D正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,
我们就称这两个变量正相关、当一个变量的值增加时,
另一个变量的相应值也呈现减少的趋势,称这两个变量徽相美•.
探究2.通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在
相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法
确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像
引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特
征”,对成对样本数据的相关程度进行定量分析呢?
对于变量x和变量y,设经过随机抽样得到的成对数据为(x,y),(x,y),…,(x,y),
1122nn
甘木一X1+X2+…+Xn_y+y+-+y
具中x=------------2,y=2------n-------
nn
将数据以区刃为零点进行平移,得到平移后的成对数据为:
X
(1-x,yi-y),(x2-X,y2-y),..(xn-x,yn-y)
绘制散点图为
40
35
30
25
20
15
10
5
O
1
平移
这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号,显然,这样的
规律是由人体脂肪含量与年龄正相关所决定的。
探究3:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后星现的规
律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
根据散点图特征,初步构造统计量.利用散点(方-又)物-刃,。=L2,...n)的
横纵坐标是否同号,可以构造一个量
4=:[(*「司(弘5)+12-,(%…+(X"G)(y.J)]
一般情形下,L>0表明成对样本数据正相关;L〈0表明成对样本数据负相关.
xyxy
问题1:L的大小一定能度量出成对样本数据的相关程度吗?
xy
我们发现,L的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程
xy
度的大小.
451啊网伉一。中叫10虱(程-Ji心叫一叫(玛->•)]=叫
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位
的改变不会改变体重与身高之间的相关程度.为了消除单位的影响,进一步做“标准化”处
理为简单起见,把上述“标准化”处理后的成对数据分别记为
(Xi',yi'),(X2',y2'),...,(Xn',yn')
仿照L的构造,可以得到
xy
4=:[(*「今(弘~)+127)(%7)+・+(07)(人7)]
分别除x「天和%—y(i=1,2,3…,n)得(号,号),(军,号),…,(甘,号)
1..................£(xi-x)(yi-y)国尸酉
1-11_1
r=;XJ+x2y2+…+X"£,)=In_2In_2=下=_2In-----------
酊-x)卧T唇"nx"ny
样本相关系数r是一个描述成对样本数据的数字特征,
它的正负和绝对值的大小可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另一个数据的值通常也变
小;当其中一个数据的值变大时,另一个数据的值通常也变大。
当「〈0时・,称成对样本数据负相关;当其中一个数据的值变小时,另一个数据的值通常会变
大:当其中一个数据的值变大时,另一个数据的值通常会变小。
样本相关系数r的取值范围为[T,1],样本相关系数r的绝对值大小可以反映成对样本数
据之间线性相关的程度:
当越接近1时,成对样本数据的线性相关程度越强;
当S越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当
r=0
时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
-3«--------------・・一
-4-2024x
n=0.24
(3)
二、典例解析
例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系
数,并推断它们的相关程度.
年龄23273941454950
脂肪9.517.821.225.927.526.328.2
年龄53545657586061
脂肪29.630.231.430.833.535.234.6
参考数据:
__141414
2
x«48.07,y«27.26,£xiyi=19403.2,=34181,=11051.77
/=!/=1i=l
1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比
较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性
相关程度低,但不一定不相关,可能是非线性相关.
2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若[r|>0.75,则
线性相关较为显著,否则不显著.
例2.有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10
年数据,如表所示.画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推
断居民年收入与A商品销售额的相关程度和变化趋势的异同.
第n年12345678910
居民年收入/亿
32.231.132.935.837.138394344.646
元
A商品销售额/万
25.030.034.037.039.041.042.044.048.051.0
元
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表
所示
[体重/kg曾展/cm
90-----------190
85-----------185
180
175
170
165
160
155
165170175180185
185身高/cm
(1)
体重与身高、臂展与身高分别具有怎样的相关性?
跟踪训练1.由于往届高三年级数学学科的学习方式大都是“刷题一一讲题一一再刷题”的
模式,效果不理想.某市一中的数学课堂教改采用了“记题型一一刷题——检测效果”的
模式,并记录了某学生的记题型时间t(单位:h)与检测效果y的数据如表所示.
t1234567
y2.93.33.64.44.85.25.9
据统计表明,y与t之间具有线性相关关系,请用相关系数r加以说明(若Irl'O.75,则
认为y与t有很强的线性相关关系,否则认为没有很强的线性相关关系).
E(ti-t)(yi-y)
i=1——
参考公式及数据:相关系数r=/,y=4.3,工
A/E(tLt)、/(y.-y)2i=l
(yi—y)'=7.08,g(ti—t)(yi—y)=14,4198.24=14.08.
i=l
【达标检测】
1.判断(正确的打“J”,错误的打“X”).
(1)变量之间只有函数关系,不存在相关关系.()
(2)两个变量之间产生相关关系的原因受许多不确定的随机因素的影响.()
(3)两个变量的相关系数越大,它们的相关程度越强.()
(4)若相关系数r=0,则两变量x,y之间没有关系.()
2.下列各图中所示的两个变量具有相关关系的是()
3.对变量x,y有观测数据(xi,yj(i=l,2,3,…,10),得散点图1;对变量u,v有观测
数据(u、,v)(i=l,2,3,…,10),得散点图2,由这两个散点图可以断定()
30
25
20
15
10
5
01234567%
图1图2
A.x与y正相关,u与v正相关B.x与y正相关,u与v负相关
C.x与y负相关,u与v正相关D.x与y负相关,u与v负相关
4.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r有
如下四个选项,其中拟合得最好的模型为()
A,模型1的相关系数r为0.75
B.模型2的相关系数r为0.55
C.模型3的相关系数r为0.25
D.模型4的相关系数r为0.90
5.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统
计资料:
X23456
y2.23.85.56.57.0
5
已知Zx:=90,〉'沁140.8,Zx,y;=112.3,乖48.9,正%1.4.
⑴求x,y;
(2)对x,y进行线性相关性检验.
【课堂小结】
判断变量的相关性通常有两种方式:
1.散点图;
2.相关系数r,
前者只能粗略地说明变量间具有相关性,而后者可以从定量的角度分析变量相关性的强
弱.
【参考答案】
知识梳理
1.②③解析:利用相关关系的概念进行判断.①④中两个变量之间的关系是一种确定性
关系,而②③中的两个变量之间的关系是不确定的,所以它们具有相关关系.
学习过程
一、问题探究
探究1:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们我
们把这样的统计图叫做散点图
40
35
30
25
20
15
10
5
O
1
问题1:我们发现,Lxy的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据
相关程度的大小.
1a1a
4=口。映矶K必-i叫仙J)+TGTA矶匕->)]1吗
二、典例解析
例1.解:先画出散点图,如右图所示观察散点图,
可以看出样本点都集中在一条直线附近,
由此推断脂肪含量和年龄线性相关.
40
35
30
25
20
15
10
5
0
1
14__14―
斗^XjYi-Uxy
必;;4胃岗1时
Vi=lVi=l
19403.2-14x48.07x27.26
'〜V34181-14X48.072XV11051.77-14x27.262〜'
由样本相关系数r^O.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很
强。脂肪含量与年龄变化趋势相同.
归纳总结
例2.解:从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
x=38,y=39,
101010
Zxi?=14665,捷2=15835,=15170,
i=li=1i=1
x0.95
例3.解:通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都
为正相关.其中,臂展与身高的相关程度更高.
普展/cm
190
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机织物的性能与运动服要求考核试卷
- 体育会展物流与供应链管理优化考核试卷
- 国际物流与跨境交通运输考核试卷
- 矿业信息安全培训课件
- 服务可持续性考核试卷
- 信托项目的合同管理与履行考核试卷
- 电子垃圾回收利用项目投资合同
- 工程项目担保合同
- 国际融资租赁合同
- 中学生阅读后的思考征文
- 2023年第27届希望杯〞八年级全国数学邀请赛试卷与参考答
- 世界著名童话故事英文绘本故事丑小鸭
- 四年级科学下册课件 第四课 河流和湖泊 冀人版 25张
- 绿色简约墙体商务风PPT模板
- GB/T 462-2003纸和纸板水分的测定
- QC演示:提高检查井周边密实度
- 年度应急演练计划表
- 英语板书设计(课件)
- 智能中台数据底座解决方案
- 《财政与金融》课程教学大纲
- 《国际税收》教案
评论
0/150
提交评论