高中数学统计案例§2成对数据的线性相关性学案_第1页
高中数学统计案例§2成对数据的线性相关性学案_第2页
高中数学统计案例§2成对数据的线性相关性学案_第3页
高中数学统计案例§2成对数据的线性相关性学案_第4页
高中数学统计案例§2成对数据的线性相关性学案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

12nniiiiiiii12nniiiiiiii§2

成数的性关2.1相系数2.2成数据的线性相关性分析学习任务

核心素养了解两个随机变间的线性相关系数r能用公式1通过相关系数、正相关、负求出相关系数r.重点).了解正相关、负相关、不相关的概念.

相关等概念的学习养学抽象素养.能利用相关系数r判两个随机变量间线性相关程度,.借助相关系数r的用,提从而判断回归直线拟合的效果重点)

升数学建模与数据分析素养.利用散点图可以从形上判断两个变量是否线性相关,如何从数上判断呢?.相关系数r的计算一般地,设随机变量的组测值分别(x,),,)…,)则变量间线性相关系数nΣr=

inΣ

nΣi

1

i

1n--Σxy-=

ix-nx

2

nΣy-y

2i

1

i

1.相关系数r与线性相关程度关系(1)r的值范围为-1,];r值越接近,随机变量之间的线性相关程度越强;r值越接近,随机变量之间的线性相关程度越弱..相关性的分类(1)当r>0时,两个变量正相关;(2)当r<0时,两个变量负相关;(3)当r时,两个变量线性不相关.r[提示]只能说明这两个随机变量不线性相关,而不能说明两个随机变量不相关.

iii1iiiiiiiiiii1iiiiiiii.思考辨析(正确的画“√”,错误的画“×”(1)两个变量的相关系数r>0,则两个变量正相关.(2)两个变量的相关系数越大,它的相关程度越强.(3)若两个变量负相关,那么其回直线的斜率为负.

()()()[答案]√

×(3).下列四个散点图中,变量X与Y之具有线性负相关关系的(D

ABCD[察散点图可知有D选的散点图表示的是变量X与Y之间具有负的线性相关关系.故选D].部门所属的10个业企业生产性固定资产价值与工业增加值资料如下单位:百万元):固定资产价值工业增加值

根据上表计算的相关系数.++56+7++9++.9918[∵x==.y=

+17+++36+42++45=.∴r=

10Σ=8.]10ΣΣi

i一唱片公司欲知片费用(十万元与唱片销售量Y千张之的关系从其所发行的1010唱片中随机抽取了张,得到如下的资料:Σx28

x2

10Σy=,y,Σxy=237,i

i1

iii求YX的关系数r的.[解]由题中数据可知,r=

-××=0.3303.4-××598.5×类型正、负相关的判断

2424142112423【例】对组数据进行统计获得如图所示的散点图,关于其相关系数的比较,正确的是)(2)Ar<r<0<rrC.r<r<0<rr

(4)B.r<r<0<rrD.<rr<rA

[散点图知图(1)图是正相关,故r,>0,图(与图4)是负相关,故r<0,r,图与图(2)样本点集中在一条直线附近,因此rr<0<r,选A.]r[跟进训练].在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的()A人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B人体脂肪含量与年龄正相关,且脂肪含量的中位数小于C.体脂肪含量与年龄负相关,且脂肪含量的中位数等于D.体肪含量与年龄负相关,且脂肪含量的中位数小于20%B

[观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于2.]

iiiiiiiiiiiiiiiiiiii类型线性相关系数及应【例】维纶纤维的耐热水性能的好可以用指标“缩醛化度来量这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度X克/)去控制这一指标,为此必找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度克/)缩醛化度克分子%

2426求相关系数r.[思路点拨]r[解]列表如下:i∑

x

y

x2

x

y2721.459803.722826.562833.476885.062921.729x=24y=28.997--Σxy-yr=

x

i-7x

2

7Σy

-7y

2i

1

i

1=

900.16-××-×242×-7×

≈0.94.rr.[跟进训练].下列是水稻产量与施化肥量的一组观测数据:施化肥量水稻产量

判断施化肥量与水稻产量是否有相关关系.

iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii[解]列表如下:i∑

x

y

x2

y2900

x∴r=

7∑x

7-∑x-yi7-7x2∑2

-7y

=2

≈.700×27i

i由于r,因此施化肥量和水稻产量成线性正相关关系类型非线性回归方程及用【例3某公司为确定下一年度投入某种产品宣传费,需了解年宣传费(单位:千元)对年销售量y单位和利润单位:千元的影响,对近年年宣传费和年销售量y(i=1,,…,数据作了初步处理,得到下面的散点图及一些统计量的值.x

ω

8∑(x-)2i

8∑(-ω)i

8∑(x-)i·(y-)

8∑(ω)i·(y-)

表中ω=x,ω=∑.i(1)根据散点图判断=+与Y=+X哪个适宜作为年销售量Y关年宣传费的回归方程类型(给出判断即可,不必说明理)?(2)根据(1)的判断结果表中数据,建立Y关X的归方程;(3)已知这种产品的年利润与x,y的关系为-.根据2)的结果回答下列问题:①年宣传费x=49时年销售量及年利的预报值是多少?

122nniii1niiii1i^122nniii1niiii1i^②年宣传费x为值时,年利润的预报值最大?附:对于一组数(u,),,),…(u,,其回归直线=+的率和截的最小二乘估计分别为:n∑^β=,=-.∑i

1[解](1)由散点图可以判断=+d适宜作为年销售量关年传费的归程类型.(2)令ω=x,先建立关ω的性回归方程,由于8∑ωy^=,1.6),8∑ωic=y-ω=563-68×6.8=,所以Y关线性回归方程为Y=100.668,此Y于X的归方程为Y=+68.(3)①由(2)知,当=49时年销售量的预报值y=100.6+=,年利润z的报值×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z=0.2(100.6x)-x=-xx+20.12所以当x=,=6.8,即x=,取得最大值.故年宣传费为千时,年利润的预报值最大..r[跟进训练].某市共有200000名小学生,其中有的学生在年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为∶∶2,进一步帮助这些学生,当地市政府设“专项教育基

112iiiiii12niii22122iii1i112iiiiii12niii22122iii1i金”,对这三个等次的困难学生每年每人分别补助1元1500元000元.经济学家调查发现,当地人均可支配收入较上一年每增加n,一般困难的学生中有3会脱贫,脱贫后将不再享受“国家精准扶贫”政策,很困难的学生中有2%为一般困难,特别困难的学生中有n转为很困难.现统计了该地级市年2019年5年人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x取15时代表,x与y(万)近似满足关系式y=CC其中为数(年2021年该市中小学生人数大致保持不变).y

5∑(k-)2

5∑(y-)

5∑(x)i

5∑(x-)ii

1

i

1

(y-)

(k-)

5其中k=y,=∑k.i2i5ii(1)估计该市年均可支配收入;(2)求该市2020的“专项教育基金”的财政预算大约为多少.附:①对于一组具有线性相关关系的数据(u,,(,),…,,),其回归直线n∑u方程=+斜率和截距的最小二乘估计分别为β

i

n∑

,=-.1i②22[解](1)因为x=×(13+14+15++=15以∑(-)2=-2)2i

+(-1)

+0+12

+2=10由k=logy得=C+C,所以C=

5∑x1=,C=k-=-×=-0.3510210∑xi

1

1iii1iiiix所以C=2,以×2.当x=18时×2×3.5=2.8(万元).即该市2020年均可支配收入为万元.(2)由题意知2019年时该市享“国家精准扶”策的学生有×7%=14人,一般困难、很困难、特别困难的中学生依次有7人4人2人年人均可支配收入比年增长错!-==10%所以2020该市特别困难的中学生有800-10%)=人.很困难的的学生有4200×(1-20%)2×10%3人,一般困难的学生有7000×(1-30%)4×20%5人.所以2020年“专项育基金”的政预算大约为5×1+×500+2520×2000=元=624(万元)..判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断..相关系数r可定量地反映出变量间的相关程度,从量上给出了有无必要建两变量间的线性回归方程..在对两个变量,进线性回归分析时,有下列骤:①对所求出的回归直线方程作出解释;②收集数据,y,i=1,2…,;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量X有线性相关的结论在下列操作顺序中正确的是)A①②⑤③④C.④③①⑤

B.②④⑤①D.⑤③①

[对两个变量进行回归分析时,首先收集数据(x,y),=,,…,;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性

112n12n112n12n回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序②⑤④③①.].在一组样本数()(x,y),…(x,)(≥2,x,,不相等的散点图中,若所有样本(x)(i,2,…)在直线y=-x+1,则这组样本数据的样ii本相关系数)A-1B.C.-

D.1A

[全的线性关系,且为负相关,故其相关系数为1,故选A].已知变量X,之的线性回归方程为,且变量X,Y之的一组相关数据如下表所示,则下列说法错误的()X

m

A变量,之呈负相关关系B可以预测,当=时,yC.D.回直线必过(,C

[-,得变量,之呈负相关关系,故A确;当=20时y×201+m=-B正确格据可知x=×+++12)=9y=(6+++=,44则

+m6+3+2×9+,解得=5故C错;由=,得y==4所以该回归直线4必过点,4)故正.故选.]^某地区近10年居民的年收入X与支出Y之的关系大致符y+单位亿)预计今年该地区居民收入为亿元,则今年支出估计是亿元.^^.[将x=代入x+,y=.].某班的健康调查小组从所在学校共选取15名男同学,其年龄、身高和体重数据如表所示本题中身高单位cm体重单位.年龄

(高,体重,,(161,,(168,,(162,,

年龄

(身高,体重),64)(168,72),(182,51)(172,68),19(175,,(167,,

(178

(173

iiiiiiii=iiiiiiii2iiiiiiii=iiiiiiii2根据表中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论