新教材人教a版选择性必修第三册8.1成对数据的统计相关性学案_第1页
新教材人教a版选择性必修第三册8.1成对数据的统计相关性学案_第2页
新教材人教a版选择性必修第三册8.1成对数据的统计相关性学案_第3页
新教材人教a版选择性必修第三册8.1成对数据的统计相关性学案_第4页
新教材人教a版选择性必修第三册8.1成对数据的统计相关性学案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.1成对数据的统计相关性知识点一变量的相关关系(一)教材梳理填空1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.3.正相关、负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,就称这两个变量线性相关.[微思考](1)相关关系与函数关系有什么区别?提示:函数关系是两个变量存在确定关系;而相关关系中,变量y的值不能随变量x的值的确定而唯一确定.(2)若散点不是落在一条直线附近,是否就说明两个变量没有相关性了?提示:只能说明这两个变量不是线性相关,但并不一定能说明有没有相关性,若落在一条折线附近,则称这两个变量非线性相关或曲线相关.(二)基本知能小试1.判断正误(1)两个变量具有相关关系就是指的具有函数关系.()(2)两个变量具有相关性,但不是线性相关,就称这两个变量非线性相关或曲线相关.()(3)当散点落在一条折线附近,这两个量也具有相关性.()答案:(1)×(2)√(3)√2.[多选]下列说法正确的是()A.同一物体的加速度与作用力是函数关系B.产品的成本与产量之间的关系是相关关系C.圆的周长与面积的关系是相关关系D.学生的身高与体重是相关关系答案:ABD3.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C由这两个散点图中的点的散布情况可以判断,变量x与y负相关,u与v正相关,选C.知识点二样本相关系数(一)教材梳理填空1.定义:假设两个随机变量的成对数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间样本相关系数r的计算公式为r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(\x\to(x))\a\vs4\al(\x\to(y)),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)\r(\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2)),则称r为变量x和变量y的样本相关系数,其中,r>0时,称成对样本数据正相关,当r<0时,称成对样本数据负相关.2.(1)r∈[-1,1],当|r|越接近1时,成对样本数据的线性相关程度越强;(2)当|r|越接近0时,成对样本数据的线性相关程度越弱.[微思考](1)当|r|=1时,成对样本数据之间具有怎样的关系呢?提示:当|r|=1时,成对样本数据的两个分量之间满足一种线性关系.(2)当r=0时,是否表明成对数据间就不存在相关性了?提示:当r=0时只表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.(二)基本知能小试1.某部门所属的10个工业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资产价值33566789910工业增加值15172528303637424045根据上表资料计算得相关系数r=0.9918,则固定资产价值与工业增加值之间的线性相关程度________(填“较高”或“较低”).解析:由于相关系数r=0.9918接近于1,所以固定资产价值与工业增加值之间的线性相关程度较高.答案:较高2.一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽取了10张,得到如下的资料:eq\i\su(i=1,10,x)i=28,eq\i\su(i=1,10,x)eq\o\al(2,i)=303.4,eq\i\su(i=1,10,y)i=75,eq\i\su(i=1,10,y)eq\o\al(2,i)=598.5,eq\i\su(i=1,10,x)iyi=237,则y与x的相关系数r为________.解析:由题中数据可知r=eq\f(237-10××,\r(303.4-10×2)\r(598.5-10×2))=0.3.答案:题型一相关关系的概念[学透用活][典例1]在下列各个量与量的关系中:①正方体的表面积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为()A.①② B.③④C.②④ D.②③[解析]①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.[答案]D[方法技巧]利用变量间相关关系的概念判断量与量之间的关系时,一般是看当一个变量的值一定时,另一个变量是否带有确定性,两个变量之间的关系具有确定关系——函数关系;两个变量之间的关系具有随机性、不确定性——相关关系.[对点练清]1.[多选]下列变量之间的关系是相关关系的是()A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4B.光照时间和果树亩产量C.某种农作物的亩产量与施肥量D.父母身高和子女身高的关系解析:选BCDB、C、D均为相关关系,A为函数关系.2.有下列关系:①人的寿命与他(她)每天坐着的时间之间的关系;②曲线上的点与该点关于原点的对称点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是________.解析:利用相关关系的概念进行判断,②中两变量的关系是一种确定性关系.答案:①③④题型二判断变量的相关关系[学透用活][典例2]两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,判断它们是否有相关关系;若具有相关关系,说出它们相关关系的区别.表1A261813104-1B202434385064表2C05101520253035D[解]作出散点图分别如图①②所示.从图中可以看出两图中的点都分布在一条直线附近,因此两图中的变量都具有相关关系.图①中A的值由大变小时,B的值却是由小变大.图②中C的值由小变大时,D的值也是由小变大.[方法技巧]1.画散点图的一般步骤(1)建立直角坐标系,注意,两轴的长度单位可以不一致.(2)将n个数据点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中,描出的点可以是实心点,也可以是空心点.(3)画直线时,一定要画在多数点经过的区域.具体作直线时,用一条透明的直尺边缘尽量靠近或经过大多数点,然后画出直线.2.判断两个变量具有相关关系的方法(1)根据直观感觉判断,这时要用到已有的知识或生活、学习中的经验等.(2)根据散点图判断,这时要由两个变量相应值的对应关系作出散点图,通过观察散点图中变量的对应点是否分布在某条曲线的周围判定这两个变量是否具有相关关系.[对点练清]1.试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是()答案:C2.对某种鸡胚胎的生长进行研究,测得5日~20日鸡的日龄与胚胎的质量如下表:日龄/天56789101112胚重/g日龄/天1314151617181920胚重/g8(1)请作出这些数据的散点图;(2)关于这两个变量的关系,你能得出什么结论?解:(1)以鸡胚胎的日龄为x轴,以胚重为y轴,作出散点图如图所示.(2)从散点图观察,许多点不在同一直线附近,但可以看出随着时间的增加,胚重增长得越来越快,所以具有相关关系.题型三相关系数的计算[学透用活][典例3]关于两个变量x和y的7组数据如下表所示:x21232527293235y711212466115325计算两个变量的样本相关关系,并据此判断x与y之间是否具有线性相关关系?[解]∵eq\x\to(x)=eq\f(1,7)×(21+23+25+27+29+32+35)≈27.4,eq\x\to(y)=eq\f(1,7)×(7+11+21+24+66+115+325)≈81.3,eq\i\su(i=1,7,x)eq\o\al(2,i)=212+232+252+272+292+322+352=5414,eq\i\su(i=1,7,x)iyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18542,eq\i\su(i=1,7,y)eq\o\al(2,i)=72+112+212+242+662+1152+3252=124393,∴r=eq\f(\i\su(i=1,7,x)iyi-7\x\to(x)\o(y,\s\up6(-)),\r(\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)·\r(\i\su(i=1,7,y)\o\al(2,i)-7\x\to(y)2))=eq\f(18542-7××,\r(5414-7×2)·\r(124393-7×2))≈0.8375.由于r≈0.8375与1比较接近,∴x与y具有线性相关关系.[方法技巧]利用相关系数r进行相关关系的判断时,需要应用公式计算出r的值,由于数据较大,需要借助计算器,但计算时应该特别细心,避免出现计算错误.[对点练清]暑期社会实践中,小娴所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:x/人24568y/元2030505070利用相关系数r判断y与x是否线性相关.解:由表中数据,计算得:eq\x\to(x)=eq\f(1,5)×(2+4+5+6+8)=5,eq\x\to(y)=eq\f(1,5)×(20+30+50+50+70)=44,eq\i\su(i=1,5,x)eq\o\al(2,i)=22+42+52+62+82=145,eq\i\su(i=1,5,y)eq\o\al(2,i)=202+302+502+502+702=11200,eq\i\su(i=1,5,x)iyi=2×20+4×30+5×50+6×50+8×70=1270,代入r的计算公式得r=eq\f(1270-5×5×44,\r(145-5×52)·\r(11200-5×442))≈0.975.∵r=0.975与1比较接近,∴x与y具有相关关系.题型四相关系数的实际应用[学透用活][典例4]某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间的数据如下表:x/h24152319161120161713y/分92799789644783687159(1)画出散点图;(2)请判断数学学习的时间与数学平均成绩之间的相关关系的类型、相关程度和变化趋势的特征.[解](1)根据表中的数据画出散点图,如图.从散点图看,数学成绩与学习时间线性相关.(2)由已知数据求得eq\x\to(x)=17.4,eq\x\to(y)=74.9,eq\i\su(i=1,10,x)eq\o\al(2,i)=3182,eq\i\su(i=1,10,y)eq\o\al(2,i)=58375,eq\i\su(i=1,10,x)iyi=13578,所以相关系数r=eq\f(\i\su(i=1,10,x)iyi-10\x\to(x)\o(y,\s\up6(-)),\r(\i\su(i=1,10,x)\o\al(2,i)-10\x\to(x)2\i\su(i=1,10,y)\o\al(2,i)-10\x\to(y)2))≈0.920.由相关系数知,数学学习时间与数学平均成绩呈正线性相关,因为r≈与1接近,所以数学学习时间与数学成绩相关程度很高,且随着学习时间的增加,相应的学习成绩升高.[方法技巧]判断变量的相关性通常有两种方式:一是散点图;二是相关系数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.[对点练清]有一个同学家开了一个小卖部,他为了研究气温对热饮料销售的影响,经过统计,得到一个卖出的热饮杯数y与当天气温x的数据如表所示.气温x/℃-5471015233036热饮杯数y/杯16212811513589716337(1)画出散点图;(2)用相关系数r判断热饮杯数与当天气温的关系的强弱.解:(1)散点图如图所示.(2)由数据得eq\x\to(x)=eq\f(1,8)×(-5+4+7+10+15+23+30+36)=15,eq\x\to(y)=eq\f(1,8)×(162+128+115+135+89+71+63+37)=100,代入r的计算公式得r=eq\f(\i\su(i=1,8,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,8,)xi-\x\to(x)2\i\su(i=1,8,)yi-\x\to(y)2))≈-eq\f(3953,\r(1340)×111)≈-0.97,所以气温与当天热饮销售杯数的负相关很强.[课堂思维激活]一、综合性——强调融会贯通1.下表是某地区年降雨量与年平均气温关系表,判断两者是否是相关关系.年平均气温(℃)年降雨量(mm)745542507813574701432解:把年平均气温作为横坐标,把相应的年降雨量作为纵坐标在直角坐标系中描点(xi,yi)(i=1,2,…,7),作出散点图如图所示.因为图中各点并不在一条直线附近,而是散乱地分布在平面直角坐标系内,所以两变量是不相关的.二、应用性——强调学以致用2.(2020·全国卷Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中x1和y1分别表示第1个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\x\to(x))2=80,eq\i\su(i=1,20,)(yi-eq\x\to(y))2=9000,eq\i\su(i=1,20,)(xi-eq\x\to(x))(yi-eq\x\to(y))=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论