![变量间的相关关系讲义_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-1/18/73fca913-2053-49cd-97fc-7f44becf9aef/73fca913-2053-49cd-97fc-7f44becf9aef1.gif)
![变量间的相关关系讲义_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-1/18/73fca913-2053-49cd-97fc-7f44becf9aef/73fca913-2053-49cd-97fc-7f44becf9aef2.gif)
![变量间的相关关系讲义_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-1/18/73fca913-2053-49cd-97fc-7f44becf9aef/73fca913-2053-49cd-97fc-7f44becf9aef3.gif)
![变量间的相关关系讲义_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-1/18/73fca913-2053-49cd-97fc-7f44becf9aef/73fca913-2053-49cd-97fc-7f44becf9aef4.gif)
![变量间的相关关系讲义_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-1/18/73fca913-2053-49cd-97fc-7f44becf9aef/73fca913-2053-49cd-97fc-7f44becf9aef5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、变量间的相关关系讲义一、根底知识梳理知识点1:变量之间的相关关系两个变量之间的关系可能是确定的关系如:函数关系,或非确定性关系.当自变量取值一定时,因变量也确定,那么为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系, 如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系, 学生的数学成绩好坏与物理成绩的关系等都是相关关系.注意:两个变量之间的相关关系又可分为 线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,那么变量之间具有相关关系不确定性的关系,如果所有样本点都落在某一直线附近,那么变量之间具有线性相
2、 关关系,相关关系只说明两个变量在数量上的关系,不说明他们之间的因果关系,也可能是一种伴随关系.点睛:两个变量相关关系与函数关系的区别和联系相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系, 而相关关系不一定是因果关系,也可能是伴随关系.知识点2.散点图.1 .在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之
3、间的一个图,通常称这种图为变量之间的散点图.2 .从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通 常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.3 .对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种 相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内.如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图 的点散步在从左上角到右下角的区域.注意:画散点图的关键是以成对的一组数据,分别为此点的横、 纵坐标,在平面直角坐标系中把其 找出来,其横纵坐标的单位长度的选取可
4、以不同, 应考虑数据分布的特征,散点图只是形象的描述 点的分布,如果点的分布大致呈一种集中趋势, 那么两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,那么表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下 图所示的情况,那么两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关点睛:散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点坐标点的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系
5、.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度知识点3:回归直线1回归直线的定义如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2回归直线的特征如果能够求出这条回归直线的方程简称回归方程,那么我们就可以比较清楚的了解对应两个变量之间的相关性,就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表.3回归直线方程一般地,设x与y是具有相关关系的两个变量,且相应n组观测值的n个点Xiy i=1,2,n大致分布在一条直线的附近,求在整体上与这 n个点最接近的一条直线,设此直线方
6、程为=bx + a,这里的y在上方加上欢迎阅读“人是为了区分实际值 y,表示当x取彳1 xi,y相应的观察值yi而直线上对应于Xi,的纵坐标是y? = bx + a点睛:1)散点图中的点整体上分布在一条直线附近时,可以应用线性回归分析的方法分析数据;2)回归直线是反映:从整体上看,各点与此直线的距离的和最小的一条直线,它反映了具有线性相关关系的两个变量之间的规律;3)我们可以通过回归直线方程,由一个变量的值来推测另一个变量的值,解决生活中的实际问题;这种方法称 为回归方法知识点4:回归系数公式及相关问题1 .最小二乘法:求回归直线的关键是如何用数学的方法刻画从整体上看,各点与此直线的距离最小,
7、 假设我们已经得到两个具有线性相关关系的变量的一组数据:(x1, y1) (x2,y2)(xn, yn).当自变量x取Xi (i =1,2,n)时,可以得到=bxj+a (i=i,2, , n),它与实际收集到的yi之间的偏差是yi -y?! = yi -(bxi + a) ( i =1,n2,n)这样用n个偏差的和来刻画“各点与此直线的整体偏差是比较适宜的.总的偏差为z (yi -?),i 1n,由于带绝对值计算不方便所以换成平方,偏差有正有负,易抵消,所以采用绝对值工|yi -y|i 1Q最小,即点到n 2Q=Z(y T) =(y bxa)2 4%bxa)2中y3_bxa)2+"
8、(yn_bxa)2现在的问题就归结为:当a,b取什么值时i拦直线y=bx+a的整体距离最小nn£(x-x)(y-y) Zxyi-nxy_ n _ 1 nb='=二=丁(其中x=1lL xi , y=-H yi )这种通过求式的最小值而得到回归£ (x -x)2£ x2 -nxn yn 匕i 1i 土Si. -,.a =y -bx直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.2 .回归直线方程的求法 先判断变量是否线性相关假设线性相关,利用公式计算出a,b利用回归方程对生活实际问题进行分析与预测注意:线性回归直线方程中x的系数
9、是b,常数项是a,与直线的斜截式不大一样,如果散点图中的点分布从整体上看不在任何一条直线附近,这时求出的线性回归方程实用价值不大. 点睛:线性回归方程:一般地,设有n个观察数据如下:当 a,b 使 Q=(y1-bx1a)2+(y2-bx2a)2 +.十 yn-bxn-a)2取得最小值时,就称夕=bx + a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线知识点5:线性回归分析思想在实际中的应用教材中利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析.利用这种分析方法可以对生活中的很多问题进行分析与预测,求线性回归方程的步骤:计算平均数x,y ;计算为与yi的
10、积,求工xiyi ;计算Z xi2 ;将结果代入公式求a ;用b =yax求b ;写出回归方程欢迎阅读注意:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.知识点6:利用相关系数判断线性相关程度最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测,如图前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系.显然求回归直线的方程是没有意义的.有些变量线性相关,有些非线性相关,衡量变量的线性相关程度引入一个量:相
11、关系数n _ _v x -Yi _yr - i - L nn二Xi2 1y _y2注意它的符号:当r A0时,X, y正相关,当r<0时,X, y负相关,统计学认为:对于 r,假设r w -1,-0.75那么负相关很强,假设r e 10.75,1,那么正相关很强假设 r e -0.75,-0.30或re 0.30,0.75 ,那么相关性一般,假设r三10.25,0.251,那么相关性较弱,1 ;- J '点睛:相关系数的绝对值越大,线性相关关系就越强.二、常考题型例解易知识点1例1:以下两个变量之间是相关关系的是A、圆的面积与半径B、球的体积与半径C、角度与它的正弦值D、一个考生
12、的数学成绩与物理成绩思路分析:由题意知A表示圆的面积与半径之间的关系 S=r2, B表示球的体积与半径之间的关34. r系7=C表小角度与它的正弦值y=sina,前面所说的都是确定的函数关系,相关关系不是确3定的函数关系,应选D.解:D点拨:此题考查变量间的相关关系,判断两个变量间的关系还是函数关系还是相关关系的关键是判 断两个变量之间的关系是否是确定的,假设确定的那么是函数关系;假设不确定,那么是相关关系.例2:名师出高徒可以解释为老师的水平越高,学生的水平也越高,那么教师与学生的水平之间有 何种关系呢你能举出更多的描述生活中两变量相关关系的成语与俗语吗至少写两个.思路分析:名师出高徒的意思
13、是有名的教师一定能教出高明的徒弟, 高水平教师有很大趋势教出高 水平的学生,实际学生成绩的好坏还与很多因素有关, 如学生的天赋,学生的努力,学习的环境等, 所以它们之间的关系带有不确定性即为相关关系.解:教师的水平与学生的水平之间具有相关关系生活中描述两个变量之间的相关关系的成语或俗语还有:老子英雄儿好汉,强将手下无弱兵,虎父无犬子2021?宁夏高考中知识点2例3.对变量x、y有观测数据xi, yi i=1 ,2,10,得散点图1;对变量u, v有观测数据ui, vi i=1 ,2,10,得散点图2.由这两个散点图可以判断A、变量x与y正相关,u与v正相关B、变量x与y正相关,u与v负相关C、
14、变量x与y负相关,u与v正相关D、变量x与y负相关,u与v负相关思路分析:由题图1可知,y随x的增大而减小,各点整体呈递减趋势,x与y负相关,欢迎阅读由题图2可知,u随v的增大而增大,各点整体呈递增趋势,u与v正相关.解:C点拨:此题考查散点图,是通过读图来解决问题,考查读图水平,是一个根底题,此题可以粗略的 反响两个变量之间的关系,是不是线性相关,是正相关还是负相关 易知识点3例4: 5个学生的数学和物理成绩如下表:由散点图判断它们是否相关,是正相关还是负相关思路分析:分别以数学和物理成绩作为横纵坐标建立直角坐标系,描点画出散点图,然后根据散点图判断.解:以x轴表示数学成绩,y轴表示物理成绩
15、可得到相应的散点图,如下列图 斗物理成绩 70 *M一: 一*-_1L_1-*工 5.帕他8.钟数学成绩由散点图可知,两者之间具有相关关系,且为正相关.例5:下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程; 如果不具有线性相关关系,说明理由.思路分析:根据表中数据画出散点图,观察数据是否集中,判断变量之间关系,再利用最小二乘法计算系数a,b写出线性回归方程 解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和: 8888£xH031iy gi
16、.6Ex2=13783l,xy =9611.7 i 上i 1i 1i 1将它们代入()式计算得b%0.0774, a = 1.0241 ,所以,所求线性回归方程为y = 0.0774x 1.0241 .知识点4例6:有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮杯数与当天 气温之间的线性关系,其回归方程为 yA=-2.35x+147.77 .如果某天气温为-2 C时,那么该小卖部大约能卖出热饮 的杯数是()A、 140 B 、 143 C 、 152 D 、 156思路分析:二.一个热饮杯数与当天气温之间的线性关系,其回归方程为y-2.35x+147.77
17、.如果某天气温为-2C时,即x=-2,那么该小卖部大约能卖出热饮的杯数y=-2.35 X (-2) +147.77=152.47 152解:C.例7:某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选 10名学生,分析他们入学的数学成绩和高一年级期末数学测试成绩(如下表):(1)对变量x与y进行相关性检验,如果x与y之间具有线性相关关系,求出线性回归方程; (2)假设某学生入学数学成绩是80分,试估测他高一期末数学测试成绩思路分析:(1)根据所给的数据利用最小二乘法.写出线性回归方程的系数和a的值,写出线性回归方程,注意运算过程中不要出错.(2)将x=
18、80代入所求出的线性回归方程中,得 y=8分,即这个学生的高一期末数学测试成绩预 测值为84分解:(1)设所求的线性回归方程为y=ax+b最小二乘法可以写出因此所求的线性回归方程y=0.742x+23.108(2)将x=80代入所求出的线性回归方程中,欢迎阅读得y=84分,即这个学生的高一期末数学测试成绩预测值为84分点拨:利用回归方程可以对总体进行预测估计,回归方程将局部观测值所反映的规律进行延伸,使我们对有线性相关关系的两个变量进行分析和限制,依据自变量的取值估计和预报因变量的值,在现实生活中有广泛的应用 知识点5例8:某种产品的广告费用支出 x万元与销售额y万元之间有如下的对应数据:(1
19、)根据上表提供的数据,求出y关于x的线性回归方程;(2)据此估计广告费用为 10万元时,所得的销售收入知识点6例9: 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:希陶(?希秒】1614128每悯生啊跣雌憾取件)119e5(1)利用散点图或相关系数 r的大小判断变量y对x是否线性相关为什么(2)如果y对x有线性相关关系,求回归直线方程;(3)假设实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应限制在什么范围内(最后结果精确到 0.001.参考数据:J
20、656.25上25.617 ,16X 11 + 14X9+12 X 8+8X 5=438, 162+142+122+82=660, 112+92+82+52=291 )思路分析:(1)利用所给的数据做出两个变量的相关系数,得到相关系数趋近于1,得到两个变量具有线性相关关系.(2)先做出横标和纵标的平均数,做出利用最小二乘法求线性回归方程的系数的量,做出系数,求出a,写出线性回归方程.(3)根据上一问做出的线性回归方程,使得函数值小于或等于10,解出不等式.三、典例方法详析考点1:相关关系方法:两个变量间的关系.相关关系是一种非确定的关系,也不一定是因果关系.如产品销售额与广告费的投入 关系.例
21、10:下面哪些变量是相关关系()A、出租车费与行驶的里程B、房屋面积与房屋价格C、人的身高与体重D、铁块的大小与质量思路分析:由出租车费与行驶的里程、房屋面积与房屋价格和铁块的大小与质量知它们都是确定的函数关系,故A、B、C不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系.从而得出正确答案.解:A、由出租车费与行驶的里程的公式知,是确定的函数关系,故 A不对;B、房屋面积与房屋价格,是确定的函数关系,故 B不对;C、人的身高会影响体重,但不是唯一因素,故 C对;D、铁块的大小与质量,是确定的函数关系故D不对.应选C.考点2:散点图方法:根据所给数据分别作为点的横纵坐标在直角坐标系
22、内描点,画图.例11:某研究小组在一项实验中获得一组数据,将其整理得到如下列图的散点图,以下函数中,最能近似刻画y与t之间关系的是()A、y=2tB、y=2t2C、y=t3D、y=log2t思路分析:根据所给的散点图,观察出图象在第一象限,单调递增,并且增长比较缓慢,一般用对数函数来模拟,在选项中只有一个底数是 2的对数函数, 解:D.欢迎阅读综合技能提升考点3:回归方程方法:利用最小二乘法的思想,根据线性回归方程系数公式建立回归方程,估计和预测取值,从而获得对两个变 量之间整体关系的了解.例12.在某种产品外表进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如表所示:(1)画出数据的散
23、点图;(2)根据散点图,你能得出什么结论(3)求回归方程.思路分析:(1)由图表可以知道有(5,6)( 10,10)(15,11) (20,13)(30,16)(40,17)(50,19)(60,23)点的坐标,在坐标系中描出点的坐标,得到散点图.(2)散点图呈带状分布,x与y是具有相关关系的两个变量,且对应 n组观测值的n个点大致分布在一条直线 附近.解:(1)由图表可以知道有(5, 6) (10, 10) (15, 11) (20, 13)(30, 16) (40, 17) (50, 19) (60, 23),在坐标系中得到散点图如下列图(2)结论:x与y是具有相关关系的两个变量,且对应
24、n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系.x与y有很强的线性相关关系,x 一 =5+10+15+20+30+40+50+608=28.75y 一 =6+10+11 + 13+16+17+19+238=14.25由计算器计算得 aA=6.6164386.62bA=0.269863 = 0.27 yA=6.62+0.27x .四、学法对应题练1、以下选项中,两个变量具有相关关系的是()A、正方形的面积与周长B 、匀速行驶车辆的行驶路程与时间C、人的身高与体重D 、人的身高与视力分析:由正方形的面积与周长的公式和匀速直线运动的路程公式
25、知它们都是确定的函数关系,故A、B不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系;人的身高与视力无任何关系,应选C.2、以下变量关系是相关关系的是()家庭的经济条件与学生的学习成绩之间的关系教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;学生的学习态度与学习成绩之间的关系.A、 B、C、 D、分析:对于,家庭的经济条件与学生的学习成绩之间的关系没有关系,所以不是;对于,教师的执教水平 与学生的学习成绩之间的有关系,但不确定;是相关关系,所以是;对于,学生的身高与学生的学习成绩之 间没有关系;所以不是;对于,学生的学习态度与学习成绩之间有关系,但关
26、系不确定;所以是相关关系, 所以是.应选D.学法指导考查了两个变量之间具有相关关系的定义,根据学过公式和经验进行逐项验证,一定要和函数关系区别出来.3 .在画两个变量的散点图时,下面哪个表达是正确的()A、预报变量x轴上,解释变量y轴上B、解释变量x轴上,预报变量y轴上C、可以选择两个变量中任意一个变量x轴上D、可以选择两个变量中任意一个变量y轴上分析:,通常把自变量称为解析变量,因变量称为预报变量,故解释变量为自变量,预报变量为因变量.应选B4 .下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗 y (吨标准煤)欢迎阅读的几组对照数据.1请画出上表数据的散
27、点图;2请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 y=bAx+aA ;3该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据2求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤参考数值:3X 2.5+4 X 3+5 X 4+6X 4.5=66.5学法指导此题考查散点图,是通过读图来解决问题,考查读图水平,是一个根底题,此题可以粗略的反响两个变量之间的 关系,是不是线性相关,是正相关还是负相关.5 2021?临颍县回归直线斜率的估计值是1.23,样本平均数 x - =4, y - =5,那么该回归直线方程为A、yA=1.23x+4B、yA=1.23x+0.08C、yA=0.08x+1.23D、yA=1.23x+5思路分析:根据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临时市场场地租赁定金合同
- 专利使用权授权合同范本
- 个人建房合作开发合同
- 专业技术服务承包合同
- 上海房屋交易合同范本
- 二手房购房合同定金支付协议
- 乡村住宅买卖合同范本
- 个人农田种植承包合同范本
- 临时摊位租赁合同细则
- 个人买卖合同范本
- 2023年检验检测机构质量手册(依据2023年版评审准则编制)
- 兴海县索拉沟铜多金属矿矿山地质环境保护与土地复垦方案
- 三相分离器原理及操作
- 新教科版五年级下册科学全册每节课后练习+答案(共28份)
- 轮值安全员制度
- 葫芦岛尚楚环保科技有限公司医疗废物集中处置项目环评报告
- 全国物业管理项目经理考试试题
- 水文水利课程设计报告
- 600字A4标准作文纸
- GB/T 18015.2-2007数字通信用对绞或星绞多芯对称电缆第2部分:水平层布线电缆分规范
- DJI 产品交付理论试题
评论
0/150
提交评论