



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、变量间的相关关系讲义一、基础知识梳理知识点 1:变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系 。相关关系是一种非确定性关系, 如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系。注意:两个变量之间的相关关系又可分为线性相关 和非线性相关 ,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具
2、有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。点睛: 两个变量相关关系与函数关系的区别和联系相同点: 两者均是两个变量之间的关系,不同点: 函数关系是一种确定的关系,如匀速直线运动中时间t 与路程s 的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系, 而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。知识点 2.散点图 .1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这
3、些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图 。2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合 。3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内。如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为 负相关 ,负相关时散点图的点散步在从左上角到右下角的区域。注意: 画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单
4、位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势, 则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关, 如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系。点睛: 散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟
5、变量之间的关系。散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度知识点 3:回归直线( 1)回归直线的定义如果散点图中点的分布从整体上看大致在一条直线附近, 我们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线。( 2)回归直线的特征如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚的了解对应两个变量之间的相关1性,就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表。( 3)回归直线方程一般地,设x 与 y 是具有相关关系的两个变量,且相应n 组观测值的n 个点( xi,yi)( i=1,2 , , n)
6、大致分布在一条直线的附近,求在整体上与这n个点最接近的一条直线,设此直线方程为ybx a,这里的y在上方加上?“ ”是为了区分实际值 y,表示当 x 取值 xi,y 相应的观察值yi 而直线上对应于xi,的纵坐标是?bx ay点睛: 1)散点图中的点整体上分布在一条直线附近时,可以应用线性回归分析的方法分析数据;2)回归直线是反映:“从整体上看,各点与此直线的距离的和最小”的一条直线,它反映了具有线性相关关系的两个变量之间的规律;3)我们可以通过回归直线方程,由一个变量的值来推测另一个变量的值,解决生活中的实际问题;这种方法称为回归方法知识点4:回归系数公式及相关问题1. 最小二乘法: 求回归
7、直线的关键是如何用数学的方法刻画从整体上看,各点与此直线的距离最小,假设我们已经得到两个具有线性相关关系的变量的一组数据:( x1 , y1 ) ( x2, y2 )( xn , yn )。当自变量x取xi=1 2( i, , ,n)时,可以得到 ?bxiayiyiyiyi(bxia)yi =1,2, ,n),它与实际收集到的之间的偏差是(?( i =1,n2, , n)这样用 n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为?),( yi yii1n? ,由于带绝对值计算不方便所以换成平方,偏差有正有负,易抵消,所以采用绝对值yii 1yin22222现在的问题就归结为
8、:当 a , b 取什么值时 Q最小,即点到Qy y?ybx aybx aybx aybx a( ii )( 11)(22)(33 )( nn )i 1直线 y=bx+a 的整体距离最小nn( xix)( yi y)xi yinx y1n1 nbi 1i1(其中 x, yy )这种通过求式的最小值而得到回归nn2x( xix) 2xi 2nin i 1inxi 1i 1i1aybx直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法。2.回归直线方程的求法先判断变量是否线性相关若线性相关,利用公式计算出a,b利用回归方程对生活实际问题进行分析与预测注意:线性回归直线方程
9、中 x 的系数是 b,常数项是 a,与直线的斜截式不大一样,如果散点图中的点分布从整体上看不在任何一条直线附近,这时求出的线性回归方程实用价值不大。点睛: 线性回归方程:一般地 ,设有 n 个观察数据如下:xx1x2x3xnyy1y2y3yn当a,b使Q( y1 bx1 a)( y2 bx2 a). ( yn bx na )取得最小值时,y bx a为拟合这n对数据的 线性回归222就称 ?方程 ,该方程所表示的直线称为回归直线知识点5:线性回归分析思想在实际中的应用2教材中利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析。利用这种分析方法可以对生活中的很多问题进行分析
10、与预测,求线性回归方程的步骤:计算平均数x, y ;计算 xi 与 yi 的积,求xi yi ;计算xi 2 ;将结果代入公式求a ;用byax 求 b ;写出回归方程注意:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出 a, b由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误。知识点 6:利用相关系数判断线性相关程度最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测,如图前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。显然求回归直线的方程是没有意义的
11、。有些变量线性相关,有些非线性相关, 衡量变量的线性相关程度引入一个量:相关系数nr( xix)(yiy)i 1nn(yy)2(xix)2ii 1j1注意它的符号:当r0 时, x,y 正相关,当 r0 时, x,y 负相关,统计学认为:对于r ,若 r1, 0.75 那么负相关很强,若r0.75,1 ,那么正相关很强若 r0.75, 0.30 或 r 0.30,0.75,那么相关性一般,若 r0.25,0.25,那么相关性较弱,点睛: 相关系数的绝对值越大,线性相关关系就越强。二、常考题型例解易 - 知识点 1例 1:下列两个变量之间是相关关系的是()A 、圆的面积与半径B 、球的体积与半径
12、C、角度与它的正弦值D 、一个考生的数学成绩与物理成绩思路分析: 由题意知A 表示圆的面积与半径之间的关系24 r 3S= r , B 表示球的体积与半径之间的关系vC3表示角度与它的正弦值y=sin ,前面所说的都是确定的函数关系,相关关系不是确定的函数关系,故选D解: D点拨:本题考查变量间的相关关系, 判断两个变量间的关系还是函数关系还是相关关系的关键是判断两个变量之间的关系是否是确定的,若确定的则是函数关系;若不确定,则是相关关系3例 2:名师出高徒可以解释为老师的水平越高,学生的水平也越高,那么教师与学生的水平之间有何种关系呢?你能举出更多的描述生活中两变量相关关系的成语与俗语吗?至
13、少写两个。思路分析: 名师出高徒的意思是有名的教师一定能教出高明的徒弟,高水平教师有很大趋势教出高水平的学生,实际学生成绩的好坏还与很多因素有关,如学生的天赋,学生的努力,学习的环境等,所以它们之间的关系带有不确定性即为相关关系。解:教师的水平与学生的水平之间具有相关关系生活中描述两个变量之间的相关关系的成语或俗语还有:老子英雄儿好汉,强将手下无弱兵,虎父无犬子2009?宁夏高考 中 知识点 2例 3. 对变量 x、y 有观测数据 ( xi ,yi )(i=1 ,2, , 10),得散点图1;对变量 u,v 有观测数据 ( ui ,vi )( i=1 ,2, , 10),得散点图2由这两个散点
14、图可以判断()A、变量 x 与 y 正相关, u 与 v 正相关B、变量 x 与 y 正相关, u 与 v 负相关C、变量 x 与 y 负相关, u 与 v 正相关D、变量 x 与 y 负相关, u 与 v 负相关思路分析: 由题图 1 可知, y 随 x 的增大而减小,各点整体呈递减趋势,x 与 y 负相关,由题图 2 可知, u 随 v 的增大而增大,各点整体呈递增趋势,u 与 v 正相关解: C点拨: 本题考查散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关易知识点3例 4: 5 个学生的数学和物理成绩如下
15、表:由散点图判断它们是否相关,是正相关还是负相关?思路分析: 分别以数学和物理成绩作为横纵坐标建立直角坐标系,描点画出散点图,然后根据散点图判断。解:以 x 轴表示数学成绩,y 轴表示物理成绩可得到相应的散点图,如图所示由散点图可知,两者之间具有相关关系,且为正相关例 5:下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由思路分析: 根据表中数据画出散点图,观察数据是否集中,判断变量之间关系,再利用最小二乘法计算系数a,b写出线性回归方程解:4在直角坐标系中画出数据的散点
16、图,直观判断散点在一条直线附近,故具有线性相关关系计算相应的数据之和:8888xi1031, yi2137835, xyii,71.6, xi9611.7i 1i 1i 1i 1将它们代入()式计算得 b 0.0774, a1.0241,所以,所求线性回归方程为y0.0774x 1.0241知识点 4例 6:有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮杯数与当天气温之间的线性关系,其回归方程为y=-2.35x+147.77 如果某天气温为 -2 时,则该小卖部大约能卖出热饮的杯数是()A、 140B、 143C、 152D、156思路分析: 一个热饮杯数与
17、当天气温之间的线性关系,其回归方程为y=-2.35x+147.77如果某天气温为-2 时,即x=-2 ,则该小卖部大约能卖出热饮的杯数y=-2.35 ( -2 )+147.77=152.47 152解: C例 7:某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选10 名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表):( 1)对变量 x 与 y 进行相关性检验,如果 x 与 y 之间具有线性相关关系,求出线性回归方程;( 2)若某学生入学数学成绩是80 分,试估测他高一期末数学考试成绩思路分析:( 1)根据所给的数据利用最小二乘法写出
18、线性回归方程的系数和a 的值,写出线性回归方程,注意运算过程中不要出错( 2)将 x=80 代入所求出的线性回归方程中,得y=8 分,即这个学生的高一期末数学考试成绩预测值为84 分解:( 1)设所求的线性回归方程为y=ax+b最小二乘法可以写出因此所求的线性回归方程y=0.742x+23.108( 2)将 x=80 代入所求出的线性回归方程中,得 y=84 分,即这个学生的高一期末数学考试成绩预测值为84 分点拨:利用回归方程可以对总体进行预测估计,回归方程将部分观测值所反映的规律进行延伸,使我们对有线性5相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量的值,在现实生活中有
19、广泛的应用知识点 5例 8:某种产品的广告费用支出x 万元与销售额y 万元之间有如下的对应数据:( 1)根据上表提供的数据,求出y 关于 x 的线性回归方程;( 2)据此估计广告费用为10 万元时,所得的销售收入知识点 6例 9:一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:( 1)利用散点图或相关系数r 的大小判断变量y 对 x 是否线性相关?为什么?( 2)如果 y 对 x 有线性相关关系,求回归直线方程;( 3)若实际生产中, 允许每小时的产品中有缺点的零件最多为10 个
20、,那么机器的运转速度应控制在什么范围内?(最后结果精确到0.001参考数据:656.2525.617,16 11+149+12 8+8 5=438, 162+142+122+82=660 , 112+92+82+52=291 )思路分析:( 1)利用所给的数据做出两个变量的相关系数,得到相关系数趋近于1,得到两个变量具有线性相关关系( 2)先做出横标和纵标的平均数,做出利用最小二乘法求线性回归方程的系数的量,做出系数,求出a,写出线性回归方程( 3)根据上一问做出的线性回归方程,使得函数值小于或等于10,解出不等式6三、典例方法详析考点 1:相关关系方法: 两个变量间的关系。相关关系是一种非确
21、定的关系,也不一定是因果关系。如产品销售额与广告费的投入关系。例 10 :下面哪些变量是相关关系()A 、出租车费与行驶的里程B 、房屋面积与房屋价格C、人的身高与体重D 、铁块的大小与质量思路分析: 由出租车费与行驶的里程、房屋面积与房屋价格和铁块的大小与质量知它们都是确定的函数关系,故A 、 B、 C 不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系从而得出正确答案解: A、由出租车费与行驶的里程的公式知,是确定的函数关系,故A 不对;B 、房屋面积与房屋价格,是确定的函数关系,故B 不对;C 、人的身高会影响体重,但不是唯一因素,故C 对;D 、铁块的大小与质量,是确定的函
22、数关系故D 不对故选 C考点 2:散点图方法: 根据所给数据分别作为点的横纵坐标在直角坐标系内描点,画图。例 11:某研究小组在一项实验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画y与 t 之间关系的是()A 、 y=2tB 、 y=2t 2C、 y=t 3D 、 y=log 2t思路分析: 根据所给的散点图,观察出图象在第一象限,单调递增, 并且增长比较缓慢,一般用对数函数来模拟,在选项中只有一个底数是2 的对数函数,解: D综合技能提升考点 3:回归方程7方法: 利用最小二乘法的思想,根据线性回归方程系数公式建立回归方程,估计和预测取值,从而获得对两个变量之间整体
23、关系的了解。例 12.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 的一组数据如表所示:( 1)画出数据的散点图;( 2)根据散点图,你能得出什么结论?( 3)求回归方程思路分析:( 1)由图表可以知道有( 5, 6)( 10, 10)( 15, 11)( 20, 13)( 30, 16)(40, 17)(50, 19)( 60,23)点的坐标,在坐标系中描出点的坐标,得到散点图( 2)散点图呈带状分布, x 与 y 是具有相关关系的两个变量,且对应 n 组观测值的 n 个点大致分布在一条直线附近( 3)计算得 r=0.979307992 0.75 x 与 y 有很强的线性相关
24、关系,做出横标和纵标的平均数,利用最小二乘法做出回归直线方程的系数,得到回归直线方程解:( 1)由图表可以知道有( 5, 6)(10, 10)( 15, 11)( 20, 13)( 30, 16)( 40, 17)( 50,19)( 60,23),在坐标系中得到散点图如图所示( 2)结论: x 与 y 是具有相关关系的两个变量,且对应n 组观测值的n 个点大致分布在一条直线附近,其中整体上与这n 个点最接近的一条直线最能代表变量x 与 y 之间的关系( 3)计算得r=0.979307992 0.75x 与 y 有很强的线性相关关系,x=5+10+15+20+30+40+50+608=28.75
25、y=6+10+11+13+16+17+19+238=14.25由计算器计算得a=6.6164386.62,b=0.269863 0.,27 y=6.62+0.27x 四、学法对应题练1、下列选项中,两个变量具有相关关系的是()A、正方形的面积与周长B、匀速行驶车辆的行驶路程与时间C、人的身高与体重D、人的身高与视力分析: 由正方形的面积与周长的公式和匀速直线运动的路程公式知它们都是确定的函数关系,故A 、B 不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系;人的身高与视力无任何关系,故选C2、下列变量关系是相关关系的是()家庭的经济条件与学生的学习成绩之间的关系教师的执教水平与学
26、生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;学生的学习态度与学习成绩之间的关系A 、B、C、D、分析: 对于,家庭的经济条件与学生的学习成绩之间的关系没有关系,所以不是;对于,教师的执教水平与学生的学习成绩之间的有关系,但不确定;是相关关系,所以是;对于,学生的身高与学生的学习成绩之间没有关系;所以不是;对于,学生的学习态度与学习成绩之间有关系,但关系不确定;所以是相关关系,所以是故选D学法指导考查了两个变量之间具有相关关系的定义,根据学过公式和经验进行逐项验证,一定要和函数关系区别出来3.在画两个变量的散点图时,下面哪个叙述是正确的()A 、预报变量x 轴上,解释变量y 轴
27、上B 、解释变量x 轴上,预报变量y 轴上8C、可以选择两个变量中任意一个变量x 轴上D 、可以选择两个变量中任意一个变量y 轴上分析: 通常把自变量称为解析变量,因变量称为预报变量,故解释变量为自变量,预报变量为因变量故选B4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据( 1)请画出上表数据的散点图;( 2)请根据上表提供的数据,用最小二乘法求出y 关于 x 的线性回归方程y=bx+a ;( 3)已知该厂技改前100 吨甲产品的生产能耗为90 吨标准煤 试根据 (2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3 2.5+4 3+5 4+6 4.5=66.5)学法指导本题考查散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关5( 2010?临颍县)已知回归直线斜率的估计值是1.23 ,样本平均数x=4, y=5,则该回归直线方程为()A 、 y=1.23x+4B 、 y=1.23x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届甘肃省临洮县全国初三冲刺考(四)全国I卷物理试题含解析
- 威海市古寨中学2025年初三4月百千联考英语试题含答案
- 湖南省湘西土家族苗族自治州花垣县2025届四下数学期末调研模拟试题含解析
- 武昌职业学院《C4D动画综合》2023-2024学年第二学期期末试卷
- 中医健康养生知识科普讲座
- 上消化道病人出血护理
- 广告传媒行业报告模板
- 学校文化建设与文化管理-培训课件
- 2025房地产经纪人协理-《房地产经纪综合能力》考前通关必练题库-含答案
- 心理健康与养生
- 吉塔行星模拟课程
- 献身国防事业志愿书,空军
- 广东省建筑施工安全管理资料统一用表2021年版(原文格式版)
- 【企业招聘管理研究国内外文献综述】
- 筒子形成及卷绕成型分析
- 五年级道德与法治下册作业设计优秀案例
- 社会工作师职业资格考试
- 风电工程建设标准强制性条文
- MT/T 240-1997煤矿降尘用喷嘴通用技术条件
- GB/T 17460-1998化学转化膜铝及铝合金上漂洗和不漂洗铬酸盐转化膜
- GB 6245-2006消防泵
评论
0/150
提交评论