版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2011届高二数学期末备考专题线性回归【重点难点讲解】.回归分析:就是对具有相关关系的两个变量之间的关系形式进行测定,确定一个相关的数学表达式,以便进行估计预测的统计分析方法。根据回归分析方法得出的数学表达式称为回归方程,它可能是直线,也可能是曲线。.线性回归方程设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点(Xi, y)(i=1,n)A大致分布在一条直线的附近,则回归直线的方程为以。.线性相关性检验线性相关性检验是一种假设检验,它给出了一个具体检验 y与x之间线性相关与否的办法。在课本附表3中查出与显著性水平 0.05与自由度n-2 (n为观测值组数)相应的相关 系数临界值 r
2、 0.05。& S w 一不r - 由公式 伯! 白 ,计算r的值。检验所得结果如果|r| Wr 0.05,可以认为y与x之间的线性相关关系不显著,接受统计假设。如果|r|r 0.05,可以认为y与x之间不具有线性相关关系的假设是不成立的,即 y与x之间 具有线性相关关系。【典型例题讲解】例1.从某班50名学生中随机抽取10名,测得其数学考试成绩与物理考试成绩资料如表:序号12345678910数学成绩54666876788285879094物理成绩61806286847685828896试建立该10名学生的物理成绩对数学成绩的线性回归模型。AA解:设数学成绩为x,物理成绩为y,则可设所求线性
3、回归模型为y=010101010Yx =780 Yv. =800yr2 =62210,7 = 63413,计算E国汽i=l,代入公式得国日=0.7394 * 0.74, a = -0.14 = 22.28.137001010所求线性回归模型为=0.74x+22.28 。A说明:将自变量x的值分别代入上述回归模型中,即可得到相应的因变量的估计值y,由回归模型知:数学成绩每增加1分,物理成绩平均增加 0.74分。大家可以在老师的帮助下对自己班的数学、化学成绩进行分析。例2.假设关于某设备的使用年限x和所支出的维修费用 y (万元),有如下的统计资料:x23456y2.23.85.56.57.0若由
4、资料可知y对x成线性相关关系。试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了 y与x间成线性相关关系,目的是训练公式的使用。 解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0 xiyi4.411.422.032.542.049162536112.3-5x4x590-5x42= 1.23文演乃-5个i-l1 5 -7 5 口 M糕-15尸)于是 b=a= 5-123x4 = 0.08,线性回归方程为:A=bx+a=1.23x+0.08。(2)当x=10时,=1.23X10+0.0 8=12.38(万元)即估计
5、使用10年时维修费用是12.38万元。说明:本题若没有告诉我们 y与x间是线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。例3.某省七年的国民生产总值及社会商品零售总额如下表所示:已知国民生产总值与 社会商品的零售总额之间存在线性关系,请建立回归模型。年份国民生产总值(亿元)社会商品零售总额(亿元)1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.5437
6、5.111991858.47413.18合计4333.012194.24解:设国民生产总值为X,社会商品零售总额为 y,设线性回归模型为y 山十九依上表计算有关数据后代入的表达式得:=0 4459577乂1440905854 433 01x2194,24 = 57g6724326 7x286751214-(433.01 - 1297595.838a = 2194 24 - 0.445957 ,= 37 4148.所求线性回归模型为 y=0.445957x+37.4148,表明国民生产总值每增加1亿元,社会商品零售总额将平均增加4459.57万元。例4.已知某地每单位面积菜地年平均使用氮肥量xk
7、g与每单位面积蔬菜每年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份 119931994199519961997199871999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量 y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。分析:(1)使用
8、样本相关系数计算公式来完成;(2)查表得出显著水平 0.05与自由度152相应的相关系数临界值0.05比较,若rr0.05,则线性相关,否则不线性相关。解:(1)列出下表,并用科学计算器进行有关计算:i123 456789101112131415xi707480788592909592108115123130138145yi5.1 6.06.87.89.0 10.210.012.011.511.0 11.812.2 12.5 1216258 13.0 xi yi357 44-4544608.4765938.4900 11401058118813571500.61766.41885 = 10;连
9、史2 = 101115152 = 161125,号丁; =n2&55,号彳必=16076.8 i-lt-1故蔬菜产量与施用氮肥量的相关系数:16076.8-15x101x10 110.8643.由于n=15,故自由度15-2=13。由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值0.05=0.514,则rr0.05,从而说明蔬菜产量与氮肥量之间存在着线 性相关关系。A(2)设所求的回归直线方程为 =bx+a,则15一_ 卒M 75生 _ 16076.8-15x101x10 1175r:-L161125-15x101电 0 093La =-ix= 10,11- 0.093
10、1x101 0,7102,A回归直线方程为=0.0931x+0.7102 。当 x=150 时,y 的估值=0.0931 X 150+0.7102=14.675(t)。说明:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心谨慎计算,如果会使用含统计的科学计算器,能简单得到 尸1谆1 *1*】,谆1这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也 可以对这些数据进行处理。x-9-6.99-5.01-2.98-554.9994y-9-7-5-3-5.024.9953.998【练习精选】一、选择题1.观测两相关变量得如下数据:则下列选项中最佳的回归方
11、程为()1,A. y x 12B.y1C. y = 2x + D.y= 2x+13解析:对表格中的数据进行适当的近似处理,分别代入选项中进行检验,每组数据都相差不多的直线模型为最佳回归方程 .仔细观察可以发现,表格的每组数据的x和y都近似相等,所以回归方程为y = x.答案:B2.下列两个变量之间是相关关系的是()A.圆的面积与半径B.球的体积与半径C.角度与它的正弦值D.一个考生的数学成绩与物理成绩解析:相关关系不是确定的函数关系,这里A、B C都是确定的函数关系.答案:D3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育
12、活动C.H。:喜欢参加体育活动与性别有关D.H。:喜欢参加体育活动与性别无关解析:独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果 K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.答案:D.已知一组观测值具有线性相关关系,若对于 ?= &+J?,求得9=0.51 , x = 61.75, y= 38.14 ,则线性回归方程为()A. ? = 0.51x+6.65B.y?= 6.65x+0.51C. ? = 0.51x+42.30D.y?= 42.30X+0.51解析:a = y -ibx = 38.14 0.51 X 61.75 =
13、42.30.答案:C.下面关于卡方说法正确的是()A.K2在任何相互独立的问题中都可以用于检验有关还是无关.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否相关的随机变量,当K2的值很小时可以推定两类变量不相关D.K2的观测值的计算公式是K2 =n(ad -bC)(a b)(c d )(a c)(b d)-.22解析:K只适用于2X2型列联表问题,且K只能推定两个分类变量相关,但不能推定两个变量不相关.选项D中K2公式错误,分子上少了平方 .答案:B二、填空题n(ad - bc).根据下表,K2-.(保留两位小数)-一 一 - _又发病启未移植手术Q40r未移植手术43P
14、2(a b)(c d)(a c)(b d)解析:把列联表的行和列的合计补充完整,可利用公式k2 =接计算.答案:1.39.下列命题:用相关系数r来刻画回归的效果时,r的值越大,说明模型拟合的效果越好;对分类变量X与丫的随机变量的K2观测值来说,K2越小,“X与丫有关系”可信程度越大;两个随机变量相关性越强,则相关系数的绝对值越接近1;其中正确命题的序号是 .(写出所有正确命题的序号)解析:正确的是,是由于 r可能是负值,中K2越大,“X与Y有关系”可信程度越大答案:三、解答题.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).施化肥量X
15、15202530354045水稻厂量y330345365405445450455(1)画出散点图;(2)求y关于x的线性回归方程;(3)若施化肥量为38 kg ,其他情况不变,请预测水稻的产量解:(1)根据题表中数据可得散点图如下:,统计数据如下不太主动参加班级工作且学习积极性一般的学生有(2)根据回归直线方程系数的公式计算可得回归直线方程是? = 4.75X+257.把x = 38代入回归直线方程得 y = 438,所以,可以预测,施化肥量为38 kg ,其他情况不变 时,水稻的产量是 438 kg.积极参加班级工作不太主动参加班级工 作合计学习积极性高18725学习积极性一般61925合计
16、2426509.某班主任对全班 50名学生学习积极性和对待班级工作的态度进行了调查 表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽19人,概率为19 .50 TOC o 1-5 h z 一,一一 _、 2.一250(1819 -67)15011 5(2) K 二二11.5,24 25 24 26132.- K 6.635,有99%勺把握说学习积极性与对待班级工作的态度有关系10.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2
17、)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y= t?(+c?;(3)已知该厂技改前 100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3X 2.5+4 X3+5X 4+6X 4.5 = 66.5)解:(1)由题设所给数据,可得散点图如图.能艳:晚标准煤)54 35 屯2.(2)由对照数据,计算得4一 2Z Xj =86 ,i 12.5 3 4 4.544已知 xi yi = 66.5 , i 1所以,由最小二乘法确定的回归方程的系数为4_ _: xi yi - 4x y12 T66.
18、5 -4 4.5 3.5 幻 一 ,b? = -4=2- =0.7 ,3=y 取=3.5 0.7 X 4.5 =0.35,x42286 -4 4.52xi - 4x i 1因此,所求的回归方程为y=0.7x+0.35. 由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90(0.7 X 100+0.35)= 19.65(吨标准煤).11.对某校学生进行心理障碍测试得到如下列联表:焦虑说谎懒惰合计女生5101530男生20105080合计252065110试说明在这三种心理障碍中哪一种与性别关系最大?解:由题设表格可得三个新的表格如下:关于是否得到焦虑的结论:焦虑不焦虑合计女生52530男生206080合计2585110关于是否说谎的结论:说谎不说谎合计女生102030男生10708
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论