整理回归分析测试题_第1页
整理回归分析测试题_第2页
整理回归分析测试题_第3页
整理回归分析测试题_第4页
整理回归分析测试题_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、测试题(s)1.下列说法中错误的是()A .如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1 , 2, 3,,n)将散布在一条直线附近如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。C.设X, y是具有线性相关关系的两个变量,且回归直线方程是9爲"自,贝yg叫回归系数D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系2.在一次试验中,测得(X, y)的四组值分别是(1, 2), X之间的回归直线方程是()(2, 3), (3, 4), (4, 5),B.=工+2C. P=2h + 1

2、3.回归直线A + 必过点((0, 0)C.(00D.4在画两个变量的散点图时,下面叙述正确的是(A .预报变量在X轴上,解释变量在/轴上B .解释变量在 尤轴上,预报变量在 y轴上C.可以选择两个变量中任意一个变量在D .可以选择两个变量中任意一个变量在5.两个变量相关性越强,相关系数rA .越接近于0B .越接近于1C.越接近于1D .绝对值越接近16.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为(C. 17.位母亲记录了她儿子 3到9岁的身高,数据如下表:1年龄(岁)I34561 7891 94.8104.211 124.3130.8身高(网1 108.7117.8

3、139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A .她儿子10岁时的身高- 定是 145.83出B .她儿子10岁时的身高在145.83亡喘以上C.她儿子10岁时的身高在145.83亡喘左右D .她儿子10岁时的身高在145.83陶以下&两个变量有线性相关关系且正相关,则回归直线方程中,D. b=1能力提升:9一个工厂在某年每月产品的总成本y (万元)与该月产量X (万件)之间有如下数据:X1.081.121.191.281.36 11 1.481.591.681.801.871.982.07y2.252.372.402.552

4、.642.752.921 3.033.143.263.363.50(1)画出散点图;(2)求每月产品的总成本 y与该月产量x之间的回归直线方程。10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了 10个企业作样本,有如下资料:产量X (千件)40424855657988100120140生产费用y (千元)150140160170150162185165190185(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为夕"疋+总,求系数庄,$。综合探究:田11. 一只红铃虫的产卵数 y和温度X有

5、关。现收集了 7对观测数据列于表中,试建立 y与x之间的回归方程。温度x /C21232527293235产卵数y/个711212466115325参考答案:fa基础达标:a1. B尽管两个变量x与y之间不存在线性相关关系, 但是由试验数据仍可求出回归直线方程= 启中的5和£,从而可写出一个回归直线方程。2. A由回归直线经过样本点的中心(儿刃,由题中所给出的数据,亍二心4 + 4代入y =+ 中适合,故选A。3. D回归直线$=阳恥,必然经过样本点的中心,其坐标为,故选D。4.5.6.7.9.解析:(1)画出的散点图如图所示:4'VIx = y = ?ilZ £r

6、? = 29 808 士砂" 244 (2)12 ,K ,鼻丄,ii5>出-12 云 M24-12x h =卑=1212 M1 215迟彳-12i.L/w界29.808-12X k 12丿a = y -bx = mZ- 1.2ie X 0.973 " 12 12所以所求回归直线方程为j>=1.216x+).973o10.解析:(1)制表:zz1401501600225006000242140176419600588034816023042560076804551703025289009350565150422522500975067916262412624412

7、7987881857744342251628081001651000027225165009120190144003610022800,10140185196003422525900合计7771165770903277119132938107 = 222 = 777 亍二凹二比"70903= 27711910, i-i,1-1103-1132938-10x77.7x165.7(70903-10x77.7'*X277115-10x1665.7')« O.SOS即x与y的相关系数r疋0.808。(2)因为I厂A °方,所以可以认为x与y之间具有很强的线

8、性相关关系。£二旦U空学2“逸(3),&=165.7-O398x777fy 1M4_8。70503-10x77.7综合探究:S311.解析:散点图如图所示:时*350,*300-*230200-GH*SO h*0»*22*14 i'ia Asis'j/x由散点图可以看出:这些点分布在某一条指数函数护"的图象的周围。现在,问题变为如何估计待定参数C1和C2,我们可以通过对数变换把指数关系变为线性关系。令"3,则变换后样本点应该分布在直线"加+位(口=血5 ,心口)的周围。这样,就可以利用线性回归模型来建立y和x之间的非线性

9、回归方程了。21232527293235由题中所给数据经变换后得到如下的数据表及相应的散点图xz1.9462.3983.0453.1784.1904.7455.784T654323 24 2630 32 34 if if因此可以用线性回归方程来2由图可看出,变换后的样本点分布在一条直线的附近, 拟合。7迟兀召二丁 33 一 741口。设所示的线性回归方程为则有5414-7x27.4295=3.612-0.273>27.429 iy-3.S76得到线性回归方程分= 0.27女-汀76因此红铃虫的产卵数对温度的非线性回归方程为总结升华:(1)在散点图中,样本点并没有分布在某个带状区域内, 关

10、系,所以不能直接利用线性回归方程来建立两个变量之间的关系。 发现样本点分布因此两个变量不呈线性相关根据已有的函数知识,可以在一条指数函数曲线P = 的周围,其中C1和C2是待定参数。(2)选择适当的非线性回归方程。然后通过变量代换,将非线性回归方程化为线性回 归方程,并由此来确定非线性回归方程中的未知参数。(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有回归分析宙撰稿吕宝珠审稿谷丹责编:严春梅课程标准的要求由回归分析的基本思想及其初步应用:(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;能读或画出两个变量的散

11、点图,并能根据散点图来粗略判断两个变量是否线性相关;理解线性回归模型;理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体计算公式.(5) 了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方 和;了解样本的数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样本的各个点的随机误差的效应的平方和)的参数:残差平方和;了解表示解释变量效应的参数:回归平方和;了解刻画回归效果的相关指数的含义及计算公式。(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的)(6) 了解残差分析的方法及意义,会读或会作残差图

12、.重点和难点分析田回归分析的基本思想及其初步应用。内容精讲口1.相关关系:a当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系。不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变 量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.2. 回归分析:S元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相

13、关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。散点图形象地反映了各对3. 散点图:a表示具有相关关系的两个变量的一组数据的图形叫做散点图 数据的密切程度。粗略地看,散点分布具有一定的规律。4. 回归直线囱n设所求的直线方程为y =,其中a、b是待定系数.迟区-无刃乞吗鹅-丹秒 b 二 - J

14、Z-1说=J 色壬相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。y与x的一组观测值,把5. 相关系数:S相关系数是因果统计学家皮尔逊提出的,对于变量工(占-无)(必-y)Y站M - 两,1 HJiI BJtg2-1= Tj-L叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线 性相关程度.6. 相关系数的性质:aW 1,且厂越接近1,相关程度越大;且越接近0,相关程度越小.7. 显著性水平:a它必须在显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。每一次统计检验之前确定。8. 显著性检验:a由显著性水平和自由度查表得出临界值,显

15、著性水平一般取0.01 和 0.05,自由度为n0.05 或 0.01-2,其中n是数据的个数 ,在“相关系数检验的临界值表” 查出与显著性水平及自由度n-2 (n为观测值组数)相应的相关数临界值r 0.05或r 0.01;例如n = 7时,r 0.05Wr 0.05或r 0.01,认为线性关系不显著。=0.754 , r 0.01 = 0.874 求得的相关系数r和临界值r 0.05比较,若r>r 0.05,上面y与x是 线性相关的,当卜典型例题:fa如下一组数据:庄iRr 1 .一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由X1.081.121.191.28

16、1.361.481.591.681.801.871.982.07Y2.252.372.402.552.642.752.923.033.143.263.363.501)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.解析:i123456789101112Xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50Xiyi2.432.2642.856 3.2643.5904.074.6435.0905.6526.096

17、6.6537.245771艮5刃"二 2却5= 29.808 迟3? = 99 2的 1 工;砂产54 2431212U1J-1口? ? ? ?1) 画出散点图:3.53-2.51.5u1,5卫_另召片-12剳1-11123 U r2)=0.99789134.171254 243-12xlx2iH12 12I g峙JC2?.8O8- 12x(5) (99.2031-12 x (在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值y (万元)与该月产量 x (万件)之0.05=0.576 < 0.997891,这说明每月产品的总成本间存在线

18、性相关关系。3)设回归直线方程卩=及? +煌132吗北-12砂“ rJ-1利用 计算a, b,得b 1.215,"八庚机刃4回归直线方程为:pi卫念*0.974得数据如下(单位:kg)圉施化肥量x15202530354045I水稻产量y3303453654054454504551)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。解析:1) 画出散点图如下:45040030010 15202530354045 X2)检验相关系数r的显著性水平:i1234567Xi15202530354045yi330345365405445450455Xiyi

19、49506950912512150155751800020475777-.Yy' = 1132725 Yx-y = 87175"go八399了台,台刀台必JJJJ7E吗r = f 7""J:87175-7x30x399.3 i-lj-Lr« 0.9133(7000-7 x30)(1132725-7x399.3)在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值0.05=0.754 < 0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。3)设回归直线方程,利用a = y bx计算 a, b,得7

20、000-7x30"4a=399.3 -4.75 X 30 疋 257,则回归直线方程 A = 4一?5玄 + 25?Xyt之间的关系有如下数据:ts年份19851986198719881989199019911992xkg与每单位面积蔬菜年平均产量x(kg)70741 807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线

21、性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若厂°皿 则线性相关,否则不线性相关。解析:(1)列出下表,并用科学计算器进行有关计算:i1234 11 5678|91011121314157074807885929095921081151231301381455.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0巒i357444544608.4765938.49001140”058118813571500.616251766.4188516076 8151515工=16112于=1628.55 迟 心故蔬菜产量与放用氮肥量的相关系数16076.8-15xWl?<10.nU1i-l1-1r 二W 0.36437(161125-15x10)(1628.5-15x10.11')由于n=15,故自由度15-2=13 O由相关系数检验的临界值表查出与显著水平0.05及自由度1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论