统计学一元线性回归课后习题答案学习教案_第1页
统计学一元线性回归课后习题答案学习教案_第2页
统计学一元线性回归课后习题答案学习教案_第3页
统计学一元线性回归课后习题答案学习教案_第4页
统计学一元线性回归课后习题答案学习教案_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1统计学一元线性回归课后习题统计学一元线性回归课后习题(xt)答案答案第一页,共54页。 从某一行业中随机抽取从某一行业中随机抽取12家企业,所得产量与生产费用的数据家企业,所得产量与生产费用的数据(shj)如下:如下:企业编号产量(台)生产费用14013024215035015545514056515067815478416581001709116167101251801113017512140185第1页/共53页第二页,共54页。产量和费用(fi yong)存在正的线性相关系数(1)绘制产量与生产)绘制产量与生产(shngchn)费用的散点图,判断二者之间的关系形态。费用的散点图,

2、判断二者之间的关系形态。第2页/共53页第三页,共54页。2222 yynxxnyxxynr222222212(40*130 42*150 . 140*185) (40 42 . 140)*(130 150 . 185)12*(4042 . 140)20 16 2212*(130 150 . 185) (130 150 . 185)r 2)计算产量与生产费用)计算产量与生产费用(fi yong)之间的线性相关系数。之间的线性相关系数。第3页/共53页第四页,共54页。2、计算(j sun)检验的统计量)2(122ntrnrt21220.92027.4354531 0.9202t(3)对相关系数

3、的显著性进行检验()对相关系数的显著性进行检验( ),并说明二者之间的关系强并说明二者之间的关系强度。度。第4页/共53页第五页,共54页。 学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构名学生构成的一个随机样本,取得成的一个随机样本,取得(qd)的数据如下:的数据如下:复习复习时间时间X X20201616343423232727323218182222考试考试分数分数Y Y6464616184

4、8470708888929272727777第5页/共53页第六页,共54页。复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系复习时间(shjin)和考试分数存在正的线性相关关系要求:(1)绘制复习时间和考试分数的散点图,判断(pndun)二者之间的关系形态。第6页/共53页第七页,共54页。2222 yynxxnyxxynr(2)计算)计算(j sun)相关系数,说明两个变量之间的关系强度。相关系数,说明两个变量之间的关系强度。222222228(20*6416*61 .22*77)(2016.22)*(6461 .77)8*(2016.22 )2016.228*

5、(6461.77 )(6461 .77)r第7页/共53页第八页,共54页。、根据一组数据建立的线性回归方程、根据一组数据建立的线性回归方程 要求:要求:1)解释截距)解释截距 的意义。的意义。1)解释斜率)解释斜率 的意义。的意义。2)当)当=6时的时的E(y)1)表示在没有自变量)表示在没有自变量X的影响时其他各种因素对因变的影响时其他各种因素对因变量量Y的影响为的影响为102)斜率的意义在于:自变量)斜率的意义在于:自变量X变化对变化对Y影响程度。回影响程度。回归方程中,当归方程中,当x增加一个增加一个(y )单位时单位时,y将减少个单位将减少个单位。3)x=6时,代入方程,则,时,代入

6、方程,则,y=10-0.5 6=7100.5yx10第8页/共53页第九页,共54页。11.4 设SSR=36,SSE=4,n=18要求:1)计算判定(pndng)系数R2并解释其意义回归直线对观测值的拟合程度为,说明变量Y的变异性中有90%是由自变量x引起的。2)计算估计标准误差 并解释其意义es2140.5218216niiieyySSEsn2360.940SSRSSRRSSTSSTSSE表示表示(biosh)实际值与估计值之间的差异程度是实际值与估计值之间的差异程度是第9页/共53页第十页,共54页。运送距离x825215107055048092013503256701215运送时间y3

7、.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 (1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计(gj)的回归方程,并解释回归系数的实际意义。第10页/共53页第十一页,共54页。(1)绘制运送距离和运送时间的散点图,判断二者之间的关系绘制运送距离和运送时间的散点图,判断二者之间的关系(gun x)形态形态第11页/共53页第十二页,共54页。运送距离运送距离x x运送时间运送时间y y运送距离运送距离x x1 1运送时间运送时间y y0.948940.948941 1(2

8、)计算计算(j sun)线性相关系数,说明两个变量之间的关系强度线性相关系数,说明两个变量之间的关系强度第12页/共53页第十三页,共54页。xyxxnyxyxnniniiiniiniiniii1012121111将表中数据(shj)代入公式得:=0.118129 =0.003585 (3)利用利用(lyng)最小二乘法求出估计的回归方程,并解释回归系数的实际意义。最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 y关于x的回归方程为表示运输距离每增加1公里,运送时间平均增加 天。第13页/共53页第十四页,共54页。 地区 人均GDP(元) 人均消费水平(元) 北京 辽宁 上海 江西

9、 河南 贵州 陕西 22 460 11 226 34 547 4 851 5 444 2 662 4 549 7 326 4 490 11 546 2 396 2 208 1 608 2 035第14页/共53页第十五页,共54页。要求: (1)人均(rn jn)GDP作自变量,人均(rn jn)消费水平作因变量,绘制散点图,并说明二者之间的关系形态。产量和生产费用(fi yong)之间存在着正的线性相关关系第15页/共53页第十六页,共54页。(2)计算两个计算两个(lin )变量之间的线性相关系数,说明变量之间的线性相关系数,说明两个两个(lin )变量之间的关系强度。变量之间的关系强度。

10、2222yynxxnyxxynr227*65100742127101240510.9981237*1904918867857397*134690076631609说明两个说明两个(lin )变量之间高度相关变量之间高度相关 第16页/共53页第十七页,共54页。(3)利用最小二乘法求出估计(gj)的回归方程,并解释回归系数的实际意义。 xyxxnyxyxnniniiiniiniiniii101212111104515.5714290.308683*12248.428127*651007421 2710124051=0.3086837*190491886785739=734.6928回归系数的含

11、义:人均回归系数的含义:人均GDP每增加每增加(zngji)1元元,人均消费增加,人均消费增加(zngji)元。元。第17页/共53页第十八页,共54页。(4)计算判定系数(xsh),并解释其意义。 niiniiniiniiyyyyyyyySSTSSRR1212121221人均人均(rn jn)GDP对人均对人均(rn jn)消费的影响达到消费的影响达到99.6%。81444968.68=0.996381750763.71第18页/共53页第十九页,共54页。 (5)检验(jinyn)回归方程线性关系的显著性(a=0.05)。181444968.68 11331.6921(2)305795.0

12、3 (72)SSRFSSE n第19页/共53页第二十页,共54页。y = 734.6928+ 0.308683 xy = 734.6928+ 0.308683 *5000=2278.1078 (6)如果某地区的人均(rn jn)GDP为5 000元,预测其人均(rn jn)消费水平。某地区的人均某地区的人均(rn jn)GDP为为5 000元,预测其人均元,预测其人均(rn jn)消费水平为元。消费水平为元。第20页/共53页第二十一页,共54页。(7)求人均(rn jn)GDP为5 000元时,人均(rn jn)消费水平95的置信区间和预测区间。21305795.034361159.007

13、225niiieyySSEsnnniiexxxxnsnty1220201)2(250004515.571412278.10782.5706*61159.007713625127.29人均(rn jn)GDP为5 000元时,人均(rn jn)消费水平95的置信区间为,2565.46399 第21页/共53页第二十二页,共54页。21305795.034361159.007225niiieyySSEsnn250004515.571412278.10782.5706*61159.007 1+713625127.29人均人均GDP为为5 000元时,人均消费水平元时,人均消费水平95的预测的预测(y

14、c)区间为,区间为,2975.74999。01580.46315()2975.74999E y第22页/共53页第二十三页,共54页。航空公司编号航班正点率顾客投诉次数181.121276.658376.685475.768573.874672.293771.272870.8122991.4181068.5125随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行(jnxng)调查,所得数据如下第23页/共53页第二十四页,共54页。二者之间为负的线性相关关系二者之间为负的线性相关关系(gun x)1)绘制散点图,说明)绘制散点图,说明(shumng)二者之间二者之间的股息形态的股

15、息形态第24页/共53页第二十五页,共54页。Coefficients标准误差t StatP-valueIntercept429.898635274.973373315.7340180.000437航班正点率-4.70112990.985891202-4.768410.001411回归系数 表示航班正点率每增加1%顾客(gk)投诉次数平均下降次。1=429.897-4.7*yx2)用航班正点率作自变量,建立(jinl)估计的回归方程,并解释回归系数的意义第25页/共53页第二十六页,共54页。213035.96519.449228niiieyySSEsnn12221119.4490.98589

16、1157830.39*757.910enniiiissxxn114.74.76840.98589tst=4.7684t,拒绝,拒绝(jju)H0,回归系数,回归系数显著显著11 (8)tts3)检验)检验(jinyn)回归系数的显著性()回归系数的显著性()第26页/共53页第二十七页,共54页。213035.96519.449228niiieyySSEsnn208 02211(8)1 0eniixxytsxx037.66()70.619E y计算计算(j sun)得得4)如果航班正点率为80%,估计顾客(gk)投诉次数8 0= 4 2 9 .8 9 7 -4 .7* 8 0 = 5 4 .2

17、y5)求航班正点率为80%,顾客(gk)投诉次数95%的置信区间和预测区间第27页/共53页第二十八页,共54页。213035.96519.449228niiieyySSEsnn20802211(8)110eniixxytsxx07.572()100.707E y计算计算(j sun)得得第28页/共53页第二十九页,共54页。11.8 下面(xi mian)是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。地区编号地区编号出租率(出租率(% %) 每平方米月租金(元)每平方米月租金(元)170.699269.874

18、373.483467.170570.184668.765763.467873.5105971.4951080.71071171.2861262861378.71061469.5701568.7811669.5751767.7821868.4941972922067.976第29页/共53页第三十页,共54页。回归统计Multiple R0.79508R Square0.632151Adjusted R Square0.611715标准误差8.568399观测值20方差析dfSSMSFSignificance F回归分析12271.0362271.03630.933182.8E-05残差1813

19、21.51473.41746 总计193592.55 第30页/共53页第三十一页,共54页。CoefCoefficificientsents标准标准误差误差t t StatStatP-P-valuvalue eLoweLower r 95%95%UppeUpper r 95%95%下限下限 95.095.0% %上限上限 95.095.0% %InterceInterceptpt- -94.294.249849832.032.079477947- -2.932.938018010.000.0087928792- -161.161.646646- -26.826.8534534- -161.1

20、61.646646- -26.826.8534534X X VariablVariable 1e 12.532.53649264920.450.45605960595.565.56176117612.8E2.8E-05-051.571.57834783473.493.49463746371.571.57834783473.493.4946374637第31页/共53页第三十二页,共54页。 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到(d do)下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归2.17E09残差40

21、158.07总计111642866.67参数估计表参数估计表Coefficients 标准误差tStatPvalueIntercept363.689162.455295.8231910.000168XVariable11.4202110.07109119.977492.17E09第32页/共53页第三十三页,共54页。 (1)完成(wn chng)上面的方差分析表。变差来源dfSSMSFSignificanceF回归11602708.61602708.6399.10000652.17E09残差1040158.074015.807总计111642866.67第33页/共53页第三十四页,共54页

22、。 (2)汽车(qch)销售量的变差中有多少是由于广告费用的变动引起的? 汽车销售量的变差中有97.56%是由于(yuy)广告费用的变动引起的 2SSR1602708.6R =0.9756SST1642866.67(3)销售量与广告费用之间的相关系数是多少(dusho)? 2r= R0.9877第34页/共53页第三十五页,共54页。(4)写出估计(gj)的回归方程并解释回归系数的实际意义。 =363.6891+1.420211*yx回归系数的意义:广告费用每增加回归系数的意义:广告费用每增加(zngji)一个单位,一个单位,汽车销量就增加汽车销量就增加(zngji)个单位。个单位。(5)检验

23、(jinyn)线性关系的显著性(a0.05)。p=2.17E09,显著。 第35页/共53页第三十六页,共54页。根据下面的数据建立回归方程,计算残差,判定根据下面的数据建立回归方程,计算残差,判定R2,估计标,估计标准误差准误差se,并分析回归方程的拟合,并分析回归方程的拟合(n h)程度。程度。=13.6254+2.30293*yx第36页/共53页第三十七页,共54页。2i1y=43.53094niiSSEy残差残差2143.53094=3.809241223niiieyySSEsnn估计估计(gj)标准误差标准误差se第37页/共53页第三十八页,共54页。本题(bnt)判定系数,可以

24、看出拟合程度好。21212694.8651.2691651.26910.937348694.8niiniiSSTyySSRyySSRRSST判定判定(pndng)R2第38页/共53页第三十九页,共54页。 从20的样本(yngbn)中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:01:0H。(1)线性关系检验的统计(tngj)量F值是多少? 12SSRSSEn6014018解:(1)SSR的自由度为1;SSE的自由度为n-2=18; F=27 (2)给定显著性水平(shupng)a,Fa是多少?1,18F0.051,18F= (3)是拒绝原

25、假设还是不拒绝原假设? 拒绝原假设,线性关系显著。 第39页/共53页第四十页,共54页。SSRSSRSSE0.6r= 由于(yuy)是负相关,因此(5)检验(jinyn)x与y之间的线性关系是否显著? 从F检验看线性关系显著。 F=271,18F 第40页/共53页第四十一页,共54页。从n=20的样本中得到(d do)的有关回归结果是: y=5+3x, =1 =2,es要求(yoqi)1)当x=4时,构建y的平均值的95%的置信区间x21() =20niiXXniiexxxxnsnty1220201)2(020.025x=4=5+12=17(2)=(18)=2.1009ytnt当时,242

26、1172.1009*1*=17 1.050452020置信区间 15.94955 , 18.05045第41页/共53页第四十二页,共54页。2)当x=4时,构建(u jin)y的平均值的95%的预测区间020.025x=4=5+12=17(2)=(18)=2.1009ytnt当时,2002211(2)1+eniixxytnsnxx2421172.1009*1* 1=172.34892020预测区间 14.6511 , 19.3489第42页/共53页第四十三页,共54页。 11.13 一家公司拥有多家子公司,公司的管理者一家公司拥有多家子公司,公司的管理者想通过广告想通过广告(gunggo)

27、支出来估计销售收入,为支出来估计销售收入,为此抽取了此抽取了8家子公司,得到广告家子公司,得到广告(gunggo)支出支出和销售收入的数据如下(单位:万元)和销售收入的数据如下(单位:万元)广告支出X12.5 3.721.6 6037.6 6.116.8 41.2销售收入Y1485533899454189126379建立线性回归建立线性回归(hugu)模型,当模型,当x=40万元时,构建销售收入万元时,构建销售收入95%的置信区间。的置信区间。第43页/共53页第四十四页,共54页。第44页/共53页第四十五页,共54页。y0当x=40万元时 E(y0)t/2=t217 0 9 0 9 .2=

28、 1 0 8 .7 5 7 5226niiieyyS S Esnnniiexxxxnsnty1220201)2(2214 02 4 .9 3 7 515 6 3 .2 9 92 .4 4 6 9 * 1 0 8 .7 5 7 51 02 4 .9 3 7 5niix=563.299 121.74置信区间为置信区间为441.559 , 685.039第45页/共53页第四十六页,共54页。从两个回归分析中得到(d do)的残差如下:绘制残差图,你会得出什么(shn me)结论。第46页/共53页第四十七页,共54页。回归回归(hugu)1 :观察图像可以看出,残差值基本上集中在两条平行线之间,表

29、明对于所有值,方差(fn ch)都相同,所以认定其假定描述变量x和y之间关系的回归模型是合理的。 第47页/共53页第四十八页,共54页。回归回归(hugu)2: 对于不同的x值残差相差也较大,且其残差值基本上集中在两条曲线之间,这就意味着其违背了方差相等的,表明所选择的回归模型(mxng)不合理,应该考虑曲线回归或多元回归。第48页/共53页第四十九页,共54页。11.15 随机抽取7家超市,得到其广告费支出和销售额数据(shj)如下:11.15 随机抽取(chu q)7家超市,得到其广告费支出和销售额数据如下: 超市 广告费支出(万元) 销售额(万元) A B C D E F G l 2

30、4 6 10 14 20 19 32 44 40 52 53 54第49页/共53页第五十页,共54页。解:(1)(1)用广告费支出(zhch)作自变量x,销售额作因变量y,求出估计的回归方程。CoeCoeffifficiecientsnts标标准准误误差差t t StaStat tP-P-valvalueueLowLower er 95%95%UppUpper er 95%95%下下限限 95.95.0%0%上上限限 95.95.0%0%InterInterceptcept29.29.39939911114.84.807207253536.16.115515573730.00.0016016959517.17.041041676741.41.756756555517.17.041041676741.41.7567565555X X VariaVariable 1ble 11.51.547447478780.40.463463499993.33.338638688880.00.020520582820.30.356056016162.72.738938939390.30.356056016162.72.73893893939=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论