




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关与回归分析思考与练习一、判断题产品的单位成本随着产量增加而下降,这种现象属于函数关系。答:错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。相关系数为0表明两个变量之间不存在任何关系。答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。答:对,因果关系的判断还有赖于实质性科学的理论分析。圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。答:错。两者是精确的函数关系。总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。答:对。当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。二、选择题变量之间的关系按相关程度分可分为:b、c、da.正相关;b.不相关;c.完全相关;d.不完全相关;复相关系数的取值区间为:aa.0WRW1;b.—1WRW1;c.—aWRW1;d.—1WRWw3•修正自由度的决定系数a、b、da.R2WR2;b.有时小于0;c.0WR2W1;d.比R2更适合作为衡量回归方程拟合程度的指标4.回归预测误差的大小与下列因素有关:a、b、c、da样本容量;b自变量预测值与自变量样本平均数的离差c自变量预测误差;d随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。两者之间的单相关关系出现正相关是因为背后还有天气等因素的影响,天气越热,两种冷饮的消费量都越多。如果设法将天气等因素固定不变,单纯考察冰激凌与汽水的消费量,则可能出现负相关关系。像这种假定其他影响因素不变专门考察其中两个因素之间的关系就成为偏相关。2.讨论以下几种场合,回归方程Y二B+BX+pX+u中回归系数的经济意义和应t122t33tt取的符号。Yt为商业利润率;X2t为人均销售额;X3t为流通费用率。Yt为粮食销售量;X2t为人口数;X3t为人均收入。
Yt为工业总产值;X2t为占用的固定资产;X3t为职工人数。Yt为国内生产总值;X2t为工业总产值;X3t为农业总产值。答:(1)P>0,0<023人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低(2)0>0,0>023人口数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆与粮食销售量呈正相关关系。(3)0>0,0>023固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它们与工业总产值的关系为正相关。(4)0>0,0>0,0>0123因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系,同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以,01>0。四、计算题1.设销售收入X为自变量,销售成本丫为因变量。现根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)Z(X—X)2=425053.73;X=647.88;Z(Y—Y)2=262855.25;Y=549.8;Z(Y—Y)(X—X)二334229.09拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释。计算决定系数和回归估计的标准误差。对02进行显著水平为5%的显著性检验。假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。解:(1)解:(1)Q2工(Y—Y)(X—X)=tt乙(X—X)2t334229.09425053.73二0.7863AA0二Y—0X二549.8—0.7863*647.88二40.3720122)—Y)(X—2)—Y)(X—X)]2r2=X)2(Y—Y)2=0.999834334229.09=0.999834425053.73*262855.25工e2二(1—r2)Z(Y—Y)2二43.6340t11)S=e二2.0889n一2(3)H:p二0,H:p丰00212,,2.0889S=e二2.0889n一2(3)H:p二0,H:p丰00212,,2.0889=0.003204鸽(X—X)2<425053.73t0.7863=245.4120S0.003204P2ta/2(n-2)二t(10)二2.2280.05t值远大于临界值2.228,故拒绝零假设,说明卩2在5%的显著性水平下通过了显著性检验。(4)Y=40.3720+0.7863*800二669.41(万元)S=S,・1+丄+y丿efnZ(Xf-X)2(X一X)2II(800一64788)2―=俪眇讣+三+425053.73=皿9所以,Yf的置信度为95%的预测区间为:Y土t,(n—2)S=669.41土2.228*1.0667=669.41土2.3767fa/2ef所以,区间预测为:664.64<Y<674.182.对9位青少年的身高Y与体重X进行观测,并已得出以下数据:工Y=13.54,工y2=22.9788,工X=472,工X2=28158,iii工XY=803.02ii以身高为因变量,体重为自变量,建立线性回归方程;计算残差平方和决定系数;计算身高与体重的相关系数并进行显著性检验;(自由度为7,显著水平为0.05的t分布双侧检验临界值为2.365。)要求:(1)(2)(3)4)对回归系数B2进行显著性检验。解:工(Y―Y)(X―X)N工XY―工X工Y)St=1~tt1-(X一X)2t(X—X)2N乙X2―(X一X)2ttt二0.02739*803.02-二0.02739*28158-472*4720二Y-0X二13.54/9-0.0273*472/9二0.072712(2)决定系数:=0.9723(Y-Y)(X-X)]2Z(X-X)2S(Y-Y)2=0.9723残差平方和工e2=(1—r2)工(Y—Y)2=0.0722t(3)身高与体重的相关系数:r=4R2=、0.9723=0.9861H:0=0=0,H:0和0不同时为零012112忆e2S=」=0.1016en—202S(X-X)2检验统计量F=—t=245.9134S2eF=t(N-2)1,N-2F值远大于临界值2.365,故拒绝零假设,说明回归方程在5%的显著性水平下通过了显著性检验。(4)H:0=0,H:0丰00212S02Se詳(X-X)2S02Se詳(X-X)2It0.027313404.222=0.00050.027302020.0005=54.6a/20.05(7)=2.365t值远大于临界值2.365,故拒绝零假设,说明02在5%的显著性水平下通过了显著性检验。3.我国2004年部分副省级大中城市的有关资料如下表。城市人均消费支出Y(元/人)人均可支配收入X(元/人)人均储蓄X(元/人)沈阳721318924222470.93
大连
大连
哈尔滨南京
武汉
济南
青岛
杭州
宁波
武汉
广^州
厦门86721037826185.596896894013402.7683501160224994.587793956419175.4684711079815298.7790021108916495.77112131456529083.99112831588223257.837793956419175.46131211688459786.52107391444338261.19资料来源:厦门市统计局网站,其中人均储蓄根据储蓄额与人口数推算。试根据该表的资料,⑴拟合以下形式的消费函数:Yt=0i+02X.t+03X2t+Ut(2)计算随机误差项的标准差估计值、修正自由度的决定系数,并对整个回归方程进行显著性检验。(3)假设某一居民家庭人均可支配收入为i2,000元,人均储蓄为40000元,试预测其人均消费支出,并给出置信度为95%的预测区间。解:(1)回归分析的EXCEL操作步骤为:步骤一:首先将数据粘贴导入EXCEL数据表中。步骤二:进行回归分析选择“工具”一“数据分析”一“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:选择“工具”一“数据分析”一“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:得到回归分析的输出结果见下图。因此回归方程为:Y二1596.0116+0.5879X-0.0245Xt1t2t
回归统计MultipleRRSqi_i;areAdjustedRSc标准误差踮则值0.984881770.969992110.96332369369.37162412方差分析dfSSMSFmific:;anc:eF回归分析23969193719845969145.46061.4E-071F91227919136435.41140919856Coefficient标准误差tStatP-valueLower95%Upper95%下限95.0%±限95.0%InterceptX\Wiable1X\Wiable21596.01156520.91993.0638330.013488417.60882774.4143417.608822774.41430.587926420.0600959.7832824.29E-060.4519820.72387080.45198210.72387080.024500730.0133011.8420420.098591-0.005590.0545894-0.0055880.054589^(2)随机误差项的标准差估计值为:S=369.3716,修正的决定系数为:R2=0.9633。h:二o,h:队p和B不同时为零01231123F=145.4606远大于F统计量的临界值4.10,说明回归方程在5%的显著性水平下通过检验。(3)预测点估计值为:C二1596.0116+0.5879*12000-0.0245*40000二9631.158f使用EXCEL进行区间估计步骤如下:步骤一:构造工作表步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称首先,定义F6、F7、F8的名称:选定E6:F8区域,然后执行菜单命令“插入”一“名称”一“指定”,
在调出的对话框中选中“最左列”,单击“确定”:其次,定义B2:D13的名称:先选定该区域,然后执行然后执行菜单命令“插入”一“名称”一“定义”:
调出“定义名称”对话框,输入名称“X”,单击“确定”。最后,采用同样方法,将B15:D15定义为“Xf”,将F2:F4定义为“B”。步骤三:计算点预测值Cf在F6中输入公式“=MMULT(Xf,B)”,按回车键即可。步骤四:计算t临界值在F7中输入公式“=TINV(1-0.95,12-3)”,按回车键即可。步骤五:计算预测估计误差的估计值Sef在F5中输入公式:“=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X))),TRANSPOSE(Xf))然后按“Ctrl+Shift+Enter”组合键即可。再计算S,在F8中输入公式“=369.3716*SQRT(1+F5)”。369.3716为回归估计标准差。e
步骤六:计算置信区间上下限在F9、F10中分别输入公式“=Cf-t临界值*Sef”和“=Cf+t临界值*Sef”。结果为:FG区间预测P11596.0116B20.5879264卩30.02450070.2802868Cf9631.157834Sef2.262157158t临界值417.943076置信区间下限8685.704963置信区间上限10576.61081最终得出C的区间预测结果:f8685.7050<C<10576.6108f4.设有以下资料试拟合以下总成本函数Y=p+PX+PX2+PX3+ut12t3t4tt根据总成本函数推导出平均成本函数,并描出平均成本函数的图形。试根据以上结果推算总产量为1550时的单位产品平均成本。某企业近年来总成本与产量年份总成本Y产量X年份总成本Y产量X199732900400200386300900199852400600200413900012001999424005002005115700110020006290070020061548001300200174100800200717870014002002100000100020082031001500解:构造EXCEL数据表,并与前面所述的同样步骤进行回归分析,得到相应的回归分析结果(见下页)。得到的回归方程为:Y=480.8525+83.7399X-0.0177X2+0.0000348X3ttttttIicrosoftExcel-统计学第六章习题囲文件込编辑⑥视閤②插入①格式迫)工具⑴数据⑪窗口⑩帮」SLUiIM^YOUTPUT回归统计MultipleR0.999717649RSqu:SLUiIM^YOUTPUT回归统计MultipleR0.999717649RSqu:are0.999435378Adjust已dRS(0.999223644标准误差1543.729057观狈値12dfSSMSFSisnific:;anc:eF方差分析r
一回残总一333746497705112488325684720.r
一回残总一333746497705112488325684720.2532.50055E-138190两95.2亦3099.40111血窕500Intereept480.852480810052.948450.0478319850.963023-22701.3032123663.01-22701.323663.0082XV;ariable183.7298812336.699701382.2814867180.051951-0.89983663168.3596-0.899837168.359599XVariable2-0.0177355980.041097295-0.431551460.677462-0.1125061910.077035-0.1125060.077035XV:3riable33.47708E-051.43437E-052.4241190370.0415821.69418E-066.78E-051.694E-066.7847E-05Coefficients标准误差tStatPmlueLower95%Upper95%下卩艮95.0%上卩艮95.0%(2)求平均成本函数:因为平均成本y与总成本Y的关系为:y=仃,所以tttXt480.8525X+480.8525X+83.7399-0.0177Xt+0.0000348X2t□QDigd=ABCDE1年份总成本产量产量的平方产量的立方213290040016000064000000325240060036000021600000043424005002500001250000005462900700490000343000000657410080064000051200000076100000100010000001000000000878630090081000072900000098139000120014400001728000000109115700110012100001331000000111015480013001690000219700000012111787001400196000027440000001312203100150022500003375000000
将产量从1到2,000取值,代入上式,获得2000个平均成本的数据点,描出平均成本函数的图形,见图7-15。平均成本曲线000000654本成均平0000000321101201301401501601701801产量901100111011201严000000654本成均平0000000321101201301401501601701801产量901100111011201严14011501]601170118011901平均成本图7-15由图可知,平均成本随着产量的增加显示下降,达到一最低值之后,又会随着产量的增加而提高。(3)预测:当X二1550时,f480.8525y=+83.7399-0.0177X+0.0000348X2fXfff=140.0867五、证明题1.试证明斯皮尔曼等级相关系数是前面介绍的样本相关系数的特例。证明:X和Y序列排列后的等级记为R和R,斯皮尔曼等级r表示为:xyscov(R,R)工(R-R)(R-R)cov(R,R)xixyiy显然,Rx2显然,Rx2(R-R)2xixi=1i=1n+1,记:等级差d2i工(R-R)2yiy=R—R,贝y:xiyi-R)2二工(R-R)2xyiyi=1:工(R--R)2二工(R-R)2xyiyi=1'xixyiyxi”i=1i=1i=1=12+22+32+(n^)2=n(n2-D212
工(R-R)(R-R)工RR-n(n^1)2xixyi工(R-R)(R-R)工RR-n(n^1)2xixyiyxiyi2r=-i=i=i-1sn(n2-1)n(n2-1)1212工R2-工dR-n(n+1)2yiyi2—-i-4i-1-n(n2-1)工R2+工dR-£2-n(n+1)2yiixii2—-t—1i—1i—n(n2-1)1212对r进行以上类似分解,容易得出HdR-工dR,上式可转化为:sixiiyii—1i—1》R2+£r-Yd2-n(n+1)2yiiyii2r—-i—ii—ii—^-sn(n2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脊柱疼痛临床
- 2025年征信考试题库:征信产品创新与金融科技融合案例试题
- 2025年乡村医生农村急救技能操作考试题库:急救技能实操模拟试题
- 2025年护士执业资格考试康复护理学专项护理法律法规试题解析试卷
- 2025年统计学专业期末考试题库-统计质量管理经典案例分析试题集
- PowerPoint制作-撕纸效果
- 2025年环境影响评价工程师考试真题卷实战演练
- 危急重症抢救制度
- 土层锚杆的成孔
- 膝关节置换手术护理配合
- 医学课件:介入放射学(全套课件328张)
- 二年级下册课文(五)16雷雨-雷雨-学习任务单
- 食品添加剂、食品污染物的本底与转化来源
- 供应商管理控制流程图
- 泥石流勘察设计Word版(共44页)
- 普通生态学15章集合种群及其模型剖析课件
- 四年级下册健康成长教案(共26页)
- 义务教育语文课程标准(2022年版)
- 初中物理公式总结大全(最新归纳)
- GB 12268-2012 危险货物品名表(高清版)
- 人员培训质量风险评估报告
评论
0/150
提交评论