统计及优化实验报告_第1页
统计及优化实验报告_第2页
统计及优化实验报告_第3页
统计及优化实验报告_第4页
统计及优化实验报告_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南昌大学统计与优化实验报告学院:管理学院专业:管理科学121班姓名:黄恬恬学号:5504112028统计优化实验(一)数据选择与分析为了研究税收(T)发展状况,选择国内生产总值(GDP)、财政支出(GE)为影响因素,建立计量经济模型分析因素之间的经济关系。选取下表的有关统计数据,模型如下:税收收入等有关统计数据单位:亿元年份税收收入T国内生产总值GDP财政支出GE1978519.283645.21122.091979537.824062.61281.791980571.74545.61228.831981629.894891.61138.411982700.025323.41229.981983775.595962.71409.521984947.357208.11701.0219852040.7990162004.2519862090.7310275.22204.9119872140.3612058.62262.1819882390.4715042.82491.2119892727.416992.32823.7819902821.8618667.83083.5919912990.1721781.53386.6219923296.9126923.53742.219934255.335333.94642.319945126.8848197.95792.6219956038.0460793.76823.7219966909.8271176.67937.5519978234.04789739233.5619989262.884402.3107985889677.113187.67200012581.5199214.615886.5200115301.38109655.218902.58200217636.45120332.72205331135822.824649.95200424165.68159878.328486.89200528778.54184937.433930.28200634804.35216314.440422.73200745621.97265810.349781.35200854223.79314045.462592.66通过绘制T,GDP,GE之间的散点图,可以猜测三者之间存在线性关系,因此采用OLS方法建立线性回归模型。用OLS建立多元线性回归模型输出结果如下:回归模型为:结果可以看出,反映拟合优度的可决系数接近于1,F统计量很大,但常数C与GDP均未能通过回归系数t检验,说明原模型是有问题的模型。模型中参数表明国内生产总值(GDP)每增加1000亿元,税收收入将增加1亿元;财政支出每增加1000亿元,税收收入将增加867亿元。从财政支出对于税收收入的影响看,参数值偏大,可能与模型的设定及其它违背假设的问题有关,问题所在将之后讨论。三、模型预测预测包括点预测和区间预测,点预测就是在回归模型的基础上,根据解释变量的预期水平推测被解释变量的预期值,简单说就是将解释变量的预期水平代入回归模型,计算出被解释变量的预期值。年份税收收入T国内生产总值GDP财政支出GE200959521.59340506.976299.93在工作文件(Workfile)窗口中双击被解释变量预测值的序列名,弹出预测值的对话框,在其对应位置可确定被解释变量的预期值。TF=66201.42,T=59522,可以看出在一定水平上,模型是可信的。四、多重共线性检验1、对多重共线性的理解(1)多重共线性是一个程度问题而不是一个存在与否的问题(2)除了对于存在一个较大的,并因此导致较大的,进而导致变大以外;一个很小的也可能导致一个较大的,因此小的样本容量也能导致大的抽样方差。(3)即使存在一个较大的和,检验也不一定不显著,毕竟,因此对多重共线性的判断要格外小心。(4)多重共线性是否一定要消除值得考虑。2、根据经验,多重共线性产生的经济背景和原因有以下几个方面:1.经济变量之间往往存在同方向的变化趋势2.经济变量之间往往存在着密切的关联度3.在模型中引入滞后变量也容易产生多重共线性4.在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性3、多重共线性检验如图从检验及其伴随概率来看,只有变量GE较为显著,GDP解释变量不显著;但方程拟和优度为0.997、同时方程整体的检验很显著。因此可以怀疑在变量GDP和GE之间存在多重共线性。因此查看GDP与GE的简单相关系数,通过eviews可得:从图可以看出,解释变量GE,GDP之间的简单相关系数很大,因此解释变量之间相关程度较高。4、解决方案(1)从模型中删除不必要的自变量删除变量要谨慎,否则可能导致模型产生偏误。(参见《计量经济学导论——现代观点》:J.M.伍德里奇,中国人民大学出版社,2003,95页)(2)用变量比例替代原变量(3)改变模型形式(4)增大样本容量(5)获取新数据我认为本题造成该多重共线性的原因在于:财政支出与税收收入之间并没有一次线性相关性。因此解决这一多重共线性的方法在于将解释变量GE删除,再对T、GDP进行线性回归,输出结果如图所示。通过对输出结果的考察,发现多重共线性已经消除。模型变化为:五、异方差性检验异方差问题是指随着解释变量的变化,被解释变量的方差存在明显的变化趋势。这也是经济与管理领域中经常出现的问题。他违反了高斯-马尔科夫定理的条件,从而使OLS估计值不再具有最优的性质。异方差问题出现时的后果回归参数的估计值仍然是无偏的,但是不再具有最小方差,所以不再有效,由于不满足关于OLS的高斯-马尔科夫定理,所以结论也不成立。异方差判断X-Y散点图判断从图中不能观察出是否有明显的散点扩大,缩小或复杂型趋势。White检验输出结果图为:图的上半部分报告的为White检验的F检验值及其相伴概率和LM统计量LM统计量(LagrangeMultiplierstatistic):拉格朗日乘数统计量,又称得分统计量(scorestatistic),此处值为观测值个数乘以残差项对自变量回归后的值,其服从自由度为自变量个数的分布,因此有时也被称为n-R-平方统计量,该统计量类似于F检验统计量,也是检验排除性约束的。LM统计量(LagrangeMultiplierstatistic):拉格朗日乘数统计量,又称得分统计量(scorestatistic),此处值为观测值个数乘以残差项对自变量回归后的值,其服从自由度为自变量个数的分布,因此有时也被称为n-R-平方统计量,该统计量类似于F检验统计量,也是检验排除性约束的。自相关检验自相关问题是指伴随不同期的样品值之间,存在相关关系这也是经济与管理领域中经常出现的问题。他违反了高斯-马尔科夫定理的条件,从而使OLS估计值不再具有最优的性质。1、引起自相关的原因变量本来就前后期相关漏掉变量,被包含在随机扰动项中,由此引起了序列相关系统观察误差灾害的影响是多年的检验异方差软件输出:接下来点击方程窗口左上角【View】—【Actual,Fitted,Residual】—【Actual,Fitted,ResidualGraph】。屏幕显示结果如图所示。残差散点图DW统计值为0.137,靠近0结合上图的分析,初步得出存在正自相关的结论。3、Durbin两步法对自相关的修正(1)在命令窗口中输入:stct(-1)gdpgdp(-1)(2)以,做广义差分变换,通过输入命令:lst-0.9315*t(-1)cgdp-0.9315*gdp(-1)输出结果,如图所示。(3)再使用genre=resid命令定义残差项,做et对et-1的回归,输出结果如图所示。自相关消除。七、正态白噪声检验正态检验EVIEWS中利用JB统计量对序列的正态性假设进行检验,如下图最后两行数据显示。其概率是原假设为正态时,原假设成立的概率。这里JB=1.459<9.488。所以必定肯定原假设,原假设成立,满足正态分布。白噪声检验白噪声检验是在正态性检验的基础上,利用相关图和Q统计量来进行的。该检验是对正态序列进行自相关和偏自相关函数计算,并就各滞后阶计算Q检验统计量,以确定“无此阶自相关”假设成立的概率。对残差的独立性检验假设选择滞后性为16、对残差平方的独立性检验八、统计学检验参数的T检验(略)方程的F检验——回归系数的F检验CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-1347.213468.557-2.875.007GDP.165.004.99038.398.000a.DependentVariable:T表中常数项和自变量“GDP”的T检验均小于0.05,即相应系数显著异于0。通过F检验。统计与优化实验(二)判别对象若干专家依据测量的数据,对一组运动员的体形,生理,心里评分,依据这些分值对运动员分类,并判定。采用层次聚类法对样本进行分类对个体进行聚类(cases),依据不同类之间的距离的平均值,进行类别合并(组间连接法)。1、给出了个体总数——13,以及被处理的情况,所选距离和方法CaseProcessingSummarya,bCasesValidMissingTotalNPercentNPercentNPercent13100.00.013100.0a.SquaredEuclideanDistanceusedb.AverageLinkage(BetweenGroups)2、聚类过程AgglomerationScheduleStageClusterCombinedCoefficientsStageClusterFirstAppearsNextStageCluster1Cluster2Cluster1Cluster21271.0000022262.5001053133.00000848115.0000065245.6672076897.500409721312.25050881213.5003711981018.00060101081223.5009012111525.7148012121848.350111003、树形图

C

A

S

E

0

5

10

15

20

25

Label

Num

+---------+---------+---------+---------+---------+

2

─┐

7

─┼───┐

6

─┘

├─────┐

4

─────┘

├─┐

13

───────────┘

├─────────────┐

1

───┬─────────┘

├─────────────────────┐

3

───┘

5

───────────────────────────┘

8

─────┬─┐

11

─────┘

├─────────┐

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论