版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中国粮食供求模型的构建与粮食安全状况的研究华东师范大学 张月霞、何思远、楼芝兰摘要粮食是人类赖以生存的宝贵资源,是关系国计民生的重要商品。我国是人多地少的发展中国家,要用占世界7的耕地来养活占世界22的人口,因此粮食问题,不仅仅是经济问题,更关乎社会的稳定、国家的长治久安。 本模型在总结有关学者对粮食供需问题研究的基础上,结合现阶段我国粮食消费和生产情况,通过中国统计年鉴以及中国统计局网站搜集数据,分别建立粮食需求和供给模型,并预测未来粮食的供求量,较为系统地分析了粮食供需平衡及粮食安全问题,对我国粮食问题提供借鉴。首先,本文利用逐步回归方法建立线性回归、残差自回归模型与C-D生产函数、残差自
2、回归模型对可能会影响粮食产量的各个因素进行分析,用R软件对结果进行共线性检验与残差分析,再利用聚类分析方法对粮食产量波动原因做深层次分析,最后得到粮食产量回归方程。通过matlab模拟曲线分别预测四个主要影响因素的值,从来得到未来中国粮食产量。然后,通过整合汇总数据对中国粮食需求总量进行分析,分别建立粮食需求高值模型与低值模型,给出未来几年粮食需求预测值,通过比较未来粮食的产量和需求量的大小,结合实际,研究中国粮食安全状况并给出合理化建议。关键字:粮食生产函数 逐步回归 时间序列 残差自回归 多重共线性 聚类分析 粮食需求函数AbstractFood is a valuable resourc
3、e for human survival, and peoples livelihood is related to the important commodities. China is a developing countries, using 7% of the worlds arable land to feed 22 percent of the worlds population, so the food problem, is not only an economic issue, but also have something to do with the social and
4、 countrys long-term stability. The model summary is based on some scholars studies about the food supply and demand, combined with the status of Chinas food consumption and production, through the collection of data by the data from China Statistical Yearbook and China Statistics Bureau Web site , e
5、stablish the food demand and supply models, and predict future food demand and supply, make more systematic analysis of food supply and demand balance and food security, providing some reference for Chinas food problem. First of all, this paper use the stepwise regression method to establish linear
6、regression, residuals from the regression model, the CD production function, residuals from the regression model may affect the grain yield of the various factors were analyzed with R software testing and the results of linear residual analysis, re-use cluster analysis on the reasons for fluctuation
7、s in food production to do in-depth analysis, the final grain yield obtained regression equation. Use Matlab simulation curves to predict four major factors affecting the value, and then calculate Chinas future food production. After that, we get the total number of chinas total grain demand, respec
8、tively established both the low-value and high-value model of food demand and forecast food demand in future years, by comparing the future demand for grain yield and size with reality, study Chinese food security situation and give reasonable suggestions.Key words :Food Production Function 、Stepwis
9、e Regression 、Time Series、 Residuals Auto-Regressive Model、Multicollinearity、Cluster Analysis、Food Demand Function目录 TOC o 1-3 h z u HYPERLINK l _Toc297074767摘要 PAGEREF _Toc297074767 h 1HYPERLINK l _Toc297074768Abstract PAGEREF _Toc297074768 h 2HYPERLINK l _Toc297074769一、问题的提出 PAGEREF _Toc297074769
10、h 4HYPERLINK l _Toc297074770二、研究现状 PAGEREF _Toc297074770 h 5HYPERLINK l _Toc297074771三、模型变量的选择 PAGEREF _Toc297074771 h 5HYPERLINK l _Toc297074772四、符号假定 PAGEREF _Toc297074772 h 7HYPERLINK l _Toc297074773五、模型建立与求解 PAGEREF _Toc297074773 h 8HYPERLINK l _Toc2970747741、逐步回归 PAGEREF _Toc297074774 h 8HYPERL
11、INK l _Toc2970747751)逐步回归分析的主要思路 PAGEREF _Toc297074775 h 8HYPERLINK l _Toc2970747762)逐步回归分析的主要计算步骤 PAGEREF _Toc297074776 h 9HYPERLINK l _Toc2970747773)基于AIC准则的逐步回归原理 PAGEREF _Toc297074777 h 10HYPERLINK l _Toc2970747782、模型具体建立 PAGEREF _Toc297074778 h 12HYPERLINK l _Toc2970747791)普通线性回归、残差自回归方程模型的建立 P
12、AGEREF _Toc297074779 h 12HYPERLINK l _Toc2970747802)基于C-D生产函数的粮食产量回归分析 PAGEREF _Toc297074780 h 18HYPERLINK l _Toc297074781六、影响我国粮食产量的外部性因素周期性聚类分析 PAGEREF _Toc297074781 h 21HYPERLINK l _Toc2970747821、聚类分析的原理 PAGEREF _Toc297074782 h 22HYPERLINK l _Toc2970747832、软件运行结果及其分析 PAGEREF _Toc297074783 h 23HYP
13、ERLINK l _Toc2970747843、模型结论分析 PAGEREF _Toc297074784 h 25HYPERLINK l _Toc297074785七、我国粮食未来需求量预测及分析 PAGEREF _Toc297074785 h 28HYPERLINK l _Toc297074786八、粮食产量预测与需求预测比较结果 PAGEREF _Toc297074786 h 31HYPERLINK l _Toc297074787九对我国粮食安全问题的思考与建议 PAGEREF _Toc297074787 h 31HYPERLINK l _Toc297074788参考文献 PAGEREF
14、_Toc297074788 h 34一、问题的提出“民以食为天”,粮食自古以来就是一件关系国计民生的头等大事。十六大报告明确提出现阶段要“保护和提高粮食综合生产能力”,这是针对我国新时期粮食经济运行的特点和粮食经济所面临的问题提出的要求。首先,中国粮食供求问题的实质在于无法及时根据市场需求变化及时调整生产所造成的结构性、阶段性生产过剩或者不足。也就是缺乏粮食的市场供给能力,而粮食市场供给能力的提高必须以粮食综合生产能力为保障;其次,粮食综合生产能力的高低,直接关系到国家的粮食安全;最后,粮食综合生产能力是综合国力的重要方面。因此,切实保护和提高粮食综合生产能力,无疑就成为目前理论界一项责无旁贷
15、的重要课题。在广泛收集近年来有关粮食生产理论资料的基础上,对粮食综合生产能力影响因素的若干问题进行探索,希望有助于粮食综合生产能力理论研究的进一步深入,进而推动新时期我国粮食生产的持续健康发展。我国是一个有着13亿人口的国家,占世界总人口数的21%,但我国的可耕地面积仅为世界可耕地面积的7%,粮食问题是关系经济安全和国计民生的重大战略问题,任何时候都不能有丝毫的松懈。我国粮食产量在 1998年突破5亿吨大关、人均占有水平达到420公斤后, 粮食耕种面积连年调减, 产量一路走低。 在充分肯定农业结构调整取得成绩的同时,人们必须清醒地认识到,近年来粮食播种面积连年下降,粮食连续减产,粮食安全潜伏一
16、定隐患。导致粮食产量连年下降的重要原因是一些地方对调整农业结构片面理解,大幅压缩粮食种植面积, 造成耕地大量减少。而随着基础建设的扩大、 城市建设的发展、 各种园区的兴起, 耕地还会减少。据国土资源部最新调查显示,中国的耕地面积已从1996年的 19.51亿亩,减少到2002年的18.89亿亩。面对眼前粮价上涨和耕地 减少的新情况,专家指出,从中长期看,由于人口增加,耕地减少,城市化加快,人民生活水平提高,中国粮食需求将呈刚性增长,粮食供求关系将是偏紧的。粮食是关系国计民生的特殊商品,确保粮食安全是中国一项长期的战略任务。为了在更高层次上发展我国的经济,真正实现全民共同富裕的伟大目标,保证粮食
17、安全,解决粮食问题是当务之急。而影响到粮食产量的因素是多方面的。因此,我们提取了农业劳动力、粮食播种面积、化肥施用量这三个对粮食产量有较大影响的因素的时间序列数据来进行分析,希望通过建立一个合适的经济模型来从理论上找出提高粮食产量的方法。二、研究现状自改革开放以来究竟是哪些主要因素影响我国粮食产量,很多学者进行了定量研究。王玉斌等通过对我国19782004粮食产量波动原因发现,要实现粮食生产持续稳定增长的目标,就必须给粮食生产以合理的收益预期,使粮食生产的比较收益与经济作物相比处于相对合理的水平2。谢杰利用1978-2004数据,基于简单线性回归模型发现,影响粮食产量的主要因素是粮食种植面积、
18、成灾面积、化肥用量及政策性因素3。汪旭辉基于DEA模型农业生产效率低下的主要原因是生产要素匹配不合理4。近几年国家减免税收和补贴政策只是引子,因占农户收入比重过小,因此对农户增加投入和提高粮食产量影响甚微(史清华等)5。政府通过粮食补贴等政策无效率,存在规模报酬递减,对农户行为影响不大(李鹏6)。要提高粮食产量,在加大粮食直补的同时不能放弃价格支持,这样才能稳定农民收入,增加粮食产量(赵玉萍7)。 目前国内外学者提出了多种基于统计学原理的粮食产量预测模型,分析这些模型的设计思路,它们大体上可分为二类:一类是气象模型,它侧重于气象波动因素对粮食产量的短期影响;另一类是社会经济模型,它侧重于社会经
19、济发展因素对粮食产量的长期影响。实际上在市场经济环境下粮食生产的不确定因素增多,波动因素不仅是气象因素,还应有市场、政策、技术等因素。如何将上述两类预测模型所考虑的因素和方法综合起来,以提高预测精度,这就是本文提出的粮食产量综合预测模型。三、模型变量的选择粮食综合生产能力是指在一定地区、一定时期和一定的社会经济技术条件下,由各种生产要素综合投入所形成的、能够相对稳定地达到一定水平的粮食产出能力。由于我国长期以来一直采取各种措施努力提高粮食的实际产量 ,并没有像欧美国家采取耕地休耕制度 ,因而我国的粮食综合生产能力可以用粮食实际产量来反映。因而对我国粮食综合生产能力影响因素的分析实际上就是对我国
20、粮食产量影响因素的分析。从理论上讲影响粮食产量的因素很多,这些因素基本上可以分为四类 ,第一类是各种生产要素的投入量,如土地、劳动、化肥、机械、资本等的投入量;第二类是各种农业技术进步;第三类是国家粮食政策、农业生产组织与经营制度;第四类是各种自然灾害。 1、粮食播种面积是解释粮食产量变化的一个关键变量 ,且对粮食产量是一种正向影响。同时,各种自然灾害对粮食产量的影响很,成灾面积可以反映粮食生产中受自然灾害影响的程度,粮食产量与成灾面积是一种负相关关系。现有各种公开出版统计资料中的成灾面积都是农作物总成灾面积,并没有单独反映粮食作物成灾面积的指标,在本研究中假定自然灾害在各种不同作物种类中的分
21、布是均匀的,这样粮食成灾面积可用粮食播种面积占农作物总播种面积的比例乘以农作物总成灾面积得到。 水利是农业的命脉,灌区是命脉中的命脉,灌区成为我国粮食安全保障的重要基地。中国以占全国耕地48%的灌溉面积,生产了占全国总产量75%的粮食和90%的棉花、蔬菜等经济作物。本模型也将有效灌溉面积考虑在影响粮食产量的一个因素。2. 劳动力是粮食生产的主体,也是影响粮食生产的重要因素之一。但是,现有公开出版的统计资料中并没有关于投入粮食生产劳动力人数的数据,目前已有的类似研究中多将农业劳动力数量作为粮食产量的解释变量来建立模型,这样不可避免地导致结果产生偏差。本文将农村人口数作为影响因素。3. 化肥是粮食
22、生产的主要投入要素之一。施肥不仅能提高土壤肥力,而且也是提高作物单位面积产量的重要措施。化肥是农业生产最基础而且是最重要的物质投入。据HYPERLINK /view/26284.htm t _blank联合国粮农组织(FAO)统计,化肥在对农作物增产的总份额中约占40%60%。中国能以占世界7%的耕地养活了占世界22%的人口,可以说化肥起到举足轻重的作用。本研究中选择化肥使用量作为衡量化肥投入水平的解释变量。 4. 农业技术进步是影响粮食产量的一个非常重要的因素 ,考虑到农业中的技术进步常常物化在良种、农膜、农药以及农业机械的使用方面 ,而本研究采用的国家农业财政支出是一个非常宽泛的概念 ,能
23、够在很大程度上涵盖农业中的技术进步因素。同时,农村居民收入也影响着农民对于种植上一些设备等的投入,所以也考虑在影响农业技术进步的范围内。5. 农业机械总动力指HYPERLINK /view/816978.htm t _blank主要用于农、林、牧、HYPERLINK /view/36346.htm t _blank渔业的各种HYPERLINK /view/71352.htm t _blank动力机械的动力总和,包括耕作机械、排灌机械、收获机械、农用运输机械、植物保护机械、HYPERLINK /view/1017723.htm t _blank牧业机械、HYPERLINK /view/36348
24、.htm t _blank林业机械、渔业机械和其他农业机械,农业机械化是农业现代化的重要标志。当前,我国正处于从传统农业向现代农业转变的关键时期,加快推进农业机械化和农机工业发展,对于提高农业装备水平、改善农业生产条件、增强农业综合生产能力、拉动农村消费需求等具有重要意义,对提高粮食产量有重要意义。6农业生产资料价格指数,指反映一定时期内农业生产资料价格变动趋势和程度的相对数。农业生产资料价格的变动会影响农民在农业基础设备上的投入,从而对粮食产量有负面影响;同时,HYPERLINK /view/331146.htm t _blank农产品生产价格指数是反映一定时期内,农产品生产者出售农产品价格
25、水平变动趋势及幅度的相对数,农产品价格的变动自然会影响农民对于种植的热情等,所以本模型考虑了农业生产资料价格指数和HYPERLINK /view/331146.htm t _blank农产品生产价格指数。7. 自1978 年农村经济体制改革以来 ,我国农村实行的是以家庭为基本经营单位的生产组织制度以及与此相联系的按人口平均分配的土地制度 ,这项制度作为农村的一项基本制度将长期保持稳定。早期研究认为 ,中国农业生产提高的动力在改革初期主要来自农村经济体制创新 ,但是 ,这种影响只是一次性的,随着这一制度的普及与稳定,制度创新对于粮食增产的促进作用几乎为零。在对 1978 年后粮食生产的分析中完全
26、可以假设制度因素为一常量。 为消除 1978 年开始的农村制度变革对之影响,本模型不考虑1978年前的全国粮食产量数据。四、符号假定:农村人口数(万人):粮食作物种植面积:生产资料价格指数:农产品生产价格指数:有效灌溉面积:化肥使用量(万吨):农业机械总动力(亿瓦):受灾面积(千公顷):农村居民收入:国家农业财政支出:随机误差:我国年粮食产量(万吨),为被解释变量。五、模型建立与求解1、逐步回归1)逐步回归分析的主要思路 在实际问题中, 人们总是希望从对因变量y有影响的诸多变量中选择一些变量作为自变量, 应用多元回归分析的方法建立“最优”回归方程以便对因变量进行预报或控制。所谓“最优”回归方程
27、, 主要是指希望在回归方程中包含所有对因变量y影响显著的自变量而不包含对y 影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对y的作用大小, 显著程度大小或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对y作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行F检验, 以保证在引人新变量前回归方程中只含有对y影响显著的变量, 而不显著的变量已被剔除。逐步回归
28、分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献), 然后选一个偏回归平方和最小的变量, 在预先给定的F水平下进行显著性检验, 如果显著则该变量不必从回归方程中剔除, 这时方程中其它的几个变量也都不需要剔除(因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。相反, 如果不显著, 则该变量要剔除, 然后按偏回归平方和由小到大地依次对方程中其它变量进行F检验。将对y影响不显著的变量全部剔除, 保留的都是显著的。接着再对未引人回归方程中的变量分别计算其偏回归平方和, 并选其中偏回归平方和最大的一个变量, 同样在给定F水平下作显著性检验, 如果显著则将该变量引入
29、回归方程, 这一过程一直继续下去, 直到在回归方程中的变量都不能剔除而又无新变量可以引入时为止, 这时逐步回归过程结束。2)逐步回归分析的主要计算步骤 (1) 确定F检验值 在进行逐步回归计算前要确定检验每个变量是否显著的F检验水平, 以作为引人或剔除变量的标准。检验水平要根据具体问题的实际情况来定。一般地, 为使最终的回归方程中包含较多的变量, 水平不宜取得过高, 即显著水平 不宜太小。F水平还与自由度有关, 因为在逐步回归过程中, 回归方程中所含的变量的个数不断在变化, 因此方差分析中的剩余自由度也总在变化, 为方便起见常按n-k-1计算自由度。n为原始数据观测组数,k为估计可能选人回归方
30、程的变量个数。例如n=15 , 估计可能有23 个变量选入回归方程, 因此取自由度为15-3-111, 查F分布表, 当 0.1, 自由度f1=1,f2=11时, 临界值F=3.23, 并且在引入变量时, 自由度取f1=1,f2=n-k-2,F检验的临界值记F1, 在剔除变量时自由度取f1=1,f2=n-k-1 , 检验的临界值记F2 , 并要求F1F2, 实际应用中常取F1=F2。 (2) 逐步计算 如果已计算t步(包含t0), 且回归方程中已引入l个变量, 则第t+1步的计算为:(a )计算全部自变量的贡献V(偏回归平方和)。 (b)在已引入的自变量中, 检查是否有需要剔除的不显著变量。这
31、就要在已引入的变量中选取具有最小V值的一个并计算其F值, 如果FF2, 表示该变量不显著, 应将其从回归方程中剔除, 计算转至(c)。如FF2,则不需要剔除变量, 这时则考虑从未引入的变量中选出具有最大V值的一个并计算F值, 如果FF1, 则表示该变量显著, 应将其引人回归方程, 计算转至( c)。如果FF1, 表示已无变量可选入方程, 则逐步计算阶段结束, 计算转人(3)。 (c)剔除或引人一个变量后, 相关系数矩阵进行消去变换, 第t+1步计算结束。其后重复( a)(c )再进行下步计算。 由上所述, 逐步计算的每一步总是先考虑剔除变量, 仅当无剔除时才考虑引入变量。实际计算时, 开头几步
32、可能都是引人变量, 其后的某几步也可能相继地剔除几个变量。当方程中已无变量可剔除, 且又无变量可引入方程时, 第二阶段逐步计算即告结束, 这时转入第三阶段。 (3) 其他计算, 主要是计算回归方程入选变量的系数、复相关系数及残差等统计量。 逐步回归选取变量是逐渐增加的。选取第l个变量时仅要求与前面己选的l-1 个变量配合起来有最小的残差平方和, 因此最终选出的L个重要变量有时可能不是使残差平方和最小的L个, 但大量实际问题计算结果表明, 这L个变量常常就是所有L个变量的组合中具有最小残差平方和的那一个组合, 特别当L不太大时更是如此, 这表明逐步回归是比较有效的方法。 引人回归方程的变量的个数
33、L与各变量贡献的显著性检验中所规定的F检验的临界值F1与F2的取值大小有关。如果希望多选一些变量进人回归方程, 则应适当增大检验水平 值, 即减小F1=F2的值, 特别地,当F1=F2=0时, 则全部变量都将被选入, 这时逐步回归就变为一般的多元线性回归。相反, 如果 取得比较小, 即F1与F2取得比较大时, 则入选的变量个数就要减少。此外, 还要注意, 在实际问题中, 当观测数据样本容量n较小时, 入选变量个数L不宜选得过大, 否则被确定的系数的精度将较差。本模型采用R软件进行数据处理及检验,采用逐步回归的方法,用AIC准则进行检验,挑选出变量使得,使得该种选择组合的AIC值最小。3)基于A
34、IC准则的逐步回归原理赤池信息量准则(Akaike information criterion、简称AIC)是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。在一般的情况下,AIC可以表示为:AIC = 2k - 2ln(L),其中:K是参数的数量,L是似然函数。假设条件是模型的误差服从独立正态分布。让n为观察数,RSS为剩余平方和,那么AIC变为: AIC=2k + nln(RSS/n),增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况
35、。所以优先考虑的模型应是AIC值最小的那一个。赤池信息量准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。本模型采用R软件进行数据处理及检验,采用逐步回归的方法,用AIC准则进行检验,挑选出变量使得,使得该种选择组合的AIC值最小。具体数据:年份X1X2X3X4X5X6X7X8X9X10Y19787901412058799.9103.944965884117550807133.6150.6630476.5197979047119263100.4122.145003.11086.31337.939367160.2174.3333212198079565117234101107.1448
36、88.11269.41474.650025191.33149.9532056198179901114958101.7105.944573.81334.9156839786223.4110.2132502198280174113462101.9102.244176.91513.41661.433133270.1120.4935450198380734114047103104.444644.11659.81802.234713309.8132.8738728198480340112884108.9104444531739.81949.731887355.3141.29407311985807571
37、08845104.8108.644035.91775.82091.344365397.6153.6237911198681141110933101.1106.444225.81930.6229547135423.8184.239151198781626111268107112444031999.32483.642086462.55195.7240298198882365110123116.212344375.92141.52657.550874544.94214.0739408198983164112205118.911544917.22357.12806.746991601.51265.94
38、40755199084138113466105.597.447403.12590.32870.838474686.31307.8444624.3199184620112314102.99847822.12805.12938.955472708.55347.5743529.3199284996110560103.7103.448590.12930.23030.851332784376.0244265.8199385344110509114.1113.448727.93151.93181.748827921.6440.4545648.8199485681109544121.6139.948759.
39、13317.93380.3550461221532.9844510.1199585947110060127.4119.949281.63593.73611.8458241577.74574.9346661.8199685085112548108.4104.250381.63827.93854.7469911926.1700.4350453.519978417711291299.595.551238.53980.74201.6534292090.1766.3949417.119988315311378794.59252295.64083.74520.85014521621154.7651229.
40、5319998203811316195.887.853158.44124.34899.6499802210.31085.7650838.5820008083710846399.196.453820.34146.45257.4546882253.421231.5446217.5220017956310608099.1103.154249.44253.85517.2522152366.41456.7345263.67200278241103891100.599.754354.94339.45793469462475.61580.7645705.7520037685199410101.4104.45
41、4014.24411.66038.7545062622.21754.4543069.53200475705101606110.6113.154478.44636.66402.8371062936.42337.646946.95200574544104278108.3101.455029.34766.26839.8388183254.932450.348402.19200673742104958101.5101.255750.54927.77252.2410913587.04317349804.23200772750105638107.7118.556518.35107.876594899241
42、40.364318.350160.28200872135106793120.3114.158471.7523982193999047615955.552870.9220097128810898697.597.659261.45404.48749.64721451537253.153082.082、模型具体建立1)普通线性回归、残差自回归方程模型的建立下面利用R软件进行逐步回归分析,R程序结果如下: Estimate Std. Error t value Pr(|t|) (Intercept) 9.927e+03 1.553e+04 0.639 0.528769 x1 5.578e-01 1.4
43、97e-01 3.727 0.001047 * x2 3.083e-01 9.313e-02 3.311 0.002933 * x3 -8.238e+01 3.187e+01 -2.585 0.016256 * x5 -1.169e+00 2.778e-01 -4.207 0.000312 *x6 8.639e+00 1.039e+00 8.315 1.58e-08 *x8 -1.621e-01 3.673e-02 -4.414 0.000184 *x10 1.279e+00 3.703e-01 3.454 0.002065 * Signif. codes: 0 * 0.001 * 0.01
44、* 0.05 . 0.1 1 Residual standard error: 1082 on 24 degrees of freedomMultiple R-squared: 0.9773, Adjusted R-squared: 0.9706 F-statistic: 147.4 on 7 and 24 DF, p-value: |t|) (Intercept) -9.897e+04 1.269e+04 -7.803 2.17e-08 *x1 1.241e+00 9.541e-02 13.010 3.82e-13 *x2 3.144e-01 8.059e-02 3.901 0.000575
45、 *x7 4.511e+00 2.270e-01 19.877 2e-16 *x8 -2.142e-01 4.400e-02 -4.868 4.34e-05 *Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1396 on 27 degrees of freedomMultiple R-squared: 0.9574, Adjusted R-squared: 0.9511 F-statistic: 151.9 on 4 and 27 DF, p-value: 2.2e-16优化的逐步回归结果分析以上
46、分析可以看出,模型拟合程度非常高,调整后的R方为0.9511。参数X1、X2、X7、X8最终被保留,X1农村人口数(万人)、X2粮食作物种植面积、X7农业机械总动力(亿瓦)对粮食产量有正向影响,符合实际情况, X8受灾面积(千公顷)与粮食产量成负向影响,符合实际情况,所以此次计算机模拟结果可以接受。多重共线性检验多重共线性的定义设回归模型如果矩阵X的列向量存在一组不全为零的数,使,则称其存在完全共线性,如果,则称其存在近似的多重共线性多重共线性的诊断(1) 直观的判断方法.在自变量 的相关系数矩阵中,有某些自变量的相关系数值比较大;.回归系数的符号与专业知识或一般经验相反;.对重要的自变量的回
47、归系数进行t检验,其结果不显著,但是F检验确得到了显著的通过;.如果增加一个变量或删除一个变量,回归系数的估计值发生了很大的变化;.重要变量的回归系数置信区间明显过大。(2) 方差扩大因子法(VIF),定义 其中 是以 为因变量时对其他自变量的复测定系数。一般认为如果最大的 超过10,常常表示存在多重共线性。事实上 这说明 即 .(3) 特征根判定法根据矩阵行列式的性质,矩阵行列式的值等于其特征根的连乘积 。因此,当行列式0时,至少有一个特征根为零,反过来,可以证明矩阵至少有一个特征根近似为零时,X的列向量必存在多重共线性,同样也可证明有多少个特征根近似为零矩阵X就有多少个多重共线性。根据条件
48、数, , 其中为最大的特征根 为其他的特征根,通常认为0k10存在着多重共线性。本模型使用SPSS进行多重共线性检验,使用的是VIF法进行判断。多重共线性的诊断结果由于第一次逐步回归因为可能有多重共线性的影响,接下来用SPSS进行多重共线性检验,得到结果如下:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-98974.82312685.008-7.803.000 x11.
49、241.095.81213.010.000.4052.471x2.314.081.2363.901.001.4312.322x74.511.2271.56619.877.000.2543.938x8-.214.044-.228-4.868.000.7191.390Dependent Variable: y从VIF值可以看出,X1、X2、X7、X8的VIF均小于10,说明不存在多重共线性。残差分析先来检验残差的自相关性,通过软件输出,得到残差的DW值为0.896,存在较强的正自相关性。考虑到本例中自变量较多,用差分法消除自相关性效果不好,我们选择使用时间序列方法来消除自相关性。残差的时序图、自相
50、关图和偏自相关图如下所示:通过AIC准则以及R软件,我们找到ARMA(0,0)到ARMA(5,5)的各种组合中AIC值最小的模型。确定为:ARMA(2,1)。利用R软件对残差进行建模,得到结果如下: ar1 ar2 ma1 1.4049 -0.6306 -1.0000s.e. 0.1273 0.1254 0.1579该模型残差通过了拉格朗日乘子检验,可认为没有异方差,且通过雅克贝拉检验符合正态性。下面是用N(0,859216)对此进行的拟合。残差模型最终决定为:下面是对2010年到2015年6年的残差项所作预测:年份残差(万吨)2010-46.412011-29.672012-12.41201
51、31.2720149.61201512.70最终模型的确定从逐步回归分析到剔除变量优化逐步回归,然后经过检验没有多重共线性,并且残差消除了自相关性,我们可以得出模型拟合结果较好,最终得到的回归模型为:该模型,则来代表产量的点估计值。最终影响因素分析劳动力是粮食生产的主体,也是影响粮食生产的重要因素之一,且是正向因素,所以本模型将农村人口数作为影响因素,进行逐步回归检验后得到正向的显著性关系是完全合理的。粮食播种面积是解释粮食产量变化的一个关键变量 ,且对粮食产量是一种正向影响。同时,各种自然灾害对粮食产量的影响很,受灾面积可以反映粮食生产中受自然灾害影响的程度,粮食产量与成灾面积是一种负相关关
52、系。由此可知,本模型用R软件对以上数据进行逐步回归后得到的粮食播种面积和受灾面积的影响关系是合理的。农业机械总动力指HYPERLINK /view/816978.htm t _blank主要用于农、林、牧、HYPERLINK /view/36346.htm t _blank渔业的各种HYPERLINK /view/71352.htm t _blank动力机械的动力总和,包括耕作机械、排灌机械、收获机械、农用运输机械、植物保护机械、HYPERLINK /view/1017723.htm t _blank牧业机械、HYPERLINK /view/36348.htm t _blank林业机械、渔业机
53、械和其他农业机械,所以对粮食产量有正向影响因素,模型检验是合理的。用得到的回归方程检验实际1978年2009年粮食产量,如下图所示:红色点是模型回归方程模拟的结果,黑色点是实际粮食产量,拟合结果在2008年和2009年非常接近。2)基于C-D生产函数的粮食产量回归分析C-D生产函数模型简介 生产函数这一名词由美国数学家Charles Cobb和经济学家Pau l Dauglas提出,他们利用历史统计资料研究二十世纪初美国的资本投入(K) 和劳动投入(L)对产量(Y) 的影响时, 得出的一种生产函数. 是分析资源“投入”与产品“产出”之间经济数量关系的最常用的一种生产函数. 其基本模型为:Y=A
54、KL其中A是常数项,代表一定的技术水平。,分别为资本投入和劳动投入的生产弹性。粮食产量的C-D、残差自回归模型假设S是粮食种植面积,W是单位面积粮食的产量,则两边同时取对数,我们可以得到: Estimate Std. Error t value pr(t) (Intercept) -5.89028 2.22198 -2.651 0.01326 * lnx2 1.26978 0.18727 6.781 2.78e-07 *lnx6 0.43114 0.02754 15.656 4.55e-15 *lnx8 -0.13449 0.03610 -3.726 0.00091 *lnx10 -0.026
55、29 0.01010 -2.604 0.01479 * Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 0.02895 on 27 degrees of freedomMultiple R-squared: 0.9687, Adjusted R-squared: 0.9641 F-statistic: 209.1 on 4 and 27 DF, p-value:2.2e-16 拟合程度较高。多重共线性检验ModelUnstandardized CoefficientsStandardized Coe
56、fficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-5.8902.222-2.651.013lnx21.270.187.3596.781.000.4132.423lnx6.431.0281.45515.656.000.1347.454lnx8-.134.036-.136-3.726.001.8721.146lnx10-.026.010-.216-2.604.015.1695.918a. Dependent Variable: lny由VIF值可以看出没有多重共线性。所以得到回归方程:残差分析下面
57、对残差进行自相关性检验,DW值为0.645,存在较强的自相关性,类似地,建立时间序列的arma模型。经过定阶得到模型为arma(2,0) ar1 ar2 1.0257 -0.5320s.e. 0.1466 0.1448该模型的残差通过了随机性检验、异方差检验和正态性检验,下面是用N(0,0.000315)所拟合的残差。最终残差的模型确定为:对残差做了6年的预测,得到:年份残差(ln万吨)20100.0043762011-0.0046472012-0.0070952013-0.0048052014-0.00115420150.001372最终的模型确定为:同样,由于,则可以作为的点估计。模型拟合
58、效果图如下:六、影响我国粮食产量的外部性因素周期性聚类分析同经济周期一样,粮食生产也有周期。改革开放以来,我国粮食生产的发展并不平稳,总产量波动非常明显。粮食生产的周期大体四五年一次,丰歉相间,不是年年丰收,也不是年年歉收,而是在一个周期内有丰收年,也有歉收年和平常年。连续2个丰年或2个歉年或2个平常年都属正常,粮食生产的发展总体上呈现螺旋式上升的的态势。造成周期性波动的原因用以上定义的客观因素已经不能较好地解释,考虑到这可能与外部性因素,如国内粮食生产政策的变动,国际市场环境的波动等有关。而这些影响因素往往比较抽象,按照常规的数值分析显然行不通。对此,我们将从19782009年的数据按照选取
59、的综合指标,以时间的顺序对样本按照K-means Cluster过程进行了聚类分析,共分为四类。1、聚类分析的原理聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些HYPERLINK /view/1655430.htm t _blank技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类是将HYPERLINK /view/3810806.htm t _bl
60、ank数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。(1)聚类方法Cluster Method:定义、计算两项之间距离或相似性的方法。组间连接:合并两类后使所有对应两项之间的平均距离最小。组内连接:合并后使类中所有项之间的平均距离(平方)最小。最近邻法:用两类之间最近点间的距离代表两类间的距离。最远邻法:用两类之间最远点间的距离代表两类间的距离。重心聚类:以计算所有各项均值间距离的方法计算两类间距离。中位数法:以各类中的中位数为类中心。最小方差:以类间方差最小为聚类原则。 (2)测度方法Measure:测度距离或相似性的算法。方法一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年超低频振动标准项目合作计划书
- 公司给员工的春节慰问信
- 幼儿园小班音乐《米奇妙妙屋》教案
- 2024年海上风电合作协议书
- 2022年采购部上半年工作总结范文样本
- 户外广告发布合同完整版2篇
- 2024年腈纶扁平丝项目合作计划书
- 城市轨道交通建设招标合同三篇
- 饲料物流运输协意三篇
- 铁路线路维修工程招标合同三篇
- 部编版一年级下册语文单元教材分析及教学要点
- 渝建竣表格新表(精编版)
- (完整版)家具项目实施方案
- 小学科学一年级下册教材分析(共3页)
- 优秀校长的政治素养与养成讲述
- 河北省滦平县东北部冶金矿产工业区发展规划
- 蓝牙测试项及其标准
- 第二章接待礼仪拜访礼仪馈赠礼仪
- 钢结构拆除的施工协议书
- 旅游列车开行管理办法
- 园区网络规划与设计管理 毕业设计
评论
0/150
提交评论