




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ARIMA模型与遗传算法优化神经网络在昆明市房价预测中的应用中文摘要房地产业是国民经济的重要组成部分,在一个国家和地区国民经济中,房地产业都有其重要的地位和作用。根据房价对宏观经济影响的实证研究得出,房价波动是影响房地产业发展的主要因素,因此预测房价走势也就能一定的程度反映房地产业的发展情况和发展趋势。本文采用两种预测方法来对昆明市房价进行预测。首先,用传统的ARIMA时间序列模型来预测昆明市房价数据,然后根据BP神经网络的预测特点来利用遗传算法优化神经网络参数,结合两种算法对昆明市房价数据进行预测。最后对两种方法的预测结果进行比较,得出预测精度更高的预测方法。本人的研究结果表明,通过遗传算法优化的BP神经网络发挥了两种算法各自的优势,大大提高了神经网络的预测精度。通过遗传算法优化的BP神经网络的预测结果与传统ARIMA模型的预测结果对比,体现了人工智能的优势所在,GA-BP神经网络预测精度明显高于ARIMA模型。因此证明了遗传算法优化的神经网络在处理时间序列数据上的优越性以及有较好的应用性。关键词:GA-BP神经网络,ARIMA,房价,预测ApplicationofARIMAmodelandneuralnetworkoptimizedbygeneticalgorithminhousingpriceforecastofKunmingCityabstractTherealestateindustryisanimportantpartofthenationaleconomy.Inthenationaleconomyofacountryandregion,therealestateindustryhasitsimportantpositionandrole.Accordingtotheempiricalresearchontheimpactofhousepriceonmacro-economy,housepricefluctuationisthemainfactoraffectingthedevelopmentofrealestateindustry,sopredictingthetrendofhousepricecanreflectthedevelopmentsituationandtrendofrealestateindustrytoacertainextent.Inthispaper,twoforecastingmethodsareusedtoforecastthehousingpriceinKunming.Firstly,thetraditionalARIMAtimeseriesmodelisusedtopredictthehousingpricedataofKunmingcity.Then,accordingtothepredictioncharacteristicsofBPneuralnetwork,geneticalgorithmisusedtooptimizetheneuralnetworkparameters,andthetwoalgorithmsarecombinedtopredictthehousingpricedataofKunmingcity.Finally,thepredictionresultsofthetwomethodsarecompared,andthepredictionmethodwithhigherpredictionaccuracyisobtained.MyresearchresultsshowthattheBPneuralnetworkoptimizedbygeneticalgorithmgivesfullplaytotheadvantagesofthetwoalgorithmsandgreatlyimprovesthepredictionaccuracyoftheneuralnetwork.ThepredictionresultsofBPneuralnetworkoptimizedbygeneticalgorithmarecomparedwiththoseoftraditionalARIMAmodel,whichshowstheadvantagesofartificialintelligence.ThepredictionaccuracyofGA-BPneuralnetworkissignificantlyhigherthanthatofARIMAmodel.Therefore,itisprovedthattheneuralnetworkoptimizedbygeneticalgorithmissuperiorinprocessingtimeseriesdataandhasgoodapplicability.Keywords:GA-BPneuralnetwork,ARIMA,houseprice,forecast目录中文摘要Abstract第一章绪论1.1研究背景及意义1.2国内外相关研究现状1.3本文的研究思路第二章ARIMA模型的预测研究2.1ARIMA模型简介2.2建立ARIMA模型的具体步骤2.2.1时间序列的预处理2.2.2模型的识别及定阶2.2.3模型的有效性分析与优化2.2.4通过模型预测结果2.3ARIMA模型在昆明市房价预测中的实证分析2.3.1运用EVIEWS软件对数据进行预处理2.3.2昆明市房价数据的平稳化处理2.3.3昆明市房价数据的ARIMA模型参数的估计以及模型确定2.3.4昆明市房价的预测结果第三章遗传算法优化的BP神经网络的预测研究3.1BP神经网络3.1.1BP神经网络原理3.1.2BP神经网络的算法过程3.1.3BP神经网络的优缺点3.2遗传算法优化的BP神经网络3.2.1遗传算法优化BP神经网络的权值和阈值3.2.2遗传算法优化BP神经网络拓扑结构3.3运用遗传算法优化BP神经网络对昆明市房价进行预测分析3.3.1BP神经网络拓扑结构的设计3.3.2数据的选择与预处理3.3.3运用软件分析数据第四章总结分析与展望4.1本文结论4.2最优模型对未来一年房价进行预测第一章绪论1.1研究背景及意义现代经济生活当中,房地产市场已经成为金融、建筑等经济板块发展的重要推动力,其产业的兴衰影响着国民经济的发展状态。而目前的房地产市场出现价格持续、过快上涨等情况,呈现明显的泡沫增长,所以无论政府还是企业,对房地产市场的价格预测都尤为重视,故如何既准确又简便地预测和分析房地产价格是有待解决的技术性问题。昆明作为云南省政治、经济、文化中心,是中国面向东南亚、南亚开放的门户城市,国家历史文化名城。是中国重要的旅游、商贸城市,西部地区重要的中心城市之一。但近年来,昆明市商品房地产价格过快上升,让人们对房价的变动比较敏感,也让商品房价价格也成为供需双方共同关注的焦点。就目前情况而言,房价价格过快上升带来了许多问题:如房地产市场去库存压力大,非住宅去库存周期长,现行商住配比中商业比例较高,导致办公、车位去库存化问题尤为突出,使得稳定商品房地产价格成为了昆明房地产市场宏观调控的主要任务。本课题旨在通过对昆明市房价预测的实证研究,提供较高精度的预测方法预测商品房价格,为昆明市房地产投资决策管理者以及购房者提供一些科学借鉴。所谓预测就是人们根据事物过往记录的数据和历史资料,根据事物目前运动和变化的状态,运用各种定性和定量的分析方法,以此来判断事物未来可能出现的趋势和可能达到的水平所进行的科学推测。对房价的预测,就是对往年的房价数据进行分析和处理,运用一定的定性和定量的分析方法对未来两年的房价走势做出预测,有利于我们看清房地产业的发展情况和发展趋势,让当下有购房意愿的居民做出更准确的选择。在一个国家和地区国民经济中,房地产业都有其重要的地位和作用。而房价波动作为影响房地产业发展的主要因素,房地产市场无论是蓬勃向上发展还是向着衰败发展都要从房地产价格这个数字的变化观察出来,所以运用掌握的数据和科学的预测方法对未来房价趋势走向进行分析和估计就显得很有意义了。我这次预测不仅利用传统的ARIMA时间序列模型来预测,还利用近几年发展迅速的人工智能中的神经网络建立昆明市房价的预测模型,并且对模型中的神经网络拓扑结构中的参数进行分析,再利用遗传算法对建立的BP神经网络的权值、阈值参数进行优化,以此来提高模型的预测精度,最后将该模型与ARIMA模型的预测结果进行对比,分析出哪一个预测方法更加适合现在这个时期的房价预测,从而为昆明市的房价预测提供有力的支持。1.2国内外相关研究现状在过去几十年中,在学术界分析城市住房价格常采用hedonicpricemethodology(特征价格法)和repeat-salemethodology(重复销售方法),国外对房价格变动的分析和研究比较深入1981年,Nellis和Longbottom通过分析英国的数据试图解释英国商品住宅价格的决定因素。作者将商品住宅的需求定义为人口数量、社区中抵押贷款的资产存量、平均的商品住宅价格、个人收入、消费品价格和抵押贷款利率的真实函数,将供给定义为商品住宅价格和商品住宅存量的函数根据供给和需求相等的原理,得到一个关于平均商品住宅价格的简化公式,从而推导出商品住宅的价格。在房价预测方法中美国的Case和Shiller(1990)采用平行数据回归分析,Clapp和Giaccotto(1994)简单的回归进行城市住宅价格的预测,Potepan(1996)采取两阶段最小二乘法进行不同城市价格的预测,Malpezzi(1999)采用平行数据回归分析,对不同的城市并非随机价格和差异性进行预测,针对价格收入比以及房价变化利用误差修正模型得出了前期价格和收入变化对于房价的影响以及短期供给弱弹性的结论;Quigley(1999)采取平行数据回归分析来于经济基本面的相关指标来解释各城市住宅价格走势。Seko通过平行数据回归分析:自回归模型调查了日本46个县的1998-2001年度数据,对日本各地区的住宅价格和经济基本的相关性进行预测。Anglin(2006)一如平均房价增长率的滞后三期以及CPI、住房抵押贷款利率和失业率,建立VAR模型预测多伦多房价变动情况。国内研究动态:国内有关房价预测的方法大体分为两类,一类为定性预测方法,如判断预测法,评估法等;另一类是定量预测方法,如时间序列分析法,回归分析法、状态转移法、经济计量模型分析法和灰色预测模型等。此外还有多元回归、ARMA模型、ARIMA模型、灰色序列预测、BP网络预测、模糊神经网络、马尔科夫预测等方法。有较多学者采用趋势外推法、多元线性和非线性回归等数学分析方法,考虑了更多的影响因素和变量,也尝试着将灰色预测理论和神经网络模型引入商品住宅市场需求预测进行了有益的探索,如蒋达强对1990年到2000年上海市的城镇住房需求给出了一个描述性的统计分析。王金明和高铁梅利用可变参数模型对我国房地产市场需求和供给进行了动态的定量分析,分析表明,在影响房屋需求的诸因素中,收入弹性最大,其次是价格、利率弹性;在影响供给的因素中,价格和利率弹性都较大。罗兆烈等人(1998)用收入、人口和旧房淘汰量等建立多元线性回归模型对我国城镇商品住宅需求量进行了预测。赵黎明等人(2001)将组合预测方法引入住宅市场需求预测,以实例具体介绍了组合预测的应用过程。实例中采用了神经网络、灰色模型等预测方法的组合体系,对当时环境下的住宅市场需求预测进行了有益的探索[3]。李国柱(2004)基于资产定价视觉来考察中国房地产市场价格波动数量研究[4];王婧和田澎(2005)采用小波神经网络对中房上海价格指数的月度数据进行预测,对房地产价格指数序列性质进行分析,表明房地产价格指数是具有非线性特征的非平稳时间序列。采用小波神经网络对房地产价格指数进行预测,并将预测结果与指数平滑法和RBF神经网络预测做了对比。采用MATLAB对拟合和预测过程进行仿真。结果指标表明,在大样本数据的情况下,采用小波神经网络对房地产指数进行预测能够获得较好的效果;吴秀丽和张峰(2007)采用时间序列分析法,以广州市几个有代表性的行政区的房价数据为分析对象来建立预测模型,并经过残差分析对误差进行检验,发现结果预测值与实际观测值基本吻合,达到了预测的目的[5]。崔庆都(2011)采用了BP神经网络的思想和方法,建立了BP神经网络模型对房价进行预测[6]。高玉明、张仁津(2014)利用遗传算法优化的BP神经网络来建立房价预测模型,弥补了传统BP神经网络存在学习收敛速度太慢,易陷入局部极小值等缺陷[8]。1.3本文的研究思路首先获取昆明市的房价历史数据进行整理,选择2002年到2020年昆明市房价数据,然后对处理好的数据进行分析。根据ARIMA模型进行预测时对数据的平稳性要求等,对数据进行预处理并确定ARIMA模型中的参数,然后利用EVIEWS软件进行实证分析找出最佳模型进行预测,得出预测值。对于神经网络的预测,根据房价和影响因子数目来确定输入层节点的数量、隐含层节点的个数以及输出层的节点数目,这样就可以确定了BP神经网络的内部结构。然后利用遗传算法进行选择、交叉、变异操作来优化BP神经网络的各个连接的权值阈值,这样我们就能确定了最优的预测房价的BP神经网络内部结构。最后进行实证分析,使用MATLAB软件,输入预测样本数据,得到预测值。将预测值和实际值进行对比得出误差率并分析检验模型的精度和可行性。把通过ARIMA模型预测得到结果数据与经遗传算法优化后的BP神经网络预测得到的结果数据进行分析比较,选出哪个模型的预测结果值更加接近真实的房价价格,以此得到最优的房价预测模型。第二章ARIMA模型的预测研究2.1ARIMA模型简介ARIMA模型全称为差分自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA),该时间序列(Time-seriesApproach)预测方法是由博克思(Box)和詹金斯(Jenkins)于70年代初提出,因此又称为Box-Jenkins模型、博克思-詹金斯法。在ARIMA模型中AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型的预测的基本原理就是将需要预测的指标的历史数据作为一组随机序列,然后用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值,这样我们就可以通过该模型预测出未来的房价价格了。2.2建立ARIMA模型的具体步骤2.2.1时间序列的预处理建立一个ARIMA模型我们需要考虑的一个问题就是将非平稳序列转化为平稳序列。验证其历史数据是否存在非平稳性,我们可以通过直接观察时间序列的散点图来进行粗略的直观判断,也可以通过EVIEWS软件对该历史数据进行ADF单位根检验来判断,为了判断的准确和保险,我们直观观察和判断完数据后还需要接着对其进行ADF单位根检验,以确保准确性。如果序列检验为非平稳序列,那么我们就要对数据进行取对数或者差分化处理,直到我们处理的数据成为一个平稳的序列。2.2.2模型的识别和定阶我们运用EVIEWS软件对数据进行平稳化的预处理过后,我们得到了平稳的时间序列,然后对序列进行自相关函数与偏自相关函数的分析,然后我们对得到ACF和PACF图进行分析,若ACF拖尾而PACF截尾,则该序列适用AR(p)模型来做拟合;若ACF截尾而PACF拖尾,则该序列比较适用于MA(q)模型来做拟合;如果ACF和PACF都呈现拖尾,则该序列比较适用于ARMA(p,q)模型来做拟合。接着就是对模型进行参数估计:借助ACF和PACF图来判断显著水平5%情况下模型显著为0的个数来大致判断模型的参数。2.2.3模型的有效性分析与优化在这个环节,我们对软件通过数学模型拟合得到的确定了参数的预测模型的残差序列进行白噪声检验,如果该模型残差序列不是白噪声序列,则我们就需要放弃该参数下的预测模型,重新对其他参数的预测模型进行测试和检验,直到选择出残差序列为白噪声序列的参数模型,然后对比符合条件的预测模型的AIC和DW检验的数据进行选优,最后比较选择出符合要求的最优模型。2.2.4通过模型预测结果最后我们需要做的就是利用上面选择出来的模型,一一进行实证分析,最后得出各个模型的预测结果,选择与实际值对比误差最小的模型所做出的预测结果进行保留。以下是ARIMA模型做预测操作流程图如图所示:2.3ARIMA模型在昆明市房价预测中的实证分析2.3.1运用EVIEWS软件对数据进行预处理本文数据取自安居客网站,实证分析所选择的数据是昆明市从2002-2020年的全部房价数据,为检验模型对房价的预测是否准确,我保留了2019和2020年的房价数据,用来检验ARIMA模型做出的预测数值。然后再对2021年和2022年的数据进行外推预测,预测出未来两年的房价,待2021和2022年的数据出来后再做后续的检验。首先用EVIEWS将我国2002-2018年的全部房价数据来绘制时间序列图,得到原始时间序列图如图2-2所示:图2-22002-2018年昆明市房价数据2.3.2昆明市房价数据的平稳化处理我从图2-2可以看出,该时间序列的趋势走向并不明显,所以我需要对样本数据进行ADF单位根检验,以此来确定该时间序列是否为一个非平稳序列。我利用EVIEWS软件对原始数据进行ADF单位根检验,所得到的结果如图2-3所示:图2-32002-2018年昆明市房价数据的ADF单位根检验结果从图2-3可以看出单位根统计量ADF比EVIEWS给出的1%、5%、10%的显著性水平都要大,说明该时间序列是非平稳的时间序列,所以我需要对该非平稳序列进行平稳化处理。通常时间序列的平稳化处理有两种基本方法,一是将时间序列取对数,二是对数据进行差分化处理。这里我们选择对该数据序列进行取对数处理,取对数后时间序列图如图2-4所示:图2-4房价数据取对数后的数据图从图4可以看出该序列仍有明显的变化趋势,所以我并不能判断该序列是否为平稳序列。这时需要对该序列进行ADF单位根检验,通过EVIEWS对处理过后的房价数据进行ADF单位根检验得到的结果如图2-5所示:图2-5原始房价数据平稳化处理后的ADF单位根检验结果根据图2-5得到的数据可以看出,单位统计量ADF仍大于每个显著性水平ADF的临界值,所以该序列仍是非平稳的。这时就需要对序列再进行差分化处理,以使得该时间序列变成平稳的时间序列。对数据一阶差分得到了平稳的时间序列,该平稳序列如图2-6所示:图2-6房价数据取对数并一阶差分后的数据图从图2-6可以清晰的判断出该数据序列已经没有了明显的变化趋势,所以可以初步判断出该序列已经为平稳序列。但我本着严谨的态度,为了确保准确所以进行了ADF单位根检验,通过EVIEWS对处理过的房价数据进行ADF单位根检验得到结果如图2-7所示:图2-7原始房价数据取对数并一阶差分后的ADF单位根检验结果从2-7所得到的结果数据,我看出通过t检验,单位统计量ADF都小于每个显著性水平ADF的临界值,显著的拒绝了原假设,所以可以肯定该时间序列数据已经处理为平稳的时间序列,下一步我将对该时间序列进行模型拟合。2.3.3昆明市房价数据的ARIMA模型参数的估计以及模型确定首先我需要运用EVIEWS软件对平稳数据做自相关函数图和偏自相关函数图,得到作图结果如图2-8所示:图2-8房价时间序列平稳化处理后的自相关函数图和偏自相关函数图根据模型参数选择原则,因为我们只将原始数据进行了一次差分,也就是一阶差分,因此ARIMA(p,d,q)中的参数d定为1。从图6中可以清楚的看出该序列的自相关系数和偏自相关系数全部都拖尾,且n从2开始控制在了置信区间之内,因此可判定为ARIMA(2,1,2)模型。2.3.4昆明市房价数据的预测结果要得到最终的预测结果就需要运用到EVIEWS的预测功能来完成数据的预测,通过软件的操作,得到模型预测结果图如图所示:图2-9ARIMA的模型预测图从图2-9可以得到TIC数据和BP、VP、CP的具体数值,根据TIC判断原则,TIC越接近0说明预测结果越精确。再看BP、VP、CP的值,这三个值相加为1,其中BP和VP占的比重较小,CP比重占了百分之九十八,CP比重越大说明预测模型的精确程度越高。根据图中得到的数据可以判断该预测模型是比较准确的。另外我对2019和2020年的数据进行外推,并和实际值进行对比,因此得到了预测结果,将预测结果和真实结果进行比较,如表2-1所示:表2-1ARIMA模型的房价数值与真实房价数值从表2-1可以看出ARIMA模型所做的预测中,2002-2017年的预测数据和实际值还是比较接近的,但2017年后发现预测值和实际值之间的误差就拉大了,说明随着时间推移,ARIMA模型预测的准确性会有所下降。为了能更直观看出根据预测值和实际值之间的误差,我将全部预测数据和实际数据整理来绘制时间序列图,其中Y曲线为实际值,YF曲线为预测值,如图2-10所示:图2-10房价实际值与ARIMA预测值数据图第三章遗传算法优化的BP神经网络的预测研究3.1BP神经网络3.1.1BP神经网络结构与原理1986年由Rumelhart和McCelland为首的科学家小组提出的BP神经网络,是一种按误差逆传播算法训练的多层前馈网络,并成为目前应用最广泛的神经网络模型之一。BP神经网络结构比较简单,参数的调整也较为灵活方便,简单易操作,所以BP神经网络已得到了非常广泛的应用。有数据显示绝大部分的神经网络模型都是使用BP神经网络或者是其变换后的形式。BP网络模型处理信息的基本原理是:输入信号Xi通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号Yk,网络训练的每个样本包括输入向量X和期望输出量t,网络输出值Y与期望输出值t之间的偏差,通过调整输入节点与隐层节点的联接强度取值Wij和隐层节点与输出节点之间的联接强度Tjk以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。BP神经网络在结构上,具有输入层、隐含层和输出层三层,其中隐含层中可以是单层或多层,这一层与外界没有直接接触,就像被隐藏了一样,因此称之为隐含层。如图3-1所示,该图是一个比较标准的3层网络结构图:图3-1三层BP神经网络图图3-1是一个三层的BP神经网络的结构图,其中x1,x2,……,xn为输入信息,输入端到隐含层的连接权用Wij表示。网络中节点的阈值用θi来表示,也就是偏差;yi是i节点的输入值,f(x)是激活函数用来表示输入值和输出值之间的关系。激活函数会将输出值控制在一个范围内,一般控制在[0,1]或者[-1,1]之间。激活函数作为神经网络的核心部分,与网络结果一同决定了一个神经网络的具体功能和处理数据的能力,从而控制网络结果中信息的输入和输出。其工作原理就是在信息由输入层进入神经网络后能在隐含层中进行运行及处理,然后将数据传入输出层,最后由输出层给出最优答案。通过BP神经网络的正向传播和误差逆向传播,不断的调整网络中单元之间的权值、阈值,通过对训练训练反复进行调整,不断的对BP神经网络进行精确。通过这样的训练使BP神经网络能记住这些原始数据,并可以直接识别和记忆。具有识别和记忆的功能后就可以像人的大脑一样智能,当再次遇到相似的输入数据的时候,BP神经网络就能自动的识别和运行相关数据,从而在输出端直接输出结果。正因为BP神经网络的有记忆和识别功能,所以在预测方面得到了广泛的应用。3.1.2BP神经网络的算法过程BP神经网络一般由信息正向传播和误差反向传播两部分构成。信息进入到BP神经网络后先开始正向传播,在进入到隐含层后进行逐层计算并进行向后传播,最后传播到输出层。进入输出层后要对数据检验,计算输出值和目标值间的误差,如果误差大的话就将误差从网络中反方向传播回去,并不断修正各个接点的权值阈值,就这样反复正向反向传播,直到满足了目标输出值的时候停止。BP神经网络的基本工作过程如图3-2所示图3-2BP神经网络学习流程图3.1.3BP神经网络的优缺点优点:BP神经网络实质上实现了从输入到输出的映射功能,三层的神经网络就能够以任意精度逼近任何非线性连续函数。这使得BP神经网络很适合求解复杂的问题,这就是说BP神经网络具有较强的非线性映射能力。BP神经网络在训练时能够通过学习自动提取数据间的“合理规则”,并将学习内容记忆于网络的权值中。这说明BP神经网络具有高度学习和适应的能力。BP神经网络在设计模式分类器时,要考虑到网络在保证对相关分类对象进行正确分类,还要考虑网络在经过训练后,能否对未见过的模式进行正确的分类。这就是说BP神经网络具有将学习成果应用于新知识的能力。BP神经网络在其局部的神经元受到破坏后对全部的训练结果不会造成很大的影响,也就是说即使BP神经系统在受到局部损伤时还可以正常工作。即BP神经网络具有一定的容错能力。虽然BP网络得到了广泛的应用,但自身也存在一些缺陷和不足,主要包括以下几个方面的问题。首先,由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。对于一些复杂问题,BP算法需要的训练时间可能非常长,这主要是由于学习速率太小造成的,可采用变化的学习速率或自适应的学习速率加以改进。其次,BP算法可以使权值收敛到某个值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,可以采用附加动量法来解决。然后,网络隐含层的层数和单元数的选择尚无统一的规范,一般是根据经验或者通过反复实验确定。所以网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。最后,网络的学习和记忆具有不稳定性。如果增加了学习样本,由于神经网络对于以前的权值和阈值是没有记忆的,训练好的网络就需要从头开始训练。但是可以将预测、分类或聚类做的比较好的权值保存。3.2遗传算法优化的BP神经网络在前面我提到了BP神经网络的训练具有收敛速度慢、易形成局部最小值和网络结构不确定等缺陷,要想克服BP网络自身存在的确定就需要借助遗传算法来完成,这样既可以充分发挥两种算法的优点,使得结合后的GA-BP算法具有更强的学习能力和适应能力。通常情况下用遗传算法优化BP神经网络的各个单元间的权值、阈值、网络拓扑结构等。整个遗传算法优化神经网络的流程如图3-3所示:图3-3遗传算法优化BP神经网络流程图3.2.1遗传算法优化BP神经网络的权值和阈值用GA算法优化神经网络的权值和阈值过程有如下3个主要过程:(1)基因的表述(也就是确定权值、阈值的编码)。(2)个体适应度的估计。(3)运用进化操作算子(包括选择,交叉和变异)。在上述3个步骤的基础上算法反复迭代寻优,直到满足条件。3.2.2遗传算法优化BP神经网络拓扑结构BP神经网络的拓扑结构在整个网络中起着至关重要的作用,它影响着整个网络的学习和训练效率以及收敛的快慢。神经网络的单元数过多过少都会出现问题,过少的单元数会导致最后输出结果误差大。过多的单元会使得网络学习训练速度慢、收敛速度慢,也许还会导致过拟合情况,从这些可以看出建立一个优良的网络结构是极其重要的。现在设计网络结构时一般都是进行不断的试验性工作进行测试,然后根据输入层输出层数据的误差来确定最终的网络结构。而这种方法不仅耗费了时间,从结果上来看也不算是最好的确定神经网络拓扑结构的办法。这时就要用到遗传算法的全局搜索来解决这个问题,使得最终结果更加精确。3.3运用遗传算法优化BP神经网络对昆明市房价进行预测分析3.3.1BP神经网络拓扑结构的设计在预测房价时,因为房价是一个正常时间序列,所以我选用了一般的三层网络结构就可以解决一般模式识别问题。对于BP神经网络的构建首先我们要确定输入层、隐含层、输出层的节点数。确定输入层的节点数需要根据输入的数据种类来确定,首先要输入往年房价数据,而对于房价有影响作用的因素,我们选取了房地产开投资额作为房价的影响因子,那为什么要选择房地产开发投资额作为房价的影响因子呢?是因为通过土地价格、房地产开发投资对房价影响的实证分析,得到了相比土地价格而言,房地产开发投资额的变动对房价影响更大的结果。由此确定了输入层的节点数为2,一个是房价数据另一个是未来一年的房地产开发投资额数据。对于隐含层节点的确定前文已经说过目前还没有完备的理论来确定其结构,所以我只能通过经验公式来确定节点数目。经验公式如下所示:n2=n1×2+1公式中n1为输入层节点数,n2为隐含层节点数,而输入层节点在上面已经确定为2,将输入层节点数代入公式可知隐含层的节点数目为5个。对于输出层节点数的确定,因为我只需要预测未来的房价,所以输出层就可以确定为一个单元。根据输入层为2个节点,隐含层为5个节点,输出层为1个节点,确定了2-5-1的网络结构。权值、阈值的个数为2×5+5×1=15个,而阈值数等于5+1=6个,所以需要遗传算法优化的参数为15+6=21个。根据得到的结果可以初步得到一个网络结构,如图3-4所示:3.3.2数据的选择与预处理根据国家统计局提供的数据,我可以得到昆明市从2002年到2018年的全部房价数据以及全部的房地产开发投资额数据,如图3-5所示:图3-5房价与房地产开发投资额数据资料来源:国家统计局地方统计数据从图中可以看出数据过大,如果我要加快网络训练收敛速度,就必须对数据进行归一化处理,进行归一化处理后可以将数据变换成统一单位的样本,先统一度量单位无论是对之后的计算还是对建模来说都简便了不少,而且归一化处理后的数值正值的话会导致输入层到输出层的权值同时增减,使得学习效率降低,。因此进行归一化处理后要将数据统一处理成[-1,1]范围内的数字,归一化所用到的公式如下所示:,用公式进行归一化处理后得到的数据如图3-6所示:图3-6归一化处理后的数据表对数据进行归一化处理后,我选取了2002年-2018年之间的房价和房地产投资额数据作为训练样本输入,将2019年和2020年的两种数据作为预测样本来检验预测结果。在执行预测时将房价数据滞后一阶,也就是利用过往的房价数据和已知的未来一年的房地产投资额数据来预测未来一年的房价。运用可以采集到的2020年房地产投资总额和2021年房地产投资预算以及2020年的房价数据外推预测2021年的房价。3.3.3运用软件分析数据对归一化处理后的数据作为输入数据输入到神经网络的输入层,然后取2002年-2017年的房价数据和2003年-2018年的房地产投资额数据来预测其2002年-2018年房价数据的能力,根据学习后的网络对2019年和2020年的房价数据进行预测。在使用遗传算法进行优化时我将遗传算法的个体数目设定为50个,遗传最大迭代次数设定为500,交叉概率设定为0.7,变异概率为0.1,得到了误差的变化图,其中Y轴代表遗传迭代次数,X轴代表误差。误差变化图如图3-7所示:图3-7误差变化图从图中可以看出误差率虽然接近0,但我想让误差更小,使得模型更加精确。所以我又将遗传最大迭代次数设置为1000,交叉概率和变异概率都不变,得到的误差变化图如图3-8:图3-8最大迭代次数为1000次的误差变化图从图中可以看出,预测误差几乎接近于0。最后利用经遗传算法优化的BP神经网络对2019年和2020年的房价进行预测,得到的预测结果如图3-9所示:图3-9GA-BP神经网络房价预测走势图利用好训练的BP神经网络得到房价数据的预测值和实际值进行预测,得到的预测值和实际值如表所示:年份实际值预测值201780108076.25201810472.29982.4620191119712306.79202013364.2514078.32房价的实际值和预测值由表可以看出,GA-BP神经网络所做预测精确度很高,非常接近实际值。第四章总结分析与展望4.1本文结论本文的第二章和第三章分别介绍了传统时间序列的ARIMA预测模型和经遗传算法优化的BP神经网络模型,并运用这两个模型对昆明市的房价进行了实证预测。最后得到的预测值和实际值如表4-1所示:表4-1两种模型预测值与实际值对比表年份实际值ARIMA预测值GA-BP神经网络预测值201780108148.8448076.25201810472.28701.5749982.462019111979625.48712306.79202013364.2510350.2614078.32根据表可以看出,利用遗传算法对BP神经网络优化后进行预测时间序列数据的效果是非常理想的,误差比ARIMA模型预测的结果更小,克服了BP神经网络预测精度不高、训练速度慢和容易陷入极值的问题。GA-BP神经网络模型不仅提高了神经网络的预测精度而且提高了BP神经网络的性能。传统的时间序列ARIMA模型相对于人工智能的GA-BP神经网络模型来说,在预测时间序列模型上GA-BP神经网络模型就显得出色得多了。但是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陕西省西安市新城区2024-2025学年八年级上学期期末生物学试题(含答案)
- 投资理财借款合同
- 城市公园建设与管理合作协议
- 教育培训领域在线教育平台内容优化策略研究
- 客户关系管理解决方案实施报告
- 农业产业链延伸作业指导书
- 干砌挡土墙现场质量检验报告单
- 国际贸易术语题库
- 院感知识岗前培训
- 特色渔业资源经营合同
- GB 45184-2024眼视光产品元件安全技术规范
- 2025年湖南科技职业学院高职单招数学历年(2016-2024)频考点试题含答案解析
- 2025年新人教版八年级下册物理全册教案
- 《建筑电气设计》课件
- 品管圈PDCA案例-介入中心提高手术患者交接记录书写合格率医院品质管理成果汇报
- 第十七届山东省职业院校技能大赛中职组“西式烹饪”赛项规程
- 华东师范大学《外国人文经典(下)》2022-2023学年第一学期期末试卷
- 储能电池模组PACK和系统集成项目可行性研究报告
- 2024年安徽省公务员录用考试《行测》真题及解析
- 牙慢性损伤-楔状缺损
- JTJ034-2000 公路路面基层施工技术规范
评论
0/150
提交评论