【兰州市二手房价格数据实证处理及价格预测探究8700字(论文)】_第1页
【兰州市二手房价格数据实证处理及价格预测探究8700字(论文)】_第2页
【兰州市二手房价格数据实证处理及价格预测探究8700字(论文)】_第3页
【兰州市二手房价格数据实证处理及价格预测探究8700字(论文)】_第4页
【兰州市二手房价格数据实证处理及价格预测探究8700字(论文)】_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

兰州市二手房价格数据实证处理及价格预测研究摘要近几年,随着二手房市场的不断崛起,很多学者也开始用不同的方法研究影响二手房市场价格的主要因素;本篇论文结合以往学者方法和实际情况,对兰州市二手房市场的价格进行分析,利用本科阶段学过的应用时间序列分析的知识,对兰州市2012年到2020年二手房价格的月度数据进行分析。首先,对兰州市二手房价格的原始数据做预处理,然后利用excel软件绘制时间序列的线图与年度折叠时间序列图,对二手房价格的时间序列数据做描述性统计分析,观察兰州市2012年到2020年二手房单位价格的时序图波动情况,分析我国2016年颁布的“房住不炒”政策对兰州市二手房价格的效果;其次,编写相应的程序并利用SAS软件对兰州市2018年到2020年份的时间序列数据进行平稳性检验和白噪声检验,对非平稳序列数据做差分得到平稳的非白噪声序列,然后利用处理后的数据拟合模型,通过观察平稳序列样本的自相关系数和偏自相关系数的值,以及AIC值的大小,选择出适当的模型为ARIMA(1,1,0)模型,再对这个模型和模型的相关系数做显著性检验。最后,利用拟合出来的模型对兰州市未来五期的二手房价格做预测。关键词兰州市二手房价格、ARMA模型、预测目录TOC\o"1-3"\h\u21714第1章绪论 9135521.1研究背景 9107731.2研究目的及意义 992441.3研究现况 1071241.4论文结构 1021909第2章相关理论基础及模型 10157012.1因素分解理论 10164482.2时间序列模型 10259622.2.1自回归移动平均(ARMA)模型 1058502.2.2求和自回归移动平均(ARIMA)模型 11244942.3ARMA模型的应用 12281552.3.1对序列做平稳性、白噪声检验 12184732.3.2ARMA模型的定阶方法 12112822.2.4模型检验 1225584第3章兰州市二手房价格数据分析 1383743.1数据来源 13203993.2描性统计分析 1370633.2.1序列预处理 13213403.2.2绘制时序图 13101803.3建模步骤 1572083.5模型的缺点 2021604第4章结论及建议 2078924.1结论 20128144.2建议 2131987参考文献 1第1章绪论1.1研究背景随着经济社会的快速发展,房地产产业成为我国国民经济发展的重要支柱,对社会经济的发展起着至关重要的作用。房地产不仅对人民生活中具有举足轻重的影响,而且也是金融投资的主要组成部分,它作为固定资产,具有保值的作用,所以很多投资者,会选择把多余的资金投资到房地产。久而久之,随着房地产投资额的增长,市场会出现一种供不应求的现象,进而导致房价不断上升,超过房子本身的价值,最后产生房地产泡沫和国民贫富两极分化现象,对于那些经济状况不是很好,而又想购买属于自己的房子的居民,二手房成了他们的首要选择。与此同时,在我国居民收入不断增加,房地产市场的价格也处于一个不断上涨的趋势,最主要的是近几年在政府政策以及资源影响等因素的影响下,房地产价格一直处于居高不下的趋势,这就导致很多中下层收入水平的家庭纷纷把注意力转移到二手房市场,二手房市场也就慢慢崛起。目前,二手房市场价格受到很多不确定因素的影响,存在很多交易双方的信息不对称,导致二手房市场的定价不仅受到房屋自身的内在因素影响,在一定程度上也受客观因素的影响。这一系列因素就导致政府部门开始重视房地产价格问题,并在2016年年底的中央经济工作会议首次提出“房子是用来住的,不是用来炒的”,此后,与房地产相关的部门根据我国不同地区的实际情况陆续出台了与之相配套的政策,强调房地产最主要的是使用功能,加强房地产市场分类调控,房价上涨压力大的城市要合理增加住宅用地,规范开发、销售、中介等行为。所以,本文想利用兰州市二手房市场近几年的价格波动情况,分析影响兰州市二手房价格的主要因素,并分析“房住不炒”政策对兰州市二手房市场的影响程度。1.2研究目的及意义近几年房地产市场备受广大群众关注,房地产作为固定资产,不仅是我们生活的必需品,而且可以作为广大投资者投资的产品。本篇论文的研究目的是分析我国“房住不炒”政策的效果如何,分析这个政策对兰州市二手房市场产生的影响。除此之外,随着社会的发展,由于当前构建房地产的地面逐年缩减,二手房价格也居高不下,区别于一手房,二手房交易流程较长、涉及的主体多、法律关系错综复杂,纠纷时常会发生,不同程度的风险也是无处不在,所以分析研究我国二手房市场的现状有助于规避一些人为的经济纠纷,房地产研究也就具备了可行性和必要性。通过运用在校期间学习的相关专业知识和统计软件分析兰州市二手房市场现状,一方面可以了解城镇二手房价格的情况和交易现状,从宏观上把握二手房市场的存在价值和发展趋势,另一方面可以通过对兰州市二手房市场单位价格的分析、前人的研究结果以及未来二手房价格的预测,分析客观政策对二手房的影响,为二手房的公平合理交易提供一些理论依据,为参与到二手房交易的个人或者家庭提供一些积极有效的参考信息和应该注意的事项,所以对城镇二手房价格的研究具有较强的现实意义和参考价值。本文对我国二手房市场现状进行分析、收集相关数据并对信息进行归纳和整理,找出目前二手房市场存在的问题。结合我国情况并根据相关理论对二手房市场进行系统的分析和研究,对房地产市场进行有效的引导和管理是具备重要的现实意义。1.3研究现况曹刚和杨巧芳在2008年的文章中提出不仅宏观经济政策、普通新房的数量会影响二手房的价格,而且由于买卖双方信息不对称,以及中介公司也会影响二手房你价格。姚翠友在2008年的文章中提出可以通过灰色关联分析进一步确定影响二手房价格的因素,并利用这个模型分析出相关因素。张景阳和潘藩友在2013年对农村居民纯收入进行预测,指出相较于多元线性回归预测模型,BP神经网络的预测效果会更好。王晨在2016年提出随着新时代的发展,大数据应用让房地产交易更健康。2017年,竺荣梁从杭州实际情况,分别从住宅区位特征、建筑特征和环境特征三大类上考虑,利用相关模型,分析这些因素对二手房住宅价格引起的波动情况,为政府更加合理的房产政策制定、房地产商的各投资决策和购房者的购房计划安排提供一个新的、相对准确的参考。董倩、孙娜娜、李伟通过对北京市二手房价格预测分析,对数据进行清洗,转换和归一化处理,选取拟合优度最高的方法作为北京市房地产估价用的模型。并用最优模型完成房价的预测和预测精度的检验。白东杰通过八爪鱼采集器爬取了石家庄市二手房的数据,分析这些数据各自对应的被解释变量和解释变量,对数据进行多元线性回归、随机森林回归分析,对石家庄市二手房单位面积房价提供了更精准的评估方法。1.4论文结构本篇论文主要分为五个章节来论述的,第一章节主要介绍的是本片文章研究的背景,研究二手房市场价格的目的和研究意义,了解目前我国二手房市场的发展状况,以及以往学者对二手房市场价格的研究结果。第二章主要是论文要用到的理论知识。包括ARMA模型的定义、基本形式、优缺点和应用的基本方法,判定准则等。第三章是实证部分,是对获取的数据进行处理,检验数据的平稳性和随机性,并用处理的数据做拟合模型,得到最优的模型,检验模型的显著性,最后在利用拟合模型做未来房价的预测。第四章是对研究结果的叙述和根据结果给出相应的政策建议。相关理论基础及模型2.1时间序列模型2.1.1自回归移动平均(ARMA)模型ARMA模型是研究时间序列的重要方法,在自回归模型(AR模型)和滑动平均模型(MA模型)的基础混合而成的新模型。ARMA模型的一般形式为ARMA(p,q),所以我们可以根据p或q是否等于0把ARMA模型分为以下三类:(1)自回归(AR)模型当q=0时,ARMA模型为变成AR模型,即自回归AR(p)模型,此时时间序列{yt}满足如下结构:其中{}是独立同分布的随机变量序列,假设该随机序列满足E()=0、则称时间序列{yt}服从p阶的自回归模型。并且当时,称序列{yt}为中心化的自回归模型,中心化的AR模型可以记为式中列满足,称为p阶自回归系数。(2)移动平均(MA)模型当p=0时,ARMA模型变成MA模型,即移动平均MA(q)模型,时间序列{yt}满足如下结构:其中随机序列{}的均值E()=0、方差、(s≠t)时,随机序列为零均值白噪声序列。当满足时,该模型变成中心化的MA(q)模型,此时该模型可以简写为,称为q阶移动平均系数多项式。需要注意的是移动平均模型在任何条件下都平稳。(3)自回归移动平均(ARMA)模型当p和q都不等于零时,即为自回归移动平均ARMA(p,q)模型,此时时间序列{yt}满足:同时该模型满足E()=0、方差、(s≠t)、时,称时间序列为{yt}服从(p,q)阶自回归移动平均模型。2.1.2求和自回归移动平均(ARIMA)模型以上所说的ARMA模型是对平稳的非白噪声序列进行拟合,但在日常生活中我们获得的原始数据可能是非平稳的,这就需要我们对原始数据进行处理,得到平稳序列后再对序列进行模型拟合。而ARIMA模型就是差分运算和ARMA模型的结合,所以我们可以利用差分运算的功能,对非平稳序列的确定信息进行提取,使非平稳的序列差分后变成平稳的非白噪声序列,再进行ARMA模型拟合。(1)差分平稳无季节效应的非平稳时间序列一般可以分为两部分,一部分是有时间t决定的确定性信息,另一部分是由白噪声序列决定的随机干扰项,所以我们可以对原始序列做适当的差分运算,消除随机干扰项的趋势性,提取出确定性信息。在差分平稳的过程中,默认为d阶差分就可以充分提取出序列{yt}的确定性信息,其结构如下:则一阶差分为,为一阶自回归过程。(2)ARIMA模型求和自回归移动平均模型的结构为:(2.5)对原始数据做差分运算得到平稳的非白噪声序列后,可以做ARMA模型拟合。2.2ARMA模型的应用2.2.1对序列做平稳性、白噪声检验对时间序列做平稳性检验我们选择用ADF检验,利用SAS软件计算出ADF检验统计量,观察ADF检验统计量的P值是否大于显著性水平α,如果小于显著性水平,可以认为该序列是平稳的,反之,这个序列是不平稳的,需要我们做差分运算后再进行检验平稳性。当序列是平稳的,我们还需要对平稳后的序列做白噪声检验,以确保对这个序列的研究是有效的。序列纯随机性检验使用的统计量是Q统计量,其中,由于标准化后的服从于标准正态分布,即其中。当Q统计量的P值大于显著性水平α或小于自由度为m的卡方分布的1-α分位点时,认为序列为白噪声序列,即纯随机序列,反之,为非白噪声序列。2.2.2ARMA模型的定阶方法模型定阶主要是通过样本的自相关系数和偏自相关系数的值以及BIC准则,选择出适当的阶数和模型拟合观察值序列。ARMA模型的定阶原则如下表2-1:表2-1拖尾p阶截尾AR(p)模型q阶截尾拖尾MA(q)模型拖尾拖尾ARMA(p,q)模型数,其中,。2.2.3模型检验模型的检验包括对拟合模型的显著性检验和参数的显著性检验。对于拟合好的模型做纯随机性检验,选取LB检验统计量,。若LB统计量的P值大于显著性水平,则拟合模型的残差序列为白噪声序列,说明拟合的模型充分提取了相关信息,模型是有效的,反之,无效。同样,为了拟合模型更精准有效,需要对拟合模型的每一个参数做显著性检验,其目的是剔除那些对因变量影响不显著的自变量。我们选用t统计量检验拟合模型参数的显著性,,在正态分布假设下,最小二乘估计出来的未知参数也服从正态分布。兰州市二手房价格数据分析3.1数据来源研究房地产市场的价格波动情况,使用单位价格代表不同地区的房价波动情况,具有代表性,可以消除同一地区不同面积对房价的影响。本篇论文的数据是从聚汇数据网站获取的。聚汇数据网站作为一个专门的二手房服务平台,其二手房信息是非常完整的,并且可以找到各个市区不同区域的二手房价格信息,最主要的是从聚汇数据网站上可以找到兰州市二手房的单位价格。3.2描性统计分析3.2.1序列预处理先对兰州市2012年到2020年的二手房月度价格数据做不变价处理,消除通货膨胀对二手房价格的影响,减少不同年份的通货膨胀对房价带来的影响;然后对得到的单位二手房不变价取对数处理,利用取对数后的数据对3.2.2绘制时序图(1)“房住不炒”政策分析为了促进房地产行业健康稳定发展,2016年中央经济工作会议首次提出“房子是用来住的,不是用来炒的”,并先后在不同地区采取不同的措施来实现真正的“房住不炒”,其目的一方面是防止房地产泡沫的发生,另一方面是实现人民住有所居。所以,本篇论文以兰州市二手房市场的价格波动情况来分析“房住不炒”政策对兰州市房地产市场的影响效果,并结合以往作者对这个政策的研究结果,分析房住不炒政策对我国房地产市场产生的效果。观察图3-1兰州市二手房单位价格的时间序列线图,可以看出从2012年1月到2020年12月份兰州市的二手房单位价格处于长期增长趋势,我国的“房住不炒”政策是在2016年颁布的,如果这个政策的效果是显著的,那么2016年前后几年时间,兰州市二手房市场的单位价格应该是有明显的变化,在这个政策的影响下,2016年后的房地产价格应该是趋于下降的,但实际上,兰州市二手房的单位价格并没有下降,反而从2016年开始有大幅度上升的趋势,尤其是2018年的12个月中二手房单位价格增长速度最快,并于10月份达到最大值13204元每平方米,之后才开始慢慢下降,从2019年到2020年逐渐趋于平稳。这就说明兰州市二手房市场的价格并没有受到“房住不炒”政策的显著影响,即“房主不炒“政策的效果并不是很好,甚至可能是没有任何效果的。但由于兰州市二手房市场的的单位价格波动情况无法代表我国整体的房地产价格变化,所以为了更充分说明”房住不炒“政策的效果,我们以下借鉴以往学者的研究结果进行说明。2020年杨洁根据史密斯政策模型,分析影响“房住不炒”的相关因素及该政策实施过程中的问题,结果表示,”房住不炒”政策的效果很小,它并没有减少居民对房地产的投资额,持续增长的投资额促使房地产价格上涨持续;2019年乔璐璐利用我国35个大中城市十年时间的月度面板数据,研究各个政策对房地产价格指数的影响,结果表明“房住不炒”政策可能存在两种情况,一种是短期有效,长期无效,另一种是这个政策直接没有效果;2015年李昱璇通过对我国29个城市的房地产价格做时间序列分析,研究结果表明“房住不炒”政策是无效的。所以,结本篇论文的研究结果和以往学者的研究表明,该政策并没有达到我们的预期的效果,即效果是不显著的。图3-1时间序列线图(2)趋势性分析使用时间序列模型分析二手房单位价格的波动情况,要保证该序列只具有长期性趋势,不受周期性因素和季节性因素影响。同时由于ARIMA模型只能分析短期序列,本篇论文我们选用2018年到2020年这三年的月度数据拟合相关模型。如下图3-2的时间序列年度折叠图,通过观察可以看出,2018年到2020年兰州市二手房单位价格的月度数据没有呈现循环特征和季节性效应,只受长期趋势和随机波动性影响,故可以利用时间序列模型做分析。图3-2年度时间序列折叠图3.3建模步骤(1)平稳性检验由时间序列图可以看出,目前的时间序列是一个非平稳的,且具有长期增长趋势,所以我们需要对非平稳序列做差分运算,使其成为一个平稳序列。先做一阶差分,,其中为单位价格收益率,为第t期的单位二手房价格;一阶差分后输出ADF检验结果,序列的平稳性检验如下表3-1。根据输出表的第四列和第六列可知,ADF检验统计量的P值小于显著性水平(α=0.05),所以该序列一阶差分后趋于平稳。表3-1平稳性检验表增广Dickey-Fuller单位根检验类型滞后RhoPr<RhoTauPr<TauFPr

>

F零均值0-46.2452<.0001-8.38<.0001

1-45.9340<.0001-4.69<.0001

2-20.53260.0005-2.630.0101

单均值0-50.16310.0002-9.430.000244.470.0010

1-75.74010.0002-5.850.000217.150.0010

2-81.61970.0002-3.470.01526.140.0184趋势0-52.3704<.0001-10.210.000152.150.0010

1-118.8270.0001-7.230.000126.140.0010

2377.95100.9999-5.190.001013.630.0010(2)白噪声检验当序列平稳时,进一步需要做白噪声检验,只有当平稳序列为非白噪声时,继续做拟合模型才是有效的,否则是无效的。观察SAS软件输出的结果,如表3-2,当延迟阶数为6时,取显著性水平为α=0.1,白噪声序列自相关检验的P值小于选取的显著性水平,所以认为该序列为非白噪声序列,说明序列是有效的,可以进一步做分析。表3-2白噪声检验表白噪声的自相关检查至滞后卡方自由度Pr>卡方自相关610.9560.0899-0.4710.0560.0820.105-0.028-0.190(3)模型定阶利用SAS软件,输出观察值序列的样本自相关和偏自相关值,利用自相关系数和偏自相关系数的值以及AIC准则,确定一个阶数适当的模型。观察如下图3-3一阶差分后序列的趋势和自相关、偏自相关分析图可以看出,序列的自相关图拖尾,偏自相关图的1阶自相关系数在2倍标准差之外,其余的自相关系数在2倍标准差的范围内。所以由定阶原则表可知,兰州市二手房市场的单位价格序列自相关拖尾,偏自相关1阶截尾,可以初步确定拟合模型为ARIMA(1,1,0)。图3-3序列趋势和相关图表3-3最优定阶原则MinimumInformationCriterionLagsMA0MA1MA2MA3MA4AR0-7.60238-7.78067-7.70809-7.65605-7.55544AR1-7.78328-7.7123-7.62298-7.61715-7.62812AR2-7.75939-7.65842-7.55771-7.51931-7.55861AR3-7.71477-7.65299-7.55754-7.59653-7.50423AR4-7.66716-7.63507-7.5833-7.51777-7.41634同一个时间序列可以构造出多个拟合模型,所以直接根据自相关系数和偏自相关系数的性质确定拟合模型不太准确,为获得一个最有效的拟合模型,我们需要利用AIC准则,选择AIC值最小的拟合模型为最优模型。观察输出结果如表3-3,从表可以看出p=1,q=0时,AIC值达到最小值,最小值为-7.78328,综上分析,ARIMA(1,1,0)为最优拟合模型。(4)模型检验对模型的有效性检验是利用残差的自相关系数来检验的,当序列为白噪声序列时,认为该模型对序列的信息提取是充分的,即这个模型是有效的。我们通过观察SAS运行的结果图得出,该ARIMA模型在6阶以内就是白噪声序列,所以拟合效果很好,如表3-3。表3-4残差自相关检验残差的自相关检查至滞后卡方自由度Pr>卡方自相关66.1050.2967-0.102-0.1620.2100.208-0.121-0.0991213.17110.28240.311-0.057-0.041-0.0060.2090.0071814.31170.6448-0.098-0.002-0.036-0.042-0.072-0.0022418.12230.75120.0090.008-0.1670.007-0.000-0.101(5)模型参数检验确定了拟合模型后,要进一步对模型的未知参数进行估计,并对估计出来的参数做显著性检验。本篇论文对模型的参数估计使用的方法是最小二乘估计,输出运行结果如表3-5,观察图可以看出相应的估计参数值,常数项的估计值为0.0065497,自回归参数值为-0.47539,并且检验估计值参数的统计量的P值小于显著性水平α=0.05,所以拟合模型的参数也是显著的,即该模型成立。表3-5最小二乘表条件最小二乘估计参数估计标准

误差t

值近似

Pr>|t|滞后MU0.00654970.00237462.760.00940AR1,1-0.475390.15406-3.090.00411综上分析,拟合模型ARIMA的具体表达形式为:残差的正态性检验在拟合时间序列模型时,我们一般默认残差序列是服从正态分布的,但有时候可能这个默认的假设条件是不成立的,所以我们需要检验残差序列的正态性。如下图残差序列正态性检验图:一个是残差的分布直方图,为检验残差的正态性,画出残差的核密度图和正态分布的密度函数图,由图可以看出,残差的核密度线近似于正态分布的密度线,并且在QQ图中,残差分布点也集中分布于对角线上,说明该序列的残差是服从于正态分布的,即我们一开始默认的残差服从于正态分布的原假设成立。图3-4残差正态性检验图3.4序列预测以上我们已经确定了拟合模型为ARIMA(1,1,0),现在可以用该模型对未来五期的二手房单位价格做短期预测,用SAS软件输出结果,如下表3-6,该表显示的预测价格是单位房价的对数,换算过来后,未来五期的二手房单位价格分别为12686.58、12732.33、12833.32、12909.26和12998.64。与此同时,我们还输出了预测价格图和拟合预测价格效果图,如图3-5和3-6。拟合与预测价格效果图,图中星号代表未来五期序列的预测观察值,红线代表根据预测观察值做的序列拟合线,上下虚线代表拟合值的95%的置信区间。表3-6价格预测表以下变量的预测:price观测预测标准误差95%置信限379.44830.02069.40809.4886389.45190.02329.40649.4974399.45980.02799.40529.5145409.46570.03099.40539.5262419.47260.03409.40609.5392图3-5价格预测图图3-6拟合与预测效果图3.5模型的缺点用ARMA模型识别、估计和诊断的系统方法。优点在于建立适当的模型并且确定模型的系数后,就可以根据有限的数据对未来的发展趋势进行预测。缺点:1)要求时序数据是稳定的,或者是通过差分化后是稳定的。2)本质上只能捕捉线性关系,而不能捕捉非线性关系。3)只能做短期的时间序列模型拟合在拟合ARMA模型时,由于模型自身的缺陷,该模型只能捕捉到影响二手房的线性因素,不能分析非线性因素,如政策、定性因素等对房价的影响,而且ARMA模型只能对短期的序列进行拟合,像本篇论文刚开始想利用2012年到2020年的数据做分析,但模型会出现平稳的白噪声序列,此时就没有分析的意义。所以不能很好的分析准确的价格波动情况。结论及建议4.1结论论文通过对兰州市二手房价格的时间序列数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论