【原创】R语言股票回归、时间序列分析报告论文附代码数据_第1页
【原创】R语言股票回归、时间序列分析报告论文附代码数据_第2页
【原创】R语言股票回归、时间序列分析报告论文附代码数据_第3页
【原创】R语言股票回归、时间序列分析报告论文附代码数据_第4页
【原创】R语言股票回归、时间序列分析报告论文附代码数据_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文题目:股票价格回归分析报告摘要:主要思路为了准确的估计股票价格,了解股票的一般规律,更好的为资本市场提供参考意见和帮助股民进行投资股票作出正确的决策,本文从股票价格指数与整个经济环境角度出发,采用多元回归分析方法,应用月度时间序列数据,通过选取综合反映股票市场上所有公司股票价格整体水平的指标建立了线性回归模型,得出了股票价格趋势变动的影响因素.关键词:回归模型;指数模型;股票价格;预测一、引言主要思路为了准确的估计股票价格,本文从股票价格指数与整个经济环境角度出发,采用多元回归分析方法,应用月度时间序列数据建立了线性回归模型,具体分析步骤:关系分析基于以上原理,为大致了解股票价格与诸因素之间的关系,先分别绘制股票价格与各个因素之间的散点图,并分析它们之间的关系.股价用上证A股指数来表示,这样可以减少人为因素对股票价格的影响,尽量将注意力集中在我们假设选用的自变量上.我们采用的数据是2012年和2015年上半年的月度数据,分析影响我国股市趋势的因素。之所以选取2012年和2015年7月的统计资料是基于以下两点考虑:中国股市发展时间较短,采用年度数据会因为样本量太小而使得回归分析失去意义;数据取得的存在较大难度,因季度数据不全而只能选取月度数据.因此选取2012年和2015年7月份月度数据作为样本.指数平滑时间序列预测模型选择多项式回归模型3.1变量选取通过向前向后逐步迭代回归模型筛选出显著性较强的变量进行回归建模。3.2显著性检验根据F值和p值统计量来判断模型是否具有显著的统计意义。3.3拟合预测使用得到的模型对实际数据进行拟合和预测。4.分析得出结论得出各个自变量之间的关系,以及它们对因变量的影响极其经济意义。二、获取数据及预处理获取2012年1月到2015年7月的上证指数数据,货币供应量,消费价格指数人民币美元汇率和存款利率数据

绘制变量之间的散点图plot(data)par(mfrow=c(2,2))

plot(美元汇率,上证指数数据)

plot(人民币存款利率,上证指数数据)三、指数平滑时间序列模型预测表示时间序列JanFebMarAprMayJunJul

2012263.67019.925240.655131.620245.665368.020

2013-51.615-156.54569.235-46.705-329.040-181.635-2.555

2014-65.53587.56579.20037.740-157.900-118.65559.360

2015-50.230142.300-11.580-25.71047.830-92.995-115.865

AugSepOctNovDec

2012-130.350-216.610125.145163.41544.480

2013145.3105.895236.40597.135-142.555

2014-176.755-108.775-71.05532.655-149.320

2015利用HoltWinters函数预测:p.hw<-forecast.HoltWinters(m.hw,h=24)h=24表示预测24个值

四、进行多元回归模型并进行分析summary(lmmod)显示回归结果

Call:

lm(formula=y~x1+x2+x3+x4,data=data)

Residuals:

Min1QMedian3QMax

-543.94-90.091.69113.01500.68

Coefficients:

EstimateStd.ErrortvaluePr(>|t|)

(Intercept)-3.457e+049.319e+03-3.7100.000661***

x13.325e-031.369e-032.4300.019950*

x21.341e+012.663e+010.5030.617562

x34.787e+011.400e+013.4200.001511**

x47.870e+023.380e+022.3280.025322*

---

Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1

Residualstandarderror:246.5on38degreesoffreedom

MultipleR-squared:0.4804,AdjustedR-squared:0.4257

F-statistic:8.783on4and38DF,p-value:4.012e-05回归结果分析从输出结果可以看出,回归方程为,变量和的统计量的估计值分别为-3.457e+04,3.325e-03,1.341e+01,4.787e+01和7.870e+02,除了x2以外由对应的值都比显著性水平0.05小,可得两个偏回归系p数在显著性水平0.05下均显著不为零。进一步地剩余方差的估计值,f统计量的估计值为8.783,由对应的p值4.012e-05说明,回归方程是显著的。可决系数R,修正的可决系数R为0.48左右说明方程的拟合效果较好。拟合效果图形展示以上证指数的原始数据作为x轴,回归拟合值为轴作图,在xy面上的点用直线连接见图1。"货币供应量数据","居民消费价格指数","美元汇率","人民币存款利率"之间原始图和拟合值的关系散点图par(mfrow=c(2,2))

plot(货币供应量数据,上证指数数据,type="l")

plot(人民币存款利率,上证指数数据,type="l")

lines(人民币存款利率,fitted(lmmod),col="red")置信区间与预测区间:置信区间是给定自变量值后,由回归方程得到的的预测值(实0y际上是的平均值)的置信区间;预测区间是实际值的置信区间,在这里称为预测区间。0y0y预测区间要比置信区间稍大,命令与显示结果如下predict(lmmod,int="c")fitlwrupr

12475.2422251.5062698.979

22499.7752292.2382707.313

32577.0192407.6312746.407

42591.8862430.2492753.522

52587.0352430.3702743.701

62693.3362533.4062853.266

72700.1742534.9392865.409

82721.1342574.9722867.296

92739.6532604.0152875.291

。。。382292.4622133.9362450.987

392431.0192261.3072600.730

402353.4662189.9582516.974

412428.7892234.3662623.211

422359.7942122.2602597.327

432165.2941879.1122451.475predict(lmmod,int="p")fitlwrupr

12475.2421928.3523022.133

22499.7751959.3093040.241

32577.0192050.0243104.014

42591.8862067.3313116.441

52587.0352063.9913110.080

。。。392431.0191903.9202958.118

402353.4661828.3312878.601

412428.7891893.2222964.355

422359.7941807.1152912.473

432165.2941590.0272740.560残差分析:残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。命令语句为plot(lm.1),显示结果如下par(mfrow=c(2,2))

plot(lmmod)左上图是拟合值与残差的散点图,从图上可以发现,除去第6个离群点外,所有点基本上是随机地分散在纵坐标值为-1和+1的两条平行线之间,这说明随机误差项具有同方差性;左下图是拟合值与残差的标准差的散点图,其意义与上面类似;右上图表明随机误差项是服从正态分布的,其原因是正态Q-Q图近似地可以看成一条直线;右下图的CooK距离图进一步证实第6个观测值是一个离群点,它对回归方程的影响是比较大的,要根据具体问题,讨论出现这一观测值的实际背景。逐步回归优化使用逐步回归法建立“最优”的回归方程Start:AIC=478.32

y~x1+x2+x3+x4

DfSumofSqRSSAIC

-x21154012324529476.61

<none>2309128478.32

-x413293902638518482.05

-x113587082667836482.53

-x317105763019704487.86

Step:AIC=476.61

y~x1+x3+x4

DfSumofSqRSSAIC

<none>2324529476.61

+x21154012309128478.32

-x416912993015828485.80

-x118608803185410488.15

-x3113934293717958494.80summary(stepmod)查看模型参数与结果

Call:

lm(formula=y~x1+x3+x4,data=data)

Residuals:

Min1QMedian3QMax

-539.93-107.079.65100.96471.56

Coefficients:

EstimateStd.ErrortvaluePr(>|t|)

(Intercept)-3.669e+048.237e+03-4.4546.9e-05***

x13.792e-039.977e-043.8000.000495***

x35.228e+011.081e+014.8352.1e-05***

x48.928e+022.621e+023.4060.001542**

---

Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1

Residualstandarderror:244.1on39degreesoffreedom

MultipleR-squared:0.4769,AdjustedR-squared:0.4367

F-statistic:11.85on3and39DF,p-value:1.17e-05上面用“逐步向前向后回归法”,通过软件分析建立“最优”回归方程。向后回归法就是建立包含全部因子的回归方程,通过回归系数的检验,从回归方程中逐个剔除不显著的因子,直到留在方程中的因子都是显著的。五、结论本文首先通过绘制上证指数与诸影响因素(货币供应量,居民消费价格指数,人民币兑美元汇率,人民币短期存款利率)之间的散点图和计算它们之间的相关系数,可知上证指数与诸因素之间存在比较明显的非线性关系,因此,为简化问题,通过R软件,采用逐步进入法剔除了不显著的自变量—居民消费价格指数、人民币短期存款利率和人民币兑美元汇率,并建立了多元回归模型.利用所得模型可对股票价格的因素进行探讨.研究表明,上证指数和货币供应量与人民币短期存款利率并不存在长期的稳定关系]8[.因此,这里只使用此模型对我国股票市场作出粗略的线性估计.我们猜测只是由于影响股票价格的因素复杂,如公司的经营状况,股民的投资心理等等,并最终反映在投资决策和投资行为上来]9[,表现在上证指数的高低.此外,股票市场是一个动态的过程,投资者作为金融产品的需求者与供应者,通过交易量的调整来表达对价格水平的意见.因此,股票价格变动与人民币兑美元汇率之间也存在一定的关系。当然,值得注意的是,股票价格并不是由上述因素来决定,还有其他的影响因素。通过回归分析可以发现,股票价格与货币发行量息息相关,股价本应随着货币发行量的增加而节节攀升,然而,自2011年至今,由全球金融危机的影响,股价持续下滑,而货币月发行量不断增加,很大程度上,这是国家宏观调在起主导作用的结果;由此可见,我们依靠纯粹的数据因素在很大程度上是很难准确预测股票价升降的走势.由于股票市场是以虚拟经济交易的场所,即是股票交易、买卖和流通的场所。股市分析方法包括技术分析、基本分析和演化分析,在此仅从技术分析角度来分析股票价格,比较片面的。更由于在我国目前仍然以实体经济为主的经济模式之下,我国的股票市场仍处于青春时期,虽然非常活跃,但同时受制于国家体制。随着经济的发展,未来的股票市场前景将随着经济总量的提升而不断扩大其基本面,但同时必须关注全球经济、政治的发展局势,把握国家宏观调控的尺度,不能单纯从相关影响因素的数据进行预测。Code:获取数据及预处理获取2012年1月到2015年7月的上证指数数据,货币供应量,消费价格指数人民币美元汇率和存款利率数据y=c(1931.3,2194.97,2214.895,2455.55,2587.17,2832.835,3200.855,3070.505,2853.895,2979.04,3142.455,3186.935,3135.32,2978.775,3048.01,3001.305,2672.265,2490.63,2488.075,2633.385,2639.28,2875.685,2972.82,2830.265,2764.73,2852.295,2931.495,2969.235,2811.335,2692.68,2752.04,2575.285,2466.51,2395.455,2428.11,2278.79,2228.56,2370.86,2359.28,2333.57,2381.4,2288.405,2172.54);上证指数数据,2012.1——2015.7?x1=c(496135.31,506708.07,530626.71,540481.21,548263.51,568916.20,573102.85,576698.95,585405.34,586643.29,594604.72,610224.52,625606.29,636072.26,649947.46,656561.72,663351.37,673921.72,674051.48,687506.92,696471.5,699776.74,710339.03,725851.79,733884.83,736130.86,758130.88,757384.56,763409.22,780820.85,772923.65,780852.30,787406.20,816829.25,825493.94,851590.90,855898.89,867171.42,895565.50,889604.04,900048.77,924991.20,919072.40);货币供应量数据,2012.1——2015.7?x2=c(98.3,98.4,98.8,98.5,98.6,98.3,98.2,98.8,99.2,99.5,100.6,101.9,101.5,102.7,102.4,102.8,103.1,102.9,103.3,103.5,103.6,104.4,105.1,104.6,104.9,104.9,105.4,105.3,105.5,106.4,106.5,106.2,106.1,105.5,104.2,104.1,104.5,103.2,103.6,103.4,103,102.2,101.8);居民消费价格指数2012.1——2015.7?x3=c(683.82,683.57,683.41,683.12,682.45,683.32,683.20,683.22,682.89,682.75,682.71,682.79,682.76,682.70,682.64,682.62,682.74,681.65,677.75,679.01,674.62,667.32,665.58,665.15,660.27,658.31,656.62,652.92,649.88,647.78,646.14,640.9,638.33,635.66,634.08,632.81,631.68,630,630.81,629.66,630.62,631.78,632.35);人民币100外币兑美元汇率2012.1——2015.7?x4=c(17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,17.1,19.1,19.1,22.5,22.5,26,26,28.5,28.5,28.5,31,31,31,31,31,31,31,31,31,31,31,28.5,26)/10;人民币存款利率2012.1——2015.7?将数据合并data=cbind(y,x1,x2,x3,x4)data=as.data.frame(data)给变量名赋值attach(data)colnames(data)=c("上证指数数据","货币供应量数据","居民消费价格指数","美元汇率","人民币存款利率")绘制变量之间的散点图plot(data)par(mfrow=c(2,2))plot(货币供应量数据,上证指数数据)plot(居民消费价格指数,上证指数数据)plot(美元汇率,上证指数数据)plot(人民币存款利率,上证指数数据)表示时间序列library(xts)上证指数数据=ts(上证指数数据,start=c(2012,1),frequency=12)plot.ts(上证指数数据)diff(上证指数数据)计算相邻观察值之差b<-rollmean(上证指数数据,12)12是移动平均的期数。lines(b)利用HoltWinters函数预测:library(forecast)m.hw<-HoltWinters(上证指数数据)p.hw<-forecast.HoltWinters(m.hw,h=24)h=24表示预测24个值plot(p.hw)进行多元回归模型并进行分析lmmod=lm(y~x1+x2+x3+x4,data=data)summary(lmmod)显示回归结果Call:lm(formula=y~x1+x2+x3+x4,data=data)Residuals:Min1QMedian3QMax-543.94-90.091.69113.01500.68Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-3.457e+049.319e+03-3.7100.000661***x13.325e-031.369e-032.4300.019950*x21.341e+012.663e+010.5030.617562x34.787e+011.400e+013.4200.001511**x47.870e+023.380e+022.3280.025322*---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:246.5on38degreesoffreedomMultipleR-squared:0.4804,AdjustedR-squared:0.4257F-statistic:8.783on4and38DF,p-value:4.012e-05回归结果分析从输出结果可以看出,回归方程为,变量和的统计量的估计值分别为-3.457e+04,3.325e-03,1.341e+01,4.787e+01和7.870e+02,除了x2以外由对应的值都比显著性水平0.05小,可得两个偏回归系p数在显著性水平0.05下均显著不为零。进一步地剩余方差的估计值,f统计量的估计值为8.783,由对应的p值4.012e-05说明,回归方程是显著的。可决系数R,修正的可决系数R为0.48左右说明方程的拟合效果较好。拟合效果图形展示以上证指数的原始数据作为x轴,回归拟合值为轴作图,在xy面上的点用直线连接见图1。plot(y,fitted(lmmod),type="l")"货币供应量数据","居民消费价格指数","美元汇率","人民币存款利率"之间原始图和拟合值的关系散点图par(mfrow=c(2,2))plot(货币供应量数据,上证指数数据,type="l")lines(货币供应量数据,fitted(lmmod),col="red")plot(居民消费价格指数,上证指数数据,type="l")lines(居民消费价格指数,fitted(lmmod),col="red")plot(美元汇率,上证指数数据,type="l")lines(美元汇率,fitted(lmmod),col="red")plot(人民币存款利率,上证指数数据,type="l")lines(人民币存款利率,fitted(lmmod),col="red")置信区间与预测区间:predict(lmmod,int="c")fitlwrupr12475.2422251.5062698.97922499.7752292.2382707.31332577.0192407.6312746.40742591.8862430.2492753.52252587.0352430.3702743.701.....422359.7942122.2602597.327432

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论