河海大学数学建模基于历史数据分析的金融投资风险问题_第1页
河海大学数学建模基于历史数据分析的金融投资风险问题_第2页
河海大学数学建模基于历史数据分析的金融投资风险问题_第3页
河海大学数学建模基于历史数据分析的金融投资风险问题_第4页
河海大学数学建模基于历史数据分析的金融投资风险问题_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于历史数据分析的金融投资风险问题摘要本文针对金融投资的问题建立了两种模型。首先,通过对历史数据的分析,发现日收益额的样本大体呈正态分布,据此提出假设并建立了正态分布通用模型,并采用概率纸检验法对分布的正态性进行检验,得出交易日的日投资效益分布近似服从正态分布,并利用其正态分布的性质进行求解,得出:一个周期内损失数额超过10万元的概率为3.80%,以95%的置信度保证损失的数额不会超8.72万元,一个周期内损失超过是10万元的可能性不大于5%的初始投资额最多为1147万元;两个周期内损失数额超过10万元的概率为3.65%,以95%的置信度保证损失的数额不会超7.94万元,两个周期内损失超过是10万元的可能性不大于5%的初始投资额最多为1259万元。模型结论可推广到T个周期的情况。其次,针对解决预测收益的数值及以一定置信度为基础的损失分析的问题,建立一个VaR(ValueatRisk)风险分析模型,得出关于初始投资额M、限定损失额L、置信度(1-)和周期个数T的一般数学表达式,采用方差—协方差法对VaR模型进行求解。利用已建立的VaR模型估计在下一个周期内的损失的数额超过10万元的可能性,以及能以95%的置信度保证损失的数额的上限值,并利用相同的方法估计下两个周期的情况。通过比较正态分布模型与VaR风险分析模型,发现两者对下一周及下两周的估计情况相近,故估计的结果具有可靠性,模型具有稳定性。关键词:正态分布;VaR模型;置信度;收益额;金融投资一、问题重述某公司在金融投资中,需要考虑如下两个问题:1)准备用数额为1000万元的资金投资某种金融资产(如股票,外汇等)。它必须根据历史数据估计在下一个周期(如1天)内的损失的数额超过10万元的可能性有多大,以及能以95%的置信度保证损失的数额不会超过多少。2)如果要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为多少。下面是该公司在过去一年255个交易日的日收益额(单位为万元)的统计数据,假定每天结算一次,保持每天在市场上的投资额为1000万元:收益额33323130292827262524232221201918天数1111121214026347收益额171615141312111098765432天数58571014819911111410668收益额10-1-2-3-4-5-6-7-8-9-10-11-12-13-14天数9593741625532210收益额-15-16-17-18-19-20-21-22-23-24-25-26-27-28-29-30天数1000000100100000要求:参考以上数据,建立两种模型来解决前述的两个问题,并对这两个模型加以比较;讨论二周期情形(如今后两天内)上述两个问题的答案。陈述上述两个问题的一般形式(即初始投资额为M,限定损失额为L,置信度为1-,T个周期)及其解决方案。二、问题分析这是一个根据已知历史收益额情况下,为将来获得较丰厚的收益而制定投资计划的问题。255个交易日的日收益额,可以看作数理统计中的样本观测值。首先,可以采用绘制样本散点图的方法,探究样本观测值的分布规律,据此选择并建立两个代表模型,确定抽样分布的概率密度函数和分布函数的通用表达式及各个参数。其次,由建好的模型预测一个周期内及两个周期内的损失的数额超过10万元的可能性,以及得出能以95%的置信度保证损失的数额不会超过多少。最后对建立的两个模型的可靠度及稳定性进行分析比较,具体情况具体分析,扬长避短,选择适宜的求解模型。图一:问题分析流程图三、模型假设(1)各个周期的收益额相互独立,不存在相关性;(2)各个周期服从的概率分布均相等,不存在差异性;(3)金融投资市场基本稳定,公司收益额的总体概率走势不会因投资额的改变而发生剧烈变化,并且影响收益额的其他因素在本文研究的较长时期内不发生变化;(4)题中给出的255个交易日的收益额为随即抽样样本,基本上可以认为能够充分反映该公司一年的整体收益情况;(5)各种风险资产之间没有一定的关联性。四、符号系统:投资中的初始投资额;:第i种收益在样本中的天数;:在样本中第i种收益的值,分别取-30,-29,……32,33;:概率密度函数;:给定置信区间内的一个特定持有期内的最大可能损失。注:其它符号文章中给予说明。五、模型建立5.1模型一的分析与建立采用绘制样本散点图的方法,观察点据分布情况,初步估计样本大体符合正态分布规律,如图二所示。下面采用数值正态分析的频率纸检验法进行证明。图二:样本散点图5.1.1对取样进行数值正态分析—概率纸检验法数据输入x=[333231302928282726262524242424222221212121212120202019191919181818181818181717171717161616161616161615151515151414141414141413131313131313131313121212121212121212121212121211111111111111111010101010101010101010101010101010101099999999988888888888777777777776666666666666655555555554444443333332222222211111111100000-1-1-1-1-1-1-1-1-1-2-2-2-3-3-3-3-3-3-3-4-4-4-4-5-6-6-6-6-6-6-7-7-8-8-8-8-8-9-9-9-9-9-10-10-10-11-11-12-12-13-15-22-25];作频数直方图利用matlab中的直方图命令hist(x),作出255个交易日的日投资效益频率分布直方图三。从图可知,该投资效益出现的可能性近似服从正态分布。图三:255个交易日的日投资效益频率分布直方图分布的正态性检验在matlab中分别输入以下命令:normplot(x)和weibplot(x),分别得到图四和图五。从图四可知,数据基本上分布在一条直线上,初步可以断定该投资效益出现的概率服从正态分布。而图五显示的是数据矩阵x的weibull概率图,如果数据来自于weibull分布,则图形将显示出直线性形态,否则显示出曲线形态。比较图四和图五可以确定,255个交易日的日投资效益分布近似服从正态分布。图四:255个交易日的日投资效益正态分布检验图图五:255个交易日的日投资效益威尔逊分布检验图参数估计在基本确定所给数据x的分布后,就可以估计该数据的参数。输入以下命令:[muhat,sigmahat,muci,sigmaci]=normfit(x);结果:muhat=7.4863;sigmahat=9.8520muci=6.2713,8.7013;sigmaci=9.0647,10.7902估计出该分布的均值为7.4863,标准差为9.8520,均值的0.95置信区间为[6.2713,8.7013],标准差的0.95置信区间为[9.0647,10.7902]。小结通过matlab的正态拟合与参数的估计可知该收益的分布近似服从正态分布,其中正态分布的参数分别用样本的均值与标准方差来进行估计,因此该分布的密度函数为:其中:。5.在5.1中已分析并建立了模型一(近似的正态分布模型),得出了收益额服从的正态分布的密度函数,下面针对题中所给出的关于预测收益的可能性及以一定置信度为基础进行损失分析的问题,采用对该分布进行分析求解概率的方法解答。首先,分析一个周期和两个周期内损失的数额超过10万元的可能性有多大问题,题中条件对于已建立的正态分布模型一相当于提供了分布自变量的区间,可以直接利用分布函数求得。其次,关于能以95%的置信度保证损失的数额不会超过多少的问题,可采用将分布函数化为标准正态分布进行计算,也可查表得到相应的损失值。利用上面得到的样本数据的均值与标准差,可以写出该近似正态分布的密度函数,表达式为:其中:。第一小问中估计在下一个周期(如1天)内损失的数额超过10万元的可能性有多大,可由概率表达式来表示:经查正态分布表及用matlab计算可知;故下一个周期内损失数额超过10万元的概率为3.80%。第二小问中假设以95%的置信度保证损失的数额不会超X万元,则有该分布服从正态分布可知:,由概率知识可知该等式可以化为:所以;将各个数据带入得X=8.72(万元)。第三小问中求为使损失额不大于10万元的投资额:在第二问中已算出损失值达到95%的置信区间时的最大损失额为8.72万元,按同样的比例求得当最多损失为10万元的投资额应为1147万元。当为两周期情形(如今后两天内)时,对于上述两个问题而言,设第一天的收益额是,第二天的收益为,根据上述模型假设(3),,均服从模型一的正态分布,其中,。同理得出两个周期的情形,关系式为:由于关系式中X,未知,需求出X,的值。引理:若X,Y相互独立且X~,Y~,则~的正态分布。[2]故~的正态分布,计算方法同一个周期的情形。问题计算结果为:两个周期内的损失的数额超过10万元的可能性为3.65%;以95%的置信度保证损失的数额不会超过7.94万元;初始投资额最多应为1259万元。对于T个周期情况而言,由引理可知该T个周期之和也服从模型一的正态分布,为,计算的方法同理于以上的步骤,将该正态分布转化为标准正态分布后,进而求解,计算过程的表达式可以简要表示如下:5.2模型二(VaR模型)的分析与建立模型:按字面的解释就是“处于风险状态的价值”,即在一定置信水平和一定持有期内,某一金融工具或其组合在未来资产价格波动下所面临的最大损失额。Jorion则把定义为:“给定置信区间的一个持有期内的最大的可能损失”。可以理解为在一定置信水平下,某一金融资产或证劵组合在未来特定时间内的最大可能损失,可表示为,其中为金融资产或证劵组合在持有期内的损失,为置信水平下处于风险中的价值。5.2.1基本模型的建立 根据Jorion(1996),可定义为: ① 其中为资产组合下的预期价值;为资产组合下的期末价值;为置信水平下下投资组合的最低期末价值。 ;;其中为持有初期资产组合价值;为设定持有期内资产组合的效益率;为资产组合在置信水平下的最低收益率。 将二者带入①式得② 公式②即为资产组合的值,根据公式②,如果能求出置信水平下的,即可求出该资产组合下的值。5.2.2模型计算方法—方差-协方差法 方差-协方差法是运用历史资料,计算资产组合的值。其基本思路为:首先,利用历史数据计算资产组合的收益的方差、标准差、协方差;其次,假定资产组合收益是正态分布,可求出在一定置信水平下,反映了分布偏离均值程度的临界值;第三,建立与风险损失的联系,推导值。设某一资产组合在单位时间内的均值为,标准差为,,又设a为置信水平下的临界值,根据正态分布的性质,在概率水平下,可能发生的偏离均值的最大距离为,即∵根据有假设持有期为,则均值和数准差分别为和,这时上式则变为:5.2.3利用模型求解一个周期的情况估计下一个周期(如一天)内的损失数额超过10万的可能性:另=10,=1化为标准正态分布查表得=0.0380,因此下一个周期(如1天)内的损失的数额超过10万元的可能性为3.80%;求以95%的置信度保证损失的数额的上限:令,,则=8.72,因此以95%的置信度保证损失的数额不会超过8.72万元。要求在一个周期内的损失超过10万元的可能性不大于5%,初始投资额最多上限:由第二问已经求出以95%的置信度保证损失的数额不会超过8.72万元,根据假设(5)可求得最多损失10万元的投资额应为1147万元。两个周期的情况对于两个周期而言,令,则:估计下二个周期(如2天)内的损失的数额超过10万元的可能性为3.65%;求以95%的置信度保证损失的数额的上限为7.94万元;要求在二个周期内的损失超过10万元的可能性不大于5%,初始投资额最多上限为1259万元。T个周期的情况对于T个周期而言,令,则:。即初始投资额为M,限定损失额为L,置信度为,T个周期,有如下通用模型二的表达式(r为参数):六、模型比较模型一和模型二考虑问题的方向不同。模型一方法较为普遍,将255个收益额看成数理统计中样本观测值,将其绘制成散点图,估计收益额样本服从的分布,建立模型,进而用基础的概率论与数理统计知识加以解决,思路清晰,求解也较为简便;模型二结合金融风险评价VaR模型对问题进行详细的阐释,VaR模型实用性更强,对投资的指导意义在于:人们可以利用计算机对大量风险投资的历史数据进行处理,通过对历史数据的分析研究,预测出资产的平均收益率和风险置信度,根据模型可以计算出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论