




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上支持向量机方法在风险评估的运用OK一、支持向量机介绍支持向量机(support vector machines)是由贝尔实验室研究者Vapnik于20世纪90年代最先提出的一种新的机器学习理论,是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。支持向量机从诞生至今才10多年,发展史虽短,但其理论研究和算法实现方面却都取得了突破性进展,有力地推动机器学习理论和技术的发展。这一切与支持向量机具有较完备的统计学习理论基础的发展背景密不可分。统计学习理论领域里把学习问题看作是利用有限
2、数量的观测来寻找待求的依赖关系的问题。而基于数据的机器学习问题,则是根据已知样本估计数据之间的依赖关系,从而对未知或无法测量的数据进行预测和判断。支持向量机方法是统计学习理论中最年轻的部分,目前仍处于不断发展阶段。支持向量机是从线性可分情况下的最优分类面发展而来的。其基本思想可用图3-3的两维情况说明。图3-3:支持向量机的分类面图3-3中,实心点和空心点代表两类样本,H为分类线,H1、H2分别为过两类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。所谓最优分类线就是要求分类线不但能将两类样本正确分开(训练错误率为0),而且使分类间隔最大,右图的H即为最优分类线。分类线方
3、程可以表示为x·w+b=0,对它进行归一化,使得对线性可分的样本集(xi,yi),i=1,n,xRd,yi+1,-1,满足约束条件式(1)。此时分类间隔等于2/w,使间隔最大等价于使w2/2最小。满足条件公式(1)且使w2/2最小的分类面就叫做最优分类面,H1、H2上的训练样本点称作支持向量。因此,求最优分类面的问题转化为在不等式(1)的约束下式(2)的优化问题。利用Lagrange优化方法可以把上述求最优分类面问题化为其对偶问题,即求式(3)的最大值,约束条件为式(4),其中i为Lagrange乘子。这是一个不等式约束下二次函数寻优的问题,存在唯一解。解上述问题后得到的最优分类函数
4、式(5)。式(5)中的求和实际上只对支持向量进行。i*为i的最优解,b*是分类阈值,可以用任一个支持向量(满足公式(1)的等号)求得,或通过两类中任意一对支持向量取中值求得。上面的最优分类面是在线性可分的前提下讨论的,在线性不可分的情况下,考虑到可能存在一些样本不能被超平面正确分类,因此引入松弛变量i0,这样公式(1)的线性约束条件变为式(6)。此时优化问题变为(7);约束条件为(8)。式(7)中的常数C起着对错分样本的惩罚作用,实现的是学习机器泛化能力和错分样本数目之间的折中。以上都是在线性分界超平面的基础上进行的讨论,在很多问题中需要将其推广到非线性分类超平面中。SVM的非线性特性可以如下
5、方式来解决,把输入样本X映射到高维特征空间(可能是无穷维)H中,并在H中使用线性分类器来完成分类,即将X做变换:R(d)H,则前面的分析同样适用。当在特征空间H中构造最优超平面时,训练算法使用空间中的点积,即仅仅使用(xi)·(xj),而没有使用单独的(xi)。因此,如果能够找到一个函数K使得k(xi,xj)=(xi)·(xj),那么,在高维空间实际上只需进行内积运算,而这种内积运算是可以用原空间中的函数来实现的,甚至没有必要知道的形式。根据泛函的有关理论,只要一种核函数k(xi,xj)满足Mercer条件,它就对应某一变换空间中的内积。选择不同的内积函数K,就形成不同类型
6、的算法,常用的内核函数有:多项式(Polynomial)内核函数、Guass内核函数、Sigmoid内核函数等。二、基于支持向量机的高校财务综合风险预测本部分的数据来源于教育部直属76所高校的2009年财务年报数据。自变量为财务综合风险评估的15个因子,也是支持向量机的输入变量,因变量为高校财务综合风险。利用因子分析的总分和排名,将财务综合风险离散化。由于财务风险通常采用五级评价(很小、较小、一般、较大、很大),因此,将76所高校的F得分离散化,转化为1,2,3,4,5,分别表示财务风险很大、较大、一般、较小和很小:F值小于-0.5表示财务风险很大,用1表示;F值介于0- -0.5之间表示财务
7、风险较大,用2表示;F值介于0-0.2之间表示财务风险一般,用3表示;F值介于0.2-1之间表示财务风险较小,用4表示;F值大于1表示财务风险很小,用5表示。转换后发现,财务风险很大的高校11所,财务风险较大的高校31所,财务风险一般的高校12所,财务风险较小的高校17所,财务风险很小的高校5所。从每种财务风险中选取部分高校,合计抽取70所高校作为已知样本,剩余6所作为检验样本。表1:76高校财务风险的原始数据高校F1F2F3F4F5F6F7F8F9F10F11F12F13F14F15离散化F分区中央戏剧学院-1.85970.1478-1.76-0.83-2.232-0.825-2.3-0.4
8、859-3.34231.0321-1.4611.266-2.83-2.5570.5645910中国矿业大学(北京)-1.1844-0.407-1.64-1.09-1.399-0.364-2.1-1.552-2.1925-1.192-1.174-0.38-1.8-0.44-0.17910中央音乐学院-1.7834-0.342-1.75-0.58-1.7820.8378-2.3-0.9874-2.27121.0038-1.196-1.13-2.77-0.640.0862210北京中医药大学-0.9016-0.657-0.98-1.51-1.2190.2883-1.2-0.9544-1.1373-0
9、.24-0.791-0.34-1.16-1.205-0.557910北京外国语大学-1.09870.1451-1.55-0.14-1.376-0.018-1.9-0.5152-2.1384-1.017-1.063-0.5-1.46-0.2511.2665510华北电力大学-0.98140.0327-1.38-0.78-1.319-0.411-1.6-1.1027-1.49250.5383-0.989-0.47-1.330.3-0.413411华北电力大学(保定)-0.9461-0.977-1.06-0.54-1.2280.1984-1.3-0.2208-1.4272-0.024-0.895-0
10、.79-1.210.2250.1204911中央美术学院-1.04930.0514-1.51-0.33-1.335-0.087-1.8-0.9915-1.8590.3165-1.021-0.63-1.34-0.2952.3552311北京化工大学-0.8132-1.119-0.93-1.24-1.012-0.16-0.8-0.0992-0.8382-0.105-0.5850.631-0.8-0.327-0.228211中国传媒大学-0.92321.1045-1.05-1.12-1.2260.0975-1.20.10757-1.2171-0.482-0.869-0.09-1.2-0.299-5.
11、645211北京语言大学-0.8344-0.25-0.950.175-1.0510.1407-1.1-0.8787-1.0693-0.523-0.75-0.33-0.850.1071-1.028911中国海洋大学-0.6636-1.056-0.74-0.68-0.7210.1587-0.5-0.0911-0.47881.6094-0.482-0.14-0.49-0.323-0.720620上海财经大学-0.3887-0.855-0.43-1.35-0.341-0.4-0.30.41605-0.1282-0.051-0.3960.139-0.28-2.5540.023520东北大学-0.5489
12、-0.69-0.74-1.14-0.655-0.438-0.50.06545-0.41270.5939-0.46-0.58-0.470.13521.1373220东华大学-0.7369-0.143-0.79-0.86-0.7940.7779-0.60.28579-0.62540.1122-0.53-0.42-0.66-0.95-0.39320中国药科大学-0.8154-0.566-0.941.544-1.0250.7228-0.9-0.4219-1.0662-2.131-0.6040.083-0.810.29241.4414420河海大学-0.79590.1769-0.910.261-0.88
13、2-1.077-0.8-0.4562-0.79720.7148-0.5620.01-0.740.34060.0605420中央财经大学-0.97811.2616-1.14-0.37-1.295-0.098-1.4-0.5877-1.43020.0886-0.9651.401-1.221.3506-0.496120中国石油大学(北京)-0.7629-0.281-0.90.072-0.8580.2296-0.8-0.0561-0.77840.2122-0.5550.418-0.710.63020.6693920华中农业大学-0.6935-0.682-0.750.49-0.7430.3447-0.5
14、0.06224-0.50540.3825-0.4890.211-0.52-0.407-0.350220南京农业大学-0.7445-0.016-0.86-0.15-0.8520.7841-0.8-0.2685-0.73980.7251-0.5530.087-0.710.1350.9730320北京林业大学-0.7427-0.067-0.830.217-0.7950.3764-0.7-0.1448-0.71781.7537-0.551-0.79-0.67-1.0911.4725520陕西师范大学-0.265-0.386-0.09-0.84-0.1660.17450.06-0.03910.05883
15、-1.158-0.299-0.01-0.06-0.302-0.722720对外经济贸易大学-0.5267-0.481-0.680.792-0.6310.0192-0.40.10399-0.36630.7671-0.4520.919-0.42-0.202-0.025720中国地质大学(北京)-0.8711-0.154-0.951.314-1.0730.814-1.12.16729-1.12771.2033-0.770.838-0.86-1.540.6611120中国地质大学(武汉)-0.51790.2595-0.480.136-0.562-0.403-0.3-0.4687-0.31860.573
16、8-0.429-0.15-0.370.6156-0.267120北京邮电大学-0.4082-0.054-0.45-0.24-0.4390.0516-0.3-0.8126-0.16050.5076-0.4010.732-0.290.12270.3657620中国政法大学-0.3394-0.605-0.32-1.15-0.2580.6512-0.21.44885-0.11020.3341-0.3630.559-0.231.1046-0.396221兰州大学-0.0357-0.5990.3122.0830.2883-6.7720.31.6740.52724-0.5230.0399-0.610.241
17、-0.666-0.28821中南财经政法大学-0.1033-0.5960.155-1.320.1523-0.4850.24-0.42870.38091.0535-0.072-0.420.17-0.4230.6371321北京科技大学-0.2689-0.302-0.17-0.32-0.214-0.4350.021.372150.03530.0298-0.314-0.39-0.120.1295-0.509921合肥工业大学-0.2904-0.482-0.180.326-0.218-0.055-0-0.9868-0.08141.0921-0.3390.815-0.16-0.7360.1648121南
18、开大学-0.2318-1.108-0.011.604-0.0120.60160.12-2.19190.24518-1.036-0.2120.9140.029-0.645-0.026921西北农林科技大学-0.1995-0.5180.0060.1020.0122-0.1820.13-0.44350.30995-0.005-0.183-0.140.033-0.1610.4991421西安电子科技大学-0.1046-0.5830.144-0.290.1146-0.3650.220.820170.361950.1866-0.134-0.520.17-1.151-0.043121江南大学-0.38860
19、.0941-0.36-0.42-0.3251.4663-0.23.27293-0.1210.1098-0.365-2.28-0.28-0.957-0.575921北京师范大学-0.524-1.129-0.581.283-0.5932.0543-0.40.77003-0.3411.4944-0.440.405-0.390.04050.1681621东南大学-0.19440.22170.039-0.660.01550.02220.14-0.59260.31636-0.756-0.176-1.810.0391.51881.5645621上海外国语大学-0.72310.9321-0.770.092-0
20、.7740.1849-0.6-0.1827-0.59192.1503-0.5260.726-0.521.09271.2108921中国人民大学0.20675-0.9290.361-0.830.4745-0.2390.340.182960.62195-1.070.14630.2240.3390.05481.4071121西南财经大学-0.3245-0.694-0.292.488-0.2211.6664-0.2-0.454-0.0955-1.515-0.3580.805-0.21-1.026-1.036621南京大学0.04443-0.6590.3570.7950.3780.13250.33-0.
21、45680.59416-2.2680.0866-1.260.3251.9421-1.195421东北林业大学-0.49730.2723-0.470.591-0.5090.4877-0.3-0.5548-0.22651.4122-0.4210.711-0.32.0975-0.231930华东师范大学-0.0501-0.3680.2220.0920.19860.65910.281.070130.42383-0.434-0.026-0.480.217-0.238-0.30430华中师范大学-0.26510.1064-0.150.937-0.193-0.7590.03-0.67290.044762.0
22、197-0.3010.278-0.111.2877-0.250230湖南大学-0.0155-0.1260.319-0.260.3614-0.0230.3-0.4370.528590.06520.05510.8550.266-0.1330.0766530中国矿业大学(徐州)-0.07240.22460.182-0.360.1618-0.1450.26-0.40690.415520.4955-0.030.3360.1871.1918-0.729630北京交通大学0.000770.26640.333-0.680.37230.11090.310.377640.53582-0.0480.0552-0.0
23、20.316-0.3430.1723830东北师范大学-0.24120.1995-0.051.051-0.1360.65980.07-0.7750.087530.0589-0.230.628-0.050.26420.4585231中山大学0.85563-0.4061.025-1.591.1033-0.6350.82-1.04130.96987-1.2270.6184-0.10.8910.244-1.605531华东理工大学-0.048-0.3320.3071.2040.23970.01550.290.861950.525290.0436-0.014-0.320.23-0.657-0.40243
24、1中国农业大学0.25115-0.6010.3630.4050.4769-0.8720.370.355330.63848-0.2830.15510.3340.361.32760.3000331长安大学-0.11791.70710.0880.280.11360.48620.17-0.15650.34622-1.066-0.142-1.870.046-0.754-0.282831西安交通大学0.32214-0.0590.431-1.010.485-0.0650.48-0.16940.653490.54010.20070.2810.4391.97980.2791231电子科技大学0.332460.7
25、160.447-0.750.4926-0.5920.6-0.47620.66064-0.4620.2172-0.530.5241.58570.4973140同济大学0.89688-0.1641.063-0.971.15010.33611-0.6150.98057-2.4610.7247-0.431.067-1.392-0.018540华南理工大学0.45098-0.3950.475-0.60.78990.19750.691.389440.839060.01190.2722-0.360.5950.7470.1528840西南大学0.386650.00580.464-0.370.5712-0.37
26、10.670.822290.77288-0.6610.25410.1710.5871.96661.6466740天津大学-0.13641.62590.0630.0960.03040.94410.170.461730.32320.3822-0.154-0.90.0411.37730.6270840厦门大学0.62378-0.6210.7030.7110.8950.52810.710.826980.89535-0.6160.32890.7470.6450.59280.0294640大连理工大学0.37587-0.0480.4621.4670.51270.87030.61-0.40940.70815
27、1.37030.22610.0110.559-0.3590.5858340中南大学0.75038-0.4770.748-0.630.9468-0.1640.81.323350.921060.77150.40493.1950.7120.8853-0.311340西南交通大学0.465160.13410.5282.6090.82120.02950.70.082250.87268-1.4410.2999-0.240.624-0.4460.7571940吉林大学1.67977-0.8561.367-0.331.5724-0.8891.41-0.73651.191950.03661.2196-0.231
28、.413-0.018-0.838441武汉理工大学1.05745-0.2611.0990.6061.17550.27011.14-1.21491.015520.11390.77480.4431.143-0.483-0.530941中国石油大学(华东)-0.23624.3963-0.030.366-0.0780.34350.120.754150.08946-0.024-0.230.0780.0090.0475-0.665741复旦大学1.29030.11281.302-0.271.3046-0.5461.20.45391.0861.30851.0725-3.251.3511.0861-0.113
29、41重庆大学0.777760.57590.9420.8970.96570.65850.820.005710.93108-2.2160.5522-0.080.7271.9180.9693441武汉大学1.80001-0.3081.472-0.731.58180.35761.49-0.82981.23114-0.4931.2846-0.011.474-0.81-1.175541山东大学1.25419-0.1931.2120.5011.2526-0.4271.20.463181.04193-0.7030.79031.8411.157-0.397-0.106141四川大学1.5598-0.5281.3
30、380.6621.45811.36371.273.421121.10025-1.1191.09330.391.41-0.306-0.6941浙江大学2.248210.38681.6593.1661.6695-1.0191.58-1.20971.275271.18361.3319-0.621.548-0.2210.1634950华中科技大学2.31991.62451.864-1.231.6715-1.0771.632.432591.36362-0.6571.83161.3331.6260.16980.850650清华大学2.98699-0.7492.979-0.282.6336-0.2182.7
31、50.057581.51740.37535.7779-0.992.371-0.136-0.384150上海交通大学2.677032.88652.898-1.182.0544-0.5731.78-0.63051.40112-1.3052.30693.4392.344-0.923-1.108351北京大学2.629174.21081.8730.622.04440.07651.72-0.70141.366140.53882.2028-1.642.164-2.1390.4318351采用Clementine 12.0的SVM模型进行支持向量机分析,从70个已知观测值中随机抽取10所高校作为训练样本,将
32、剩余的60所高校随机分为3组,每组20所,这可以通过新增一个分组变量来解决,令这四组取值分别为0,1,2,3。Clementine 12.0的SVM模型有四种内核类型:RBF、多项式、Sigmoid、线性,本书将依次采取这四种模式,最后选取一个准确率最高的模式,运行结果见表2。四个模式都计算变量的重要性,见图1。四个模式都采用专家模式而非简单模式。模型停止的标准是1.0E-3,规则化参数为10,回归精确度为0.1,RBF伽马为0.1,伽马为1.0,偏差为0.0,度为3。由表2可知,四个模式中,相对而言RBF的分类准确性要高一些,训练样本和三组检验样本的准确性分别为73%、74%、81.5%和8
33、1.5%,可以将该模式继续用于6名财务绩效假定未知的识别。模型的整体分类准确性还有待提高,这主要是因为本书只考虑了影响财务绩效的15个因素,并不全面,而且前面的因子分析有部分信息丢失。表2:支持向量机的分类结果的准确性由图2可知,RBF模式认为各变量的重要性依次为:F2、F1、F5、F3、F10、F7、F11、F12、F13、F9、F15、F14、F8、F4和F6;多项式模式认为各变量的重要性依次为:F5、F11、F2、F7、F10、F12、F13、F14、F8、F15、F4、F9、F3、F6和F1;Sigmoid模式认为各变量的重要性依次为:F15、F6、F9、F4、F14、F13、F8、F
34、10、F7、F5、F1、F3、F11、F12和F2;线性模式认为各变量的重要性依次为:F5、F2、F7、F1、F10、F3、F12、F15、F14、F9、F8、F11、F4、F6和F13。因为相对而言RBF模式的准确率最高,所以,F2应该是影响高校财务风险大小的首要因素。图10-2:支持向量机分析结果中变量的重要性高校财务风险评价具有重要意义,而支持向量机的分类方法能在一定程度上帮助高校进行财务风险评价和预测。考虑到支持向量机的优点和高校财务风险评价的数据特点,本书设计了一种基于支持向量机的高校财务风险评价模型。根据2009年76高校财务绩效数据,选取10所作为训练样本,选取60所高校分为3组,作为检验样本集。使用训练数据集对支持向量机模型进行训练,并将训练后的模型对测试数据集(剩余6所高校)进行测试,取得了较好的实验结果。三、利用支持向量机进行风险评估的相关文献1李丽,周宗放.企业集团信用风险评估SVM集成分类器的构建与应用.技术经济.2013(11).摘要:将AdaBoost算法与支持向量机(S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程公司财务制度
- 咸宁彩色混凝土施工方案
- 砖砌污水井施工方案
- 砼护栏施工方案
- 南山车库防水施工方案
- 广西喷泉维修施工方案
- 6mm 650nm 5mw 红光点状激光 pd脚作用
- 5年级下册人教版英语词语表
- 5年级白鹭第二自然段改写成一段说明文
- 桥梁端头封堵施工方案
- 少儿美术绘本教案课件-3-6岁 《100层巴士》
- 钢筋原材质量证明书
- WH/T 42-2011演出场所安全技术要求第2部分:临时搭建演出场所舞台、看台安全技术要求
- GB/T 5023.5-2008额定电压450/750 V及以下聚氯乙烯绝缘电缆第5部分:软电缆(软线)
- GB/T 23445-2009聚合物水泥防水涂料
- 瓷贴面教学课件
- 尺骨冠突骨折课件
- 北师大版七年级下册第一章整式的乘除计算题专项训练
- 2022年苏州健雄职业技术学院单招考试面试试题及答案解析
- 乳腺癌改良根治术
- 新版(七步法案例)PFMEA
评论
0/150
提交评论