版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆邮电大学毕业设计论文编号:审定成绩:重庆邮电大学毕业设计(论文)设计(论文)题目:基于聚类分析方法分析我国商业银行的盈利能力学院名称:理学院学生姓名:张浩鹏专业:数学与应用数学班级:1131301学号:2013212970指导教师:李辉答辩组负责人:填表时间:年月重庆邮电大学教务处制基于聚类分析方法分析我国商业银行的盈利能力摘要在改革开放的30多年里,中国经济在几十年之间连续取得了快速增长,获得了全世界的赞谈,而在此期间,中国银行业历经几次改革,截至目前,中国商业银行总体可分为三大类:四大国有商业银行,全国或多个省市股份制商业银行,地方城市商业银行。而评价一个银行的关键因素之一就是该银行的盈利能力。怎样来分析评价我国不同商业银行的盈利能力?影响商业银行盈利能力的指标有哪些、分别都有什么程度的影响?这些都是需要我们进行研究的。本文采用了工商银行、建设银行等20家中国商业银行在2015年的13个数据指标,以20家商业银行进行聚类分析,将其分为了7类,并再次通过数据对这7类银行的盈利能力进行级别划分。然后又对13个指标进行聚类分析,将其分为了4类,分析这些不同类别的指标造成了什么样的影响。本文在软件使用方面,没有使用单一的数据分析软件,而是采用MATLAB与SPSS软件的结合。在聚类分析中,样品之间的距离采用欧氏距离,用MATLAB确定最佳类间距离,然后再使用SPSS软件使用最佳类间距离进行分类处理。在对不同的银行样本进行聚类分析后,得出了最佳分类数为7,因此将这20家商业银行按照不同的盈利能力分为了7类,其中工商银行的盈利能力最高。并且发现,现阶段我国盈利能力最高的几家银行都属于大型国有银行。其次是国内各大城市的商业银行,这些银行在成本方面具有良好的控制能力。而全国性的股份制商业银行因为在全国铺设站点的缘故,成本大规模增加,但在非利息收入等方面不如大型国有银行,因此盈利能力并不理想。在对13个选取的的指标进行聚类分析后,将这13个指标分为了4类,并将其按照对银行盈利能力的影响程度进行了排序。在论文结尾,本文结合数据分析得出的结果提出了一些意见和建议,希望有所帮助。关键词:聚类分析;谱系聚类:商业银行;盈利能力;MATLAB软件;SPSS软件;AbstractInthereformandopeningupmorethan30years,theChineseeconomyinseveraldecadesbetweentherapidgrowthachieved,wontheworld'spraise,andduringthisperiod,China'sbankingindustryafterseveralreforms,ChinahasalsoformedavarietyofcategoriesOfthebanks,andnowChina'scommercialbankscanbedividedintothreecategories:oneisalargestate-ownedcommercialbanks;oneisanationaljoint-stockcommercialbanks,thereisaclassoflocalcommercialbanks.Oneofthekeyfactorsinevaluatingabankisthebank'sprofitability.HowtoanalyzeandevaluatetheprofitabilityofdifferentcommercialbanksinChina?Whataretheeffectsoftheindicatorsthataffecttheprofitabilityofcommercialbanks?Thesearewhatweneedtostudy.Inthispaper,20industrialandcommercialbanks,IndustrialBank,ChinaMerchantsBank,ShanghaiPudongDevelopmentBank,MinshengBank,CITICBank,BankofBeijing,NanjingBank,GuangdongDevelopmentBank,BankofCommunications,ConstructionBank,AgriculturalBankofChinaIndexdata,inordertoclusterthe20commercialbankstobeclassifiedintosevencategories,andonceagainthroughthedataontheseventypesofbanksprofitabilityleveldivision.Andthenclusteranalysisof13indicators,analysisofdifferentindicatorsonthebank'sprofitabilitycausedbythedifferenteffects.Inthispaper,theuseofsoftware,didnotuseasingledataanalysissoftware,buttheuseofMATLABandSPSSsoftwarecombination.Intheclusteranalysis,thedistancebetweenthesampleswasEuclideandistance,thebestinterclassdistancewasdeterminedbyMATLAB,andthenSPSSsoftwarewasusedtoclassifythebestinterclassdistance.Aftertheclusteringanalysisofdifferentbanksamples,thebestclassificationnumberis7,sothe20commercialbanksaredividedinto7categoriesaccordingtodifferentprofitability,amongwhichtheprofitabilityofICBCisthehighest.AndfoundthatChina'scurrentprofitabilityofthehighestnumberofbanksarelargestate-ownedbanks.Followedbylocalcitycommercialbanks,urbancommercialbanksintermsofcostisbetterthanthenationaljoint-stockbanks.Thenationaljoint-stockcommercialbanksbecauseofthelayingofthesiteinthecountry'ssake,thecostoflarge-scaleincrease,butinnon-interestincome,etc.aslargestate-ownedbanks,soprofitabilityisnotideal.Afterclusteringthe13selectedindicators,the13indicatorswereclassifiedintofourcategoriesandsortedaccordingtothedegreeofimpactonthebank'sprofitability.Finally,thispaper,combinedwiththeresultsofdataanalysisonhowtoincreasetheprofitabilityofChina'scommercialbanksmadesomecomments.Keywords:clusteringanalysis;pedigreeclustering:commercialbanks;profitability;MATLABsoftware;SPSSsoftware;目录摘要Abstract绪论1.1课题研究背景与现状1.1.1课题研究背景1.1.2课题研究现状1.1.3本文研究的主要内容和方法第二章简析聚类分析方法2.1聚类分析方法简析2.2聚类分析的基本方法2.1.1谱系聚类2.1.2K均值聚类第三章谱系聚类法3.1相似性度量3.1.1向量的距离3.1.2类的定义和特征3.1.3类间距离3.1.4类间距离递推公式3.2MATLAB数据分析方法3.2.1MATLAB的简介3.2.2MATLAB的特点3.2.3谱系聚类的实现3.3谱系聚类的有效性第四章聚类分析的实现4.1原始数据来源4.2聚类分析的步骤4.2.1原始数据预处理4.2.3.求取向量之间的距离4.2.4求指标之间的相关系数4.2.5求取类间距离4.2.6有效性分析4.2.7利用SPSS进行分析4.2.8SPSS分析得到的冰柱图4.2.9SPSS分析得到的最短距离聚类图4.3聚类结果分析第五章对指标的聚类分析第六章总结与展望6.1本文主要结论6.2提高我国商业银行盈利能力的建议6.3论文不足之处参考文献附录原始数据MATLAB程序致谢
绪论1.1课题研究背景与现状1.1.1课题研究背景改革放开至今,中国经济经过连续数十年的高速、蓬勃的发展。但是随之而来的企业资金缺口也在增大。并且中小企业的增多导致融资需求是非常大的。但原国有大型银行由于体制等原因,不能满足国内中小企业的融资需求。中国的经济发展将受到不利影响。为此中国的金融业体制的不断深化改革。随着改革的深入,我国的银行业也在走向全面开放,与此同时,国际性大银行也进入中国市场不断地开展业务。然而我国的银行业在国内长期处于保护状态,竞争压力不大。因此部分银行在盈利能力、公司制度等方面全面落后于国际性商业银行。外资银行凭借着多年来的管理经验、竞争意识、创新意识与本土银行展开激烈竞争。在面对外资商业银行时,我国的上市商业银行不能故步自封,应该主动向外资银行虚心学习,以先进的经营机制和管理机制约束自己、找到属于自己的盈利方式、增强自身的创新意识,从而提高自身的盈利能力。1.1.2课题研究现状对于本课题研究的问题的问题,前人已经做了很多研究,何晓群在《多元统计分析》一书中详细介绍了聚类分析的各种方法。还有就是SPSS软件的应用。徐函在2009年发表的论文中对此也进行了探讨,认为国内商业银行的在扩大规模方面受到限制、获取利润的方法单一。并且少数银行的普及率不够高,因而盈利能力受到限制。张杰在2015年发表的论文里将我国商业银行分为两类进行研究,得出结论,大型商业银行的盈利能力要更高,领先于其他银行。而上市股份制商业银行的得益于政策的开放,在不断地提高实力中。本文只考虑影响商业银行盈利能力的内部因素(例如总资产、存款、总支出、成本等因素),而对于外部因素(例如国内经济情况、政策等方面)不做考虑。1.1.3本文研究的主要内容和方法多元统计分析是从统计学中发展出来的一个重要的分支学科,在面对自然科学、社会、经济领域的问题时,多元统计分析表现出了极强实用能力,因而被大规模采用。本文找寻了我国的20家商业银行的数据,采纳了2015年的数据。采用聚类分析方法,选取营业外支出、利息收入、总资产等13个代表性数据。这些数据能够反应银行的收入途径的获得利润的能力,从而对多家商业银行进行分类,然后根据分类结果进行评价。还有就是对13个指标也进行聚类分析。本文采取的方法是聚类分析法中的谱系聚类法。关于该方法的思想和方法,见下文。第二章简析聚类分析方法2.1聚类分析方法简析研究对象的分类是人们使用的最重要的研究方法之一。聚类分析是研究样本或指标分类问题的一种多元统计方法。聚类分析方法认为研究样本具有不同程度的相似性。根据一批样本的观测指标,可以对样本或指标之间的相似度进行统计,定义指标间的相似系数。样本距离表示样本之间的相似性,指标之间的相似性指标之间的相似性的特征。在此基础上,将一些相似样本划分为一类,并将其它相似样本分成一类。要关闭关系到一个小的分类单元,将聚合的关系分解为一个大的分类单元,知道所有的样本都会完成,不同类型的一一对应,形成一个小到大的分类系统。2.2聚类分析的基本方法2.2.1谱系聚类法谱系聚类法是目前引用较为广泛的一种聚类法。谱系聚类法也叫作系统聚类法。谱系聚类是根据生物分类学的思想对研究对象进行分类的方法,分类单位越小,所包含的生物就越少,生物之间的共同特征就越多。利用这种思想,谱系聚类首先将每个样品看成一类,然后把最相似(距离最近或相似系数最大)的样品聚为小类,再讲已经聚合的小类按各类之间的相似性(用类间距离度量)进行再聚合,随着相似性的减弱,最后再将一切子类都聚为一个大类,从而得到一个按相似性大小聚结其起来的谱系图。2.2.2K均值聚类以上介绍了谱系聚类法,但是谱系聚类法有着自己的缺,K均值聚类法就是为了克服这个缺点被而进行了改变。谱系聚类的缺点是是一旦某一个样品被分到某一类中后就再也不能进行更改,且计算比较麻烦,当问题的样本容量变大时,计算量也会变大。克服此缺点的一个方法就是K均值聚类法。在运用K均值聚类法之前,要根据实际问题先确定分类数k,在每一类中选择有代表性的样品,这样的样品称为聚点。选择聚点的方法通常有最大最小原则。若将N个样品分成k类,先选择所有样品中距离最远的两个样品为聚点使得然后选择第三个聚点,使得它与前两个聚点的距离最小者等于所有其余的与的较小距离中最大的,即最后按相同原则选取,重复前面的步骤,直到确定k个聚点。第三章谱系聚类法3.1相似性度量3.1.1向量的距离设有个样品的元观测数据这时,每个样品可看成元空间的一个点吗,即一个维向量,两个向量之间的距离记为,满足如下条件:(1)非负性:任意两个向量之间的距离非负,即,且当且仅当(2)对称性:(3)三角不等式:在聚类分析中最常用的是欧氏距离。欧氏距离绝对距离闵式距离其中m,m>0为常数。切氏距离切比雪夫距离(Chebyshevdistance)简称切氏距离,定义如下:方差加权距离其中马氏距离以上几种距离是适用于间隔尺度的变量,在平时的聚类分析中,人们通常还是喜欢用用欧氏距离。在聚类分析中,人们不但将样品分类,还会将指标进行分类,在指标也可以定义距离,但更常用的是相似系数,用来表示指标i和指标j之间的相似系数。相似系数越接近1,表示关系越密切。越是接近0,关系越疏远。常用的相似系数有:夹角余弦相关系数;这是大家最熟悉的统计量,它是将数据标准化后的夹角余弦,记为,定义是:除了相似系数,指标之间旺旺有的时候也可以用距离来描述两个指标之间的接近程度。并且实际上距离和相似系数之间是可以互相转换。若是一个距离,则是相似系数。3.1.2类间距离(1)类的定义我们的问题是聚类,那么什么是类?在不同问题中千差万别,下面给出类的几个定义,不同定义适用于不同场合。定义一:设为一给定的阈值,如果对于任意的,有,(为之间的距离),则称为一个类。定义二:对阈值,如果对每个,有则称为一个类。定义三:对阈值,如果,对一切,则称为一个类。可见定义一对类的要求是最高的,凡是符合它的类,一定是后两种的类。此外,符合定义二的类一定符合定义三。类的特征可将类的元素用表示,m为的样品数(或指标数),常用的类之间的特征有以下三种:均值(或称为的重心)样本离差阵及协方差阵类的直径。它有多种定义,例如:3.1.3类间距离的递推公式在聚类分析中,不仅要考虑各个类的特征,还要考虑类间距离。设表示两个样品之间的距离,分别表示两个类别,各自含有个样品。最短距离即两类样品中两两样品之间的距离最短的那一个距离。(2)最长距离(3)类平均距离即用两个类别中所有两两样品之间的距离的平均值。(4)重心距离其中分别是的重心。(5)离差平方和距离显然,离差平方和距离与重心距离的平方成正比。3.1.4类间距离的递推公式设有两类合并成新的一类,包含了个样品,如何计算与其他类别之间的距离?(1)最短距离(2)最长距离(3)类平均距离显然,之间的类平均距离是之间的类平均距离以及之间的类平均距离的加权平均。重心距离(5)离差平方和距离3.2MATLAB数据分析方法3.2.1MATLAB简介MATLAB]是由美国Mathwork公司推出的一个科技应用软件。它是一种广泛应用于工程计算和数据分析领域的新型高级语言,可以把科学计算、结果可视化和编程都集中在一个使用方便的环境中。在国际学术界,MATLAB已经被认为是准确、可靠的科学计算标准软件。3.2.2MATLAB的特点该软件提供以下功能:数值计算功能、符号运算功能、绘图功能、编程功能、并提供丰富的工具箱。是一个交互式软件系统。3.2.3谱系聚类的步骤1.n个样品作为n类,计算两两之间的距离或相似系数,得到实对称矩阵。2.从的非主对角线上寻找最小距离或最大元素(相似系数),设该元素为,则将合并成一个新的类,在中去掉所在的两行、两列,并加上新的类与其余各类之间的距离或相似系数,得到阶矩阵。3.从出发重复第二步的做法得到,在由出发重复以上步骤,知道全部样品聚为一个大类为止。4.在合并过程中要记下合并样品的编号以及两类合并时候的水平,并绘制谱系聚类图。3.3谱系聚类的有效性谱系聚类试讲所有样品聚为一个大类,我们得到的只是一个树状结构图,那么问题来了,怎样确定样品的最佳聚类的个数呢?在研究这个问题之前,我们先讨论样品之间和两个总体(类)之间究竟采用何种距离尾号。假设样品之间的距离已定,例如选取欧氏距离。对于类间的5种不同距离,我们计算cophenet相关系数。聚类数的cophene距离与生成该聚类数的原始距离之间的线性相关系数定义为聚类数的cophene相关。该系数越接近1,聚类效果越好。在MATLAB中计算cophene相关系数的命令为:其中,z是用某种类间距离linkage后的结果,d是样品之间的某种距离。以上是考虑了样品之间距离与类间距离如何搭配可以是聚类效果最好,但究竟分为几类合适,到目前为止还没有从理论上完全解决这一问题,通常的准则有:统计量假设已经将n个样品分为k类,记为:表示类的样品个数;表示的重心,即,则类中的个样品的离差平方和为所有样品的总离差平方和为:令,则值越大,也就是越大,表示k个类的类间偏差平方和的总和所占比例越大,说明k个类能够分开。越大,聚合效果越好。第四章聚类分析的实现4.1原始数据来源本文要实现用聚类分析方法对我国20家商业银行得2015年盈利数据进行分析(见附表)。表12015年度商业银行盈利数据课程编号课程名称课程编号课程名称M利息支出M非利息净收入M手续费及佣金支出M营业外收入M营业支出M总存款M营业外支出M净贷款M固定资产净值M不良贷款M其它资产M总资产M利息净收入4.2聚类分析的步骤在进行聚类分析时,由于不知道采用哪一种类间距,所以本文先采用MATLAB软件确定类间距的选择,然后采用SPSS软件进行更加具体的过程分析和结果处理。(1)为减少大数据对结果造成的而影响,首先对数据进行预处理标准化,MATLAB中的调用格式为;Z=zscore(x),x为原始观测矩阵,行位个体,列为指标。输出Z为x的标准化矩阵。(2)求取样品之间的距离(本文使用的是欧氏距离,其余的距离不做分析)和距离矩阵。(3)求指标之间的相关系数和夹角余弦。(4)求类间的各种距离(最短、最长、类平均、加权平均、重心、离差平方和)。(5)对聚类的有效性进行分析,求cophenet相关系数,看哪一种距离的聚类效果最好。(6)作图,采用SPSS作出聚类分析后的树状图。(7)对结果进行分析。4.2.1原始数据预处理由于20家商业银行的数据有较大差异,故需要对数据进行预处理,将数据标准化:令,,分别表示第j个指标的样本均值,样本极差,样本标准差,即、标准化后的数据为(详见附表):在MATLAB中,这一步骤不许大量运算,秩序输入命令Z=zscore(x)即可,其中x是原始数据的矩阵4.2.3.求取向量之间的距离本文在前面介绍了多种向量之间的距离,但在日常运用中,人们通常采取的是欧氏距离,因此本文也将采用欧氏距离,对于其他的距离不做分析。而在MATLAB中,要实现对其的欧氏距离计算,在命令窗口中输入命令Y=pdist(Z),Z为原始数据标准化后的矩阵。4.2.4求指标之间的相关系数M1M2M3M4M5M6M7M8M9M10M11M12M13M11.00000.90350.98440.55450.96440.99240.98240.96500.92860.98210.98500.95650.9923M20.90351.00000.90620.39710.90070.91990.90880.95000.86370.92010.92090.86450.9199M30.98440.90621.00000.61820.95950.99170.99410.96240.96430.98990.98650.98010.9916M40.55450.39710.61821.00000.56320.58350.62070.41010.72930.60990.54990.74260.5834M50.96440.90070.95950.56321.00000.97820.96000.95420.91020.97910.98270.95320.9787M60.99240.91990.99170.58350.97821.00000.99360.96910.95160.99710.99630.97451.0000M70.98240.90880.99410.62070.96000.99361.00000.95390.97480.99510.98980.98280.9935M80.96500.95000.96240.41010.95420.96910.95391.00000.88130.96190.97510.90730.9692M90.92860.86370.96430.72930.91020.95160.97480.88131.00000.96350.94260.98090.9514M100.98210.92010.98990.60990.97910.99710.99510.96190.96351.00000.99620.98260.9971M110.98500.92090.98650.54990.98270.99630.98980.97510.94260.99621.00000.96670.9964M120.95650.86450.98010.74260.95320.97450.98280.90730.98090.98260.96671.00000.9745M130.99230.91990.99160.58340.97871.00000.99350.96920.95140.99710.99640.97451.0000表2各指标之间的相关系数矩阵由表格可以看出13个指标之间的相关系数,数据越是接近1,表示两者密切相关,越是接近0,表示两者相关程度不大。通过这个表格可以看出,利息支出与总资产、总存款、其他资产、利息净收入密切相关。而手续费以及佣金支出除了与营业外支出相关程度较低外,与其他各项指标的相关程度都比较大。营业外支出该项指标与其他指标的关联程度都是比较小的。通过此表格,我们可以直观的分析出13项指标之间的相互关联程度,对此有必要的话我们可以使用聚类分析的方法对指标进行聚类分析,将指标分成不同的类别,分析不同的指标对银行的盈利能力造成的影响。4.2.5求取类间距离图1:六种距离的类间距离其中,z1:最短距离;z2:最长距离;z3:类平均距离;z4:加权平均距离:z5:重心距离;z6:离差平方和距离。4.2.6有效性分析我们在上面求取了6种距离,那么哪一种距离才能达到更好的聚类效果呢?为此,我们需要对不同距离的有效性进行分析,因此需要求取cophenet系数来对不同的距离进行分析。在MATLAB中,实现此命令的语句是R=cophenet(z,d)。其中,z是类间距离后得到的结果,d是样品之间的某种距离。输出结果如下图2图2cophenet系数最大值为0.9586,所以采用最短距离距离效果最好。4.2.7利用SPSS进行分析表3:凝聚顺序表阶段结合的聚集系数阶段聚集第一个出现下一個暂置聚集1聚集2聚集1聚集211920.07900221719.08001331417.092024414162994066714.3100577715.38360981012.3980010979.412701110610.427081311713.433901412811.63700131368.6971012141467.85313111515561.1450141916341.981001717132.8880161818123.7311701919154.61318150:图三:聚合系数随着分类数变化曲线用EXCEL软件绘图,得到聚合系数随着分类数变化的曲线。需要注意的是某阶段的分类数等于样品数减去阶段数。例如,第一步的分类数为20-1=19.。由该图进行分析,可以看出当分类数为6或者7的时候,曲线开始变得平缓。所以我们可以选择分为7类,这比较符合我们的目的。所以在SPSS中选择分类数为7再次进行聚类分析,得到如下表的结果:各类别成员观察值分类数7工商银行1农业银行2中国银行3建设银行4交通银行5兴业银行6华夏银行7招商银行6平安银行7浦发银行6民生银行6中信银行6光大银行7浙商银行7广发银行7恒丰银行7渤海银行7北京银行7南京银行7宁波银行7表4:分类数为7的分类结果4.2.8SPSS分析得到的冰柱图图4最短距离垂直冰柱图由图可以,看到上方是各家银行的代号,每家银行有两条灰色冰柱(左侧和右侧)。图标的左边的纵轴代表的是分类的数目,按照设定的分类数目,在那一行可以从左到右找到各类所含的样品。例如我们选择了分类数为5,则在分类数为5划伤一条横线,观察哪一家银行右边的灰色冰柱小于5,可以看到是代号为5的银行右边冰柱小于5,而在它之前的所有银行右侧的冰柱都大于5,则把代号为5的银行与前面所有银行都分为1类。如此下去,知道5类找完为止。4.2.9SPSS分析得到的最短距离聚类图图5:最短距离聚类图4.3聚类结果分析根据以上图表,我们最终选择的聚类数是7个,对结果进行分析,可以得出分类结果,即第一类别1个:工商银行。第二类别1个:农业银行。第三类别1个:中国银行。第四类别1个:建设银行。第五类别1个:交通银行。第六类别5个:兴业银行、招商银行、浦发银行、民生银行、中信银行。其余的为第七类别。第7类别的商业银行,例如北京银行、南京银行、广发银行,大都是我国的城市商业银行,业务范围打都在省内或直辖市内,很少扩展至其他地域,规模也并不大,仅有广大银行的机构数超过了1000(1048),其他银行的机构数都在1000以下,但是在平均总资产收益率上表现较为抢眼,专注于控制成本,因而部分银行:例如招商银行、平安银行具有较强的盈利能力。由下表可以看出,像华夏银行、平安银行的系数比就相对较低。表520家银行总支出除以总收入总支出/总收入工商银行1.0270农业银行1.1234中国银行1.1330建设银行1.0364交通银行1.4017兴业银行1.4796华夏银行1.3566招商银行1.1348平安银行1.0931浦发银行1.3381民生银行1.3369中信银行1.3997光大银行1.4020浙商银行1.6986广发银行1.8346恒丰银行1.9729渤海银行1.9804北京银行1.5140南京银行1.4680宁波银行1.4402其次是第6类别的银行,例如兴业银行、招商银行、浦发银行、民生银行、中信银行。这些银行已经是地域性的商业银行,属于上市股份制商业银行,业务已经扩展至多个省,设立的机构数在1000-3000左右,盈利能力在非利息净收入上相对上一类别的大部分银行都有了提高,但是由于经营地域的扩大,成本也在增加,在非利息业务方面强于城市银行,却不如大型国有银行,因此除招商银行外,其余银行的盈利能力反而有有一定的降低。接着是第五类别的银行:交通银行。已经是全国股份制商业的银行,在国内的盈利能力相对上一个个类别已经有了大幅度的提高,但是由于扩展中需要大量站点,增加了成本。第4类别的建设银行,属于国有商业银行,从规模上来讲已经远远超过了强两个类别,由于早早得建立了全国性的站点,为增加非利息收入节约了成本,因而盈利能力要强于交通银行。中国银行在总存款和总资产上弱于建设银行、工商银行和农业银行,因此,即使在成本控制的条件下,盈利能力地域建设银行。第1类别的工商银行是我国商业银行盈利能力最高的银行。工商银行已经是属于全球性的银行,在国外许多城市都有自己的办事机构,并且在总资产、总收入、总存款、总支出与总收入的比例等方面遥遥领先。排在第二类别的农业银行在总资产、存款、利息净收入等方面都不如工商银行,但相比其他银行还是有叫我显著的提升。第五章对指标的聚类分析我们除了对不同的银行进行聚类分析,还可以对影响对我国商业银行盈利能力的指标进行聚类分析,分析不同指标会对我国对商业银行的盈利能力造成的不同影响,排除或者改进所用的的数据,使聚类结果更加可靠。首先还是对数据进行MATLAB分析,确定最佳类间距离。此时用到的数据需要对来源是数据进行转置,将指标变为行向量。然后按照第四章的步骤对其进行分析。得到结果R1=0.90290.91010.91030.91030.91030.9046由于最大值为0.9103,分别有三个距离合适。这里选取类平均距离图6:指标聚合系数曲线图各类别成员分类数4利息支出1手续费及佣金支出1营业支出1营业外支出1固定资产净值1其它资产2利息净收入1非利息净收入1营业外收入1总存款3净贷款4不良贷款1总资产2表5:指标分类结果图图7:指标分类冰柱图第一类:利息支出、手续费及佣金支出、营业支出、营业外支出、固定资产净值、利息净收入、非利息净收入、营业外收入、不良贷款。这些指标都对银行的盈利能力有着直接并且较大的影响。第二类:总资产和其他资产。这涉及到一家银行的规模,因而对银行盈利能力有较大影响。第三类:总存款。这涉及到银行的放贷能力,对银行的盈利能力有一定的影响。但放贷有一定风险,不是说存款越多、放贷越多就越能盈利,所以对银行盈利能力影响不是很大。第四类:净贷款。由于净贷款还经常和不良贷款牵扯在一起,贷款多不一定盈利多,需要和不良贷款放在一起判断才能进一步分析我国商业银行的盈利能力,所以影响最小。对指标的聚类分析可以让我们更好的了解不同指标对样本造成的影响,更直观的进行分析,可以排除掉一些完全无用的数据,进而提高分析结果的可靠性。第六章总结与展望6.1本文主要结论在借鉴了众多学者研究成果后,本文采用原始数据预处理、MATLAB数据处理确定最佳距离、SPSS进一步具体分析最佳聚类数、最后对指标进行聚类分析。详细的对我国20家商业银行的盈利能力进行聚类分析,研究不同的指标对银行盈利能力的影响。主要内容如下:(1)对原始数据进行预处理,消除大数据造成的影响。(2)研究了聚类分析的基本理论,对聚类分析中的谱系聚类方法以及谱系聚类的的有效性进行了进一步探讨;(3)研究聚类在银行盈利能力问题中的应用,利用MATLAB和SPSS统计软件,以20家商业银行的13个指标进行实例论证,探究聚类分析的分类方法;基于以上的聚类分析,并把分类结果同原始数据进行对比,我们可以得出以下结论:我国目前盈利能力最强的几家商业银行仍然是大型国有银行,上市股份制银行其次。银行的盈利能力是利息净收入、非利息净收入、营业外收入以及各种支出多重因素作用的结果。盈利能力强的银行营业外收入普遍较高。地方城市商业银行的总体盈利能力不如大型国有银行,但是却在平均总资产收益率上与大型国有银行持平甚至略有超出。因为城市商业银行具有低于大型国有银行和上市股份银行的成本。城市商业银行的盈利更多来自于利息业务,专注于控制成本,因而也具有较强的盈利能力。老牌大型国有银行因为早早的建立了遍布全国的站点系统,为扩展非利息收入节约了成本,因此使得国有商业银行拥有了较高的总资产收益率。6.2提高我国商业银行盈利能力的建议仔细对着20家商业银行进行研究,我们可以发现,盈利能力比较强的是工商银行、农业银行等大型国有银行,大型国有银行拥有政策以及强大的资金支持,目前让然是是我国银行业的霸主,而上市股份制银行的盈利能力居中,虽然不如大型国有银行,但是却强于广发银行、南京银行等地方银行。银行要想增强自身的盈利能力,可以从减少利息支出、手续费及佣金支出、营业支出、营业外支出、不良贷款。增加固定资产净值、利息净收入、非利息净收入、营业外收入。因此可以对银行提出以下意见:大力开展网络银行,减少对机构数的依赖。随着网络的发展和普及,开展网络银行可以极大的提升银行的办事效率,并显著减少营业支出。据英国艾伦米尔国际管理顾问公司调查,网络银行的经营成本只占到经营收入的15%到20%,而传统银行则占到60%。金融的网络、电子化为银行提供了巨大的助力,并显著降低了经营成。提高贷款质量。放贷员工应当严格把关,减少不良贷款所占的比例,不良贷款一旦增多,就会迅速拖垮银行的资金流,并且对放贷的利息收入造成影响。改进公司制度。现代化的商业银行一定需要现代化的企业管理制度,企业结构要合理,并增强公司员工的创新意识。6.3论文改进由于时间、知识能力、实践经验等方面的欠缺,论文还有许多不足的地方,今后还可以在以下几个方面做进一步完善和深入研究:(1)本文只是研究了欧氏距离,在向量距离中还有许多其他的距离方法,例如闵式距离、切比雪夫距离、方差加权距离等,可以进一步运用这些距离方法,来研究在该问题中的最佳距离搭配,得到更加科学准确的方法;(2)数据收集可能不够完善,仅有20家银行一年的13个指标,数据量不够大,可能导致结果的不准确;(3)所用的方法也应该进行扩展,采用聚类分析中的其他方法,如模糊聚类、K均值聚类;(4)采用的方法也比较单一,仅仅使用聚类分析这一种方法并不好,应当与其他的多元统计分析方法一起采用,例如:主成分分析、判别分析。联合采用可以得出更好的结论。实际上在现代的统计分析中,不同的方法有不同的优势和劣势,应当采用多种方法结合,单靠一种方法很难得出科学结论。参考文献[1].何晓群多元统计分析【M】北京:中国人民大学出版社,2004[2].李俏.中国上市银行盈利分析【D】北京:中国社会科学院,2012[3].徐函.我国上市商业银行盈利能力的聚类分析\o"《中国证券期货》"《中国证券期货》,
2009(10):30-31[4].RichardAJohnson,Dean,WWichern..应用多元统计分析【M】北京:中国统计出版社,2002[5].李柏年,吴礼斌MATLAB数据分析方法【M】机械工业出版社,2012[6].张进芳.中国商业银行盈利能力测度及影响因素研究[D]成都:西南财经大学,2012[7].龚勋.中国商业银行盈利能力效率的实证研究[D]武汉:华中师范大学,2013[8].严祥瑞.我国商业银行盈利能力研[D]究上海:华东师范大学,2011[9].程婧.中国商业银行盈利能力影响因素研究[D]上海:上海外国语大学,2011[10].唐有瑜.我国上市商业银行财务状况的行业特征[J]证券市场导报,2002,9月号:15-20[11].李安娜.中国商业银行盈利能力影响因素的实证分析——基于中国上市商业银行的面板数据的研究[J]经济研究导刊,2013,20期:184-185[13]张杰.我国商业银行盈利能力比较分析【D】西南财经大学2014附录致谢
附录一.原始数据利息支出手续费及佣金支出营业支出营业外支出固定资产净值其它资产利息净收入非利息净收入营业外收入总存款净贷款不良贷款总资产工商银行36391218279338112692195401220143795078671897804392162819391175394817951822209780农业银行2896537945303297669315617817635215436140100028467913538360869705121286717791393中国银行286406849524394573018203116633566328650145671192511729171900496313089716815597建设银行31280778743091071518159531181899584577521474453925136685331031916016598018349489交通银行160954320410811643078342707702014417249
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- QC/T 1206.1-2024电动汽车动力蓄电池热管理系统第1部分:通用要求
- 2024年血液净化信息系统项目资金申请报告代可行性研究报告
- 公路护栏施工合同
- 《项目组管理方案》课件
- 2015年中考思品热点总复习(终极预测)
- 余弦定理课件
- 【培训课件】防雷装置设计技术评价讲座
- 16.2《登泰山记》课件 2024-2025学年统编版高中语文必修上册-8
- 2025届内蒙古包头市高考考前提分语文仿真卷含解析
- 2025届辽宁省重点协作校高三一诊考试数学试卷含解析
- 机械专业职业生涯规划
- 护士法律法规培训通用课件
- 幼儿园大班建构式课程
- 终端设备量子通信与后量子密码技术
- 新北师大版小学数学二年级上册《六-测量:课桌有多长》-公开课教案-1
- 云南中烟公司招聘考试题目
- 论社会系统研究方法及其运用读马克思主义与社会科学方法论有感
- 环境监测投标书
- 支气管镜术后护理常规
- 儿科护理培训:儿童流行性感冒护理
- 解答-统计学导论-曾五一课后习题答案
评论
0/150
提交评论