金融统计分析课件 第2讲 金融数据_第1页
金融统计分析课件 第2讲 金融数据_第2页
金融统计分析课件 第2讲 金融数据_第3页
金融统计分析课件 第2讲 金融数据_第4页
金融统计分析课件 第2讲 金融数据_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲金融数据2023/2/51主要内容一、金融数据生产、分类与公布系统二、金融数据挖掘原理与技术方法三、金融数据处理与统计分析基础四、实验报告要素2023/2/52一、金融数据生产、分类与公布系统(一)金融数据的生产

1.宏观金融经济数据的生产

一国的统计系统是生产宏观经济数据的主要部门,国民经济核算体系(SystemofNationalAccount,缩写为SNA)是国家宏观经济数据的生产体系。

国家统计局、中国人民银行、财政部等部门是我国宏观金融经济数据的生产编制机构。标准:IMF2000年公布了《货币和金融统计手册》,2001年公布了修订后的《政府财政统计手册》,2009年发布了修订后《国际收支和国际投资头寸统计手册》第六版(BPM6)2023/2/53一、金融数据生产、分类与公布系统(一)金融数据的生产2.微观金融经济数据的生产

机构单位、工商企业、金融企业、居民个人等的金融经济活动数据生产过程是分散化的,也基本没有统一的标准,没有专门的机构进行统计,无公开发布。(中国居民家庭金融资产数据)专业调查研究形成部分数据,而零散的研究难以形成数据体系。(民间金融规模数据,互联网金融数据)

微观金融经济数据对于宏观政策决策具有基础性参照价值,这些数据的规范依然是金融经济数据生产、公布体系需要努力的方向。*(家庭金融资产负债表)2023/2/54中国家庭资产负债2023/2/55一、金融数据生产、分类与公布系统(二)金融数据的分类1.从宏观金融与微观金融角度进行数据分类

宏观金融数据是从中央银行、金融监管机构的视角进行统计监测生成的数据,主要包括货币类数据、金融投资类数据、保险经营类数据等。(M2、M1、M0,信贷、存款、社会融资、汇率、利率、股指、国债、财政赤字、对外贸易、FDI)

微观金融数据是金融市场上单个经济主体的数据,如上市公司资产负债表,保险公司资产负债表等,投资项目的金融数据等。(公司股票持有结构、分红状况、项目盈亏分析、财务报告)2023/2/56微观数据2023/2/57一、金融数据生产、分类与公布系统(二)金融数据的分类2.从金融机构类别进行数据分类银行类金融机构数据,是针对银行性质的金融机构业务状况进行的统计数据。证券类机构的金融数据,是证券公司、投资银行的经营数据,包括经纪业务、自营业务、投资银行业务等数据。基金类机构的金融数据,是各类基金公司的业务运作数据,包括风险投资基金、产业基金、资本市场基金、货币市场基金、社会保障类基金等业务运作数据。保险类机构的金融数据,包括财产性保险公司、人寿类保险公司、再保险公司等商业性保险业务运作数据,如保险费收入、赔付,基金投资组合、资产管理状况等数据。期货类机构的金融数据,是期货交易所、期货经纪公司、非经纪类期货交易机构的有关期货交易业务的统计数据。2023/2/58(二)金融数据的分类3.从金融市场角度进行数据分类货币市场数据,包括货币市场交易工具的发行、二级交易规模、利率、交易投资者状况等。资本市场数据,包括市场的发行、交易规模、交易价格水平等。外汇市场数据,包括不同货币之间的兑换比价、外汇交易规模等数据。黄金市场数据,包括黄金交易数量、价格等数据。保险市场数据,包括保险产品类型及交易数额、保险费收入、保费赔付、保险机构业务运作情况等。衍生品市场数据,包括期货、期权、互换、远期利率协议,以及复杂衍生工具的交易、持仓、价格等数据。

2023/2/59一、金融数据生产、分类与公布系统生活中的数据2023/2/510(二)金融数据的分类4.从经济部门角度进行数据分类住户部门金融数据,包括储蓄存款、贷款,股票、基金与债券投资,购买保险,外汇与黄金交易等非金融企业部门金融数据,包括存款、贷款、发行股票与债券、购买商业保险等。政府部门金融数据,包括为财政赤字进行的融资发行的国债、借款,地方政府投资项目的融资,社会保障基金运作等。金融机构部门金融数据,包括资产类、负债类、发行和交易类、价格类数据。国外部门金融数据,包括外商直接投资、国内企业对外直接投资、外国证券投资、国内对外证券投资、与贸易投资有关的贷款、货币、存款资金的跨境转移等。2023/2/511一、金融数据生产、分类与公布系统(二)金融数据的分类5.从融资方式角度进行数据分类间接融资统计数据,主要是信贷规模数据,信贷形式和信贷结构直接融资统计数据,主要包括发行股票、债券、基金等直接融资工具的规模,以及金融工具市场交易数量、价格等2023/2/512一、金融数据生产、分类与公布系统(三)金融数据的公布系统1.数据公布标准:SDDS与GDDSSDDS是数据公布特殊标准(SpecialDataDisseminationStandard)的英文缩写,适用于已经参与国际金融市场的大多数工业化国家和一些新兴市场经济体,1996年3月公布。GDDS是数据公布通用系统(GeneralDataDisseminationSystem)的英文缩写,适用于尚未达到SDDS要求的国家,大部分为发展中经济体,1997年12月公布。

2023/2/513一、金融数据生产、分类与公布系统(三)金融数据的公布系统2.SDDS与GDDS的区别适用国家不同宏观部门划分不同:GDDS有社会人口部门发布数据差异:综合统计框架,跟踪性数据种类,与部门相关的统计指标,社会人口数据鼓励公布的指标“视相关程度”而定的指标数据公布的及时性与频率2023/2/514一、金融数据生产、分类与公布系统SDDS与GDDS的区别2023/2/515一、金融数据生产、分类与公布系统(三)金融数据的公布系统3.中国的数据公布系统我国于2002年4月15日正式加入了GDDS;2015年10月,央行宣布正式采纳SDDS标准公布相关统计数据国家统计局负责统计核算和公布国民经济实际部门的指标和数据财政部负责统计并公布财政部门的指标和数据中国人民银行、银监会、证监会、保监会等负责统计和公布金融部门的指标和数据国家外汇管理局、海关总署负责统计和公布国外部门的指标和数据2023/2/5导论16一、金融数据生产、分类与公布系统(一)金融数据挖掘的基本原理1.概念:金融数据挖掘(datamininginfinance)金融行为的选择者从大量的、不完全的、存在噪声的、模糊的、随机生成的金融数据中,搜索、发现、提取隐含在数据内部的、尚未被他人所知的、对决策具有潜在价值的信息或知识的过程。2023/2/517二、金融数据挖掘原理与技术方法二、金融数据挖掘原理与技术方法(一)金融数据挖掘的基本原理2.目标原理:发现存在于数据中的关键信息、模式和趋势

掌握金融领域的基本知识和金融行为决策的目标依据金融行为选择目标,选定要解决的问题和适合的金融数据集对原始数据进行预处理将数据集中的数据转换成适合挖掘的形式确定合适的数据挖掘方法数据挖掘过程分析解释数据应用2023/2/518(一)金融数据挖掘的基本原理2023/2/519金融数据挖掘原理图示二、金融数据挖掘原理与技术方法(二)金融数据挖掘的主要任务

关联分析:变量之间的数值存在的规律性

聚类:将数据库中的数据按照一定的规则,划分为一系列有意义的子集的过程

分类:找出一个类别的内涵或特征,能够代表该类数据的整体信息

估计:数据挖掘中确定一个未知输出属性的值

预测:利用历史数据发现未来输出结果的过程

异常检测:对数据中存在异常情况加以发现、甄别的过程,找出观察数据与参照标准之间的差异,更好地为模型预测分析服务

发现时序模式:在时间序列中找到重复发生概率比较高的模式,强调时间的影响2023/2/520二、金融数据挖掘原理与技术方法聚类与分类2023/2/521(三)金融数据挖掘的统计技术方法1.描述统计分析

集中趋势分析:平均数、中位数、众数

离中趋势分析:极差、标准差、方差、最大值、最小值、偏度、峰度、偏度系数、峰度系数

统计图形分析:直方图、茎叶图、箱线图等对观察数据进行直观描述

2023/2/522二、金融数据挖掘原理与技术方法二、金融数据挖掘原理与技术方法2.相关分析相关表相关图相关系数(±0-100)2023/2/52324(三)金融数据挖掘的统计技术方法3.差异分析从样本统计量的值得出差异,来确定总体参数之间是否存在差异是一种在实践中被广泛运用的统计方法。与回归分析方法关系密切,但并不完全相同。可视为线性回归的一种延续。如果某指标(因变量)其变化可能受到众多离散型因素的影响(如性别、职业等)而不是连续型因素(如年龄、收入、价格等)的影响,应考虑采用差异分析方法。案例1:在一、二、三、四线城市,或者在北京市各地段之间,房价存在巨大差异,如何分析其影响因素?案例2:金融生态环境2023/2/525二、金融数据挖掘原理与技术方法(三)金融数据挖掘的统计技术方法4.回归分析简单线性回归多元回归虚拟变量2023/2/526二、金融数据挖掘原理与技术方法274.回归分析(续)虚拟变量实际工作中我们经常需要研究某种事物状态变量的影响因素。如:通过财务信息预测公司是否破产通过驾驶纪录预测驾驶员是否会出事故通过购物和还款记录预测信用卡持卡人是否诚信……这类变量都具有如下特征变量值只有0和1两种状态,分别代表了事物的两种状态变量值没有任何数量意义案例:ST类股票是特殊处理(SpecialTreatment)的缩写,是我国股票市场一项特有的,旨在保护投资者利益的政策。如果上市公司的财务数据出现异常,则证监会将对其进行特殊处理,以便对投资者进行警示。

(一)最近两个会计年度的审计结果显示的净利润均为负值;

(二)最近一个会计年度的审计结果显示其股东权益低于注册资本,即每股净资产低于股票面值;

(三)注册会计师对最近一个会计年度的财务报告出具无法表示意见或否定意见的审计报告;

(四)最近一个会计年度经审计的股东权益扣除注册会计师、有关部门不予确认的部分,低于注册资本;

(五)最近一份经审计的财务报告对上年度利润进行调整,导致连续两个会计年度亏损;

28问题从投资人角度来看,财务报表分析能否帮助预测什么特点的公司容易被ST,从而避免投资损失?哪些公司更容易被ST?哪些财务指标与公司是否被ST相关?能够给出某个特定公司被ST可能性的定量化估计么?29(三)金融数据挖掘的统计技术方法5.聚类分析

Clusteranalysis通过分析事物的内在特点和规律,根据相似性原则对事物进行分组适用于没有先验知识的分类,如没有理论指引,没有国际标准、国内标准或行业标准2023/2/530二、金融数据挖掘原理与技术方法(三)金融数据挖掘的统计技术方法6.判别分析

在已知的分类下,遇到有新的样本时,利用已经选定的判别标准,判定如何将新样本放置于哪个族群中。它是一种预测导向型的统计方法,用以事后分析。

7.时间序列分析平稳随机序列的统计分析,在理论上的发展比较成熟,是时间序列分析的基础。谱分析也称频域分析,因为一个时间序列可看成各种周期扰动的叠加,频域分析就是确定各周期的振动能量的分配2023/2/531二、金融数据挖掘原理与技术方法三、金融数据处理与统计分析基础(一)金融基础数据的处理与显示1.统计整理依照研究目标,对收集或调查获得的数据进行科学的分类、汇总,使其达到系统化、规范化,进而可以从数据中得出所研究对象的必要信息、基本特征、规律和趋势等统计整理的结果一般是数据库表格,或者是统计表,在此基础上绘制统计图形。3233统计表是由纵横交叉的线条形成的表格,用以显不统计数据资料。统计表的经济内容包括总标题、横栏标题、纵栏标题、主词和宾词等。342.建立数据文件

3.绘制基本统计图形

条形图、线形图、面积图、饼图、高低点图、帕雷托图、控制图、盒形图、散点图、直方图等

35三、金融数据处理与统计分析基础(续)(二)金融数据的描述性统计分析1、集中趋势的测量算术平均数:分析社会经济现象一般水平和典型特征的基本指标。调和平均数:几何平均数:36众数:一组数据中出现次数最多的变量数值,一组数据可以有多个众数,也可以没有众数

中位数:将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。

截尾均值:去掉两端的极值后所计算的算术平均数372.离中趋势的测量全距,极差,是最大值与最小值之间的差距四分位差,总体数量标志值数列中各四分位数离差的平均数异众比率,也称离异比率或变差比,是指非众数组的频数占总频数的比率。38方差:各个数据与其算术平均数的离差平方和的平均数标准差:变异系数,反映的是标准差相对于均值的离散程度393.频率分布及特征的测量正态分布标准分值:标准分值Zi表示用标准差的单位数来衡量某一特定观测值与均值之间的距离40偏度系数:反映频率分布曲线高峰是偏左,居中还是偏右;偏度系数sk如果小于零,表示负偏(左偏);如果大于零,表示正偏(右偏);等于零,表示分布对称峰度系数:峰度系数ku如果小于零,表示频数分布曲线为平阔峰;如果大于零,表示频数分布曲线为尖峭峰;等于零,表示曲线为正态峰41(三)金融数据的均值比较分析、因子分析与主成分分析1、均值比较分析假设检验:是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是:先对总体的特征做出某种假设,然后通过通过抽样研究的统计推理,对此假设应该被拒绝还接受做出推断。三、金融数据处理与统计分析基础(续)42(卡方)检验:适用于拟合优度检验,检验实际观测值数目与期望观测值数目之间是否存在显著差异,在统计上是否显著。其中,Oi为观测值的实际频数;Ei为期望频数k为样本分类数单均值假设:432.因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计方法,目的是定义数据矩阵的基本结构。通过定义一套通用的基本维度(因子)来解决那些多变量之间相关性的结构分析问题。因子分析同时考虑一个变量与其他所有变量之间关系的相互依赖关系,在分析过程中不区分自变量和因变量。因子分析的步骤:确定主因子对因子定义解释和命名443.主成分分析,是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量45实验项目1(示例):广义货币供应量数据挖掘处理实验

一、实验类型设计型实验。本实验主要是设计对1978-1989年期间,中国M2数据的挖掘、处理与分析基本路径与程序。二、实验目的通过实验教学,掌握金融统计系统不完善导致的时间序列数据中缺失数据的挖掘、修补方法;掌握数据收集渠道。

46三、实验背景分析与检验经济货币化程度,需要M2的时间序列数据。现有的公开统计当中,中国人民银行公布的M2数据是从1990年开始的,1985-1989年的可以在《中国金融年鉴1990》中找到,但口径比较小;1978-1984年的M2数据需要挖掘修补。47四、实验环境数据处理软件工具:微软EXCEL工作表;数据基础:《中国金融年鉴1988》、《中国金融年鉴1990》电子版或纸质版。数据比较:国内其他研究文献中有关学者测算的数据。代表性的有:易纲著《中国的货币银行与金融市场1984-1993》(第59页),武剑著《货币政策与经济增长》(第206页)。48五、实验原理M2的统计构成原理。按照IMF的货币统计标准与我国的货币统计实践,M2的计算公式为:M2=M1+定期存款+储蓄存款+其他存款+证券公司的客户保证金其中,狭义货币M1的计算公式为:M1=流通中的现金(M0)+活期存款按照M2的计量原理及相应的基础数据进行测算。49六、实验步骤第一步:从《中国金融年鉴1990》找到1985-1989年货币概况数据。P125/1154:“1985-1989年货币概况”表第二步,从《中国金融年鉴1988》找到1978-1984年国家银行与农村信用社存款与流通中货币数据。P109/986:“1978—1987年国家银行、农村信用合作社资金平衡表(年末余额)”表。第三步,建立1978-1989年中国M2数据挖掘EXCEL文件。将1978-1984年流通中的现金与各项存款数据,1985-1989年货币数据导入该文件。50第四步,将挖掘出的中国1978-1989年M2,直接使用现金加存款得出的数据与其他学者的测算的数据进行比较。主要与易纲(2003)、武剑(2000)文献中同期M2数据进行对比。第五步,分析数据差异,提出调整建议。通过对比挖掘数据结果与其他学者使用的数据发现,数据之间还是存在明显的差异。挖掘得出的各年M2数据明显大于这两位学者使用的数据,挖掘数据与直接按照现金加存款方法测算的数据也略有差异,应该是在银行存款相应的轧差方面处理方法问题。511978-1984年两位学者的M2数据是一致的,但1985-1989年武剑使用的数据大于易纲的数据。问题主要是口径不一致。从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论