




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。金融数据描述性分析与可视化Python金融数据分析与应用(微课版)第四章公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。目录CONTENTS统计量和描述性分析4.1双变量的描述性分析4.2金融技术分析工具4.3公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.1统计量和描述性分析4.1统计量和描述性分析4.1.1定性变量的描述性分析(1)频数分布
频数是指特定数值在数据集中出现的次数,而频率是指该数值在数据集中出现的次数占数据集总样本量的比例。众数是数据集中出现次数最多的数值。频数分布表将数据集中的每个不同数值及其频数以表格形式列出。表4-1 行业分类频数分布表行业分类频数频率汽车119.2%房地产2319.2%银行4638.3%交通运输4033.3%公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.1统计量和描述性分析(2)定性变量的描述性分析Python应用举例【案例4-1】金融贷款审批金融贷款审批是金融机构在向客户提供贷款之前,对客户的信用状况、还款能力等方面进行评估的过程,这一过程对金融机构的风险管理和资产质量控制至关重要。在金融贷款审批过程中,金融机构会收集并分析客户的财务状况、工作背景等数据。本案例收集了客户的性别、婚姻状况、受教育程度、收入(元/月)、贷款金额(万元)、城市、贷款状态等信息,具体数据见文件“金融贷款审批.xlsx”。4.1.1定性变量的描述性分析4.1统计量和描述性分析4.1.1定性变量的描述性分析以【案例4-1】金融贷款审批数据集中的定性变量“受教育程度”为例,使用pandas来进行定性变量的频数分析。步骤1使用pandas的value_counts()函数计算受教育程度的频数分布。步骤2使用pandas和Matplotlib来绘制频数分布柱形图。Python演示4.1统计量和描述性分析4.1.2定量变量的描述性分析
常用的基本描述统计量主要可以分为表示集中趋势的统计量、表示离散程度的统计量、表示分布形态的统计量。Python演示公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.2双变量的描述性分析4.2双变量的描述性分析4.2.1定性变量与定性变量(1)列联表
列联表,又称交互分类表,是一种用于分析两个或多个变量之间关系的方法。列联表通常是一个二维表格,其中的行表示一个变量的不同取值,列表示另一个变量的不同取值。表格中的每个单元格记录了两个变量同时具有某个取值的频数或频率。表
列联表常规格式ABB1B2A1n11n12A2n21n22A3n31n324.2双变量的描述性分析4.2.1定性变量与定性变量(2)双定性变量的关系分析Python应用举例
本节以【案例4-1】金融贷款审批数据中的定性变量“贷款状态”和“城市”为例,进行双定性变量的关系分析。
步骤1使用pd.crosstab()函数创建频数列联表,其中行索引为数据集中的“城市”列,列索引为“贷款状态”列,列联表将展示每个城市贷款状态的频数。
步骤2计算每个元素占该行总和的比例。
步骤
3为了更直观地展示数据分布情况,绘制百分比堆积柱形图。百分比堆积柱形图直条高度表示各类别的占比情况,总百分比为100%。Python演示4.2双变量的描述性分析4.2.2定量变量与定量变量(1)双定量变量的相关性分析
相关性分析是统计学中用来研究两个或多个变量之间相互依赖关系的工具。在现实生活中,许多现象都不是孤立存在的,它们之间往往存在一定的联系。
例如,商品的价格和需求量、个人的收入和消费水平、疾病的发病率与环境因素等,这些“变量”之间都可能存在某种程度的相关性。4.2双变量的描述性分析4.2.2定量变量与定量变量
相关性分析通过计算相关系数来衡量两个变量的关系的强度和方向。相关系数是衡量两个变量的线性关系强度的数值。相关系数的取值范围在-1到1之间,接近1或-1表示强烈的正相关或负相关,而趋近0则表示没有线性关系。
常见的相关程度划分标准相关程度划分标准强相关相关系数绝对值在0.7到1之间,表示两个变量具有较强的线性关系中等程度相关相关系数绝对值在0.3到0.7之间,表示两个变量存在一定的线性关系,但强度不如强相关弱相关相关系数绝对值在0.1到0.3之间,表示两个变量的线性关系较弱极弱相关/不相关相关系数绝对值在0到0.3之间,表示两个变量极弱相关或不相关
散点图以一个定量变量为横坐标,以另一个定量变量为纵坐标,数据以点的形式分布在直角坐标系中。散点图能通过直观的方式反映两个变量之间的相互影响程度,如果两个变量值同时增长,则为正相关,如图(a)所示;如果一个变量值增加,而另一个变量值下降,则为负相关,如图(b)所示;如果散点图上呈现为随机分布的离散的点,则为不相关,如图(c)所示。4.2双变量的描述性分析4.2.2定量变量与定量变量4.2双变量的描述性分析4.2.2定量变量与定量变量(2)双定量变量的相关性分析Python应用举例
以【案例4-1】金融贷款审批数据的定量变量“收入(元/月)”和“贷款金额(万元)”为例,进行双定量变量的相关性分析。首先计算双定量变量的相关系数,绘制相关系数热力图,然后绘制散点图,观察两个定量变量的变化趋势。Python演示
热力图是一种非常有效的数据可视化工具,它通过颜色变化来展示数据之间的相关性,使复杂的数据显示得更加直观和易于理解。4.2双变量的描述性分析4.2.2定量变量与定量变量Python演示4.2双变量的描述性分析4.2.2定量变量与定量变量通过散点图中数据点的分布关系,可以判断两个变量是否存在某种关系。Python演示4.2双变量的描述性分析4.2.3定性变量与定量变量(1)分组描述分析定性变量与定量变量的描述分析可通过计算分组的基本描述统计量来实现,具体为先根据定性变量进行分组,然后计算各个组下定量变量的基本描述统计量。表4-6所示为分组的定量变量描述统计表示例,其中A为定量变量,B为定性变量,B有两个类别B1、B2。表4-6
分组的定量变量描述统计表示例定性变量定量变量A平均值方差最小值最大值…B1B24.2双变量的描述性分析4.2.3定性变量与定量变量(2)定性变量与定量变量的相关性描述Python应用举例
以【案例4-1】金融贷款审批数据中的定性变量“贷款状态”和定量变量“贷款金额(万元)”为例,进行定性变量与定量变量的相关性描述分析。分组对定量变量进行描述统计,分别计算各个城市的贷款金额最大值、平均值以及最小值。为了更直观地展示变量“贷款状态”和“贷款金额(万元)”的关系,可以绘制这两个变量的分组箱线图。Python演示公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.3金融技术分析工具K线图,又称蜡烛图、烛线图或阴阳线图,是股票、外汇等金融市场一种常用的图表类型,用于展示一定时期内的开盘价、收盘价、最高价和最低价。K线图因其形状类似蜡烛的形状而得名,由影线和实体组成。实体是K线图中的矩形部分,它表示开盘价和收盘价之间的价格范围。实体的上方和下方分别连接着上影线和下影线,共同构成了K线图的基本形态。4.3.1K线图4.3数据变换阳线
阴线十字线4.3.2移动平均线4.3数据变换(1)简单移动平均线
简单移动平均线(SimpleMovingAverage,SMA)是通过在指定时间段内取一组给定值的算术平均值来计算的。简单移动平均线的计算方法是:将过去n天的收盘价相加,然后除以n。这种方法假设过去n天的收盘价对当前股价的影响是相同的,忽略了不同时间点的收盘价对当前股价的影响可能不同。4.3.2移动平均线4.3数据变换(2)加权移动平均线
加权移动平均线(WeightedMovingAverage,WMA)通过为不同时间点的数据赋予不同的权重来计算平均值。4.3.2移动平均线4.3数据变换(3)指数移动平均线
指数移动平均线(ExponentialMovingAverage,EMA)给予最近的数据更大的权重,从而更好地反映股价的近期趋势。4.3.3mplfinance绘图4.3数据变换(1)mplfinance函数mpf.plot()函数是mplfinance中的核心函数,它用于绘制金融时间序列数据,如股票价格图表、K线图、棒状图等。这个函数非常灵活,可选参数很多,可以自定义图表属性,包括颜色、线条样式、标记、网格、图例、工具栏等。(2)mplfinance绘图应用举例【案例4-2】神州高铁股票历史日线数据
神州高铁(股票代码:000008)是我国高速铁路网络建设和运营的重要企业之一,作为我国高速铁路的代表,神州高铁股票的走势往往被视为我国高铁行业发展的一个重要指标。具体数据见文件“神州高铁历史日线数据.xlsx”。以【案例4-2】神州高铁股票历史日线数据为例,使用mplfinance绘制金融图形,基本步骤如下。步骤1
数据准备。导入mplfinance,根据mplfinance需要,DataFrame要包含“Open”“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大班健康《食品安全》教案
- 高校思政教育班会
- 2025至2030全球及中国溶剂回收服务行业发展研究与产业战略规划分析评估报告
- 2025至2030全球及中国汽车玻璃天窗行业发展研究与产业战略规划分析评估报告
- 2025至2030全球及中国汽车全息仪表板行业发展研究与产业战略规划分析评估报告
- 腰腿痛健康宣教
- 《凡卡》教学设计
- 2025至2030全球及中国工业级切碗机行业发展研究与产业战略规划分析评估报告
- 健康甜食摄入控制指南
- 2025年中级银行从业资格之《中级个人理财》题库含答案详解【完整版】
- 注塑成型PFMEA完整版
- 七年级上学期历史导言课课件 ( 希沃白板课件+PPT课件)
- 医疗管理制度PDCA培训:提高医院感染管理相关制度的落实率
- 肺结核诊断和治疗指南
- 软件系统售后服务方案
- GB/T 9765-2009轮胎气门嘴螺纹
- GB/T 4623-2014环形混凝土电杆
- GB/T 23806-2009精细陶瓷断裂韧性试验方法单边预裂纹梁(SEPB)法
- GB/T 16823.3-2010紧固件扭矩-夹紧力试验
- GB/T 13785-1992棉纤维含糖程度试验方法比色法
- 食品安全相关知识考核试题题库与答案
评论
0/150
提交评论