财务大数据分析 课件 项目一任务二 Python数据分析的工具​_第1页
财务大数据分析 课件 项目一任务二 Python数据分析的工具​_第2页
财务大数据分析 课件 项目一任务二 Python数据分析的工具​_第3页
财务大数据分析 课件 项目一任务二 Python数据分析的工具​_第4页
财务大数据分析 课件 项目一任务二 Python数据分析的工具​_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目一

Python数据分析概述《财务大数据分析》课程JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院财务大数据分析课程团队

目录任务一认识数据分析任务二Python数据分析的工具​JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院1.掌握广义的数据分析和狭义的数据分析的概念;

2.掌握典型的数据分析流;

3.了解七大类常见的数据分析应用场景;

4.了解数据分析常用的Python、R和MATLAB工具;

5.了解使用Python工具进行数据分析的优势;

6.了解7个Python数据分析常用类库。学习任务JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院任务二

Python数据分析的工具​JIANGSUVOCATIONALCOLLEGEOFINFORMATIONTECHNOLOGY江苏信息职业技术学院了解数据分析常用工具目前主流的数据分析语言有Python、R、MATLAB这3种。其中,Python具有丰富和强大的库。它常被称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地连接在一起,是一门更易学、更严谨的程序设计语言。R语言则是用于统计分析、绘图的语言和操作环境。它属于GNU系统的一个自由、免费、源代码开放的软件。MATLAB的作用是进行矩阵运算、绘制函数与数据、实现算法、创建用户界面和连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通信、图像处理、信号检测、金融建模设计等领域。一(1)语法简单精练。对于初学者来说,比起其他编程语言,Python更容易上手。(2)有很多功能强大的库。结合在编程方面的强大实力,可以只使用Python这一种语言去构建以数据为中心的应用程序。(3)功能强大。从特性观点来看,Python是一个混合体。丰富的工具集使它介于传统的脚本语言和系统语言之间。Python不仅具备所有脚本语言简单和易用的特点,还提供了编译语言所具有的高级软件工程工具。Python数据分析的优势二Python是一门应用十分广泛的计算机语言,在数据科学领域具有无可比拟的优势。Python正在逐渐成为数据科学领域的主流语言。Python数据分析主要包含以下5个方面优势。(4)不仅适用于研究和原型构建,同时也适用于构建生产系统。研究人员和工程技术人员使用同一种编程工具,会给企业带来非常显著的组织效益,并降低企业的运营成本。资产负债数据结构分析二(5)Python是一门胶水语言。Python程序能够以多种方式轻易地与其他语言的组件“粘接”在一起。例如,Python的C语言API可以帮助Python程序灵活地调用C程序。这意味着用户可以根据需要给Python程序添加功能。IPython是Python科学计算标准工具集的组成部分,它将其他所有相关的工具联系在一起,为交互式和探索式计算提供了一个强健而高效的环境。同时,它是一个增强的PythonShell,目的是提高编写、测试、调试Python代码的速度。IPython主要用于交互式数据并行处理,是分布式计算的基础架构。另外,IPython还提供了一个类似于Mathematica的HTML笔记本、一个基于Qt框架的GUI控制台,具有绘图、多行编辑以及语法高亮显示等功能。Python数据分析常用类库三1、IPYthon(1)快速高效的多维数组对象ndarray。三Python数据分析常用类库2、NumPyNumPy是NumericalPython的简称,是一个Python科学计算的基础包。NumPy主要提供了以下内容。(2)对数组执行元素级计算以及直接对数组执行数学运算的函数。(3)读/写硬盘上基于数组的数据集的工具。(4)线性代数运算、傅里叶变换及随机数生成的功能。(5)将C、C++、Fortran代码集成到Python的工具。除了为Python提供快速的数组处理能力外,NumPy在数据分析方面还有另外一个主要作用,即作为算法之间传递数据的容器。对于数值型数据,使用NumPy数组存储和处理数据要比使用内置的Python数据结构高效得多。此外,由低级语言(比如C和Fortran)编写的可以直接操作NumPy数组中数据,无须进行任何数据复制工作。三Python数据分析常用类库3、SciPySciPy基于Python的开源代码,是一组专门解决科学计算中各种标准问题域的模块的集合,特别是与NumPy、Matplotlib、IPYthon、和pandas这些核心包一起使用时。Scipy主要包含了8个模块,不同的模块有不同的应用,如用于插值,积分,优化,处理图像和特殊函数等。三Python数据分析常用类库4、pandaspandas是Python的数据分析核心库,最初被作为金融数据分析工具而开发出来。它提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。Python之所以成为强大而高效的数据分析环境与它息息相关。pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能。它提供了复杂精细的索引功能,以便便捷地完成重塑、切片和切块聚合及选取数据子集等操作。pandas将是本书中使用的主要工具。三Python数据分析常用类库Matplotlib是最流行的用于绘制数据图表的Python库,是Python的2D绘图库。Matplotlib的操作比较容易,用户只需用几行代码即可生成直方图、功率谱图、条形图、错误图和散点图等图形。Matplotlib提供了pylab的模块,其中包括了NumPy和pyplot许多常用的数,方便用户快速进行计算和绘图。Matplotlib与IPython结合得很好,提供了一种非常好用的交互式数据绘图环境。5、Matplotlib6、scikit-learnscikit-learn是一个简单有效的数据挖掘和数据分析工具,可以供用户在各种环境下重复使用。而且scikit-learn建立在NumPy、SciPy和Matplotlib基础之上,对一些常用的算法方法进行了封装。目前,scikit-learn的基本模块主要有数据预处理、模型选择、分类、聚类、数据降维和回归6个。在数据量不大的情况下,scikit-learn可以解决大部分问题。三Python数据分析常用类库Spyder(前身是Pydee)是一个强大的交互式Python语言开发环境,提供高级的代码编辑、交互测试和调试等特性,支持Windows、Linux和OSX系统。Spyder可用于将调试控制台直接集成到图形用户界面的布局中。Spyder的最大优点就是模仿MATLAB的“工作空间”,可以很方便地观察和修改数组的值。当多个窗格出现在一个区域时,将使用标签页的形式显示。界面包含了“Editor”“Objectinspector”“Variableexplorer”“Fileexplorer”“PythonConsole“Historylog”和“IPythonConsole”等区域,方便用户灵活运用Python。7、Spyder(一)第一步首先在windows系统中安装Python以下为在Windows平台上安装Python的步骤:(1)第一步双击“python-3.9.7-amd64”四安装Python相关运用软件(2)第二步单击“InstallNow”,复选框中的内容都勾选(3)第三步点击“关闭”(二)第二步在windows系统中安装Anconda进入Anaconda官方网站,下载Windows系统中的Anaconda安装包,选择PYthon3.0以上版本。安装Anaconda的具体步骤如下。(1)单击“Next”按钮进入下一步四安装Python相关运用软件(2)单击“IAgree”按钮,同意上述协议并进入下一步(3)选择“AllUsers(requiresadminprivileges)”单选按钮,进入下一步(4)单击“Browse”按钮,选择在指定的路径安装Anaconda,选择完成后单击“Next”按钮,进入下一步;四安装Python相关运用软件(5)勾选2个复选框的内容,单击“Install”按钮,等待安装结束(6)单击“finish”按钮,

安装完成。(三)第三步分别安装pycharm、Pandas、Matplotlib(1)PyCharm安装:单击“Next”按钮进入下一步四安装Python相关运用软件(2)勾选复选框中的全部内容,单击“Next”按钮进入下一步(3)单击“Install”进入下一步四安装Python相关运用软件(4)勾选“Iwanttomanuallyrebootlater”(5)单击“finish”完成四安装Python相关运用软件安装好的PyCharm默认是英文界面,可以通过安装插件把它更改为中文界面。打开菜单栏“File”,选择“Settings”,然后选“Plugins”,单击“Marketplace”,搜索“Chinese”,然后单击“Install

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论