大数据处理与分析整本书课件完整版电子教案全套课件最全教学教程ppt(最新)_第1页
大数据处理与分析整本书课件完整版电子教案全套课件最全教学教程ppt(最新)_第2页
大数据处理与分析整本书课件完整版电子教案全套课件最全教学教程ppt(最新)_第3页
大数据处理与分析整本书课件完整版电子教案全套课件最全教学教程ppt(最新)_第4页
大数据处理与分析整本书课件完整版电子教案全套课件最全教学教程ppt(最新)_第5页
已阅读5页,还剩515页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、乘风破浪,世界就在眼前第1章 开发环境搭建目录 Python解释器的安装单击此处添加备注.1 Anaconda的安装及环境搭建1.2 Jupyter Notebook与Pycharm的安装及工程环境设置1.31.1 Python解释器安装TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add herePython是什么?Python是1989年荷兰人Guido van Rossum发明的一种面向对象的解释型编程语言。Python语言简洁、易读以及可扩展性好,语法非常清晰,而且Python的拓展库丰富,具

2、有脚本语言中最丰富和强大的类库。Python语言及其众多的扩展库构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。1.1 Python解释器安装MAC OS下安装解释器安装流程第一个hello world程序代码运行Windows安装解释器安装流程Linux下安装解释器虚拟机与安装流程1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here1.准备工作(1)一台装有Windows系统的计算机。(2)在

3、Python官网上下载相应版本的安装包。 进入Python官网后在首页单击“Downloads”,如图1-1所示;然后选择all releases或Windows后进入版本选择页面,选择相应版本;最后下载X86的64位版本中的可执行安装器即可(executable installer)1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add here点击下载选择版本1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add hereTEXT add hereTE

4、XT add hereTEXT add here2.具体安装步骤 (1)单击运行安装包,开始安装Python,如图所示。选择 Customize installation(自定义安装),暂不勾选Add Python 3.7 to PATH。单击“Customize installation”进入下一步。1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here2.具体安装步骤 (2)在Python的安装配置界面中,将所有选项全部勾选后,单击“

5、Next”按钮进入下一步,如下图所示。1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here2.具体安装步骤(3)此时进入高级选项步骤,选择下图中的选项,并在Customize install location中选择相应的安装目录后,单击“Install”按钮进行安装,如图所示。1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add here2.具体安装步骤(4)等待安

6、装完毕后显示安装成功界面。1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add here3.环境变量配置(1)进入控制面板所有控制面板项系统,选择“高级”活页夹,可进入系统属性界面,如下图所示,单击右下角“环境变量”按钮,进入环境变量配置。1.1.1 在Windows系统下安装Python解释器TEXT add hereTEXT add hereTEXT add here3.环境变量配置(2)进入环境变量界面后,选择Path,单击“编辑”,如下图所示。在其中添加Python安装目录和安装目录下Scripts文件这两个路径即

7、可。(3)在命令行中输入python命令,出现相应的Python版本号,就说明环境变量配置成功。1.1.2 Linux系统下安装Python解释器TEXT add hereTEXT add hereTEXT add here1.准备工作(1)一台装有Linux系统的计算机或安装了Linux系统的虚拟机,Linux系统采用Cent OS7。一般情况下Linux系统自带有Python,但可能不是Python 3版本,如果要确认Python版本的话,可以分别在终端输入命令:python或python3,运行后的界面如下图所示。1.1.2 Linux系统下安装Python解释器1.准备工作(2)Pyt

8、hon 3源码包,可通过自带的火狐浏览器直接到Python官网下载,或者在终端输入“su root”命令后键入用户密码,获取root权限,输入以下命令:wget /ftp/python/3.7.0/Python-3.7.0.tgz用此方法下载源码包,安装成功如图所示。1.1.2 Linux系统下安装Python解释器2.具体安装步骤(1)为了方便管理,首先在/usr/local/下面创建一个文件,作为安装Python的目标文件,文件名任意,这里取名为Python3。在Linux中一般习惯把用户安装的软件安装在/usr/local/XXX/下。使用以下命令进入/usr/local/创建文件,创建

9、后可以用“ls”命令查看当前路径下的目录,如下图所示,可以发现新增了Python3目录。1.1.2 Linux系统下安装Python解释器2.具体安装步骤(2)回到起始路径,输入以下命令解压下载好的Python安装压缩包。rootlocalhost dd# tar -zxvf Python-3.7.0.tgz(3)解压完成后,输入命令:cd Python-3.7.0/,进入生成的目录。rootlocalhost dd# cd Python-3.7.0/接着执行命令:./configure -prefix=/usr/local/Python3,设置Python的安装目录为/usr/local/P

10、ython3。 # ./configure -prefix=/usr/local/Python3(4)配置完成之后执行命令:make,开始编译源码。rootlocalhost Python-3.7.0# make1.1.2 Linux系统下安装Python解释器2.具体安装步骤编译成功后如右图所示。(5)编译完成后,执行命令:make install,开始安装Python。rootlocalhost Python-3.7.0# make install(6)在第五步make install的安装过程中,可能遇到如下问题。zipimport.ZipImportError: cant decomp

11、ress data; zlib not availablemake: * install Error 11.1.2 Linux系统下安装Python解释器2.具体安装步骤该问题是缺少相应的Python 3依赖包引起的,可以通过以下命令安装所有包来解决。rootlocalhost Python-3.7.0# yum install zlib*或者也可以通过安装所需要的部分包来解决。rootlocalhost Python-3.7.0# yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readl

12、ine-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel 该问题解决后可能还会再遇到以下问题。ModuleNotFoundError: No module named _ctypes此时还需要额外安装依赖。yum -y install libffi-devel1.1.2 Linux系统下安装Python解释器2.具体安装步骤解决问题后再次执行make install命令进行安装,安装成功后就会显示下图所示界面。1.1.2 Linux系统下安装Python解释器3.更改默认指向安装完成后,在终端输入python或python3命

13、令,如果出现的版本依然是原来的默认版本,那么就需要创建链接。在终端中输入以下命令删除原有对Python 2的软链接。rm /usr/bin/python再创建新的链接。ln -s /usr/local/Python3/bin/python3 /usr/bin/pythonln -s /usr/local/Python3/bin/pip3 /usr/bin/pip最后再使用python命令查看默认版本,观察Python默认版本是否已经更换为你安装的最新版。1.1.3 在MacOS系统下安装Python解释器1.准备工作(1)一台装有Mac OS系统的计算机。(2)Python可执行安装包,可到P

14、ython官网下载。2.安装步骤(1)进入Python官网,选择相应的Mac OS版本Python安装包进行下载。(2)下载完成后,打开安装包进行安装,单击“继续”按钮,显示如下图所示界面。1.1.3 在MacOS系统下安装Python解释器1.准备工作(3)根据每一步的提示进行操作,安装成功后显示如下图所示的界面。(4)查看安装是否成功,打开终端输入python查看默认版本即可。1.1.4 运行第一个hello world程序在计算机里还没有安装Python的集成开发环境时,有以下两种方式写出第一个程序。(1)使用cmd命令行。打开cmd,输入python后,就可以在命令行里编写Python

15、程序了。如写入以下代码:print(hello world!)按下回车键后就能看见输出的结果,再输入以下命令即可退出Python编写。exit()(2)使用Python Shell来编写。在主菜单左下角搜索Python,找到Python Shell,启动后在里面同样书写print(hello world!),按下回车键,即可得到如下图所示的结果。1.2 Anaconda的安装及环境变量配置安装Anaconda安装流程Anaconda简介介绍环境变量配置环境变量1.2.1 Anaconda简介TEXT add hereTEXT add hereTEXT add hereTEXT add here

16、TEXT add hereTEXT add hereAnaconda是基于Python的数据处理和科学计算平台,它内置了许多非常有用的第三方库,其内部包含了conda、Python在内的超过180个科学包及其依赖项。Anaconda是在conda(一个包管理器和环境管理器)上发展出来的。安装Anaconda,就相当于把Python和一些如Numpy、Pandas、Scrip、Matplotlib等常用的库自动安装好了,比在常规Python环境下安装这些组件更容易。如果计算机中已经安装了Python,也建议安装上Anaconda,因为使用Anaconda进行开发时默认Python还是选取的Ana

17、conda附带的Python。不会和原来已安装的Python产生冲突。1.2.1 Anaconda简介TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here 总结起来,Anaconda具有四大特点:开源;集成安装;高性能使用Python和R语言;免费的社区支持。 此外Anaconda还有很多预知的相关包以及可安装的三方库:1.科学计算相关包(1)iPython(2)NumPy(3)Matplotlib(4)beautiful-soup 2.机器学习和数据挖掘相关包(2)Pandas(3)sci

18、kit-learn(4)nltk 1.2.1 Anaconda简介TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here3.其他重要的预置工具(1)conda(2)IPython Notebook(3)Spyder(4)PyQt(5)CPython 1.2.2 安装AnacondaTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here安装步骤如下:(1)到Anaconda官网寻找要安装的相应版

19、本,这里选择Windows的64位Python 3.7图形化安装包,单击下载,如下图所示。1.2.2 安装AnacondaTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here安装步骤如下:(2)打开安装包,进入安装界面,如下图所示。选择是为当前用户还是为所有用户安装,如果电脑中只有一个用户选择第一个即可,这里选择第一个选项,然后单击“next”按钮。1.2.2 安装AnacondaTEXT add hereTEXT add hereTEXT add here安装步骤如下:(3)单击“next

20、”按钮后进入高级选项界面,第一个选项是添加环境变量,第二个选项是选择将Anaconda 3中的Python解释器作为默认的Python 3.7解释器,这里选择第二个选项,环境变量待会手动添加比较好,单击“Install”按钮进行安装,如下图所示。1.2.2 安装AnacondaTEXT add hereTEXT add hereTEXT add here安装步骤如下:(4)安装完成,单击“Next”按钮,显示感谢安装使用界面,如图1-25所示,再单击“Finish”按钮结束安装。1.2.3 配置环境变量TEXT add hereTEXT add hereTEXT add here配置步骤如下:

21、(1)在控制面板中找到高级系统设置,打开后在系统属性中单击“环境变量”按钮,在环境变量中找到Path,在其中添加Anaconda安装目录的Scripts文件夹路径:D:Anaconda3Scripts,如下图所示。1.2.3 配置环境变量配置步骤如下:(2)配置好后,打开Windows Powershell或者cmd,输入命令:conda version,即可查看当前的安装版本,输入命令:conda list可查看已安装的包名和版本号,如果显示出如下图类似的对应信息,则说明安装和环境变量等配置成功。1.3 Jupyter Notebook与PyCharm的安装及工程环境设置设置Notebook

22、工程环境设置工程环境Pycharm工程环境设置新建项目与解释器选择Notebook的简介与安装安装流程Pycharm的简介与安装安装流程1.3.1 Jupyter简介TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here Jupyter Notebook(以下简称Jupyter)项目开始于2014年,在所有编程语言中,是一种用于支撑科学计算和交互式计算科学的衍生式IPython。 Jupyter是一种模块化的Python编辑器(现在也支持R等多种语言)。在Jupyter中,可以把大段的Pyth

23、on代码碎片化处理,分开每一段来运行。在软件开发中,Jupyter可能显得并没有那么好用,这个模块化的功能反而会破坏掉程序的整体性;但是当在做数据处理、分析、建模、观察结果等的时候,Jupyter模块化的功能不仅会提供更好地视觉体验,更能大大缩小运行代码及调试代码的时间,同时还会让整个处理和建模的过程变得异常清晰。 Jupyter由三个组件构成:笔记本应用程序、内核、笔记本文件。1.3.1 Jupyter简介TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here其核心特点主要有以下几方面。(1

24、)开源。(2)支撑30种语言,包括一些数据科学领域很流行的语言,如Python、R、Scala、Julia等。(3)允许用户创建和共享文件,文件中可以包括公式、图像以及重要的代码(4)拥有交互式组件,可以编程输出视频、图像、LaTaX。不仅如此,交互式组件能够用来实时可视化和操作数据。(5)它也可以利用Scala、Python、R整合大数据工具,如Apache的Spark。用户能够拿到和Pandas、scikit-learn、ggplot2、dplyr等库内部相同的数据。1.3.1 Jupyter简介TEXT add hereTEXT add hereTEXT add hereTEXT add

25、 hereTEXT add hereTEXT add here其核心特点主要有以下几方面。(6)markdown标记语言能够代码标注,用户能够将逻辑和思考写在笔记本中,这和Python内部注释部分不同。(7)Jupyter笔记本的用途包括数据清洗、数据转换、统计建模和机器学习。(8)Matplotlib、NumPy、Pandas等拓展库整合了机器学习的一些特性。Jupyter笔记本有一个很重要的特性,就是它能够用图显示单元代码的输出。如今Jupyter已迅速成为数据分析、机器学习的必备工具,因为它可以让数据分析师集中精力向用户解释整个分析过程。1.3.1 Jupyter安装TEXT add h

26、ereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here安装Jupyter的最简单方法是使用Anaconda,关于Anaconda的安装在上一节已经介绍过。Anaconda发行版附带了Jupyter Notebook,你能够在默认环境下使用Notebook。最直接的方法就是在Anaconda Navigator界面中直接选择Jupyter Notebook启动即可,如下图所示。1.3.1 Jupyter安装TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEX

27、T add hereTEXT add here另外一种方法是在conda环境中安装Jupyter,在conda终端使用以下命令即可(以下两个命令是指在conda的终端Anaconda Prompt中运行):conda install jupyter notebook安装好后启动Jupyter Notebook输入以下命令即可:jupyter notebook1.3.1 Jupyter安装TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here如果不使用Anaconda安装Jupyter Note

28、book,可以通过Python Shell的pip来单独安装。具体安装步骤如下。(1)首先升级pip到最新版本,老版本的pip在安装Jupyter过程中或面临依赖项无法同步安装的问题,因此建议先把pip升级到最新版本。使用Python 3.x安装,在cmd或PowerShell命令行中输入以下命令(建议使用Python 3来安装)。pip3 install -upgrade pip使用Python 2.x安装,在cmd或PowerShell命令行中输入以下命令。pip install -upgrade pip(2)然后升级完毕即可安装Jupyter。使用Python 3.x安装,在cmd或Po

29、werShell命令行中输入以下命令(建议使用Python 3来安装)。pip3 install jupyter使用Python 2.x安装,在cmd或PowerShell命令行中输入以下命令。pip install jupyter1.3.2设置Jupyter Notebook工程环境TEXT add hereTEXT add hereTEXT add here设置步骤如下:(1)首先创建一个自己的工作目录,例如:D:Anaconda3jupyter_work,以后在启动Jupyter Notebook时打开的都是这个jupyter_work文件夹。(2)接着在开始菜单中打开Anaconda

30、Prompt,输入jupyter notebook -generate-config生成文件,打开C盘下jupyter文件夹查看生成是否成功,如下图所示。(3)根据Anaconda Prompt中生成文件的路径,找到jupyter_notebook_config.py文件,如下图所示,用记事本或其他工具将其打开。1.3.2设置Jupyter Notebook工程环境设置步骤如下:(4)打开文件后找到#c.NotebookApp.notebook_dir=这一行配置信息,如右图一所示,删除“#”以去掉注释,并在等号后的中填入自己设定的工作路径,如右图二所示,修改完成后保存文件。1.3.2设置Ju

31、pyter Notebook工程环境设置步骤如下:(5)修改开始菜单中Jupyter Notebook的快捷方式操作流程(以Win 10为例):开始Jupyter Notebook右键更多打开文件位置找到Jupyter Notebook的快捷方式右键打开属性,去掉目标这一项中“.py”后面的所有内容,结果如右图所示。(6)以上内容设置成功后,在Anaconda Prompt中输入Jupyter notebook,即可启动Jupyter了1.3.3 PyCharm简介与安装1.PyCharm简介能够开发Python项目的IDE很多,如Sypder、sublime text、PyCharm等,可以

32、根据个人爱好来选择安装IDE应用。下面介绍一个比较强大IDE工具:PyCharm。PyCharm带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、脚本控制等。此外,该IDE还提供了用户支持Django框架下的专业Web开发,同时支持Google APP Engine等高级功能,更好的一点是PyCharm支持IronPython。由于Jupyter不能debug,而且打开.py的脚本也不方便,所以建议安装PyCharm这个IDE来进行Python程序的编写。1.3.3 PyCharm简介与安装2.Py

33、Charm安装(1)本书将要介绍安装的PyCharm版本为2020.1的社区版(community),可以到jetbrains官网下载相应版本。(2)下载好后打开安装包进入安装欢迎界面,单击“next”按钮进入如下图所示的界面,选择自己想要安装路径,然后单击“Next”按钮进入安装选项界面。1.3.3 PyCharm简介与安装2.PyCharm安装(3)在安装选项界面中,如下图所示,可以看到四个选项,分别是创建桌面快捷方式、配置环境变量、以工程形式打开文件、关联.py文件。将它们全部选中,单击“Next”按钮进入下一步。(4)选择开始菜单文件界面,即选择一个开始菜单文件夹存放PyCharm快捷

34、方式,这里使用默认的JetBrains文件夹,单击“Install”按钮进行安装。1.3.3 PyCharm简介与安装2.PyCharm安装(5)等待安装成功后显示如下图所示的界面。此时有两个选项,第一个选项是立即重启计算机,第二个选项是随后手动重启计算机。重启计算机的作用是自动完成环境变量等系统配置,此处可以选择第二个选项,先进行PyCharm创建工程和工程环境配置。1.3.4 PyCharm工程环境设置在完成PyCharm的所有安装步骤后,就可以单击PyCharm开始创建第一个工程项目。首先打开PyCharm后见到的是一些基本选择,如图1-43所示。在这里可以选择一个你喜欢的UI主题界面。

35、1.3.4 PyCharm工程环境设置在选好界面后,接着选择Next:Featured plugins显示如图1-44所示的界面,单击“Create New Project”按钮开始建立第一个项目。1.3.4 PyCharm工程环境设置新建项目后,显示如图所示的配置界面。第一行Location选择项目存放路径,默认路径前半部分是工程文件夹存放路径,末尾的untitled是由我们自定义的工程文件夹名称。Location下面选项是选择项目解释器,也是选择依赖的Python库。Python的默认实现是为每个项目创建Virtualenv。展开Project Interpreter:New Virtua

36、lenv Environment,然后选择创建新虚拟环境的工具。使用New environment using选项时,可以创建新的环境(解释器),有三个选项:Virtualenv,Pipenv,Conda,分别表示使用这三种工具创建新环境,而使用Existing interpreter时,表示选择使用已存在解释器。现在选择Virtualenv工具,并指定新虚拟环境的位置和基本解释器,这里的Location会和上面第一个Location同步,可看到创建的新环境位于工程目录的子目录venv下,对于解释器选择,如果安装了Anaconda的话,可以直接选择Anaconda自带解释器作为基本解释器。最后

37、单击“Create”按钮创建项目。1.3.4 PyCharm工程环境设置1.3.4 PyCharm工程环境设置在使用上述第一个选项New environment using来创建项目时,会在项目中创建一个venv(virtualenv)目录,这里存放一个虚拟的Python环境。这里所有的类库依赖都可以直接脱离系统安装的Python独立运行,优点是:Python项目可以独立部署;防止一台服务器部署多个项目之间存在类库的版本依赖问题发生;可以充分发挥项目的灵活性。注意,新创建的项目只包含pip和setuptools两个包,打开项目文件设置项目Project Interpreter项目环境,需要选择

38、右方的加号手动添加所需的三方库。1.3.4 PyCharm工程环境设置如果想要一来就拥有Anaconda已装好的库,且不想在项目中出现venv虚拟解释器,可以选择Existing Interpreter关联已经存在的本地Python解释器,如右图一所示,第一步选择Existing interpreter,第二步浏览已有的解释器,如右图二所示,此处选择conda环境,Interpreter选择anconda目录下的Tools文件夹下的python.exe文件,最后单击“OK”按钮即可。1.3.4 PyCharm工程环境设置创建好工程后,在代码界面选择File-Settings,如左图所示,选择后

39、进入设置界面,展开Project,选择Project Interpreter即可看到当前项目的解释器还有所有已添加的包,如右图所示,以anaconda为例,可以看到它的版本。往下继续检索,还可以看到Numpy、Pandas和Matplotlib这些数据分析常用包的信息。Thank You!乘风破浪,世界就在眼前第2章 使用NumPy进行数据计算目录 安装NumPy2.1 NumPy中的数组对象2.2 使用NumPy进行数学运算2.3 NumPy使用案例2.42.1 安装NumPyTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT a

40、dd hereTEXT add hereNumPy是什么?NumPy(Numerical Python)是Python用于科学计算的基础软件包,是Python的开源数值计算扩展,NumPy主要用来存储数组对象和处理大型矩阵(matrix),比Python自身的嵌套列表(nested list structure,也可用来表示矩阵)结构要高效的多。此外NumPy是一个运行速度非常快的数学库,主要用于数组计算,包含强大的n维数组对象ndarray、广播功能函数、线性代数等功能。2.1 安装NumPyTEXT add hereTEXT add hereTEXT add here在cmd下使用命令:p

41、ip install numpy注意:若没有配置环境变量,需要先cd到python的安装目录安装完成后实验NumPy是否安装成功数组对象创建 常用属性访问修改基础运算常用函数是什么?怎么用?有什么特点?2.2 NumPy中的数组对象2.2.1 数组的创建TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here1.使用array()函数创建数组:使用NumPy的array()函数可以创建一维、二维、n维数组,array()函数要求传入Python列表数据,传入Python列表数据的嵌套层次决定了创

42、建数组的维数。2.2.1 数组的创建TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here2.使用zeros()、ones()、empty()函数创建数组:zeros()函数创建数组元素全部为0的数组,默认情况下数组元素的类型为float 64;ones()函数创建数组元素全部为1的数组,默认情况下数组元素的类型为float 64;empty()函数创建数组元素为随机内容的数组,随机内容取决于存储器的状态。一维数组:2.2.1 数组的创建TEXT add hereTEXT add hereTE

43、XT add hereTEXT add hereTEXT add hereTEXT add here2.使用zeros()、ones()、empty()函数创建数组:二维或多维数组:2.2.1 数组的创建TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here2.使用zeros()、ones()、empty()函数创建数组:创建指定类型的数组例如:complex的二维数组2.2.1 数组的创建TEXT add hereTEXT add hereTEXT add hereTEXT add here

44、TEXT add hereTEXT add here3.使用arange()函数创建等间隔的数字数组:使用arange()函数可以创建等间隔的数字数组,其函数参数有三个,第一个为起始值,第二个为终止值,第三个参数为间隔距离,第三个参数默认值为None,即一个单位。2.2.2 数组对象的常用属性TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add hereTEXT add here属性属性说明ndarray.ndim秩,即轴的数量或维度的数量ndarray.shape数组的维度,对于矩阵,n行m列ndarray.size数组元素

45、的总个数,相当于.shape中n*m的值ndarray.dtypendarray对象的元素类型ndarray.itemsizendarray对象中每个元素的大小,以字节为单位ndarray.flagsndarray对象的内存信息ndarray.realndarray元素的实部ndarray.imagndarray元素的虚部ndarray.data包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性常用的ndarray对象属性2.2.2 数组对象的常用属性TEXT add hereTEXT add hereTEXT add hereTEXT add hereTEX

46、T add hereTEXT add here属性描述C_CONTIGUOUS(C)数据是在一个单一的C风格的连续段中F_CONTIGUOUS(F)数据是在一个单一的Fortran风格的连续段中OWNDATA(O)数组拥有它所使用的内存或从另一个对象中借用它WRITEABLE(W)数据区域可以被写入,将该值设置为False,则数据为只读ALIGNED(A)数据和所有元素都适当地对齐到硬件上UPDATEIFCOPY(U)这个数组是其它数组的一个副本,当这个数组被释放时,原数组的内容将被更新ndarray.flags中的内存信息介绍2.2.3 数组元素的访问与修改TEXT add hereTEXT

47、 add hereTEXT add here1.一维数组元素的访问与修改:访问的时候是用的变量名加上数组的下标(数组下标从0开始,数组下标是对应的元素个数-1,因此第三个元素的数组下标为2),并用框起来,修改同理。2.2.3 数组元素的访问与修改TEXT add hereTEXT add hereTEXT add here2.二维数组元素的访问与修改:如果只给出一个,就会输出一行的元素,因此这个二维数组可以看做是由多个一维数组组成的一个新的数组。如果要访问到某个位置的元素,就需要同时确定它的行标和列标,所以在访问时,需要用2个,其中第一个框代表行标,第二个框代表列标,其数组下标意义与一维数组类

48、似。n维数组的访问可以参考二维数组依次类推。2.2.4 数组对象的基础运算TEXT add hereTEXT add hereTEXT add here1.不改变原数组的自增自减运算2.改变原数组的自增自减运算2.2.5 数组对象的基本操作TEXT add hereTEXT add hereTEXT add here1.reshape()函数:reshape()函数的功能是改变数组形状,可以把x维数组改成y维数组。函数原型是reshape(n)。参数:n代表数组形状。2.2.5 数组对象的基本操作TEXT add hereTEXT add hereTEXT add here2.ravel()函

49、数ravel()函数的功能是将多维数组展开为一维数组。2.2.5 数组对象的基本操作3.concatenate()函数:concatenate()函数的功能是将多个数组连接。函数原型是concatenate(arr,axis)。参数:arr是要拼接的数组,要求数组维数要一致;axis默认值是0,表示在第0个维度上拼接,也可以给其赋值,拼接在指定维度上。2.2.5 数组对象的基本操作4.delete()函数:delete()函数的功能是从数组中删除指定值。函数原型是delete(arr,obj,axis)。参数:arr是需要处理的矩阵;obj在什么位置处理;axis是一个可选参数,axis=No

50、ne,1,0。当axis=None时,arr会先按行展开,然后按照obj,删除第obj-1(从0开始)位置的数,返回一个行矩阵;当axis=0时,arr按行删除;当axis=1时,arr按列删除。2.2.5 数组对象的基本操作5.sort()函数:sort()函数返回输入数组的排序副本。函数原型是sort(arr, axis, kind, order)。参数:arr是要排序的数组;axis是沿着它排序数组的轴,如果没有数组会被展开,沿着最后的轴排序,axis=0按列排序,axis=1按行排序;kind是排序方法,默认为quicksort(快速排序),排序方法及其一些情况如表2-3所示;orde

51、r是排序的字段,可以不包含。种类速度最坏情况工作空间稳定性quicksort(快速排序)1O(n2)0否mergesort(归并排序)2O(n*log(n)n/2是heapsort(堆排序)3O(n*log(n)0否2.2.5 数组对象的基本操作5.sort()函数:2.2.5 数组对象的基本操作6.where()函数:where()函数筛选出满足条件元素的下标。函数原型是where(condition, x, y)。参数:满足条件condition,输出x,不满足输出y。若没有x和y,则输出满足条件(即非0)元素的坐标。2.2.5 数组对象的基本操作7.extract():extract()

52、和where()函数有一点类似,不过extract()函数是筛选出满足条件元素的值并返回,而不是元素索引。数学运算位运算函数 数学函数算术函数统计函数线性代数函数是什么?怎么用?有什么特点?2.3 使用NumPy进行数学运算2.3.1 位运算1.bitwise_and()函数:bitwise_and()函数的主要作用是对数组中整数的二进制形式执行按位与运算。函数原型是bitwise_and(a,b)。参数:a和b为两个求位与运算的数字。2.3.1 位运算2.bitwise_or()函数:bitwise_or()函数的主要作用是对数组中整数的二进制形式执行按位或运算。函数原型是bitwise_o

53、r(a,b)。参数:a和b为两个求位或运算的数字。2.3.1 位运算3.invert()函数:invert()函数的主要作用是对数组中整数进行按位取反运算,即0变成1,1变成0。函数原型是invert(n)。参数:n为按位取反运算的数字。2.3.1 位运算4.left_shift()函数:left_shift()函数的主要作用是将数组元素的二进制形式向左移动到指定位置,右侧附加相等数量的0。函数原型是left_shift(a,b)。参数:a为要左移的数字,b为要左移的位数。2.3.1 位运算5.right_shift()函数right_shift()函数的主要作用是将数组元素的二进制形式向右移

54、动到指定位置,左侧附加相等数量的0。函数原型是right_shift(a,b)。参数:a为要右移的数字,b为要右移的位数。2.3.2 数学函数1.三角函数标准的三角函数:sin()、cos()、tan()反三角函数arcsin()、arccos()和arctan()degrees()函数将弧度转换为角度2.3.2 数学函数2.舍入函数(1)around()函数返回指定数字的四舍五入值。函数原型是around(array,decimals)。参数:array表示数组;decimals表示舍入的小数位数,默认值为0,如果为负,整数将四舍五入到小数点左侧的位置。2.3.2 数学函数2.舍入函数(2)

55、floor()函数用于返回小于或者等于指定表达式的最大整数,即向下取整。ceil()函数用于返回大于或者等于指定表达式的最小整数,即向上取整。函数原型:floor(n),ceil(n)参数:n为要取整的数2.3.3 算术函数1.简单的加减乘除add(),subtract(),multiply()和divide()是简单的加减乘除运算,也是基本的运算,这里要注意的是数组必须具有相同的形状或符合数组广播规则,否则会报错。2.3.3 算术函数2.reciprocal()函数reciprocal()函数返回参数元素的倒数。2.3.3 算术函数3.power()函数power()函数是将第一个输入数组中

56、的元素作为底数,计算它与第二个输入数组中相应元素的幂。2.3.3 算术函数4.mod()与remainder()函数mod()函数计算输入数组中相应元素的相除后的余数。remainder()函数也产生相同的结果。2.3.4 统计函数1.最大值amax()与最小值amin()函数这两个函数的功能分别是用于计算数组中的元素沿指定轴的最小大值和最小值。另外还有ptp()函数计算数组中元素最大值与最小值的差。2.3.4 统计函数2.百分位数percentile()函数percentile()函数的主要功能是用来计算数组中的百分位数,百分位数是统计中使用的度量,表示小于这个值的观察值的百分比。函数原型是

57、percentile(array, q, axis)。参数:array是输入数组;q是要计算的百分位数,在0100之间;axis是沿着它计算百分位数的轴。2.3.4 统计函数3.中位数median()函数median()函数的主要功能是用于计算数组array中元素的中位数(中值)。2.3.4 统计函数4.算数平均数mean()函数与加权平均数average()函数mean()函数的主要功能是返回数组中元素的算术平均值。如果提供了轴,则沿其计算。算术平均值是沿轴的元素的总和除以元素的数量。average()函数根据在另一个数组中给出的各自的权重计算数组中元素的加权平均值;该函数可以接受一个轴参数

58、,如果没有指定轴,则数组会被展开。加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。2.3.4 统计函数5.标准差std()函数与方差var()函数标准差是一组数据平均值分散程度的一种度量,而统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数,其中,标准差是方差的平方根。2.3.5 线性代数函数描述dot()两个数组的点积,即元素对应相乘vdot()两个向量的点积inner()两个数组的内积matmul()两个数组的矩阵积determinant()数组的行列式solve()求解线性矩阵方程inv()计算矩阵的乘法逆矩阵2.3.5 线性代数1

59、.dot()函数dot()函数主要对于两个一维的数组,计算的是这两个数组对应下标元素的乘积和(数学上称之为内积);对于二维数组,计算的是两个数组的矩阵乘积;对于多维数组,它的通用计算公式如下,即结果数组中的每个元素都是:数组a的最后一维上的所有元素与数组b的倒数第二位上的所有元素的乘积和:dot(a, b)i,j,k,m = sum(ai,j,: * bk,:,m)。2.3.5 线性代数2.vdot()函数vdot()函数的作用是计算两个向量的点积。如果第一个参数是复数,那么它的共轭复数会用于计算。如果参数是多维数组,它将会被先展开,后计算。2.3.5 线性代数3.inner()函数inner

60、()函数的作用是返回一维数组的向量内积。对于更高的维度,它返回最后一个轴上的和的乘积。2.3.5 线性代数4.matmul()函数matmul()函数返回两个数组的矩阵乘积。虽然它返回二维数组的正常乘积,但如果任一参数的维数大于2,则将其视为存在于最后两个索引的矩阵的栈,并进行相应广播。另一方面,如果任一参数是一维数组,则通过在其维度上附加1来将其提升为矩阵,并在乘法之后被去除。2.3.5 线性代数5.linalg.det()函数linalg.det()函数用于计算输入矩阵的行列式。2.3.5 线性代数6.linalg.solve()函数linalg.solve()函数用于求矩阵形式的线性方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论