版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章
数据处理与应用1、常用表格数据的处理2、大数据处理3、大数据典型应用人生苦短我用python学习目标:
1、了解Python常用扩展模块的功能。2、掌握pandas模块的调用方法、数据结构等基本知识。3、能使用pandas模块对数据进行编辑、计算和统计分析,并能从中提取有用信息形成结论。4、掌握matplotlib模块的调用方法和使用matplotlib模块对数据进行可视化的基本方法。还记得吗?python模块的导入——import一个程序中已出现的一个或多个函数或模块,引入到另一个python代码中,从而实现代码的复用。语法如下:import模块名模块名.函数名from模块名import函数名python模块的小名儿import还有更多详细的用法,主要有以下两种:导入整个模块时,也可以为模块指定别名。
import模块名1[as别名1]…例如:importsysassprint(s.argv[0])
from模块名import成员名1[as别名1],…例如:fromsysimportargvasvprint(v[0])pandas处理数据
数据处理可以使用现成的软件或平台,也可以通过编写程序实现。Python语言丰富的标准模块和扩展库提供了许多高效灵活的函数,可以帮助我们较好地进行数据整理。
pandas数据结构
1.Series(序列)Series类似于一维数组,由一个数组的数据和一个与数据关联的索引(index),索引值默认是从0起递增的整数。frompandasimportSeries#导入pandas库中Series模块pds1=Series([1,2,3,4])pds101122334左列:index右列:valuespandas数据结构通过指定索引的方式pds2=Series([1,2,3,4],index=['a','b','c','d'])pds2a
1b2c3d4pandas数据结构通过字典方式创建data={"i1":1,"i2":2,"i3":3,"i4":4}#由于字典是无序的,因此指定索引排列顺序ps3=Series(data,index=['i1','i2','i3','i4'])ps3i11i22i33i44pandas数据结构
2.DataFrame(数据框)
DataFrame是一种类似于关系表的表格型数据结构,DataFrame对象是一个二维表格,由1个索引列(index)和若干个数据列组成。其中,每列中的元素类型必须一致,而不同的列可以拥有不同的元素类型。使用DataFrame前,需要导入pandas库中的DataFrame模块frompandasimportDataFrame
pandas数据结构data={"name":["王晓明","李静","田海"],"sex":["男","女","男"],"aged":[20,19,21]}#字典是无序的,因此需要通过columns指定列索引的排列顺序df=DataFrame(data,columns=["name","sex","aged"])dfindexpandas数据结构
DataFrame数据有列索引和行索引,行索引类似于关系表中每行的编号(未指定行索引的情况下,会使用0到N-1作为行索引),列索引类似于表格的列名(也称为字段)。df1=DataFrame(data,columns=["name","sex","aged"],index=["L1","L2","L3"])df1data={"name":("张三","李四","王五","赵六"),"sex":("男","女","女","男"),"aged":(20,19,20,21),"score":(80,60,70,90)}df=DataFrame(data)#使用字典创建DataFrame对象dfpandas数据结构
pandas数据结构
DataFrame模块提供了丰富的函数,这些函数可以用来进行行、列编辑和统计计算等。1.增加行增加行数据可以通过append()函数传入字典数据即可。append_data={"name":"朱八","sex":"男","aged":23,"score":65}new_df=df.append(append_data)new_df
pandas数据结构
2.增加列增加列可以直接通过标签索引方式进行,当新增的列中的数值不一样时,可以传入列表或者数组结构进行赋值。new_df["city"]=["北京","西安","长春","珠海","昆明"]new_df
pandas数据结构
3.删除使用drop()函数可以删除指定轴上的信息,原来的DataFrame数据不会删除。new_df.drop(2)#删除行索引是2的信息
pandas数据结构
4.修改标签
通过rename()函数完成行和列索引标签的修改,index参数指定要修改的行标签,columns参数指定要修改的列标签。new_df.rename(index={3:2,4:3},columns={"score":"grade"})#以字典形式指定修改信息
pandas数据结构
Matplotlib——绘图Matplotlib—绘制精美的图表
Matplotlib——绘图
matplotlib中的快速绘图的函数库可以通过如下语句载入:接下来调用figure创建一个绘图对象,并且使它成为当前的绘图对象。通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;dpi参数指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80。因此本例中所创建的图表窗口的宽度为8*80=640像素。importmatplotlib.pyplotaspltplt.figure(figsize=(8,4))快速绘图接下来通过一系列函数设置绘图对象的各个属性:•xlabel/ylabel:设置X轴/Y轴的文字•title:设置图表的标题•ylim:设置Y轴的范围•legend:显示图示最后调用plt.show()显示出创建的所有绘图对象。21plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()
Matplotlib——绘图快速绘图
22importnumpyasnpimportmatplotlib.pyplotasplt
x=np.linspace(0,10,1000)y=np.sin(x)z=np.cos(x**2)
plt.figure(figsize=(8,4))plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2)plt.plot(x,z,"b--",label="$cos(x^2)$")plt.xlabel("Time(s)")plt.ylabel("Volt")plt.title("PyPlotFirstExample")plt.ylim(-1.2,1.2)plt.legend()plt.show()
Matplotlib——绘图快速绘图23
Matplotlib——绘图课堂小结import模块名1[as别名1]…from模块名import成员名1[as别名1],…pandas数据结构Series(序列)DataFrame(数据框)Matplotlib——绘图1.下列Python的模块中,主要用于数据的处理和分析的是()A.ImageB.pandasC.scipyD.matplotlib课堂练习B课堂练习2.有Python程序段如下:importpandasaspdser=pd.Series([1,3,5,7])print(ser.index)
该程序段运行后输出结果为()A课堂练习3.某Dat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货币政策在通胀中的作用
- 绩效管理的法律和道德影响
- 益气健脾药物的药理基因组学研究
- 遥感技术在自然地理学中的应用
- 神经反馈在神经系统疾病个性化康复中的潜力
- 新学期学习计划模板汇编六篇
- 范文新学期计划模板七篇
- 健康咨询服务对医疗系统压力的影响
- 2024年酒泉市肃州区一级造价工程师《土建计量》高分冲刺试题含解析
- 代理招聘合同5篇
- GB/T 13818-2024压铸锌合金
- 小学二年级数学100以内加减法竖式计算同步监控口算题带答案
- 大学生创新创业法律实务-知到答案、智慧树答案
- 2024年中移铁通限公司公开招聘工作人员100名公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版
- 第二讲小数的意义和读写市公开课一等奖省赛课微课金奖课件
- 九年级体育与健康下册运动中伤害事故的预防和处理方法省公开课一等奖新名师获奖
- 通信光缆在线割接施工方案研究
- 天津市河西区2024年九年级结课质量调查英语试卷
- 月相观察记录表
- 2022年4月自考00369警察伦理学试题及答案含解析
- 人教版英语九年级全册英语单词默写表
评论
0/150
提交评论