




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、py t hon 资 料 精品文档 python资料 Python对csv的处理: #edcoding:utf-8 import pandas as pd import csv df=pd.read_csv(23.csv) print df.week #输出week这一列的数据 print dfweek #输出week这一列的数据 print df.ix1 #输出第二行数据(下标是从0开始的) print df.iloc:,1:4 #输出第二到第四列的数据但是只可以通过序列取,不能通过列名 print df.ix:,LEASETIME,SHEDID #通过列名取出数据 print df.ix:
2、,1,5#取出第二行和第六行数据(下标是从0开始的) print df.ix5,1#输出第六行第二列的数据(下标是从0开始的) print df.head(10)#取出前十行数据 print df.tail(10) #取出后十行数据(从后往前数) print dfdf.week=0 #将week这列等于0的全部取出来 print df(df.week=0)print np.dtype(f4);print np.dtype(f8) print AAAAAAAAAAAAA t=np.dtype(float) # t=np.dtype(float) print t.char,t #dtype类型属性
3、type print t.type #dtype类型属性str保存一个表示数据类型的字符串 print t.str print BBBBBBBBBBBBBB #一维数组的切片与索引 a=np.arange(10) print a3:5 #左闭右开 print a1:7:2 #左闭右开,间隔2 print a4:-1 # 输出4 3 2 1 0 print CCCCCCCCCCCCCCCC #处理数组形状 print a.reshape(2,5) #将1行10列数组转换成 2行5列数组 b=np.arange(24).reshape(2,3,4) print b print b.ravel()
4、#将多为数组降为1维数组,默认以行为准,参数-1以列为准 print b.flatten(-1) #拉直操作,默认以行为准,参数-1以列为准 print b.ravel().reshape(4,6) print b.ravel().reshape(4,6).transpose() # 转秩操作 print DDDDDDDDDDDDDDDDDDD #reshape函数返回一个新数组,但原数组本身.不变; # resize在返回一个新数组的同时也改变原数组本身。 print b=,b print b.reshape=,b.reshape(4,6) print b=,b b.resize(2,12)
5、 print b=,b b.shape=(2,3,2,2) #用元组的形式指定数组形状 print b print EEEEEEEEEEEEEEEEEEEEEEEEE #堆叠数组 a=np.arange(9).reshape(3,3) print a b=a*2 print a*2 c=np.hstack(a,b,a) #水平叠加 d=np.vstack(a,b)# 垂直叠加 print c,Hello,d axis=1垂直叠加 print np.concatenate(a,b),axis=1) #concatenate 功能数组叠加,axis=0 默认水平叠加, d=np.dstack(a,
6、b,a) #深度叠加,沿着第三个坐标轴(纵向)的方向叠加一摞数组。 print d aa=np.arange(2) bb=aa*2 print aa,bb #column_stack列式叠加,以列方式对一维数组进行堆叠,多维数组和hstack类似 print np.column_stack(aa,bb) #以列方式对一维数组进行堆叠 print np.column_stack(a,b) # 多维数组和 hstack类似 print np.hstack(a,b)=np.column_stack(a,b) #row_stack行式叠加,以行方式对一维数组进行堆叠,多维数组和vstack类似 pri
7、nt np.row_stack(aa,bb) print np.row_stack(a,b) print np.row_stack(a,b)=np.vstack(a,b) print FFFFFFFFFFFFFFFFFFF #数组拆分 a=np.arange(9).reshape(3,3) print a print type(np.vsplit(a,3),np.vsplit(a,3) # 纵向切分 print np.hsplit(a,3)# 横向切分 print 深向切分 print 切分前 a=np.arange(18).reshape(2,3,3) print a print 切分后 p
8、rint np.dsplit(a,3) print GGGGGGGGGGGGGGGG print数组的属性,不需要加() print a print a.ndim #数组的维度 print a.shape#数组的每一维度的大小 print a.dtype#数组中元素的数据类型,numpy要求数组元素类型一致 print a.size #数组中元素个数 print a.itemsize #返回数组中各个元素所占用的字节数 print a.itemsize*a.size #返回数组占用空间大小(字节为单位) b=np.arange(5) print b print a.T #转秩,与transpo
9、se。函数功能相同 print b.ndim b=np.array(1,2+2j) #复数用j表示,定义一个数组,包含两个元素 print b.real #获取数组的实部 print b.imag #获取数组的虚部 print b.dtype #复数数据类型自动变成复数类型 b=np.arange(4).reshape(2,2) f=b.flat print f1,3,2 #取列表中的某几个元素 for i in f: #对列表做循环 print i b.flat=7 #对数组整体赋值 print b b.flat2=3 print b #对数组某个元素赋值 b.flat2,3=2 print
10、 b print GGGGGGGGGGGGGGGGGGGGGGGGGGG print 数组的转换,tolist()方法 a=np.array(1+1j,0.3+0.8j) print a print a.dtype b=a.tolist() print b print type(b) #此时b已经不是numpy数组,不能再具有 dtype属性,查看类型 a=11 print type(a) #a.dtype b=np.array(1+1j,0.3+0.8j) c=b.astype(float) #将数组元素转换成指定类型 print c,b #转换完成虚部被舍弃 print HHHHHHHHH
11、HHHHHHHHHHHHHH print 创建数组的视图 #acopy=lena.copy() #print acopy Python 中 pandas: #coding=utf-8 import pandas as pd import numpy as np #Series obj=pd.Series(1,2,3,4) print obj obj=pd.Series(1,2,index=a,b) print obj data=pd.Series(0,1,2,3,index=1,2,3,4) print data print datadata1 print data*3 print data3
12、 print pd.notnull(a) #DataFrame data=state:beijin,shanghai,hangzhou,a:a,b,c print pd.DataFrame(data) print pd.DataFrame(data,columns=state,a,index=1,2,3) a=pd.DataFrame(data) print a.ix1 print a.T print a2:4 a=pd.Series(np.arange(4,8),index=a,b,c,d) print a print aaaaaa print a:4 print aaaaaa print
13、a:5 df仁pd.DataFrame(np.arange(1,13).reshape(3,4),columns=a,b,c,d,index=A,B,C) print df1 df2=pd.DataFrame(np.arange(1,10).reshape(3,3),columns=a,b,e) print df2 print df1.add(df2,fill_value=0) Python 中 matplotlib : 线型图: import matplotlib.pyplot as plt x=1,3,5 y=4,6,8 x1=3,4,6 y1=5,4,9 plt.plot(x, y, l
14、abel=First Line) plt.plot(x1, y1, label=Second Line) plt.xlabel(Plot Number) plt.ylabel(Important var) plt.title(lnteresting GraphnCheck it out) plt .l egend() plt.show() 在这里,我们绘制了我们已经看到的东西,但这次我们添加另一个参数label。这允许我们为线条指 定名称,我们以后可以在图例中显示它。 使用plt.xlabel和plt.ylabel,我们可以为这些相应的轴创建标签。 接下来,我们可以使用plt.title创建图
15、的标题,然后我们可以使用plt.legend()生成默认图例 条形图: import matplotlib.pyplot as plt plt.bar(1,3,5,7,9,5,2,7,8,2, label=Example one) plt.bar(2,4,6,8,10,8,6,2,5,6, label=Example two, color=g) plt .l egend() plt.xlabel(bar number) plt.ylabel(bar height) plt.title(Epic GraphnAnother Line! Whoa) plt.show() plt.bar为我们创建条
16、形图。如果你没有明确选择一种颜色,那么虽然做了多个图,所有的条看起来 会一样。 这让我们有机会使用一个新的Matplotlib自定义选项。你可以在任何类型的绘图中使用颜色,例如 g为绿色, b为蓝色,r为红色,y为黄色,k为黑色,w为白色,买等等。你还可以使用十六进制颜色代码, 如#191970。 直方图: 接下来,我们会讲解直方图。直方图非常像条形图,倾向于通过将区段组合在一起来显示分布。这 个例子可能是年龄的分组,或测试的分数。 我们并不是显示每一组的年龄,而是按照2025,2530等等来显示年龄。这里有一个例子: import matplotlib.pyplot as plt popul
17、ation_ages = 22,55,62,45,21,22,34,42,42,4,99,102,110,120,121,122,130,111,115,112,80,75,65,54,44,43,42,48 bins = 0,10,20,30,40,50,60,70,80,90,100,110,120,130 plt.hist(population_ages, bins, histtype=bar, rwidth=0.8) plt.xlabel(x) plt.ylabel(y) plt.title(lnteresting GraphnCheck it out) plt .l egend()
18、plt.show() 对于plt.hist,你首先需要放入所有的值,然后指定放入哪个桶或容器。在我们的例子中,我们绘制 了一堆年龄,并希望以10年的增量来显示它们。 我们将条形的宽度rwidth设为0.8,但是如果你想让条形变宽,或者变窄,你可以选择其他的宽 度。 散点图 import matplotlib.pyplot as plt x = 1,2,3,4,5,6,7,8 y = 5,2,4,2,1,4,5,2 plt.scatter(x,y, label=skitscat, color=k, s=25, marker=o) plt.xlabel(x) plt.ylabel(y) plt.t
19、itle(Interesting GraphnCheck it out) plt .l egend() plt.show() plt.scatter不仅允许我们绘制x和y,而且还可以让我们决定所使用的标记颜色color,大小s和类型 markero有一堆标记选项,请参阅 Matplotlib标记文档中的所有选项。 堆叠图: 在这篇Matplotlib数据可视化教程中,我们要介绍如何创建堆叠图。堆叠图用于显示部分对整 体随时间的关系。堆叠图基本上类似于饼图,只是随时间而变化。 让我们考虑一个情况,我们一天有24小时,我们想看看我们如何花费时间。我们将我们的活动分 为:睡觉,吃饭,工作和玩耍。 我
20、们假设我们要在5天的时间内跟踪它,因此我们的初始数据将如下所 import matplotlib.pyplot as plt days = 1,2,3,4,5 sleeping = 7,8,6,11,7 eating = 2,3,4,3,2 working = 7,8,7,2,2 playing = 8,5,7,8,13 plt.plot(,color=m, label=Sleeping, linewidth=5) plt.plot(,color=c, label=Eating, linewidth=5) plt.plot(,color=r, label=Working, linewidth=5) plt.plot(,color=k, label=Playing, linewidth=5) plt.stackplot(days, sleeping,eating,working,playing, colors=m,c,r,k) plt.xlabel(x) plt.ylabel(y) plt.title(lnteresting GraphnCheck it out) plt .l egend() plt.show() 我们在这里做的是画一些空行,给予它们符合我们的堆叠图的相同颜色,和正确标签。我们还使它 们线宽为5,使线条在图例中显得较宽。现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2019-2025年消防设施操作员之消防设备高级技能题库练习试卷B卷附答案
- 2025年度主管护师考试专项复习试题库50题及答案(四)
- 生物荧光知识培训课件
- 纪录片美丽的自然教学教案设计
- 工厂生产线产量进度表
- 解决方案推广计划
- 西游记唐僧取经之旅解读
- 企业内部信息安全技术保障服务合同
- 小红帽新编故事读后感
- 技术创新成果统计表
- 临时工雇佣合同范本2025年度
- (二调)武汉市2025届高中毕业生二月调研考试 地理试卷
- “艾梅乙”感染者消除医疗歧视制度-
- 2024-2025学年八年级地理下册第七章《南方地区》检测卷(人教版)
- 森林防火知识
- 2025年黑龙江林业职业技术学院单招职业适应性测试题库带答案
- 第二单元第1课《精彩瞬间》第2课时 课件-七年级美术下册(人教版2024)
- 2025年公共营养师三级理论试题及答案
- 煤矿防治水安全质量标准化评分表
- 2025电动自行车安全技术规范培训课件
- 小学语文常见的说明方法(四年级下册第二单元)
评论
0/150
提交评论