Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取_第1页
Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取_第2页
Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取_第3页
Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取_第4页
Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章

数据处理包PandasExcel数据文件读取TXT数据文件读取CSV数据文件读取Excel文件读取第3章

通过read_excel()函数读取Excel文件数据,可以读取指定的工作簿(sheet),也可以设置读取有无表头的数据表。path='一、车次上车人数统计表.xlsx';data=pd.read_excel(path);Excel文件读取第3章

读取文件中Sheet2里的数据data=pd.read_excel(path,'Sheet2')#读取sheet里面的数据Excel文件读取第3章

有时候数据表中没有设置字段,即无表头,读取格式如下:dta=pd.read_excel('dta.xlsx',header=None)#无表头TXT文件读取第3章

通过read_table()函数可以读取TXT文本数据。需要注意的是,TXT文本数据列之间会存在特殊字符作为分隔,常见的有Tab键、空格和逗号。同时还需注意有些文本数据文件是没有设置表头的。importpandasaspddta1=pd.read_table('txt1.txt',header=None)#分隔默认为Tab键,设置无表头。TXT文件读取第3章

dta2=pd.read_table('txt2.txt',sep='\s+')#分隔为空格,带表头TXT文件读取第3章dta3=pd.read_table('txt3.txt',sep=',',header=None)

#分隔为逗号,设置无表头CSV文件读取第3章CSV文件也是一类广泛使用的外部数据文件,对于一般的CSV数据文件可以通过read_csv()函数读取。importpandasaspdA=pd.read_csv('data.csv',sep=',');#逗号分隔CSV文件读取第3章CSV文件可以存储大规模的数据文件,比如单个数据文件大小可达数GB、数十GB,这时候可以采用分块的方式进行读取。importpandasaspdreader=pd.read_csv('data.csv',sep=',',chunksize=50000,usecols=[3,4,10])k=0forAinreader:k=k+1print('第'+str(k)+'次读取数据规模为:',len(A))执行结果如下:第1次读取数据规模为:50000第2次读取数据规模为:50000第3次读取数据规模为:33699CSV文件读取第3章对大规模的CSV文件进行数据探索,可以读取前N行进行分析,比如前1000行importpandasaspdA=pd.read_csv('data.csv',sep=',',nrows=1000)小结:通过pandas包中的函数,读取Excel、T

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论