python操作excel教学教材_第1页
python操作excel教学教材_第2页
python操作excel教学教材_第3页
python操作excel教学教材_第4页
python操作excel教学教材_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Good is good, but better carries it.精益求精,善益求善。python操作excel-Youarehere:HYPERLINKHomeHYPERLINK/articles/category/cso查看计算机中的全部文章计算机HYPERLINK/articles/category/cs/programmingo查看编程中的全部文章编程Python操作ExcelHYPERLINK/articles/python-excel-lib.htmloPermalinktoPython操作ExcelPython操作ExcelHYPERLINK/articles/python

2、-excel-lib.htmlo11:41上午2012-09-01老婆单位有时候有一些很大的Excel统计报表需要处理,其中最恶心的是跨表的JOIN查询。他们通常采取的做法是,把多个Excel工作簿合成一个工作簿的多个表格,然后再跑函数(VLOOKUP之类)去查。因为用的函数效率很低,在CPU打满的情况下还要跑几个小时。然后我就看不过去了,我也不懂Excel,不知道如何优化,但我想用Python+SQLite总归是能够实现的。于是就尝试了一把,效果还不错,一分钟以内完成统计很轻松,其中大部分时间主要花在读Excel内容上。1.Python操作Excel的函数库我主要尝试了3种读写Excel的方

3、法:1HYPERLINK/xlrd,xlwt,xlutils:这三个库的好处是不需要其它支持,在任何操作系统上都可以使用。xlrd可以读取.xls,.xlsx文件,非常好用;但因为xlwt不能直接修改Excel文档,必须得复制一份然后另存为其它文件,而且据说写复杂格式的Excel文件会出现问题,所以我没有选它来写Excel文件。2HYPERLINK/openpyxl/openpyxl:这个库也是不需要其它支持的,而且据说对Office2007格式支持得更好。遗憾地是,我经过测试,发现它加载Excel文件的效率比xlrd慢3倍以上,内存使用在10倍以上,于是就放弃了。3HYPERLINK/%7E

4、skippy/win32/Downloads.htmlwin32com:PythonWin32扩展,这个库需要运行环境为Windows+Office对应版本。由于PythonWin32扩展只是把COM接口包装了一下,可以视为与VBA完全相同,不会有读写格式上的问题。尝试了一下用win32com读取Excel文件,效率还是比xlrd慢一些。由于读取效率上xlrdwin32comopenpyxl,所以我自然选择了xlrd用来读取统计报表;而最终输出的报表格式较复杂,所以选择了win32com直接操作Excel文件。2.Python里的关系型数据库HYPERLINK/SQLite是一个非常轻量级的关

5、系型数据库,很多语言和平台都内置SQLite支持,也是iOS和Android上的默认数据库。Python的标准库里也包含了HYPERLINK/library/sqlite3.htmlsqlite3库,用起来非常方便。3.用xlrd读取Excel并插入数据库样例如果数据量不大,直接用Python内部数据结构如dict,list就够了。但如果读取的几张表数据量都较大,增加个将数据插入数据库的预处理过程就有很大好处。一是避免每次调试都要进行耗时较长的Excel文件载入过程;二是能充分利用数据库的索引和SQL语句强大功能进行快速数据分析。#!/usr/bin/python#-*-coding:gbk-

6、*-importxlrdimportsqlite3#打开数据库文件device_city_db=sqlite3.connect(device_city.db)cursor=device_city_db.cursor()#建表cursor.execute(DROPTABLEIFEXISTSdevice_city)cursor.execute(CREATETABLEdevice_city(device_idchar(16)PRIMARYKEY,cityvarchar(16)#打开device相关输入Excel文件device_workbook=xlrd.open_workbook(输入.xlsx)

7、device_sheet=device_workbook.sheet_by_name(设备表)#逐行读取device-城市映射文件,并将指定的列插入数据库forrowinrange(1,device_sheet.nrows):device_id=device_sheet.cell(row,6).valueiflen(device_id)16:device_id=device_id0:16iflen(device_id)=0:continuecity=device_sheet.cell(row,10).value#避免插入重复记录cursor.execute(SELECT*FROMdevice_

8、cityWHEREdevice_id=?,(device_id,)res=cursor.fetchone()ifres=None:cursor.execute(INSERTINTOdevice_city(device_id,city)VALUES(?,?),(device_id,city)else:ifres1!=city:print%s,%s,%s,%s%(device_id,city,res0,res1)device_city_mit()4.将结果写入Excel文件样例使用win32com写入Excel的时候要注意,一定要记得退出Excel,否则下次运行会出错。这需要增加异常处理语句,我这

9、里偷了个懒,出了异常后要手动杀死任务管理器中的excel进程。至于win32com中类的接口,可以从HYPERLINK/en-us/library/office/bb149081%28v=office.12%29MSDN网站查阅。importwin32com.clientaswin32importosexcel=win32.gencache.EnsureDispatch(Excel.Application)excel.Visible=False#貌似这里只能接受全路径workbook=excel.Workbooks.Open(os.path.join(os.getcwd(),输出.xlsx)m

10、onth_sheet=workbook.Worksheets(1)#计算文件中实际有内容的行数nrows=month_sheet.Range(A65536).End(win32.constants.xlUp).Row#操作Excel单元格的值forrowinrange(5,nrows-4):month_sheet.Cells(row,1).Value+=something#保存工作簿workbook.Save()#退出Excelexcel.Application.Quit()HYPERLINK/lhj588/archive/2012/01/06/2314181.htmlpython操作Exce

11、l读写-使用xlrd一、安装xlrd模块到python官网下载HYPERLINK/pypi/xlrd/pypi/xlrd模块安装,前提是已经安装了python环境。二、使用介绍1、导入模块importxlrd2、打开Excel文件读取数据data=xlrd.open_workbook(excelFile.xls)3、使用技巧获取一个工作表table=data.sheets()0#通过索引顺序获取table=data.sheet_by_index(0)#通过索引顺序获取table=data.sheet_by_name(uSheet1)#通过名称获取获取整行和整列的值(数组)table.row_v

12、alues(i)table.col_values(i)获取行数和列数nrows=table.nrowsncols=table.ncols循环行列表数据foriinrange(nrows):printtable.row_values(i)单元格cell_A1=table.cell(0,0).valuecell_C4=table.cell(2,3).value使用行列索引cell_A1=table.row(0)0.valuecell_A2=table.col(1)0.value简单的写入row=0col=0#类型0empty,1string,2number,3date,4boolean,5erro

13、rctype=1value=单元格的值xf=0#扩展的格式化table.put_cell(row,col,ctype,value,xf)table.cell(0,0)#单元格的值table.cell(0,0).value#单元格的值三、Demo代码Demo代码其实很简单,就是读取Excel数据。1#-*-coding:utf-8-*-2importxdrlib,sys3importxlrd4defopen_excel(file=file.xls):5try:6data=xlrd.open_workbook(file)7returndata8exceptException,e:9printstr

14、(e)10#根据索引获取Excel表格中的数据参数:file:Excel文件路径colnameindex:表头列名所在行的所以,by_index:表的索引11defexcel_table_byindex(file=file.xls,colnameindex=0,by_index=0):12data=open_excel(file)13table=data.sheets()by_index14nrows=table.nrows#行数15ncols=table.ncols#列数16colnames=table.row_values(colnameindex)#某一行数据17list=18forro

15、wnuminrange(1,nrows):1920row=table.row_values(rownum)21ifrow:22app=23foriinrange(len(colnames):24appcolnamesi=rowi25list.append(app)26returnlist2728#根据名称获取Excel表格中的数据参数:file:Excel文件路径colnameindex:表头列名所在行的所以,by_name:Sheet1名称29defexcel_table_byname(file=file.xls,colnameindex=0,by_name=uSheet1):30data=open_excel(file)31table=data.sheet_by_name(by_name)32nrows=table.nrows#行数33colnames=table.row_values(colnameindex)#某一行数据34list=35forrownuminrange(1,nrows):36row=table.row_values(rownum)37

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论