版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python读写worddocx和docx2txt包示例,python,使用,实例简介doc是微软的专有的文件格式,docx是MicrosoftOffice2007之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,比doc文件所占用空间更小。docx格式的文件本质上是一个ZIP文件,所以其实也可以把.docx文件直接改成.zip,解压后,里面的word/document.xml包含了Word文档的大部分内容,图片文件则保存在word/media里面。docx包python-docx不支持.doc文件,间接解决方法是在代码里面先把doc转为.docxopython-docx,对象
2、,处理对象。模块会把word文档中的段落、文本、字体等看作?Document对象:一个word文档?Paragraph对象:word文档中的一个段落?Paragraph对象的text属性:段落的义本内容安装pipinstallpython-docx使用实例1:读fromdocximportDocumentdefreadDocx(fileName):doc=Document(fileName)# pythonUnicodeEncodeError:gbkcodeccantencodecharacterxefinposioutFile=open(a.+fileName+.txt,”wencoding
3、=utf-8)#forparaindoc.paragraphs:#print(para.txt)#每一段的编号、内容foriinrange(len(doc.paragraphs):outFile.write(str(i)+doc.paragraphsi.text+n)#表格tbs=doc.tablesfortbintbs:#行forrowintb.rows#列inrow.cells:.write(cell.text+t)forcelloutFile.write(n)#也可以用下面方法# text=# forpincell.paragraphs:#text+=p.text# print(text
4、)写fromdocximportDocumentfromdocx.sharedimportInchesdefcreateDocx():document=Document()#添加标题并设置级别,范围0-9,默认1document.add_heading(Title,0)p=document.add_paragraph(aplainparagraphlalalal)#在段落后面追加文本,并设置样式#直接追加哦outFilep.add_run(boldp.add_run(testp.add_run(italic.foriindocumentstr(i),level).bold=True).ital
5、ic=Truerange(10):.add_heading(heading,level=i)一document.add_paragraph(intensequotestyle=IntenseQuote)#添加带计数的list#添加图片(3,101,Spam),(7,422,Eggs),(4,631,Spam,spam,eggs,andspam)添加表格:一行二列表格样式参数可选:#NormalTable#TableGridShadingAccent6Accent6#添加list(原点)documentlist,style.add_paragraph=LisfBullet(firstitemin
6、unordered)documentlist,style.add_paragraph=LisfBullet(seconditeminunordered)documentlist,styledocumentlist,style.add_paragraph=ListNumber.add_paragraph=ListNumber(firstiteminordered)(seconditeminordered)documentwidth=Inchesrecords.add_picture(1.25=(test.PNG)#LightShading、LightShadingAccent1至Light#Li
7、ghtList、LightListAccent1至LightListAccent6#LightGrid、LightGridAccent1至LightGrid#太多了其它省略.table=document.add_table(rows=1,cols=3,style=LightShadingAccent1)#获取第一行的单元格列表hdr_cells=table.rows0.cells#下面三行设置上面第一行的三个单元格的文本值hdr_cells0.text=Qtyhdr_cells1.text=Idhdr_cells2.text=Descforqty,id,descinrecords#表格添加行,并返回行所在的单兀格列表row_cells=table.add_row().cellsrow_cells0.text=str(qty)row_cells1.text=idrow_cells2.text=descdocument.add_page_break()#保存.docx文档document.save(demo.docx)docx2txt包用它是因为python-docx读不到超链接的文字内容。而docx2txt一定能读到所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商铺分租租赁合同
- 新版石材采购合同书
- 家电购销合同模版
- 建筑工程合同策划
- 2024二手房买卖按揭贷款合同2篇
- 工程项目方协议模板合同范本标准版
- 年度建筑材料供应合同043篇
- 2024年度房地产买卖合同标的物及附属条件3篇
- 2024年度东莞市二手房买卖合同(标的:茶山镇世纪豪庭住宅)2篇
- 租房合同样板下载
- EBZ悬臂式掘进机设计计算书
- 一年级数学上册期末1120各数的认识专项练习题
- 花格子小牛(课堂PPT)
- 润滑油清洁度划分
- 《表观遗传学》课件.ppt
- 婚介登记表完整优秀版
- 压力与水的沸点的对应关系
- SMT员工绩效考核方案
- 保安服务劳务外包合同书范本
- 有机玻璃生产线项目可行性研究报告
- 产品ID设计需求单.doc
评论
0/150
提交评论