python docx库使用手册

合集下载

python docx 大纲编码

一、Python docx 大纲编码介绍1.1 Python docx 是什么Python docx 是一个用于创建和操作 Microsoft Word 文档的Python 库，由 Python 编写。

它允许用户使用 Python 代码创建和编辑 Word 文档，包括插入文本、表格、图像等操作。

1.2 大纲编码的概念大纲编码是指在 Word 文档中对文本进行结构化标记，以便于生成大纲、目录等功能。

Python docx 提供了大纲编码的功能，可以通过设置文本的级别、标题样式等参数实现文档的结构化标记。

二、Python docx 大纲编码的使用2.1 创建 Word 文档在使用 Python docx 进行大纲编码之前，首先需要创建一个Word 文档对象。

from docx import Documentdoc = Document()2.2 添加标题对于需要进行大纲编码的文本，首先需要将其设置为标题样式，以便于在生成大纲时进行识别。

title = doc.add_heading('Python docx 大纲编码', level=1) 2.3 添加正文内容在添加标题后，可以使用 add_paragraph 方法添加正文内容，并根据需要设置不同级别的标题样式。

content1 = doc.add_paragraph('Python docx 大纲编码是一种在 Word 文档中进行结构化标记的方法。

')content2 = doc.add_paragraph('通过设置标题样式和级别，可以实现对文档内容的结构化标记。

')2.4 保存文档在添加完标题和正文内容后，需要使用 save 方法将文档保存到指定路径。

doc.save('outline.docx')三、Python docx 大纲编码的应用场景3.1 自动生成目录通过对文档进行大纲编码，可以方便地生成文档的目录。

docxreadwrite 使用方法

docxreadwrite 使用方法# docxreadwrite 使用指南`docxreadwrite` 是一个流行的库，用于读取、修改和写入Microsoft Word `.docx` 文件。

这个强大的工具在处理文档自动化、批量更新或生成报告时特别有用。

下面将详细介绍如何使用`docxreadwrite`。

## 1.安装首先，确保你的环境中已经安装了`docxreadwrite`。

如果未安装，可以通过以下命令进行安装：```shellpip install docxreadwrite```## 2.基础操作### 2.1 打开和读取文档要打开一个`.docx` 文件，你可以这样操作：```pythonfrom docxreadwrite import Documentdoc = Document("example.docx")```### 2.2 获取文档内容你可以遍历文档中的段落和句子，如下所示：```pythonfor para in doc.paragraphs:print(para.text)```### 2.3 修改内容你可以通过定位到具体的段落或文本，进行修改：```pythondoc.paragraphs[0].text = "新的第一段内容"```### 2.4 添加内容插入新的段落和文本非常简单：```pythondoc.add_paragraph("这是一个新段落。

")```### 2.5 保存文档完成所有更改后，保存文档：```pythondoc.save("modified_example.docx")```## 3.高级操作### 3.1 添加样式为文本或段落添加样式：```pythonfrom docx.shared import Ptstyle = doc.styles["Normal"]style.font.size = Pt(18)```### 3.2 插入图片```pythondoc.add_picture("image.png", width=Pt(100), height=Pt(100))```### 3.3 插入表格```pythontable = doc.add_table(rows=2, cols=2)cell = table.cell(0, 1)cell.text = "示例文本"```## 4.实用技巧### 4.1 批量处理你可以编写脚本批量处理多个文档，例如，将特定关键词批量替换。

python3 document用法

在Python 3中，您可以使用docx模块来创建、修改和保存Microsoft Word文档。

以下是一些基本用法：
导入docx模块：
python
from docx import Document
创建一个新的文档对象：
python
document = Document()
添加标题：
python
document.add_heading('标题名称', level=1)
其中，level参数指定标题的级别，1表示一级标题，2表示二级标题，以此类推。

添加段落：
python
document.add_paragraph('段落内容')
保存文档：
python
document.save('文档名称.docx')
这将把文档保存为指定名称的.docx文件。

如果文件已经存在，它将被覆盖。

打开现有文档：
python
document = Document('现有文档名称.docx')
这将打开指定的.docx文件，并将其加载到document对象中。

然后，您可以使用上述方法对其进行修改和保存。

python处理word文档

python处理word⽂档python 处理 word1. 简介在web开发过程中，经常需要导出⼀些word⽂档，⽐如运营⽉报、进货单、收据等。

它们的特点是格式都是⼀致的，只是需要不同的数据进⾏填充docx 和 docxtpl 是⽐较常见的处理 word ⽂件的python库。

其中前者⽤于创建⼀个包含段落、图⽚、表格、页眉等元素⽂档，后者使⽤类似 jinja2 的⽅式从模板⽂档⽣成新的⽂档2. 安装pip install python-docxpip install docxtpl # docxtpl 库会依赖jinja23. 使⽤情景1：使⽤python-docx从⽆到有创建⼀个docx⽂档，很少这样做，⼏乎不⽤关注情景2：使⽤docxtpl库对已有的docx⽂档模板进⾏数据填充，极为常见处理docx模板⽂档在docx⽂档中直接使⽤jinja2语法，{{ var }}，即可将数据render进去循环是⾼级点的语法，可百度，并⽆特别难之处对应的主要python代码，⼤同⼩异，在py脚本中将数据彻底处理好，render仅做简单数据填充。

from docxtpl import DocxTemplatedoc = DocxTemplate("my_word_template.docx")context = {'company_name' : "World company"}doc.render(context)doc.save("generated_doc.docx")4. 结合python框架的⽰例代码Djangodef export_monthly_report(request, year, index):context = {} # 填充数据doc = DocxTemplate(app.root_path + '/templates/report_monthly.docx')target_filename = 'monthly_{}_{}.docx'.format(year, index)doc.render(context)file_stream = io.BytesIO()doc.save(file_stream)file_stream.seek(0)response = HttpResponse(file_stream.getvalue(), # use the stream's contentscontent_type="application/vnd.openxmlformats-officedocument.wordprocessingml.document",)response["Content-Disposition"] = 'attachment; filename = "{}"'.format(target_filename)response["Content-Encoding"] = "UTF-8"return responseflaskimport iofrom flask import send_filedef export_monthly_report(year, index):context = {} # 填充数据doc = DocxTemplate(app.root_path + '/templates/report_monthly.docx')target_filename = 'monthly_{}_{}.docx'.format(year, index)doc.render(context)file_stream = io.BytesIO()doc.save(file_stream)file_stream.seek(0)return send_file(file_stream, as_attachment=True, attachment_filename=target_filename)。

python-docx读取doc文件

python-docx读取doc文件一、python-docx读取docx文件1. 安装python-docx包pip install python-docx2. python-docx读取docx文件使用python-docx需要导入docx包import docx2. 读取docx文件段落和表格内容import docximport os.pathdocxFile = 'text.docx'doc = docx.Document(docxFile)for para in doc.paragraphs:print(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:print(cell.text)二、使用office word将doc转换为docx1. 安装pypiwin32在windows操作系统上利用office word将doc文件转换为docx 文件需要用到win32com包使用win32com包需要安装pypiwin32包pip install pypiwin322. doc转docximport os.pathfrom win32com.client import Dispatch, DispatchEximport docxdocPath = 'text.doc'# wordApp = DispatchEx('Word.Application')wordApp = Dispatch('Word.Application')# 设置word不显示wordApp.Visible = 0wordApp.DisplayAlerts = 0docxPath = os.path.splitext(docPath)[0] + '.docx'doc = wordApp.Documents.Open(docPath)doc.SaveAs(docxPath, 12, False, '', True, '', False, False, False, False)doc.Close()wordApp.Quit()3. python-docx读取docx问题python-docx读取由office word转换doc得到的docx文件时，会导致部分内容得不到例如由office word转换doc得到的docx文件中包含如下一段文字使用python-docx读取的到的信息为日期：2012年，其中缺少了半段文字暂未不知其原因三、libreoffice将doc转docx1. libreoffice使用libreoffice将doc文件转换为docx文件使用如下代码libreoffice --handless --convert-to docx [file] [--outdir] [dirPath]其中docx指定转换后的文件类型file表示doc文件的路径（包含文件名）参数--outdir指定输出docx文件的路径（选填）dirPath表示输出文件路径例如libreoffice --handless --convert-to docx text.doc --outdir ./ libreoffice --handless --convert-to docx text.doc2. 问题使用libreoffice将doc转换为docx可以避免第二部分第三节中描述的问题。

python-docxtemplate操作word文档

python-docxtemplate操作word⽂档
Python操作word⽂档。

可以⽤python docx来new⼀个⽂档，⾃动排版等。

也可以⽤python-docx template来修改模板。

本⽂讲python-docx template来操作。

先上效果图。

⼀阵操作，就可以⽣成这个表格。

代码截图
python-docx template ⽂档链接
github上的⽰例 github Demo
很好的是：1. 保留原样式； 2. 替换⽅便，类似于所谓的jinja2模板引擎。

3. ⽀持中⽂！字体、字号，应有尽有！
以后⼯作⽇志、⽇报、报告、协议、合同…，不⽤愁了…
超链接：jinja
链接：中⽂版的jinja⽂档链接
注意
1. ⽣成表格的时候，内容太多，分页以后希望继续有表头，要在原来的word⽂档中，对表格的标题设置重复标题⾏。

布局--重复标题⾏
2. ⽣成表格，如果列宽不是想象的样⼦，尤其把模板写成这样的时候。

要确保这些是⼀根线。

最好的办法是，插⼊⼀个N*M的表格，然后再⽤橡⽪擦，或者合并单元格。

3. 跨⾏、跨列，要指定⾏数或列数。

————————————————
版权声明：本⽂为CSDN博主「qcyfred」的原创⽂章，遵循CC 4.0 BY-SA版权协议，转载请附上原⽂出处链接及本声明。

原⽂链接：https:///qcyfred/article/details/79925099。

python如何编程word文档？有哪些库可以直接使用？

python如何编程word⽂档？有哪些库可以直接使⽤？这⾥介绍⼀个库—python-docx，专门⽤于python读写word⽂档，使⽤⽅便、快捷，下⾯我简单介绍⼀下这个库的安装和使⽤，实验环境win10 python3.6 pycharm5.0，主要内容如下：1.安装python-docx，这个直接在cmd窗⼝输⼊命令“pip install python-docx”就⾏，如下：2.安装完成后，我们就可以进⾏简单的测试了，这⾥我分别就读取word⽂档和写⼊word⽂档做了简单介绍，主要代码及截图如下：读取word⽂档，这⾥以读取⽂档中的段落⽂本和表格数据为例，⽰例⽂档如下：对应读取代码如下，很简单，分别获取所有段落⽂本和表格数据，然后循环打印就⾏，readWord函数输⼊参数为需要读取的word⽂档：程序运⾏截图如下，已经成功获取到word⽂档的内容：写⼊word⽂档，这个也很简单，构造相应数据结构，然后直接写⼊word⽂档就⾏，这⾥以添加标题、段落、图⽚、引⽤、表格，设置字体、有序列表和⽆序列表为例，主要测试代码如下：程序运⾏截图如下，已经成功创建并⽣成word⽂档：⾄此，我们就完成了利⽤python来编程word⽂档。

总的来说，整个过程不难，思路不难，代码也不多，很好理解，只要你有⼀定的python基础，熟悉⼀下相关⽰例和代码，多练习⼀下，很快就能掌握的，python-docx官⽹也提供了⾮常详细的使⽤⽂档，⾮常适合初学者学习，介绍的很全⾯，可以参考⼀下https://python-docx.readthedocs.io/en/latest/index.html，⽹上也有相关教程和资料，感兴趣的话，可以搜⼀下，希望以上分享的内容能对你有所帮助吧，也欢迎⼤家评论、留⾔。

206.python-docx操作word

206.python-docx操作word 看代码import datetimefrom pathlib import Pathfrom docx import Documentfrom docx.oxml import OxmlElement, nsfrom docx.shared import Inches, Pt, Cm, Mm, RGBColorfrom docx.enum.text import WD_ALIGN_PARAGRAPH, WD_TAB_ALIGNMENTfrom docx.text.font import Fontfrom docx.oxml.ns import qnBASE_DIR = Path(__file__).resolve().parent.parent# 对其⽅式WD_ALIGN = {"center": WD_ALIGN_PARAGRAPH.CENTER,"left": WD_ALIGN_PARAGRAPH.LEFT,"right": WD_ALIGN_PARAGRAPH.RIGHT,"justify": WD_ALIGN_PARAGRAPH.JUSTIFY,# "distribute": WD_ALIGN_PARAGRAPH.DISTRIBUTE, # 分散对齐, 占满整⾏# "justify_med": WD_ALIGN_PARAGRAPH.JUSTIFY_MED, # 类似于左对齐# "justify_hi": WD_ALIGN_PARAGRAPH.JUSTIFY_HI, # 类似于左对齐# "justify_low": WD_ALIGN_PARAGRAPH.JUSTIFY_LOW, # 类似于左对齐# "thal_justify": WD_ALIGN_PARAGRAPH.THAI_JUSTIFY, # 类似于左对齐}class Report:"""⼯具类"""def __init__(self):self.doc = Nonedef init_doc(self, font_name):"""直接初始化默认的正⽂字体和⼤⼩https:///weixin_42763696/article/details/105492135https:///qq_40272386/article/details/114867630"""doc = Document()doc.styles['Normal'] = font_namedoc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), font_name)doc.styles['Normal'].font.size = Pt(12)doc.add_picture('{}/images/0001.jpg'.format(BASE_DIR), width=Inches(1.25)) # 1.25间距插⼊图⽚ self.doc = docdef init_header(self, text):"""添加页眉设置https:///s?id=1665454009794833226 很详细的页眉页脚设置"""section = self.doc.sections[0]header = section.headerp = header.paragraphs[0]run = p.add_run(text) # 这个⽂字其实应该抽出去但是我懒了font = run.fontfont.size = Pt(10.5)run.font.underline = True # 添加下划线def create_element(self, name):return OxmlElement(name)def create_attribute(self, element, name, value):element.set(ns.qn(name), value)def add_page_number(self):"""添加页码"""p = self.doc.sections[0].footer.paragraphs[0]run = p.add_run()fldChar1 = self.create_element('w:fldChar')self.create_attribute(fldChar1, 'w:fldCharType', 'begin')instrText = self.create_element('w:instrText')self.create_attribute(instrText, 'xml:space', 'preserve')instrText.text = "PAGE"fldChar2 = self.create_element('w:fldChar')self.create_attribute(fldChar2, 'w:fldCharType', 'end')run._r.append(fldChar1)run._r.append(instrText)run._r.append(fldChar2)font = run.fontfont.size = Pt(10.5)p.alignment = WD_ALIGN.get("center")def add_paragraph(self, text, font_name="⿊体", size_num=12, bold=False, alignment=None, line_spacing=1.5, style=None):"""定义段落格式"""p = self.doc.add_paragraph(style=style)run = p.add_run(text)run.font.color.rgb = RGBColor(0, 0, 0)if alignment:p.alignment = WD_ALIGN.get(alignment)font = run.font = font_namerun.element.rPr.rFonts.set(qn("w:eastAsia"), font_name)font.size = Pt(size_num)run.bold = boldpformat = p.paragraph_formatpformat.line_spacing = line_spacing # ⾏间距# https:///p/ceea5ade0cda# https:///star565/article/details/103411328# https:///ibiao/article/details/78595295 table.style# https:///p/8d8a75a50190 段落格式设置def add_table(self, data, aufofix=True, style="Table Grid", col_width=None, vertical_alignment=None):# 注意data中的数据和t_row, t_col = len(data), len(data[0]), 必须对应, 否则列宽可能失败(# 就算我最后⼀⾏不写任何东西都要⽤["", "", "", "", ""]填充)t_row, t_col = len(data), len(data[0])table = self.doc.add_table(rows=t_row, cols=t_col, style=style) # 添加⼀个表格table.autofit = aufofixfor i in range(t_row):# table.rows[1].height = Cm(2) # 可以通过索引指定⾏⾼for j in range(t_col):table.cell(i, j).text = data[i][j]# 但是列宽必须每个cell单独设置, 否则设置不成功, 同时table.autofit = False(是否开启⾃动调整列宽功能) if col_width:table.cell(i, j).width = Cm(col_width.get(j, 0))if vertical_alignment:table.cell(i, j).vertical_alignment = vertical_alignmentself.add_paragraph("\n")def add_page_break(self):self.doc.add_page_break()def save(self, path):self.doc.save(path)class AgileReport:"""每个报告都不⼀样可以改造成继承也可以直接调⽤调⽤"""def __init__(self, report: Report):self.report = reportdef part1(self, version, creator):"""创建报告前部固定位置信息"""self.report.add_paragraph("\n" * 2)text = "{}测试报告".format(version)self.report.add_paragraph(text, font_name="⿊体", alignment="center", size_num=24, bold=True)texts = ["⽂件编号：XXXXXXXXXXX", "版本号： A", "受控状态：受控", "密级：内部公开"]for text in texts:self.report.add_paragraph(" " * 20 + text, font_name="⿊体", size_num=14, alignment="left")self.report.doc.add_paragraph("\n" * 8)text = "XXXXXX有限公司"self.report.add_paragraph(text, font_name="⿊体", alignment="center", size_num=16, bold=True)self.report.add_page_break()self.report.add_paragraph("⽂档修订记录", font_name="⿊体", alignment="center", size_num=14, bold=True)time1 = datetime.datetime.now().strftime("%Y-%m-%d")data = [["修订号", "⽇期", "内容", "作者", "审核"],["1", time1, "创建", creator, ""],["", "", "", "", ""]] # table填充的数据col_width = {0: 3, 1: 3, 2: 3, 3: 3, 4: 3.6} # 经过⼀次次试验发现, word默认宽15.6cm (当然你也可以超过这个长度, 可能会使得表格看起来怪异) vertical_alignment = WD_TAB_ALIGNMENT.CENTERself.report.add_table(data, col_width=col_width, vertical_alignment=vertical_alignment)self.report.add_page_break()def part2(self, product, project):# 发现其实标题也是段落, 只不过加了个style⽽已, 呢就直接统⼀掉self.report.add_paragraph("1 测试范围", size_num=22, bold=True, style="Heading 1")self.report.add_paragraph("1.1 测试产品信息", size_num=16, bold=True, style="Heading 2")self.report.add_paragraph("产品名称：{}".format(product))self.report.add_paragraph("版本信息：{}".format(project))self.report.add_paragraph("1.2 测试内容", size_num=16, bold=True, style="Heading 2")self.report.add_paragraph("《XXXXXX产品检测规范.docx》")self.report.add_paragraph("2 测试环境", size_num=22, bold=True, style="Heading 1")data = [["设备类型", "操作系统", "说明"], ["Linux", "CentOS release 6.10", ""]] # table填充的数据col_width = {0: 5, 1: 5, 2: 5, 3: 1, 4: 1} # 列宽vertical_alignment = WD_TAB_ALIGNMENT.CENTERself.report.add_table(data, col_width=col_width, vertical_alignment=vertical_alignment)self.report.add_paragraph("3 测试执⾏", size_num=22, bold=True, style="Heading 1")def part_change(self, data):"""这⼀部分信息变动⽐较⼤data = {任务名称: [优先级1: [数据列表], 优先级1: [数据列表]], 任务名称: [优先级1: [数据列表], 优先级1: [数据列表]]} """header = ["序号", "⽤例标题", "前置条件", "测试步骤", "预期结果", "测试结果", "备注"]task_idx = 1for task_key in data:self.report.add_paragraph("3.{} {}".format(task_idx, task_key), size_num=16, bold=True, style="Heading 2")pri_idx = 1for pri_data in data[task_key]:for pri_key in pri_data:self.report.add_paragraph("3.{}.{} {}".format(task_idx, pri_idx, pri_key), size_num=16, bold=True)col_width = {0: 1.2, 1: 2.1, 2: 2.1, 3: 6, 4: 2.1, 5: 2.1, 6: 1.4} # 列宽vertical_alignment = WD_TAB_ALIGNMENT.CENTERpri_data = [header] + pri_data[pri_key]self.report.add_table(pri_data, aufofix=False, col_width=col_width,vertical_alignment=vertical_alignment)pri_idx += 1task_idx += 1def part3(self, path):"""报告后半部分固定信息"""self.report.add_paragraph("4 测试结果统计", size_num=22, bold=True, style="Heading 1")self.report.add_paragraph("5 测试结论", size_num=22, bold=True, style='Heading 1')self.report.save(path)def create_report(self, pjv: list, data: dict, path: str, creator: str):# 真实报告的步骤可以随便加self.part1(pjv[-1], creator)product, project = pjv[0], pjv[1]self.part2(product, project)# table填充的数据self.part_change(data)self.part3(path)if __name__ == '__main__':report = Report()report.init_doc('微软雅⿊')report.init_header("XXXXXX\t\t测试报告")report.add_page_number()real_report = AgileReport(report)pjv = []data = {}path = r"C:\Users\yzt\Desktop\test1.docx"real_report.create_report(pjv, data, path, "root")总结:这个⼯具包底层是xml组成的, ⼀些功能没有实现⽐如⽬录, 希望有⼤佬可以实现, 菜鸡只能⽤⽤。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

python docx库使用手册
Python-docx是一个用于创建和修改Microsoft Word文档的Python库。

它允许你使用Python代码生成、编辑和保存Word文档，包括添加文本、样式、表格、图像和其他元素。

以下是Python-docx库的一些常用功能和用法：
1. 安装Python-docx库
使用pip命令安装Python-docx库：
```
pip install python-docx
```
2. 导入库
在Python脚本中导入Python-docx库：
```python
import docx
```
3. 创建一个新的Word文档
```python
doc = docx.Document()
```
4. 添加文本
```python
doc.add_paragraph('Hello, World!') ```
5. 保存文档
```python
doc.save('document.docx')
```
6. 打开现有的Word文档
```python
doc = docx.Document('document.docx') ```
7. 获取文档内容
```python
for paragraph in doc.paragraphs:
print(paragraph.text)
```
8. 添加样式
```python
from docx.enum.text import
WD_PARAGRAPH_ALIGNMENT
paragraph = doc.add_paragraph('Hello, World!') paragraph.alignment =
WD_PARAGRAPH_ALIGNMENT.CENTER
```
9. 添加表格
```python
table = doc.add_table(rows=3, cols=3)
cells = table.cell(0, 0).text = 'Cell 1'
```
10. 添加图片
```python
doc.add_picture('image.jpg',
width=docx.shared.Inches(2),
height=docx.shared.Inches(2))
```
以上是Python-docx库的一些基本用法，你可以根据自己的需求进一步探索更多功能。

详细的文档和示例可以在Python-docx的官方网站上找到：https://python-docx.readthedocs.io/。