这里批量处理word文档的操作主要是通过python-docx非标准库实现的,通过定位到文档对象、再到段落、最后到一行文本从而完成针对文字对象的处理。

file

【阅读全文】

使用pip的方式安装python-docx

pip install python-docx

将实现过程中需要的模块导入进来

from docx import Document  # 文档处理对象

from docx.shared import RGBColor, Pt, Cm  # 文本样式处理

import os  # 应用/文件处理

import glob  # 文件处理

定义需要处理的文件路径及生成的目标文件的路径

source_file = 'C:/source'  # 来源文件路径

target_file = 'C:/target'  # 目标文件路径

将需要批量处理样式的word文档放到source目录下面,我这里准备了一个文档作为演示处理。

file

下面是处理文本样式的代码块实现部分。

for current_file in glob.glob(source_file + '/*.docx'):  # 遍历word文档文件

    word_obj = Document(current_file)  # 初始化word对象

    for para in word_obj.paragraphs:  # 遍历当前文档段落

        for run in para.runs:  # 遍历当前段落的文本块

            if 'Python' in run.text: # 判断当前文本块是否包含Python字符串

                run.font.underline = True  # 加上下划线

                run.font.color.rgb = RGBColor(255, 0, 0)  # 设置字体颜色为红色

    word_obj.save(target_file + '/' + os.path.basename(current_file))

处理完成的效果如下:

file

执行完上述代码块就可以实现我们想要的效果:批量设置word文档样式。

最后,再补充几个工具的使用方式,设置字体颜色时可以参考下面的颜色对照表。

颜色对照表地址:

https://tool.oschina.net/commons?type=3

file

其他字体样式的设置参考下面的代码块

'''
# 加粗
font.bold = True
# 斜体
font.italic = True
# 下划线
font.underline = True
# 删除线
font.strike = True
# 字号
font.size = Pt(20)
# 阴影
font.shadow = True
'''

使用时,直接在文本块中调用即可。在上面的文本处理中我们使用的是加下划线设置。

run.font.underline = True  # 加上下划线

比如:若是需要添加阴影则直接在当前对应的文本块中进行类似的处理。

run.font.shadow = True

最后,需要注意的一点是在执行处理时不要将word文档使用wps或其他工具打开,否则会出现找不到文件的报错信息。

file

【往期精选】

python 如何在多层循环中使用break/continue!

用python为心爱的人制作520照片墙,已成功做出效果图!

两个库搞定python中引用javascript代码块/文件...

python实现excel数据与mysql数据库互通有无!

python 实现超快窗口截图,自动获取当前活动窗口并展示截图...


Python集中营
34 声望10 粉丝