作者:陈熹
来源:早起Python
大家好,又到了办公自动化系列!之前讲过很多基于Excel的数据及样式调整案例,今天分享一个python操作Word的真实自动化需求实现过程:
「使用Python批量修改Word样式」
主要将涉及
需求描述
手上现有若干份财务分析报告的Word文档,如下:
每一份Word文档中的内容如下:
为了方便后续审阅,需要将所有文档中所有含有资金的语句标红加粗,如图所示
步骤分析和前置知识
为了解决这个需求简单复习一下相关知识。Word文档一般而言由文档(document) - 段落(paragraph) - 文字块(run) 三级结构组成:
从需求反馈中可以看出,本质上我们需要做的就是对所有含有资金的文字块Run进行样式调整
因此,本需求的逻辑如下:
1.创建一个空文件夹(用于存放修改后的财务报告,避免直接对原文件修改)
2.通过glob获取目标文件夹下的所有Word路径
3.利用docx模块对每个Word文档遍历,并获取包含特定词的文字块
4.对文字块进行样式修改
代码实现
首先导入需要的库并设置目标文件夹路径
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob # 此处更换创建文件夹的路径 mkdir_path = r'C:\Users\xxx\new_dir' # 此处更换所有文件所在的位置 file_path = r'C:\Users\xxx\'
os和glob我们都很熟悉,这里简单介绍一下docx模块 这是一个非标准库,在命令行中我们需要输入以下命令安装:
pip install python-docx
尤其要注意安装时候输入的是python-docx,而实际调用时为docx
实例化具体的Word文档代码为:
from docx import Document wordfile = Document(path)
如果不指定路径则为创建新的Word文档,这点跟操作Excel的openpyxl不太一样,有机会再做介绍。
现在我们建立文件夹存放新生成的文件,首先判断文件夹是否存在,不存在时再运行os.mkdir避免报错
if not os.path.exists(mkdir_path): os.mkdir(mkdir_path)
接着遍历Word文档,利用glob模块的通配符,框架如下:
for file in glob.glob(file_path + '/*.docx'): pass
根据三级结构,一个文档Document有一个或多个段落Paragragh,一个段落Paragraph有一个或多个文字块Run,合起来代码为:
for file in glob.glob(file_path + '/*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: pass
最后我们针对特定词修改样式,遍历到文字块后就可以做判断了
... for run in paragraph.runs: if '资金' in run.text: run.font.bold = True # 加粗 run.font.color.rgb = RGBColor(255, 0, 255) # 设置字体颜色 # 最后切记保存 docx.save(mkdir_path + '/' + os.path.basename(file))
当然,除了修改字体颜色和加粗之外,还支持其他样式的设置,以下列出常用的作为参考:
# 加粗 run.font.bold = True # 斜体 run.font.italic = True # 下划线 run.font.underline = True # 删除线 run.font.strike = True # 字号 run.font.size = Pt(20) # 阴影 run.font.shadow = True # 字体颜色 run.font.color.rgb = RGBColor(255, 0, 255)
至此,整个需求就顺利结束了,附上完整代码:
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob mkdir_path = r'C:\xxx\new_dir)' if not os.path.exists(mkdir_path): os.mkdir(mkdir_path) keyword = '资金' file_path = r'C:\Users\xxx' for file in glob.glob(file_path + '\*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: if keyword in run.text: run.font.bold = True run.font.color.rgb = RGBColor(255, 0, 0) docx.save(mkdir_path + '/' + os.path.basename(file))
通过本文的Python自动化脚本制作过程,我们可以再次体会Python办公自动化的强大!如果对自动化代码和数据感兴趣可以在后台回复自动化获取。
当然除了调整Word字体颜色,其他的大多数样式调整都可以使用Python完成,也可以与Excel和PPT结合,这些就留给读者自己开发。
数据分析咨询请扫描二维码
在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16