熱線電話:13121318867

登錄
首頁精彩閱讀如何用python快速優雅的批量修改Word文檔樣式?
如何用python快速優雅的批量修改Word文檔樣式?
2020-09-02
收藏

作者:陳熹 

來源:早起Python

大家好,又到了辦公自動化系列!之前講過很多基于Excel的數據及樣式調整案例,今天分享一個python操作Word的真實自動化需求實現過程:

「使用Python批量修改Word樣式」

主要將涉及

  • os模塊綜合應用
  • glob模塊綜合應用
  • docx模塊讀寫Word文檔及樣式修改

需求描述

手上現有若干份財務分析報告的Word文檔,如下:

每一份Word文檔中的內容如下:

為了方便后續審閱,需要將所有文檔中所有含有資金的語句標紅加粗,如圖所示

步驟分析和前置知識

為了解決這個需求簡單復習一下相關知識。Word文檔一般而言由文檔(document) - 段落(paragraph) - 文字塊(run) 三級結構組成:

從需求反饋中可以看出,本質上我們需要做的就是對所有含有資金的文字塊Run進行樣式調整

因此,本需求的邏輯如下:

1.創建一個空文件夾(用于存放修改后的財務報告,避免直接對原文件修改)

2.通過glob獲取目標文件夾下的所有Word路徑

3.利用docx模塊對每個Word文檔遍歷,并獲取包含特定詞的文字塊

4.對文字塊進行樣式修改

代碼實現

首先導入需要的庫并設置目標文件夾路徑

from docx import Document
from docx.shared import RGBColor, Pt, Cm
import os
import glob

# 此處更換創建文件夾的路徑
mkdir_path = r'C:\Users\xxx\new_dir'

# 此處更換所有文件所在的位置
file_path = r'C:\Users\xxx\'

os和glob我們都很熟悉,這里簡單介紹一下docx模塊 這是一個非標準庫,在命令行中我們需要輸入以下命令安裝:

pip install python-docx

尤其要注意安裝時候輸入的是python-docx,而實際調用時為docx

實例化具體的Word文檔代碼為:

from docx import Document
wordfile = Document(path)

如果不指定路徑則為創建新的Word文檔,這點跟操作Excel的openpyxl不太一樣,有機會再做介紹。

現在我們建立文件夾存放新生成的文件,首先判斷文件夾是否存在,不存在時再運行os.mkdir避免報錯

if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)

接著遍歷Word文檔,利用glob模塊的通配符,框架如下:

for file in glob.glob(file_path + '/*.docx'):
    pass

根據三級結構,一個文檔Document有一個或多個段落Paragragh,一個段落Paragraph有一個或多個文字塊Run,合起來代碼為:

for file in glob.glob(file_path + '/*.docx'):
    docx = Document(file)
    for paragraph in docx.paragraphs:
        for run in paragraph.runs:
            pass

最后我們針對特定詞修改樣式,遍歷到文字塊后就可以做判斷了

        ...
        for run in paragraph.runs:
            if '資金' in run.text:
                run.font.bold = True # 加粗
                run.font.color.rgb = RGBColor(255, 0, 255) # 設置字體顏色
        # 最后切記保存
        docx.save(mkdir_path + '/' + os.path.basename(file))

當然,除了修改字體顏色和加粗之外,還支持其他樣式的設置,以下列出常用的作為參考:

# 加粗
run.font.bold = True
# 斜體
run.font.italic = True
# 下劃線
run.font.underline = True
# 刪除線
run.font.strike = True
# 字號
run.font.size = Pt(20)
# 陰影
run.font.shadow = True
# 字體顏色
run.font.color.rgb = RGBColor(255, 0, 255)

至此,整個需求就順利結束了,附上完整代碼:

from docx import Document
from docx.shared import RGBColor, Pt, Cm
import os
import glob

mkdir_path = r'C:\xxx\new_dir)'
if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)

keyword = '資金'

file_path = r'C:\Users\xxx'

for file in glob.glob(file_path + '\*.docx'):
    docx = Document(file)
    for paragraph in docx.paragraphs:
        for run in paragraph.runs:
            if keyword in run.text:
                run.font.bold = True
                run.font.color.rgb = RGBColor(255, 0, 0)

    docx.save(mkdir_path + '/' + os.path.basename(file))

通過本文的Python自動化腳本制作過程,我們可以再次體會Python辦公自動化的強大!如果對自動化代碼和數據感興趣可以在后臺回復自動化獲取。

當然除了調整Word字體顏色,其他的大多數樣式調整都可以使用Python完成,也可以與Excel和PPT結合,這些就留給讀者自己開發。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢