
來源:早起Python
作者:劉早起
大家好,我是早起。
在之前的辦公自動化系列文章中,曾經介紹過很多將Excel指定字段提取到Word模版中指定位置的案例
從Excel到Word批量制作合同
在上述案例中,都要求有一個現成的Word模版才可以執行,那么如果現在沒有Word模版,要求針對Excel指定內容批量生成Word該如何實現?
本文就將基于一個真實的辦公案例進行講解如何提取Excel內容并創建Word,主要將涉及以下三個知識點
“openpyxl 讀取 Excel 文件python-docx 寫入 Word 文件python-docx 各類樣式的設計和調整”
你是公司的底層小蝦米,前段時間收集了公司各個部門的請假信息匯總表如下:
現在你需要根據表格中每個人的信息依次生成各自的請假條如下:
需求的特殊性在于沒有現成的模板,因此需要在代碼中同時完成模板的制作和文字、段落樣式設計。
比較復雜的文字版面更建議直接設計好模板,以及確定好程序識別位置的定位符,詳細內容可以參考之前的教程:批量生成合同
整個需求的實現邏輯很簡單,主要分為以下 2 步:
“
獲取 Excel 文件中每一行的信息,提取 5 個參數;結合獲取的參數設計請假條樣式并輸出
”
邏輯并不困難,但是復雜的地方在于用代碼輸出請假條的過程,包括加粗、字號、下劃線等等。
需求中的請假信息匯總表為 Leave.xlsx,已放鏈接供練習下載 首先讀取請假信息表,嘗試獲取除表頭外實際信息的 5 個參數:
from openpyxl import load_workbook
path = r'C:xxx' # 路徑為Excel 文件所在的位置,可按實際情況更改
workbook = load_workbook(path + r'Leave.xlsx')
sheet = workbook.active
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value)
n += 1
通過 for row in sheet.rows 和 for cell in row 就可以迭代 Excel 中有數據的每個單元格了。
循環體中加上對 n 的判斷是為了跳過表頭 如果讓輸出更加直觀可以稍微修改上面的代碼:
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value, end=', ')
print('')
n += 1
信息已經獲取到了,但我們也發現申請日期是 datetime 形式,因此我們需要利用 datetime 庫獲取其中的日期成分,也可以轉化為字符串后利用空格切片:
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value
date = str(row[4].value).split()[0]
print(name, department, reason, days, date)
n += 1
提取到信息后就可以在循環體內建立個“請假條函數”,即把每條記錄的 5 個變量傳入函數,在函數中生成完整請假條并保存,即修改成如下形式:
def request_for_leave(name, department, reason, days, date):
pass
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value date = str(row[4].value).split()[0]
request_for_leave(name, department, reason, days, date)
n += 1
生成請假條中,首先導入依賴的庫 python-docx 以及跟樣式設置有關的相應方法:
# 讀取 Word 文件 from docx import Document # 文件涉及段落樣式修改 from docx.enum.text
import WD_PARAGRAPH_ALIGNMENT # 文件涉及文字樣式修改:顏色修改、字號調整 from docx.shared
import RGBColor, Pt # 設置中文字體 from docx.oxml.ns import qn
接下來就是依次添加各部分的內容和樣式,因為全文的字體均為楷體,可以在函數體的最末尾一并修改。首先實例化文件后添加“請假條”:
def request_for_leave(name, department, reason, days, date): doc = Document()
heading_1 = '請 假 條' paragraph_1 = doc.add_heading(heading_1, level=1)
# 居中對齊 paragraph_1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# 標題要打,單獨修改較大字號 for run in paragraph_1.runs:
run.font.size = Pt(17)
如果對上面的代碼單獨輸出會發現標題顏色是藍色,這是以 .add_heading() 添加標題默認的顏色。
最后也可以統一修改 對于“尊敬的領導:”這一行基本同理,但不需要修改字號:
greeting_word = '尊敬的領導:' paragraph_2 = doc.add_paragraph(greeting_word)
接下來是核心請假條的正文了,從需求中的樣式上可以看出,整句話中有一些文字塊是固定的,包括 “本人” “、所在部門” “,由于” “需請假” “天?!?/span>,而幾個文字塊之間的信息是根據不同人的情況而不同,并且需要添加下劃線。
簡單的邏輯就是將參數對應的文字塊添加好下劃線之后,和固有不變的變量進行拼接,就可以形成完整的段落了:
word_1 = " 本人" word_2 = ",所在部門" word_3 = ",由于"
word_4 = ",需請假" word_5 = "天。" paragraph_3 = doc.add_paragraph()
paragraph_3.add_run(word_1)
paragraph_3.add_run(name).underline = True paragraph_3.add_run(word_2)
paragraph_3.add_run(department).underline = True paragraph_3.add_run(word_3)
paragraph_3.add_run(reason).underline = True paragraph_3.add_run(word_4)
paragraph_3.add_run(str(days)).underline = True paragraph_3.add_run(word_5)
# 設置下劃線 paragraph_3.paragraph_format.line_spacing = 1.5
代碼中 .underline = True 就是對參數對應的文字塊添加下劃線 接下來的申請人和日期填寫就和上面基本類似。
比較大的區別在于添加了一行新的命令 paragraph.alignment =
WD_PARAGRAPH_ALIGNMENT.RIGHT, 這行命令能夠將這兩個段落右對齊:
word_6 = '申請人:' paragraph_4 = doc.add_paragraph()
paragraph_4.add_run(word_6)
paragraph_4.add_run(name).underline = True
paragraph_4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
word_7 = '日期:' sign_date = "{}年{}月{}日".format(date.split('-')[0],
date.split('-')[1], date.split('-')[2])
paragraph_5 = doc.add_paragraph()
paragraph_5.add_run(word_7)
paragraph_5.add_run(sign_date).underline = True
paragraph_5.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
最后就是統一修改字體為楷體,中文字體修改比較麻煩,不像英文字體只需要指定如 run.font.name = 'Arial' 就可以,需要額外的幾行代碼。最后記得保存:
for paragraph in doc.paragraphs:
for run in paragraph.runs:
# 統一修改顏色 run.font.color.rgb = RGBColor(0, 0, 0)
run.font.name = '楷體' r = run._element.rPr.rFonts
r.set(qn('w:eastAsia'), '楷體')
doc.save(path + "{}-請假條.docx".format(name))
運行上述代碼即可針對每個人產生相應的請假條:
至此,我們就成功利用Python實現了開頭的需求,解放雙手。注意本案例同樣適用于邀請函、證明等各類文書的制作,大家可以舉一反三。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25