python讀取docx文件，就是如此簡單-創新互聯

中文編碼問題總是讓人頭疼(尤其是mac本),想要用 Python讀取word中的內容。用open()經常報錯,通過百度搜索+問身邊小伙伴發現了 Python有專門讀取.docx的模塊python_docx。本篇文章主要來解決一個讀取docx文件的基本操作。希望感興趣的小伙伴可以堅持看下去同時歡迎提出寶貴的意見讓我們一起進步！

創新互聯建站長期為近千家客戶提供的網站建設服務，團隊從業經驗10年，關注不同地域、不同群體，并針對不同對象提供差異化的產品和服務；打造開放共贏平臺，與合作伙伴共同營造健康的互聯網生態環境。為驛城企業提供專業的網站制作、成都網站設計，驛城網站改版等技術服務。擁有十年豐富建站經驗和眾多成功案例,為您定制開發。

01：問題拋出與引入

import docx

path = "C:\\Users\\qin\\Desktop\\1.docx"

file_object=open(path,'rb')

print(file_object.read())

#輸出結果如下所示：

b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00

(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一個很簡單的docx文件,打印出來的結果卻不是我們想要的。對此引入一個十分好用的docx模塊,下面就詳細介紹該模塊的一些基本操作。

02：安裝docx模塊

pip install python_docx

03：新建文檔對象

import docx

from docx import Document

# 新建文檔,并將其保存名為“test.docx”的文件

document = Document()

document.save('test.docx')

04：添加文檔內容

import docx

from docx import Document

from docx.shared import Inches

document = Document('C:\\Users\\qin\\Desktop\\1.docx')

document.add_heading('I like python', 0)#插入標題：0表示樣式為title標題

document.add_heading('一級標題', level=1)#插入1級標題

p = document.add_paragraph('Python是一種計算機程序設計語言 ')#插入段落

document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加圖片并指定寬度

table = document.add_table(rows=1, cols=3)  #添加一個表格，每行三列

hdr_cells = table.rows[0].cells  #獲取第一行的單元格列表對象

hdr_cells[0].text = 'ID'    #為每一個單元格賦值

hdr_cells[1].text = 'Name'

hdr_cells[2].text = 'Age'

new_cells = table.add_row().cells #為表格添加一行

new_cells[0].text = '1'

new_cells[1].text = 'Tom'

new_cells[2].text = '15'

document.add_page_break()   #添加分頁符

05：保存文檔內容

名字相同則將修改的文件內容保存; 名字不同則將修改的文件內容另存為。

import docx

from docx import Document

document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存

document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存為

06：讀取文本內容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)

for paragraph in document.paragraphs:

   print(paragraph.text)

07：讀取表格內容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)  # 讀入文件

tables = document.tables   # 獲取文件中的表格集

table = tables[0]  # 獲取文件中的第一個表格

for i in range(0, len(table.rows)):  # 從表格第一行開始循環讀取表格數據

   result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'

   # cell(i,0)表示第(i+1)行第1列數據,以此類推

   print(result)

想要知道docx模塊更多資料參考:https://python-docx.readthedocs.io/en/latest/

當前題目：python讀取docx文件，就是如此簡單-創新互聯
本文地址：http://m.newbst.com/article16/dcddgg.html

成都網站建設公司_創新互聯，為您提供App開發、網站收錄、標簽優化、App設計、微信公眾號、企業建站

聲明：本網站發布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網站立場，如需處理請聯系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經允許不得轉載，或轉載時需注明來源：創新互聯

猜你還喜歡下面的內容

免费观看又色又爽又黄的小说免费_美女福利视频国产片_亚洲欧美精品_美国一级大黄大色毛片