chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分享一款批量將PDF文件轉(zhuǎn)換為Word的神器

工程師鄧生 ? 來(lái)源:Python愛(ài)好者集中營(yíng) ? 作者:欣一 ? 2022-09-01 17:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無(wú)論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問(wèn)題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,也就是說(shuō)從只讀轉(zhuǎn)換成可編輯的格式。網(wǎng)上絕大多數(shù)的工具也都是收費(fèi)的,今天小編就給大家制作了一款批量將PDF文件轉(zhuǎn)換為Word的神器,使用起來(lái)也是相當(dāng)?shù)姆奖恪?br />
實(shí)現(xiàn)效果

我們首先來(lái)看一下出來(lái)的效果,如下圖所示

6027737a-29d6-11ed-ba43-dac502259ad0.gif



618fe468-29d6-11ed-ba43-dac502259ad0.png

61c0cd08-29d6-11ed-ba43-dac502259ad0.png

環(huán)境準(zhǔn)備

用到的模塊叫做pdf2docx,我們通過(guò)pip命令進(jìn)行下載,如下

pip install pdf2docx

后續(xù)我們還可以為py文件打包,用到的庫(kù)是pyinstaller

pip install pyinstaller


代碼實(shí)現(xiàn)

我們先簡(jiǎn)單地實(shí)現(xiàn)將單個(gè)PDF文檔轉(zhuǎn)換成Word文檔,代碼如下

pYYBAGMQfMWAKCJIAAA5iyss-GA794.jpg

那么上面的是單個(gè)PDF文件,要是涉及到是多個(gè)PDF文件,則需要用到遍歷上傳過(guò)來(lái)的每一個(gè)文件,用到for循環(huán)遍歷

def startAction(self):
output_path_1 = Path.joinpath(Path.home(), "Desktop")
output_path_2 = str(output_path_1) + "\\output"
if not os.path.exists(output_path_2):
os.mkdir(output_path_2)

for path_list in pdfPath_list:
print("路徑: ", path_list)
name = path_list.split("/")[-1].split(".")[0]
cv = Converter(path_list)
cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
cv.close()

msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
msg_box.exec_()

上述的代碼,我們首先將指定好輸出的Word文檔的位置,這里小編設(shè)置的是在桌面,然后通過(guò)for循環(huán)去遍歷處理每一個(gè)PDF文檔,當(dāng)所有的步驟都完成的時(shí)候,提示我們已經(jīng)完成了。

當(dāng)然整個(gè)可視化界面當(dāng)中還有一個(gè)上傳文件的功能,代碼如下

# 選擇本地文件上傳
def uploadFiles(self):
global pdfPath_list # 這里為了方便別的地方引用文件路徑,將其設(shè)置為全局變量
pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)")
# 顯示所選文件的路徑
self.ui.lineEdit.setText(",".join(pdfPath_list))

整體的代碼如下所示

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
def __init__(self):
self.ui = QUiLoader().load('pdf2word.ui')
self.ui.pushButton.clicked.connect(self.uploadFiles)
self.ui.pushButton_2.clicked.connect(self.startAction)

def uploadFiles(self):
........
........

def startAction(self):
.......
.......

if __name__ == '__main__':
app = QApplication([])
# 顯示創(chuàng)建的界面
MainWindow = OCRQt() # 創(chuàng)建窗體對(duì)象
MainWindow.ui.show() # 顯示窗體
app.exit(app.exec_()) # 程序關(guān)閉時(shí)退出進(jìn)程


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • PDF
    PDF
    +關(guān)注

    關(guān)注

    1

    文章

    174

    瀏覽量

    35059
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4848

    瀏覽量

    88920

原文標(biāo)題:Python 如何實(shí)現(xiàn)一鍵批量將 PDF 文檔轉(zhuǎn) Word?

文章出處:【微信號(hào):AI科技大本營(yíng),微信公眾號(hào):AI科技大本營(yíng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何圖像文件轉(zhuǎn)換為二進(jìn)制文件?

    如何圖像文件轉(zhuǎn)換為二進(jìn)制文件
    發(fā)表于 09-05 08:28

    N9H2x如何視頻轉(zhuǎn)換為 AVI 文件

    N9H2x如何視頻轉(zhuǎn)換為 AVI 文件?
    發(fā)表于 09-01 08:05

    如何通過(guò)VCOM4個(gè)CAN FD消息轉(zhuǎn)換為SLCAN?

    通過(guò)VCOM接口M460系列微控制器(MCU)的4條CAN FD消息轉(zhuǎn)換為SLCAN協(xié)議,并發(fā)送到計(jì)算機(jī)。
    發(fā)表于 08-19 06:23

    如何判斷一款電源管理IC芯片的性能?

    判斷一款電源管理 IC(PMIC)的性能,需要結(jié)合其核心功能(電壓轉(zhuǎn)換、穩(wěn)定輸出、能效控制等)和應(yīng)用場(chǎng)景(如消費(fèi)電子、工業(yè)控制、汽車(chē)電子等),從關(guān)鍵技術(shù)指標(biāo)、實(shí)際工況表現(xiàn)、可靠性等多維度綜合評(píng)估
    的頭像 發(fā)表于 08-18 09:59 ?501次閱讀

    無(wú)法Tensorflow Lite模型轉(zhuǎn)換為OpenVINO?格式怎么處理?

    Tensorflow Lite 模型轉(zhuǎn)換為 OpenVINO? 格式。 遇到的錯(cuò)誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    發(fā)表于 06-25 08:27

    一款入耳式耳機(jī)的仿真與分析

    電子發(fā)燒友網(wǎng)站提供《一款入耳式耳機(jī)的仿真與分析.pdf》資料免費(fèi)下載
    發(fā)表于 04-22 15:39 ?5次下載

    YOLOv4模型轉(zhuǎn)換為IR的說(shuō)明,無(wú)法模型轉(zhuǎn)換為TensorFlow2格式怎么解決?

    遵照 YOLOv4 模型轉(zhuǎn)換為 IR 的 說(shuō)明,但無(wú)法模型轉(zhuǎn)換為 TensorFlow2* 格式。 YOLOv4 darknet
    發(fā)表于 03-07 07:14

    ONNX模型轉(zhuǎn)換為IR后報(bào)錯(cuò),怎么解決?

    運(yùn)行模型優(yōu)化器,以 ONNX 模型轉(zhuǎn)換為 IR。 收到錯(cuò)誤:[ ERROR ] The ExpandDims node Unsqueeze_333 has more than 1 input
    發(fā)表于 03-05 09:11

    使用myriad_compileIR模型轉(zhuǎn)換為blob后收到錯(cuò)誤怎么解決?

    使用模型優(yōu)化器將自定義 TensorFlow* 2 模型轉(zhuǎn)換為中間表示 (IR)。 使用 myriad_compile IR 模型轉(zhuǎn)換為 blob 并收到錯(cuò)誤: 遇到未知輸入類(lèi)型的循環(huán) v5
    發(fā)表于 03-05 08:27

    Spire.Cloud.Word云端Word文檔處理SDK介紹

    Spire.Cloud.Word一款專(zhuān)業(yè)的云端 Word 文檔處理 SDK,開(kāi)發(fā)人員使用它在云端創(chuàng)建、讀取、編輯、轉(zhuǎn)換和保存 Word
    的頭像 發(fā)表于 02-11 11:11 ?665次閱讀
    Spire.Cloud.<b class='flag-5'>Word</b>云端<b class='flag-5'>Word</b>文檔處理SDK介紹

    EE-133:ADSP-218x的傳統(tǒng)架構(gòu)文件轉(zhuǎn)換為鏈接器描述文件

    電子發(fā)燒友網(wǎng)站提供《EE-133:ADSP-218x的傳統(tǒng)架構(gòu)文件轉(zhuǎn)換為鏈接器描述文件.pdf》資料免費(fèi)下載
    發(fā)表于 01-13 16:34 ?0次下載
    EE-133:<b class='flag-5'>將</b>ADSP-218x的傳統(tǒng)架構(gòu)<b class='flag-5'>文件</b><b class='flag-5'>轉(zhuǎn)換為</b>鏈接器描述<b class='flag-5'>文件</b>

    使用pdfDocs提高工作效率,改進(jìn)PDF工作流程

    pdfDocs? 通常PDF文檔很難正確編輯、整理或編輯。這意味著,許多法律專(zhuān)業(yè)人士依靠手工方法復(fù)雜的PDF文檔合并在起,在MS Word
    的頭像 發(fā)表于 12-21 15:31 ?629次閱讀
    使用pdfDocs提高工作效率,改進(jìn)<b class='flag-5'>PDF</b>工作流程

    基于TPS40055的設(shè)計(jì)在15安培時(shí)12V總線(xiàn)轉(zhuǎn)換為1.8V

    電子發(fā)燒友網(wǎng)站提供《基于TPS40055的設(shè)計(jì)在15安培時(shí)12V總線(xiàn)轉(zhuǎn)換為1.8V.pdf》資料免費(fèi)下載
    發(fā)表于 12-16 09:25 ?2次下載
    基于TPS40055的設(shè)計(jì)在15安培時(shí)<b class='flag-5'>將</b>12V總線(xiàn)<b class='flag-5'>轉(zhuǎn)換為</b>1.8V

    基于TPS40051的設(shè)計(jì)12V總線(xiàn)轉(zhuǎn)換為15A時(shí)的1.8V(slup195)

    電子發(fā)燒友網(wǎng)站提供《基于TPS40051的設(shè)計(jì)12V總線(xiàn)轉(zhuǎn)換為15A時(shí)的1.8V(slup195).pdf》資料免費(fèi)下載
    發(fā)表于 12-16 09:19 ?0次下載
    基于TPS40051的設(shè)計(jì)<b class='flag-5'>將</b>12V總線(xiàn)<b class='flag-5'>轉(zhuǎn)換為</b>15A時(shí)的1.8V(slup195)

    base64字符串轉(zhuǎn)換為二進(jìn)制文件

    Base64是種編碼方法,用于二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為ASCII字符串。這種編碼通常用于在不支持二進(jìn)制數(shù)據(jù)的系統(tǒng)中傳輸數(shù)據(jù),例如電子郵件或網(wǎng)頁(yè)。Base64字符串
    的頭像 發(fā)表于 11-10 10:55 ?3387次閱讀