惊呆同事的自动化小工具来了!一键实现批量将 PDF 文档转 Word

无论是惊呆具键将在工作还是学习当中,大家都会遇到这样一个问题,同事将“PDF当中的自动化内容(文本和图片)转换为Word的格式”,也就是小工说从只读转换成可编辑的格式。网上绝大多数的实现工具也都是收费的,今天小编就给大家制作了一款批量将PDF​文件转换为Word的批量神器,使用起来也是文档相当的方便。

实现效果​

我们首先来看一下出来的源码下载惊呆具键将效果,如下图所示:

环境准备​

用到的同事模块叫做pdf2docx​,我们通过pip命令进行下载,自动化如下:

pip install pdf2docx

后续我们还可以为py​文件打包,小工用到的实现库是pyinstaller:

pip install pyinstaller代码实现​

我们先简单地实现将单个PDF​文档转换成Word文档,代码如下:

from pdf2docx import Converter

cv = Converter(r"pdf文件的批量路径")

cv.convert("test.docx", start=0,end=None)

cv.close()

那么上面的是单个PDF​文件,要是文档涉及到是多个PDF​文件,则需要用到遍历上传过来的惊呆具键将每一个文件,用到for循环遍历:

def startAction(self):

output_path_1 = Path.joinpath(Path.home(), "Desktop")

output_path_2 = str(output_path_1) + "\\output"

if not os.path.exists(output_path_2):

os.mkdir(output_path_2)

for path_list in pdfPath_list:

print("路径: ", path_list)

name = path_list.split("/")[-1].split(".")[0]

cv = Converter(path_list)

cv.convert(output_path_2 + "\\{ }.docx".format(name), start=0, end=None)

cv.close()

msg_box = QMessageBox(QMessageBox.Information, 完成, 提取完成, QMessageBox.Yes)

msg_box.exec_()

上述的代码,网站模板我们首先将指定好输出的Word​文档的位置,这里小编设置的是在桌面,然后通过for循环去遍历处理每一个PDF文档,当所有的步骤都完成的时候,提示我们已经完成了。当然整个可视化界面当中还有一个上传文件的功能,代码如下:

# 选择本地文件上传

def uploadFiles(self):

global pdfPath_list # 这里为了方便别的地方引用文件路径,将其设置为全局变量

pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上传文件", r"路径", "*.pdf;;All Files(*)")

# 显示所选文件的路径

self.ui.lineEdit.setText(",".join(pdfPath_list))

整体的代码如下所示:

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog

from PySide2.QtUiTools import QUiLoader

from pdf2docx import Converter

from pathlib import Path

import os

class OCRQt:

def __init__(self):

self.ui = QUiLoader().load(pdf2word.ui)

self.ui.pushButton.clicked.connect(self.uploadFiles)

self.ui.pushButton_2.clicked.connect(self.startAction)

def uploadFiles(self):

........

........

def startAction(self):

.......

.......

if __name__ == __main__:

app = QApplication([])

# 显示创建的界面

MainWindow = OCRQt() # 创建窗体对象

MainWindow.ui.show() # 显示窗体

app.exit(app.exec_()) # 程序关闭时退出进程云南idc服务商
系统运维
上一篇:并非一个好米任何人都会给你一个好的价格。那你该如何用以有的好米卖出最理想的价格呢?
下一篇:3、考虑出售域名