資源簡介
python實現pdf轉word,支持中英文轉換,轉換精度高,可以達到使用效果。
代碼片段和文件信息
#!/usr/bin/python
#?-*-?coding:?utf-8?-*-
#?author:zhoulong_GISER
#?-*-?coding:?utf-8?-*-
#?blog:https://blog.csdn.net/qq_33356563
#?!/usr/bin/python
#?-*-?coding:?utf-8?-*-
import?sys
import?importlib
importlib.reload(sys)
from?pdfminer.pdfparser?import?PDFParser?PDFDocument
from?pdfminer.pdfinterp?import?PDFResourceManager?PDFPageInterpreter
from?pdfminer.converter?import?PDFPageAggregator
from?pdfminer.layout?import?*
from?pdfminer.pdfinterp?import?PDFTextExtractionNotAllowed
‘‘‘
解析pdf文件,獲取文件中包含的各種對象
‘‘‘
#?解析pdf文件函數
def?parse(pdf_path):
????fp?=?open(pdf_path?‘rb‘)??#?以二進制讀模式打開
????#?用文件對象來創建一個pdf文檔分析器
????parser?=?PDFParser(fp)
????#?創建一個PDF文檔
????doc?=?PDFDocument()
????#?連接分析器?與文檔對象
????parser.set_document(doc)
????doc.set_parser(parser)
?
評論
共有 條評論