資源簡(jiǎn)介
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
from?pdfminer.pdfparser?import?PDFParser
from?pdfminer.pdfdocument?import?PDFDocument
from?pdfminer.pdfpage?import?PDFPage
from?pdfminer.pdfpage?import?PDFTextExtractionNotAllowed
from?pdfminer.pdfinterp?import?PDFResourceManager
from?pdfminer.pdfinterp?import?PDFPageInterpreter
from?pdfminer.pdfdevice?import?PDFDevice
from?pdfminer.layout?import?*
from?pdfminer.converter?import?PDFPageAggregator
import?os
#?os.chdir(r‘F:\test‘)
fp=open(r‘笨方法學(xué)Python.PDF‘‘rb‘)
#來創(chuàng)建一個(gè)pdf文檔分析器
parser?=?PDFParser(fp)
#創(chuàng)建一個(gè)PDF文檔對(duì)象存儲(chǔ)文檔結(jié)構(gòu)
document?=?PDFDocument(parser)
#?檢查文件是否允許文本提取
if?not?document.is_extractable:
????raise?PDFTextExtractionNotAllowed
else:
????#?創(chuàng)建一個(gè)PDF資源管理器對(duì)象來存儲(chǔ)共賞資源
????rsrcmgr=PDFResourceManager()
????#?設(shè)定參數(shù)進(jìn)行分析
????laparams=LAParams()
????#?創(chuàng)
?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件?????1017966??2019-12-02?17:51??笨方法學(xué)Python.PDF
?????文件????????1705??2019-12-03?09:24??pdf2txt.py
評(píng)論
共有 條評(píng)論