下面代码 pdfplumber读取pdf文件的内容输出是none
是什么问题
import pdfplumber
# 打开PDF文件
with pdfplumber.open('C:/Users/xhz1cng/Desktop/3398157986.pdf') as pdf:
# 遍历PDF页码
for page in pdf.pages:
# 获取页码文本内容
text = page.extract_text()
# 输出每一页的文本内容
print(text)
在使用pdfplumber提取文本内容时,如果某一页的文本内容为空,或者PDF文件本身没有包含文本内容,那么page.extract_text()方法将返回None,因此在输出时会显示为None。
为了避免输出None,可以在输出之前先进行判断,例如:
if text is not None:
print(text)
这样可以确保只输出非空文本内容。