代码:
import os #批量提取pdf 转换txt文件
import sys
import time
pdfs=(pdfs for pdfs in os.listdir('.') if pdfs.endswith('.pdf'))
for pdf1 in pdfs:
pdf=pdf1.replace(' ','').replace('-','').replace('&','_')
os.rename(pdf1,pdf)
print('='*30+'\n',pdf)
txt=pdf[:-4]+'.txt'
exe='"'+sys.executable+'""'
pdf2txt=os.path.dirname(sys.executable)
pdf2txt=pdf2txt+'\\scripts\\pdf2txt.py"-o'
try:
cmd=exe+pdf2txt+txt+' '+pdf
os.popen(cmd)
time.sleep(2)
with open(txt,encoding='utf-8') as fp:
print(fp.read(200))
except:
pass
运行问题:
zzj.pdf
文件名、目录名或卷标语法不正确。
PS E:\python\yuan1\chap1>
请问,这怎么解决
说你目录不对吧。
pdf2txt这里是获取目录
然后你确定这个目录下有scripts文件夹?