python处理PDF文本。想要用pdfplumber提取知网下载文献中的文本,但是只能提取出英文,无法提取中文,随便写了一个测试文档转PDF,发现代码可以正常使用。
所以想问问大家,有没有遇到过相应的问题,或者该怎么处理。
哎,一天天的,要被代码整疯了
你要看你的pdf里面的内容是图片还是world转换而成的,如果是图片应该无法提取的,如果是world,应该问题不大,可以参考:https://blog.csdn.net/weixin_42277380/article/details/98752212
官方文档https://gitee.com/hailei_yan/pdfplumber
希望对你有帮助,如有帮助,望采纳,谢谢