因为需要,在数据库中存的PDF文件是经过转码后的base64字符串,现在想取出来解析pdf里的内容有没有大佬可以给点思路。
首先base64解码,保存字节成pdf文件然后用itext这个库读取如果内容是图片,还需要ocr