在做一个信息提取的项目,需要提取几万份文件中的特定数据(每份文件大概是两百页左右的PDF),现在已经可以提取出其中一份文件中的特定数据了。问:现在要怎样提取几万份文件中的特定数据?用的是Java,据说要用多线程,不知道是不是,如果是的话,具体要怎么用?
开线程可能会造成内存溢出的问题,这样的任务应该交给多台服务器多个线程来处理,这样又快又安全。