我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

Java中处理大数据的问题

在做一个信息提取的项目,需要提取几万份文件中的特定数据(每份文件大概是两百页左右的PDF),现在已经可以提取出其中一份文件中的特定数据了。
问:现在要怎样提取几万份文件中的特定数据?
用的是Java,据说要用多线程,不知道是不是,如果是的话,具体要怎么用?

开线程可能会造成内存溢出的问题,这样的任务应该交给多台服务器多个线程来处理,这样又快又安全。

近期文章

  • mongoTemplate修改时如何传入一个对象
  • 关于at24c04的驱动程序
  • 当数据库表中包含较多BIT类型的列时,该如何设计
  • java.lang.reflect.InvocationTargetException
  • Android内存泄漏中no GC root的含义
  • pushlet使用过程中的问题
  • 请问大神错在哪里 c语言初学者
  • cocos2d调度器只能在场景中使用,普通的类不能用吗?
  • 进度条不能运行的问题
  • android 创建热点密码设置问题
  • Android : phonegap 配置文件一直报错,不知道什么情况 (1C别嫌少,全部家产了)
  • android程序连接oracle
  • iOS 获取不到定位权限
  • dhcp报文异常,求经验人士帮忙分析
  • linux控制文本排版问题
  • 在LabView上如何存储MapX地图上的数据
  • C# WINFORM GMAPcontrol控件如何添加?
  • jdbctemplate.queryforlist查询oracle
  • vhdl错误,急求帮忙看一下
  • 怎么用window.onbeforeunload区分是页面关闭还是刷新,IE和FireFox环境下,跪求大神们

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华