如图所示,假如我要读取word文件内容,业务概述存一行条数据,业务类型存一条数据,办理时限存一条数据,以此类推。那我读取word文件的时候改如何区分他们分别存入呢,不要问我为什么,因为有上万个这样的文档,手动复制到死去
以下依赖包可以读取word文件的内容
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>3.17</version>
</dependency>
思路
取得上万个word文件名,
遍历读取文件内容,
得到内容,截取所需要的部分,持久化
引用POI包读取word文档内容
poi.jar 下载地址
http://apache.freelamp.com/poi/release/bin/poi-bin-3.6-20091214.zip
http://apache.etoak.com/poi/release/bin/poi-bin-3.6-20091214.zip
http://labs.renren.com/apache-mirror/poi/release/bin/poi-bin-3.6-20091214.zip
搜寻,移到桌面。再移到你要放的地方
读取world文档跟IO流不是一个层次的东西吗?
逐个读取.world
用正则分割
我好菜,好像根本没看懂你说的是什么....
搜寻,移到桌面。再移到你要放的地方
根据系统时间当成唯一标志用来区别,存入集合里,读取的时候便利输出不行吗
http://blog.csdn.net/tuzongxun/article/details/51992704
搜寻,移到桌面。再移到你要放的地方
搜索、移到桌面、再移到你要放置的地方就可以了
使用IO流
File文件;
Input流插入File;
读取文件中的行newLine();并做判断是否包含业务概述、业务类型、办理时限,采用StringBuffer接收读取到的内容,当读到下一个(比如:业务类型)时则把StringBuffer中的内容给业务概述类型,然后清空StringBuffer继续读取下面的内容;
其实这个一直要做判断有点不合适,但是我这是我目前想到的处理方式;
如果最终楼主有更好的处理方式请告诉我一下,谢谢
搜寻,移到桌面。再移到你要放的地方
用apache的poi可以读取word和表格
题主可以看下poi
POI没有pageOffice好使的