java读取word内容显示在页面显示。并逐条保存数据库;类似于这样的
目前用apache TiKa能把所有的内容读取出来 可是怎么分开抓取没有思路。。。
1.把word转出html格式的文本http://jingyan.baidu.com/article/14bd256e2d1301bb6d26122e.html
2.用java的io流读取文件,web和h5直接展示html;android或者ios用webview加载这个html;
3.存数据库的话也可以直接存这个html格式的
读文本本质都是流,你要想区分题目,肯定要有个标志,将流输出为string进行区分。
public class TestThread {
public static void main(String[] args) throws Exception {
BufferedReader br = new BufferedReader(new FileReader("D:\\work\\word.txt"));
String line = "";
String allWord = "";
while((line=br.readLine())!=null){
if(line.startsWith("表现形式")){
// 将这道题目的末尾加上标志 ===== 。唯一可识别的记号
allWord = line + "=====" ;
}
}
String every [] = allWord.split("=====");
for (String string : every) {
//逐条插入数据库
}
}
}
只是伪代码。望采纳
每个题目、答案等存储部位 用个标签标识 然后直接转xml字符串 再用DOM4j解析,存到自定义的对象里面再遍历存数据库就好了
java有个poi库 你百度一下 可以转成html html是文本就可以保存到数据库