java读取word内容显示在页面并保存数据库

java读取word内容显示在页面显示。并逐条保存数据库；类似于这样的

目前用apache TiKa能把所有的内容读取出来可是怎么分开抓取没有思路。。。

1.把word转出html格式的文本http://jingyan.baidu.com/article/14bd256e2d1301bb6d26122e.html
2.用java的io流读取文件，web和h5直接展示html；android或者ios用webview加载这个html；
3.存数据库的话也可以直接存这个html格式的

读文本本质都是流，你要想区分题目，肯定要有个标志，将流输出为string进行区分。


public class TestThread {

    public static void main(String[] args) throws Exception {

        BufferedReader br = new BufferedReader(new FileReader("D:\\work\\word.txt"));

        String line = "";
        String allWord = "";
        while((line=br.readLine())!=null){

            if(line.startsWith("表现形式")){
                // 将这道题目的末尾加上标志   =====  。唯一可识别的记号
                allWord =   line + "=====" ;
            }
        }

        String every [] = allWord.split("=====");

        for (String string : every) {
            //逐条插入数据库
        }
    }
}

只是伪代码。望采纳

每个题目、答案等存储部位用个标签标识然后直接转xml字符串再用DOM4j解析，存到自定义的对象里面再遍历存数据库就好了

java有个poi库你百度一下可以转成html html是文本就可以保存到数据库