怎么去解析word试卷的每道题,然后不该面题目里面的表格,还有图片公式等

现在需要做个题库系统,用户上传word的试卷,系统拆分成一个一个的题目,要求格式保持基本不失真。我发现用poi解析后,会把表格放在最后面去了,这样就失去了题目原油的格式了,我想问一下大牛们怎么去解决。解析word试卷的题目

试卷什么样子的,截个图看看

用什么语言的写的,能不能把试卷发一下,就算不方便发发个模板也可以

图片说明
图片类似这个样子

我这个是我从word读取生成的网页内容

你最后是生成网页的形式吗看我从word生成的HTML页面,是这样效果吗图片说明