如何解析pdf或者word文档内容,分章节存进mysql数据库

    最近在做一个项目,有很多国家标准文档,格式很规范。如下所示:
            1 主面内容和适用范围
            本 标准 规 定了书脊的定义、内容和设计规则。
            2 定义
            2.1 书籍
            连接书的封面和封四,以缝、钉、粘或其它方法装订而成的转折部位。
            2.2 边缘名称
      出版物封四上沿书脊边缘纵排的书脊名称。
            3 设计和使用
            3.1 ......
            3.2 ......

            如何解析文档内容,分章节存进mysql数据库的不同字段中,用java编写。

用itext库解析pdf
用poi解析word

   我知道用poi解析word,pdfbox解析pdf。关键是怎么实现啊。