快速抓取网页数据入库

抓取了网页的html代码保存在一个文本文件里,如何将其table表格里的数据快速定位并入库,高手降临指教!!!
---------------------- 以下就是抓取存在文件里的内容


****




5806系统后台



        <li><a href="">退出登录</a></li>
 </ul>
 </div>

<div id="mainContent">
<div id="sidebar">

</div>
<div id="content">  
    <table width="90%">
        <tr><td></br><h1>订购查询</h1></td></tr>
        <tr><td>    
            <table width="90%" border="0" bordercolor="#FFFFFF" cellspacing="0" cellpadding="0">

                            共分1页显示,当前是
                            1页.
                            <form id='form6' name='form6' method='post' action=''>  <label>跳转到第<select name='pageid' id='pageid'>

1

                    </hr>
                    <tr>
                        <td>名称</td>
                        <td>时间</td>
                        <td>代码</td>
                        <td>代码</td>
                        <td>总数</td>
                        <td>总金额</td>
                        <td>小计</td>
                    </tr>
                    <tr class="trlist">
                    <td>104&nbsp;&nbsp;</td>
                    <td>2012-10-02 00:00:00.0&nbsp;&nbsp;</td>
                    <td>022&nbsp;&nbsp;</td>
                    <td>103&nbsp;&nbsp;</td>
                    <td>1&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    </tr>
                    <tr class="trlist">
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    </tr>   
            </table>
</td></tr></table>          
</div>



 


CopyRight 2011-2015




考虑使用下jsoup吧 类似于css/jquery语法

用htmlparser解析好了

你就是想要

之间的数据呗?

那就解析你的文本,找到此部分,一个一个取