请教JAVA PARSE NETSCAPE BOOKMARK.HTML 的问题

请问如何把NETSCAPE BOOKMARK.HTML 解释并把书签目录和书签转换成JAVA OBJECT呢?

请有例子程序的共享一下,谢谢了

请有心人士加我QQ,知道一下也可以.

QQ:41567494
[b]问题补充:[/b]
还有就是BOOKMARK里面是有父子关系的,请问怎么把当前的ENTRY的父亲找出来呢?
[b]问题补充:[/b]
pJun:

我已经写了PARSE BOOKMARK.HTML的代码了.

现在就卡在父子结构这个难题上.

我是
1.用SWING的HTML PARSER直接PARSE的.
2.用LINKEDLIST储存获得的VALUE.
3.ENTRY的层次和PARENT ID,这两个VALUE我真的不知道怎么计算了...想了一晚.

我查看了一下到处的Bookmark Html格式,他是通过
[code="html"]


帮助和教程
自定义 Firefox
我也要参与
关于我们

[/code]

通过DL/DT的层次结构可以找出父子关系,不过这个关系上面没有类似于Pid的标示. :?
应该在转换成XML后,解析XML加上一个标示,或者在XML转JAVA对象的时候加上个标示.

自己用xml或html解析组件去解析嘛,

应该不难,jdom,htmlparser等

我的思路是这样的
html->xml->JavaObject

html--> xml : 利用tidy组件来处理.
xml-->Javaobject : 利用Digester组件来搞定

参考在这里

[quote]
用 HTML Tidy 将 HTML 转换成 XML
http://www.ibm.com/developerworks/cn/xml/x-tiptidy/index.html
[/quote]
[quote]
利用Digester把XML转换为Java对象
http://www.cnblogs.com/bjzhanghao/archive/2005/03/25/125747.html
[/quote]

:D 还有要注意的是 DL/DT嵌套可以出现多层.

自己定义一个数据结构嘛

class entry
{
string parentid;
string value;
string id;

}