请问如何把NETSCAPE BOOKMARK.HTML 解释并把书签目录和书签转换成JAVA OBJECT呢?
请有例子程序的共享一下,谢谢了
请有心人士加我QQ,知道一下也可以.
QQ:41567494
[b]问题补充:[/b]
还有就是BOOKMARK里面是有父子关系的,请问怎么把当前的ENTRY的父亲找出来呢?
[b]问题补充:[/b]
pJun:
我已经写了PARSE BOOKMARK.HTML的代码了.
现在就卡在父子结构这个难题上.
我是
1.用SWING的HTML PARSER直接PARSE的.
2.用LINKEDLIST储存获得的VALUE.
3.ENTRY的层次和PARENT ID,这两个VALUE我真的不知道怎么计算了...想了一晚.
我查看了一下到处的Bookmark Html格式,他是通过
[code="html"]
通过DL/DT的层次结构可以找出父子关系,不过这个关系上面没有类似于Pid的标示. :?
应该在转换成XML后,解析XML加上一个标示,或者在XML转JAVA对象的时候加上个标示.
自己用xml或html解析组件去解析嘛,
应该不难,jdom,htmlparser等
我的思路是这样的
html->xml->JavaObject
html--> xml : 利用tidy组件来处理.
xml-->Javaobject : 利用Digester组件来搞定
参考在这里
[quote]
用 HTML Tidy 将 HTML 转换成 XML
http://www.ibm.com/developerworks/cn/xml/x-tiptidy/index.html
[/quote]
[quote]
利用Digester把XML转换为Java对象
http://www.cnblogs.com/bjzhanghao/archive/2005/03/25/125747.html
[/quote]
:D 还有要注意的是 DL/DT嵌套可以出现多层.
自己定义一个数据结构嘛
class entry
{
string parentid;
string value;
string id;
}