java如何解析含有html内容的xml文件

是这样的,现在有个xml文件,实际上是个只有头部是xml标签的文件,内容主体是html写成的,现在想要解析这个xml文件,提取其中的数据,不知该用何种方法。
试过dom4j和jsoup,这两个一个适合用来解析纯xml文件,一个适合解析纯html文件,但是不知如何解析嵌套在xml文件里的html文件。这是我要解析的xml文件截图一部分:
图片说明

这是xml文件的一部分:
<?xml version="1.0"?>

-

-


……


请各路大神指点迷津。

http://blog.csdn.net/javaxiaochouyu/article/details/6889140

这个有好几种方法的,可以用dom4j,可以用sax,也可以用jdom;这几种方式各种特点,你需要根据业务去判断用哪个

需要先从html的整体文本中正则捕获出xml文件,然后才能选用dom4j之类的解析器进行解析

Elements urlem = dom.getElementsByTag("model")
e.select("[salesnum=14609]").attr("date")
jsoup 不知道行不行。