java后台读取大字段中的内容过滤出相应的值

例如,我从大字段中读取出如下数据:

    
罂粟属植物

 

碎米荠
一种木本植物岩须
木本植物矮桦
仙女木
在斯瓦尔巴德地区采集到4种木本植物,最后找到的是“岩高兰”。这是结着累累果实的岩高兰
极地柳树,虽不及大陆上的柳树高大,却也是木本的。这是绽放柳絮的柳树。
木贼
北极棉花
植物学家武素功这次来北极考察,和植物学家杨永平共同进行斯瓦尔巴德地区与青藏高原植物对比研究。他们每天都要去野外,或登高山,或入河谷,采集标本
武素功和杨永平在采集标本
植物学家、中科院昆明植物研究所副所长杨永平
来源:人民网 2002年8月12日
(责任编辑:张莉)

现在我要读取出每个中的src的值,也就是读取出W020020813382486943322.jpg。
注意,是用java后台实现,不要给我回js哦。

是所有的jpg都读出来吗? 用正则表达式。

你这都是html代码吧

那很好办,用htmlparser来解析html页面就很方便得到你要的值

可以参考些使用例子快速上手
http://blog.csdn.net/redez/archive/2005/11/21/534277.aspx