怎样用正则表达式从一个Html 中提取一些想要的数据,正则表达式该写在哪里呢
/<(.*)>.*<\/\1>/ "<(.*)>.*<\/\1>" 匹配一个 HTML 标记。
你是用什么语言,想提取什么标签内的内容
问这种问题应该给出示例的html代码片断,以及你希望提取的数据,还有你用的编程语言,才好帮助到你。
你什么都不说,只能给你一个泛泛的解答了:在google中搜索“正则表达式30分钟教程”。
如果你没想好用什么语言,那么推荐用Python。如果提取简短的字段,用正则表达式,提取成对标签里内容的话可以用Beautifulsoup。可以在网上找例子,非常好用
根据你需要的html tag,来匹配就简单了