网络爬虫,我抓取了一些标签源码,怎么去除标签的样式?如图

我抓了P标签,我想要的效果是

正文


P标签的那些样式怎么删除?在线等,急
图片说明

用函数 .text()

正则替换下


    var s = '<p style="color:red....其他样式">内容1</p><p style="color:red....其他样式">内容2</p>';
    s = s.replace(/<p[^>]+>([\s\S]+?)<\/p>/gi, '<p>$1</p>');
    alert(s)

我也同意用正则替换的办法,或者自己用编程语言实现字符串解析

用java的html解析工具htmlparser解析,只取文本,然后再按需要的格式输出。