如何在一大串字符串中去掉所有html标签并取得余下内容

 string str="<body><b>abcdefg<html><a>链接123</a>456中文。"

如上字符串，如何得到结果是

 var aa=“abcdefg链接123456中文。”

 aa=Regex.Replace(str,"<[^>]*?>","");

aa=str.replace(/[\r\n]/g,"").trim();

这个你要声明是什么语言下实现，不过不管杀码语言，你使用正则取过滤掉html标签总不会错的
当然有些语言本身就内置含有去除html标签的

使用正则表达式对象来替换

 str=System.Text.RegularExpressions.Regex.Replace(str,"<[^>]+>");