字符串如下:
"<!DOCTYPE html>><html><br />catch<br /><body><br /><h1>Hello, world!</h1><br /></body><br />123<br /></html><br /><br/>
我现在需要用split(/\b/)把它分割成一个一个的词组,
需求是保留 转义后的<和 > 不被分割,
哪个大神知道怎么写这个的正则表达式
\b是单词边界,&;和是符号你哟啊整一起肯定要单独替换过为一个特殊字符,如★这种什么的,然后再split后反替换回来