正则替换<br />为回车？

a=requests.get('https://www.23us.com/html/78/78926/').content.decode('gbk')#decode('gbk')为编码方式
b='<a href="(\d+\.html)">.*?</a>'
c=re.compile(b)
d=c.findall(a)
for i in d[0:1]:
    hrefs='https://www.23us.com/html/78/78926/'+i
    a=requests.get(hrefs).content.decode('gbk')
    b='<h1>(.*?)</h1>.*?<dd id="contents".*?>(.*?)</dd>'
    b=b.replace('/<br \/>', "\r")
    c=re.compile(b,re.S)
    d=c.findall(a)
    print(d)

不知道你这个问题是否已经解决, 如果还没有解决的话:

这篇文章：正则化线性模型也许能够解决你的问题，你可以看下

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^