a=requests.get('https://www.23us.com/html/78/78926/').content.decode('gbk')#decode('gbk')为编码方式
b='<a href="(\d+\.html)">.*?</a>'
c=re.compile(b)
d=c.findall(a)
for i in d[0:1]:
hrefs='https://www.23us.com/html/78/78926/'+i
a=requests.get(hrefs).content.decode('gbk')
b='<h1>(.*?)</h1>.*?<dd id="contents".*?>(.*?)</dd>'
b=b.replace('/<br \/>', "\r")
c=re.compile(b,re.S)
d=c.findall(a)
print(d)
不知道你这个问题是否已经解决, 如果还没有解决的话: