import re import requests url ='https://www.cnblogs.com/' headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36'} response = requests.get(url=url,headers=headers).text ex = '<div class="post_item_body">.*?target="_blank">(.*?)</a></h3>' print(re.findall(ex,response,re.S))
你得到的 response 是什么? 后面的 findall 就是一个模式匹配的过程了,先看是否得到了正确的返回网页数据。
你要匹配什么呢, 代码没问题, 那就是正则写错了