如何通过beautiful soup的语法获取下图中的两个文本信息,一个文本信息在P标签下,另一个在P标签的span标签下
目前已可实现一次性获取该P标签下的文本信息,但是如果需要分开来获取的话,就不清楚使用什么语法来获取
代码如下
start_url = "https://www.jzda001.com"
header = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
response = requests.get(url=start_url, headers=header)
html = response.text
# 选择解析方式
soup = BeautifulSoup(html, 'html5lib')
# attrs解析
content = soup.find_all('ul', 'art-list')[0] # 获取三个模块的信息
for author_time in content.find_all('p',attrs={'class':'name'}):
pass
目前知道可以使用正则来实现,但想尝试利用beautiful soup自带的语法来实现需求