题目:编写爬虫程序,爬取学院新闻主页中的新闻信息,包括:新闻标题,新闻时间,链接,并将这些信息转存为Excel文档。
想问问能不能提供一下思路!!
还有一个就是:
tds = tr('td')
st0 = tds[0].string
st4 = tds[4].string
ulist.append([st0.strip(),tds[1].a.string,st4.strip()])
这一步不是很能理解,请大家提供一下思路,谢谢~
1.可以尝试使用requests.get进行请求,2.使用bs4对页面进行解析,3.获取节点属性值。图中就是先获取节点tds列表,然后用索引取其中字符串值。