用python爬github的代码,到了从html文件中抽取那了,用beautifulsoup来解析,然后使用soup.find函数,想要获得作者名和库名这个内容,尝试了一下这个link--secondary,但是不对,有人知道这里应该填什么吗?
你可以用re模块来爬取可以这样子写selector=re.findall(r'(.*?)',response_pic,re.S)response_pic就是你爬取到的html代码