python资料获取问题

img

img


如上两张图,是我抓取数据的原始程序和结果,报错list index out of range,于是我打印了结果,发现re.findall('j_d_post_content ">(.*? )<', source,re.S)获取的是空数据集,请问这该怎么解决呀!

对空列表进行异常处理,把这里改成:

'content': content_list[i] if len(content_list) > i else ''

img

有帮助的话,请点采纳该答案~

问题点:正则提取关键信息为空
分析思路:
①确认source中,是否包含 j_d_post_content这个关键信息;
②在①的基础上,确认有这个关键信息,再修改正则表达式.(是不是少了一个双引号" ?)