提问仅用于科研学习,不涉及任何商业用途
import requests
import json
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 '
'Safari/538.36 Edg/109.0.1516.67 '
}
url = 'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid' \
'=MS4wLjABAAAAF6DBprxchsasOrovWpV5cSeLw1aKKfX1ONlSV5sDExI&count=21&max_cursor=0&msToken' \
'=VTpFKsbuCK5bmTK3ohT4iZRnbjJ7LtPQm9hQaVKCnHBVHr098t5hkXt3ggC86y49EqZ3S4uj4MXRsfIsSqsCJK6EhEC' \
'v8s8aRNQoCtJCQ4prS3DyFczfpoE3b1h9SMBALgc=&X-Bogus=DFSzKwVO5UUANGU6ShWhRKXAIQ53&_signature=_02B4Z6wo00001h' \
'uhShgAAIDDeKuKcq8UKXYbsU6AAOUZ7AI4sVgClohIqXJ2MfChE3TUAF1GJ.9FZKNW4OblnAHBtqmfIIMRB-wD6oW5U05NCkE3QrFFc.' \
'JBDlJOIFgmhsQl5cMarV7Hg0xza1 '
res = requests.get(url=url, headers=headers)
print('content', res.content)
print('text', res.text)
content b''
text
拟获取的信息理应是图一中右侧的信息,想请教一下是代码的问题吗,如何正确获取图一右侧内容?图一右侧的代码是json格式吗?
1.代码本身没有问题,可以换一个其他的URL,例如某度的网址应该就能返回数据,你这个图片看不到请求,理论上请求头部应该加上cookie;
2.获取数据理论上是可以的,有时候接口可能返回空数据,因此需要多试几次,一般过了人工滑动验证后的接口基本可用;
3.右侧看着是json格式,想确认是否是json格式,可以查看标头的响应内容的内容类似Content-Type,其会显示内容格式。
如未能解决,可以继续与我联系。
额,你这请求头没有携带加密信息,获取不到JSON数据的
《爬虫120例》https://blog.csdn.net/hihell/category_11079529.html