import requests
import json
if __name__ == '__main__':
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'
}
id_list = []#存储企业的id
all_data_list = [] #存储所有企业的详情数据
#批量获取不同企业的id值
url = 'http://scxk.nmpa.gov.cn:81/xk/'
for page in range(1,7):
page = str(page)
data={'on': 'true',
'page': '1',
'pageSize': '15',
'productName':'',
'conditionType':'1',
'applyname':'',
'applysn':''}
json_ids = requests.post(url=url ,headers=headers,data=data).json()
for dic in json_ids['list']:
id_list.append(dic['ID'])
#获取企业详情数据'
post_url='http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsById'
for id in id_list:
data = {
'id':id
}
detail_json = requests.post(url=post_url,headers=headers,data=data).json()
#print(detail_json)
all_data_list.append(detail_json)
#持久化存储all data list
fp= open('./allData.json','w',encoding='utf-8')
json.dump(all_data_list,fp=fp,ensure_ascii=False)
print('over')
代码无法获取json格式的数据主要原因有二个方面,一是11行的url不准确,应该是url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do';二是要传参数params,在第13行后加上params = ( ('method', 'getXkzsList'), ),在第23行post里写上params=params
是不是文件内容不符合json格式规范。
另外在data里第15行写成'page':page,这样才能更新页数。
您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632
非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!
速戳参与调研>>>https://t.csdnimg.cn/Kf0y