目前公司有一web ERP系统(特定APP扫码登录)需要每天导数据(十多种类型表格,每种类型表格有表头20-30个,数据内容通过外部加载),比较麻烦,想通过python自动化,但是在爬取过程中爬取后的数据输出导表格后发现表头全是英文,如何匹配对应中文?下面是部分截图:
其中一个表格“检查” html部分:
其中一个表格需求的数据:
其中一个表头的中文:
开发者模式下搜索表头字段结果:
请各位大神支招如何快速提取中文表头,在哪里提取,怎么提取,谢谢(不方便发url)!
获取数据的json部分
是不是人家网站里有另外的文件里面有英文对应的中文?
还是没太懂。。。从这json里面拿出来的键名,也就是你要的表头肯定是英文啊。你想直接要中文?所以在F12里面查中文表头?
就我所知道的,页面表格的渲染方式:前端写好表头,从后端接口中获取数据json,一个一个对应。所以我认为你还是得自己写一个表头,一个一个对应
数据给个全版,信息可以打码
试一下使用requests库和BeautifulSoup库
https://wwa.lanzoui.com/izHRapha6oh
自己去下载吧,我爬过一个和你类似的。你网址改下,然后那个要查询的内容改下基本上就可以了