问题描述:HTML中的编码串:HTML源码:&#x开头的编码字符串,爬虫爬下来的是 \u开头的,后四位一样这个怎么才能获得&#x开头的编码啊?ps: \u开头的字符串,python认为是一个字符,也就是说他的长度为1,因为需要做字符串替换,替换成uni开头的(后四位不变),用来做大众点评的字体反爬,所以想要获得HTML中的&#x开头的字符串恳请大佬指点指点!!!!
抓字体文件获得的字典:
爬虫爬下的HTML中的编码:
已解决