我有一个字符串要用JSON.loads处理成JSON对象
str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''
要用json.loads处理,但是里面的value是个HTML标签,而且里面的p标签里面的内容又有英文引号,属性那也有英文引号,直接用json.loads会报错,该如何处理好
直接用json.loads会提示
Expecting ',' delimiter: line 1 column 33 (char 32)
你已经生成字符串就不好处理了
只能用正则表达式把html代码先提取出来,再把html代码中的引号前面加个 \
不过这样不太好精确的提取html代码部分
最好是能在生成这个字符串时,把html代码拼接进字符串之前就把html代码中的引号前面加 \
import re
import json
str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''
str = re.sub(r'(\[")(.*?)("\])',lambda x: x.group(1)+re.sub(r'"',r'\"',x.group(2))+x.group(3),str)
data = json.loads(str)
print(data)
如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!
你这个不是html 转不了,是value 对应列表里的字符不合法。你这样
```python
str = '''{"level": 1, "value": ["<p align='center'>aaa'b'ccc</p>"]}'''
```
然后 json.loads(str) 就没问题了