python的json.loads如何处理带HTML的字符串

问题遇到的现象和发生背景

我有一个字符串要用JSON.loads处理成JSON对象

str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''

要用json.loads处理,但是里面的value是个HTML标签,而且里面的p标签里面的内容又有英文引号,属性那也有英文引号,直接用json.loads会报错,该如何处理好

直接用json.loads会提示

Expecting ',' delimiter: line 1 column 33 (char 32)
问题相关代码,请勿粘贴截图
运行结果及报错内容
我的解答思路和尝试过的方法
我想要达到的结果

你已经生成字符串就不好处理了
只能用正则表达式把html代码先提取出来,再把html代码中的引号前面加个 \
不过这样不太好精确的提取html代码部分
最好是能在生成这个字符串时,把html代码拼接进字符串之前就把html代码中的引号前面加 \

import re
import json
str = '''{"level": 1, "value": ["<p align="center">aaa"b"ccc</p>"]}'''
str = re.sub(r'(\[")(.*?)("\])',lambda x: x.group(1)+re.sub(r'"',r'\"',x.group(2))+x.group(3),str)
data = json.loads(str)
print(data)

如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

img

你这个不是html 转不了,是value 对应列表里的字符不合法。你这样


```python
str = '''{"level": 1, "value": ["<p align='center'>aaa'b'ccc</p>"]}'''

```
然后 json.loads(str) 就没问题了

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632