实在搞不定,求助各位大神。
我获取一个网站https://www.toodc.cn/list/c31...
里面有一个scripts标签存放所有的城市列表信息,
我通过re.findall提取到关键信息,但是在转行json的时候一直报错,求助大神。
data = re.findall('allCity:(.*"\w+",type:a}]}])', response.text)
datajson = json.loads(("".join(data)))###这一步报错如下图
获取的数据如下图:
我注意到不是标准的json格式,有的key value没有双引号,导致报错无法转换,
我使用re.sub(r"(,?)(\w+?):", r"\1'\2' :", data)
想先把所有key值加上引号,最后想通过replace进行替换双引号,但是还是匹配报错
实在搞不定,求助各位大神。感激
js代码
结果:
