如图的字符串,如何用正则其中某些内容取出来?

新手上路,请多包涵

爬虫获得了如图内容,现在需要取出该字符串中的四组汉字,用了包含的正则方法(.*),没有成功,请问如何取出,或者说有更好的方法。
片20200302122626.png

阅读 1.6k
2 个回答
✓ 已被采纳新手上路,请多包涵

经过一段时间的研究,我发现可以通过正则获取所有的汉字,然后把提取列表变为字符串,然后使用结巴分词分开即可。

这是 JSON 啊,直接解析了按结构取不就完了……