爬虫获得了如图内容,现在需要取出该字符串中的四组汉字,用了包含的正则方法(.*),没有成功,请问如何取出,或者说有更好的方法。
经过一段时间的研究,我发现可以通过正则获取所有的汉字,然后把提取列表变为字符串,然后使用结巴分词分开即可。
这是 JSON 啊,直接解析了按结构取不就完了……
4 回答14k 阅读✓ 已解决
2 回答9.3k 阅读
1 回答2.9k 阅读✓ 已解决
1 回答7.5k 阅读✓ 已解决
1 回答6.6k 阅读
经过一段时间的研究,我发现可以通过正则获取所有的汉字,然后把提取列表变为字符串,然后使用结巴分词分开即可。