一个爬虫项目,需要以 POST 方式获取结果页面。
Chrome 查看 POST 过程,发现其中的中文表单内容变成了方块乱码:������,当然,浏览器可以正确的发送请求获取结果(这不是废话。。。)
然后我用代码模拟 POST 请求,发现只要表单出现中文,就无法获取正确的结果(结果总是为 0,因为查询乱码,网站的服务器肯定找不到乱码对应的结果啊)
请问要如何解决乱码问题?
一个爬虫项目,需要以 POST 方式获取结果页面。
Chrome 查看 POST 过程,发现其中的中文表单内容变成了方块乱码:������,当然,浏览器可以正确的发送请求获取结果(这不是废话。。。)
然后我用代码模拟 POST 请求,发现只要表单出现中文,就无法获取正确的结果(结果总是为 0,因为查询乱码,网站的服务器肯定找不到乱码对应的结果啊)
请问要如何解决乱码问题?
10 回答11.1k 阅读
15 回答8.3k 阅读
6 回答3k 阅读
5 回答4.8k 阅读✓ 已解决
4 回答3k 阅读✓ 已解决
8 回答6.2k 阅读
2 回答2.6k 阅读✓ 已解决
找到解决方法了,使用 ByteArrayContent 而不是 StringContent。