一个爬虫项目,需要以 POST 方式获取结果页面。
Chrome 查看 POST 过程,发现其中的中文表单内容变成了方块乱码:������,当然,浏览器可以正确的发送请求获取结果(这不是废话。。。)
然后我用代码模拟 POST 请求,发现只要表单出现中文,就无法获取正确的结果(结果总是为 0,因为查询乱码,网站的服务器肯定找不到乱码对应的结果啊)
请问要如何解决乱码问题?
一个爬虫项目,需要以 POST 方式获取结果页面。
Chrome 查看 POST 过程,发现其中的中文表单内容变成了方块乱码:������,当然,浏览器可以正确的发送请求获取结果(这不是废话。。。)
然后我用代码模拟 POST 请求,发现只要表单出现中文,就无法获取正确的结果(结果总是为 0,因为查询乱码,网站的服务器肯定找不到乱码对应的结果啊)
请问要如何解决乱码问题?
10 回答11.7k 阅读
2 回答3.2k 阅读✓ 已解决
8 回答6.5k 阅读
2 回答4.3k 阅读✓ 已解决
2 回答863 阅读✓ 已解决
4 回答2.2k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
找到解决方法了,使用 ByteArrayContent 而不是 StringContent。