在一次抓取网站的过程中,使用chrome调试时,发现一个参数为:(unable to decode value),经过多方尝试,发现是网页编码问题,在返回的网页源代码中可以看到该网站编码为GBK,

content="text/html;charset=GBK"

这里只需要使用python的encode方法将编码转换即可

 company_name = "科技有限公司"
 company_name = company_name.encode("GBK")

ChenYakun
6 声望3 粉丝

python/爬虫/scala/大数据