试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示
但是入库后就是乱码
试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示
但是入库后就是乱码
问题已经解决了,原因是requests 获取的response 编码有些情况下不准确,强制解码 可是作为unicode 使用,但是入库时会出现异常,跟其他组件没有关系。
办法就是使用 chardet 再次检测 reponse.content的编码,指定给response
1 回答9.5k 阅读✓ 已解决
2 回答5.1k 阅读✓ 已解决
2 回答3.5k 阅读✓ 已解决
3 回答4.4k 阅读
2 回答2.4k 阅读✓ 已解决
2 回答1.5k 阅读✓ 已解决
1 回答2.7k 阅读✓ 已解决
BeautifulSoup 解析的时候得utf-8