问题如题.
存储为中为编码的问题可能较多,一般处理编码的问题在下列地方
json要实现对文件的encode
下载的时候吸入数据到item时要decode
最关键的是在解析为后获得为列表数据时,还不能对列表decode
详细中文编码问题可以参考博客
http://www.addbook.cn/blog/scrapy%E4%B8%AD%E6%96%87%E7%BC%96%E7%A0%81%E9%97%AE%E9%A2%98
3 回答3k 阅读✓ 已解决
2 回答1.8k 阅读✓ 已解决
2 回答1.7k 阅读✓ 已解决
2 回答1k 阅读✓ 已解决
4 回答1.7k 阅读
3 回答1.6k 阅读
1 回答1.3k 阅读✓ 已解决
http://stackoverflow.com/questions/18337407/saving-utf-8-texts-in-json-dumps-as-utf8-not-as-u-escape-sequence 里面有提到,将 JSONEncoder 的
ensure_ascii
参数设为 False 即可。而 scrapy 的 item export 文档里有提到
因此就在调用
scrapy.contrib.exporter.JsonItemExporter
的时候额外指定ensure_ascii=False
就可以啦。