scrapy错误：'gbk' codec can't encode character

Question

scrapy错误：'gbk' codec can't encode character

发布于
2016-07-15

更新于
2016-07-15

我用的是python 3.5.2 和scrapy 1.1,
使用scrapy的时候，出现三个错误，详见下面：

...
...
...

//1、有些地方是乱码
 'address': ['�������������ɽ��·������88��'],
 'email': ['��ҵ���ò����\u2e6b��'],

...
...
...

//2、这个应该是scrapy支持python3不完全的bug？！
2016-07-15 05:53:15 [scrapy] ERROR: Error caught on signal handler: <bound method FeedExporter.item_scraped of <scrapy.extensions.feedexport.FeedExporter object at 0x042CC3F0>>

...
...
...

//3、下面这个错误是编码的问题吗？是网页编码为gbk不能转换为utf-8？
UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 113: illegal multibyte sequence

...
...
...

上面代码的注释中，第3个问题可能是第1个问题的原因,第2个问题可能是bug，所以先解决第3个问题，如果没其它什么问题就先不管第2个问题了。
但不太清楚怎么解决第3个问题。

scrapy

阅读 6.4k

1 个回答

这个的文件编码为cp936 GBK虽然也标记为936但是我在多个编辑器上试过只有指定936时才会显示中文

撰写回答