scrapy错误:'gbk' codec can't encode character

我用的是python 3.5.2 和scrapy 1.1,
使用scrapy的时候,出现三个错误,详见下面:

...
...
...

//1、有些地方是乱码
 'address': ['�������������ɽ��·������88��'],
 'email': ['��ҵ���ò����\u2e6b��'],

...
...
...

//2、这个应该是scrapy支持python3不完全的bug?!
2016-07-15 05:53:15 [scrapy] ERROR: Error caught on signal handler: <bound method FeedExporter.item_scraped of <scrapy.extensions.feedexport.FeedExporter object at 0x042CC3F0>>

...
...
...

//3、下面这个错误是编码的问题吗?是网页编码为gbk不能转换为utf-8?
UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 113: illegal multibyte sequence

...
...
...

上面代码的注释中,第3个问题可能是第1个问题的原因,第2个问题可能是bug,所以先解决第3个问题,如果没其它什么问题就先不管第2个问题了。
但不太清楚怎么解决第3个问题。

阅读 6.4k
1 个回答

这个的文件编码为cp936 GBK虽然也标记为936但是我在多个编辑器上试过只有指定936时才会显示中文

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进