我用的是python 3.5.2
和scrapy 1.1
,
使用scrapy的时候,出现三个错误,详见下面:
...
...
...
//1、有些地方是乱码
'address': ['�������������ɽ��·������88��'],
'email': ['��ҵ���ò����\u2e6b��'],
...
...
...
//2、这个应该是scrapy支持python3不完全的bug?!
2016-07-15 05:53:15 [scrapy] ERROR: Error caught on signal handler: <bound method FeedExporter.item_scraped of <scrapy.extensions.feedexport.FeedExporter object at 0x042CC3F0>>
...
...
...
//3、下面这个错误是编码的问题吗?是网页编码为gbk不能转换为utf-8?
UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 113: illegal multibyte sequence
...
...
...
上面代码的注释中,第3个问题可能是第1个问题的原因,第2个问题可能是bug,所以先解决第3个问题,如果没其它什么问题就先不管第2个问题了。
但不太清楚怎么解决第3个问题。
这个的文件编码为cp936 GBK虽然也标记为936但是我在多个编辑器上试过只有指定936时才会显示中文