网页能通过浏览器正常打开,但是scrapy shell+网址 打开报错
http://www.landchina.com/Desk...
但是scrapy shell后,view response后得到
我也试着加入-s USER_AGENT='Mozilla/5.0' 但是没效果
请问是怎么回事?
网页能通过浏览器正常打开,但是scrapy shell+网址 打开报错
http://www.landchina.com/Desk...
但是scrapy shell后,view response后得到
我也试着加入-s USER_AGENT='Mozilla/5.0' 但是没效果
请问是怎么回事?
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.4k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
2 回答2k 阅读✓ 已解决
关于scrapy无法下载html内容的问题
在我这是默认打开的, 内容是如下:
关于xpath的问题
的确存在这个问题, 可能是小几率的xpath失效的问题 -> (我猜测是这个问题), 因为我尝试过在浏览器中使用我写的xpath发现是可以获取的, 但是scrapy中并不行.
我尝试过使用相对路径, 发现也不行, 我建议你这里使用regex正则表达式来提取.
我写的正则不是特别简洁, 但是可以提取表格内的所有内容, 以列表(二维数组)形式被存下来.