在NodeJS里使用http.get方法,平时获取各种网页返回的内容都很正常,最近碰到“上观新闻”的站点很奇怪,例如:
栏目列表页 http://web.shobserver.com/new...
详情页 http://web.shobserver.com/new...
通过http.get方法返回的response是空白,也没有错误提示,不知道该站点有什么特殊之处?
代码如下:
http.get(url,function(res){
var html = '';
res.setEncoding('utf-8');
res.on('data',function(chunk){
html += chunk;
});
res.on('end',function(){
//解析html
});
});
这种问题很常见,在请求的 headers 里加上 User-Agent 模拟正常的浏览器就行了。
原生http比较难用,我就用 request 示例: