node 的express 如何接受以一个网站的url作为参数的路由

qianjiahao
  • 8.4k

在做一个爬虫,从前端的angular传过来一个路由,路由有一个参,是一个网站的url,

http://localhost:3000/newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml 

newslist/ 后面的就是url参数,我希望能提取这个参数,于是我这么写:

app.get('/newslist/:url', function (req, res) {
console.log('3')
var url = req.params.path;
console.log(url);

superagent.get(url)
    .end(function (err, data) {
        if (err) console.log(err);

但是这样写的路由无法捕获前端传过来的值,提示:

GET http://localhost:3000/newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml 404 
Cannot GET /newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml

不知正确的写法应该怎么写,望大神指点~

回复
阅读 7.7k
2 个回答
✓ 已被采纳

express中的path解析用的是https://github.com/component/path-to-regexp,path是以/来分割目录的,也就是说形如/newslist/:url中的url是不能再包含单斜杠的,否则就无法匹配到这个path规则,那么多个path中的参数怎么匹配呢,形如"/newslist/:page/:id"当然这个并不是你的需求。其实你这个完全可以不用path传参,而用query形如

app.get('/newslist',function(req,res){
    var url = req.query.url;
    //TODO:other logic
})

然后访问http://localhost:3000/newslist?url=http://news.neusoft.edu.cn/2015/0402/4710.shtml
应该就可以了

前一个答案已经被采纳了,不过还有一种方式是hash,例如hash可以构造同样的参数。

http://localhost:3000/newslist#url=http://news.neusoft.edu.cn/2015/0402/4710.shtml
//js获取参数的代码:
function getQuery(query) {
    query = query.replace(/[\[]/, "\\\[").replace(/[\]]/, "\\\]");
    var expr = "[\\?#&]" + query + "=([^&#]*)";
    var regex = new RegExp(expr);
    var results = regex.exec(window.location.href);
    if (results !== null) {
        return results[1];
    } else {
        return false;
    }
}

//调用方法获取参数
var name = getQuery('name');

//设置hash的代码
location.hash = '#name=' + PAGE_USER + '&type=shared';

利用hash的好处是通用,在浏览器也比较好处理这个~(≧▽≦)/~啦啦啦

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏