Mongo 查询怎样先按一个字段分组,然后对所有组进行组内排序(按另一字段)?

比方说数据库存有 Post 类型的数据,每个文档记录了发布帖子的时间和该帖子获得的投票数:

...
{ time: 1481185194698,
  vote: 2 }
...

我这里想执行一个 find({}) 操作,把所有帖子按照发布时间 24 小时间隔分组(新一天的组排前面),然后每个组内再按照投票数排序。我查遍了 MongoDB 的文档,没有找到解决方案,请问这可以办到吗?

我也查看了 Mongo 的 aggregate 操作,聚合的 $group 和 $bucket 操作都会合并文档,我这里只想查询,不想合并文档。

------------------------UPDATE 2016/12/09--------------------------

问题解决了,最终采用的解决方案是在数据库里新增一个 daysFrom 字段,用来保存距离 1970/1/1 过去的天数,然后按照该天数排序。

阅读 5.8k
2 个回答

办法还是有的,会比较绕一些。
首先你的时间是NumberLong,这种类型无法直接取到天。所以第一步需要转换类型,把所有记录的“天”拿出来投影成一个字段。
然后没理解错的话,你的要求应该是按天排序,同样的天内再按vote排序。所以第二个pipeline是一个$sort。处理之后应该是你想要的结果。

db.test.aggregate([
    // {$match: <cond>}
    {
        $project: {
            time: "$time",
            date: {$multiply: [{$floor: {$divide: ["$time", 86400000]}}, 86400000]}, // 864000ms = 1天
            vote: "$vote"
        }
    },
    {$sort: {date: 1, vote: -1}}
])

注意:

  1. 如果对全部数据都做这个操作,肯定是一个很费时的操作,所以建议第一个条件用$match先过滤出你感兴趣的时间再进行后面的操作

  2. 如果考虑到时区问题,可能还要做些修改。不妨自己理解一下上面的语句再自己修改。

1、假设model如下:

{ title : 'xxxx',
  time : 1481185194698,
  vote : 2}

2、试试如下的aggregation

db.post.aggregate([
                    {$group: {
                    _id: {year : {$year :'$time'},
                          month: {$month :'$time'},
                          day: {$dayOfMonth : '$time'},
                          title : $title
                    },
                    total: {$sum:'$vote'}}},
                    {$sort: {_id:-1}}
                  ]);

看到您更新的说明,如果不使用aggregate,那么使用基于time的range查询不满足您的需求吗?

关于time,留意一下:1、时区;2、在使用string,还是date类型

db.post.find({time: {$gte: start, $lt: end}});
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题