将数据分组为求和数组 - 自定义聚合的乐趣 - 从 depesz 中选择 *;

主要观点:通过按特定条件分组并使用自定义聚合来处理数据,将每天的计数存储在单个行的数组中,以优化数据处理。
关键信息:

  • sum()interaction_countcategoryobjectinteraction_type和截断到小时的timestamp进行分组。
  • 想法是将一整天的计数存储在单个行的数组中,如a_countsb_counts各有 24 个元素对应每小时。
  • 编写自定义聚合函数sum_per_hour,接收小时和计数作为参数,返回修改后的状态(即结果)。
  • 示例代码展示了如何使用该聚合函数对输入数据进行分组和计数,并得到按天、类别和对象汇总的结果。
    重要细节:
  • 输入数据通过generate_series()生成 20 行随机数据。
  • 聚合函数的参数包括状态、小时和计数,返回的数组索引从 0 到 23。
  • 最后提到了合并数据的问题及使用MERGE来存储和添加聚合数据的方法。
阅读 6
0 条评论