主要观点:通过按特定条件分组并使用自定义聚合来处理数据,将每天的计数存储在单个行的数组中,以优化数据处理。
关键信息:
- 用
sum()
对interaction_count
按category
、object
、interaction_type
和截断到小时的timestamp
进行分组。 - 想法是将一整天的计数存储在单个行的数组中,如
a_counts
和b_counts
各有 24 个元素对应每小时。 - 编写自定义聚合函数
sum_per_hour
,接收小时和计数作为参数,返回修改后的状态(即结果)。 - 示例代码展示了如何使用该聚合函数对输入数据进行分组和计数,并得到按天、类别和对象汇总的结果。
重要细节: - 输入数据通过
generate_series()
生成 20 行随机数据。 - 聚合函数的参数包括状态、小时和计数,返回的数组索引从 0 到 23。
- 最后提到了合并数据的问题及使用MERGE来存储和添加聚合数据的方法。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。