在数据分析领域,时间间隔计算的功能是为了分析两个时间点之间的间距,从而获得时间间隔的信息。这种计算用于事件发生的频率、持续时间等方面。在JVS-智能BI平台中提供了多种方式对时间间隔计算方式。这里我们以系统某应用对用户操作日志场景为例,需要分析用户最早登录与最晚登录时间的间隔,我们先看看原始数据记录,如下形态:
图片

需要分析所有用户的最早登录时间与最晚登录时间的差距,接下来给大家详细介绍下分析的配置的过程:
1、将系统的日志数据接入BI系统数据源中,如下图所示,具体配置请参照数据源配置相关操作说明
图片

2、建立数据集加工“用户登录行为分析”,并将刚才的登录日志数据源引入到数据加工画布中,如下图所示
图片

点击数据输入节点①后,在配置预览面板上 可以查看到数据具体的字段结构②,与具体示例数据③。

查看实际数据后,发现数据表中对同一用户存在多条记录,而且有登录失败的情况,那么先要过滤掉登录失败的数据,再对用户、操作最早时间、操作最晚时间进行聚合。那么我们接着配置。

3、引入数据筛选节点,把状态为“失败”的数据过滤掉,如下图所示,选择对应字段,设置过滤条件,把登录成功的数据保留下来
图片

4、配置用户、时间的分组汇总,把每个用户的 用户id、登录次数、操作最早时间、操作最晚的时间进行分组汇总聚合出来,配置如下:
图片

对字段汇总时,系统可以计算数据的条数,对数字字段汇总可以实现 求和、平均、最大、最小等多种操作,对时间汇总时,可以对最早、最晚等进行计算

5、接下来增加一个字段,计算最早时间与最晚时间的时间间隔(以天表示),具体配置如下:
图片

通过数据拓展,增加一个函数计算的字段,设置函数内容,将上一步骤汇总出来的时间设置进入时间间隔函数的入参中,最后得到计算的时间间隔值。

6、最后把输出的结果引入输出节点即完成简单的时间间隔的计算加工。
图片

当然,如果还需要周期性数据同步、或者权限等相关设置,都可以独立的去设置任务执行和权限分配等操作,这里就不重点介绍了,可以查看往期的相关介绍。

在线demo:http://bi.bctools.cn/
gitee地址:https://gitee.com/software-minister/jvs-bi


软件部长
43 声望6 粉丝

软件研发行业老司机,提供些踩坑的经验而已