SPL 简化 SQL 案例详解：组内运算

在开发数据库应用时，经常在分组后需要对组内数据进行计算，例如：列出近3年每年都发表过论文的学生名单（按论文发表年分组后列出每年都出现的学生清单），统计全部参加了历次培训的员工（按培训分组后统计每次都有的员工人数），选出每位客户的高尔夫成绩最高的三天（按客户分组后按天计算成绩的Top3）等等。

对于SQL来说，完成这类运算一般较为复杂，需要嵌套多层，往往导致代码难以理解和维护困难。而SPL非常擅长这类组内计算，并且很容易和JAVA、报表工具集成。下面用一个例子来进行说明。

表sales存储着多年的订单数据，部分数据如下：

1png

要求是请根据该表统计出指定年份（例如2015）中，每个月销售金额均排在前20名的客户名称。

解决这个问题的思路是，首先选出2015年销售数据，按月分组统计，然后循环选出每月销售前20名的客户，最后求各组的交集。

这样的计算在SQL很难直接表达，而SPL则可以很自然地逐步计算，将复杂问题拆分后得出最终结果。

SPL代码：

2png

A1：从数据库中读出销售表；

A2：=A1.select(year(ORDERDATE)==YEAR)，从销售数据中取出指定年份的数据。通过网格参数YEAR灵活适应不同的查询需求，此例中YEAR=2015。当然，这里的过滤也可以直接通过A1中的SQL来完成。

A3：=A2.group(month(ORDERDATE))，使用group函数，将2015年的数据按照月份分组。这里需要特别说明的是，SPL的数据分组，是真实的分组，会根据需要将数据实际分为多个组。这和SQL中的情况不同，SQL中的group by命令是直接计算分组的汇总值，并不能保留中间的分组结果。因此也就无法对分组的数据进一步计算了。分组后，A3中的数据如下：