Oracle中用GROUPING SETS分组自定义汇总

本文通过文章作者的亲身经历来讲解如何在Oracle数据库中使用GROUPING SETS分组自定义。

当你与COUNT和SUM这类总计函数一起使用GROUP BY语句时,你一般得不到多级总数。GROUP BY中每个唯一的列组合生成一个总数,但这些总数不会“累加”到更高一级的总数中。

要实现这一点,你可以用GROUP BY ROLLUP或GROUP BY CUBE替代GROUP BY,不过它们会生成所有可能的总数,而你可能不需要全部总数。对GROUP BY CUBE而言,将会生成2^n组总数,这里的n是GROUP BY中列的数目。

查看下面的查询,它使用了SH样本模式:

SELECT prod_id, cust_id, channel_id, SUM(quantity_sold)

FROM sales

WHERE cust_id < 3

GROUP BY CUBE (prod_id, cust_id, channel_id)

这将生成8组总数:
所有行的总和

每个通道,包括所有产品和顾客。

每个顾客,包括所有产品和通道。

每项产品,包括所有顾客和通道。

每个通道/顾客组合,包括所有产品。

每个通道/产品组合,包括所有顾客。

每个产品/顾客组合,包括所有通道。

每个产品、顾客和通道组合。

可能的组合非常多。GROUP BY CUBE中每增加一列,生成的总数就会翻一番。

可以用GROUP BY GROUPING SETS来代替GROUP BY CUBE。你可以应用来指定你感兴趣的总数组合。因为它不必计算它不需要集合(也不会产生太多结果),所以对SQL引擎来说更为高效。

其格式为:

GROUP BY GROUPING SETS ((list), (list) ... )

这里(list)是圆括号中的一个列序列,这个组合生成一个总数。要增加一个总和,必须增加一个(NUlL)分组集。

例如,如果只要生成每项产品(包括所有顾客和通道)和每个顾客/通道组合(包括所有产品)的总数,可以输入:

SELECT prod_id, cust_id, channel_id, SUM(quantity_sold)

FROM sales

WHERE cust_id < 3

GROUP BY GROUPING SETS (

(prod_id), (cust_id, channel_id)

);

这种方法将这个数据集生成的总数数量从180个减少到37个,并帮助你着重回答你希望解答的问题。