面试官：GROUP BY和DISTINCT有什么区别？

在 MySQL 中，GROUP BY 和 DISTINCT 都是用来处理查询结果中的重复数据，并且在官方的描述文档中也可以看出：在大多数情况下 DISTINCT 是特殊的 GROUP BY，如下图所示：

官方文档地址：https://dev.mysql.com/doc/refman/8.0/en/distinct-optimization.html

但二者还是有一些细微的不同，接下来一起来看。

1.DISTINCT 介绍

SELECT DISTINCT column1, column2 FROM table_name;

用途：GROUP BY 主要用于对结果集按照一个或多个列进行分组，通常与聚合函数（如 COUNT, SUM, AVG, MAX, MIN 等）一起使用，以便对每个组进行统计。
语法：GROUP BY 通常跟在 FROM 或 WHERE 子句之后，在 SELECT 语句的末尾部分。例如以下 SQL：

SELECT column1, COUNT(*) FROM table_name GROUP BY column1;

假设有一个表 students，包含以下数据：

使用 DISTINCT 去除重复行：

SELECT DISTINCT name, age FROM students;

结果：

<font style="color:#1f2329;">name</font>	<font style="color:#1f2329;">age</font>
<font style="color:#1f2329;">Alice</font>	<font style="color:#1f2329;">20</font>
<font style="color:#1f2329;">Bob</font>	<font style="color:#1f2329;">22</font>

假设还是上面的表 students，我们想要统计每个学生的数量：

SELECT name, COUNT(*) AS count FROM students GROUP BY name;

结果：

<font style="color:#1f2329;">name</font>	<font style="color:#1f2329;">count</font>
<font style="color:#1f2329;">Alice</font>	<font style="color:#1f2329;">2</font>
<font style="color:#1f2329;">Bob</font>	<font style="color:#1f2329;">1</font>

功能不同：DISTINCT 用于去除重复行，而 GROUP BY 用于对结果集进行分组，通常与聚合函数一起使用。
返回结果不同：DISTINCT 返回去重后的结果集，查询结果集中只能包含去重的列信息，有其他列信息会报错；GROUP BY 返回按指定列分组后的结果集，可以展示多列信息，并可以包含聚合函数的计算结果。
应用场景不同：DISTINCT 更适合单纯的去重需求，GROUP BY 更适合分组统计需求。
性能略有不同：如果去重的字段有索引，那么 GROUP BY 和 DISTINCT 都可以使用索引，此情况它们的性能是相同的；而当去重的字段没有索引时，DISTINCT 的性能就会高于 GROUP BY，因为在 MySQL 8.0 之前，GROUP BY 有一个隐藏的功能会进行默认的排序，这样就会触发 filesort 从而导致查询性能降低。

count(*)、count(1) 和 count(字段) 有什么区别？

本文已收录到我的面试小站 www.javacn.site，其中包含的内容有：Redis、JVM、并发、并发、MySQL、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、设计模式、消息队列等模块。