1.优化COUNT()查询

首先我们先回顾以下聚合函数COUNT()的一些用法。简单的将,COUNT()函数的用法有两种,一种是统计表的行数,用法如下:

mysql> SELECT COUNT() FROM user;

第二种用法就是统计一个具体的数据列的非空值的数量:

mysql> SELECT COUNT(age) FROM user;
  • 简单的优化:

当我们使用COUNT()计算数据表的行数的时候,大多数存储引擎都不会去完整的遍历一个表来得到他的行数,而是可以利用存储引擎的特性来直接得到这个值。(这建立在没有where条件的COUNT(\)语句中)。因此我们可以利用这个特质优化以下情况的查询:

mysql> SELECT COUNT(*) FROM user WHERE age > 25;

如果我们假设总共有10000个数据,而上述的查询语句需要查询9000行,这显然是一个效率很差的结果,因此可以将查询转化为:

mysql> SELECT (SELECT COUNT(*) FROM user) - COUNT(*) FROM user WHERE age <= 25;

上面这个转换看似将一次查询变成了两次,但是实际上获得全表的count非常的快,而获得age<=25的数据只需要查询1000行,这显然比直接查询age>25需要查询9000行来的快得多。

  • 使用近似值

有时候我们在工程与项目中使用COUNT()函数,可能并不是需要一个准确的数量值,而只是想知道当前数据库数据的规模。例如当下想知道网站的活跃用户的数量,这往往只需要知道数据的量级,例如是100000量级还是1000000量级,而对于低位的具体数字就显得不是那么的重要了。因此我们可以在COUNT()语句前面使用EXPLAIN关键字,EXPLAIN关键字会解析SQL语句,并返回一个大致的查询行数的估算值,注意此时并不需要执行真正的查询,因此成本很低。

2.优化关联查询

  • 确保ON或USING子句中的列有索引,创建索引的时候就需要考虑到关联的顺序。
  • 确保所有GROUP BY和ORDER BY中的表达式只涉及到一个表中的列。

3.优化子查询

关于子查询的优化我们给出的最重要的建议就是尽可能使用关联查询代替子查询。

4.优化GROUP BY()语句

通常对GROUP BY的分组要求,我们往往是借助索引来进行优化。因为索引其实在创建的时候就已经默认的帮助我们将该列的数据进行了按照一定规律的分组,因此当我们可以预见将会对某一个数据列使用GROUP BY语句的时候,可以在创建时在该列上添加上索引。同样的在多个表的关联查询中,我们如果想要的得到分组的效果,最好对一个表上的标识列进行分组。

5.优化UNION查询

如果不是确实需要服务器消除重复的行,否则就一定要使用UNION ALL。如果没有ALL关键字,MySQL会给临时表加上一个DISTINCT选项,这会导致对整个表进行数据的唯一性检查,这样做的代价非常高。事实上,即使有ALL关键字,MySQL仍会使用临时表存储结果,再读出,但是没有唯一性检查将会大大降低查找代价。


超人不会飞
12 声望4 粉丝

一个想去做开发的研究生