SQL这么写！你是给自己挖坑.....

作者：会技术的葛大爷
原文：https://www.toutiao.com/i6606...

SQL是作为一个程序员接触得非常多的一种语言，但是，很多时候，我们会发现，有些SQL的执行效率异常的差，造成了数据库的负担。我们通过分析这些有问题的SQL，就可以发现很多我们平时在写SQL的时候忽略的问题。

今天，我们就来讲一下这些需要改掉的坏习惯。

尽量少用负向条件查询

==========

假设我们有一个Order表，表中有一个字段是Status，这个字段有4个值，分别是0=待支付、1=待发货、2=待收货、3=已完成。

这时，我们要查询所有已经支付的订单，很多人就会写这样的SQL：

select * from Order where Status != 0

这就是一个不好的习惯了。负向条件查询（例如：!=、not in、not exists）都是不能使用索引的，当Order表中的数据到达一定量级时，这个查询的效率会急剧的下降。

所以，正确的写法应该是：

select * from Order where Status in (1,2,3)

尽量少用前导模糊查询

==========

假设我们现在要根据用户的订单号（OrderNo）查询用户的订单，如果是直接通过SQL查询的话，尽量不要使用前导模糊查询，也就是：

select * from Order where OrderNo like '%param'

或者

select * from Order where OrderNo like '%param%'

因为，前导模糊查询是无法命中索引的，所以，会整个数据库去检索，效率相当的差，而非前导模糊查询则是可以使用索引的。

因此，我们尽量不要把通配符放在前面，改成下面这样：

select * from Order where OrderNo like 'param%'

尽量不要在条件字段上进行运算

==============

假设，现在有一个需求，是要查询2018年全年的订单数据，我们就需要通过创建时间（CreateTime）来进行检索，但是，有些程序员就喜欢这样写SQL：

select * from Order where Year(CreateTime)=2018

然后，每次执行时就会发现，查询的速度异常的慢，导致了大量的请求挂起甚至超时。这是因为，我们即使在CreateTime上建立了索引，但是，如果使用了运算函数，查询一样会进行全表的检索。

所以，我们可以改成这样：

select * from Order where CreateTime > '2018-1-1 00:00:00'

当查询允许Null值的列时，需要特别注意

====================

我们在创建表的字段时，如果这个字段需要作为索引时，尽量不要允许Null。因为，单列索引不会存Null值，复合索引不存所有索引列都为Null的值，所以如果列允许为Null，可能会得到“不符合预期”的结果集。

例如：我们有一个User表，其中有UserName字段记录了用户的名字，并且添加了索引。

现在我们执行了这样一个查询：

select * from User where UserName != '小倩'

但结果是这样的

那位UserName为Null的数据并没有能包括进来。因此，如果我们想要包含这个用户的话，最好能够设置一个默认值。

复合索引，使用时要注意顺序

=============

当我们使用

select * from User where LoginID = '{LoginID}' and Password = '{Password}'  

select * from User where Password = '{Password}' and LoginID = '{LoginID}'

查询时，都是能够准备的命中索引。当我们使用：

select * from User where LoginID = '{LoginID}'

查询时，也是能够命中索引的。但是，当我们使用

select * from User where Password = '{Password}'

查询时，确无法命中索引，这是什么原因呢？

这是由于，复合索引对于查询的顺序是非常的铭感的，所以，符合索引中包含了几种规则，其中就有全列匹配和最左前缀匹配。

当所有列都能够匹配时，虽然查询的顺序上有不同，但是查询优化器会将顺序进行调整，以满足适合索引的顺序，所以，顺序的颠倒是没有问题的。

但是，如果所有列不能匹配时，就必须满足最左前缀匹配了，也就是，必须按照从左到右的顺序进行排列。因此，当我们建立是索引是<LoginID, Password>时，where Password = '{Password}' 就不满足最左前缀规则，无法命中索引了。

结果唯一时，别闷着

=========

通常，我们设计User表时，并不会把LoginID作为主键，但是，LoginID确会在业务逻辑中验证唯一性，因此，如果使用

select * from User where LoginID = '{LoginID}'

查询时，结果一定只有一条。但是，数据库是不知道的，即使找到了这唯一的一条结果，他也会一直继续，直到扫描完所有的数据。

因此，在执行这样的查询时，我们可以优化一下，改成：

select * from User where LoginID = '{LoginID}' limit 1

这样，当查询到结果时，就不会再继续了。

最后，上面所有的例子都是坑

=============

尽量少用或别用Select ，我们的查询其实都是有目的的，就好像登录一样，我们其实只需要知道有结果返回就行了，使用select count(0)就可以了，但是我们使用select 的话，就会消耗大量无效的数据库内存。

SQL这么写！你是给自己挖坑.....

尽量少用负向条件查询

尽量少用前导模糊查询

尽量不要在条件字段上进行运算

当查询允许Null值的列时，需要特别注意

复合索引，使用时要注意顺序

结果唯一时，别闷着

最后，上面所有的例子都是坑

民工哥

引用和评论

早知道有这么个吊炸天的 CI&CD 工具，我就不用 Jenkins 了！

70k star，取代Postman！这款轻量级API工具，太香了！

C++ 中 VS 项目引入公共配置文件

MySQL慢查询日志：性能优化的终极指南

做到真正0丢失、0重复：Apache SeaTunnel 实现万亿级数据一致性全解密

大数据从业者必知必会的Hive SQL调优技巧

疯狂推荐！从零开始 Dify 部署全攻略！