测试环境 X表数据量30万 Y表数据量2000 X表索引：verify_user_id,state,verify_user_id_state(联合索引) Y表索引：user_id 测试1（左连接） sql select count(*) from X A left join Y B on A.verify_user_id=B.user_id where A.state='2' explain分析 1 SIMPLE A ref state state 5 const 258460 100 Using index condition 1 SIMPLE B ref user_id_index user_id_index 5 db.A.verify_user_id 1 100 Using index 执行用时 2.4秒测试2（笛卡尔积） sql select count(*) from X A, Y B where A.verify_user_id=B.user_id and A.state='2' explain分析 1 SIMPLE B index user_id_index user_id_index 5 1833 100 Using where; Using index 1 SIMPLE A ref verify_user_id,state,verify_user_id_state verify_user_id_state 10 db.B.user_id,const 264 100 Using where; Using index 执行用时 0.6秒问题为什么用笛卡尔积查询反而比左连接效率更高？

sql尽量使用数据量小的表做主表，这样效率高，如果使用数据量大的表做主表，此时使用left join 就会比较慢，即使关联条件有索引。但如果使用inner join速度就较快。因为inner join 在执行的时候回自动选择最小的表做基础表，效率高，总之相比之下inner join不管从效率还是速度上都优于left join，毕竟left join 会多一部分逻辑运算选择inner join还有个好处，不会产生null,有些表我们在定义的时候某些字段不允许存在null,如果用left join就可能会产生null,此时软件就会报错，而inner join可以避免具体看实际场景吧

为什么sql进行count统计时笛卡尔积比左连接效率高？

秦羽

3681575100

发布于
2021-09-07

更新于
2021-09-07

测试环境

X表数据量30万
Y表数据量2000
X表索引：verify_user_id,state,verify_user_id_state(联合索引)
Y表索引：user_id

测试1（左连接）

select count(*) from X A left join Y B on A.verify_user_id=B.user_id where A.state='2'

explain分析

1    SIMPLE    A        ref    state    state    5    const    258460    100    Using index condition
1    SIMPLE    B        ref    user_id_index    user_id_index    5    db.A.verify_user_id    1    100    Using index

执行用时
2.4秒

测试2（笛卡尔积）

select count(*) from X A, Y B where A.verify_user_id=B.user_id and A.state='2'

explain分析

1    SIMPLE    B        index    user_id_index    user_id_index    5        1833    100    Using where; Using index
1    SIMPLE    A        ref    verify_user_id,state,verify_user_id_state    verify_user_id_state    10    db.B.user_id,const    264    100    Using where; Using index

执行用时
0.6秒

问题

为什么用笛卡尔积查询反而比左连接效率更高？

mysql mysql优化 mysql索引 sql 数据库

阅读 4.3k

3 个回答

✓ 已被采纳

sql尽量使用数据量小的表做主表，这样效率高，如果使用数据量大的表做主表，此时使用left join 就会比较慢，即使关联条件有索引。但如果使用inner join速度就较快。因为inner join 在执行的时候回自动选择最小的表做基础表，效率高，总之相比之下inner join不管从效率还是速度上都优于left join，毕竟left join 会多一部分逻辑运算
选择inner join还有个好处，不会产生null,有些表我们在定义的时候某些字段不允许存在null,如果用left join就可能会产生null,此时软件就会报错，而inner join可以避免
具体看实际场景吧