本文内容来自YashanDB官网,原文内容请见https://www.yashandb.com/newsinfo/7802945.html?templateId=171...

【标题】复合索引下in大量参数查询性能慢

【关键字】复合索引 in 大量参数

【问题描述】

测试表数据量200w,表结构如图,且在ID和PHONE字段上创建了复合索引
image.png

测试SQL为:

复合索引下in大量参数查询性能慢
首页  ꁇ  复合索引下in大量参数查询性能慢
【标题】复合索引下in大量参数查询性能慢

【关键字】复合索引 in 大量参数

【问题描述】

测试表数据量200w,表结构如图,且在ID和PHONE字段上创建了复合索引

output

测试SQL为:

select name,sum(id) from test1119 where id > 50000 and phone in (...) group by name;

且in中的参数大于300个

执行时间:
image.png

且使用no_index_ffs的hint也无法达到优化

【问题原因分析】

检查执行计划可知,计划中先access ID>50000的区域,再用filter去过滤in大量参数的场景,整体性能较差

image.png

【解决/规避方法】

先将原本的复合索引设为invisible。

新建复合索引IND_TEST1119_PHONE_ID,将需要用in大量过滤的字段放在复合索引的前面。

alter index IND_TEST1119_ID_PHONE invisible;

create index IND_TEST1119_PHONE_ID on TEST1119(PHONE,ID);

检查执行计划,先access来过滤,复合预期

image.png

当前执行时间:

image.png

【影响范围】当前所有版本

【修复版本】-


YashanDB
1 声望0 粉丝

崖山数据库系统YashanDB是深圳计算科学研究院自主设计研发的新型数据库管理系统,融入原创的有界计算、近似计算、并行可扩展和跨模融合计算理论,可满足金融、政企、能源等关键行业对高性能、高并发及高安全性的...