本文内容来自YashanDB官网,具体内容请见[https://www.yashandb.com/newsinfo/7396959.html?templateId=171...]()

问题现象

yashandb执行带oracle dblink表的sql性能差:


同样的语句,同样的数据,oracle通过dblink访问远端oracle执行,耗时不到1秒钟:

问题的风险及影响

yashandb通过dblink访问oracle性能不佳,影响业务运行效率及客户体验

问题影响的版本

截止目前所有的yashandb版本

问题发生原因

yashandb在访问远端oracle的数据时,拉取了表的所有列。并且每批次只拉取16条数据,在网络有时延时(现场网络时延0.4ms),会有额外的网络传输耗时。

解决方法及规避方式

内核修改代码优化。规避方式为在远端oracle侧创建视图,只查询需要的列。

问题分析和处理过程

使用 sudo tc qdisc add dev bond1 root netem delay 0.45ms 命令模拟网络时延

并将客户的数据导回来,在测试环境模拟重现,yashandb的耗时:

oracle的耗时:

细观察oracle的执行计划,我们可以发现,其访问远端表并不是将所有列的数据拉回来了,而只是拉回来了select查询语句中需要的列:

使用OCI驱动编程使用示例 中提供的例子可以分析oci的耗时。

fetch size如果为2000,只从CUX.CUX\_PM\_PG\_SUB\_PROJECTS表中查询"SUB\_PROJECT\_ID","PROJECT\_NAME"两列,耗时100ms左右,注意此时的网络时延仍然为0.45ms:

结合以上分析,yashan需要优化的方向为:

1、只从dblink拉取查询需要的列数据

2、设置合理的fetch size,不能太小

经验总结

使用oci编程可以验证yashandb访问oracle dblink远端表在不同情况下的性能表现


YashanDB
1 声望0 粉丝

崖山数据库系统YashanDB是深圳计算科学研究院自主设计研发的新型数据库管理系统,融入原创的有界计算、近似计算、并行可扩展和跨模融合计算理论,可满足金融、政企、能源等关键行业对高性能、高并发及高安全性的...