引言

PostgreSQL 与 Oracle 的语法差异较大,为兼容 Oracle 语法并保持原生 PostgreSQL 语法,IvorySQL 采用了双 Parser 框架,动态切换不同 Parser,实现 Oracle 兼容语法与 PostgreSQL 原生语法的共存。

双 Parser 架构设计总览

双 Parser 的实现目标是在 SQL 和服务器编程语言两个层面兼容 Oracle。通过端口选择或兼容模式设定,实现 Oracle/PG 语法解析的“热切换”。

涉及到的核心模块包括:

  • SQL 解析层,即 Oracle 风格语法树生成;
  • 服务器端编程语言层(通过全新的 PL/iSQL 过程语言实现兼容 Oracle 的 PLSQL)

SQL 端词法语法分离

概述

基本做法是新增一套兼容 Oracle 风格的语法和词法,在开启 Oracle 兼容模式时,采用 Oracle 风格的语法分析,生成对应的语法树。

具体实现步骤

src/backend/ 目录下新建一个 oracle_Parser 目录,将 src/backend/Parser/ 中的 scan.lgram.y 复制到新目录,并分别重命名为 ora_gram.yora_scan.l,添加 Oracle 风格的语法和词法分析代码。同时,将 keywords.c 文件复制到该目录,用于存放自定义的关键字。该 oracle_Parser 目录会编译成一个动态库 libParser_oracle.so。当开启 Oracle 兼容模式时,配置文件 ivorysql.conf 将被嵌入到 postgresql.conf 的末尾,并在 ivorysql.conf 中的 shared_preload_libraries 参数中添加 liboracle_Parser,确保数据库启动时自动加载 liboracle_Parser 动态库。

新增 ora_raw_Parser 函数指针,当 libParser_oracle.so 动态库加载时,动态库中的 _PG_init() 函数会将 oracle_raw_Parser() 函数的地址赋值给 ora_raw_Parser,而 _PG_fini() 函数则在兼容模式切换时负责将 ora_raw_Parser 重置为空。

每个后端进程会调用 BackendInitialize() 函数,根据后端进程所连接的端口号设置 port->connmode。如果端口是 Oracle 兼容端口,则将 connmode 设置为 'o',否则设置为 'p'

PostgresMain() 调用 InitIvorysql() 后,如果 port->connmode'o',则调用 SetConfigOption("ivorysql.compatible_mode", "oracle", PGC_USERSET, PGC_S_OVERRIDE)。由于该参数设置了 assign_hook,在 SetConfigOption() 中执行 assign_hook() 时,实际上会调用 assign_compatible_mode(),从而将 sql_raw_Parser 设置为 ora_raw_Parser

在对 SQL 语句进行分析时,函数 pg_parse_query()->raw_Parser() 通过函数指针 sql_raw_Parser 调用 standard Parser() 或者 ora_raw_Parser()

下面的图演示了 SQL 语句分析时发生的事情。

服务器端编程语言词法语法分离

概述

与 SQL 端类似,基本做法是新增一套兼容 Oracle 风格的编程语言 PL/iSQL,在开启 Oracle 兼容的情况下,使用 PL/iSQL 语言进行编译。

具体实现步骤

将 PostgreSQL 源码中的 plpgsql 目录复制一份并改名为 plisql,同时将目录内的文件名修改为以 plisql 开头。由于 plpgsql 是一种语言,改造后的 plisql 也将成为一种语言,因此,plpgsql 语言的注册函数如 plpgsql_validatorplpgsql_call_handlerplpgsql_inline_handler 等也需要修改为以 plisql 开头,其他函数名同样按此规则改为以 plisql 开头。

plisql 目录构建为一个插件,initdb 时如果数据库模式是 Oracle,则创建这个插件。这个插件会将 pliSQL 语言注册到数据库的系统表中。

PL/iSQL 本身没有独立的词法解析体系,而是依赖于 SQL 端的词法分析器。因此,为了确保 PL/iSQL 兼容 Oracle 的词法规则,主要的改造是在 plisql_scanner_init 函数中,需调用 ora_scanner_init() 函数,同时,plisql 目录中的 internal_yylex() 函数也应调用 ora_core_yylex()

PL/iSQL 语法规则在 plisql/src/pl_gram.y 中,兼容 Oracle PLSQL 块的语法规则都在这个模块中实现。

SQL 端创建函数,没有指定 language 的时候,如果当前是兼容 Oracle 模式,则默认 language 是 PL/iSQL,如果是兼容 pg 模式,则默认 language 是 PL/pgSQL。oracle_Parser 中的 ora_gram.y 默认是 PL/iSQL,pg Parser 中的 gram.y 默认是 PL/pgSQL。

匿名块没有指定 language 的时候,如果是兼容 Oracle 模式,默认 PL/iSQL;如果是兼容 pg 模式,则默认 PL/pgSQL。

处理过程的 ExecuteDoStmt 函数同样根据兼容模式来决定默认 language。

下面的图演示了块语句编译分析时发生的事情。

总结

双 Parser 框架作为 IvorySQL 的重要基础,确保同时支持原生 PG 与 Oracle 语法风格,避免两者相互干扰,为 IvorySQL 的兼容特性提供了坚实保障。

IvorySQL 生态大会预告

2025 年 6 月 27 日,IvorySQL 生态大会将在济南盛大开幕,已确认多位全球 PostgreSQL 大咖参与,包括:

Bruce Momjian:PG 全球开发小组联合创始人和核心团队成员
Cédric Villemain:法国,Data Bene 创始人&CEO
Chris Travers:印度尼西亚,PG 和基础设施专家
Ivan Blinkov:俄罗斯,YDB 副总裁
Michael Meskes:德国,Meskes 董事长(原 Credativ 创始人)
Yurii Rashkovskii:加拿大,Omnigres 公司创始人
Álvaro Hernández:西班牙,OnGres 创始人
更多重量级嘉宾正在确认中!目前议题仍在火热征集中,欢迎提交您的议题

无论你是数据库开发者、架构师还是技术爱好者,这都是与全球顶尖专家面对面交流的绝佳机会。6 月 27 日,相约济南,共同探索 PostgreSQL 的无限可能!

本文由博客一文多发平台 OpenWrite 发布!

IvorySQL
1 声望0 粉丝

IvorySQL 是瀚高公司主导研发的一款兼容 Oracle 的开源 PostgreSQL 数据库。