引言
PostgreSQL 与 Oracle 的语法差异较大,为兼容 Oracle 语法并保持原生 PostgreSQL 语法,IvorySQL 采用了双 Parser 框架,动态切换不同 Parser,实现 Oracle 兼容语法与 PostgreSQL 原生语法的共存。
双 Parser 架构设计总览
双 Parser 的实现目标是在 SQL 和服务器编程语言两个层面兼容 Oracle。通过端口选择或兼容模式设定,实现 Oracle/PG 语法解析的“热切换”。
涉及到的核心模块包括:
- SQL 解析层,即 Oracle 风格语法树生成;
- 服务器端编程语言层(通过全新的 PL/iSQL 过程语言实现兼容 Oracle 的 PLSQL)
SQL 端词法语法分离
概述
基本做法是新增一套兼容 Oracle 风格的语法和词法,在开启 Oracle 兼容模式时,采用 Oracle 风格的语法分析,生成对应的语法树。
具体实现步骤
在 src/backend/
目录下新建一个 oracle_Parser
目录,将 src/backend/Parser/
中的 scan.l
和 gram.y
复制到新目录,并分别重命名为 ora_gram.y
和 ora_scan.l
,添加 Oracle 风格的语法和词法分析代码。同时,将 keywords.c
文件复制到该目录,用于存放自定义的关键字。该 oracle_Parser
目录会编译成一个动态库 libParser_oracle.so
。当开启 Oracle 兼容模式时,配置文件 ivorysql.conf
将被嵌入到 postgresql.conf
的末尾,并在 ivorysql.conf
中的 shared_preload_libraries
参数中添加 liboracle_Parser
,确保数据库启动时自动加载 liboracle_Parser
动态库。
新增 ora_raw_Parser
函数指针,当 libParser_oracle.so
动态库加载时,动态库中的 _PG_init()
函数会将 oracle_raw_Parser()
函数的地址赋值给 ora_raw_Parser
,而 _PG_fini()
函数则在兼容模式切换时负责将 ora_raw_Parser
重置为空。
每个后端进程会调用 BackendInitialize()
函数,根据后端进程所连接的端口号设置 port->connmode
。如果端口是 Oracle 兼容端口,则将 connmode
设置为 'o'
,否则设置为 'p'
。
在 PostgresMain()
调用 InitIvorysql()
后,如果 port->connmode
为 'o'
,则调用 SetConfigOption("ivorysql.compatible_mode", "oracle", PGC_USERSET, PGC_S_OVERRIDE)
。由于该参数设置了 assign_hook
,在 SetConfigOption()
中执行 assign_hook()
时,实际上会调用 assign_compatible_mode()
,从而将 sql_raw_Parser
设置为 ora_raw_Parser
。
在对 SQL 语句进行分析时,函数 pg_parse_query()->raw_Parser()
通过函数指针 sql_raw_Parser
调用 standard Parser()
或者 ora_raw_Parser()
。
下面的图演示了 SQL 语句分析时发生的事情。
服务器端编程语言词法语法分离
概述
与 SQL 端类似,基本做法是新增一套兼容 Oracle 风格的编程语言 PL/iSQL,在开启 Oracle 兼容的情况下,使用 PL/iSQL 语言进行编译。
具体实现步骤
将 PostgreSQL 源码中的 plpgsql
目录复制一份并改名为 plisql
,同时将目录内的文件名修改为以 plisql
开头。由于 plpgsql
是一种语言,改造后的 plisql
也将成为一种语言,因此,plpgsql
语言的注册函数如 plpgsql_validator
、plpgsql_call_handler
、plpgsql_inline_handler
等也需要修改为以 plisql
开头,其他函数名同样按此规则改为以 plisql
开头。
plisql
目录构建为一个插件,initdb 时如果数据库模式是 Oracle,则创建这个插件。这个插件会将 pliSQL 语言注册到数据库的系统表中。
PL/iSQL 本身没有独立的词法解析体系,而是依赖于 SQL 端的词法分析器。因此,为了确保 PL/iSQL 兼容 Oracle 的词法规则,主要的改造是在 plisql_scanner_init
函数中,需调用 ora_scanner_init()
函数,同时,plisql
目录中的 internal_yylex()
函数也应调用 ora_core_yylex()
。
PL/iSQL 语法规则在 plisql/src/pl_gram.y
中,兼容 Oracle PLSQL 块的语法规则都在这个模块中实现。
SQL 端创建函数,没有指定 language 的时候,如果当前是兼容 Oracle 模式,则默认 language 是 PL/iSQL,如果是兼容 pg 模式,则默认 language 是 PL/pgSQL。oracle_Parser
中的 ora_gram.y
默认是 PL/iSQL,pg Parser 中的 gram.y
默认是 PL/pgSQL。
匿名块没有指定 language 的时候,如果是兼容 Oracle 模式,默认 PL/iSQL;如果是兼容 pg 模式,则默认 PL/pgSQL。
处理过程的 ExecuteDoStmt 函数同样根据兼容模式来决定默认 language。
下面的图演示了块语句编译分析时发生的事情。
总结
双 Parser 框架作为 IvorySQL 的重要基础,确保同时支持原生 PG 与 Oracle 语法风格,避免两者相互干扰,为 IvorySQL 的兼容特性提供了坚实保障。
IvorySQL 生态大会预告
2025 年 6 月 27 日,IvorySQL 生态大会将在济南盛大开幕,已确认多位全球 PostgreSQL 大咖参与,包括:
Bruce Momjian:PG 全球开发小组联合创始人和核心团队成员
Cédric Villemain:法国,Data Bene 创始人&CEO
Chris Travers:印度尼西亚,PG 和基础设施专家
Ivan Blinkov:俄罗斯,YDB 副总裁
Michael Meskes:德国,Meskes 董事长(原 Credativ 创始人)
Yurii Rashkovskii:加拿大,Omnigres 公司创始人
Álvaro Hernández:西班牙,OnGres 创始人
更多重量级嘉宾正在确认中!目前议题仍在火热征集中,欢迎提交您的议题!
无论你是数据库开发者、架构师还是技术爱好者,这都是与全球顶尖专家面对面交流的绝佳机会。6 月 27 日,相约济南,共同探索 PostgreSQL 的无限可能!
本文由博客一文多发平台 OpenWrite 发布!
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。