Timescale通过pgai向量化器增强AI就绪的PostgreSQL

Timescale 扩展 PostgreSQL AI 功能,推出 pgai Vectorizer

Timescale 最近通过 pgai Vectorizer 扩展了其 PostgreSQL AI 产品。这一更新使开发者能够在不需要外部工具或额外基础设施的情况下,直接在 PostgreSQL 中创建、存储和管理向量嵌入,同时与关系数据共存。

TimescaleDB 与 AI 集成

TimescaleDB 是一个针对时间序列数据优化的开源 PostgreSQL 扩展,最初通过实时分析功能增强了 PostgreSQL。现在,Timescale 通过 pgai 套件和 pgai Vectorizer 进一步增强了 AI 集成,使开发者能够在 PostgreSQL 中无缝进行 AI 开发。

开发中的挑战

在开发过程中,贡献者 Tostino 指出了一些问题,特别是 OpenAI API 的兼容性问题。当前的实现缺少一些必要的参数,无法在使用开源推理服务器时使用代理解决方案或自定义采样器。此外,Tostino 建议在原始函数返回 JSON 的基础上构建“简单”的包装函数,以增强灵活性。

pgai Vectorizer 的优势

构建搜索引擎和 AI 代理等 AI 系统通常需要复杂的工作流程。pgai Vectorizer 通过将整个 AI 工作流程集成到 PostgreSQL 中,简化了这一过程,使开发者能够使用熟悉的 SQL 命令快速高效地创建高级 AI 应用。

向量嵌入的处理

Timescale 认为将向量嵌入作为独立数据处理的标准方法会导致同步问题和数据过时。相反,TimescaleDB 提出将嵌入视为类似于数据库索引的派生数据,这与其他数据库(如 planetscale)通过“原生向量化器”抽象将嵌入集成到索引中的方法相似。pgai Vectorizer 在此基础上自动同步嵌入与源数据。

pgvector 和 pgvectorscale 扩展

pgvectorpgvectorscale 扩展允许在数据库中存储向量嵌入并执行快速高效的向量搜索。pgai Vectorizer 在这些扩展的基础上,自动为数据库中的任何文本数据创建和同步嵌入。

社区反馈与未来计划

社区对扩展支持的嵌入模型范围表现出兴趣。贡献者 claudeomusic 询问是否可以使嵌入模型的选择可配置,强调了灵活性的重要性。Timescale 的 alejandrodnm 确认,虽然当前 Vectorizer 仅支持 OpenAI 模型,但未来计划包括其他提供商,并欢迎社区贡献。

开发者资源

开发者可以使用预构建的 Docker 环境快速尝试嵌入功能,详见 Vectorizer 快速入门。详细的技术规格可参考 Vectorizer API 参考

阅读 43
0 条评论