使用 pgvector 和 Next.js 构建语义电影搜索演示

发布于 2025-01-30

主要观点：介绍了用向量嵌入技术实现语义电影搜索的项目，包括背景、实现细节、可重复性措施、应用开发、部署及性能等方面。
关键信息：

背景：AI 发展迅速易错过创新，向量嵌入因检索增强生成技术应用更广泛，作者曾在搜索团队维护 ElasticSearch 集群，对向量嵌入感兴趣但不知从何开始。
实现：以电影为主题，从 Kaggle 获得 45000 部电影数据，用 PostgreSQL 数据库结合 pgvector 扩展存储电影及嵌入向量，选择 gte-small 嵌入模型，用 JavaScript 代码生成嵌入向量。
可重复性：添加下载数据集脚本和种子脚本，集成 devenv 确保项目可在不同环境中重现。
应用：用 Next.js 开发 Web 应用，使用 Slonik 进行数据库操作，UI 简单易用，不使用 ORM。
部署：用 Vercel 部署，其与 Supabase 集成提供免费 PostgreSQL 数据库，需设置环境变量 NODE_TLS_REJECT_UNAUTHORIZED=0。
性能：本地测试结果有时不理想，嵌入模型小且数据量少，有一定容错性，能找到与搜索词相关的电影。
结论：对项目结果虽有遗憾但仍觉神奇，承认语义搜索非万能，未来希望使用多模态嵌入模型，源代码在 GitHub 上可查看。
重要细节：
代码部分详细展示了生成嵌入向量、插入数据库、查询相似电影等过程的代码实现。
提及多个相关技术的参考资料，如 word2vec、React 新特性等。
介绍了项目在不同阶段所使用的工具和技术，如 devenv、Slonik、Zod 等。

阅读 19