开发基于低成本人工智能的相似性搜索

主要观点：人工智能（AI）和大型语言模型（LLM）常给人高门槛印象，作者通过构建名为“Wiki 导航器”的项目证明学习其基本原理无需复杂设置，重点介绍基于向量嵌入等核心概念的 RAG 搜索解决方案及其在不同场景的应用，如在 Chromium 开源代码库和 Rust 编程语言相关书籍上的训练，还探讨了相似性搜索的细节、算法一致性等方面，强调基础概念对普通人的可及性及后续探索方向。
关键信息：

“Wiki 导航器”利用 tokenization、vector embeddings 和 cosine similarity 构建 RAG 搜索解决方案，可在 Chromium 代码库中运行，后又用于训练 Rust 编程语言的聊天机器人。
相似性搜索核心概念包括训练阶段将文档转换为向量嵌入，查询阶段将用户提问转换为向量并与文档向量比较，通过余弦相似度操作找到最接近匹配。
实现相似性搜索需确保 C#和 JavaScript 中算法的一致性，包括 tokenization 和向量计算等步骤，以保证查询结果一致。
系统具有三阶段架构处理复杂查询，包括上下文数据库准备、用户查询处理和通用知识检索（RAG 回退），保证答案有依据。
实践探索暴露相似性搜索的实际见解，如可不用 AI 模型仅用纯哈希嵌入，以及“余弦相似度滥用”等问题。
重要细节：
训练向量嵌入过程对大型语料库约需一小时，文中主要聚焦简单哈希方法，也有基于预训练模型的 AI 模型解决方案在生产中运行。
C#中VectorUtils类负责计算余弦相似度，JavaScript 中在客户端实时计算相似性并处理用户查询。
系统通过不同阶段处理查询，根据置信度选择不同回答方式，且答案可基于引用或仅返回有效 URL 链接。
实践探索暴露的问题如“余弦相似度滥用”等是“提示注入”问题的一部分，对 AI 用户和开发者构成威胁。
鼓励探索开源代码，如Source code等，开启后续 AI 项目探索。