权重提升：从入门到“巅峰”——工程师必须跨越的 8 道难关

主要观点：向量搜索纸面上简单，实际应用却易遇雷区，如云服务账单爆炸、搜索结果跑偏等。介绍 8 个常见“坑”及避坑策略，包括忽视评估、无视混合搜索、过度优化、不量化 Embedding、硬抗内存索引、跳过微调、把向量检索库当数据库、不敢直视原始数据和分块等，强调构建性能稳定、结果靠谱且成本可控的向量搜索 pipeline 需注意这些问题。
关键信息：

8 个“坑”及对应破法：
- 忽视评估：建小评估集、用标准指标、监控效果变化。
- 无视混合搜索：结合向量和关键词搜索、提升召回率、重排结果。
- 过度优化：设定基线、量化评估、小步迭代。
- 不量化 Embedding：拥抱量化技术、尝试低维、相信重排器力量。
- 硬抗内存索引：采用磁盘索引、预估规模、关注延迟变化。
- 跳过微调：微调 Embedding 模型和重排器、用评估集验证。
- 把向量检索库当数据库：选用真正向量数据库、确认混合搜索、检查元数据过滤。
- 不敢直视原始数据和分块：抽查分块结果、手动干预问题数据、根据用户反馈迭代。
总结：向量搜索利弊并存，无论向量数量多少，都应注意这些坑点并采取相应解法，可构建良好的向量搜索 pipeline。
重要细节：
评估能让团队摆脱瞎猜，确定改动效果。
混合搜索可结合向量和关键词搜索优势，提升召回率。
过度优化易陷入误区，应先建立基线并量化评估。
量化 Embedding 可降低内存成本，提升性能。
采用磁盘索引可降低内存使用量，不影响查询延迟。
微调可提升 embedding 在特定领域的表达能力。
选择成熟向量数据库可解决生产环境问题。
可手动调整数据和分块解决查询问题。