为什么「上下文检索」是提升 RAG 系统问答准确度的关键?

3 月 7 日
阅读 16 分钟
335
为什么明明答案就在知识库里,但 AI 却无法准确回答?原因之一是由于 RAG 系统处理文档的方式。“文档切块”步骤导致丢失语义缺失、语义歧义或全局结构缺失,AI可能只看到了“局部信息”,却忽略了“全局意义”。这正印证了莫拉维克悖论——对人类而言是基于直觉的语义衔接,对AI却是一个需要复杂计算的挑战。针对这一问题,庖丁...
封面图

PDF之父的三个关键抉择

2024-05-15
阅读 3 分钟
365
编者按:迄今为止,PDF仍然是在商业领域中(特别是金融领域)最广泛使用的电子文档格式。庖丁科技以此文悼念PDF文档格式的共同发明者 — Charles Geschke博士,并纪念这一改变人类阅读方式的伟大发明。欲了解更多PDF文档格式和历史,请阅览《电子文档全景结构识别漫谈》。
封面图

大语言模型的技术发展及金融领域应用展望

2024-05-15
阅读 7 分钟
557
3 月 15 日,美国人工智能公司 OpenAI 发布 GPT-4 多模态大模型,支持文本和图像输入;与 GPT-3.5 相比,其回答准确度、文字输入长度等各方面性能显著提升。
封面图