机器阅读理解之多答案抽取论文推荐

百度本次答案抽取的任务比较特殊，相当于每个问题对应的答案片段会分布在文档的多个位置，传统的答案抽取模型不能直接抽取多片段答案，下面是调研了一些多片段抽取论文，可以学习下

A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning （Hu et al., 2019）

本文通过增加一个预测answer span的数目的分类子任务，结合non-maximum suppression (NMS) 算法，得到置信度最高且互不重叠的个answer span。

这是一个多类型、多跨度的阅读理解网络，需要对段落内容进行离散推理。我们增强了一个支持逻辑否定的多类型答案预测器，提出了一种产生多个答案的多跨度抽取方法，并设计了一个算术表达式重排机制来进一步确认预测。我们的模型在DROP隐藏测试集上实现了79.9 F1，创造了新的最先进的结果。作为未来的工作，我们将考虑处理其他类型，如排序或乘法/除法。我们还计划探索更先进的方法来进行复杂的数字推理。

https://github.com/huminghao1...

Tag-based Multi-Span Extraction in Reading Comprehension (Efrat et al., 2019）

本文富有创意地的结合了MRC和NER两种任务的思路处理多答案抽取，后续DROP的top solution大多延续了本文的思路。

https://github.com/eladsegal/...

论文链接：https://arxiv.org/pdf/1909.13...

机器阅读理解之多答案抽取论文推荐

WintoMT

引用和评论

学习笔记：使用 Amazon Bedrock 进行图像生成

百度 Create AI 开发者大会：李彦宏发布两大新模型、多款热门 AI 应用，帮助开发者全面拥抱 MCP

千亿级打点PV的成本治理实践

两连发！文心大模型4.5及X1，上线千帆！

图灵数据洞察平台-TDF（Turing Data Finder）

百度大模型产品与技术生态（2025年5月）

名列前茅！百度文心大模型4.5及X1在中国信通院“方升”大模型基准测试中表现优异