百度本次答案抽取的任务比较特殊,相当于每个问题对应的答案片段会分布在文档的多个位置,传统的答案抽取模型不能直接抽取多片段答案,下面是调研了一些多片段抽取论文,可以学习下
- A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning (Hu et al., 2019)
本文通过增加一个预测answer span的数目的分类子任务,结合non-maximum suppression (NMS) 算法,得到置信度最高且互不重叠的 个answer span。
这是一个多类型、多跨度的阅读理解网络,需要对段落内容进行离散推理。我们增强了一个支持逻辑否定的多类型答案预测器,提出了一种产生多个答案的多跨度抽取方法,并设计了一个算术表达式重排机制来进一步确认预测。我们的模型在DROP隐藏测试集上实现了79.9 F1,创造了新的最先进的结果。作为未来的工作,我们将考虑处理其他类型,如排序或乘法/除法。我们还计划探索更先进的方法来进行复杂的数字推理。
https://github.com/huminghao1...
- Tag-based Multi-Span Extraction in Reading Comprehension (Efrat et al., 2019)
本文富有创意地的结合了MRC和NER两种任务的思路处理多答案抽取,后续DROP的top solution大多延续了本文的思路。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。