头图

机器阅读理解之多答案抽取论文推荐

百度本次答案抽取的任务比较特殊,相当于每个问题对应的答案片段会分布在文档的多个位置,传统的答案抽取模型不能直接抽取多片段答案,下面是调研了一些多片段抽取论文,可以学习下

  1. A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning (Hu et al., 2019)

本文通过增加一个预测answer span的数目的分类子任务,结合non-maximum suppression (NMS) 算法,得到置信度最高且互不重叠的 个answer span。
image.png

这是一个多类型、多跨度的阅读理解网络,需要对段落内容进行离散推理。我们增强了一个支持逻辑否定的多类型答案预测器,提出了一种产生多个答案的多跨度抽取方法,并设计了一个算术表达式重排机制来进一步确认预测。我们的模型在DROP隐藏测试集上实现了79.9 F1,创造了新的最先进的结果。作为未来的工作,我们将考虑处理其他类型,如排序或乘法/除法。我们还计划探索更先进的方法来进行复杂的数字推理。

https://github.com/huminghao1...

  1. Tag-based Multi-Span Extraction in Reading Comprehension (Efrat et al., 2019)

本文富有创意地的结合了MRC和NER两种任务的思路处理多答案抽取,后续DROP的top solution大多延续了本文的思路。

https://github.com/eladsegal/...

论文链接:https://arxiv.org/pdf/1909.13...

1 声望
0 粉丝
0 条评论
推荐阅读
显式融合词法和句法特征的抽取式机器阅读理解模型
在做了一段时间之后,百度sti比赛分数上不去,下面是调研了答案抽取任务优化思路,主要是融合词法和句法特征的抽取式机器阅读理解模型, 在抽取式机器阅读理解数据集CMRC2018上的实验表明, 本文方法以极低的算力...

WintoMT阅读 439

封面图
文心一言:这48小时,我被问了xxxx个问题
16日下午14:00文心一言开启邀测了!作为国内首个新一代知识增强大语言模型、生成式 AI 产品,“邀测通道”瞬间被挤爆,甚至连百度人自己也需要排队等候。 但随着厂长的一声令下,开放了百度内部全员申请 

飞桨PaddlePaddle阅读 486

百度生成式AI产品文心一言邀请测试,五大场景、五大能力革新生产力工具
3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、...

飞桨PaddlePaddle阅读 377

百度APP iOS端包体积50M优化实践(一)总览
百度APP作为日活过亿的国民级应用,经过这些年的发展,从最初的搜索,发展到现在包含搜索、Feed、视频、直播、小说、购物、小程序、网盘和众多垂类模块的超级应用,为服务更多用户满足更多用户需求不断迭代,应用...

百度Geek说阅读 334

文心一言,通营销之学,成一家之言,百度人工智能AI大数据模型文心一言Python3.10接入
“文心”取自《文心雕龙》一书的开篇,作者刘勰在书中引述了一个古代典故:春秋时期,鲁国有一位名叫孔文子的大夫,他在学问上非常有造诣,但是他的儿子却不学无术,孔文子非常痛心。

刘悦的技术博客阅读 321

封面图
动转静两大升级!一键转静成功率领先,重点模型训练提速18%+
目前主流深度学习框架支持的编程方式有两种,分别为动态图和静态图。动态图的Pythonic编程体验更佳、更易调试,但性能方面与静态图有一定差距。静态图先组网再执行,预先拥有完整网络结构,更利于全局优化,虽调...

飞桨PaddlePaddle阅读 320

性能平台数据提速之路
导读 性能平台负责MEG所有研发数据的管理、接入、传输、应用等各个环节。数据的提速对于公司报表建设、决策分析、转化策略效果都有至关重要的影响。重点介绍数据生产端与消费端提速落地实践,如何高性价比满足大...

百度Geek说阅读 309

1 声望
0 粉丝
宣传栏