大赛介绍
百度搜索技术创新挑战赛(简称 STI)是由百度搜索发起,联合四大区域高校、学会共同举办的一项全国性科技竞赛。本次大赛以“新智能·新搜索”为主题,围绕人工智能、检索技术,为参赛团队提供海量百度搜索脱敏业务数据进行训练及测试。本次大赛面向全国企业、高校、科研机构、项目团队及个人广发英雄帖,旨在挖掘和培育搜索 AI 人才,促进业内交流、产教融合,推动算法和技术应用创新。
本次大赛分为区域赛、复赛、决赛三个阶段,区域赛将由四大赛区独立排名及颁奖,复赛及决赛将依据总排名进行选拔和评比。北部赛区由北京大学承办,东部赛区由山东大学承办,南部赛区由湖南省人工智能学会承办, 西部赛区由西安电子科技大学承办。
赛道一:搜索问答
近年来,随着机器阅读理解与深度预训练模型等相关技术的发展,抽取式智能问答系统的性能取得了非常明显的提升。然而,在开放领域的搜索场景下得到的网页数据会非常复杂,其中往往存在着网页文档质量参差不齐、长短不一,问题答案分布零散、长度较长等问题,给答案抽取和答案置信度计算带来了较大挑战。
因此,本任务希望从答案抽取和答案检验两个方面调研真实网络环境下的文档级机器阅读理解技术,以求进一步提升深度智能问答效果,给用户提供更好的搜索体验。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。