喜报!数据堂荣获2020年度北京市科学技术进步二等奖

faddiddn

9月25日的2021中关村论坛全体大会上,正式发布了2020年度北京市科学技术奖评审结果,数据堂公司、北京市大数据中心、中科院计算所、太极计算机联合完成的“大规模人工智能数据柔性生产关键技术及应用”项目荣获2020年度北京市科学技术奖项科技进步奖二等奖。

北京市科学技术奖由北京市人民政府设立评审,汇集了顶尖高校、科研院所等参与评定,被公认为是科技领域最具权威性的奖项。在此次评选中大规模人工智能数据柔性生产关键技术及应用项目,历经多轮答辩评比,最终从426个组队中脱颖而出,拔得头筹。相关领域院士专家鉴定认为,该项目总体技术达到国际先进水平,对于推进整个人工智能行业降本增效,促进更多产业转型升级具有重要意义。

本项目从实际市场需求出发,以构建“大规模人工智能数据柔性生产平台”为目标,在以下三方面取得显著创新性成果:

在数据智能处理技术方面,针对大规模的数据生产需求,提出了高效半自动数据标注新框架,一体化融合了无监督冷启动标注、弱监督预标注和少监督精标注,实现最经济标注生产方式,数据生产效率提升30-40%,解决了“数据标注效率低”的问题。业内评价,将域自适应学习理论和方法应用于大规模数据生产过程中,取得开创性的成果。

在标注工具构建技术方面,针对多品类的数据生产需求,提出了基于主动学习的人机交互式标注新范式,建立了基于组态化的数据标注工具生成环境,攻克“标注工具易用性差、开发周期长”的问题,数据标注工具的开发周期缩短80倍。

在生产资源调度策略方面,针对个性化的数据生产需求,提出了基于遗传粒子群算法的数据柔性生产资源配置新技术,实现计算、人力、数据、工具等生产资源的最优配置,数据生产平台吞吐量10TB/日,5000用户并发,生产能力3PB/年,解决了“生产线适应性差”的问题。

项目研制了大规模AI数据柔性生产平台--数加加,开创了国内PB级数据生产先河,处理数据总规模超过18PB,国内市场占有率第一。项目发表论文59篇,获得发明专利17项、软件著作权120项,参与标准制定3项;参与建设了多个国家、省市、行业的超大规模AI数据生产平台,产生了重大的经济效益和社会效益。

此次获奖是对数据堂在人工智能数据服务领域取得成绩的肯定,未来,数据堂还将持续探索领域前沿,积累核心技术以及落地应用,助力各行各业创新发展、智能化转型升级,为我国人工智能的发展添砖加瓦。

阅读 97

1 声望
0 粉丝
0 条评论
1 声望
0 粉丝
文章目录
宣传栏