活动介绍

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、国音智能、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—语音技术在国音智能的应用,将于2022年9月27日18:30-20:50线上直播。

参会嘉宾


许敏强,国音智能首席科学家,博士,硕士生导师,师从“计算机视觉之父”Thomas S.Huang院士。原阿里巴巴语音团队创始人之一、达摩院声纹算法负责人,百度云语音和数字人算法团队负责人。先后在微软亚洲研究院、阿里和百度任职并从事声纹和语音识别、数字人等领域的研究工作。曾7次带领团队在NIST CTS、VoXCeleb等国际语音处理领域比赛中获得第一。中国计算机协会CCF语音对话与听觉专委执行委员。分享主题:The SpeakIn System Description for VoxSRC2021 & FFSVC2022摘要:作为声纹识别比赛 VoxSRC2021(The Third VoxCeleb Speaker Recognition Challenge) 和 FFSVC2022(Far-field Speaker Verification Challenge 2022)两场比赛的冠军团队,本报告分享了针对两场比赛的方案设计和系统描述,展示了声纹识别领域的最新技术和成果。


郑渝,国音智能声纹识别算法工程师,负责声纹识别算法研发、迭代和落地。曾多次作为核心主力参加国际公开说话人识别比赛并获得冠军。支持公司声纹算法的各类场景应用和业务需求,有丰富的落地经验。分享主题:基于深度学习的声纹识别技术框架简述摘要:介绍了基于深度学习的声纹识别技术的基础技术框架,并对其原理进行剖析。同时,结合深度学习的前沿进展,探索其在声纹识别算法中的效果优化。


郝瀚,国音智能语音算法工程师,负责语音识别算法的迭代与落地,开发的语音识别系统应用于公司内部多条产品线,拥有丰富的模型研发与落地经验。分享主题:语音识别技术在会议系统中的应用摘要:本主题介绍了国音智能语音识别技术框架,并从会议系统的场景出发介绍整体技术和优化细节,包括远场识别优化,热词速度优化等。

沙龙议程

发布于 2022-09-20
0 条评论
组织者
主办方
CCF语音对话与听觉专委会
中国人工智能产业发展联盟(AIIA)评估组
国音智能
语音之家
北京希尔贝壳科技有限公司