活动介绍

图片

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、小米集团、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—如何应用k2开发语音识别系统,将于2022年9月22日19:00-20:35线上直播。参会嘉宾


姚增伟
嘉宾简介:小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,硕士毕业于哈尔滨工业大学,主要研究方向为语音识别。

分享主题:新一代 Kaldi 中的 Reworked Conformer 模型以及基于多码本向量量化的蒸馏方案

摘要:本报告将介绍近期新一代 Kaldi 项目的两个核心贡献点。针对 Conformer 模型存在的问题进行改进,实现了训练稳定、性能更优的 Reworked Conformer 模型,其核心思想已拓展应用于 Emformer 和 LSTM 等模型中。基于多码本向量量化的蒸馏方案,通过将 teacher 模型的高维(如 1280 维)的 float 向量量化为极少数个(如 8 个)uint8 类型的码本索引,显著地降低了存储空间,并基于量化结果进行高效蒸馏。

匡方军
嘉宾简介:小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,主要研究方向为语音识别。 GitHub:https://github.com/csukuangfj

分享主题:新一代 Kaldi 部署框架 sherpa 分享

摘要:本报告将介绍如何使用新一代Kaldi 部署框架sherpa 在不同平台 (Linux/macOS/Windows/Raspberry Pi 等) 进行语音识别。沙龙议程

发布于 2022-09-15
0 条评论
组织者
主办方
CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、小米集团、语音之家、北京希尔贝壳科技有限公司