由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、NVIDIA、语音之家、希尔贝壳共同主办的【语音之家】AI产业沙龙—动手体验语音AI开发利器 - NVIDIA NeMo代码实战,将于2023年2月28日19:00-20:30线上直播,同时还可线上与老师一起上机实操。
沙龙简介
NVIDIA NeMo是一个用于构建对话式人工智能应用的自动语音识别工具库。它采用语音文本数据为输入,并使用人工智能和自然语言处理模型理解语义,从而实现语音与文字间内容的相互转换。NeMo toolkit可用于构建人机语音文字交互的对话式解决方案,用于搭建智能语音助手,聊天机器人,智能语音翻译 ,声控智能家居及无人驾驶汽车语音指令交互等应用场景。本次沙龙将重点介绍如何使用NeMo训练自定义语音AI模型,同时上机操作体验在边缘计算设备Jetson NX中实现语音AI模型的推理。
参会嘉宾
Yipeng LiNVIDIA 企业开发者社区经理嘉宾
简介:Yipeng Li,拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 AI 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统,曾开发基于 NLP 知识抽取,KG 知识图谱的建立的科研文档智能检索系统。
分享主题:通过NVIDIA NeMo训练语音AI模型
摘要:NVIDIA NeMo是一个使用了GPU加速的能够用于构建对话式人工智能应用的自动语音识别工具库,它采用语音文本数据作为输入,并使用人工智能和自然语言处理模型理解语义,从而实现语音与文字间内容的相互转换。NeMo toolkit可用于构建人机语音文字交互的对话式解决方案,用于搭建智能语音助手,聊天机器人,智能语音翻译 ,声控智能家居及无人驾驶汽车语音指令交互等应用场景。我们将重点介绍如何使用NeMo训练自定义语音AI模型,涉及构建适用于NeMo的语音数据集、中文语音识别模型、中文语音合成模型的训练,同时上机操作体验在边缘计算设备Jetson NX中实现语音AI模型的推理。
沙龙议程
NVIDIA NeMo介绍
构建适用于NeMo的语音数据集
使用NeMo训练中文ASR语音识别模型
使用NeMo训练中文TTS语音合成模型
在边缘计算设备上实现语音AI模型推理
上机操作
50台Jetson NX 作为实验硬件平台
Jupyter Lab 作为实验开发工具
线上远程网络连接对应IP端口登录
限50个名额、先到先得旁听不限
( https://jinshuju.net/f/AgAggA )
参加方式
直播将通过语音之家微信视频号进行直播手机端、PC端可同步观看👇👇👇
讨论群
扫码添加语音小管家,进入语音之家讨论群
沙龙联系人
闫亮
电话:18611344096
邮箱:jack@speechhome.com
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。