活动图

ICASSP2025论文预讲会第三期

ICASSP2025论文预讲会第三期

3 月 10 日 周一 00:00 —— 3 月 10 日 周一 21:00
线上活动
活动介绍

ICASSP 2025 论文预讲会由CCF语音对话与听觉专委会、语音之家主办,旨在为学者们提供更多的交流机会,更方便、快捷地了解领域前沿。活动将邀请 ICASSP 2025 录用论文的作者进行报告交流。ICASSP 2025 论文预讲会邀请到武汉大学IASP实验室在3月10日和3月11日分别做两期专场分享,本文介绍第一场相关内容,欢迎大家预约观看。
图片

实验室概况

武汉大学智能声学与语音处理实验室(Intelligent Acoustics and Speech Processing Lab, IASP-Lab)致力于通过人工智能和声学技术的创新,推动语音交互和声学感知的智能化发展,赋能新一代通信和智能交互应用。

第三期:武汉大学IASP实验室(一)【专场】
时间:3月10日(周一)19:00 ~ 20:30
形式:线上
议程:每位嘉宾分享30分钟(含5分钟QA)
图片

嘉宾&主题

图片
嘉宾简介:刘威,武汉大学电子信息学院信息与通信工程系博士研究生二年级,导师为黄公平教授,合作导师为陈景东教授和Jacob Benesty教授。他的主要研究兴趣是麦克风阵列、语音增强和声场分析。他曾在OPPO北京研究所音频算法研发岗位实习,并独立完成一项研究课题。他作为核心成员完成了一项校企联合研究项目,参与了两项国家自然科学基金项目。他是多个期刊的审稿人,包括IEEE Signal Processing Letters,Circuits, Systems, and Signal Processing和Chinese Journal of Electronic。他是IEEE和IEEE SPS的学生会员。目前,他以第一作者发表了1篇SCI论文,他的1篇论文被ICASSP 2025大会接收。
分享主题:基于动态模式分解的麦克风阵列波束形成语音增强方法
摘要:麦克风阵列波束形成被广泛应用于从噪声环境中提取所需的语音信号。现有研究主要关注如何利用空间信息进行滤波,但较少关注麦克风阵列观测的内在物理机制。本文旨在通过动态模态分解(Dynamic Mode Decomposition, DMD)来探索这种被忽视的物理机制。我们的贡献有两部分:一是我们提出了一种基于DMD的麦克风阵列信号模型,以捕获相邻麦克风的观测信号之间的关系;二是提出了一种基于DMD的预处理方法和相应的波束形成方法。仿真结果表明,与传统的波束形成技术相比,该方法显著提高了性能。

图片
嘉宾简介:杨晓冉,武汉大学电子信息学院硕士研究生一年级,导师为黄公平教授。主要研究兴趣是麦克风阵列、多通道语音增强和音效生成。曾作为队长带领团队获得挑战杯“揭榜挂帅”专项赛国家三等奖,申请了一项发明专利和两项实用新型专利。目前,她的1篇论文被ICASSP 2025大会接收。
分享主题 :基于超指向波束形成与后置滤波联合优化的多通道语音增强方法
摘要: 超指向性(Superdirective, SD)波束形成因其高指向性与频不变波束特性,在小规模麦克风阵列中应用广泛。然而,这类波束形成器对阵列自噪声等极为敏感。为提升稳健性,稳健超指向性(robust superdirective, RSD)波束形成应运而生,但仍存在以下局限:1)波束变宽,噪声抑制能力下降;2)频不变特性丢失,低频段波束宽度大、高频段波束宽度小;3)当前后置滤波方法虽能优化噪声抑制,却难以解决声源偏离阵列指向方向时的失真问题。针对上述问题,本文提出一种RSD波束形成器与后置滤波联合优化的方案:以RSD的输出作为后置滤波网络的输入,通过模拟阵列指向偏差等失配场景,训练后置滤波网络以协同增效。

图片
嘉宾简介:张耀恺,武汉大学电子信息学院三年级本科生,目前于 IASP 实验室科研实习,由黄公平教授指导。他曾获国家奖学金,湖北省大学生数学竞赛一等奖等荣誉。他的研究兴趣包括机器学习、语音与音频生成、语音增强。他的1篇论文被ICASSP 2025大会接收。
分享主题:基于高效窄带与跨带注意力机制的轻量多通道语音增强神经网络
摘要:现有基于深度学习的多通道语音增强方法通过融合子频带、跨频带和空间信息取得了显著效果,但存在计算资源消耗大、终端设备部署困难等问题。本文提出一种基于解耦全连接注意力机制的轻量化网络,在不使用循环单元的情况下实现长程窄带特征捕捉与跨频带信息交互。实验表明,该网络在保持语音增强性能的同时,显著降低了计算复杂度和处理延迟,为终端设备部署提供了可行方案。

参与方式

直播将通过语音之家微信视频号进行直播手机端、PC端可同步观看👇👇👇
图片

发布于 2025-03-10
0 条评论
组织者
主办方
CCF语音对话与听觉专委会
语音之家