活动介绍

ICASSP 2026 论文预讲会由CCF语音对话与听觉专委会、语音之家主办,旨在为学者们提供更多的交流机会,更方便、快捷地了解领域前沿。活动将邀请 ICASSP 2026 录用论文的作者进行报告交流。

ICASSP 2026 论文预讲会邀请到武汉大学智能声学与语音处理实验室(IASP-Lab)在2月9日和2月10日分别做两期专场分享,本文介绍第二场相关内容,欢迎大家预约观看。

实验室概况
武汉大学智能声学与语音处理实验室Intelligent Acoustics and Speech Processing Lab (IASP-Lab)致力于通过人工智能和声学技术的创新,推动语音交互和声学感知的智能化发展,赋能新一代通信和智能交互应用。
图片
第三期 - 武汉大学智能声学与语音处理实验室(二)【专场】
时间:2月10日(周二)19:00 ~ 21:00
形式:线上
议程:每位嘉宾分享30分钟(含5分钟QA)
图片

嘉宾&主题

嘉宾简介:钱远杭,武汉大学电子信息学院一年级博士研究生,导师为黄公平教授。主要研究方向为多通道语音增强、语音修复等。曾在OPPO上海研究所音频算法研发岗位实习,作为核心成员参与了多项校企联合研究项目和国家自然科学基金项目,担任包括IEEE Signal Processing Letters、Circuits, Systems, and Signal Processing、ICASSP 等期刊和会议的审稿人。
分享主题:Online Neural Fusion of Distortionless Differential Beamformers for Robust Speech Enhancement
摘要:麦克风阵列与波束形成是人机交互、语音转录及多方会议等应用中获取高质量语音的核心技术。在实际系统中,差分麦克风阵列(DMA)因其高指向性、紧凑结构及频率不变性被广泛采用,但其静态滤波特性限制了其在动态声学环境中的表现。尽管自适应凸组合(ACC)技术试图通过线性组合多个固定波束形成器来提升鲁棒性,但该方法本质上依赖于信号梯度的自适应更新,在面对快速移动干扰源或复杂非平稳噪声时,往往因梯度估计延迟或不准确导致权重分配次优,难以有效抑制干扰。为此,本文提出了一种基于在线神经网络的多波束融合框架(BeamFusion)。该框架并行运行一组具有不同零点指向约束的固定波束形成器,利用分组双路径RNN网络捕捉信号的时频特征,实时预测最优的线性组合权重。该方法有效解决了传统ACC算法在动态场景下的跟踪滞后问题,为高动态环境下的鲁棒语音增强提供了新的解决方案。
论文链接https://arxiv.org/abs/2510.24497

嘉宾简介:朱瑜杰,武汉大学电子信息学院一年级硕士研究生,导师为黄公平教授,合作导师为陈景东教授。主要研究方向语音去混响,波束形成和大规模麦克风阵列等。作为核心成员参与了多项校企联合研究项目和国家自然科学基金项目,以第一作者身份在Signal Processing、ICASSP 等国际期刊和会议上发表论文3篇。
分享主题 :Forward Convolutive Prediction for Frame Online Monaural Speech Dereverberation Based on Kronecker Product Decomposition
摘要:语音去混响是语音信号处理领域中的一个重要研究方向,其目标是减轻混响对语音通信和语音交互系统带来的不利影响。在现有方法中,前向卷积预测(FCP)近年来受到了广泛关注。然而,该方法的一个主要缺点在于所需的线性预测滤波器往往长度较长,从而带来较大的计算复杂度。本文提出一种基于Kronecker积分解的 KP-FCP 方法。通过将长滤波器分解为两个短滤波器的Kronecke 积表示,并在RLS准则下进行在线迭代更新,在显著降低参数规模和计算开销的同时,保持甚至优于传统FCP方法的去混响性能。实验结果表明,在显著降低计算复杂度的同时,所提出的方法在去混响性能上能够达到甚至超过传统 FCP 方法。

嘉宾简介:陈康,武汉大学电子信息学院博士研究生一年级,导师为黄公平教授。其主要研究方向为麦克风阵列语音信号处理,重点聚焦声源分离、语音去混响及波束形成等关键技术,相关研究面向复杂声学环境下的稳健语音获取问题。作为核心成员参与了多项校企联合研究项目和国家自然科学基金项目。担任 IEEE Signal Processing Letters、Circuits, Systems 等期刊的审稿人。以第一作者身份在 IEEE ICASSP 等国际期刊和会议上发表论文 3 篇。
分享主题:Robust Online Overdetermined Independent Vector Analysis Based on Bilinear Decomposition摘要:在线盲源分离在语音通信和人机交互中具有重要意义。在现有方法中,超定独立向量分析(OverIVA)通过利用源信号之间的统计独立性以及源子空间与噪声子空间之间的正交性,表现出较强的分离性能。然而,当应用于大规模麦克风阵列时,其参数数量会迅速增长,从而降低在线估计的准确性。为了解决这一问题,本文提出将每个较长的分离滤波器分解为由两个较短滤波器构成的双线性形式,从而有效减少参数数量。由于这两个滤波器之间存在紧密耦合关系,我们设计了一种交替迭代投影算法,对其进行迭代更新。仿真结果表明,在参数数量大幅减少的情况下,所提出的方法仍能获得更优的性能和更强的稳健性。

参与方式

直播将通过语音之家微信视频号进行直播手机端、PC端可同步观看👇👇👇
图片

预讲会征集

ICASSP 2026 论文预讲会面向全球线上招募,结合定向邀请与征集报名的方式,来选择预讲会的嘉宾。
图片

发布于 2026-02-09
0 条评论
组织者
主办方
CCF语音对话与听觉专委会
语音之家