ICASSP 2023 论文预讲会是由CCF语音对话与听觉专委会、语音之家主办,旨在为学者们提供更多的交流机会,更方便、快捷地了解领域前沿。活动将邀请 ICASSP 2023 录用论文的作者进行报告交流。
ICASSP 2023 论文预讲会第五期邀请到香港理工大学(PolyU)做本次会议的专场分享,欢迎大家观看。
第五期
香港理工大学【专场】
时间:5月15日(周一) 19:00 ~ 20:00
形式:线上
议程:每位嘉宾分享30分钟(含5分钟QA)
嘉宾&主题
嘉宾简介:李哲,香港理工大学在读博士。研究方向:鲁棒性声纹识别、多模态说话人识别。IEEE 会员,中国人工智能学会及中文信息学会会员。曾获得中国人工智能学会优秀科技成果奖1项。发表ICASSP, ICMR等CCF会议论文及SCI和中文核心论文共计17篇,授权发明专利2项,软件著作权1项。
分享主题:Discriminative Speaker Representation Via Contrastive Learning with Class-Aware Attention in Angular Space
摘要:将对比学习应用于说话人识别面临的挑战在于基于Softmax的对比损失在优化类间差异(即分离不同类别)方面表现较好,然而,在降低类内变化(即使同一类别的特征紧凑)方面表现并不理想,并且难以处理困难样本对学习的影响。为克服第一个挑战,我们提出了一种将附加角度间隔引入监督对比损失的说话人识别框架,通过该角度间隔提高说话人表征的判别能力。针对第二个挑战,我们引入了一种基于类别感知的注意力机制,使得困难样本对监督对比损失的影响降低。此外,我们还采用了基于梯度的多目标优化方法来平衡分类损失和对比损失。在CN-Celeb和Voxceleb1数据集上的实验结果表明,这一新的学习目标能够使编码器找到一个在跨语言之间具有良好说话人判别能力的嵌入空间。
嘉宾简介:柯晓权,香港理工大学电子与信息工程系三年级博士生,研究方向为自然语言处理,语音识别,和基于语音的老年痴呆症检测。
分享主题:Feature Selection and Text Embedding For Detecting Dementia from Spontaneous Cantonese
摘要:Dementia是因脑神经疾病、身体系统性疾病、药物或成瘾物质使用引起的持续性认知功能下降的症状。罹病者可能会面临思考能力、判断力、记忆力、空间感知力和理智等全面性心智能力的丧失。其中最常见的dementia是阿尔茨海默症(Alzheimer's disease, AD)。因为患有dementia的病人可能在病症早期就出现语言损伤(spoken language deficit),所以利用语音处理技术来检测早期老年痴呆症成为可行方法。本次的分享介绍了使用特征选择(feature selection)方法来选择声学特征(acoustic features),来检测老年痴呆症。结果表明,使用选择的声学特征可以达到70%的准确率;此外,结合预训练语言模型(pre-trained language model)和选择的声学特征可以显著提高准确率。
参与方式
直播将通过语音之家微信视频号进行直播手机端、PC端可同步观看👇👇👇
论文征集
ICASSP 2023 论文预讲会面向全球线上招募,结合定向邀请与自选投稿的方式,来选择预讲会的嘉宾
为了共创高质量的论文预讲会,我们诚挚邀请所有 ICASSP 2023 作者参与到会议中来,也欢迎大家推荐适此会议论文分享的学者。
投稿邮箱:jack@speechhome.com
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。