音频处理性能测评:audioflux、torchaudio、librosa和essentia谁最快?

2023-04-26
阅读 4 分钟
1.1k
音频信号处理在各种应用中都发挥着重要的作用,如语音识别、音乐信息检索、语音合成等。其中,Mel频谱是一种常用的频域特征表示方法,用于描述人类听觉系统对频率的敏感程度。

这个小项目,上周被国外 AI 新闻网站报道,前些天又上了 github 热榜

2023-03-29
阅读 1 分钟
694
疫情期间在校花了几个月时间,写了这个小项目,是关于音频特征提取和分析的,自己是 AI 专业研究音频的,但受限于对音频特征的理解,做研究时总感觉缺乏“底料”,所以当做是学习练手做了这个小东西。
封面图

Mel频谱和MFCC深入浅出

2023-02-28
阅读 10 分钟
1.3k
在音频领域,mel频谱和mfcc是非常重要的特征数据,在深度学习领域通常用此特征数据作为网络的输入训练模型,来解决音频领域的各种分类、分离等业务,如端点侦测、节奏识别、和弦识别、音高追踪、乐器分类、音源分离、回声消除等相关业务。
封面图

深度学习工具audioFlux--一个系统的音频特征提取库

2023-02-21
阅读 4 分钟
1.2k
目录时频变换频谱重排倒谱系数解卷积谱特征音乐信息检索audioFlux是一个Python和C实现的库,提供音频领域系统、全面、多维度的特征提取与组合,结合各种深度学习网络模型,进行音频领域的业务研发,下面从时频变换、频谱重排、倒谱系数、解卷积、谱特征、音乐信息检索六个方面简单阐述其相关功能。时频变换audioFlux在时...
封面图