音频分析 - SegmentFault 思否

音频处理性能测评：audioflux、torchaudio、librosa和essentia谁最快？

C4Lab

2023-04-26

阅读 4 分钟

1.8k

音频信号处理在各种应用中都发挥着重要的作用，如语音识别、音乐信息检索、语音合成等。其中，Mel频谱是一种常用的频域特征表示方法，用于描述人类听觉系统对频率的敏感程度。

这个小项目，上周被国外 AI 新闻网站报道，前些天又上了 github 热榜

C4Lab

2023-03-29

阅读 1 分钟

862

疫情期间在校花了几个月时间，写了这个小项目，是关于音频特征提取和分析的，自己是 AI 专业研究音频的，但受限于对音频特征的理解，做研究时总感觉缺乏“底料”，所以当做是学习练手做了这个小东西。

Mel频谱和MFCC深入浅出

C4Lab

2023-02-28

阅读 10 分钟

2.1k

在音频领域，mel频谱和mfcc是非常重要的特征数据，在深度学习领域通常用此特征数据作为网络的输入训练模型，来解决音频领域的各种分类、分离等业务，如端点侦测、节奏识别、和弦识别、音高追踪、乐器分类、音源分离、回声消除等相关业务。

深度学习工具audioFlux--一个系统的音频特征提取库

C4Lab

2023-02-21

阅读 4 分钟

1.7k

目录时频变换频谱重排倒谱系数解卷积谱特征音乐信息检索audioFlux是一个Python和C实现的库，提供音频领域系统、全面、多维度的特征提取与组合，结合各种深度学习网络模型，进行音频领域的业务研发，下面从时频变换、频谱重排、倒谱系数、解卷积、谱特征、音乐信息检索六个方面简单阐述其相关功能。时频变换audioFlux在时...