MLow:Meta 的低比特率音频编解码器

主要观点:Meta 通过其应用为数十亿人支持实时通信(RTC),致力于让 RTC 更易获取,多年来不断努力确保所有通话有稳定音频质量,开发了 Meta Low Bitrate(MLow)编解码器以改善低网速连接下的音频质量。
关键信息

  • RTC 产品依赖音频/视频编解码器等组件,如 Opus 已被用于 Meta 的 RTC 需求,但在低网速等情况下存在不足。
  • 新的基于机器学习的音频编解码器虽能在低比特率下提供良好质量,但计算成本高,仅高端设备能可靠运行。
  • Meta 开发的 MLow 编解码器在 6kbps 时比 Opus 质量提高两倍(POLQA MOS 1.89 vs 3.9),计算复杂度降低 10%,已在 Instagram 和 Messenger 通话中全面推出,正在 WhatsApp 上推广,改善了用户参与度,还能更有效地进行前向纠错。
  • MLow 基于经典 CELP 编解码器概念,通过分带优化能以更低比特率实现超宽带音频传输。
    重要细节
  • 图 1 表明增加复杂度或比特率通常能提高质量,好的编解码器能在三者间平衡。
  • 大量用户使用低端设备,如超过 20%的通话在 ARMv7 设备上进行,WhatsApp 每天有数千万通话在 10 年以上设备上进行。
  • 给出了不同比特率下 Opus 和 MLow 的音频样本对比,展示了 MLow 的优势,如在 14kbps 且 30%接收端丢包情况下,Opus 无法编码带内 FEC,而 MLow 可以。
  • 图 3 展示了 MLow 编解码器的内部架构,通过分带优化实现高效编码。
阅读 12
0 条评论