RTC 实时音视频 - SegmentFault 思否

详解低延时高音质：回声消除与降噪篇

RTE开发者社区

2021-11-12

阅读 6 分钟

在实时音频互动场景中，除了我们上一篇讲到的编解码会影响音质与体验，在端上，降噪、回声消除、自动增益模块同样起着重要作用。在本篇内容中我们将主要围绕回声消除和降噪模块，讲讲实时互动场景下的技术挑战，以及我们的解决思路与实践。

实时语音如何过质量关？

RTE开发者社区

2021-11-01

阅读 8 分钟

1.5k

大家好，我是 cv 君，涉猎语音一段时间了，今天提笔浅述一下语音的传输前后，质量如何过关，也就是说，怎么评价我们语音的质量，比如麦克风等声音设备等等。

【AI 全栈 SOTA 综述】这些你都不知道，怎么敢说会 AI？【语音识别原理 + 实战】

RTE开发者社区

2021-10-25

阅读 19 分钟

2.6k

首先是语音任务，如语音识别和语音唤醒。听到这些，你会想到科大讯飞、百度等中国的平台。因为这两家公司占据了中国 80% 的语音市场，所以他们做得非常好。但是由于高精度的技术，他们不能开源，其他公司不得不花很多钱购买他们的 API，但是语音识别和其他应用很难学习（我培训了一个语音识别项目，10 个图形卡需要运行 ...

【音视频专题】音频质量评估方法那些事

RTE开发者社区

2021-09-22

阅读 3 分钟

2.6k

音频(泛指人能听到的自然界的所有声音，人耳能听到声音的频谱范围一般为 20~20000HZ)和语音 (语音是指人说话的声音，人说话的声音频谱能量范围大部分分布在 300~3400HZ)两者是不同的，可以看出人是可以听到比人说话更广范围的声音的；这就是人可以听到像乐器，自然界，尖鸣声这些声音，但是人并不能发出来。

声网 Agora 音频互动 MoS 分方法：为音频互动体验进行实时打分

RTE开发者社区

2021-07-29

阅读 4 分钟

1.8k

在业界，实时音视频的 QoE（Quality of Experience）方法一直都是个重要的话题，每年 RTE 实时互联网大会都会有议题涉及。之所以这么重要，其实是因为目前 RTE 行业中还没有一个很好的可用于评价实时互动场景的 QoE 评价方法。

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

RTE开发者社区

2021-07-26

阅读 8 分钟

在实时通讯技术迅猛发展的今天，人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。在 LiveVideoStackCon 2021 上海站中，声网Agora 音频算法负责人冯建元分享深度学习落地移动端的范例，遇到的问题和未来的展望。

App 用户新体验——Agora Native SDK 3.4.0

RTE开发者社区

2021-07-22

阅读 4 分钟

1.5k

声网Agora Native SDK 3.4.0 本月已正式上线。新版本不仅增加了更丰富的实时美声音效、屏幕共享、虚拟节拍器等功能，同时在 SDK 的稳定性、兼容性及安全合规上做了大幅度升级，希望为 App 用户带来更顺畅、舒适的互动新体验。

Qcon 实时音视频专场：实时互动的最佳实践与未来展望

RTE开发者社区

2021-07-19

阅读 5 分钟

1.9k

互动直播、线上会议、在线医疗和在线教育是实时音视频技术应用的重要场景，而这些场景对高可用、高可靠、低延时有着苛刻的要求，很多团队在音视频产品开发过程中会遇到各种各样的问题。例如：流畅性，如果在视频过程中频繁卡顿，基本上就很难有良好的互动；回声消除，经过环境反射被麦克风重新采集并传输，这也会影响互...

Why WebRTC｜“浅入深出”的工作原理详解

RTE开发者社区

2021-07-14

阅读 5 分钟

5.3k

今年 1 月，WebRTC 被 W3C 和 IETF 发布为正式标准。据调研机构 GrandViewReseach 的报告显示，预计 2025 年全球 WebRTC 市场规模将达到 210.23 亿美元，相较 2019 年 23 亿美元的市场规模，5 年的复合年增长率为 43.6％。