详解低延时高音质:回声消除与降噪篇

2021-11-12
阅读 6 分钟
3k
在实时音频互动场景中,除了我们上一篇讲到的编解码会影响音质与体验,在端上,降噪、回声消除、自动增益模块同样起着重要作用。在本篇内容中我们将主要围绕回声消除和降噪模块,讲讲实时互动场景下的技术挑战,以及我们的解决思路与实践。
封面图

实时语音如何过质量关?

2021-11-01
阅读 8 分钟
1.5k
大家好,我是 cv 君,涉猎语音一段时间了,今天提笔浅述一下语音的传输前后,质量如何过关,也就是说,怎么评价我们语音的质量,比如麦克风等声音设备等等。
封面图

【AI 全栈 SOTA 综述 】这些你都不知道,怎么敢说会 AI?【语音识别原理 + 实战】

2021-10-25
阅读 19 分钟
2.6k
首先是语音任务,如语音识别和语音唤醒。听到这些,你会想到科大讯飞、百度等中国的平台。因为这两家公司占据了中国 80% 的语音市场,所以他们做得非常好。但是由于高精度的技术,他们不能开源,其他公司不得不花很多钱购买他们的 API,但是语音识别和其他应用很难学习(我培训了一个语音识别项目,10 个图形卡需要运行 ...
封面图

【音视频专题】音频质量评估方法那些事

2021-09-22
阅读 3 分钟
2.6k
音频(泛指人能听到的自然界的所有声音,人耳能听到声音的频谱范围一般为 20~20000HZ)和语音 (语音是指人说话的声音,人说话的声音频谱能量范围大部分分布在 300~3400HZ)两者是不同的,可以看出人是可以听到比人说话更广范围的声音的;这就是人可以听到像乐器,自然界,尖鸣声这些声音,但是人并不能发出来。

声网 Agora 音频互动 MoS 分方法:为音频互动体验进行实时打分

2021-07-29
阅读 4 分钟
1.8k
在业界,实时音视频的 QoE(Quality of Experience) 方法一直都是个重要的话题,每年 RTE 实时互联网大会都会有议题涉及。之所以这么重要,其实是因为目前 RTE 行业中还没有一个很好的可用于评价实时互动场景的 QoE 评价方法。
封面图

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

2021-07-26
阅读 8 分钟
2k
在实时通讯技术迅猛发展的今天,人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。在 LiveVideoStackCon 2021 上海站中,声网Agora 音频算法负责人冯建元分享深度学习落地移动端的范例,遇到的问题和未来的展望。
封面图

App 用户新体验——Agora Native SDK 3.4.0

2021-07-22
阅读 4 分钟
1.5k
声网Agora Native SDK 3.4.0 本月已正式上线。新版本不仅增加了更丰富的实时美声音效、屏幕共享、虚拟节拍器等功能,同时在 SDK 的稳定性、兼容性及安全合规上做了大幅度升级,希望为 App 用户带来更顺畅、舒适的互动新体验。
封面图

Qcon 实时音视频专场:实时互动的最佳实践与未来展望

2021-07-19
阅读 5 分钟
1.9k
互动直播、线上会议、在线医疗和在线教育是实时音视频技术应用的重要场景,而这些场景对高可用、高可靠、低延时有着苛刻的要求,很多团队在音视频产品开发过程中会遇到各种各样的问题。例如:流畅性,如果在视频过程中频繁卡顿,基本上就很难有良好的互动;回声消除,经过环境反射被麦克风重新采集并传输,这也会影响互...
封面图

Why WebRTC|“浅入深出”的工作原理详解

2021-07-14
阅读 5 分钟
5.3k
今年 1 月,WebRTC 被 W3C 和 IETF 发布为正式标准。据调研机构 GrandViewReseach 的报告显示,预计 2025 年全球 WebRTC 市场规模将达到 210.23 亿美元,相较 2019 年 23 亿美元的市场规模,5 年的复合年增长率为 43.6%。
封面图