QOE 驱动下的分布式实时网络构建:Agora SD-RTN 的演进

2021-09-23
阅读 7 分钟
3k
编者按:**近日,全球软件案例研究峰会在北京召开。全球软件案例研究峰会(简称“TOP100Summit”)是科技界一年一度的案例研究榜单,每年甄选年度最值得借鉴的100个好案例,旨在揭幕优秀研发团队背后的做法、思考,为读者提炼最佳学习路径梳理、思考案例长尾价值。
封面图

【音视频专题】音频质量评估方法那些事

2021-09-22
阅读 3 分钟
3k
音频(泛指人能听到的自然界的所有声音,人耳能听到声音的频谱范围一般为 20~20000HZ)和语音 (语音是指人说话的声音,人说话的声音频谱能量范围大部分分布在 300~3400HZ)两者是不同的,可以看出人是可以听到比人说话更广范围的声音的;这就是人可以听到像乐器,自然界,尖鸣声这些声音,但是人并不能发出来。

声网推出首个完整实时合唱解决方案 即将上线“咪哒”全国线下K歌房

2021-09-18
阅读 4 分钟
2.8k
4月20日,声网Agora宣布对实时合唱技术方案全面升级,帮助国内知名迷你KTV品牌“咪哒”实现国内首个支持多终端、多人合唱、高音质的完整实时合唱解决方案的落地,结束了国内K歌行业长期探索“实时合唱”场景,却一直未能上线的现状。
封面图

Javacv 音视频小工具 - 下载抖音视频

2021-09-17
阅读 6 分钟
4k
大家好,俗话说的好,学习新的知识后要学以致用,在学习音视频的过程中,你有没有疑问,不知道音视频可以用来做什么。下面举几个例子,比较耳熟能详,被吹到风口的一些场景有:AI 视觉计算, AI 人脸识别. 细化到一些小的领域,如现在直播技术,摄像头监控拉流;其他还有抖音中的美颜,滤镜,其背后是使用的音视频领域的...
封面图

音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理

2021-09-15
阅读 10 分钟
5.1k
FFMPEG 是特别强大的专门用于处理音视频的开源库。你既可以使用它的 API 对音视频进行处理,也可以使用它提供的工具,如 ffmpeg, ffplay, ffprobe,来编辑你的音视频文件。本文将简要介绍一下 FFMPEG 库的基本目录结构及其功能,然后详细介绍一下我们在日常工作中,如何使用 ffmpeg 提供的工具来处理音视频文件。
封面图

人类视觉神经科学助力音视频产业革命 - 弱网下的极限实时通信

2021-09-13
阅读 2 分钟
1.5k
弱网从字面意思看就是网络比较弱, 我们通称为信号差, 网速慢, 随着移动互联网火热发展的这些年, 大量用户会在地铁, 隧道, 电梯和车库等特殊场景下使用移动端 APP 。这些场景下, 网络会出现延迟、中断、抖动、超时等情况。
封面图

流媒体:依托于声网的连麦解决方案

2021-09-10
阅读 4 分钟
1.7k
近些年,直播连麦这把火在流媒体领域整整燃烧了 6 年。从刚开始的简单探索,到现在的成熟全链路方案,不得不说日益增长的激烈竞争,已将让原本的蓝海领域变成了深海互搏。在这样的大环境下,是否意味着小厂将再也没有机会追逐流媒体行业风口,以小搏大呢?答案当然不是,感谢多年来的市场驱动带来的技术思想碰撞,由此诞...
封面图

弱网下的极限实时视频通信

2021-09-08
阅读 2 分钟
1.5k
通常意义上,当我们出现网络有拥塞之后,之前会消耗比较长的时间在这个网络里面,通过一个前向校验码 fec,或者是我们通过 arq ,目前还有无数的研究者在做这样 hybrid arq 加上 fec 。但是从视频信号的角度来看的话,需要寻求另外一种方法。就是在你的网络时差的时候,比如说我们所说的入网环境在 50k 以下 5kbps 以下...

浅谈实时语音质量监控系统

2021-09-06
阅读 4 分钟
2.3k
在过去的语音通信系统中,影响语音质量的因素有很多,包括但不仅限于延时(delay)、丢包(packet loss)、包延迟变化(packet delay variation)、回声(echo)、以及由于编码造成的失真。
封面图

(深入篇)漫游语音识别技术—带你走进语音识别技术的世界

2021-09-02
阅读 10 分钟
2.4k
前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天咱们继续漫游语音识别技术哈,今天内容稍微专业一些,大家可以结合上一篇漫游语音识别技术一起学习。
封面图

不用手机,如何让猫给你打视频电话丨日常小技

2021-08-31
阅读 3 分钟
3.2k
文章首发于微信公众号@代号XY 作者:代号XY大家好,我是XY。「日常小技」栏目是我和RZ做项目时发现的一些内行小技术,可以应用在日常生活中。未来我们会把积累写的相关程序开源。① 首先,你需要一个摄像头某宝上平均售价从20、200到400元不等就像选相机一样,像素、帧率是硬指标。这是你可以重复利用的东西,拆装很方便...

漫游语音识别技术——带你走进语音识别技术的世界

2021-08-30
阅读 4 分钟
2.5k
前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天我来带大家漫游一下当下发展火热的语音识别技术,通俗易懂、干货满满、一定要学到最后呦!
封面图

笔记分享 -- 弱网下的极限实时视频通信

2021-08-27
阅读 3 分钟
1.8k
首先说下课题的背景,平时手机、电脑等网络设备接收信息的准确性和及时性都与实时通信有关,以实时视频通信为例,我们不可能一直保证网络的全时稳定,此时,弱网环境的存在会对提高传输质量起到重要的作用。
封面图

开发者实践丨盲水印插件:用户端的实时视频溯源保护

2021-08-25
阅读 2 分钟
3.5k
本文作者是 RTE 2021 创新编程挑战赛获奖者董章晔团队。在实时音视频领域,视频内容会需要得到版权保护,而盲水印则是保护的措施之一。这支参赛团队基于声网 SDK 开发了一款应用于用户端的实时视频盲水印插件。其他使用声网 SDK 的开发者,也同样可以在自己的应用中使用该插件。访问『阅读原文』,可以查看该项目的源码。
封面图

Agora 教程丨一个典型案例,教你如何使用水晶球“数据洞察”

2021-08-23
阅读 3 分钟
1.7k
“数据洞察”的“用量概览”最大的意义就是可以帮你回溯过去一段时间内的整体音视频分钟数趋势,为业务运营策略的复盘、调整提供数据参考。这些数据图表比较容易理解。
封面图

Springboot 结合 Netty 实战聊天系统

2021-08-20
阅读 50 分钟
5.4k
微服务,英文名:microservice,百度百科上将其定义为:SOA 架构的一种变体。微服务(或微服务架构)是一种将应用程序构造为一组低耦合的服务。

实时语音质量监控

2021-08-18
阅读 3 分钟
1.9k
今天主要想介绍下,实时语音的质量到底是什么样的,大概介绍一下这个领域的一些已有的一些方法,然后会再介绍一下现有的方法,并且介绍一下未来想做的一些事情。

【音视频】弱网下实时视频的极限通信

2021-08-16
阅读 4 分钟
1.1k
弱网与常规的互联网还是不一样的,常规的互联网对于极限挑战,已经是不错的。无论是直播、点播,基础设施、网络设备以及压缩处理技术等已经完全可以满足高清、超高清、多视点等需求了。但对于弱网来说,比如:应急救灾、远洋海事、无人图传、边防监控等,这些场景往往需要实时的通信,但这些场景下,依赖基站通信存在一...

音频技术及行业的发展

2021-08-13
阅读 2 分钟
2.3k
在当今社会,工业科技革命的迅速崛起,大数据分析技术、物联网技术、音频技术等的相互融合快速发展,在生物、化学、人工智能等领域有了较大的市场和研究价值。对于音频技术在这之中起到了承上启下、不可或缺的一部分。对于音频技术在这之中起到了承上启下、不可或缺的一部分。虽然音频技术不是当下最热门、最主流的前沿...
封面图

手把手 Golang 实现静态图像与视频流人脸识别

2021-08-11
阅读 12 分钟
4.5k
说起人脸识别,大家首先想到的实现方式应该是 Python 去做相关的处理,因为相关的机器学习框架,库都已经封装得比较好了。但是我们今天讨论的实现方式换成 Golang,利用 Golang 去做静态图像和视频流人脸识别的相应处理。

Golang 实现 RTP

2021-08-09
阅读 5 分钟
5.7k
在 Coding 之前我们先来简单介绍一下 RTP(Real-time Transport Protocol), 正如它的名字所说,用于互联网的实时传输协议,通过 IP 网络传输音频和视频的网络协议。

基于 HLS 创建 Golang 视频流服务器

2021-08-06
阅读 3 分钟
5.1k
HLS 是 HTTP Live Streaming 的缩写,是苹果开发的一种基于 HTTP 的自适应比特率流媒体传输协议, 并于 2009 年. HLS 流媒体已经成为应用最广泛的实时视频协议。它是一种将流分解成基于文件小段的格式, 可以通过 HTTP 下载,HLS 可以通过标准的 HTTP 或代理服务器等,这和基于 UDP 的协议(例如 RTP)不同。既然 HLS 现在...

读书日送书丨关于音视频技术你需要知道的二三事

2021-08-04
阅读 1 分钟
1.8k
值此世界读书日,声网Agora 携手 InfoQ 联合推出读书日献礼,精选 50 本音视频技术好书,免费赠送给热爱写作的音视频领域技术创作者。
封面图

声网Agora发布教育信息化解决方案 助力教育公平提效

2021-08-02
阅读 5 分钟
1.6k
4月23日-25日,由中国教育装备行业协会主办的第79届教育装备展在厦门国际会展中心举办。作为赋能教育信息化的实时互动PaaS服务商,声网Agora应邀参会。展会现场,声网展示了基于实时音视频互动能力打造的“三个课堂”线上教学场景解决方案、承载“三个课堂”应用的互动录播解决方案,以及实时音视频在智能台灯、人脸闸机、电...
封面图

声网 Agora 音频互动 MoS 分方法:为音频互动体验进行实时打分

2021-07-29
阅读 4 分钟
2.2k
在业界,实时音视频的 QoE(Quality of Experience) 方法一直都是个重要的话题,每年 RTE 实时互联网大会都会有议题涉及。之所以这么重要,其实是因为目前 RTE 行业中还没有一个很好的可用于评价实时互动场景的 QoE 评价方法。
封面图

声网 X Yalla:面对面不如线上见,中东年轻人最偏爱的语聊房是怎样“炼”成的?

2021-07-27
阅读 4 分钟
2.4k
“实时互动的本质是服务,而非功能。”这是声网一直以来坚信的理念。功能上线之后,服务才真正开始。实时互动的每一秒,甚至每一毫秒的体验都需要得到稳定、可靠的保证。而广大用户之所以能够在诸多创新应用中与好友语音开黑、与主播随时随地连麦畅聊、与千里之外的名师实时互动问答等,皆是源于声网与客户、开发者一起亲...
封面图

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

2021-07-26
阅读 8 分钟
2.4k
在实时通讯技术迅猛发展的今天,人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。在 LiveVideoStackCon 2021 上海站中,声网Agora 音频算法负责人冯建元分享深度学习落地移动端的范例,遇到的问题和未来的展望。
封面图

实践解析 | 如何通过 WebAssembly 在 Web 进行实时视频人像分割

2021-07-23
阅读 5 分钟
4.7k
5 月 15 日,声网Agora 高级架构师高纯参加了 WebAssambly 社区举办的第一场线下活动“WebAssembly Meetup”,并围绕声网Agora 在 Web 实时视频人像分割技术的应用落地,分享了实践经验。以下为演讲分享整理。
封面图

App 用户新体验——Agora Native SDK 3.4.0

2021-07-22
阅读 4 分钟
1.7k
声网Agora Native SDK 3.4.0 本月已正式上线。新版本不仅增加了更丰富的实时美声音效、屏幕共享、虚拟节拍器等功能,同时在 SDK 的稳定性、兼容性及安全合规上做了大幅度升级,希望为 App 用户带来更顺畅、舒适的互动新体验。
封面图

Qcon 实时音视频专场:实时互动的最佳实践与未来展望

2021-07-19
阅读 5 分钟
2.1k
互动直播、线上会议、在线医疗和在线教育是实时音视频技术应用的重要场景,而这些场景对高可用、高可靠、低延时有着苛刻的要求,很多团队在音视频产品开发过程中会遇到各种各样的问题。例如:流畅性,如果在视频过程中频繁卡顿,基本上就很难有良好的互动;回声消除,经过环境反射被麦克风重新采集并传输,这也会影响互...
封面图