直播预告|从一张 CD 说起,关于播放器的前世今生

3 月 5 日
阅读 3 分钟
84
当时,这台机器使用一张薄薄的铁箔盘来录制声音,爱迪生亲手转动铁箔盘,在上面刻下声音的波纹。不过这个设计并不太实用,很难录制清晰持久的声音。据说爱迪生尝试过无数种设计和材料,直到 1897 年终于发明出一个更实用的唱片机。这也是我们现在所知道的唱片机的雏形。
封面图

保姆级教程!集成声网 SDK 实现 iOS 平台音视频通话和虚拟背景功能

2023-03-29
阅读 6 分钟
735
如果你想实现 iOS 平台的音视频通话,想在音视频通话中添加虚拟背景,那这篇文章完全可以借鉴。使用 swift 语言,集成声网 SDK 实现音视频通话,并调用 enableVirtualBackground 接口添加虚拟背景,小伙伴们赶快跟着小曾实践起来吧。

保姆级教程!基于声网 Web SDK实现音视频通话及屏幕共享

2023-03-17
阅读 7 分钟
1k
前言大家好,我是 @小曾同学,小伙伴们也可以叫我小曾~如果你想实现一对一音视频通话和屏幕共享功能,不妨来看看这篇文章,保姆级教程,不需要从零实现,直接集成声网 SDK 即可轻松上手。本文也分享了我在实践过程中遇到的一些问题,帮助小伙伴们避坑。如果文章知识点有错误的地方,还请大家指正,让我们一起学习,一起...

Flutter 2 渲染原理和如何实现视频渲染

2021-12-07
阅读 11 分钟
2.8k
7 月 17 日下午,在前端专场巡回沙龙北京站中,声网Agora跨平台开发工程师卢旭辉带来了《Flutter2 渲染原理和如何实现视频渲染》 的主题分享,本文是对演讲内容的整理。
封面图

声网 X 远程超声:实时音视频解决基层“看病难” 推动医疗资源均衡化

2021-12-06
阅读 3 分钟
1.7k
实时互联网像触角一样,通过情景的共享延伸开来,链接着我们彼此的线下、线上生活,形成一张不可分割的网络。随着社交直播、在线教育、视频会议成为大众生活不可或缺的一部分的同时,智能手表、智能作业灯、视频双录、视频核保、远程问诊等更多新场景也在不断崭露头角。在我们看来,探索实时互联网未来场景的过程,就如...
封面图

小谈音视频质量检测

2021-11-04
阅读 2 分钟
1.7k
本人从一位测试的角度出发,基于目前项目中摄像头的直播和语音对讲业务,正寻求音视频的质量测试及一些监控分析手段。工作中发现达到一定的并发程度之后,就会出现延时、卡顿、丢帧、马赛克等问题。所以最近在网上看看专家的直播和专栏,学习一下行业内的好的测试方法。

实时语音如何过质量关?

2021-11-01
阅读 8 分钟
1.6k
大家好,我是 cv 君,涉猎语音一段时间了,今天提笔浅述一下语音的传输前后,质量如何过关,也就是说,怎么评价我们语音的质量,比如麦克风等声音设备等等。
封面图

Android 音视频 - MediaCodec 编解码音视频

2021-10-28
阅读 12 分钟
4.1k
我们知道 Camera 采集回传的是 YUV 数据,AudioRecord 是 PCM,我们要对这些数据进行编码(压缩编码),这里我们来说在 Android 上音视频编解码逃不过的坑-MediaCodec

【AI 全栈 SOTA 综述 】这些你都不知道,怎么敢说会 AI?【语音识别原理 + 实战】

2021-10-25
阅读 19 分钟
2.6k
首先是语音任务,如语音识别和语音唤醒。听到这些,你会想到科大讯飞、百度等中国的平台。因为这两家公司占据了中国 80% 的语音市场,所以他们做得非常好。但是由于高精度的技术,他们不能开源,其他公司不得不花很多钱购买他们的 API,但是语音识别和其他应用很难学习(我培训了一个语音识别项目,10 个图形卡需要运行 ...
封面图

Android 音视频 - EGL 源码解析以及 C++ 实现

2021-10-22
阅读 12 分钟
2.2k
OpenGL 是一个跨平台的 API,而不同的操作系统(Windows,Android,IOS)各有自己的屏幕渲染实现。所以 OpenGL 定义了一个中间接口层 EGL(Embedded Graphics Library)标准,具体实现交给各个操作系统本身

Android 音视频采集那些事

2021-10-20
阅读 9 分钟
2.9k
在整个音视频处理的过程中,位于发送端的音视频采集工作无疑是整个音视频链路的开始。在 Android 或者 IOS 上都有相关的硬件设备——Camera 和麦克风作为输入源。本章我们来分析如何在 Android 上通过 Camera 以及录音设备采集数据。本章可结合之前发布的文章Android 音视频 - MediaCodec 编解码音视频做一个完整的 Demo。

音视频学习 -- 弱网对抗技术相关实践

2021-10-18
阅读 5 分钟
2.7k
实时音视频通话在当前的生活中是无时不刻存在的,包括社交、安防、交通等等各个方面都需要。用户场景复杂多变、要求严苛、网络环境不一致等给实时音视频通话带来很大条件。我们在这方向稍微做了一些工作,虽然和其他大厂的优化工作相比,我们还处于劣势,还有很多可以优化和改进的,但是目前的一些进展和工作内容和大家...
封面图

别再傻傻分不清 AVSx H.26x MPEG-x 了

2021-10-15
阅读 6 分钟
6.7k
在音视频发展的历程中,编解码无疑是其最核心的功能,编解码标准的更新换代也极大促进了音视频技术的发展以及行为模式的变更。从电视到网络视频以及现在的网络直播、点播、音视频会议等等,这些变化的背后都离不开音视频编解码技术的更新迭代。比如 H.264(仍然是目前使用最多的编解码规范)以及 H.265/HEVC(部分大厂在使...

声网 2020 实时大会后的弱网对抗实践

2021-10-11
阅读 3 分钟
2.4k
基于 IP 的音视频传输是一种实时视频通话技术,经由 Internet 协议来达成音视频通话,以及多媒体会议。VoIP 可用于包括 VoIP 电话、智能手机、个人计算机在内的诸多互联网接入设备,通过蜂窝网络、Wi-Fi、同轴电缆、光纤等设备进行信令传输、音视频通话、发送短信,以及部分控制信息的传输。
封面图

音频和视频流最佳选择?SRT 协议解析及报文识别

2021-09-29
阅读 8 分钟
5.1k
我们所知道 SRT 是由 Haivision 和 Wowza 开发的开源视频流协议。很多人会认为在不久的将来,它被是 RTMP 的替代品。因为 RTMP 协议安全性稍低,延迟相对较高 ,而相对于 SRT 协议支持高质量、稳定性、亚秒级延迟、强大的编解码器支持。SRT 被许多行业专家认为是视频流的新协议。SRT 究竟是什么?
封面图

音视频同步!RTCP 协议解析及代码实现

2021-09-27
阅读 15 分钟
3.5k
RTCP 是实时控制协议(Real-Time Control Protocol)的缩写。RTCP 由 RFC 3550 定义(取代作废的 RFC 1889)。
封面图

【经验分享】RTC 技术系列之视频编解码

2021-09-24
阅读 3 分钟
2k
那为什么要进行视频编解码呢,因为视频信号数字化后数据量巨大,如果以这样的数据量进行网络传输或者存储时,会占用大量的带宽和存储空间,造成浪费。已当前主流的 1080P 分辨率,一秒 30 帧的视频举例 1080P 图像的高和宽分别为 1080 和 1920,每个像素用三原色 RGB 表示(即每个像素三个字节),因此每帧图像的数据量为 ...

【音视频专题】音频质量评估方法那些事

2021-09-22
阅读 3 分钟
2.7k
音频(泛指人能听到的自然界的所有声音,人耳能听到声音的频谱范围一般为 20~20000HZ)和语音 (语音是指人说话的声音,人说话的声音频谱能量范围大部分分布在 300~3400HZ)两者是不同的,可以看出人是可以听到比人说话更广范围的声音的;这就是人可以听到像乐器,自然界,尖鸣声这些声音,但是人并不能发出来。

Javacv 音视频小工具 - 下载抖音视频

2021-09-17
阅读 6 分钟
3.6k
大家好,俗话说的好,学习新的知识后要学以致用,在学习音视频的过程中,你有没有疑问,不知道音视频可以用来做什么。下面举几个例子,比较耳熟能详,被吹到风口的一些场景有:AI 视觉计算, AI 人脸识别. 细化到一些小的领域,如现在直播技术,摄像头监控拉流;其他还有抖音中的美颜,滤镜,其背后是使用的音视频领域的...
封面图

音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理

2021-09-15
阅读 10 分钟
4.7k
FFMPEG 是特别强大的专门用于处理音视频的开源库。你既可以使用它的 API 对音视频进行处理,也可以使用它提供的工具,如 ffmpeg, ffplay, ffprobe,来编辑你的音视频文件。本文将简要介绍一下 FFMPEG 库的基本目录结构及其功能,然后详细介绍一下我们在日常工作中,如何使用 ffmpeg 提供的工具来处理音视频文件。
封面图

人类视觉神经科学助力音视频产业革命 - 弱网下的极限实时通信

2021-09-13
阅读 2 分钟
1.3k
弱网从字面意思看就是网络比较弱, 我们通称为信号差, 网速慢, 随着移动互联网火热发展的这些年, 大量用户会在地铁, 隧道, 电梯和车库等特殊场景下使用移动端 APP 。这些场景下, 网络会出现延迟、中断、抖动、超时等情况。
封面图

流媒体:依托于声网的连麦解决方案

2021-09-10
阅读 4 分钟
1.6k
近些年,直播连麦这把火在流媒体领域整整燃烧了 6 年。从刚开始的简单探索,到现在的成熟全链路方案,不得不说日益增长的激烈竞争,已将让原本的蓝海领域变成了深海互搏。在这样的大环境下,是否意味着小厂将再也没有机会追逐流媒体行业风口,以小搏大呢?答案当然不是,感谢多年来的市场驱动带来的技术思想碰撞,由此诞...
封面图

弱网下的极限实时视频通信

2021-09-08
阅读 2 分钟
1.3k
通常意义上,当我们出现网络有拥塞之后,之前会消耗比较长的时间在这个网络里面,通过一个前向校验码 fec,或者是我们通过 arq ,目前还有无数的研究者在做这样 hybrid arq 加上 fec 。但是从视频信号的角度来看的话,需要寻求另外一种方法。就是在你的网络时差的时候,比如说我们所说的入网环境在 50k 以下 5kbps 以下...

浅谈实时语音质量监控系统

2021-09-06
阅读 4 分钟
2k
在过去的语音通信系统中,影响语音质量的因素有很多,包括但不仅限于延时(delay)、丢包(packet loss)、包延迟变化(packet delay variation)、回声(echo)、以及由于编码造成的失真。
封面图

(深入篇)漫游语音识别技术—带你走进语音识别技术的世界

2021-09-02
阅读 10 分钟
2k
前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天咱们继续漫游语音识别技术哈,今天内容稍微专业一些,大家可以结合上一篇漫游语音识别技术一起学习。
封面图

笔记分享 -- 弱网下的极限实时视频通信

2021-08-27
阅读 3 分钟
1.7k
首先说下课题的背景,平时手机、电脑等网络设备接收信息的准确性和及时性都与实时通信有关,以实时视频通信为例,我们不可能一直保证网络的全时稳定,此时,弱网环境的存在会对提高传输质量起到重要的作用。
封面图

Springboot 结合 Netty 实战聊天系统

2021-08-20
阅读 50 分钟
4.9k
微服务,英文名:microservice,百度百科上将其定义为:SOA 架构的一种变体。微服务(或微服务架构)是一种将应用程序构造为一组低耦合的服务。

实时语音质量监控

2021-08-18
阅读 3 分钟
1.7k
今天主要想介绍下,实时语音的质量到底是什么样的,大概介绍一下这个领域的一些已有的一些方法,然后会再介绍一下现有的方法,并且介绍一下未来想做的一些事情。

【音视频】弱网下实时视频的极限通信

2021-08-16
阅读 4 分钟
967
弱网与常规的互联网还是不一样的,常规的互联网对于极限挑战,已经是不错的。无论是直播、点播,基础设施、网络设备以及压缩处理技术等已经完全可以满足高清、超高清、多视点等需求了。但对于弱网来说,比如:应急救灾、远洋海事、无人图传、边防监控等,这些场景往往需要实时的通信,但这些场景下,依赖基站通信存在一...

手把手 Golang 实现静态图像与视频流人脸识别

2021-08-11
阅读 12 分钟
4k
说起人脸识别,大家首先想到的实现方式应该是 Python 去做相关的处理,因为相关的机器学习框架,库都已经封装得比较好了。但是我们今天讨论的实现方式换成 Golang,利用 Golang 去做静态图像和视频流人脸识别的相应处理。