音视频FAQ(三):音画不同步

2023-12-01
阅读 5 分钟
182
本文介绍了音画不同步问题的五个因素:编码和封装阶段、网络传输阶段、播放器中的处理阶段、源内容产生的问题以及转码和编辑。针对这些因素,提出了相应的解决方案,如使用标准化工具、选择强大的传输协议、自适应缓冲等。此外,介绍了第三方音视频服务商如即构的解决方案,包括优化的编解码器、动态码率调整、前向纠错...

音视频FAQ(二)视频直播延时高

2023-12-01
阅读 7 分钟
214
延时高是实时互动技术中常见的问题之一,解决延时高问题需要综合考虑网络、设备、编解码算法等多个因素。解决方案包括优化设备端延时、优化网络传输延时和使用UDP进行音视频传输等。在选择音视频传输协议时,需要综合考虑实际需求和网络条件,选择最适合的协议。本文介绍了延时高的原因和解决方案,希望对音视频开发者能...

音视频FAQ(一):视频直播卡顿

2023-11-30
阅读 7 分钟
208
本文介绍了视频直播卡顿的四个主要原因,用户网络问题、用户设备性能问题、技术路线的选择和实现问题。因本文主要阐述视频直播的卡顿,故技术路线的实现指的是:CDN供应商的实现问题,包含CDN性能不足、CDN地区覆盖不足。对于每个原因,提供了初步判断和进一步诊断的方法和技术工具,并列出了关键性能指标以帮助诊断和解...

技术教程 | 在线 KTV 实现过程(内附demo体验)

2023-11-02
阅读 6 分钟
308
如此庞大的市场规模,以及音视频技术使用门槛逐步降低的加持,各类在线K歌玩家大幅增加,在K歌赛道大放异彩,对于开发者而言,如何能够快速实现线上 KTV 的场景就变得十分重要。

花了3个小时解决了和异地女朋友一起看电影的需求(内附源码)

2023-11-01
阅读 6 分钟
238
一、这是一件悲伤的故事我是一名程序员,我和我的女友是异地恋,so sad!!!一次视频时,她突然来了一句:“我们已经很久没有一起看电影了吧。。。。。。”“呃。。。好像是”,毕竟离得那么远,一起看电影有点难啊。女友“哦”了下,我们便陷入了沉默。视频结束,心情有点忧伤。是啊,已经很久没有好好陪她了吧。突然想到市...

如何在 Web 前端做 3D 音效处理

2023-11-01
阅读 7 分钟
327
在社交元宇宙、大逃杀等类型的游戏场景下,用户在通过简单语音交流外,结合场景也需要一些立体声效果来让用户感知游戏角色周围其他用户的存在及其对应的距离和方位,提高语音互动的趣味性。

鸿蒙应用开发:环境搭建(Mac)与项目构建

2023-11-01
阅读 3 分钟
420
2021年6月2日,华为发布了鸿蒙操作系统-HarmonyOS。它是一款“面向未来”、面向全场景(移动办公、运动健康、社交通信、媒体娱乐等)的分布式操作系统。我们要基于HarmonyOS开发手机APP,就要先把开发环境给安装起来。接下来我们就基于macOS环境下载安装HarmonyOS开发工具DevEco Studio。

鸿蒙应用开发:如何与组件库(Glide)衔接?

2023-11-01
阅读 3 分钟
214
Android 发展到现在不仅提供了很多 API,还提供了很多第三方库。这降低了我们开发者的开发难度,提升了开发效率,让应用开发更加的简单高效。众所周知,HarmonyOS 除了提供 16000 多个 API 外也是支持组件库的调用的,那么鸿蒙应用开发是如何与第三方库衔接的呢?

程序员的硬核浪漫 — 女友专属语聊房(内附源码)

2023-11-01
阅读 5 分钟
268
虽然日常生活中大家对程序猿的标签大多是呆板、木讷、不懂浪漫,格子衫牛仔裤和黑框眼镜,整天宥与Coding(脱发),哪怕是红酒蜡烛鲜花围绕,一个告警也要立刻掏出电脑处理 。

ZEGO 即构科技首发适配鸿蒙系统的 Express SDK 1.0 版本,并正式启动公测!(内附源码)

2023-11-01
阅读 2 分钟
164
HarmonyOS 鸿蒙系统是一款“面向未来”、面向全场景(移动办公、运动健康、社交通信、媒体娱乐等)的分布式操作系统。在传统的单设备系统能力的基础上,HarmonyOS 提出了基于同一套系统能力、适配多种终端形态的分布式理念,能够支持多种终端设备。

鸿蒙应用开发:实现简单的媒体播放器

2023-11-01
阅读 11 分钟
174
距离 Harmony OS 发布已过去了一段时间,为了了解鸿蒙系统的功能与特性,今天我们将准备使用系统 API 实现一个简单的媒体播放器 demo。

即构移动端实时超分辨率技术,迭代视觉新体验

2023-10-31
阅读 2 分钟
367
超分辨率(Super Resolution,简称 SR),是计算机视觉的一个经典应用。SR 是指通过软件或硬件的方法,从观测到的低分辨率图像重建出相应的高分辨率图像,简单来说就是通过 AI 算法来放大原有图像的分辨率以达到提升画质的效果。在监控设备、卫星图像遥感、数字高清、显微成像、视频编码通信、视频复原和医学影像等领域...

ZEGO 最后一公里网络传输的容灾及优化方案

2023-10-13
阅读 3 分钟
119
作为运维,你是否遇到过一些用户域名解析异常,你是否又遇到过某些区域云商加速节点异常导致业务不可用,此时的你一脸茫然,不知所措?作为运维,你是否被最后一公里问题搞得焦头烂额?

如何选择视频分辨率、帧率、码率?

2023-10-13
阅读 1 分钟
205
产品 / 插件:实时音视频 / 实时语音 / 低延迟直播平台 / 框架:全平台一、概念解释分辨率:单位英寸中所包含的像素点数。帧率:是单位时间内视频显示帧数的量度单位,单位为 fps(frame per second)。码率:是指每秒传输的比特(bit)数,单位为 bps(bit per second)。二、设置分辨率、帧率、码率设置视频参数时,主...

音视频开发基础入门|声音的采集与量化、音频数字信号质量、音频码率

2023-10-11
阅读 9 分钟
340
为了帮助开发者更好的理解音视频概念,进行音视频应用开发,ZEGO 即构科技联合内部音视频开发专家打磨了本套《音视频开发进阶》课程,帮助大家轻松入门并可以自己动手开发音视频 App!

音视频 SDK |合理配置视频参数,提升使用质量

2023-10-10
阅读 3 分钟
163
在视频通话或直播时,开发者可以根据需要指定推流和拉流视频相关配置,如视频采集分辨率、视频编码输出分辨率、视频帧率、码率、视图模式和镜像模式。

音视频处理三剑客之 AEC:回声产生原因及回声消除原理

2023-10-09
阅读 7 分钟
233
在上一期课程《音视频开发者进阶 —— 音频要素》中,我们从声音三要素、音频模拟信号的数字化和音频数字信号特征等方面,重新认识了“声音”这个老朋友。今天,我们会进一步聊聊这个老朋友在 RTC 世界中的其他故事。

音视频处理三剑客之 ANS:噪声产生原因及噪声抑制原理解析

2023-09-28
阅读 5 分钟
263
在上一期课程《音视频开发进阶课程|第二讲:回声消除》中,我们接触了音频前处理的概念,还认识了音频前处理的三剑客之一 AEC 回声消除。今天,我们继续来认识三剑客中的第二位:噪声抑制 ANS (Ambient Noise Suppression)。

即构「畅直播」,全链路升级的一站式直播服务

2023-09-28
阅读 3 分钟
258
数据显示:国内直播市场耕耘已久,人口红利基本吃透,观看直播的用户群体总数的增长速率逐步放缓,疫情带来的短暂上升随着国内可靠的防疫举措施行也渐渐回落。纯获客拓新已经转化为平台之间的用户争夺。

针对直播痛点的关键技术解析——首帧秒开、清晰度、流畅度

2023-09-27
阅读 4 分钟
462
复杂的网络环境、机型设备等问题,导致直播产品面临诸多体验问题,如首帧加载时间过长、画面模糊、卡顿等,极度影响了用户的直播观看体验,导致头部主播离家出走、营收下降、用户流失严重、APP 活跃度下降等问题,而以上问题出现的原因通常可以从网络、设备、成本三方面来进行归纳。

音视频通话前的网络及设备检测该如何操作?

2023-09-27
阅读 4 分钟
267
前言:为了保证实时通信体验,通话前可以进行网络与设备的检测,提前识别并排查问题。网络检测:检测网络环境,可用于判断或预测网络环境是否适合推/拉指定码率的流。 设备检测:检测本地麦克风、摄像头以及扬声器是否能正常工作。本文将介绍如何使用 ZEGO SDK 接口,实现上述两个角度的检测。网络检测请参考 网络与性能...

音视频开发进阶|第四讲:音频自动增益控制 AGC

2023-09-27
阅读 6 分钟
519
在之前的文章中,我们已经接触了两个重要的音频前处理模块 – 回声消除 AEC 和噪声抑制 ANS,它们分别解决了 RTC 场景下的回声、噪声问题,极大提升了用户的体验。至此,音频前处理三剑客中,就只剩下一位 – 音频自动增益控制 AGC(Automatic Gain Control)还没有介绍,今天我们就来认识一下它。

暗黑系王者,低照度图像增强技术解析

2023-09-21
阅读 3 分钟
953
​在低光照的夜间,摄像头采集的画面通常是一片昏暗,画面清晰度要远远低于肉眼。而随着实时音视频应用技术的发展,我们已经看到了各种画质增强的视频增强技术,那么是否存在一种技术,可以使视频在低光照条件下看起来比实际情况更清晰或接近实际情况呢?

瞬间抠图!揭秘 ZEGO 绿幕抠图算法背后的技术

2023-07-05
阅读 6 分钟
694
抠图的主要功能是为了后期的合成做准备。在 Photoshop 中,抠图的方法有很多种,最常见的有通道抠图、蒙版抠图、钢笔工具抠图和快速选择工具等。针对视频的抠图方法主要是基于keylight 插件对纯色背景进行抠图(多用于绿幕)。

ZEGO 即构音乐场景降噪技术解析

2023-06-21
阅读 2 分钟
441
随着线上泛娱乐的兴起,语聊房、在线 KTV 以及直播等场景在人们的日常生活中占据越来越重要的地位,用户对于音质的要求也越来越高,因此超越传统语音降噪算法的 AI 降噪算法应运而生,所以目前各大 RTC 厂商普遍使用 AI 技术进行降噪处理,使用 AI 降噪技术消除除人声外的一切声音。

音视频开发进阶|第七讲:分辨率与帧率·下篇

2023-06-20
阅读 7 分钟
597
在视频系列的上一篇推文中,我们简单总结了色彩、像素、图像和视频等基础概念之间的关系。并且主要关注了两个组合:像素和图像,图像和视频之间的构成逻辑。我们先来简单回顾一下:

音视频开发进阶|第七讲:分辨率与帧率·上篇

2023-01-03
阅读 9 分钟
796
在视频系列的前几篇推文中,我们已经接触了视频相关的不少概念,它们都是围绕着几个核心角色 :色彩、像素、图像和视频来展开的。这几个核心角色之间的关系,大家应该都有了基本的了解,我们再来简单回顾一下。

SDK 接入|游戏语音之“范围语音”接入实践

2022-12-09
阅读 6 分钟
919
语音是线上游戏用户的主要交流方式,大多数用户会通过游戏中的内置语音功能与其他玩家沟通,而一些用户在游戏没有内置语音功能的情况下,通过其他语音软件与玩家沟通。

我与梅西粉丝们的世界杯观球日常

2022-11-28
阅读 4 分钟
673
世界杯 ⚽️ 期间,我与其他的梅西粉丝在某 APP 里建了个梅粉聊天群,群内人数上万人,大家一起讨论赛事热点,可谓热火朝天,此起彼伏,这是四年一度的狂欢,虽值冬季,但热情不减。
封面图

音视频开发进阶|第六讲:色彩和色彩空间·下篇

2022-11-08
阅读 10 分钟
674
在前两篇推文中,我们了解了色彩空间、像素、图像和视频之间的组成关系,并且比较详细的学习了色彩空间 RGB、YUV 的采样&存储格式。今天,我们基于这些内容,再补充一些重要的关联知识。