音视频开发进阶|第七讲:分辨率与帧率·下篇

2023-06-20
阅读 7 分钟
872
在视频系列的上一篇推文中,我们简单总结了色彩、像素、图像和视频等基础概念之间的关系。并且主要关注了两个组合:像素和图像,图像和视频之间的构成逻辑。我们先来简单回顾一下:

音视频开发进阶|第七讲:分辨率与帧率·上篇

2023-01-03
阅读 9 分钟
964
在视频系列的前几篇推文中,我们已经接触了视频相关的不少概念,它们都是围绕着几个核心角色 :色彩、像素、图像和视频来展开的。这几个核心角色之间的关系,大家应该都有了基本的了解,我们再来简单回顾一下。

SDK 接入|游戏语音之“范围语音”接入实践

2022-12-09
阅读 6 分钟
1.1k
语音是线上游戏用户的主要交流方式,大多数用户会通过游戏中的内置语音功能与其他玩家沟通,而一些用户在游戏没有内置语音功能的情况下,通过其他语音软件与玩家沟通。

我与梅西粉丝们的世界杯观球日常

2022-11-28
阅读 4 分钟
764
世界杯 ⚽️ 期间,我与其他的梅西粉丝在某 APP 里建了个梅粉聊天群,群内人数上万人,大家一起讨论赛事热点,可谓热火朝天,此起彼伏,这是四年一度的狂欢,虽值冬季,但热情不减。
封面图

音视频开发进阶|第六讲:色彩和色彩空间·下篇

2022-11-08
阅读 10 分钟
822
在前两篇推文中,我们了解了色彩空间、像素、图像和视频之间的组成关系,并且比较详细的学习了色彩空间 RGB、YUV 的采样&存储格式。今天,我们基于这些内容,再补充一些重要的关联知识。

元宇宙场景技术实践|实现“虚拟人”自由

2022-11-08
阅读 8 分钟
1k
虚拟形象是虚拟世界的核心资产,也是打造元宇宙社交的数字名片,从虚拟形象为切入点,ZEGO Avatar 基于强大的 AI 算法能力,可以为企业提供多元化风格虚拟形象制作及智能互动服务,助力企业打造虚拟形象数字资产,创造多样的玩法体验,支持客户以相对较低的门槛快速进入元宇宙赛道。

音视频开发进阶——YUV与RGB的采样与存储格式

2022-10-19
阅读 8 分钟
1k
在上一篇文章中,我们带大家了解了视频、图像、像素和色彩之间的关系,还初步认识了两种常用的色彩空间,分别是大家比较熟悉的 RGB,以及更受视频领域青睐的 YUV。今天,我们将继续深入学习 RGB、YUV 的相关内容,进一步了解它们的常见采样格式和存储格式。

元宇宙场景技术实践|虚拟直播间搭建教程

2022-09-23
阅读 10 分钟
1.3k
虚拟直播场景为元宇宙社交娱乐模式下的全新直播方式,由虚拟形象替代真人出镜,可以给用户打造不一样的直播体验,还可以加入表情随动、手势识别触发特效等多种玩法,在场景里支持多位虚拟形象视频连麦互动,更容易吸引用户参与连麦互动,提升用户的消费意愿及粘性。

AI 时代的视频云转码移动端化——更快、更好、更低、更广

2022-09-13
阅读 7 分钟
956
编者按: AI技术的落地是渐渐地从服务器端、云端落地,逐步到移动端及边缘设备上。这些年随着AI技术的进步,轻量级算法模型开始在移动端实时跑起来,并且移动端算法也在不断进行迭代和完善,而对于实时直播场景,也有越来越多的AI算法落地。ZEGO即构科技提出了一套极轻量级AI算法模型,结合移动端硬件特性,差异化优化前...

音视频开发进阶|第六讲:色彩和色彩空间·上篇

2022-09-02
阅读 7 分钟
856
虽说声音在我们日常的生活、工作、娱乐过程中,发挥着不可替代的作用,但人们常说,百闻不如一见、耳听为虚眼见为实。我们对于世界的认识、对于沟通和互动的需求从未满足于 “声音” 这一个途径,在如今这个 “看脸” 的时代,我们很多时候还追求 “看见”、“面对面”,而这就是视频存在的意义。

多路混流实操流程

2022-08-26
阅读 6 分钟
1.4k
降低了开发实现上的复杂性,例如当有 N 个主播进行连麦,如果采用混流,观众端不必同时拉 N 路视频流,开发实现上省去了拉 N 路流并布局的步骤。

快速实现 CDN 直播

2022-08-12
阅读 5 分钟
1.1k
ZEGO Express SDK 支持推流到 CDN(Content Delivery Network,内容分发网络),包括转推 CDN 和直推 CDN 两种功能。开发者基于该功能可打通 RTC 产品和 CDN 直播产品,方便用户从网页或第三方播放器直接观看和收听直播内容。为了保证安全,推流到 CDN 时默认开启 CDN 鉴权。

人像分割技术解析与应用

2022-08-12
阅读 4 分钟
1.5k
抠图主要解决的是图像中前景和背景区域的准确预测问题,对于图像编辑和影视制作有着及其重要的实际意义。所以准确有效的抠图算法可以极大的改善内容生产的工作流程,从而节省大量的人力物力来提高工作效率。

音视频开发进阶|音频编解码的必要性解读与格式选取

2022-08-12
阅读 7 分钟
927
在上一篇文章中,我们完成了对音频前处理三剑客的学习。声音信号经过音频前处理模块,已经“洗尽铅华、去除杂质”,现在,你是否已迫不及待想要将它们分享到世界各地了呢?但稍安勿躁,想要更好地与世界分享我们的声音,还有一个不得不考虑的问题,而这个问题将由我们今天的主角 “音频编解码”来解决。

直播预告 | 社交新纪元,共探元宇宙社交新体验

2022-06-09
阅读 1 分钟
624
走过热火朝天的2021,2022年元宇宙热度依旧不减,年初一款名为“啫喱”的元宇宙社交App上线,20多天迅速走红;映客直播也于近日上线“全景K歌”,为用户提供元宇宙K歌体验......

端午“沉浸式云旅游”怎么玩?即构助力“直播+”新场景落地

2022-06-06
阅读 3 分钟
708
《2022新旅游消费趋势报告》显示,“直播云旅游”已经被超过一半的Z世代年轻人所接受,11%的人表示“经常看”。除了旅游博主以外、导游、博物馆、旅游平台、景区、民宿等都加入了旅游直播的阵营,线下沉寂的旅游市场在线上逐渐火热。

在映客的虚拟KTV里唱了一首“爱你”

2022-06-02
阅读 2 分钟
785
如果你突然打了个喷嚏那一定就是我在想你如果半夜被手机吵醒啊~那是你的虚拟 KTV 在响起2022 年 5 月 18 日,映客 App 上线了业内首个元宇宙 K 歌玩法「全景 K 歌」,给用户带来前所未有的社交体验:1、生成虚拟化身,穿越进虚拟世界玩家可以自由创造虚拟形象,利用 AI 实时建模、捏脸生成专属形象,进入到一个酷炫的虚...

消灭非稳态噪音的利器 - AI 降噪

2022-05-26
阅读 3 分钟
1.4k
当下,用户在进行音频通话时常常置身于各种不同的场景中,嘈杂的背景声音以及非稳态噪音往往会对通话产生干扰,其中非稳态噪音是指在时间分布上不连续,并有其形态特征的噪声,是相对稳态噪声而言的,例如,鼠标点击声、键盘声、敲击声、空调声、厨房碗碟碰撞声等都属于非稳态噪音。

行业疯狂内卷,出海企业如何乘风而起实现突围?

2022-05-26
阅读 6 分钟
1.3k
受全球疫情持续影响,全球用户的生活方式发生了变化,人们习惯每日通过线上方式满足娱乐需求,泛娱乐应用大量崛起,激烈的竞争使得产品同质化严重和获客困难成为企业出海新痛点,面对一系列问题,泛娱乐赛道企业亟需打破困局,找到新的增长点。

即视角|泛娱乐场景下的银发经济:老龄用户画像及触网行为分析

2022-05-25
阅读 4 分钟
1.4k
共享即构新洞察,共建行业新动能——ZEGO即构科技基于音视频技术领域的多年深耕,综合面向各行业的服务经验,推出【即视角】栏目,发布即构对行业的洞察。欢迎大家探讨论道,共驱前行。

面由 AI 生|ZegoAvatar 捏脸技术解析

2022-05-25
阅读 6 分钟
1.3k
2021年,元宇宙概念席卷全球,国内各大厂加速赛道布局,通过元宇宙为不同的应用场景的相关内容生态进行赋能。针对“身份”、“沉浸感”、“低延迟”、“随时随地”这四个元宇宙核心基础,ZEGO 即构科技基于互动智能的业务逻辑,提出并落地了 ZegoAvatar 解决方案,将 AI 视觉技术应用至虚拟形象,完成了业务和技术的无缝衔接。

泛娱乐出海实时化,技术驱动新场景开拓

2022-05-25
阅读 3 分钟
909
今年2月,data ai发布中国非游戏出海厂商及应用收入TOP 30 榜单,榜单中的厂商基本为社交&泛娱乐、工具以及网文三大类,其中泛娱乐社交占据53.3%。相对于饱和度较高的国内社交市场,出海社交市场可拓展空间较大。

活动干货|泛娱乐App出海东南亚深度解析

2022-05-24
阅读 3 分钟
1.4k
为助力出海企业把握增长红利,即构科技特开设《出海“构”有料——泛娱乐出海系列直播》,从热门国家的特性洞察、玩法解决方案到技术服务经验分享,全方位助力出海企业把握增长红利。

红松:构建全新的中老年兴趣社交平台

2022-05-24
阅读 2 分钟
783
2021年,中国第七次人口普查数据公布,60岁以上人口占比为18.7%,较十年前相比上升了5.44%。社科院最新数据更是表明,中国农村60岁以上人口占比已超20%,完全达到了“老龄化社会”标准。

抢唱玩法升级!正版音乐高潮片段、实时打分能力等你集成~

2022-05-24
阅读 2 分钟
1k
从功能上讲,抢唱是少有兼具“唱歌+社交+游戏竞技”属性的K歌玩法;在用户喜爱程度上,凭借抢唱玩法出圈的音遇在推出后短时间内成为百万量级爆款,曾获AppStore社交榜单第一,免费总榜第二。

音视频开发进阶课程|第一期:音频要素

2022-05-20
阅读 8 分钟
1.4k
为了帮助开发者更好的理解音视频概念,进行音视频应用开发,ZEGO 即构科技联合内部音视频开发专家打磨了本套《音视频开发进阶》课程,帮助大家轻松入门并可以自己动手开发音视频 App!
封面图

AI 加持实时互动|ZegoAvatar ⾯部表情随动技术解析

2022-04-15
阅读 5 分钟
1.6k
2021年,元宇宙概念席卷全球,国内各大厂加速赛道布局,通过元宇宙为不同的应用场景的相关内容生态进行赋能。针对“身份”、“沉浸感”、“低延迟”、“随时随地”这四个元宇宙核心基础,ZEGO 即构科技基于互动智能的业务逻辑,提出并落地了 ZegoAvatar 解决方案,将 AI 视觉技术应用至虚拟形象,完成了业务和技术的无缝衔接。
封面图

WebGL 及其在 WebRTC 中的应用

2022-03-25
阅读 5 分钟
1.3k
WebGL 允许把 JavaScript 和 OpenGL ES 2.0 结合在一起,通过增加 OpenGL ES 2.0 的一个JavaScript 绑定,WebGL 可以为 HTML5 Canvas 提供硬件 3D 加速渲染。Web 开发人员就可以借助系统显卡来在浏览器里更流畅地展示 3D 场景和模型,还能创建复杂的导航和数据视觉化。
封面图

ZEGO 自研客户端配置管理系统 —— 云控

2022-03-18
阅读 2 分钟
1.2k
1、一些配置参数的值是要依赖客户本地环境参数(机型、系统版本、客户端版本、网络环境、硬件设备),客户本地环境参数发生了变化,那么配置参数要有相应的值来匹配,否则有可能会导致客户端的用户体验变差甚至功能不可用。举个例子,是否开启硬件编码加速,在 macOS + 系统版本的条件下要关闭,而在 iOS 下要打开。
封面图

WebRTC 简单入门与实践

2022-03-11
阅读 5 分钟
2.9k
做为一名 Web 开发者,WebRTC 这块的概念着实花了不少时间才搞明白,一是 WebRTC 本身有较多的独有概念,二是虽然带“Web”字样,但依赖底层概念和网络却是 Web 开发很少接触到的;
封面图