5G 技术大带宽、低延时、海量连接的特点,让短视频、直播购物、游戏、音视频社交等变得更加简单,同时,互联网的发展带来了泛娱乐领域的多样化体验,让大众对于 AI 以及音视频的体验、参与和互动有了更高的诉求。
B站、伏羲等玩家如何将AI 以及音视频技术应用于泛娱乐产品?技术如何赋能业务以满足用户多样化的需求?
4月10日,网易 MCtalk 和掘金 JTalk 联合举办的娱乐社交技术沙龙——“泛娱乐领域音视频技术探索与实践”在上海成功举办。
本次活动邀请到网易伏羲人工智能实验室资深视觉研究员袁燚、网易音视频实验室高级技术专家韩庆瑞、网易云音乐 Andiord 技术专家贺俊玮以及哔哩哔哩移动端资深开发工程师臧至聪4位技术大咖,就泛娱乐应用在 AI 以及音视频上的技术实践,与现场百名听众交流分享。
《游戏智能捏脸算法研究与应用》
袁燚 网易伏羲人工智能实验室资深视觉研究员
随着 AI 技术的发展,AI 与游戏的结合形式不断推陈出新。捏脸系统基本上是现代 RPG 游戏的标配,它为玩家准备了很多的控制条和选项,通过拖动控制条或者直接拖动角色面部,玩家就可以改变相应部位的相貌从而创造出自己想要的角色了。网易伏羲人工智能实验室资深视觉研究员袁燚分享了他们的智能捏脸算法以及在逆水寒、天谕手游等网易雷火的多款游戏中落地效果。
视觉计算 AI 技术能够有效改进当前游戏中角色和场景模型的制作流程和效果,大大增强玩家的参与感和沉浸感。对很多普通玩家来说,想要利用复杂的游戏捏脸器去捏一个特定相貌的角色,往往需要花费非常非常多的时间。袁燚讲述了如何利用人工智能技术赋能玩家捏脸,通过迭代优化的深度神经网络模型,让玩家实现只需要上传单张照片,就能在半秒内得到既像且美捏脸结果的效果。
《网易云信视频 RTC 引擎关键技术分享》
韩庆瑞 网易音视频实验室高级技术专家 网易云信视频团队负责人
5G 与 AI 时代已来,音视频技术持续迭代升级,网易云信也推出了全新一代音视频技术架构,对音视频全流程都做了重大升级。视频引擎作为网易云信新一代音视频核心能力模块,承担了 RTC 场景中最为重要的视频通信功能。
本次活动中,网易音视频实验室高级技术专家、网易云信视频团队负责人韩庆瑞分享了网易云信新一代视频引擎架构以及其各个模块中的关键技术。他为参会者详细介绍了从摄像头采集视频到视频信息网络传输再到视频显示整个完整过程中网易云信研发的一系列关键技术,包括网易云信高效的视频处理算法、自研的 NE264 和 NEVC 视频编码器。同时也介绍了网易云信为保证在各种网络状况下,用户都能有最佳的视频体验进行的技术探索:智能视频 QoE 技术和高性能的 AI 超分方案的技术解读,以及以上技术的落地实践。
《网易云音乐音视频创新业务的探索和实践》
贺俊玮 网易云音乐 Android 技术专家
对于泛娱乐平台,音视频能力正变得越来越重要,依托这样的基础,网易云音乐一直致力于能够提供全新的创新能力和场景,将之呈现给用户。
本次分享中,来自网易云音乐 Andiord 技术专家贺俊玮为我们介绍了网易云音乐在移动端音视频创新业务方向的探索,从工程优化、设计方法论、质量体系打造、线上大型演出等方面的建设,实现构建快速高效的音视频业务。介绍了在各业务线创新业务全面铺开中,网易云音乐基于三方SDK的原子能力构建了适合自身状态的中台组件和脚手架,解决了多业务线的协调效率问题。此外,还构建了音视频质量评估标准和质量监控体系,以便对业务的全链路进行进一步优化。最后,整体介绍以上能力在线上大型演出实践中的落地。
《Bilibili 互动弹幕引擎分享》
臧至聪 哔哩哔哩移动端资深开发工程师
在个人视频内容行业飞速发展的今天,用户视频体验已不是单单取决于视频内容本身。弹幕作为连接 UP 主与用户、用户与用户的媒介,已成为与视频内容不可分割的一部分。
作为 Bilibili 的“招牌”,弹幕也在 B 站不断演化,直至互动弹幕诞生。本次分享,来自 Bilibili 的资深开发工程师臧至聪,介绍了Bilibili 互动弹幕的诞生从可点的一键三连开始,后产生弹幕刷屏、弹幕投票等互动形式的产品能力化。活动中,臧至聪还详细介绍了实现互动弹幕的自研引擎,其拥有跨平台的绘制引擎、对上层业务封装多端统一的 API、支持业务代码的热更新等特性,可以达到跨平台统一、提升研发效率,以及快速上线产品功能的效果。
以上是每位嘉宾的分享概述,点击“这里”即可获取本场技术沙龙的嘉宾PPT。
本次上海音视频技术沙龙圆满举办,后续我们还将在杭州、北京等地举办技术活动。想参加的朋友,可随时关注我们发出的活动消息~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。