“下一个风口”
在去年北京站大会筹备过程中,我曾经采访过一些技术人,有问到这么一个问题:“您认为目前我们所处的‘后疫情时代’,音视频技术领域的下一个风口在哪里?”
大家的回答都不太一样,这也的确是一个仁者见仁,智者见智的问题。我们摘选了如下几个回答:
- 未来的方向是基于硬件、算法、网络等等这一系列性能的提升,让实时音视频的应用场景变得更加贴近线下,延迟更低、沉浸度更高等等。
- 音视频技术的需求还将会在直播、会议、电商、娱乐、协作方面继续保持增长。
- 当前社会的发展依然面临着很多的挑战,比如碳中和问题、人口的增长放缓,以及在后疫情时代的经济发展和远程协同问题。相信国家在未来很长一段时间的注意力也会聚焦在这些问题上。如果音视频技术在以上某个方向上的应用落地,能够对这些方向形成助力,那么会更容易地成为下一个阶段的风口。比如:音视频通话对于留守儿童的关怀问题;低延时视频传输在新能源汽车上的远程操控能力;更加无缝嵌入到现有协同体系中的办公协同应用等等;新能源发电的远程监控和远程排障方向等等。
- 音视频领域的下个风口应该紧盯海外市场。因为海外市场拥有不同的国家、宗教、文化,不会被某一家公司垄断整个市场。
从以上的回答可以看出,虽然大家对音视频技术这条垂直赛道的未来关注点不同,但是对这个领域可持续发展的信心感是很强烈的。无论是从底层技术的不断打磨提升,还是对技术应用场景的稳固与扩展,亦或是另辟蹊径,寻求海外商机,无疑都是将音视频技术带到更高更远的地方,在不同的行业中发光发热。
这也是我们策划LiveVideoStackCon 2022 音视频技术大会 上海站的立意初衷:当音视频技术渗透到不同行业中,会给人们带来怎样的惊喜?即本次大会的主题——「音视频+无限可能」。为了让参会的朋友们提前感受大会的盛况,我们特意邀请了本次大会的部分讲师来“详细剧透”一下他们的演讲内容。
*以下演讲介绍可作为实际大会的演讲参考,最终演讲内容以大会当天为准。(So,如果想了解大会一手演讲内容、与讲师现场交流,快去官网报名参会吧!九折优惠限时抢购,团体购票优惠很猛,请疯狂私信小秘书(添加微信号:LVSgogo)哈~)
演讲剧透
.新一代车载音频系统实践
马桂林 科大讯飞 智能汽车事业部副总经理
科大讯飞杰出科学家
所属专题:音视频+
随着消费的升级,智能网联时代的到来,传统的车载音频解决方案已经无法满足广大消费者对于美好声音和智能化场景的需求。如何设计智能音频管理系统,让广大用户能够从现在开始就享受到新一代以智能化场景化为特点的极致的音频体验,是本次分享的主题。
本次分享分为三个部分,首先是关于新一代音频系统硬件介绍,尤其是硬件如何设计从而支撑新的场景需求。相比较于传统的车内音频需求,新的场景需求逻辑更为复杂,对性能要求更高,这就要求硬件设计在计算性能、音频性能、接口、功耗、时延、扩展性等等方面都达到优异的性能,从而支撑各种复杂和高阶的软件和算法。
第二部分介绍新一代车载音频系统的核心算法以及这些算法如何服务于各种场景。音效算法是各种场景服务的核心。为了满足丰富的应用场景,我们的音频系统包含了从基础到高阶的丰富算法,满足用户从安全驾驶、声浪模拟到影音体验的各种需求。我们自主研发的高端算法经过测试达到了优异的性能。
第三部分介绍软硬件如何与生态、场景、内容等打通形成智能的场景化服务。软硬件平台做到了优异的性能是场景化服务的前提,但不是全部。车载音频体验需要与场景打通。有三种主要的场景构建方式:第一种是基于单一功能或者环境的场景化服务,例如声浪的模拟;第二种是端到端的场景化构建,一端是内容,一端是车载音频管理系统;第三种是结合多模态交互的场景构建,结合语音、视觉等多种方式构建车载音频场景化的服务。
总之,新一代的车载音频系统要求突出的软硬件能力和丰富的场景化、个性化设计,从而将用户体验提升到一个新的维度。
.Gstreamer中的视频处理与硬件加速
何俊彦 英特尔 加速计算系统与图形部工程师
所属专题:开源与体验创新
Gstreamer作为一个比较流行的开源多媒体框架,其优秀的架构使其具有高度的模块化和良好的扩展性,并具有广泛的应用前景。从广义上说,不只是媒体流,Gstreamer可以扩展并处理任何一种数据流。在AI时代,随着例如DeepStream, DLStreamer等AI插件的推出, Gstreamer必将被越来越多的应用于集编解码、AI、渲染等于一体的综合应用场景中。
本次分享将有三个部分,首先将会讨论Gstreamer基于Pipeline和插件的工作原理,以及其机制是如何保证在其各个插件具有良好独立性的前提下,实现插件之间无缝的数据传递与协作,从而使得Pipeline的搭建即简单高效又灵活方便。
另外,本次分享将会介绍如何开发一个完整而又高效的Gstreamer插件,特别是基于GPU以及硬件加速的插件,以及在插件开发中的注意事项。
最后,随着AI时代的到来,传统的视频处理过程会加入越来越多的AI处理。本次分享将介绍一些经典的Gstreamer Pipeline实例以及当下比较流行的AI应用,同时讨论Gstreamer的未来发展与前景。
.Shopee音视频处理中台落地应用
范志兴 Shopee 视频技术团队负责人
所属专题:视频编解码性能优化与体验
随着Shopee电商业务在东南亚等市场迅速展开,视频和电商结合的应用迅速落地。比如feeds、rating流、买/卖家秀,直播带货,数字银行开户以及短视频等。东南亚大部分地区都是欠发达地区,手机用户大多使用的是国内2010左右普及的千元机机型,这些手机在视频编解码、图像处理方面的性能存在严重性能瓶颈,网络质量远不如国内。在这样的网络条件下传输媒体数据谈何容易。还有就是海量的视频文件和直播视频处理给Shopee后台带来了巨大的压力。那么Shopee是如何通过技术手段来解决这一系列问题的呢?
本次分享将从4个方面为大家解开谜团。首先本次分享将会介绍落地了哪些应用,如:Shopee直播带货、视频通话在线开户、feeds流,Shopee video、seditor和云导播等等。
第二部分将会介绍与视频编码优化相关的工作,比如适应低带宽和抖动网络环境。这部分内容将从高清低码、RTC场景的SVC编码、前置处理/编码性能调优,以及软解码快速精确seek等四个方面来展开。
第三部分将会重点介绍工程实现方面。首先是转码Pipeline实现,转码处理节点以region的方式组织,耗时短的节点,集成到同一个region, region内部串行,region之间并行,保证最大的处理输出帧率。其次是自研混流服务,在直播带货连麦过程中,RTC房间为单个用户时转发媒体数据,缓存last gop,当有连麦者加入时无缝切换为混流模式。另外还有混流录制,帧率对齐用户端。
第四部分是有关落地计划的介绍,如:手机端编解码汇编优化,以提高H.265的覆盖率;支持更多渲染特效;AI图像增强等计划。
.大众点评客户端视频实时超分实践
周文业 美团点评 音视频研发工程师
所属专题:客户端建设及调优实践
视频超分端上部署具有省流、实时等优势。然而,随着分辨率增加算力和存储成本成倍提升,在不依赖硬件平台优化的前提下,如何突破移动端算力限制、保持超分实时性、实现机型高覆盖,并获得明显超分效果是大分辨率视频端上实时超分落地必须面对的难点和挑战。本次分享将从模型优化、工程优化、机型覆盖、帧率保障等方面介绍大众点评端上实时超分能力落地过程中所采用的解决方案和最佳实践。
本次分享共分为4个部分,首先介绍端上超分推理如何处理实时性、超分效果和视频分辨率的关系。涉及超分推理延迟优化、推理实时性的判定和超分效果评价,以及如何在满足实时性和超分效果的前提下不断提升目标视频分辨率。
第二部分将会介绍超分模型如何落地到视频播放的业务场景,包括超分架构设计、视频超分播放流水线设计和超分监控设计。
另外,端上超分落地对实时性有很高的要求,而超分过程涉及到很多耗时任务,本次分享将介绍如何从流程简化和过程加速角度进行实时性优化。
第四部分是通过端上超分推理需要考虑到的机型、分辨率和帧率等因素,将介绍如何通过超分规则控制资源分配、机型覆盖。
以上仅为大会部分演讲话题的提前剧透,更多精彩内容将在5月20-21日上海站大会进行分享哈~ 欢迎大家莅临LiveVideoStackCon 2022 音视频技术大会 上海站,期待与你相遇在春暖花开的日子里。
⭐️ 福利放送 ⭐️
请在评论区留下您以往参与LiveVideoStack活动的感悟或者建议,我们将评选三位“最真情实感”用户并送上礼物~
扫描二维码 直达9折优惠
2022年5月20-21日
上海海神诺富特大酒店
策划、编辑:Teresa
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。