LiveVideoStackCon回归深圳 《2024音视频技术发展报告》发布

大约1400多天前，LiveVideoStackCon首次来到深圳。和今年一样，那一年我们也交付了三场大会，只不过今年的第一场北京站其实是2022年延期而来。那一年非常疲惫，也非常幸运。如果不是2019年有过第一次，大概率今年也不会来深圳了，这可能是无法弥补的遗憾。

正如大家感受到的一样，多媒体生态的困局投射在每一名从业者身上。你不可能改变行业的急转直下，正如不可能改变当初千播大战、疫情点燃整个行业一样。你可以随口抱怨几句，继续行动。今天的LiveVideoStackCon正是在这样的局面下交付给大家的，算不上最精彩的一次，但同样是付出了团队心血的，诚意满满。

接下来推荐一些个人认为有独创性的议题，这种从经验和统计学出发筛选的推荐内容，对于单个读者的价值非常不稳定，建议大家直接参考大会官网的讲师信息和议题描述，根据个人需求自行判断。免责声明完成，那我们开始。

主题演讲：

《概述AVM的编码工具》陈诚/Google

推荐这个话题的理由有二。首先，这是过去四年间唯一一名来自海外（线下参与）的讲师。其次，AVM就是AOMedia的下一代视频编码标准，大概率会在2024年发布。尽管国内多媒体生态依然被ITU和ISO/IEC这些传统老牌组织的标准牢牢统治，但AV1已经在海外成为新的共识，受到空前的关注和应用。随着苹果在AV1/AVM上投入不断加大，也为AV1/AVM成为行业事实标准做好了铺垫。

专场：

《抖音背后的体验增长实战揭秘》

无论在国内还是在全球，字节是少数几个还在增长的重度应用视频的巨头，他们的一举一动当然值得关注，他们的经验也值得参考。本专场会围绕业务增长、体验、成本等关键维度，涉及直播、RTC、网络优化、后端流媒体流水线架构、AIGC等。你可以通过以上海报的二维码报名。

数字化与行业案例：

《突破边界：低延时视频技术的应用场景与挑战》扶凯/秒点科技

作为老朋友，扶凯早在2017年就在第一届LiveVideoStackCon做了分享。如今作为一名创业者，他和他的团队正在探索将流媒体技术应用于企业协同、远程导播台、云电脑等SaaS场景，他所面临的各种挑战与思考可能正是你需要的。

降本增效：

《希沃智能语音的低成本落地实践》李波/希沃

李波是希沃AI团队的leader，也是智能语音技术的研发主力，目测内容会非常干。

网络优化实践：

《元象RTC云网端协同技术的演进》涂承杰/元象

《端到端Low Latency HLS低延时方案》汪立民/微帧科技

涂承杰和汪立民都是我们非常期待合作的技术专家，而他们也非常低调，能够邀请他们来输出内容实属幸运。涂承杰此前是腾讯、Uber、高通、微软等公司视频编码专家。汪立民可能是我接触了唯二最低调的技术专家（另一位是爱奇艺的王志航），2017年就与他相识，足足用了6年时间邀请他出山。

AI与多媒体：

《芒果TV长视频内容理解检索与应用创新》郑孝直/芒果TV

芒果TV可能是在国内的同行中拥有最大规模的技术团队，历来重视技术、尊重人才，他们在媒体内容制播、商业化等方面处在领先地位。郑孝直这个话题也是所有长视频平台无法绕过去的挑战，直接关系到降本与效率。

音频新体验：

《座舱音频系统的架构设计和音频体验》高林/蔚来

音频创新的场景很多，但很难有另外一个场景的潜力超过智能座舱吧。作为造车新势力中的一员，蔚来在智能座舱音频应用的探索和经验应该值得关注。

元宇宙：

《AR协作的思考与实践》唐荣兴/亮风台

唐荣兴是国内首批AR创业技术人，一路走来已经超过了10年。由他来总结AR协作这个话题是非常适合的。唐荣兴经历了传统通信、移动通信、互联网通信的过程，他的这些经历也让他对协作有更深的认识。

QoE与数据驱动：

《水下图像质量评价与画质增强研究》赵铁松/福州大学

我选择了一个看上去非常冷门的场景——水下图像的质量与增强，但是个人认为这将是一个很有前景的领域，毕竟我们对水下世界的了解还非常有限。

视频编解码与AI：

《面向内容感知的超高清视频实时编解码技术》孟现东/鹏城实验室

《JPEG AI图像编码标准进展和应用》赵寅/华为

《端到端图像视频编码及其标准化》李礼/中国科学技术大学

这是一个神仙打架的专题，推荐起来非常困难，推荐这三位只是因为议题中的某个细节打动了我，并不代表其他议题不够出色。这三个话题分别从AI端到端视频编码工具与传统编码框架融合的混合编码方式、AI图片端到端编码以及AI编码的标准化三个角度切入，非常有代表性。

多媒体商业探索：

《未来音频》

《AIGC商业化落地》

《音视频通讯协作的过去、现在和未来》

多媒体商业探索是圆桌形式的自由讨论，你可以与嘉宾直接提问互动。设立这个专题的初衷就是为了探索多媒体的未来场景和商业化机会，而这正是我们这个领域十分欠缺的。

AIGC与内容生产：

《美图AI动漫功能的落地探索》李骈臻/美图

《XMusic：多模态可控的高质量通用作曲框架》田思达/腾讯

AIGC被认为是可以帮助多媒体领域很好的解决内容生产的瓶颈，可以大规模低成本的输出内容，但当下最大的挑战在于将AIGC应用在具体的商业场景上，这就对技术的鲁棒性、成本提出了更高的要求。以上两个话题都是具体应用场景下的AIGC探索，值得学习。

浏览器：

《WebCodecs 开启 Web 音视频新篇章》刘俊/哔哩哔哩

WebCodec是浏览器上与流媒体相关的非常重要的能力更新，有望彻底解决编解码这种高算力场景需求，从而替代传统的WebAssembly方案。

IoT与多媒体：

《混合现实影像在音视频会议领域的应用实践》陈宇/视熙科技

《万物云RTC技术演进的关键时刻》张自豪/万物云

《在嵌入式低资源系统中实现高效音视频播放》张丙儒/RT-Thread

这三个话题都来自创业团队，都在通过自己的方式探索流媒体与IoT结合的创新机会。

另一个足够幸运的是，我们完成了首次音视频技术发展报告发布，这是一份酝酿了5年多的报告，感谢团队的坚持，几百位参与了报告调研的行业用户，几十位技术专家为报告输出了关键信息与专业审校。

在这份《2024音视频技术发展报告》中，主要讨论了2个问题：当下国内的音视频技术生态的现状，以及未来的发展方向。

现在你可以扫码或者点击阅读原文获取这份报告，如果你发现报告中有任何错误或欠妥之处，请联系我们 contribute@livevideostack.com 。

最后，预祝大家有两天充实的参会之旅。

LiveVideoStackCon回归深圳《2024音视频技术发展报告》发布

LiveVideoStack

引用和评论

AIGC时代下阿里云视频云媒体内容生产技术实践

2025版 RTC、直播、点播技术对比｜腾讯云/即构/声网如何选型

三分钟掌握音视频处理 | 在 Rust 中优雅地集成 FFmpeg

三分钟掌握视频分辨率修改 | 在 Rust 中优雅地使用 FFmpeg

CVPR 2025 | 火山引擎获得NTIRE 视频质量评价挑战赛全球第一

三分钟掌握音视频信息查询 | 在 Rust 中优雅地集成 FFmpeg

【harmonyOS NEXT 下的前端开发者】WAV音频编码实现