音视频技术在直播、语聊、游戏等泛娱乐领域早已有了大量深度应用,在互联网教育领域也已成为标配,到金融行业的视频双录、线上营业厅,保险行业的视频开户、用来开早会,随着各行业信息化的不断深入,音视频技术的数字化程度越来越完善。LiveVideoStack特别采访了即构科技技术副总裁廖念波,请他以后台技术老兵的角度,讲述了他对视频云PaaS服务后台架构、运营,以及音视频行业的理解。
专家信息
廖念波是即构科技技术副总裁,后台技术负责人,拥有16年互联网海量服务架构和技术运营经验。此前在腾讯QQ、腾讯视频任技术总监,负责基础后台团队、AI技术团队。
以下内容由LiveVideoStack与廖念波的采访整理而成。
01 目前在即构科技中负责的主要业务
我在即构科技分管实时音视频云PaaS服务的后台团队。基于我们的PaaS服务,客户可以快速实现:
1. 多人的音视频实时通信,例如视频会议、线上教育、直播连麦、游戏开黑等。
2. 大型的直播,例如秀场、演唱会。
而客户完全不需要关心背后的编解码、流媒体传输、服务器开发和运维等。
02 加入即构科技是出于什么样的考虑?之前的工作经验与在即构科技的工作是否有不一致?
我之所以加入即构科技,主要看重这么三个方面。
1. 我之前在腾讯积累的的架构和运营经验有用武之地,能够发挥所长。
2. 相比我之前经历的toC/本地化的产品,即构科技提供的toB的PaaS服务,对我挑战更高,是更好地实践靶场。例如,多租户要求架构更加弹性,资源既共享又隔离;来自世界各地的用户要求我们的服务是去中心化的、全球分布;实时通信要求对低时延追求极致。
3. 即构科技是以技术立本的公司,技术是我们的第一竞争力,而且能够显著为客户和社会带来价值,这符合技术人出身的我的初衷。
说到异同点,我觉得前后这两段职业生涯,从技术和方法论的方面来说是相通的。不同的地方,除了前面第2点提到的具体技术挑战,还有很明显一点就是,即构科技是成长型的公司,我感受到有更多的事情去做和更大的空间去发挥。
其实,这一点不只是我,从普通员工到资深架构师或者管理干部,我们都会有这样的体会。我们一个刚毕业一两年的优秀的小伙子,就有机会操刀一个重要系统的构建,这样的机会不是哪里都有的。在这个过程中,你会觉得很有成就感,会感受到自己明显的成长蜕变,当然也会遇到非常多的困难,会痛苦、焦虑,也有快乐。
03 互联网行业工作20年中,印象特别深刻的是技术困难
回忆总是比经历要简单和轻松很多,现在回过头去看,似乎没有具体哪个技术点、哪个重大项目事件尤其难忘。虽然一路过来,我经常为一些技术困难纠结和烧脑,譬如怎么做抽象和解耦让架构更加清晰可扩展,怎么实现数据在全球的快速可靠的同步,以及怎么能够更高性能地实现网络传输……但这些工作可以说已经常态化,虽然跌宕起伏倒也波澜不惊。
但这几年我越发感受深刻的一点是:技术运营能力,是可以有很大的高下之分的,是很能体现团队水平的一个难题。技术运营能力弱的团队,要么一天到晚救火,按下葫芦浮起瓢,要么运动式梳理整顿,治标不治本,随着业务的增长和需求的演变,工作复杂度成指数上涨,系统稳定性难以为继。
而相比之下,技术运营能力强的团队,有这么几个特点。
1. 工作做得比较全面,没有落下明显的保健因子。例如,受敏捷软件开发的影响,一开始只是快速上线了业务特性,日志/监控/运维工具都没有管,后面也一直没有投入精力去补上,那这些工作的缺失会让雪球越滚越大。敏捷软件开发是很好的,但一些保健因子一定要及时补上。
2. 运营能力是一开始就和业务特性一样并重(甚至更高优先级)地设计到系统中去的。好的系统是“设计”出来的,虽然持续迭代、让产品如珊瑚一样生长的方法论非常好,但这些主要适用于业务特性/产品体验,基础的框架还是要一开始就设计好,否则每次迭代都伤筋动骨。
3. 使用软件工程/工具,而不是使用流程和依赖人员意识,来做团队协同和能力沉淀。DevOps工具让一个需求从提出到发布像工场流水线一样精密;自动化诊断工具让运维人员可以根据有限的信息,从运作极其复杂的系统中还原出第一现场并直指问题的要害;健壮性设计让系统像奶牛一样皮实耐摔,而不是像宠物一样捧在手心;混沌工程/压测把线上系统逼到墙角、用实际的表现说话。
04 目前音视频通信技术遇到的技术挑战
得益于全球互联网、基础科学、基础设施的快速发展,音视频通信技术体验越来越好,使用的人越来越多,涉及到的领域也越来越广,用户的预期也越来越高。但最基本的技术挑战一直没有变过:全球复杂的网络状况下,如何确保稳定的低时延的数据传输。
从用户侧的第一公里,到全球数百个国家地区间的公网中继,物理距离遥远、环节众多,可以认为是一个复杂的混沌系统。而要实现稳定的实时音视频数据,无异于穿越重重炮火,把信送给加西亚(编者注:《把信送给加西亚》是阿尔伯特·哈伯德的作品)。
我们团队通过海量服务实践积累,结合SDN技术,背靠基础多云商,自研了海量有序数据网络MSDN(Massive Serial Data Network),可以自动容错、智能选择最优传输路径,当出现线路故障时秒级响应/自动恢复,让使用者获得更高的网络质量。
根据不同客户的业务需求,即构分别提供了数据传输的“高速公路”和“专业赛道”,也就是低延迟直播Low-Latency Live(简称L3)产品和WebRTC超低延时技术。
L3将传输延迟由传统CDN直播的3~5秒降低到1秒,有效改进“在线教育、电商直播、体育直播、秀场直播”场景中的延迟高、弱网抗性差和内容不同步等问题。同时,也打破了市场上只能在CDN和RTC之间二选一的困境,帮助客户兼顾成本与性能,智能调度和平衡资源分配。
在自研技术音视频引擎和MSDN网络的支撑下,最近我们在低时延数据传输上又有了新的突破,实现了从“信息采集->处理->编码->传输->解码->渲染”全链路端到端70ms超低感官延迟。在70ms的时延下,人体的感官延迟几乎为零,这可以应用在对于互动反馈实时性要求更高的场景中。
这项技术被我们应用到了在线K歌的场景中,推出了“在线KTV实时合唱解决方案”,系统解决了以往线上K歌过程中,合唱者之间没办法实时对齐合唱的难题。我们是行业第一个落地真实时合唱场景的技术服务商。
05 音视频技术在转换为商业价值道路上的机遇
即构从创业至今一直秉持的理念是“让音视频技术融于无形”,我们实时音视频产品的迭代步履不停,同时又在云通信的不同层面上多点开花,推出了实时消息、低延迟直播产品、AI 视觉等产品,技术产品体系肉眼可见变得丰富立体,而融于“无形”的理念却在咱们每个人脑海里烙印更深了。因为不仅仅是技术和产品在往前跑,更多行业的生产流程、生产场景也在推陈出新,这样的变化并不意味着音视频技术要成为改造行业的主角,而是各种行业在更大的范围上包含了音视频技术。所以我们也选择用更结构化、层次化的产品矩阵去尝试多点融入,由此看到了一些化学反应。
除了提供底层的音视频技术支持,为了满足更多企业快速获得音视频能力的需求,我们还将PaaS产品方案化,渗透进具体的业务场景中,提供低代码、可扩展、弹性伸缩的aPaaS模式解决方案,让客户可以更快、更低成本地实现音视频产品。
今年2月份,我们推出了业内首个面向全行业的低代码互动平台产品RoomKit,通过对业务场景能力的完整封装,实现了互动房间的0码搭建。就算是没有技术团队的客户,也能够通过Roomkit的功能可视化配置,完成产品的接入和上线。此外,我们还提供了Talkline、小艺帮等App产品。
为什么要这样子去做呢?我们诞生在互联网行业,这里的数字化程度是比较完善的,音视频技术在直播、语聊、游戏等泛娱乐领域早已有了大量深度应用,各种玩法可以说脑洞大开玩出花了,此外音视频在互联网教育领域也已成为标配。但要说在传统行业里,因为企业信息化进程的进度差异,我们是有前有后切身地感受着变化,这个现象其实还挺有趣的。比如,传统教培行业用Roomkit快速进行线上化转型,在金融行业的视频双录、线上营业厅,保险行业的视频开户、用来开早会,小艺帮用于学校线上考试、远程招生。随着各行业信息化的不断深入,我相信这样的例子只会越来越多。
我觉得在和行业的整个融合过程中,要把技术转为商业价值,最关键还是“耐心”二字。我们预期是深入行业里产生化学反应,而不要快速平推的物理反应,所以必须千方百计站在客户角度去尝试为他们所在行业创造价值,从行业的信息化发展中长期受益,这才是最健康的。但既然选择了在行业变革的早期成为“合伙人”,自然就更得耐住一时的寂寞。
06 从技术大会中得到最大的收获
因为时间有限,来去匆匆 :)
但看到越来越多的公司/人加入或者关注实时音视频技术,人才优势与激烈竞争能够让整个行业做得更好。
参加技术大会,除了学习他人,对于我自己也是输出倒逼输入、输出倒逼系统性思考总结的过程,这个过程让我很有收获。
编辑:Cindy Chen
活动推荐
全球领先的实时音视频云服务商即构科技将于5月29日(周六)在北京联合火山引擎举办『泛娱乐社交音视频技术实践沙龙』,特别邀请到了思享无限(秀色直播)研发总监、即构科技解决方案高级架构师、火山引擎解决方案高级顾问三位嘉宾,分别从技术推动娱乐直播的内容升级与体验升级、共享体验场景创新、RTC服务体验优化、音视频业务全链路增长等维度分享最佳实践,复盘实战经验,畅聊技术趋势和未来玩法,对音视频技术/泛娱乐社交场景创新感兴趣的朋友,可扫描下方海报二维码
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。