阿里云视频云 - SegmentFault 思否

隔空手势交互，在现实世界上演“得心应手”

CloudImagine

2022-06-01

阅读 3 分钟

1.7k

手，作为人体最灵活的器官，参与我们生活的方方面面；手，是除了眼睛之外能直接感受三维世界和物体的器官；手，作为无声的交互工具，已经在计算机领域占了无比重要的地位。

当姿态估计算法遇上《本草纲目》，看“刘畊宏男孩”如何驱动虚拟人

CloudImagine

2022-05-20

阅读 3 分钟

1.4k

最近，最炙烈的话题莫过于刘畊宏的男孩女孩们。刘畊宏的燃脂健身直播刷屏网络，掀起了一阵狂热不退的居家健身潮，以周杰伦的《本草纲目》为旋律的毽子舞，更是引发了全民打卡热。于是，程序员圈是怎么游刃于这波热潮的？阿里云程序员化身“刘畊宏男孩”[链接]一则程序员的“本草纲目”让大家预热体会一下“人体姿态估计算法”...

AliAGC 自动增益控制算法：解决复杂场景下的音量问题

CloudImagine

2022-05-19

阅读 4 分钟

2.6k

音视频会议，直播连麦以及短视频已经成为人们工作、教学以及娱乐的一部分，其背后都离不开音视频实时通信等关键技术的广泛应用。音频方面，可预见的是客户业务形式的多样性，环境的复杂性，以及接入设备的差异性会带来的一系列问题，我们意识到单一场景的技术与策略已经无法满足日趋暴露的线上问题，音频前处理 3A（AEC...

AliIAC 智能音频编解码器：在有限带宽条件下带来更高质量的音频通话体验

CloudImagine

2022-05-05

阅读 3 分钟

1.9k

随着信息技术的发展，人们对实时通信的需求不断增加，并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数均处于良好的网络状况，但仍有不少地区处于极差的网络条件下，除此之外，即使在网络良好区域，也仍会存在弱网现象。那么如何...

阿里云视频云互动虚拟技术，打造虚拟直播最佳沉浸式体验

CloudImagine

2022-04-26

阅读 4 分钟

3.1k

2022是“体育超级大年”，冬奥会、亚运会、大运会、世界杯等各类大型体育赛事贯穿全年。由于受到疫情管控和物理空间的限制，赛事直播至关重要，观众体验需求也在不断升级。

打破虚拟边界的视频交互新方式，AR 隔空书写的应用理念和探索实践

CloudImagine

2022-04-19

阅读 3 分钟

1.2k

随着技术的发展和超视频化的时代驱动，交互的形式日渐丰富。从屏幕点触，到语音交互，人脸、指纹、声纹，再到近年流行的 AR 和 VR……人类早在语言出现之前便习惯使用肢体和手势这种近乎本能的沟通方式来进行交流，作为最基础和自然的交互方式，手势交互的应用场景越来越多。

CVPR2022 前沿研究成果解读：基于生成对抗网络的深度感知人脸重演算法

CloudImagine

2022-04-18

阅读 3 分钟

2.3k

凭借在人脸生成领域的扎实积累和前沿创新，阿里云视频云与香港科技大学合作的最新研究成果《基于生成对抗网络的深度感知人脸重演算法》（Depth-Aware Generative Adversarial Network for Talking Head Video Generation）被 CVPR2022 接收。本文为最新研究成果解读。

阿里云视频云人脸生成领域最新研究成果入选 CVPR2022

CloudImagine

2022-04-15

阅读 2 分钟

1.2k

CVPR（IEEE Conference on Computer Vision and Pattern Recognition）作为计算机视觉和模式识别领域的顶级会议，在全球具有极高的权威性。目前在中国计算机学会推荐国际学术会议的排名中，CVPR为人工智能领域的A类会议。

AliPLC 智能丢包补偿算法,提升弱网环境的通话质量

CloudImagine

2022-04-11

阅读 4 分钟

2.8k

在线视频/语音通话逐渐成为人们日常生活的一部分，而复杂多变的网络环境会导致部分音频包无法传送到接收端，造成语音信号的短时中断或者卡顿，这会严重影响通话体验，为解决这类问题，阿里云视频云音频技术团队在综合考虑效果、性能开销、实时性等诸多因素后，研发了实时因果的智能丢包补偿算法 AliPLC (Ali Packet Loss...

如何在云端重塑内容生产？来看这场虚拟人主持的发布会

CloudImagine

2022-04-08

阅读 2 分钟

1.3k

3月30日，阿里云视频云在线上举行了一场由虚拟人助力主持的「智能媒体生产」产品升级发布会，活动围绕产品能力的展现、视频生产流程的革新、高效生产背后的技术先进性，阐释了企业如何在云端重塑视频内容生产的全流程，打造云端内容制作新范式。

Ali266首次商用落地，助力优酷码率最高节省40%

CloudImagine

2022-04-07

阅读 5 分钟

2.2k

阿里云自研编码器Ali266于2022年1月在优酷正式上线，这是已知的业界首个H.266/VVC标准的编码器商用落地项目。经过两个月的实际运行数据显示，开启Ali266后，同等画面清晰度的情况下比原H.265/HEVC方案码率最高节省40%，卡顿率降低50%，充分证明了Ali266的商用价值。

AliSSR 语音超分算法：让在线会议语音更明亮更自然

CloudImagine

2022-03-28

阅读 3 分钟

1.5k

超分让在线会议语音更明亮，在线会议已成为日常工作中较为普遍的沟通交流方式，接入会议的方式也呈现多样化，比如电脑入会、手机入会又或是电话入会。

带你了解2022两会黑科技：阿里云视频云「AI编辑部3.0」

CloudImagine

2022-03-21

阅读 4 分钟

1.8k

5G链接前后方，AI直抵采访一线，视频生产的云端化和移动化，重塑了媒体生产与传播的全流程，“AI编辑部”助力人民日报新媒体全链路上云，由此，轻量化、智能化的AI编辑部让每一次两会报道都更“劲”一步。

ICASSP 2022 | 前沿音视频成果分享：基于可变形卷积的压缩视频质量增强网络

CloudImagine

2022-03-11

阅读 4 分钟

阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》（Deformable Convolution Dense Network for Compressed Video Quality Enhancement）已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主题会议接收，并受邀在今年5月的全球会议上向工业界和学术界进...

语音顶会 ICASSP 2022 成果分享：基于时频感知域模型的单通道语音增强算法

CloudImagine

2022-03-03

阅读 4 分钟

1.9k

近日，阿里云视频云音频技术团队与新加坡国立大学李海洲教授团队合作论文《基于时频感知域模型的单通道语音增强算法》(Time-Frequency Attention for Monaural Speech Enhancement ) 被 ICASSP 2022 接收, 并受邀于今年 5 月在会议上向学术和工业界做研究报告。ICASSP（International Conference on Acoustics, Speech...

一部属于阿里云视频云的【百年奥运云上故事】

CloudImagine

2022-02-28

阅读 3 分钟

1.5k

“奥运120多年历史，是人类更高更快更强的拼搏史，也是科技应用的演变史。从时间维度看，奥运是一个传统产业，但基于数字化，奥运正焕发着新光彩。北京冬奥会以前所未有的数字化水平，让更多人感受奥运文化与精彩。”巴赫说。

解码北京冬奥沉浸式报道黑科技：阿里云视频云「互动虚拟演播技术」

CloudImagine

2022-02-25

阅读 4 分钟

1.4k

“虚拟演播厅”在东京奥运会就曾进入奥运村，而在2022冬奥期，其技术方案全面升级，达到广电级导播效果的同时，接入门槛极大降低，大大拓展了该技术的应用场景。同时在链路上打通RTC和GRTN网络，将多机位、多视角实时同步技术能力，与RTC实时连麦、异地开播能力结合，可实现主播、嘉宾的多层虚拟背景等能力叠加，提升沉浸...

揭秘2022冬奥黑科技，阿里云视频云「Cloud ME」如何实现全息会面？

CloudImagine

2022-02-22

阅读 4 分钟

1.9k

但绿色奥运不止如此，在面临 Covid-19 限制和物理隔阂之下，千里之外，人与人的会面可以透过绿色科技之光而以全息形态实现，这便是阿里云视频云基于AliRTC（音视频通信技术）推出的云上创新解决方案——阿里云聚“Alibaba Cloud ME”，第一次在百年奥运史上跨越物理空间，创造了人与人之间的“云聚”时刻。（以下简称Cloud ME）

百年奥运的凌空之美，AI 云智剪背后的新算法

CloudImagine

2022-02-18

阅读 4 分钟

1.7k

奥运赛事每天都在上演冰雪奇迹，而捕捉发生瞬间，凝结最精彩、最动人的体育人文画面，让“冰之舞”、“雪之舞”、“速度之美”、“凌空之美”如盛宴般绽放，让“金牌时刻”与“国将风采”变成永恒回荡时空。而实现这一切的，源自阿里云视频云AI编辑部提供的云上智能生产能力——AI云智剪。

中国视频云千亿市场，阿里云四年稳居“第一”

CloudImagine

2022-01-24

阅读 3 分钟

1.4k

国际权威数据公司IDC发布《中国视频云市场跟踪（2021 上半年）》报告：阿里云连续四年稳居中国视频云整体市场份额第一，整体市场份额占比达25.9%。

干掉大小流切换 I 帧！阿里云 RTC QoS 及视频编码联合优化之切流编码

CloudImagine

2022-01-20

阅读 4 分钟

如果要在两条分辨率不同的视频流之间切换，尽管这两条流的画面内容基本一样，但是由于两条流的参考帧不同，分辨率不同，目前所有的视频编码标准都无法做到利用帧间预测编码得到编解码匹配的结果，而帧内预测编码即 I 帧的压缩效率是非常低下的，因此在切流处很容易造成视频质量下降或由于码率突增引起的卡顿；阿里云 RTC...

阿里云视频云「 vPaaS 」演绎了怎样的音视频应用开发「未来图景」？

CloudImagine

2022-01-17

阅读 4 分钟

1.9k

vPaaS是阿里云视频云最新推出的低代码音视频应用开发产品，其中，vPaaS低代码音视频工厂，彻底打破了音视频应用的繁冗技术开发壁垒；vPaaS视频原生应用开发平台，全新定义了音视频应用的开发方式。

透析阿里云视频云「低代码音视频工厂」之能量引擎——vPaaS 视频原生应用开发平台

CloudImagine

2022-01-13

阅读 4 分钟

1.5k

为满足企业用户极速搭建高品质专属音视频业务的需求，阿里云视频云的“低代码音视频工厂”应运而生，但极速而高品质的平台搭建诉求，需要用全新的开发方式才能真正实现，而全新的开发方式背后蕴藏着强大的能量引擎，这便是“vPaaS视频原生应用开发平台”。

vPaaS低代码音视频工厂：极速智造，万象空间

CloudImagine

2022-01-12

阅读 2 分钟

1.9k

当下音视频技术越来越广泛地应用于更多行各业中，但因开发成本高、难度系数大等问题，掣肘了很多企业业务的第二增长需求。阿里云视频云基于云原生、音视频、人工智能等先进技术，提供易接入、强拓展、高效部署和覆盖多场景的音视频服务——vPaaS低代码音视频工厂，助力企业快速搭建高品质的专属音视频业务平台。

阿里云视频云低代码音视频工厂正式上线，以vPaaS全新定义企业级音视频应用开发

CloudImagine

2022-01-07

阅读 2 分钟

1.7k

1月5日，阿里云视频云“低代码音视频工厂vPaaS“正式上线，极大程度降低音视频开发门槛，打破传统音视频技术壁垒，全新定义企业级的音视频应用开发。

从直播硬件出发，浅析直播技术到物联网设备的智能化趋势

CloudImagine

2021-12-16

阅读 5 分钟

2.6k

直播有个人直播（泛娱乐直播）和企业直播（商业&商务直播）之分；个人直播的投入成本低，一部手机便可以随时随地开播，且各直播App有足够多的直播辅助工具来协助开播，对增值服务需求不高；企业直播讲究规范，有专门的直播间，投入的人力物力很大，直播影响面广泛，对专业的直播硬件，PaaS，SaaS等软件服务以及运营...

提升 RTC 音频体验 - 从搞懂硬件开始

CloudImagine

2021-11-29

阅读 4 分钟

2.3k

RTC（实时音视频通信）技术的快速发展，助力了直播、短视频等互动娱乐形式的普及；在全球疫情持续蔓延的态势下，云会议需求呈现爆发式增长，进一步推动了 RTC 行业的快速发展。为了给客户提供稳定可靠的服务，网络系统方面需要不断提升频道连通率，降低会议过程中的断流率，增强抗弱网能力；视频方面需要提升视频清晰度...

ICCV 2021口罩人物身份鉴别全球挑战赛冠军方案分享

CloudImagine

2021-11-22

阅读 9 分钟

2.4k

10月11-17日，万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行，受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队（由阿里云视频云和达摩院视觉团队组成）参加了 MFR 口罩人物身份鉴别全球挑战赛，并在总共5个赛道中，一举拿下1个冠军、1个亚...

拥抱智能，AI 视频编码技术的新探索

CloudImagine

2021-11-16

阅读 7 分钟

2.1k

随着视频与交互在日常生活中的作用日益突显，愈发多样的视频场景与不断提高的视觉追求对视频编码提出更高的挑战。相较于人们手工设计的多种视频编码技术，AI 编码可以从大数据中自我学习到更广泛的信号内在编码规律。工业界与学术界发力推动 AI 视频编码标准并进行新框架的探索。

软硬一体的算法实践，阿里云如何以算法实现场景 “再创新”？

CloudImagine

2021-11-16

阅读 12 分钟

音视频消费的新场景催生了越来越多新的技术需求，从当下的直播、点播、RTC，到未来的 XR 和元宇宙，音视频技术对新场景的支撑越来越趋向于综合性，近年来 AI 算法发展迅猛，但是较好的算法效果往往需要消耗很大的算力资源，这使算法商业化落地面临非常大的挑战。我们应该如何充分发挥软硬一体的能力？如何有效平衡算法效...