AliSSR 语音超分算法:让在线会议语音更明亮更自然

2022-03-28
阅读 3 分钟
1.2k
超分让在线会议语音更明亮,在线会议已成为日常工作中较为普遍的沟通交流方式,接入会议的方式也呈现多样化,比如电脑入会、手机入会又或是电话入会。
封面图

带你了解2022两会黑科技:阿里云视频云「AI编辑部3.0」

2022-03-21
阅读 4 分钟
1.6k
5G链接前后方,AI直抵采访一线,视频生产的云端化和移动化,重塑了媒体生产与传播的全流程,“AI编辑部”助力人民日报新媒体全链路上云,由此,轻量化、智能化的AI编辑部让每一次两会报道都更“劲”一步。
封面图

ICASSP 2022 | 前沿音视频成果分享:基于可变形卷积的压缩视频质量增强网络

2022-03-11
阅读 4 分钟
1.7k
阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》(Deformable Convolution Dense Network for Compressed Video Quality Enhancement)已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主题会议接收,并受邀在今年5月的全球会议上向工业界和学术界进...
封面图

语音顶会 ICASSP 2022 成果分享:基于时频感知域模型的单通道语音增强算法

2022-03-03
阅读 4 分钟
1.4k
近日,阿里云视频云音频技术团队与新加坡国立大学李海洲教授团队合作论文 《基于时频感知域模型的单通道语音增强算法 》(Time-Frequency Attention for Monaural Speech Enhancement ) 被 ICASSP 2022 接收, 并受邀于今年 5 月在会议上向学术和工业界做研究报告。ICASSP(International Conference on Acoustics, Speech...
封面图

一部属于阿里云视频云的【百年奥运云上故事】

2022-02-28
阅读 3 分钟
1.4k
“奥运120多年历史,是人类更高更快更强的拼搏史,也是科技应用的演变史。从时间维度看,奥运是一个传统产业,但基于数字化,奥运正焕发着新光彩。北京冬奥会以前所未有的数字化水平,让更多人感受奥运文化与精彩。”巴赫说。
封面图

解码北京冬奥沉浸式报道黑科技: 阿里云视频云「互动虚拟演播技术」

2022-02-25
阅读 4 分钟
1.2k
“虚拟演播厅”在东京奥运会就曾进入奥运村,而在2022冬奥期,其技术方案全面升级,达到广电级导播效果的同时,接入门槛极大降低,大大拓展了该技术的应用场景。同时在链路上打通RTC和GRTN网络,将多机位、多视角实时同步技术能力,与RTC实时连麦、异地开播能力结合,可实现主播、嘉宾的多层虚拟背景等能力叠加,提升沉浸...
封面图

揭秘2022冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?

2022-02-22
阅读 4 分钟
1.6k
但绿色奥运不止如此,在面临 Covid-19 限制和物理隔阂之下,千里之外,人与人的会面可以透过绿色科技之光而以全息形态实现,这便是阿里云视频云基于AliRTC(音视频通信技术)推出的云上创新解决方案——阿里云聚“Alibaba Cloud ME”,第一次在百年奥运史上跨越物理空间,创造了人与人之间的“云聚”时刻。(以下简称Cloud ME)

百年奥运的凌空之美,AI 云智剪背后的新算法

2022-02-18
阅读 4 分钟
1.4k
奥运赛事每天都在上演冰雪奇迹,而捕捉发生瞬间,凝结最精彩、最动人的体育人文画面,让“冰之舞”、“雪之舞”、“速度之美”、“凌空之美”如盛宴般绽放,让“金牌时刻”与“国将风采”变成永恒回荡时空。而实现这一切的,源自阿里云视频云AI编辑部提供的云上智能生产能力——AI云智剪。
封面图

中国视频云千亿市场,阿里云四年稳居“第一”

2022-01-24
阅读 3 分钟
1.2k
国际权威数据公司IDC发布《中国视频云市场跟踪(2021 上半年)》报告:阿里云连续四年稳居中国视频云整体市场份额第一,整体市场份额占比达25.9%。
封面图

干掉大小流切换 I 帧!阿里云 RTC QoS 及视频编码联合优化之切流编码

2022-01-20
阅读 4 分钟
1.8k
如果要在两条分辨率不同的视频流之间切换,尽管这两条流的画面内容基本一样,但是由于两条流的参考帧不同,分辨率不同,目前所有的视频编码标准都无法做到利用帧间预测编码得到编解码匹配的结果,而帧内预测编码即 I 帧的压缩效率是非常低下的,因此在切流处很容易造成视频质量下降或由于码率突增引起的卡顿;阿里云 RTC...
封面图

阿里云视频云「 vPaaS 」演绎了怎样的音视频应用开发「未来图景」?

2022-01-17
阅读 4 分钟
1.7k
vPaaS是阿里云视频云最新推出的低代码音视频应用开发产品,其中,vPaaS低代码音视频工厂,彻底打破了音视频应用的繁冗技术开发壁垒;vPaaS视频原生应用开发平台,全新定义了音视频应用的开发方式。
封面图

透析阿里云视频云「低代码音视频工厂」之能量引擎——vPaaS 视频原生应用开发平台

2022-01-13
阅读 4 分钟
1.3k
为满足企业用户极速搭建高品质专属音视频业务的需求,阿里云视频云的“低代码音视频工厂”应运而生,但极速而高品质的平台搭建诉求,需要用全新的开发方式才能真正实现,而全新的开发方式背后蕴藏着强大的能量引擎,这便是“vPaaS视频原生应用开发平台”。
封面图

vPaaS低代码音视频工厂:极速智造,万象空间

2022-01-12
阅读 2 分钟
1.7k
当下音视频技术越来越广泛地应用于更多行各业中,但因开发成本高、难度系数大等问题,掣肘了很多企业业务的第二增长需求。阿里云视频云基于云原生、音视频、人工智能等先进技术,提供易接入、强拓展、高效部署和覆盖多场景的音视频服务——vPaaS低代码音视频工厂,助力企业快速搭建高品质的专属音视频业务平台。
封面图

阿里云视频云低代码音视频工厂正式上线,以vPaaS全新定义企业级音视频应用开发

2022-01-07
阅读 2 分钟
1.4k
1月5日,阿里云视频云“低代码音视频工厂vPaaS“正式上线,极大程度降低音视频开发门槛,打破传统音视频技术壁垒,全新定义企业级的音视频应用开发。
封面图

从直播硬件出发,浅析直播技术到物联网设备的智能化趋势

2021-12-16
阅读 5 分钟
2.4k
直播有个人直播(泛娱乐直播)和企业直播(商业&商务直播)之分;个人直播的投入成本低,一部手机便可以随时随地开播,且各直播App有足够多的直播辅助工具来协助开播,对增值服务需求不高;企业直播讲究规范,有专门的直播间,投入的人力物力很大,直播影响面广泛,对专业的直播硬件,PaaS,SaaS等软件服务以及运营...
封面图

提升 RTC 音频体验 - 从搞懂硬件开始

2021-11-29
阅读 4 分钟
2.2k
RTC(实时音视频通信)技术的快速发展,助力了直播、短视频等互动娱乐形式的普及;在全球疫情持续蔓延的态势下,云会议需求呈现爆发式增长,进一步推动了 RTC 行业的快速发展。为了给客户提供稳定可靠的服务,网络系统方面需要不断提升频道连通率,降低会议过程中的断流率,增强抗弱网能力;视频方面需要提升视频清晰度...

ICCV 2021口罩人物身份鉴别全球挑战赛冠军方案分享

2021-11-22
阅读 9 分钟
2.1k
10月11-17日,万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行,受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队(由阿里云视频云和达摩院视觉团队组成)参加了 MFR 口罩人物身份鉴别全球挑战赛,并在总共5个赛道中,一举拿下1个冠军、1个亚...

拥抱智能,AI 视频编码技术的新探索

2021-11-16
阅读 7 分钟
1.8k
随着视频与交互在日常生活中的作用日益突显,愈发多样的视频场景与不断提高的视觉追求对视频编码提出更高的挑战。相较于人们手工设计的多种视频编码技术,AI 编码可以从大数据中自我学习到更广泛的信号内在编码规律。工业界与学术界发力推动 AI 视频编码标准并进行新框架的探索。

软硬一体的算法实践,阿里云如何以算法实现场景 “再创新”?

2021-11-16
阅读 12 分钟
1.8k
音视频消费的新场景催生了越来越多新的技术需求,从当下的直播、点播、RTC,到未来的 XR 和元宇宙,音视频技术对新场景的支撑越来越趋向于综合性,近年来 AI 算法发展迅猛,但是较好的算法效果往往需要消耗很大的算力资源,这使算法商业化落地面临非常大的挑战。我们应该如何充分发挥软硬一体的能力?如何有效平衡算法效...

编解码再进化:Ali266 与下一代视频技术

2021-11-15
阅读 13 分钟
2.3k
过去的一年见证了人类百年不遇的大事记,也见证了多种视频应用的厚积薄发。而因此所带来的视频数据量的爆发式增长更加加剧了对高效编解码这样的底层硬核技术的急迫需求。

AliRTC 开启视频互动 “零计算” 时代

2021-11-08
阅读 4 分钟
2.1k
在 2021 云栖大会《产业视频化创新与最佳实践》视频云主题论坛中,阿里云智能高级技术专家在《AliRTC 开启视频互动 "零处理" 时代》的主题演讲中,发布了阿里云视频云下一代实时交互解决方案 —RTC “零处理”,同时分享了阿里云视频云在 RTC 产品的探索和实践,以下为演讲内容整理。
封面图

阿里云视频云,用技术普惠打造平民化“虚拟人”

2021-11-04
阅读 3 分钟
2.3k
近日,国内首个超写实数字人 AYAYI 宣布入职阿里,成为天猫超级品牌日的数字主理人,二者将共同开启元宇宙的营销世界。在未来她将与天猫解锁多个身份,如 NFT 艺术家、数字策展人、潮牌主理人、顶流数字人等等。
封面图

四种 AI 技术方案,教你拥有自己的 Avatar 形象

2021-11-04
阅读 6 分钟
2.3k
随着元宇宙概念的大火,Avatar 这个词也开始越来越多出现在人们的视野。2009 年,一部由詹姆斯・卡梅隆执导 3D 科幻大片《阿凡达》让很多人认识了 Avatar 这个英语单词。不过,很多人并不知道这个单词并非导演杜撰的,而是来自梵文,是印度教中的一个重要术语。根据剑桥英语词典解释,Avatar 目前主要包含三种含义。

LiveVideoStackCon2021 北京站专访:从上云到创新,视频云的新技术、新场景

2021-10-26
阅读 5 分钟
1.4k
伴随着视频技术的进步和标准的迭代,视频产业从模拟进入到数字时代,完成了从电影电视到互联网的媒介转换,并且衍生出了超高清、3D、AR/VR 等多种创新形态。特别是在后疫情的当下,我们可以看到音视频技术领域的诸多新变化,云与端的协同互动、算法创新与工程应用的深度交合、场景与需求的渗透促进,在严峻的挑战下,为...
封面图

【免费报名】与阿里云一同探索视频云的新技术与新场景

2021-10-25
阅读 4 分钟
1.5k
在过去的一年中,我们可以看到多媒体特别是音视频技术的能力在严峻的挑战下,为各行各业带来了巨大的变化。疫情过后,又会有哪些多媒体新技术、新实践呈现在大众的视野当中?为行业的发展与应用带来哪些新的趋势与机会?
封面图

10 月 30 日 北京 LiveVideoStack 阿里云视频云专场限量赠票 100 张

2021-10-15
阅读 1 分钟
1.4k
10 月 30 日 | 北京 LiveVideoStack 将携手阿里云共邀 4 位技术大咖,一同探讨从上云到创新,视频云的新技术与新场景。阿里云视频云依托阿里云服务数百万开发者的卓越服务能力与实践,在本专场演讲中,将从云计算服务、网络调度到端侧呈现等视频生产与消费的全流程角度出发,分享下一代技术趋势和判断,并从实践角度分享...
封面图

云栖大会|盛宴之下,共赴一场视频云的进化论

2021-10-14
阅读 3 分钟
986
2021 云栖大会10 月 21 日,阿里云视频云将深度演绎一场视频云赛道的全面进化音视频技术开创产业视频化新蓝海新内容与新交互的演进,推动了消费端全方位的体验革新,展开了云上视频新景象,促动了众多行业音视频数智化转型,更打开了产业视频化的更大空间。视频云作为大视频产业的技术底座,如何渗透、影响并与产业结合...
封面图

云栖大会|感受万物数字化,体验千行视频化

2021-10-13
阅读 3 分钟
2.3k
从10月19日至22日,云栖大会将带来100+场新思想论坛、450+最热科技新品、1000+数字新物种、40000平米的“云栖数字谷”沉浸科技体验,以及一系列炫目的极客盛会。
封面图

浅谈语音质量保障:如何测试 RTC 中的音频质量?

2021-09-27
阅读 4 分钟
3.1k
日常音视频开会中我们或多或少会遭遇这些场景:“喂喂喂,可以听到我说话吗?我听你的声音断断续续的”,“咦,我怎么可以听到回声?”,“太吵啦,我听不清楚你在说啥” 等等。这些语音质量问题影响音视频开会体验,如若是重要的会议,那足够让人 “恼羞成怒”。那么如何有效的减少这些问题发生呢?本系列文章就将为大家分享阿...
封面图

一朵云、一张网、一体化 ——GRTN 打造最佳流媒体场景实践

2021-09-24
阅读 3 分钟
2.6k
卢日分享了他对分布式云的见解,他表示,Gartner 连续两年将分布式云列为全球 10 大最顶级技术趋势,并预测到 2025 年超过 50% 的企业将会使用分布式云,分布式云代表了云计算的未来。
封面图