今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。

开发者和企业用户在魔乐社区中可以直接下载并体验。

Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。可直接生成204帧、540P分辨率的高质量视频。

根据阶跃星辰此前公布评测结果,Step-Video-T2V 在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型;而 Step-Audio 是行业内首款产品级开源语音交互大模型,能生成多种情感、方言、语言、唱腔及个性化风格的语音。

阶跃星辰在不久前的生态开放日上透露,3月份还将开源图生视频模型。

据了解,魔乐社区由天翼云与华为联合打造,面向 AI 开发者与技术爱好者,提供模型、数据集、开发工具链与应用 的一站式托管与展示服务。为了方便模型及应用的展示,社区还提供免费算力支持, 让用户可以在线体验模型推理,无需复杂环境搭建,即可快速验证 AI 方案。

目前,头部技术社区已纷纷上架阶跃星辰两款开源多模态模型,除魔乐社区外,魔搭社区(ModelScope)、模力方舟(Gitee AI)、HuggingFace、Replicate 平台上均可体验。

此外,阶跃星辰开源引发了芯片企业、云厂商、智能终端厂商和创作者平台的关注,包括天数智芯、阿里云、火山引擎、TCL、LiblibAI、欢瑞世纪等各行各业的标杆企业均已接入阶跃星辰开源生态。


量子位
43 声望20k 粉丝

一家专注于人工智能与前沿科技领域的产业服务平台。