能说方言会唱歌，阶跃星辰 Step-Audio-TTS-3B 在线体验上线模力方舟

欢快的柳树

3 月 11 日广东

阅读 1 分钟

0

阶跃星辰开源的文本转语音模型Step-Audio-TTS-3B 现已上线模力方舟 Serverless API，访问以下连接即可体验使用：https://ai.gitee.com/serverless-api?model=Step-Audio-TTS-3B

Step-Audio-TTS-3B是业界首个基于大规模合成数据集并采用 LLM-Chat 范式训练的文本转语音（TTS）模型。该模型在SEED TTS Eval基准测试中取得了SOTA（最先进的）字符错误率成绩。

内容一致性的表现对比中，Step-Audio-TTS-3B的中英文 CER（字符错误率）和 WER（词错误率）均表现出色

Step-Audio-TTS-3B支持多种语言、丰富的情感表达以及多样的语音风格控制。特别值得注意的是，Step-Audio-TTS-3B也是业界首个能够生成说唱和哼唱的 TTS 模型。

于谦大爷音色示例

四川话示例

哼唱示例

点击文末阅读原文，前往模力方舟体验Step-Audio-TTS-3B吧！

人工智能语音合成音频转化 serverless 大模型

阅读 559发布于 3 月 11 日

欢快的柳树

1 声望0 粉丝

« 上一篇

7 款热门项目管理工具深度剖析：Gitee 的卓越优势与多元选择

下一篇 »

开源中国2025年战略部署会全揭密：AI工具、AI教育、AI应用市场三箭齐发

引用和评论

推荐阅读

打造高效开发团队：主流DevOps工具推荐

欢快的柳树阅读 509

一文掌握 MCP 上下文协议：从理论到实践

陈明勇赞 6阅读 1.9k

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

思否编辑部赞 2阅读 5.1k

大模型时代，后端程序员如何避免被AI卷死？

王中阳讲编程赞 4阅读 2k

MCP 协议为何不如你想象的安全？从技术专家视角解读

Baihai_IDP赞 2阅读 456

🔥吐血整理 Bolt.diy 部署与应用攻略

北京宏哥阅读 6.1k

常见的 AI 模型格式

HuggingFace赞 1阅读 664

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。