目前支持中文的,最好的 text-to-speech 和 audio-to-text 模型是哪个?
就是把文字转成音频,和把音频转成文字的
要求开源免费,可以私有化部署的
目前支持中文的,最好的 text-to-speech 和 audio-to-text 模型是哪个?
就是把文字转成音频,和把音频转成文字的
要求开源免费,可以私有化部署的
1 回答3.2k 阅读
4 回答642 阅读✓ 已解决
1 回答3k 阅读
1 回答921 阅读✓ 已解决
2 回答1.4k 阅读
1 回答1k 阅读
1 回答736 阅读
一、Text-to-Speech(文本转语音)
1.Tacotron 2:这是一个由谷歌开源的文本到语音模型:https://github.com/Rayhane-mamah/Tacotron-2。
2.Mozilla TTS:这是一个由Mozilla开源的文本到语音模型,支持多种语言(包括中文):https://github.com/mozilla/TTS。
二、Audio-to-Text(音频到文本):
1.DeepSpeech:这是一个由Mozilla开源的语音识别模型:https://github.com/mozilla/DeepSpeech。