一、Text-to-Speech(文本转语音)1.Tacotron 2:这是一个由谷歌开源的文本到语音模型:https://github.com/Rayhane-mamah/Tacotron-2。2.Mozilla TTS:这是一个由Mozilla开源的文本到语音模型,支持多种语言(包括中文):https://github.com/mozilla/TTS。二、Audio-to-Text(音频到文本):1.DeepSpeech:这是一个由Mozilla开源的语音识别模型:https://github.com/mozilla/DeepSpeech。Kaldi:Kaldi是一款流行的开源语音识别工具包:https://github.com/kaldi-asr/kaldi。
一、Text-to-Speech(文本转语音)
1.Tacotron 2:这是一个由谷歌开源的文本到语音模型:https://github.com/Rayhane-mamah/Tacotron-2。
2.Mozilla TTS:这是一个由Mozilla开源的文本到语音模型,支持多种语言(包括中文):https://github.com/mozilla/TTS。
二、Audio-to-Text(音频到文本):
1.DeepSpeech:这是一个由Mozilla开源的语音识别模型:https://github.com/mozilla/DeepSpeech。