GitHub - k2-fsa/sherpa-onnx: 使用下一代 Kaldi 和 onnxruntime 实现的语音转文本、文本转语音、说话人分离、语音增强、源分离和语音活动检测,无需互联网连接。支持嵌入式系统、Android、iOS、HarmonyO

主要观点:该仓库支持多种本地运行的功能,包括语音转文本、文本转语音等,可在多种平台和操作系统上运行,提供了多种编程语言的 API,还提供了 Huggingface Spaces、预构建的 Android APKs、Flutter APPs、Lazarus APPs 等的链接以及预训练模型的链接,并列举了一些使用 sherpa-onnx 的项目。
关键信息

  • 支持的功能:语音识别、语音合成、说话人分离等多种语音相关功能。
  • 支持的平台:x86、arm64 等多种架构,Linux、macOS 等多种操作系统,以及 Android、iOS 等移动平台。
  • 支持的编程语言:C++、C、Python 等多种语言。
  • Huggingface Spaces 链接:提供多种语音相关任务的试用空间。
  • 预构建的 Android APKs 链接:不同功能的 Android APK 下载链接。
  • 预构建的 Flutter APPs 链接:实时语音识别和文本转语音的 Flutter APP 下载链接。
  • 预训练模型链接:各种语音任务的预训练模型下载链接。
  • 项目使用 sherpa-onnx:列举了多个使用 sherpa-onnx 的项目,如 BreezeApp 等。
    重要细节
  • 不同功能的具体支持情况,如各种语音任务在不同平台和语言下的支持。
  • Huggingface Spaces 中不同空间的具体用途和对应的镜像地址。
  • 预构建的 APPs 中每个链接对应的具体功能和中国用户的相关链接。
  • 预训练模型中不同模型的名称、支持语言和描述。
  • 各个使用 sherpa-onnx 的项目的特点和相关链接。
阅读 48
0 条评论