GitHub - k2-fsa/sherpa-onnx: 使用下一代 Kaldi 和 onnxruntime 实现的语音转文本、文本转语音、说话人分离、语音增强、源分离和语音活动检测，无需互联网连接。支持嵌入式系统、Android、iOS、HarmonyO

发布于 2025-07-24

主要观点：该仓库支持多种本地运行的功能，包括语音转文本、文本转语音等，可在多种平台和操作系统上运行，提供了多种编程语言的 API，还提供了 Huggingface Spaces、预构建的 Android APKs、Flutter APPs、Lazarus APPs 等的链接以及预训练模型的链接，并列举了一些使用 sherpa-onnx 的项目。
关键信息：

支持的功能：语音识别、语音合成、说话人分离等多种语音相关功能。
支持的平台：x86、arm64 等多种架构，Linux、macOS 等多种操作系统，以及 Android、iOS 等移动平台。
支持的编程语言：C++、C、Python 等多种语言。
Huggingface Spaces 链接：提供多种语音相关任务的试用空间。
预构建的 Android APKs 链接：不同功能的 Android APK 下载链接。
预构建的 Flutter APPs 链接：实时语音识别和文本转语音的 Flutter APP 下载链接。
预训练模型链接：各种语音任务的预训练模型下载链接。
项目使用 sherpa-onnx：列举了多个使用 sherpa-onnx 的项目，如 BreezeApp 等。
重要细节：
不同功能的具体支持情况，如各种语音任务在不同平台和语言下的支持。
Huggingface Spaces 中不同空间的具体用途和对应的镜像地址。
预构建的 APPs 中每个链接对应的具体功能和中国用户的相关链接。
预训练模型中不同模型的名称、支持语言和描述。
各个使用 sherpa-onnx 的项目的特点和相关链接。

阅读 306