GitHub - deepakjois/podscript: 使用语言和语音转文本模型生成 podcast 转录文本

主要观点:podscript 是用于为 podcasts 及其他类似音频文件生成转录文本的工具,可使用 LLMs 和 Speech-to-Text(STT)API。
关键信息

  • 安装:go install github.com/deepakjois/podscript@latest~/go/bin/podscript --help
  • Web UI:有基于网页的界面,运行podscript web可在http://localhost:8080启动服务器,还有相关演示。
  • CLI 获取开始:配置支持服务的密钥并写入$HOME/.podscript.toml,有多种转录音频的命令,如转录 YouTube 视频、从 URL 或文件转录音频等,ytt子命令默认使用gpt-4o模型等。
  • 更多信息:支持的 STT API 有 Deepgram、Assembly AI、Groq 等,各 API 有相关介绍及免费试用信息。
  • 开发:本地构建和运行项目的步骤,包括安装npmcaddy,分别构建前端和后端并运行等。
  • 反馈:可通过XEmail Me联系。
  • 许可证:MIT 许可证。
阅读 8
0 条评论