GitHub - deepakjois/podscript: 使用语言和语音转文本模型生成 podcast 转录文本

发布于 2025-01-23

主要观点：podscript 是用于为 podcasts 及其他类似音频文件生成转录文本的工具，可使用 LLMs 和 Speech-to-Text（STT）API。
关键信息：

安装：go install github.com/deepakjois/podscript@latest，~/go/bin/podscript --help。
Web UI：有基于网页的界面，运行podscript web可在http://localhost:8080启动服务器，还有相关演示。
CLI 获取开始：配置支持服务的密钥并写入$HOME/.podscript.toml，有多种转录音频的命令，如转录 YouTube 视频、从 URL 或文件转录音频等，ytt子命令默认使用gpt-4o模型等。
更多信息：支持的 STT API 有 Deepgram、Assembly AI、Groq 等，各 API 有相关介绍及免费试用信息。
开发：本地构建和运行项目的步骤，包括安装npm和caddy，分别构建前端和后端并运行等。
反馈：可通过X或Email Me联系。
许可证：MIT 许可证。

阅读 29