OpenAI 按分钟收费,所以让分钟更短。

主要观点:为使 OpenAI 转录更快更便宜,可加快音频速度,如通过 ffmpeg 以 2 倍或 3 倍速度处理音频后再转录,能减少令牌使用量和等待时间,且转录质量几乎无下降。文中还介绍了从视频中提取音频、使用不同模型转录等一系列操作流程及相关实验和成本分析。
关键信息:

  • 介绍了用于提取音频、处理音频和转录的工具,如 yt-dlp、ffmpeg、llm 等。
  • 提到最初因版本问题导致 YouTube 自动生成字幕下载失败,更新后解决。
  • 测试 OpenAI 转录工具时遇到音频时长限制,通过加快音频速度解决,如 2 倍和 3 倍速度。
  • 分析加快音频速度能节省成本的原因,以及不同速度下的成本对比和令牌使用情况。
  • 指出 4 倍速度会使转录结果不可用,但 2 倍和 3 倍速度在效率和保真度之间效果较好。
    重要细节:
  • 给出具体的脚本代码用于音频处理和转录操作。
  • 详细说明了不同速度下音频时长、音频输入令牌、输入令牌成本、输出令牌成本等数据。
  • 提到对 2 倍和 3 倍速度转录结果的抽查情况,以及 4 倍速度转录的糟糕结果。
  • 最后总结为节省时间和金钱可加快音频速度,2 倍或 3 倍效果较好,4 倍速度不可用,并提供联系和雇佣信息。
阅读 17
0 条评论