视频抓取:从 35 秒的屏幕截图中提取 JSON 数据,成本不到 1/10 美分

主要观点:作者为了将分散在 12 封电子邮件中的数值相加,尝试用屏幕录制结合 Google Gemini 提取数字,结果很好,介绍了使用 QuickTime 录制视频、在 Google AI Studio 中处理并转换为 JSON 数组和 CSV 格式,计算成本仅不到 1/10 美分且实际免费,对比了其他数据获取方式的缺点,强调视频抓取技术的强大及在数据新闻领域的应用,还提到关于可靠性的注意事项以及创建了 LLM 定价计算器工具。
关键信息:

  • 10 月 17 日使用 Mac 上的 QuickTime 录制包含 Gmail 邮件的屏幕视频,上传至 Google AI Studio 处理成 JSON 数组和 CSV 格式,数据准确。
  • Gemini 1.5 Flash 每 100 万令牌收费 0.075 美元,此次使用 11018 令牌花费不到 1/10 美分且免费。
  • 讨论了手动复制数据、访问 Gmail 数据程序、浏览器自动化、使用已有 AI 工具等替代方式的缺点。
  • 12 月 22 日补充说明 LLM 模型结果不能 100%可靠,需手动验证。
  • 创建了 LLM 定价计算器工具,可手动设置输入输出令牌价格或使用预设模型价格,由 Claude 编写。
    重要细节:
  • 录制视频时在 Gmail 账户部分屏幕上拖动框,依次点击邮件并暂停。
  • 给出了计算成本的具体步骤和结果。
  • 对比了各种替代方式的具体情况和困难。
  • 展示了 LLM 定价计算器工具的界面截图和相关对话转录。
阅读 12
0 条评论