没有新闻就是好新闻:使用人工智能自动跳过追听广播中的新闻

主要观点:作者通过收听广播节目录音来拓展音乐视野,却被录音中的旧新闻公告所困扰,于是开发了一个浏览器扩展来自动跳过新闻片段。该扩展基于本地模型 whisper.cpp 处理音频文件获取转录文本,借助 Gemini Pro 识别新闻片段的起止时间,将转录文本和跳过时间戳保存到磁盘,通过服务器提供服务,浏览器扩展在播放页面请求相应转录文本并配置自动跳过新闻片段。

关键信息:

  • 广播节目录音存在旧新闻公告,手动跳过不精确,需要 podcast 式章节系统。
  • 作者开发浏览器扩展,利用 JavaScript 代码实现自动跳过新闻片段功能。
  • 新闻片段检测困难,最初尝试通过转录文本寻找特定短语来识别,效果不佳,后借助 AI(Gemini Pro)有效识别新闻片段。
  • 整个流程包括下载媒体文件、处理音频、识别跳过点并保存相关信息,通过服务器和浏览器扩展实现。
  • 作者认为此项目可能过度设计,且在开发过程中发现新闻片段时间规律,未来可尝试寻找更多节目片段及识别歌曲边界。

重要细节:

  • 浏览器扩展通过监听音频元素的timeupdate事件来检查和跳过新闻片段。
  • 使用 whisper.cpp 处理音频文件并以 JSON 格式输出转录文本。
  • 作者因担心法律问题未将代码开源,且承认代码较为粗糙。
  • 开发过程中作者借助 AI 帮助编写浏览器扩展,节省了时间。
阅读 16
0 条评论