关注前沿科技 量子位
一出道就惊艳整个AI圈的笔记工具——谷歌NotebookLM又进化了!
最近它们更新了一个重磅功能:随时加入(Join)AI之间的讨论。
现在,你不仅可以从各种资料中实时生成播客,而且你还可以点击加入按钮,随时来一场在线小组讨论。
NotebookLM团队成员Steven Johnson也亲自做了示范,要求NotebookLM对他的书籍生成建议。
在一顿奉承之后,NotebookLM真的给出了一些建设性的意见,Steven表示非常满意。
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3800795947525537793" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtD5mnVtLC3tyt9A2iaZAvAOqrp5oQco8fG4XH84RJtAKGCZGHdwz5O0RQjLUHsN6A4PicPyb71vh3Nw%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="0.8333333333333334" data-w="720" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3800795947525537793"></iframe>
之前NotebookLM团队曾在Google开发者大会上展示过这个功能,最近终于上线了Beta版。
网友们也纷纷点赞:年度最佳AI工具、比ChatGPT高级语音功能好多了(doge)
不愧是曾经被卡帕西和奥特曼等一众大佬点赞的“ChatGPT”级产品。
3步生成实时互动播客
只需三步,你就可以用NotebookLM构建自己的可交互式播客:
1.上传来源
在 NotebookLM中新建或打开笔记本。 然后添加你想要的任意来源(文件、幻灯片、PDF、在线视频、网站链接等)。
2.生成播客
在音频概述部分(Audio Overview)加载音频。
你还可以在生成播客之前围绕某些主题对播客内容进行引导性定制(Customize),让它更加专注某些议题。
3.实时交互
选择“交互模式(Interactive mode)”并启动音频。
然后,你就可以随时点击加入(Join)按钮进行提问或讨论了!
实测结果非常可靠
实际效果到底怎么样呢?量子位也帮大家实测了一波。
首先来看看解读论文的能力:
比如斯坦福最近一篇研究LLM数学能力的论文 Putnam-AXIOM: A Functional and Static Benchmark for Measuring Higher Level Mathematical Reasoning,我们用NotebookLM生成了一段16分钟的播客。
然后在交互模式中,我们尝试让它列举并解释一个论文中出现的具体数学题目。
它在几秒钟之内就做出了反应,并举例解释了论文中的斐波那契数列题目:
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3800794657223622657" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtD5mnVtLC3tyt9A2iaZAvAOqMtBcibhc3rGqvlf7bYibVibMCTfX7icRvcACNA6caIONmDyX5mKFg53mTg%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7861111111111112" data-w="1286" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3800794657223622657"></iframe>
短篇论文没问题,那长一点的文章呢?
我们又上传了一篇长达76页的提示词综述,并按照下面的要求让NotebookLM生成了一段定制播客:
1.关注对于多模态语言模型的提示技巧 2.关注角色扮演相关的提示技巧
接下来,在交互模式中,我们询问了两个相关的问题: 1.在生成视频时,如何更精确地描述画面的主题和摄影机运动? 2.我正在为一个证券公司工作的财务员工生成年终报告,如何更精确地用提示词描述这个岗位?
针对这两个具体的问题,NotebookLM也马上就给出了非常专业的建议。
比如在生成视频描述提示时,它建议我们可以给出更具体的人物描述,比如用戴红帽子的女人代替“一个女士”,以及更精确的摄影机运动术语,比如左移(pan left)、放大(zoom in)、鸟瞰视角(bird’s eye view)等。
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3800796887100276736" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtD5mnVtLC3tyt9A2iaZAvAOqWsgibMiaAuFllYAg4icsYRW5ic8TZG9qGAHtNHlXf55pCJTmERuQIXKqIA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7861111111111112" data-w="1286" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3800796887100276736"></iframe>
而针对第二个问题,NotebookLM也返回了非常靠谱的建议。
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3800795085831143429" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtD5mnVtLC3tyt9A2iaZAvAOqVZLbyiaoickwXQHHzRCKwnbjEK9D02rju3icx2hoMFtc8Y2czLy0zPic0Q%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7861111111111112" data-w="1286" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3800795085831143429"></iframe>
One More Thing
在功能方面,目前这项实时交互的语音功能还存在两个小缺陷:
- 交互时不能拖动音频进度条
- 目前语言只支持英文
此外,除了交互式音频概览外,谷歌还为 NotebookLM 引入了一个新界面。
新界面将内容组织成三个区域:左边的“来源(Source)”面板用于上传信息,中间的“聊天(Chat)”面板用于与 AI 聊天机器人讨论来源,以右边的“工作室(Studio)”面板,用于制作音频概览和学习指南等。
NotebookLM也发布了新的Plus订阅计划。
NotebookLM Plus订阅者将获得多项优惠,包括可以生成五倍数量的音频概览、笔记本和每个笔记本的来源;自定义笔记本回复的风格和长度;共享团队笔记本及使用分析;以及额外的隐私和安全保障等。
参考链接: [1]https://x.com/stevenbjohnson/... [2]https://x.com/itsPaulAi/statu... [3]https://blog.google/technolog...
— 完 —
量子位年度AI主题策划正在征集中!
欢迎投稿专题 一千零一个AI应用,365行AI落地方案
或与我们分享你在寻找的AI产品,或发现的AI新动向
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。