基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!

在今天,哪些职业用AI最多?他们都用AI干什么?

这些有关AI在各经济领域应用情况的问题,报告用实实在在的统计数据全回答了。

Claude团队:用400万条对话分析AI对经济的长期影响

这一次,他们不仅推出The Anthropic Economic Index(用来理解AI对经济影响的指数),还公开了第一篇论文,里面包含大量观察结论:

  • 目前AI使用场景最多的是软件写作
  • AI应用也呈现出“二八定律”,约4%的职业在75%的任务中高度使用AI;
  • 是否使用AI与经济水平高度相关,中高收入最为普遍,最高和最低都要低得多;
  • 当前AI更多承担辅助功能,不过自动执行任务已经渐趋成熟(43%);

……

与此同时,Anthropic宣布开源上述用于分析的数据集,以方便其他研究人员进一步得出发现。

报告一经发布,迅速引起热议。

Claude团队:用400万条对话分析AI对经济的长期影响

看完上述消息,网友们终于舒了一口气!

AI对经济的影响,总算不用全靠猜测了。

Claude团队:用400万条对话分析AI对经济的长期影响

AI还只是某种选择而非必需品

还是先来看第一篇公开论文的具体内容。

概括而言,通过对Claude平台400万+匿名对话数据的分析,Anthropic构建起了衡量AI在经济活动中使用模式的框架,以此揭示AI在不同任务、职业中的应用情况,并最终探讨了其对经济的影响。

Claude团队:用400万条对话分析AI对经济的长期影响

展开来说,如下图框架所示,研究团队使用Clio工具(Anthropic开发的自动化分析工具)对大量对话进行分析,目标是将对话映射到职业类别上。

由于美国劳工部O*NET数据库包含近20,000个独特的任务陈述,导致直接分类难度较大,因此研究人员构建了一个分层的任务树结构。

也就是说,先由Claude筛选出职业相关对话,接着借助树状搜索,让Claude依据对话内容从任务层次结构顶层向下遍历选择,最终完成对话与具体O*NET任务的映射。

Claude团队:用400万条对话分析AI对经济的长期影响

而根据上述映射和分析,研究发现了AI在不同职业类别中的使用差异

首先,由于软件开发、数据分析等工作高度适配AI技术,因此计算机和数学相关职业的AI使用率最高,占所有查询的37.2%,整体TOP 6如下:

Claude团队:用400万条对话分析AI对经济的长期影响

与之相反,偏传统的农林牧渔行业与AI最远。

Claude团队:用400万条对话分析AI对经济的长期影响

进一步分析不同职业的AI使用深度,可以看出,约36%的职业在四分之一任务中会使用AI,而仅有约4%的职业会在四分之三任务中使用。

换句话说,少部分人大量使用AI,大多数人采取“适量”姿态,整体上AI还只是一种选择而非必需品

Claude团队:用400万条对话分析AI对经济的长期影响

其次,收入情况也和AI使用率息息相关。

数据显示,AI在中高收入的工作中(如程序员)使用最为普遍;低收入(如服务员)和非常高收入(如麻醉师)的工作中AI使用率则又要低得多,呈现中间多、两边少的形态。

Claude团队:用400万条对话分析AI对经济的长期影响

接下来,研究观察了人们更喜欢与AI协作,还是让AI自动化执行任务。

结果发现人机协作仍占据主位,约占57%;不过以智能体为代表的自动化执行也不容小觑,目前已经占比43%。

这也意味着,“2025属于Agents(智能体)”这句话的含金量还在上升。

Claude团队:用400万条对话分析AI对经济的长期影响

BTW,Anthropic这次还透露了Claude 3.5 Sonnet和Claude 3 Opus模型之间的任务使用模式的比较分析。

显而易见,最新模型Sonnet 3.5被更多用于编码和技术任务,而Opus更多用于创意写作和教育内容开发。

Claude团队:用400万条对话分析AI对经济的长期影响

以上为论文主要发现。另外值得一提的是,官方还特意强调了分析所存在的局限性。

无法确定所有这些任务都是在工作中完成;

人们可能从不同途径使用Claude,(当前仅统计官方平台)协同使用这一项可能被低估;

由于Claude不支持图片生成,可能遗漏部分重要使用场景。

Claude团队:用400万条对话分析AI对经济的长期影响

不过接下来,Anthropic将继续推进这一研究。对此,他们同步公开了上述分析所使用的数据集,并邀请经济学家、政策专家和研究人员开展合作。

而且还顺势搞了波招聘,为公司社会影响团队招研究科学家和研究工程师。

Claude团队:用400万条对话分析AI对经济的长期影响

全网催更Claude新模型

除了讨论报告本身,保留节目是,网友们纷纷借此开启了催更模式。

Sonnet 4怎么还不来??

Claude团队:用400万条对话分析AI对经济的长期影响

更有网友犀利辣评,Anthropic将发布除新模型之外的一切。(doge)

Claude团队:用400万条对话分析AI对经济的长期影响

回顾Anthropic更新Claude模型的频率,不难发现新模型可能要等到今年上半年

(表格由AI整理,内容经过验证)

Claude团队:用400万条对话分析AI对经济的长期影响

更具体的说法,来自创始人Dario Amodei在今年一月底的一次访谈,他透露Anthropic正在开发一些新的大模型,有望在未来3-6个月内发布。

嗯,保守估算一下,也就是今年5~8月份了。

另外他当时还剧透了,新模型会采取不同于其他公司的策略,让推理能力与模型的其他能力更加协调统一。

正在开发的还有一个“虚拟协作者”(Virtual Collaborator)。

这是一个可以在计算机上执行各种任务(如写代码、测试、交流、撰写文档等)的AI系统,用户可以与它进行长时间的任务导向交互。

至于图像和视频生成则不是Anthropic的研发重点,未来如果确有必要的话,也会选择“拿来主义”,与专业的图像生成公司合作。

那就狠狠期待一波了~


量子位
18 声望3 粉丝

一家专注于人工智能与前沿科技领域的产业服务平台。