头图

图片

  • 2023年国内AI Agent下项目大盘点,科技大厂与创业公司齐头并进
  • 热闹人工智能VS酷寒资本寒冬,2023年AI Agent项目盘点与融资分析
  • 资本寒冬下的AIGC,为什么这些AI Agent项目能够先一步获得融资?
  • 一边热闹一边冰冷,资本寒冬下的AI Agent铆足劲头狂奔
  • AI Agent成创业项目主力,为何2023宣布融资的AI智能体数量无几?
  • 2024年AI智能体创业怎么干?从2023年AI Agent融资项目中寻找启示

文/王吉伟

如果只用一个词来形容2023年国内人工智能,那就是热闹。2023年元旦前一个月,大洋彼岸的OpenAI发射了一枚“ChatGPT”礼炮,大语言模型嗨爆全年。

于是,雨后春笋般的生成式AI应用,某项技术的发丝级突破,某个产品的迭代及创新,某个平台的新功能,创作者们造就的10W+文章与视频资讯,打着“颠覆”“变革”“史诗级”的标签,借着AIGC的流量红利,在各个内容平台裹挟与影响越来越多的人。

从AIGC到生成式AI,从生成式AI到LLM(Large Language Models ),从LLM再到AI Agent。

全民狂欢的AIGC,到处都是人工智能带来的热闹,到处都是人们参与的热闹。创业者们造热闹,投资者们看热闹,围观者们凑热闹,分析者们聊热闹。

图片

自AutoGPT火爆以来,AI Agent热度一路飙涨,现在几乎人人都在聊Agent。落地应用离不开Agent,开会活动聚焦Agent,创业项目也在走向Agent。

相比前几个月都在谈海外Agent项目,不少国产Agent项目已成为新的谈资。

目前,阿里、腾讯、华为等科技大厂相继推出Agent项目,创业团队也在争相发布Agent产品。办公类Agent越来越多,垂直类Agent增量明显。原生类Agent抓人眼球,原始类Agent先声夺人。

按照投资人们在2023年的说法,在国外,至少有100个项目正致力于将AI代理商业化,近10万名开发人员正在构建自主Agent。

在国内,也已经达到“10个项目4个是办公类Agent”的境况。正常的逻辑下,根据这些说法,应该会有很多Agent项目已经拿到融资。然而2023年国内已官宣的Agent融资项目数量并不算多,仅有数起。

看来,目前热闹的AI Agent在资本市场并不是那么热闹。事实上,人工智能再热闹,也掩盖不了2023年资本寒冬更加酷寒的事实。

图片

清科统计数据显示,相比2022年,2023年前三季度,新募集基金总规模下滑了20.2%,投资金额同比下滑31.8%,早期投资、VC、PE市场的活跃度呈现不同程度缩减。

所以,投资机构手里仅有的钱都得省着花,要把钱用在刀刃上,投资在精品项目上。由此,在AI智能体尚处于早期阶段的当下,AI Agent越是火热,投资人们越是谨慎。看项目的大有人在,投项目的寥寥无几。

这种情况,使得AI Agent创业项目耀眼夺目但融资并不容易。自然已经融资的相关项目,也展现出了颇为不凡的实力。说到这里,有人可能会问目前已经拿到新一轮融资的Agent项目,是怎么做到的?

本文,王吉伟频道就借盘点目前国内已推出的Agent产品与项目,顺便拆解一个融资案例,分享给大家。科技大厂齐齐发力不差钱不缺人才的科技大厂,率先开启了AI Agent征战模式。

图片
▲ 点击看大图

早在7月份,阿里云魔搭社区就推出了国内首个大型模型调用工具魔搭GPT(ModelScopeGPT)。使用这款工具,用户可以一键发送指令调用魔搭社区中的其他人工智能模型,从而实现大大小小的模型共同协作,进而完成复杂的任务。

ModelScopeGPT基于开源大语言模型(LLM)的AI Agent(智能体)开发框架ModelScope-Agent。这是一个通用的、可定制的Agent框架,用于实际应用程序,其基于开源的大语言模型 (LLMs) 作为核心,包含记忆控制、工具使用等模块。

8月份,字节跳动推出了基于云雀模型开发的AI工具豆包,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台。

图片

豆包定位是用户的智能伙伴,既能帮助用户提升效率完成各种工作任务,又能高情商聊天提供各种感情建议,还能创建AI智能体进行自由对话。目前该产品主打智能体创建,打开看应用就能看到项目的“创建AI智能体”字样,用户可以在这里简单创建并发布面向各种应用场景的AI智能体。

大概都想在2024 AI Agent元年之前秀出Agent肌肉,12月份大厂推出的Agent产品及项目非常密集。

百度将其8月份发布的「灵境矩阵」平台全新升级为「文心大模型智能体平台」。灵境矩阵基于文心大模型,为开发者提供多样化的开发方式,支持广大开发者根据自身行业领域、应用场景,选取多样化的开发方式,打造大模型时代的原生应用。

图片

数据显示,灵境矩阵已有超过3万开发者申请入驻,并能依托百度全域场景,获得更多的流量分发路径和商业机会。

目前,已有法律智能助手、TreeMind树图、职场密码AI智能简历等众多智能体通过灵境矩阵跑通从开发到分发再到变现的路径。腾讯也通过与德州大学达拉斯分校合作推出了一个名为AppAgent的项目。

图片

该项目可以通过自主学习和模仿人类的点击和滑动手势,在手机上执行各种任务。包括在社交媒体上发帖、帮助用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑。AppAgent在50个任务上进行了广泛测试,涵盖了10种不同的应用程序。

AppAgent的主要功能特点包括多模态代理、直观交互、自主学习和构建知识库。作为一个基于大语言模型的多模态代理,AppAgent能够处理和理解多种类型的信息,使得它能够理解复杂的任务并在各种不同的应用程序中执行这些任务。

华为诺亚方舟实验室、伦敦大学学院(UCL)、牛津大学等机构的研究者,也提出了盘古智能体框架Pangu-Agent。

图片

这是一种通用的、可微调的、具有结构化推理能力的智能体模型,在多个单智能体和多智能体的任务上,使用不同的通用语言模型和提示方法,对盘古智能体进行了广泛的评估,展示了其在结构化推理和微调方面的优势。

昆仑万维在12月25日正式开放测试其AI Agents开发平台“天工SkyAgents”Beta版。「天工 SkyAgents」基于昆仑万维的「天工大模型」,具备自主学习和独立思考能力。用户可以通过自然语言构建自己的私人助理,并将不同任务模块化,实现执行各种任务。

该平台支持模块化任务组件、智能知识库构建、第三方工具调用和个性化 AI Agents 一键分享。

图片

360旗下的智能营销云,曝光了“大模型+ 企业知识库+ Agent”的解决方案。其Agent模式让大模型不仅作为“大脑”识别人类的意图,智能化地思考分解任务,还能够长出“手脚”,自动化地使用工具、调用各种API,执行任务、解决问题,达成目标结果,成为一种通用的智能体系统。

依托大模型能力、知识库训练能力、Agent Studio、数字人等技术的支撑,360智能营销云已陆续推出了AI数字人、AI数字员工、360智绘等多种产品。

12 月 27 日,联想也宣布推出个人智能体(Agent),并同时开放本地大模型 API。该智能体主要面向开发者,定位是混合模型中的新型人机交互方式,同时支持跨端服务。

创业公司的冲势

不只是科技大厂紧锣密鼓研发Agent,专注应用层的创业公司也都瞄准了Agent。创业公司船小好调头,尤其是专注垂直领域的企业更容易快速创新并推出相应的产品与解决方案。

图片
▲ 点击看大图

实在智能在2023年8月份发布了自研垂直“塔斯(TARS)大语言模型”,并在全行业首发了基于TARS的产品级落地产品实在RPA Agent智能体:TARS-RPA-Agent。

澜码科技在12月20日正式发布了AskXBOT平台,是其自主研发基于LLM的Agent智能体与工作流设计、开发、使用、管理、知识沉淀的一站式平台。

生成式AI驱动的多Agent营销SaaS平台WorkMagic,已推出1.0版本「WorkMagic Copilot」。AutoAgents.ai即将推出三种Agent产品:工作助手(Copilot),业务自巡航及自主智能体(Autonomous Agents)。

壹沓科技推出了基于大模型的数字员工平台CubeAgent,能够为企业提供基于大模型技术驱动的数字员工聚合及训练服务,帮助企业轻松构建专有的“数字员工团队”。

图片

面壁智能推出三款AI Agent产品:XAgent是能够能自行拆解复杂任务的超强AI智能体应用框架;AgentVerse智能体是Agent扮演角色彼此互动的通用平台;ChatDev则是一个基于群体智能的AI原生应用智能软件开发平台。

此外,这家公司还联合清华自然语言处理实验等机构,发布了新一代流程自动化范式 Agentic Process Automation(APA,相关项目为ProAgent)。

智谱AI在10月份迭代的ChatGLM3,集成了自研的AgentTuning技术,激活了模型智能代理能力。该厂商还于近日联合清华发布了CogAgent-Chat,这是一个基于180亿参数规模的视觉语言模型(VLM)的图形用户界面(GUI)智能体,专注于GUI图形交互界面的理解和导航。

(注:回复 APA,获取本文提及Agent项目相关论文。)

图片

王吉伟频道获悉,除了这些已曝光的AI Agent产品,还有更多团队已经推出Agent产品或者即将发布相关产品。

Agent已经被公认为LLM落地的最佳载体,目前在资本市场比较受关注。上面所列的前四个创业项目,都在2023年因为AI Agent创业项目拿到了新一轮融资,或者因为推出AI Agent产品而受到资本与经营双重市场的重视。

资本寒冬下的AI Agent

从2022年11月30日ChatGPT推出以来,因为大语言模型的爆发并时而涌现各类现象级应用,人工智能大突破带来的“C端狂嗨”现象,让2023年全年看起来都十分热闹。

但实际上,在经济下行与复杂国际形势的影响之下,2023年延续下来的资本寒冬比以往更加严重。根据清科的统计,2022 年中国股权投资市场新募集金额为 21,582.55 亿元人民币,同比小幅下滑2.3%;投资总金额9,076.79亿元人民币,同比大幅减少36.2%。

今年前三季度,新募集基金总规模13521.53亿元,进一步下滑了20.2%;投资金额5070.94亿元,同比下滑31.8%。不论是早期投资,还是VC、PE市场的活跃度都呈现不同程度的缩减。

图片

现在的资本市场有一个最深刻的标志,是市场化的钱越来越少。这种情况下,资本机构自然会将手头上有限的资金投给市场潜力大、成长速度快的“好项目”。

即便现在的AI Agent项目已经不少,按照某投资人的说法,已经达到“十个AI应用里面,五个办公Agent,三个AIGC”的境况。但这样的项目越多,实际能获得投资的占比就越小,几年前的同一家机构投资多个相同赛道项目的情况已不多见。

另一方面,面对大量做办公应用及垂直场景解决方案的应用层C端Agent产品,执行能力欠佳的Agent短期内尚难以触达企业深层运营,资本机构反而更加期待已投资的B端企业服务类创业项目在这轮LLM及AI Agent方面的表现。

换言之,由企业服务厂商在原有企业级产品基础上打造的Agent产品,可能更有机会获得新一轮投资。

图片

背后的大趋势,实则还是消费互联网向产业互联网的迁移。以前投资机构研究企服类项目如何用技术创新改变某些行业,现在则进一步观察这些企业如何用最新的Agent技术变革各个领域。

所以,在AI Agent的应用早期,能够拿到融资的项目都是在产品、技术、市场、生态、团队乃至愿景方面能够经受得住考验的。

这些厂商往往在行业经验、技术积累、产品打磨、数据储备、生态建设、市场拓展、需求洞悉、客户维护、行业前瞻等方面做得比较到位或者具备得天独厚的优势,才能在更加酷寒的资本寒冬期捕获资本芳心,拿下新一轮融资。

当然,即便2024的资本寒冬继续延续,随着AI Agent产品的逐步成熟以及更多企业对AI智能体认知的加深,加上LLM落地应用的趋势,2024年也会有更多AI Agent项目拿到融资。

Agent原生派与Agent原始派

自AI Agent被公认为LLM落地的主要途径以来,企业服务领域一直在努力探索如何打造企业级Agent以助力B端用户更好地应用LLM实现降本增效。

图片

在技术、架构、产品及模式与LLM及Agent融合发展的过程中,根据创业公司属性及产品形态的不同,这些厂商逐渐发展为两个派系,王吉伟频道(id:jiwei1122)将其称之为原生派和原始派。

原生派直接在LLM应用层进行各种应用开发,这些应用从设计之初就充分考虑并利用AI技术的优势,打造出具有全新用户体验的应用程序。

对原生AI应用而言,AI会存在于Agent设计、开发、部署、运营和维护过程之中。用原生应用思维打造的Agent构建平台,自然也具备原生应用的全部属性。

原始派如ERP、OA、RPA、BI等传统企业管理软件厂商在原有产品基础上做加法,通过API引入LLM或者自研垂直领域模型,基于AutoGPT、Assistants API(OpenAI的Agent构建解决方案)及开源Agent架构将原有企业管理系统升级迭代为Agent,或者将Agent作为其平台服务的一部分。

图片

现在的Agent产品大多都“浮于表面”,很难下沉到组织运营的ERP、CRM等企业管理系统之中。

不管是哪一派,想要实现Agent深入到企业运营长而复杂业务流程,就必须提升Agent的执行能力,也就需要关联到Agent框架中的“工具使用”模块。因此在执行能力上必然离不开数据的打通,需要同时兼顾API与UI集成的自动化(会在另一篇文章中探讨)。

在这方面,原生派如源码科技AskXBOT构建的Agent在融合专家知识的基础上,将过去的代码、RPA、低代码、BI、爬虫、OCR模型以及其他如文生图、ASR、TTS等技术全部嵌入其中,构建既能推理思考又具备超强执行力的专家型Agent。

图片
▲ 源码AskXBOT Agent构建法则

原始派如实在智能TARS-RPA-Agent则通过自研垂直领域模型TARS并结合ISSUT(智能屏幕语义理解)技术,提升Agent的执行能力。

图片
▲ 实在智能TARS-RPA-Agent运行界面

在具体实现方案上,实在智能将自研CV技术(ISSUT)、大模型(TARS)和实在RPA进行深度融合,即通过ISSUT,提供基于人类视觉的,对屏幕画面和被操作对象的理解能力。

通过“塔斯(TARS)大模型”,提供理解人类意图,将复杂问题自主拆解细化,并与实在RPA的流程块和组件进行映射的逻辑推理能力;通过实在RPA,提供对所有桌面软件操作的使用工具能力。

需要说明的是,实在智能自研的基座大模型TARS,最大特点是被投喂了大量的自动化流程数据,有利于TARS对客户业务流程的理解和拆解,也使得实在RPA Agent智能体能够更好地规划与执行多种复杂业务流程。

拆解:Agent项目成功融资启示

实在智能于去年8月份发布了自研垂直“塔斯(TARS)大语言模型”,并在全行业首发产品级别的落地产品实在RPA Agent智能体:TARS-RPA-Agent。

在12月18日,该厂商宣布完成近2亿元的C轮融资,该轮融资由金泰富资本和安吉智慧谷共同领投,安吉两山国创跟投。在这轮融资之前,实在智能曾完成六次融资。

通过一些调研与产品及技术分析,在王吉伟频道看来,实在智能之所以能够在当前融资环境异常艰难的情况下得到资本市场认可拿到新一轮融资,至少有以下几点原因:

首先,企业级产品形态。

TARS-RPA-Agent是一个大语言模型超自动化智能体,也是业界首款企业级Agent智能体产品。它基于实在智能自研大语言模型TARS和ISSUT(智能屏幕语义理解)双模引擎,是能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的全新智能体产品。

图片
▲ TARS-RPA-Agent技术架构

作为一款企业级AI Agent平台,该产品具备识别与理解、系统方案、深入匹配、专有部署、更加可信、自主可控、持续迭代等多种特性,可以为企业打造无需额外配置、开箱即用且效果立竿见影的智能体助理,高落地性和智能性,能够有效帮提升工作效率和创造力,赋能企业增效降本。

可信、安全、稳定的企业级Agent产品,能够真正快速投入市场并得到客户响应,也意味着稳定的市场份额,这是投资项目的重点。其次,庞大的市场需求。

通过更智能更易用的AI Agent应用LLM,目前已经成为企业共识。从目前市面上大多AI Agent产品以及用户反馈来看,AI智能体想要真正在B端实现量级业务场景的落地及更好地商用,需要综合考量其本身的安全性、技术发展周期是否成熟以及To B端的场景是否密切贴合,更需要考虑接口成本、隐私、管理、授权等诸多因素。

图片

就如金融领域大B客户的查询和拆解指标、项目数据查看分析、推送报表/报告等需求,看起来简单却不是简单的GPTs或者知识内容类Agent能够实现的。

其中的业务流程涉及到了深入企业管理系统的复杂流程自动化构建,更涉及到了数据库读取、API管理及UI自动化连接等。这样的需求,不是简单的办公类Agent就能实现的,也使得广大组织对于企业级Agent产品及解决方案有着更深入和细分的需求。

第三,清晰的行业认知与规划。

实在智能团队对于即将面临的挑战及行业发展趋势,有着清晰的认知。2024 AI Agent元年,随着AI技术的开源和入局者的增加,Agent赛道竞争必将加剧。

对于即将到来的市场竞争,实在智能CEO孙林君认为,对于RPA企业而言,行业的Know How、产品的ROI(投入产出比)以及技术创新能力,将是核心竞争力。这个认知,足以让这家企业打造更高的竞争壁垒。

图片

该公司计划在2024年初,对Agent智能体产品进行市场公测。针对个人用户,实在智能将推出解决长尾、低频自动化需求的PC助理,针对政府企业,公司则计划推出员工办公助手。

第四,坚实的企业愿景。

实在智能致力于通过自研AGI大模型结合超自动化技术,以领跑正在到来的大语言模型人机协同时代。为了实现这个愿景,近年来该公司在不断加大研发投入,加快产品迭代和技术创新。

图片

事实上在王吉伟频道看来,企业级、产品级、私有化部署、数据安全、个性定制、API与UI兼顾,易于管理、多模型集成等越来越多企业提及的与Agent相关联的关键词,早已将实在智能映射到了很多机构的投资项目名单。

以此,能够在2023资本寒冬技术厂商大洗牌时期,依然保持强劲的发展势头与融资实力,也就不足为奇了。

这些,也值得更多创业者去关注。最后,如果你是正在关注AI Agent的创业者、投资人及企业,欢迎带着产品、项目及需求与我交流。
全文完

【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与RPA,欢迎关注与交流。】


王吉伟频道
3 声望5 粉丝