你是否也曾反复揣摩《Her》中的语音交互,并梦想着复刻甚至超越那份智能与情感?在 Voice Agent Camp,遇见与你怀着同样热忱与梦想的伙伴。
Voice Agent Camp 正在寻找重塑下一代人机实时互动体验的语音智能体初创团队! 多模态 AI、语音合成、multi-agent 等技术日臻成熟,场景应用即将爆发。我们将招募约 15 家团队,共同围绕「Voice First」理念,打造 AI 陪伴、个人助理、企业客服、AI 语音智能硬件等下一代产品。
「超音速计划 2025·Voice Agent Camp」 将于 6 月初开营,为期三个月。通过 peer learning 朋辈互助的方式,分享交流语音技术和产品、开源策略和商业模式、全球化拓展和增长等话题。同时提供丰富的免费技术资源、投融资对接、展会展位和媒体访谈等创业加速支持。
申请链接:https://www.rtecommunity.dev/t/t_n5Fb9YDJS9JGPA
语音技术日趋成熟,场景应用即将爆发
GPT-4o 发布一周年之际,我们决定发起这个创业营。
过去一年,语音技术突飞猛进。端到端语音技术不仅能够识别,更能传递丰富的声音信息(如音色、笑声、叹息等),全双工技术则实现了人机双向对话的流畅自然和随时打断的灵活便捷。随着智能体场景和设备日益多元化,语音降噪、人声识别、音视频压缩、传输延迟等底层音视频技术的重要性也显现,成为构建流畅语音交互体验的关键。
诸如一些中间层如智能体构建工具,以及围绕 agent 生态的数据、搜索、记忆层服务,都极大地简化了开发流程,方便开发者快速完成场景试错和最小可行产品的搭建。
与此同时,推理模型、多智能体架构和 AI 视觉理解能力的发展,正在赋予智能体更强的意图识别和跨模态推理能力,而语音交互无疑将成为其中重要的界面和入口。
2025 年,ChatGPT、Grok 和 Meta AI 等拥有海量用户的平台正逐步推出语音与视频对话功能,这不仅会加速语音互动类应用「跨越鸿沟」,走进大众生活。更会催生出对特定领域更专业、更细分的语音智能体应用需求,AI 口语陪练和 AI 面试等赛道正是在此趋势下涌现的新兴领域。
得益于底层技术的日趋成熟、中间层工具的日益丰富和通用型语音互动类应用的市场培育,我们有理由相信,这样生态土壤将生长出更多垂直场景下的创新产品。
我们在寻找什么样的人和项目?
我们期待遇见这样的你:
- 深耕垂直领域: 对特定行业或场景有深刻理解和独到见解。
- 善用语音交互: 能够巧妙地利用语音和对话技术,撬动「Voice-to-X」的场景价值,创造独特的用户体验。
- 早期初创团队: A 轮或 A 轮之前,产品处于早期阶段的团队。
作为一个社区驱动的创业营项目,我们已经在 RTE 开发者社区的多次 Demo Day 和 Workshop 上,见证了各种语音智能体场景快速增长的需求,例如 AI 陪伴和个人助手、企业客服、智能 AI 硬件、AI 用户访谈、AI 播客和实时翻译等创新场景。
我们推崇 Voice First,但更看重你在垂直领域的深度和跨业务融合的潜力。期待你的加入,共同拓展我们对语音智能体的想象边界。
如何参与 Voice Agent Camp?
「超音速计划 2025·Voice Agent Camp」 将于 6 月初开营,为期三个月。采用线上线下结合的方式进行,线下核心模块计划在北京或上海开展。最初的开营和最后的结营需要你在线下参与,期间活动将采取更加灵活的线上线下结合的方式展开。
我们将通过 peer learning 朋辈互助的方式,分享交流语音技术和产品、开源策略和商业模式、全球化拓展和增长等话题。同时提供丰富的免费技术资源、投融资对接、展会展位和媒体访谈等创业加速支持。
历时五年,超音速计划已经聚集了 103 家永久创业伙伴,并持续为伙伴们提供长期创业陪跑支持。
Peer Learning 学习伙伴
本期 Voice Agent Camp 里,这些语音和实时互动领域的专家和创业者,都将成为与你一起共同学习的伙伴:
- 武执政,香港中文大学(深圳)副教授、博导。武博士致力于语音技术的开源交流,带领开发了语音合成开源系统 Merlin、Amphion 及开源数据库 Emilia。
- 陈柯宇,前网易伏羲&上海人工智能实验室 AI 研究员,实时 AI 语音翻译会议 Pinch 联合创始人。兼具学术研究和 YC 连续创业经历。
- 王乐,AI 玩具 Folotoy 联合创始人。作为最早的一批 AI 玩具创业者,从第一天起践行 Build in Public 理念,Folotoy 借助社区力量,十余人团队跑出数万台出货量、20+%复购率。
……更期待你的加入
与此同时,你还将融入一个由上千名 Voice Agent 和实时互动领域从业者组成的社区。在这里,我们通过 Voice Agent 学习笔记、Meetup、播客等形式,交流最新的技术和产品心得。
Voice 之外,打造实时互动的未来
诚然,这是一期专注于语音和智能体的创业营,但如果你对 context awareness、ambient agent、proactive agent 和 always-on 等理念有所探索,也欢迎申请本次 camp,在我们看来,这些理念打造的产品,未来会和语音双向奔赴,且都将是实时互动(Real-Time Engagement,RTE)所追求的未来。
申请超音速计划
- 本期申请时间:5 月 13 日~5 月 31 日
- 营期时间:6 月 7 日~8 月 31 日
申请步骤:
- 填写申请
- 初筛后线上沟通
- 最终筛选与评估
- 发送通知正式开营
资源与权益:长期陪跑支持
入选「超音速计划」的创业伙伴,均可获得以下四类资源与机会支持:
技术与产品
- Real-Time AI DevKit 支持,包括来自声网对话式 AI 引擎/RTC/RTM、商汤日日新实时交互融合大模型、讯飞创业投资孵化语音资源等免费资源包等(更多实时多模态开发资源持续加入中);
- 其中声网对话式 AI 引擎/RTC/RTM 包含 6 万分钟免费对话式 AI 引擎,或 100 万分钟免费实时音/视频通话支持,或等值 RTM 产品免费加速包;
- 环信价值 1 万的免费产品支持;
- AWS、微软、Google 等云厂商抵用券资源或出海投放咨询支持;
- 50+合作伙伴的免费使用、测试、联合产品打磨机会(语音 agent 框架如 TEN 等)。
VC 与孵化
- 推荐进入顶级加速器面试、大厂创业计划等绿色通道机会;
- 终生校友共同成长陪伴,包括长期技术沟通和支持、社群福利和活动、人才培养、推荐奖励、行业洞察分享等;
- 来自五源资本、锦秋基金、线性资本、纪源资本等一线 VC 合作伙伴为超音速伙伴提供的 VC 1 对 1 深度交流机会。
社群与生态
- 「超音速计划」独有的 buddy 机制——与音视频、网络、AI 等内外商业化、产品和技术大牛等 buddy 深入探讨交流;
- 「超音速计划」永久创业伙伴支持(长期技术沟通和支持、社群福利和活动、人才培养);
- 连接全球 Top 合作伙伴,带来专属的全球前沿趋势洞察、创新玩法分享,快人一步了解未来。
市场与品牌
- 进入 RTE 年度场景 Showcase 的路演机会;
- 行业大会 startup 展示机会(演讲、展示、业务机会对接等形式);
- 合作媒体曝光机会(播客、采访、VC Day);
- 合作伙伴大会、行业展会等展示、主题分享机会等。
2024 RTE 年度场景
超音速计划以每年「RTE 年度场景 Showcase」为压轴活动,邀请各团队 Demo 创意,与国内外一线投资人组成的评委团深度交流。2024 的年度项目已初步显现多模态 Agent 的场景方向:
Infiniflow
AI 原生数据库,结合大模型共同服务 RAG 场景,提供完整的行业 RAG 解决方案。帮助打造出体验更细腻的 AI Agent,5 万 Github 星标的全球 Top 开源项目,端到端解决大模型在企业应用的实际痛点。
聊会小天
一款免费心理机器人,提供 24 小时陪伴倾诉服务,由西湖大学深度学习实验室孵化。海量专业心理测评,安全的心理咨询服务。
Traini
专注在人宠互动的领域,主要为宠物父母提供宠物行为翻译和服务 Agent 的服务,创造了全球第一个用多模态技术建设的模型,主要是解决宠物行为翻译。
FAQ
1. 申请和入选会产生任何费用吗?
申请和入选不需要缴纳任何费用,入选团队如不在线下活动所在城市,需自行承担差旅费用,我们将提供活动日午餐及零食水果等。
2. 完成报名表后接下来是什么?
报名完成后,「超音速计划」将与您联系(请一定确保联系方式填写正确)。筛选滚动进行,建议有意向者尽快报名。选拔分为线上筛选和评委打分两部分,初筛后可能我们会与您进行时长约为 30-60 分钟的视频沟通, 来更好地了解您的产品与所需支持。
3. 报名需要提供什么信息?需要准备 BP 吗?
填写报名表即可报名, 但后续需要 BP。线上视频面试时申请者需要分享 BP 并做不超过十五分钟的公司介绍和产品展示,同时需要在面试前后提供 BP 文档,以便进行后续交叉评估。建议在申请时就有成型的 BP。
4. 入选后需要投入多少时间与精力?可以线上参加吗?
超音速创业伙伴营时间跨度约为三个月, 以线上线下相结合的方式进行。最初的开营和最后的结营的两个核心模块需要你在线下参与, 在上海(或北京) 线下进行,核心模块互动性强,无法线上参与, 主要时间节点为隔周的周末;另根据项目具体需求, 会在工作日设置与行业专家或投资人的一对一沟通探讨环节。
关于超音速计划
「超音速计划」是面向实时互动(RTE,Real-Time Engagement)创业者发起的创业加速计划。重点关注实时互动领域新场景、新技术,旨在加速实时互动领域的创业企业价值成长,共同定义和扩大实时互动赛道,赋能开发者更低成本、更高效的实现创新创业。
关于 RTE 开发者社区
RTE 是一个聚焦实时互动(Real-Time Engagement)领域的开发者社区。我们致力于连接行业内的开发者与生态伙伴,激发新技术、新场景的火花,共同探索实时互动的无限可能。在这里,你将遇见一群志同道合的技术探索者,一同改变人与人、人与世界、以及人与 AI 的连接方式。
更多 Voice Agent 学习笔记:
级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨Voice Agent 学习笔记
a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场丨 Voice Agent 学习笔记
a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记
ElevenLabs 33 亿美元估值的秘密:技术驱动+用户导向的「小熊软糖」团队丨Voice Agent 学习笔记
端侧 AI 时代,每台家居设备都可以是一个 AI Agent丨Voice Agent 学习笔记
世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。