2024 年 10 月 25 日~26 日,由声网和 RTE 开发者社区联合主办的 RTE2024 第十届实时互联网大会 将在北京·悠唐皇冠假日酒店正式开启!
大会以「AI 爱」为主题,推出覆盖实时互联网全生态的论坛及周边活动共计 20 余场。
RTE Open Day 携手 18 家展区伙伴齐聚大会现场,等候实时互动领域的开发者们前来体验、交流!
这次 Open Day, 除了多家互动体验强、探索前沿 RTE+AI 场景的展商,还会带来一场 RTE 2024 Workshop,与 builders 一起动手构建实时多模态 AI Agent。更别忘了游园打卡,领取礼品🎁!
如果有兴趣一起共建活动,也欢迎成为社区志愿者。
⏰ 10 月 25 日-26 日(周五、六)
📍场地:北京悠唐皇冠假日酒店 F6 层
🗺️ 地址:北京市朝阳区三丰北里 3 号
🙋🏻 大会参与方式:扫描海报二维码限时获取免费门票
👇等不及的朋友可以先报名,再看具体指南👇
RTE Open Day 完全指南
翻阅这篇指南,将 RTE2024 Workshop、RTE Open Day 展区、技术论坛、创赛决赛、Dev Party 的精彩内容打包收下。也请一并收下 RTE Open Day 展区玩法,拿走我们准备的各种社区好礼 🎁!
一、RTE2024 Workshop|AI 工坊:「组装」你的专属多模态 Agent!
OpenAI Realtime API 发布,语音 AI 将迎来新一次爆发。AI 的实时语音和视觉互动能力将为我们带来多少新的创意和场景?现在,让我们快速动手去体验,并实现一种想法。
在这场工作坊,你会接触到平台型开源框架 TEN Framework,以及使用 TEN 开发的多模态实时互动 AI Agent — TEN Agent,并尝试自定义一个实时多模态 Agent。
与此同时,来自 CosyVoice、Rokid 的开发者导师,也会分享在语音生成模型、空间计算在 Agent 搭建的原理和实践。启发你更多想象。
TEN 是市面上第一个兼容了 OpenAI Realtime API 和 RTC 的实时多模态 AI Agent 框架,现在访问https://agent.theten.ai可以立刻体验接入 Realtime API beta 的最新版本 TEN Agent!
无需撰写代码,你就能创建多模态 Agent。当电脑响起 “Voice Agent connected!”,你将亲身体验到 AI Agent 的实时对话能力,TEN Agent 能够立即响应你的语音指令,基于视频进行图像理解,并且还能进行网页和天气检索,让你感受到更自然的人机互动体验。
如果你还有口语陪练、儿童故事会、旅游助手等想法,不妨在 TEN 框架下进行自定义,为你的 Agent 赋予新的人设(persona)、音色和功能,即刻探索语音、视频交互的新场景!
现场会设置双重挑战,无论你是想体验多模态 Agent 抑或尝试自己的想法,这里都有适合你的内容。来自 TEN Framework 团队的技术导师们都会在现场为大家答疑。达成基础挑战的伙伴都能拿走我们的开发者奖品,完成进阶挑战更有好礼相赠!
即刻扫码报名!仅有三十余席位!报名需审核,名额满员即截止报名。
*本 Workshop 门票包含:开发者伴手礼包、当日活动下午茶、大会千人高峰论坛及分论坛免费参与、展区参观体验、大会资料下载。
二、RTE Open Day 展区,实时多模态 AI Builder 聚集!
在 RTE Open Day 展区,身临其境地「触摸」、「聆听」、「交互」实时互动前沿技术,与产品背后风采各异的开发者和创业者一对一交流。这次参与的 17 家展商,包含了 AI Agent 框架、AI 情感陪伴、AI 翻译、AI 游戏、虚拟空间、Voice AI 等众多 RTE+AI 场景,欢迎大家深度游玩体验。
后面还有今年的展区玩法和礼品噢!
RTE Open Day 展位名单
RTE 开发者社区
RTE 开发者社区是聚焦实时互动领域的开发者社区。希望通过社区链接领域内的开发者和生态力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。这里你将遇见一群致力于改变人和人、人和世界,以及人和 AI 连接方式的开发者。
TEN Framework-首个兼容了 OpenAI Realtime API 和 RTC 的实时多模态 AI Agent 框架
多模态 agent #实时 AI
TEN (Transformative Extensions Network) Framework 是一个平台型开源框架,能够让开发者一站式快速、灵活地搭建属于自己的多模态实时互动 AI Agent,这个框架包括了基于 Rust 语言开发的 all-in-one TEN manager,支持实时互动的多模态标准协议,支持多种编程语言混合使用的 TEN Runtime,用于可视化低代码编排逻辑的 Graph Designer,以及支持社区公开发布、分享的 Extension Store,供开发者在构建 AI Agent 的过程中即插即用地挑选心仪的模块灵活替换。
超梦AI - 超越现实 梦伴相随
#情感计算 #AI 陪伴
超梦品牌创建于2024年,其母公司超次元10年来勇立潮头,曾引领AR收藏卡牌,AI数字人、元宇宙等多个风口行业的商业化创新。超梦AI专注于AI情感陪伴领域的商业化探索,目前已上线的产品有《心动日记X》,《超梦AI》也即将重磅推出,超梦AI是集真人拍摄+AIGC拟真+ AIGC二次元等多型态自定义角色+多模态场景交互建立起来的AI陪伴社区,可满足用户多样化情感陪伴。再立潮头,超梦AI蓄势待发。
**Felo 实时翻译
实时翻译 #AI 出海**
Felo 实时翻译是一款利用 GPT 翻译功能的工具。使用首创RRT (Real-time ReWrite Translate)技术,先快速直译,再结合上下文深度翻译,可使实时翻译和同声传译比以往更快、更高效。无论是国际旅行、跨境商务交流,还是单纯的外语学习,Felo 实时翻译都是您的理想工具。还支持所有的客户端(iOS,Android,Mac,Windows)。
**Gotin - 虚拟体验和智能营销管理一站式平台
multi-player #实时 3D**
有大科技致力于建设国际领先的虚拟空间及体验综合服务平台,打造未来虚拟交互的新方式,为全球品牌方及组织机构提供虚拟空间一站式解决方案。依托于自研AI算法和WebGL 3D引擎,融合虚拟人、数字资产等技术,帮助客户搭建沉浸式品牌空间,运营高互动性的在线营销活动,沉淀高活跃度的品牌社区。真正为品牌方提供从策划到运营的一体化落地方案。有大科技已服务数百家知名企业、组织,包括联合国、GSMA、保时捷、友邦保险、字节跳动等,成为科技、汽车、金融、奢侈品等行业品牌值得信赖的虚拟营销伙伴。
**XSwitch - 做最好的实时音视频和AI连接器
多模态 agent #实时音视频**
XSwitch是一个实时多媒体软交换系统和连接器,致力于连接一切音视频、AI设备和服务,包括但不限于PSTN、SIP、WebRTC、和各种GPT。
**言灵计划- Your game, redefined
multi-player #互动娱乐**
《言灵计划:中二嘴炮大作战》是一款由AI驱动的演出派对游戏。召唤师通过玩梗召唤独一无二的神奇生物“言灵”,让他们进行荒诞且热血有趣的嘴(hu)炮(xiang)战(tu)斗(cao)。和你的朋友一起,进行充满着想象力和创意的对决吧!
**Emerge
数字艺术 #实时互动**
自2017年成立以来,EMERGE 一直致力于创造美好而又能被感知的体验。践行独特的理念和方法论,为诸多品牌创作和制造了有趣而又奇妙的互动内容。用更可感知的技术,让故事、知识走进了企业、公共空间、展场、峰会、校园。
**萤火空间混合现实(MR)人机协同平台 - 世界顶尖混合现实技术+优秀自研软硬件
空间计算 #混合现实**
苏州萤火空间科技有限公司成立于2017年,专注于混合现实企业级软硬件产品的研发以及开发。目前拥有数项世界领先技术,包括全球最大的光学透视视场角光学方案、国际顶尖的3D实时扫描建模技术、电池热插拔技术以及混合现实一体机技术等。公司同时独立研发了MR远程协作以及MR无代码编辑器两款标准化软件,可供企业快速部署和使用,目前已经在国家电网、工厂、设备供应商等多个领域有销售和落地案例。
**Viitor AI - 利用我们的人工智能平台彻底变革您的内容
Voice AI #实时翻译**
ViiTor AI 提供高质量的视频翻译、音色克隆、AI虚拟形象视频、语音合成、音色库等产品服务,为您的创作全方位赋能;同时还支持实时翻译功能,19种语言互译,为您提供无障碍交流服务。
**PixelHack - 进入儿时街机世界,与好友一起大战像素世界!
multi-player #互动娱乐**
《PixelHack》是一款XR射击游戏,通过RTE实现多人实时在线作战,玩家们可以在同一地方实时看到其他玩家的位置动作,通过语音互相沟通。游戏是复古像素画风,给人一种回到小时候打街机的感觉。
**FishAudio - 实时、定制化、情感丰富的下一代语音合成技术
Voice AI #情感计算**
Fish Speech是Fish Audio团队自主研发的语音合成大模型,通过上传音频或使用线上音频生成如原声般自然的音频。基于团队对模型的设计与70万小时的数据训练(截至目前),各项能力均领先于行业。我们深知开源对技术发展的重要性,在Github上已开源,模型框架简单易用、延迟低至200-400ms(含网络)、效率高,通过上传15秒的参考音频快速克隆出音色/语调/韵律/情感,表达不同语种下的内容。随意的音频片段或是专业的配音片段,模型都会展现其原本声色。
**MicroBlocks - 为「物理计算」而生的图形化编程语言
物理计算 #实时编程**
使用 MicroBlocks 实时编程工具制作的互动空间。包括可以语音互动的机器狗,动态生成的MIDI 节奏,一起跳舞的小车。
**蚁触科技 - 用触觉赋能数字世界,让每个用户感受到真实
触觉 AI #实时 AI**
蚁触科技触觉AI解决方案以自研算法ANTHAP.AI为核心,该算法能够适配多智能终端、兼容多系统并跨平台运行,为音乐、视频、游戏等内容实时渲染细腻逼真的触觉效果。我们率先将方案应用于品牌数字营销场景和车内空间,软硬件产品均已量产并成为多个行业头部客户的认可。
**扶光工作室(TouchLight Studio) - Dance with Light
multi-player #混合现实**
扶光工作室专注于MR(混合现实)技术开发,致力于为线下娱乐提供创新的多玩家互动体验。我们以轻量化设备和自研技术为基础,打造例如《气与魔法》这样的多人混合现实对战游戏,融合虚实,让玩家在现实世界中感受魔法对战的乐趣。我们的解决方案灵活适用于商业地产、展览等场景,推动虚拟与现实娱乐的结合,满足人们不断升级的娱乐需求,让更多人体验混合现实的独特魅力。
**面壁「小钢炮」MiniCPM - 旗舰端侧大模型
实时多模式 #边缘计算**
面壁「小钢炮」MiniCPM 端侧模型系列
全球领先的轻量高性能大模型。包含基座模型MiniCPM和多模态模型MiniCPM-V。自发布以来,以其「以小博大」的性能和卓越端侧表现,受到世界开源社区的广泛赞誉,当前下载量已超100万。
旗舰端侧基座模型 MiniCPM
MiniCPM基座系列以仅2B的参数规模,超越7B甚至更大量级模型性能,追求极致高效率、低成本,支持消费级显卡微调。
旗舰端侧多模态模型 MiniCPM-V
开启端侧全面对标超越GPT-4V 新时代。实现单图,多图,实时视频全维度 3SOTA。多项功能,首次上端!
**声湃 x 罗德麦克风 - 让您的声音如专业主播般动听
Voice AI #音频硬件**
罗德麦克风,作为全球知名的音频设备厂商,专注于提供高端的声音采集与录制解决方案。旗下的产品搭载了先进的硬件AI,能够自动提升您的音质体验。而作为国内最大的第三方播客内容服务平台,声湃与罗德麦克风携手,在超过20,000小时的中文播客内容训练的基础上,为播客创作提供专门训练的TTS服务和模型,确保您的表达方式更贴近专业主播的风格。
**inSpaze - 社交,从未如此真实
multi-player #空间计算**
inSpaze是一款专为Apple Vision Pro设计的全新社交应用,旨在利用Apple Vision Pro的空间计算能力为全球用户提供全新的沉浸式社交体验。在inSpaze中,你可以结识其他Apple Vision Pro的用户,空间音频、persona和实时语音翻译等功能为你提供无与伦比的临场感,感觉就像正在和人面对面交谈。可以在“派对”上玩游戏、分享空间照片和视频,甚至与他人分享您的3D模型。
RTE Open Day 展区玩法
大会盖章打卡 【大会服务台处抽奖】
1、全场共 32 个大会打卡点,RTE Open Day 的所有 18 家展位都参与其中,欢迎找我们打卡集章。
2、T01-「RTE 开发者社区」、T08-「TEN Framework」、T10-「Viitor AI」、T18-「inSpaze」是本次大会「必打卡点」,「必打卡点」全部集齐有机会抽取大会特等奖!
Open Day 展区打卡 【T01 社区展位领奖】
1、注册网站有礼
扫码注册「RTE 开发者社区网站」https://www.rtecommunity.dev/,线下即有 RTE Open Day 定制主题拼图+社区充电线相送!
2、扫码入群有礼
到时现场扫码入 「RTE Open Day 现场观众群」,获取 Open Day 展区专属 「夸夸贴纸」 ,为你喜欢的项目👍
后续还会在群里发起精彩评论有礼活动!
3、精彩评论有礼
登录「RTE 开发者社区网站」,在本次展区你喜欢的项目页面留言、点赞,25、26日晚上我们都会选出至少 3 个精彩评送出价值 150~200 元左右的礼品,超音速定制键盘、超音速定制护照夹、围炉煮茶套装、社区帽衫等等!
还有一个终极评论奖,我们将送出一只价值 400 元的定制版超音速吉祥物獭獭!
Open Day 展区展商大奖
结合线下的「夸夸贴纸」数量和线上的「留言点赞」,我们会从展商中评选出一个 「你就是 RTE 行业的未来」 奖,并送出一台 PS5,请大家发散自己的好评吧!
p.s. 1个线上评论=5个线下「夸夸贴纸」点赞=5个线上点赞
线上评论/点赞截止时间:10月27日 23:59开奖时间:10月28日
三、技术论坛专场和创赛决赛,汲取行业领袖洞见和创新灵感
点击论坛图片,了解嘉宾和议题。
https://mp.weixin.qq.com/s/Sd2Pnu34B2P8Gb72zgvwrg
https://mp.weixin.qq.com/s/zI6sWxvLJyc3-3Cz3Lx2HA
https://mp.weixin.qq.com/s/7YE4NS6ve3ZNEEbwDc07rQ
https://mp.weixin.qq.com/s/w-hUvdXtnL1fhtl9UAmiXA
https://mp.weixin.qq.com/s/AMoKfIW5Na2S_e0QzwvG1w
https://mp.weixin.qq.com/s/jUlkQy2BhC2Z4YFaFyRLpA
四、Dev Party@RTE Open Day,开发者派对,交流技术交朋友
一天的灵感和技术交流后,来 Dev Party@RTE Open Day,换一个轻松氛围认识新朋友、分享你的新想法。
在 RTE2024 大会第一天(10 月 25 日)结束后,晚上在我们的开发者聚会享受轻松氛围、美食饮料,和一群实时互动 builder 交流技术与生活。
本活动为邀请制。
成为志愿者,共建社区
如果你对人和技术都怀有好奇心和善意,欢迎扫码成为 RTE Open Day 现场志愿者,与我们一起共建和成长。
报名志愿者
以上即本次 RTE Open Day@RTE2024 的完整指南!
请收好并报名,RTE Builders,我们北京见!
RTE 开发者社区介绍
RTE 开发者社区由声网及多位资深实时互动社区专家联合发起,是聚焦实时互动领域的中立开发者社区。希望通过社区链接领域内的生态伙伴,激活开发者力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。
RTE 开发者社区有一系列的线上线下活动平台,包括平均单期播放 10 万人次的播客《编码人声》、每月举办的RTE Meetup 以及周期性的 RTE Open Day,为各类 RTE 开发者提供了交流、展示 demo、合作握手的平台,可以关注我们的公众号“RTE 开发者社区”了解最新动态与活动信息哦!
超音速计划介绍
超音速计划是 RTE(实时互动)赛道头部创业伙伴营,关注 RTE 领域新场景、新技术,赋能创业开发者更低成本、更高效地实现创新创业。超音速计划诚邀那些专注于实时音视频(RTE)新技术与新场景的初创企业参与申请。我们特别欢迎融资阶段处于A轮或A轮之前的企业,尤其是那些产品仍处于初级阶段,并且深刻认同 RTE 长期价值的创新团队。希望与您共同探索无限可能,推动行业的未来发展!如果还没有完整的项目,也欢迎先加入我们的 RTE 开发者社区哦~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。