SF
RTC 实时音视频
RTC 实时音视频
注册登录
关注博客
注册登录
主页
关于
RSS
ElevenLabs 对话式 AI 支持 RAG;阿里 TaoAvatar 快速生成 3D 数字人:实时渲染兼容移动设备丨日报
RTE开发者社区
3 月 28 日
阅读 5 分钟
95
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
昆仑万维发布 Mureka TTS API 和音乐推理大模型;通义发布小尺寸端到端多模态模型 Qwen2.5-Omni丨日报
RTE开发者社区
3 月 27 日
阅读 5 分钟
143
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
直播预告丨手把手教你让 DeepSeek 开口说话
RTE开发者社区
3 月 26 日
阅读 1 分钟
151
直播预告丨手把手教你让 DeepSeek 开口说话 声网资深产品经理实践教学,“小白”都能看懂的0到1攻略,让 DeepSeek 开口说话就是这么简单
Google 发布 Gemini 2.5 Pro 模型:思考+多模态;Vibe Coder :通过语音对话实现「氛围编程」丨日报
RTE开发者社区
3 月 26 日
阅读 5 分钟
246
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
什么是「Agentic 工作流程」?丨社区来稿
RTE开发者社区
3 月 25 日
阅读 3 分钟
267
刚才读到了一篇言简意赅的文章(链接在文末),我想就基于以下每一张文中的图示,来说说什么是 Agentic Workflow、有哪些组成、流程模式与应用场景吧。
Dify+Agora 快速打造语音智能体;ISSEN:个性化 AI 语言老师,可语音交互丨日报
RTE开发者社区
3 月 25 日
阅读 5 分钟
258
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
FeedbackStream:8 分钟创建 AI 面试智能体;Moshi 开源图像理解实时语音模型 MoshiVis 丨日报
RTE开发者社区
3 月 24 日
阅读 5 分钟
296
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
OpenAI 发布新一代 STT/TTS 模型,10 行代码构建 Voice Agent;声网推出对话式 AI 开发套件丨日报
RTE开发者社区
3 月 21 日
阅读 5 分钟
232
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Second Me:在 AI 中保留自我的火种丨社区来稿
RTE开发者社区
3 月 20 日
阅读 5 分钟
331
然而我也经常想,当我们所有人,都心甘情愿地为自己“造神” -- 创造超级智能(Super AI)替我们连接一切,决定一切 -- 我们是否能接受,造神带来的副作用:
月暗推出音频模型 AudioX:任意内容生成音频和配乐;开源 TTS 模型 Orpheus,可生成叹息、笑声等非文本线索丨日报
RTE开发者社区
3 月 20 日
阅读 5 分钟
361
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
听见未来,Audio+AI | GAS 2025完整议程揭晓!
RTE开发者社区
3 月 19 日
阅读 3 分钟
282
大会主题聚焦聚焦“听见未来,Audio+AI”,两场主旨论坛、八场专题论坛。内容覆盖电子产业热点领域及方向,分别包括音频+AI、智能车载 音频、线上智能交互、智能耳机与可穿戴、电声元器件及芯片、助辅听医疗健康、声音与音乐技术、检测及软件。
Amphion 推出合成音频鉴别系统 Auditi;Gemini 引入 NotebookLM 功能,生成文档、网页音频摘要丨日报
RTE开发者社区
3 月 19 日
阅读 6 分钟
244
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Agent 智能体创作大赛+参赛小分队召集
RTE开发者社区
3 月 18 日
阅读 1 分钟
311
大赛公告发布出去后,不少社区伙伴都表示有兴趣参与,所以我们决定建一个「RTE 参赛小分队」微信群 ,愿意一起分享想法和讨论技术,一起赶 deadline(3 月 28 日)的朋友可以加群(加微信 Creators2022,备注身份和来意(参赛小分队加群)。
Zoom 全线产品引入 Agent,实现语音转录总结和语音客服等功能;谷歌云推出 TTS 模型 Chirp 3丨日报
RTE开发者社区
3 月 18 日
阅读 5 分钟
283
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
ElevenLabs 33 亿美元估值的秘密:技术驱动+用户导向的「小熊软糖」团队丨Voice Agent 学习笔记
RTE开发者社区
3 月 17 日
阅读 10 分钟
409
ElevenLabs 是一家专注于人工智能语音技术的创新公司,致力于重新定义音频体验。凭借其突破性的语音克隆和配音工具,ElevenLabs 正在重塑音频内容创作的未来,让高质量、易于访问的音频内容触手可及。
米哈游蔡浩宇新游戏:角色语音、情绪、动作实时生成;Argmax 端侧说话人分离框架:10M 大小 1 秒识别 4 分钟音频丨日报
RTE开发者社区
3 月 17 日
阅读 6 分钟
380
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
阿里通义实验室语音团队负责人鄢志杰离职;苹果计划在 AirPods 上配备实时对话翻译功能丨日报
RTE开发者社区
3 月 14 日
阅读 5 分钟
400
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
通义 R1-Omni 模型:通过音视频判断人物情绪;Google 开源端侧多模态模型 Gemma 3,最小 1B 参数丨日报
RTE开发者社区
3 月 13 日
阅读 5 分钟
363
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
直播预告:慢热的 MCP 终于火了;什么是 MCP,以及智能体通信协议的未来丨RTE Dev Talk
RTE开发者社区
3 月 12 日
阅读 2 分钟
328
MCP(Model Context Protocol)是一种标准化协议,可将 AI 智能体连接到各种外部工具和数据源。(图:Norah Sakal)
Cartesia 升级 TTS 模型,可在音频中无缝填充内容;索尼 AI 游戏角色原型:结合语音与动画,与玩家实时对话丨日报
RTE开发者社区
3 月 12 日
阅读 4 分钟
303
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
端侧 AI 时代,每台家居设备都可以是一个 AI Agent丨Voice Agent 学习笔记
RTE开发者社区
3 月 11 日
阅读 5 分钟
313
2 月 26 日,Amazon 发布了新一代 Alexa+,为全球 6 亿台智能设备终端瞬间赋予了新一代 AI 能力。 现场演示令人惊艳:Alexa+不仅能根据语音指令无缝切换播放设备,实现音乐和视频在不同房间的流转,还能与安防摄像头联动,自主调取与用户指令相关的视频片段。
Tavus 发布对话轮次控制模型:能理解对话节奏和意图;百度推出 AI 情感陪伴应用月匣,整合 MiniMax 等模型丨日报
RTE开发者社区
3 月 11 日
阅读 5 分钟
320
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
线下活动:与宇树 G1 机器人零距离,具身智能畅谈体验会丨社区来稿
RTE开发者社区
3 月 10 日
阅读 2 分钟
310
还记得 2025 蛇年春晚穿着花棉袄转手绢的机器人“舞团”吗?它们是来自宇树科技的 H1 人形机器人,春晚亮相之后,火爆全网,热卖到断货。 时隔 3 个月,H1 的新伙伴 G1 又凭借连续后空翻、360°旋踢等高难度武打动作再度登顶热搜。
Llama 4 即将发布,引入语音能力;AI 智能运动眼镜 BleeqUp:实时对讲、AI 自动成片等功能丨日报
RTE开发者社区
3 月 10 日
阅读 5 分钟
310
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
YC 孵化项目 Pinch:实时语音翻译视频会议平台;Mistral OCR:能处理多语言多模态复杂文档丨日报
RTE开发者社区
3 月 7 日
阅读 5 分钟
358
我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过
RTE开发者社区
3 月 6 日
阅读 9 分钟
277
你估计刷到过上面这个视频,两个 AI 最初用人类自然语言交流,在确认彼此身份后,立刻切换到「哔哔哔哔」这种机器专属的 GGWave 通信方式。这个爆火全网的视频,就诞生于我们今天要介绍的 ElevenLabs Hackathon。
ARR 破百万,「外星人」AI 朋友 Tolan 融资千万美元;Spark-TTS:基于 LLM 的高效文本转语音模型丨日报
RTE开发者社区
3 月 6 日
阅读 4 分钟
496
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
直播预约丨就在明天,声网对话式 AI 引擎发布会
RTE开发者社区
3 月 5 日
阅读 1 分钟
291
Dubformer 获 360 万美元融资,情感迁移技术革新 AI 配音;全球首款宠物智能手机亮相:可定位、AI 实时通话丨日报
RTE开发者社区
3 月 5 日
阅读 4 分钟
385
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Gemini AI 升级视频提问和屏幕共享功能;Voice+Visual Agent Demo:语音对话与视觉互动元素结合丨日报
RTE开发者社区
3 月 4 日
阅读 5 分钟
387
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
1
(current)
2
3
4
5
…
More
下一页
1
(current)
下一页