SF
RTC 实时音视频
RTC 实时音视频
注册登录
关注博客
注册登录
主页
关于
RSS
Claude 语音版曝光,可通过对话搜索文档、撰写邮件;ElevenLabs 已支付音频样本演员超 500 万美元丨日报
RTE开发者社区
5 月 28 日
阅读 5 分钟
94
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
世界人工智能大会招募丨 WAIC 2025 FUTURE TECH 创新企业招募倒计时 15 天!让世界看见你的硬核 AI 创新
RTE开发者社区
5 月 27 日
阅读 2 分钟
171
2025 世界人工智能大会将于 7 月 26~29 日在上海举办。其中在世博展览馆会有 200 家创新项目在 Future Tech 展区交流。
离线声音合成应用 RWKV Talk:多语言、多音色、支持声音克隆;马斯克:AI 将替代传统搜索丨日报
RTE开发者社区
5 月 27 日
阅读 6 分钟
200
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Kyutai 推出模块化语音 AI 工具 Unmute,赋予大模型语音能力;开源语音硬件「小智 AI 」演示视觉理解能力丨日报
RTE开发者社区
5 月 26 日
阅读 4 分钟
218
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
上线 3 天破 500 星,TEN VAD 与 Turn Detection 让 Voice Agent 对话更拟人丨社区来稿
RTE开发者社区
5 月 23 日
阅读 4 分钟
269
GPT-4o 所展示对话式 AI 的新高度,正一步步把我们在电影《Her》中看到的 AI 语音体验变成现实。AI 的语音交互正在变得更丰富、更流畅、更易用,成为构建多模态智能体的重要组成部分。
微软 Azure 发布 Voice Live API,自带音频处理可自选模型;空间语音翻译:保持环境中说话人方向和声音特征丨日报
RTE开发者社区
5 月 23 日
阅读 6 分钟
267
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
腾讯推出端到端语音通话模型「混元 Voice」,1.6 秒响应;实时转录工具集体爆发丨日报
RTE开发者社区
5 月 22 日
阅读 5 分钟
256
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Gemini 刚发布的「主动音频」和「主动视频」是什么?对谈 Project Astra 主管
RTE开发者社区
5 月 21 日
阅读 7 分钟
328
今天的 Google I/O 2025 大会上,实时多模态模型 Gemini Live API 升级了最新功能,除了更加细致的情感理解和双人语音合成,更吸引人注意的便是「主动音频」和「主动视频」功能。
Gemma 3n 新增音视频理解,可在手机运行;Gemini Live API 升级主动音视频,能记录关键事件和适时回应丨日报
RTE开发者社区
5 月 21 日
阅读 5 分钟
303
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
高能预警!Community Day 20+议题大公开
RTE开发者社区
5 月 20 日
阅读 2 分钟
362
盛夏将至一场技术狂欢即将上演热血开发者蓄势待发 海量议题 即将引爆全场!Community Day 倒计时仅剩一周 你准备好了吗?立即报名不错过海量技术干货【时间】 5月25日11:00-20:00【地点】 北京市东城区美术馆后街40号·美后肆时论坛1:Next下一代开发范式(时间段:13:30-17:30)聚焦改变开发者日常的革命性突破没有晦涩...
NotebookLM 推出移动版本,音频概览支持实时互动;豆包 AI 耳机支持外教语音智能体 Owen丨日报
RTE开发者社区
5 月 20 日
阅读 5 分钟
274
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
ListenHub :短播客内容生成和消费 Agent;Ollama 新引擎支持多模态推理模型,将支持语音生成丨日报
RTE开发者社区
5 月 19 日
阅读 5 分钟
312
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
最新开源 TEN VAD 与 Turn Detection 让 Voice Agent 对话更拟人 | 社区来稿
RTE开发者社区
5 月 16 日
阅读 4 分钟
320
GPT-4o 所展示对话式 AI 的新高度,正一步步把我们在电影《Her》中看到的 AI 语音体验变成现实。AI 的语音交互正在变得更丰富、更流畅、更易用,成为构建多模态智能体的重要组成部分。
TEN 开源超轻量 VAD 和全双工对话轮次检测模型;Stability AI 发布全新端侧音频生成模型,无版权风险丨日报
RTE开发者社区
5 月 16 日
阅读 5 分钟
245
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
MiniMax 新语音模型登顶 TTS 全球榜单;AI 会议笔记 Granola 融资 6700 万美元,估值 2.5 亿丨日报
RTE开发者社区
5 月 15 日
阅读 6 分钟
301
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
免费门票丨IVS2025:日本规模最大的创业与创新大会,京都,7.2-4
RTE开发者社区
5 月 15 日
阅读 3 分钟
322
很开心 RTE 开发者社区能作为 IVS2025 的全球合作伙伴,为社区带来更多全球化发展的机会。IVS 是日本规模最大的创业与创新大会,今年更是有 Notion 创始人 Ivan Zhao 出席分享。
Nooka:将书籍生成可互动音频,支持随时打断和提问;Sam Altman:语音与图形界面结合将带来创新丨日报
RTE开发者社区
5 月 14 日
阅读 4 分钟
280
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
扎克伯格:AR 眼镜会是未来的手机,VR 则是未来的电视;Manus AI 融资 7500 万美元,开放免费使用丨日报
RTE开发者社区
5 月 13 日
阅读 5 分钟
319
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Voice Agent Camp 招募:GPT-4o 一周年,我们决定发起一个创业营丨超音速计划 2025
RTE开发者社区
5 月 13 日
阅读 5 分钟
308
你是否也曾反复揣摩《Her》中的语音交互,并梦想着复刻甚至超越那份智能与情感?在 Voice Agent Camp,遇见与你怀着同样热忱与梦想的伙伴。
苹果提出高效视觉编码器 FastVLM,可在移动设备部署;微软更新 Copilot:与 AI 实时分享并讨论屏幕内容丨日报
RTE开发者社区
5 月 12 日
阅读 5 分钟
348
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
Ava:6 分钟语音聊天免费生成 MBTI 报告;字节发布图像理解与生成统一模型 Mogao丨日报
RTE开发者社区
5 月 9 日
阅读 5 分钟
358
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
72小时AI生存挑战 After Party,喊你一起来玩儿!
RTE开发者社区
5 月 9 日
阅读 2 分钟
387
72小时,他们会崩溃,还是会开挂?谁会第一个和AI吵架?谁第一个靠AI点外卖成功?AI会成为朋友,还是会逼疯他们?他们如何用AI对抗时间、匮乏与孤独,并寻找创造力的边界?AI可以帮我们活下来,但能帮我们“活得像人”吗?经过两个多月的筹备,2025年5月15-18日,第一批“AI生存探索者”,即将在上海集结,开启72小时的AI生...
AI 大赛丨总奖池 50 万元!「1000 AIdea 应用计划」等你来战!
RTE开发者社区
5 月 8 日
阅读 2 分钟
385
由 AWS 发起的「1000 Aldea 应用计划」正式起航啦! 无论你来自哪个行业,是企业的 CXO、技术人员、非技术人员亦或是高校学生均可报名参赛!共同用技术定义下一个 AI 时代。
通义视觉负责人薄列峰离职;ElevenLabs 开源 Next.js 音频入门套件,几分钟搭建对话式 AI丨日报
RTE开发者社区
5 月 8 日
阅读 4 分钟
386
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
活动报名丨在旧金山&硅谷,遇见 Voice Agent 开发者&创业者
RTE开发者社区
5 月 7 日
阅读 4 分钟
118
5 月 14~16 日,我们将在美国旧金山举办和参与多场 Voice Agent 主题的开发者活动。其中包括 TEN Framework 的工作坊、RTE Dev Party 和 Linkloud 的硅谷线下沙龙。
Voila:开源端到端全双工语音模型,延迟 195 毫秒;Gemini 2.5 Pro 预览版发布,视频理解能力提升丨日报
RTE开发者社区
5 月 7 日
阅读 4 分钟
166
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
彻底搞懂 MCP 是什么、和 API 的区别、对企业的价值,如何在企业落地、未来趋势丨社区来稿
RTE开发者社区
5 月 6 日
阅读 7 分钟
412
APIPark 也看到 MCP 在企业部署过程中碰到的实际问题:如何将企业内部的系统清晰、高效、安全地开放给 Agent? 原有的 API 系统如何快速接入 MCP? APIPark 也给出了一些自己的探索和解决方案。
通义发布小尺寸多模态模型 Qwen2.5-Omni-3B;英伟达开源 ASR 模型 Parakeet TDT 0.6B 丨日报
RTE开发者社区
5 月 6 日
阅读 4 分钟
305
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的观点」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
NotebookLM 音频概览支持中文;扎克伯格 LlamaCon 发言:语音当下被低估了,未来语音交互将占据更大比重丨日报
RTE开发者社区
4 月 30 日
阅读 5 分钟
440
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的观点」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
沐言智语开源 Muyan-TTS:基于高质量播客数据集,二次开发友好;Ztalk.ai:实时语音会议翻译,支持 30+语言丨日报
RTE开发者社区
4 月 29 日
阅读 5 分钟
541
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
1
(current)
2
3
4
5
…
More
下一页
1
(current)
下一页