SF
美团技术团队
美团技术团队
注册登录
关注博客
注册登录
主页
关于
RSS
AAAI 2026 | 美团技术团队学术论文精选
美团技术团队
1 月 13 日
阅读 5 分钟
220
AAAI 是人工智能领域顶级的国际学术会议,本文精选了美团技术团队被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,希望这些论文能对大家有所帮助或启发。
KuiTest:基于大模型通识的UI交互遍历测试
美团技术团队
1 月 13 日
阅读 7 分钟
215
美团质效技术部联合复旦大学周扬帆教授团队推出KuiTest——零规则UI功能性异常测试工具。KuiTest通过将“人类预期”直接用作Test Oracle,解决了长期以来UI测试Oracle泛化性差的自动化痛点。实验表明,KuiTest异常召回率达86%,误报率仅1.2%,已在执行21万+测试用例,发现百余例有效缺陷,大幅降低人工成本并提升测试覆盖率。
2025 美团技术团队热门技术文章汇总
美团技术团队
2025-12-29
阅读 8 分钟
565
今年,美团技术团队在持续深耕中涌现出不少值得分享的实践与开源产品&服务。我们从中精选了18篇具有代表性的技术文章,内容涵盖大模型开源、研发技能、产品服务三大方向。值得一提的是,美团 LongCat 团队今年在大模型开源领域成果显著,陆续发布了涵盖基座模型、图像、视频、语音等多个方向的开源产品与工具,期望能够...
美团 LongCat-Video-Avatar 正式发布,实现开源SOTA级拟真表现
美团技术团队
2025-12-23
阅读 4 分钟
529
今年 8 月,美团开源的 InfiniteTalk 项目凭借无限长度生成能力与精准的唇形、头部、表情及姿态同步表现,迅速成为语音驱动虚拟人领域的主流工具,吸引全球数万名开发者的使用。10月底,LongCat 团队开源了 LongCat-Video 视频生成模型,尤其在长视频生成领域具备显著优势。
大模型剪枝新范式:先浓缩,再剪枝——DenoiseRotator技术解读
美团技术团队
2025-12-19
阅读 4 分钟
541
在大语言模型(LLM)快速发展的今天,庞大的参数规模带来高昂的推理存储成本和回复时延,已成为实际应用中的关键挑战。特别是在面向人机对话的应用场景,模型推理效率直接影响到对话体验。在推理优化方法中,参数剪枝作为一项经典的模型压缩技术,旨在通过剔除模型中“不重要”的权重来实现参数量的显著降低与计算效率的提...
美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA
美团技术团队
2025-12-09
阅读 4 分钟
483
当前 AI 图像生成技术需求旺盛,但行业陷入 “两难困境”:闭源大模型性能强劲但无法自行部署或二次定制开发,开源方案普遍存在轻量化与模型性能难以兼顾、面向商用专项能力不足的痛点,制约商业创作与技术普惠。为此,美团 LongCat 团队正式发布并开源 LongCat-Image 模型,通过高性能模型架构设计、系统性的训练策略和数...
LongCat 上线 AI 生图!精准高效,AI 创作不设限
美团技术团队
2025-12-09
阅读 4 分钟
596
美团 LongCat 全新上线 AI 生图功能,该功能基于 LongCat系列模型「LongCat-Image」打造而成。不仅在文生图任务中实现了“快、真、准” :出图快速响应、达到摄影棚拍摄质感、中文渲染精准度高;更在图像编辑任务上做到了精准便捷,无需复杂指令,可以用自然语言对图像进行二次编辑。无论是追求高效出图的普通用户,还是需...
AI Coding与单元测试的协同进化:从验证到驱动
美团技术团队
2025-12-05
阅读 19 分钟
633
AI生成代码质量难以把控!本文分享来自美团的技术实践,三大策略破解AI编程痛点。单测快速验证逻辑正确性,安全网保护存量代码演进,TDD模式精准传递需求。告别「看起来没问题」的错觉,构建AI时代的代码质量保障体系。
R-HORIZON:探索长程推理边界,复旦 NLP&美团 LongCat 联合提出 LRMs 能力评测新框架
美团技术团队
2025-12-01
阅读 4 分钟
469
随着 OpenAI o1 、 DeepSeek-R1 等大型推理模型(LRMs)的问世, AI 推理能力迎来了「测试时扩展」的新阶段。这些模型通过长链思维(Long Chain-of-Thought, CoT)在数学推理、代码生成、智能体任务等领域展现出强大能力。
美团 LongCat 团队发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限
美团技术团队
2025-12-01
阅读 5 分钟
486
大模型的“推理能力”能让机器具备与人类相似的认知和行为能力,能像人一样理解、思考、学习并解决复杂问题。而在众多推理能力评测场景中,数学推理任务是当前衡量和追踪模型推理能力进展的 “黄金标尺”。与此同时,主流数学推理评测体系正面临关键瓶颈:部分顶尖模型在常用的数学推理评测任务中,如 AIME24/25 的正确率已...
美团 LongCat Interaction 团队发布大模型交互系统技术报告 WOWService
美团技术团队
2025-11-21
阅读 4 分钟
676
在本地生活服务领域,大模型技术落地正遭遇 “三重困境”:通用能力与领域需求难以适配,复杂场景下服务可靠性与个性化无法兼顾,高昂的数据成本与漫长的训练周期进一步增加了开发难度。更关键的是,行业内缺乏可复用的业务适配框架与真实场景优化方案,导致技术落地效率较低。
美团 LongCat 团队发布全模态一站式评测基准UNO-Bench
美团技术团队
2025-11-17
阅读 7 分钟
887
多模态人工智能正从单一感知能力迈向视觉、音频与文本的统一融合,即全模态大模型(Omni-models)时代。然而,相应的评测体系却相对滞后。现有的评测工具不仅稀缺、各自为战,且几乎完全以英文为中心,缺乏对中文场景的有效支持。此外,一些现存的数据集在设计上存在局限性,例如部分问题的解答路径并非严格依赖于多模态...
美团开源LongCat-Audio-Codec,高效语音编解码器助力实时交互落地
美团技术团队
2025-11-14
阅读 4 分钟
678
语音大语言模型(Speech LLM)想落地,绕不开一个死结:既要快速理解语音里的语义,又要说出自然的音色,还得实时响应。比如智能音箱 “听不懂” 语音,车载助手 “说” 得像机器人,实时翻译延迟卡半秒 ——深究根源,全在 “语音 Token 化”:作为拆分语音为 Speech LLM “离散单元” 的关键步骤,传统方案始终没平衡好 —— 要么...
美团 LongCat 团队发布 VitaBench:基于复杂生活场景的交互式 Agent 评测基准
美团技术团队
2025-11-05
阅读 6 分钟
516
由美团 LongCat 团队研发的 VitaBench(Versatile Interactive Tasks Benchmark)正式发布,这是当前高度贴近真实生活场景所面临复杂问题的大模型智能体评测基准。
LongCat-Flash-Omni正式发布并开源:开启全模态实时交互时代
美团技术团队
2025-11-03
阅读 4 分钟
615
自9月1日,美团正式发布 LongCat-Flash 系列模型,现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本,获得了开发者的关注。今天 LongCat-Flash 系列再升级,正式发布全新家族成员——LongCat-Flash-Omni。
LongCat-Video 视频生成模型正式发布,探索世界模型的第一步
美团技术团队
2025-10-31
阅读 3 分钟
1.2k
要让人工智能真正理解、预测甚至重构真实世界,“世界模型”(World Model)已成为通往下一代智能的核心引擎。作为能够建模物理规律、时空演化与场景逻辑的智能系统,世界模型赋予AI“看见”世界运行本质的能力。而视频生成模型有望成为构建世界模型的关键路径——通过视频生成任务压缩几何、语义、物理等多种形式的知识,AI得...
ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享
美团技术团队
2025-10-31
阅读 5 分钟
859
本文介绍了美团技术团队在国际顶会ICCV 2025中发表的5篇论文。同时,在ICCV 2025 举办的多模态推理竞赛中,美团基础研发平台/计算和智能平台组建的ActiveAlphaAgent团队,斩获赛题1真实场景视觉定位(VG-RS)冠军,赛题2空间感知视觉问答(VQA-SA)季军和赛题3创意广告视频视觉推理(VR-Ads)季军。本文也分享了这三道赛...
从0到1建设美团数据库容量评估系统
美团技术团队
2025-10-17
阅读 7 分钟
1.7k
美团数据库团队推出了数据库容量评估系统,旨在解决数据库容量评估与变更风险防控等领域难题。本文介绍了系统架构和主要功能:系统使用线上流量在沙盒环境回放验证变更安全,结合倍速回放技术探测集群性能瓶颈,构建容量运营体系实现集群容量观测与治理闭环。系统具备数据操作安全、结果真实可靠、灵活高效赋能等特点,...
可验证过程奖励在提升大模型推理效率中的探索与实践
美团技术团队
2025-10-10
阅读 4 分钟
849
美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。
开源 | InfiniteTalk:无限长虚拟人视频生成的新范式
美团技术团队
2025-09-24
阅读 6 分钟
1.3k
为解决虚拟人长视频生成的质量退化问题,基础研发平台/计算和智能平台部/视觉智能团队推出 InfiniteTalk 技术,实现无限时长视频生成。该技术口型精准且动作流畅,支持“语音驱动图像”和“语音驱动视频”多种模式,已在 GitHub 开源并获 1.6K Stars, Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教...
LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!
美团技术团队
2025-09-23
阅读 3 分钟
2k
今天,美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 极致速度的同时,全新发布的 LongCat-Flash-Thinking 更强大、更专业。综合评估显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA)。
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
美团技术团队
2025-09-16
阅读 6 分钟
2.8k
9 月 1 日,美团正式发布并开源 LongCat-Flash-Chat,它采用了创新性混合专家模型(Mixture-of-Experts, MoE)架构,实现了计算效率与性能的双重优化。
报名 | 清华美团数字生活研究院学术论坛——大模型:前沿理论与产业变革
美团技术团队
2025-09-05
阅读 1 分钟
1.5k
2025 年清华大学-美团数字生活联合研究院(简称清华美团数字生活研究院)学术论坛将于 9 月 22 日(周一)举办。本次论坛聚焦大模型的前沿理论与产业变革,将邀请郑纬民院士、多位学者和美团技术专家,提供多维视角,共探大模型技术边界拓展与落地实践路径。
美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
美团技术团队
2025-09-01
阅读 3 分钟
1.9k
今天,我们正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型 的“听话”能力
美团技术团队
2025-08-29
阅读 5 分钟
1.3k
近期,以 OpenAI o 系列模型、Claude 3.5 Sonnet 和 DeepSeek-R1 等各类大模型为代表的 AI 技术快速发展,其知识与推理能力得到了广泛认可。然而,许多用户在实际使用中也注意到一个普遍现象:模型有时未能严格遵循输入指令的具体格式要求、字数限制或内容约束,导致输出结果虽内容尚可,却不完全符合输入指令。
可信实验白皮书系列08:开放式分析引擎 | 附PDF合集下载
美团技术团队
2025-08-22
阅读 5 分钟
1.1k
本篇为《可信实验白皮书》系列的最后一篇内容,主要分享了AB实验分析方法库在美团的实践。同时,我们也为大家准备了一份系列全集的PDF文档,希望能够帮助到更多从事AB实验工作的同学们。获取方式:关注美团技术团队微信公众号,在对话框回复「可信实验白皮书」即可获取下载链接。
美团智能头盔研发实践系列01:硬件设计篇
美团技术团队
2025-08-15
阅读 8 分钟
1.2k
本文系《美团智能头盔研发实践》系列的第一篇文章,聚焦硬件设计维度。针对外卖骑手传统头盔佩戴体验不佳等痛点,从安全保障、体验优化、效率提升三大方向切入,详细解析安全防护、多传感器预警、通风减重、长效续航、音频降噪、工艺控制等关键技术,并提炼研发过程中行之有效的设计经验。
美团智能头盔研发实践系列02:软件功能篇
美团技术团队
2025-08-15
阅读 5 分钟
1.3k
本文系《美团智能头盔研发实践系列》的第二篇文章,围绕智能头盔如何通过主动安全和被动安全相结合的方式有效保护骑手,主要包括智能头盔骑行通话质量强化、智能语音助手、碰撞摔倒监控等三项软件能力。
联合营销生态下的广告机制设计与实践
美团技术团队
2025-08-08
阅读 7 分钟
1.1k
即时零售行业蓬勃发展,在此生态下美团零售广告成为助力零售商家和品牌商扩大生意规模的重要驱动力。文章首先介绍了在全新业务模式“联合营销”场景下,首创的多协同方参竞拍卖机制算法——“集资拍卖”,然后梳理了集资拍卖在美团的技术发展路径和实践,围绕规则化集资拍卖、模型化集资拍卖、整体集资拍卖进行了展开,最后是...
ACL 2025 | 美团技术团队论文精选
美团技术团队
2025-08-01
阅读 5 分钟
1.4k
本文介绍了美团技术团队在国际顶会ACL 2025中发表的8篇论文,研究方向覆盖了生成式检索算法、多目标偏好对齐训练、富文本图像理解、搜索词推荐、跨语言迁移能力、多模态数学推理、第三人称任务等技术领域,希望相关研究能给同学们带来一些帮助或启发。
1
(current)
2
3
4
5
…
More
下一页
1
(current)
下一页