美团技术团队

美团技术团队最近更新内容。

可验证过程奖励在提升大模型推理效率中的探索与实践

美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM 通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。

2025/10/10
articleCard.readMore

LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!

美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。综合评估显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA)。

2025/9/22
articleCard.readMore

开源 | InfiniteTalk:无限长虚拟人视频生成的新范式

为解决虚拟人长视频生成的质量退化问题,美团基础研发平台/视觉智能团队推出了 InfiniteTalk 技术,实现无限时长视频生成。已在 GitHub 开源并获 1.6K Stars,Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教育、影视等领域。

2025/9/21
articleCard.readMore

LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型

SGLang 团队是业界专注于大模型推理系统优化的技术团队,提供并维护大模型推理的开源框架SGLang。近期,美团M17团队与SGLang团队一起合作,共同实现了LongCat-Flash模型在SGLang上的优化。

2025/9/11
articleCard.readMore

美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代

我们正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。

2025/9/1
articleCard.readMore

美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的“听话”能力

针对大模型知识推理能力与指令遵循能力存在表现差异的现象,为推进指令遵循能力的系统化研究与精准评估,美团 M17 团队推出全新评测基准 Meeseeks,并在GitHub、Huggingface、魔搭社区等开源平台上线。

2025/8/29
articleCard.readMore

可信实验白皮书系列08:开放式分析引擎 | 附PDF合集

本篇为《可信实验白皮书》系列的最后一篇内容,主要分享了 AB 实验分析方法库在美团的实践。同时,我们也为大家准备了一份系列全集的 PDF 文档,希望能够帮助到更多从事 AB 实验工作的同学们。

2025/8/22
articleCard.readMore

美团智能头盔研发实践系列01:硬件设计篇

本文系《美团智能头盔研发实践》系列的第一篇文章,聚焦硬件设计维度。针对外卖骑手传统头盔佩戴体验不佳等痛点,从安全保障、体验优化、效率提升三大方向切入,详细解析安全防护、多传感器预警、通风减重、长效续航、音频降噪、工艺控制等关键技术,并提炼研发过程中行之有效的设计经验。

2025/8/15
articleCard.readMore

美团智能头盔研发实践系列02:软件功能篇

本文系《美团智能头盔研发实践系列》的第二篇文章,围绕智能头盔如何通过主动安全和被动安全相结合的方式有效保护骑手,主要包括智能头盔骑行通话质量强化、智能语音助手、碰撞摔倒监控等三项软件能力。

2025/8/15
articleCard.readMore

联合营销生态下的广告机制设计与实践

即时零售行业蓬勃发展,在此生态下美团零售广告成为助力零售商家和品牌商扩大生意规模的重要驱动力。文章首先介绍了在全新业务模式“联合营销”场景下,首创的多协同方参竞拍卖机制算法——“集资拍卖”,然后梳理了集资拍卖在美团的技术发展路径和实践,围绕规则化集资拍卖、模型化集资拍卖、整体集资拍卖进行了展开,最后是一些总结,希望能对大家有所帮助或启发。

2025/8/8
articleCard.readMore