美团技术团队

美团技术团队最近更新内容。

KuiTest:基于大模型通识的 UI 交互遍历测试

美团质效技术部联合复旦大学周扬帆教授团队推出 KuiTest——零规则 UI 功能性异常测试工具。KuiTest 通过将“人类预期”直接用作 Test Oracle,解决了长期以来 UI 测试 Oracle 泛化性差的自动化痛点。实验表明,KuiTest 异常召回率达 86%,误报率仅 1.2%,已在执行 21 万+测试用例,发现百余例有效缺陷,大幅降低人工成本并提升测试覆盖率。

2026/1/13
articleCard.readMore

AAAI 2026 | 美团技术团队学术论文精选

AAAI 是人工智能领域顶级的国际学术会议,本文精选了美团技术团队被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,希望这些论文能对大家有所帮助或启发。

2026/1/12
articleCard.readMore

2025 | 美团技术团队热门技术文章汇总

感谢这一路上,每一位伙伴的并肩前行与坚定支持。今年,美团技术团队在持续深耕中涌现出不少值得分享的实践与开源产品&服务。我们从中精选了18篇具有代表性的技术文章,内容涵盖大模型开源、研发技能、产品服务三大方向。

2025/12/29
articleCard.readMore

美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现

2025/12/23
articleCard.readMore

大模型剪枝新范式:先浓缩,再剪枝——DenoiseRotator技术解读

美团 LongCat Interaction 团队联合上海交通大学听觉认知与计算声学实验室,以及香港科技大学的研究者,共同完成了大模型剪枝方法的创新研究,提出了名为 DenoiseRotator 的新技术。通过首先对参数矩阵进行变换,“将知识和推理能力浓缩到由少量参数组成的子网络内”,“再裁剪掉子网络外的参数”,实现了大模型剪枝的新范式。

2025/12/19
articleCard.readMore

LongCat 上线 AI 生图!精准高效,AI 创作不设限

美团 LongCat 全新上线 AI 生图功能,该功能基于 LongCat 系列模型「LongCat-Image」打造而成。无论是追求高效出图的普通用户,还是需要精准落地创意的专业创作者,LongCat 都以 “轻量化模型 + 流畅体验” ,让 AI 生图真正成为人人可用的创作工具。

2025/12/9
articleCard.readMore

美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA

美团 LongCat 团队正式发布并开源 LongCat-Image 模型,通过高性能模型架构设计、系统性的训练策略和数据工程,以 6B 参数规模,成功在文生图和图像编辑的核心能力维度上逼近更大尺寸模型效果,为开发者社区与产业界提供了 “高性能、低门槛、全开放” 的全新选择。

2025/12/9
articleCard.readMore

AI Coding与单元测试的协同进化:从验证到驱动

AI生成代码质量难以把控!本文分享来自美团的技术实践,三大策略破解AI编程痛点。单测快速验证逻辑正确性,安全网保护存量代码演进,TDD模式精准传递需求。告别「看起来没问题」的错觉,构建AI时代的代码质量保障体系。

2025/12/5
articleCard.readMore

R-HORIZON:探索长程推理边界,复旦NLP&美团LongCat联合提出LRMs能力评测新框架

复旦大学与美团LongCat联合推出 R-HORIZON——首个系统性评估与增强 LRMs 长链推理能力的评测框架与训练方法。核心创新:R-HORIZON 提出了问题组合(Query Composition)方法,通过构建问题间的依赖关系,将孤立任务转化为复杂的多步骤推理链。

2025/11/28
articleCard.readMore

美团 LongCat 发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限

美团 LongCat 团队发布数学推理评测基准—— AMO-Bench 。该评测集共包含 50 道竞赛专家原创试题,所有题目均对标甚至超越 IMO 竞赛难度。AMO-Bench 既揭示出当前大语言模型在处理复杂推理任务上的局限性,同时也为模型推理能力的进一步提升树立了新的标杆。

2025/11/27
articleCard.readMore