Agent 模型怎么训练?学习 Kimi K2 论文

在 Agent 使用的模型上,Claude 一直独一档,Deepseek、豆包、Gemini 等模型跟它都有很 […]

2025/8/6
articleCard.readMore

AI Coding 与 AI 视频:从生产力工具到大众内容平台

数字世界的创作和内容,最重要的是程序和视频。程序负责逻辑、互动;视频负责信息的表达、感知。 2024年2月 S […]

2025/6/5
articleCard.readMore

做好 AI Agent 最重要的是什么

是评测,或者说是基准测试(Benchmark)。 为什么? 因为我们已经有足够的技术方案,只要定义清楚我们要解 […]

2025/4/27
articleCard.readMore

Browser Use 原理解析-为一个小项目能融1700万美元

Browser Use 成为近期的明星项目,两个人的纯技术开源项目,核心代码 8000 行,融资 1700 万 […]

2025/4/7
articleCard.readMore

GTC 2025 见闻

参加了 NVidia GTC (GPU Technology Conference),由于英伟达的地位,这会也 […]

2025/3/28
articleCard.readMore

LangChain 作者聊 AI Agent 的几个相关课题

参加 NVIDIA GTC 会,其中一场听了 LangChain 的作者 Harrison Chase的分享《 […]

2025/3/24
articleCard.readMore

聊聊 Agent 架构 – Single Agent / MCP / Multi-Agent

近期在业务中尝试落地 Agent,有一个架构设计问题,应该用单 Agent 架构,还是多 Agent 架构? […]

2025/3/16
articleCard.readMore

细看 Claude 3.7 两个重要的 Benchmark:SWE-Bench & TAU-Bench

Claude 3.7 Sonnet 在万众期待中推出了,为什么期待,因为从 Claude 3.5 Sonnet […]

2025/2/27
articleCard.readMore

DeepSeek R1 是怎么训练出来的?- R1 论文精读

背景 DeepSeek 里程碑式的爆火,有必要学习下是怎么回事。 大语言模型的发展,之前一直是以预训练为主,虽 […]

2025/2/10
articleCard.readMore

500 美元一个月的 Devin 是怎么实现的

使用 这两天有机会体验了下 Devin,感受到一些小小的震撼。 虽然之前已经用过 cursor 和 winds […]

2025/1/19
articleCard.readMore