Agent 模型怎么训练?学习 Kimi K2 论文
在 Agent 使用的模型上,Claude 一直独一档,Deepseek、豆包、Gemini 等模型跟它都有很 […]
在 Agent 使用的模型上,Claude 一直独一档,Deepseek、豆包、Gemini 等模型跟它都有很 […]
数字世界的创作和内容,最重要的是程序和视频。程序负责逻辑、互动;视频负责信息的表达、感知。 2024年2月 S […]
是评测,或者说是基准测试(Benchmark)。 为什么? 因为我们已经有足够的技术方案,只要定义清楚我们要解 […]
Browser Use 成为近期的明星项目,两个人的纯技术开源项目,核心代码 8000 行,融资 1700 万 […]
参加了 NVidia GTC (GPU Technology Conference),由于英伟达的地位,这会也 […]
参加 NVIDIA GTC 会,其中一场听了 LangChain 的作者 Harrison Chase的分享《 […]
近期在业务中尝试落地 Agent,有一个架构设计问题,应该用单 Agent 架构,还是多 Agent 架构? […]
Claude 3.7 Sonnet 在万众期待中推出了,为什么期待,因为从 Claude 3.5 Sonnet […]
背景 DeepSeek 里程碑式的爆火,有必要学习下是怎么回事。 大语言模型的发展,之前一直是以预训练为主,虽 […]
使用 这两天有机会体验了下 Devin,感受到一些小小的震撼。 虽然之前已经用过 cursor 和 winds […]
在 Agent 使用的模型上,Claude 一直独一档,Deepseek、豆包、Gemini 等模型跟它都有很 […]
数字世界的创作和内容,最重要的是程序和视频。程序负责逻辑、互动;视频负责信息的表达、感知。 2024年2月 S […]
是评测,或者说是基准测试(Benchmark)。 为什么? 因为我们已经有足够的技术方案,只要定义清楚我们要解 […]
Browser Use 成为近期的明星项目,两个人的纯技术开源项目,核心代码 8000 行,融资 1700 万 […]
参加了 NVidia GTC (GPU Technology Conference),由于英伟达的地位,这会也 […]
参加 NVIDIA GTC 会,其中一场听了 LangChain 的作者 Harrison Chase的分享《 […]
近期在业务中尝试落地 Agent,有一个架构设计问题,应该用单 Agent 架构,还是多 Agent 架构? […]
Claude 3.7 Sonnet 在万众期待中推出了,为什么期待,因为从 Claude 3.5 Sonnet […]
背景 DeepSeek 里程碑式的爆火,有必要学习下是怎么回事。 大语言模型的发展,之前一直是以预训练为主,虽 […]
使用 这两天有机会体验了下 Devin,感受到一些小小的震撼。 虽然之前已经用过 cursor 和 winds […]