博客园热门文章

马上订阅 博客园热门文章 RSS 更新: https://feed.cnblogs.com/blog/sitehome/rss

Search-R1论文浅析与代码实现 - qlhh

2025年10月21日 12:28
【摘要】GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ 阅读全文