bang's blog

我的世界

马上订阅 bang's blog RSS 更新: http://blog.cnbang.net/feed/

DeepSeek R1 是怎么训练出来的?- R1 论文精读

bang
2025年2月10日 10:39
技术文章AI
背景 DeepSeek 里程碑式的爆火,有必要学习下是怎么回事。 大语言模型的发展,之前一直是以预训练为主,虽 […]