当前位置：小狮博客 > 技术专栏 > 正文

聊聊GRPO算法——从Open R1来看如何训练DeepSeek R1模型

2025-02-11 分类：技术专栏阅读(293) 评论(0)

聊聊DeepSeek R1的一些总结

赞(0)

未经允许不得转载：小狮博客 » 聊聊GRPO算法——从Open R1来看如何训练DeepSeek R1模型

相关推荐

回顶
回顶部