当前位置：小狮博客 > 技术专栏 > 正文

小白也能看懂的LLM-RL算法：PPO/DPO/GRPO/GSPO

2026-01-11 分类：技术专栏阅读(212) 评论(0)

LLM-RL往期文章推荐

赞(0)

未经允许不得转载：小狮博客 » 小白也能看懂的LLM-RL算法：PPO/DPO/GRPO/GSPO

相关推荐

回顶
回顶部