欢迎光临
我们一直在努力

全网第二细致的Verl GRPO实现拆解讲解

Verl的入口在
main_ppo.py中的
main_task函数,比较抽象的是,不管啥算法在Verl中全部都用这个函数,然后这个文件还叫
main_ppo.py,不清楚为啥。

赞(0)
未经允许不得转载:小狮博客 » 全网第二细致的Verl GRPO实现拆解讲解
分享到: 更多 (0)