欢迎光临
我们一直在努力

解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 – RL Scaling

整体上DeepSeek的实验方案更加纯粹,所以我们先介绍Deepseek R1的技术方案,再用kimi来补充一些细节。

赞(0)
未经允许不得转载:小狮博客 » 解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 – RL Scaling
分享到: 更多 (0)