Minimind-一个开源LLM项目的代码分析1:模型结构

这个项目实现了一个参数规模较小但功能完整的 LLM,涵盖了预训练、LoRA 微调、SFT、蒸馏以及基于人类反馈的强化学习(RLHF)等多个模块,可以说是非常难得的入门教材。

赞(0)
未经允许不得转载:小狮博客 » Minimind-一个开源LLM项目的代码分析1:模型结构
分享到: 更多 (0)

联系我们