欢迎光临
我们一直在努力

模型蒸馏(Distillation)案例–从DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏

本文重点进行DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏(Distillation
),由于硬件资源有限,只能只用cpu进行模型蒸馏。

赞(0)
未经允许不得转载:小狮博客 » 模型蒸馏(Distillation)案例–从DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏
分享到: 更多 (0)