欢迎光临
我们一直在努力

解密prompt系列43. LLM Self Critics

人类提供的监督信号有几类,包括人工直接生成最优回答(Demonstration), 人工提供偏好对比(Preference),人工给出优化建议(Critique)等几种,论文中曾提及以上几类信号的难易程度

赞(0)
未经允许不得转载:小狮博客 » 解密prompt系列43. LLM Self Critics
分享到: 更多 (0)