欢迎光临
我们一直在努力

解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强

以上两个方向相对正交分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题,今天再聊一个相对Hybrid的方向,通过Verifier和Generator相互博弈来同时提升双方实力。这里分别介绍Anthropic的辩论法,和OpenAI的博弈法

赞(0)
未经允许不得转载:小狮博客 » 解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强
分享到: 更多 (0)