解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强

2025-01-07 分类：技术专栏阅读(224) 评论(0)

以上两个方向相对正交分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题，今天再聊一个相对Hybrid的方向，通过Verifier和Generator相互博弈来同时提升双方实力。这里分别介绍Anthropic的辩论法，和OpenAI的博弈法