欢迎光临
我们一直在努力

thbcm的文章

技术专栏

泛函和变分法

thbcm阅读(13)赞(0)

  泛函数(Functional,简称泛函)$J$是以函数为自变量的函数,它将一个定义在某函数空间$Y$中的自变量函数映射到实数域$\mathcal{R}$或复数域$\mathcal{C}$,即$J:Y\rightarrow \mathca...

技术专栏

解密prompt系列43. LLM Self Critics

thbcm阅读(14)赞(0)

人类提供的监督信号有几类,包括人工直接生成最优回答(Demonstration), 人工提供偏好对比(Preference),人工给出优化建议(Critique)等几种,论文中曾提及以上几类信号的难易程度