小狮博客
欢迎光临
我们一直在努力
示例页面
示例页面
Hi, 请登录
我要注册
找回密码
当前位置:
小狮博客
>
技术专栏
>
正文
offline RL · PbRL | LiRE:构造 A>B>C 的 RLT 列表,得到更多 preference 数据
2024-12-27
分类:
技术专栏
阅读(37)
评论(0)
从 RLT 里推导出
\((\sigma_0, \sigma_1, p)\)
的 preference 数据,其中
\(p\in\{0,0.5,1\}\)
。
赞(
0
)
未经允许不得转载:
小狮博客
»
offline RL · PbRL | LiRE:构造 A>B>C 的 RLT 列表,得到更多 preference 数据
分享到:
更多
(
0
)
上一篇
硬盘的基本知识与选购指南
下一篇
一款.NET开源的Windows资源管理器标签页工具
相关推荐
偷偷告诉你5个好用的Pandas技巧
使用canal+Kafka进行数据库同步操作
List 集合去重的 3 种方法
Python实用小技巧,30个Python极简代码
了解RXJS中四种Subject的区别
Java跟Linux内核距离有多远
学习Vue3.0,你需要先了解一下Proxy
跨平台C++开发工具Qt,开发GUI之前你可以了解一下Qt类
QQ咨询
QQ咨询
回顶
回顶部