奖励机制 — 标签

揭露强化学习中的奖励黑客：如何影响 AI 的学习与应用

奖励黑客在强化学习中由于奖励函数的缺陷而引发的挑战，特别是在语言模型中的影响，亟需更多的研究和应对策略。

Lilian Weng · Thu, 28 Nov 2024 00:00:00 +0000