揭露强化学习中的奖励黑客:如何影响 AI 的学习与应用 奖励黑客在强化学习中由于奖励函数的缺陷而引发的挑战,特别是在语言模型中的影响,亟需更多的研究和应对策略。 Lilian Weng · Thu, 28 Nov 2024 00:00:00 +0000