15
2024/07

广义优势估计

优势是什么 在强化学习(Reinforcement Learning)中,优势函数(Advantage Function) 是一个非常重要的概念。优势函数衡量了某个动作相对于其他动作的好坏程度,具体来 ...