对于强化学习中的策略优化,以下哪种方法可以降低方差?
对于强化学习中的策略优化,以下哪种方法可以降低方差?
A.优势函数估计
B.策略梯度估计
C.价值函数估计
D.动作值函数估计
正确答案:A
答案解析:优势函数估计可以降低策略优化中的方差。
Tag:AI人工智能知识竞赛 函数 方差
时间:2025-01-17 21:13:44