对于强化学习中的策略优化,以下哪种方法可以降低方差?



对于强化学习中的策略优化,以下哪种方法可以降低方差?

A.优势函数估计

B.策略梯度估计

C.价值函数估计

D.动作值函数估计

正确答案:A

答案解析:优势函数估计可以降低策略优化中的方差。


Tag:AI人工智能知识竞赛 函数 方差 时间:2025-01-17 21:13:44