在强化学习中,以下哪种算法结合了策略梯度和价值函数的优势?
在强化学习中,以下哪种算法结合了策略梯度和价值函数的优势?
A.A3C
B.DQN
C.TD3
D.Sarsa
正确答案:C
答案解析:TD3结合了策略梯度和价值函数的优势。
Tag:AI人工智能知识竞赛 梯度 函数
时间:2025-01-17 21:13:55