在强化学习中,以下哪种算法结合了策略梯度和价值函数的优势?



在强化学习中,以下哪种算法结合了策略梯度和价值函数的优势?

A.A3C

B.DQN

C.TD3

D.Sarsa

正确答案:C

答案解析:TD3结合了策略梯度和价值函数的优势。


Tag:AI人工智能知识竞赛 梯度 函数 时间:2025-01-17 21:13:55