在马尔科夫过程中使用动态规划,根据bellman公式,一个状态的价值为改状态的即时奖励和该状态的后继状态的价值的()。



在马尔科夫过程中使用动态规划,根据bellman公式,一个状态的价值为改状态的即时奖励和该状态的后继状态的价值的()。

A、差

B、积

C、和

D、商

正确答案:C


Tag:数字时代的智能技术 状态 价值 时间:2025-04-07 09:55:26