首页
强化学习的特点之一在于智能体程序得到的奖励是及时的。()
精华吧
→
答案
→
超星尔雅学习通未分类
强化学习的特点之一在于智能体程序得到的奖励是及时的。()
A、正确
B、错误
正确答案:B
Tag:
数字时代的智能技术
智能
程序
时间:2025-04-07 09:55:23
上一篇:
以下属于强化学习应用场景的是()。
下一篇:
强化学习是智能体在环境中给予的奖励刺激下,逐步形成对刺激的预期,产生能获得最大的利益的习惯性行为。()
相关答案
1.
在人工智能范畴内的机器学习,包括()。
2.
贝叶斯网络是一个无向图,每个结点标注了定量的概率信息。()
3.
贝叶斯网络对于非确定性关系,可以用()来刻画。
4.
马尔科夫决策过程可以简化由于任务环境的随机性所引发的随机过程,其简化的基本思路是使得随机过程的状态不具有()。
5.
马尔科夫决策过程用来帮助智能体在()任务环境中达到行动合理性。
6.
模拟退火算法是模拟冶金过程中材料“退火”的一种算法。()
7.
爬山法有时被称为贪婪局部搜索,可以很快朝着最优解的方向进展。()
8.
人工智能向自然学习的经典算法有()。
9.
知情搜索中的贪心算法与盲目搜索中的贪心算法相同。()
10.
知情搜索在搜索策略中运用了若干与问题形式化本身之外的、被认可的()。
热门答案
1.
深度优先搜索及其变种算法属于()。
2.
以下哪一种常和深度优先搜索结合使用()。
3.
路径代价测试可以用代价函数,为每条路径赋一个代价值,即边加权值。()
4.
搜索算法可以简单理解为,在一个给定的状态空间中,从一个()出发,通过智能体程序算法,最终达到()。
5.
智能体的合理性必须充分考虑行动的后果,行为是否合理可以由智能体自行评估。()
6.
智能体的行动合理性是指智能体能够做“正确”的事情,这样的智能体称为理性智能体。()
7.
智能体“PEAS”法则中的S是指()。
8.
吴军博士在Google研发人工智能回答复杂问题的方法是()。
9.
WH语句中属于比较复杂的问题是()。
10.
Google研发人工智能回答复杂问题的团队在两年努力之后,使得计算机能够回答()的复杂问题。