第八章单元测试
  1. 下列哪种搜索策略不一定能够找到问题的最优解( )。


  2. A:A* B:DFS C:另外三项都能找到最优解 D:BFS
    答案:DFS
  3. 下列说法中,正确的一项是( )。

  4. A:使用BFS进行搜索时,会优先搜索某一节点的子节点及其后裔节点 B:A*搜索算法中启发函数的定义与具体问题有关,不同问题下启发函数的形式也可能不同 C:盲目搜索方法依照预先确定的规则搜索路线,其典型算法包括DFS、BFS和A* D:使用DFS进行搜索时,会优先搜索与某一节点位于同一层级的所有节点
  5. 以下关于强化学习四个基本要素的描述中,正确的是( )。

  6. A:价值函数是对智能体的序列决策收益的衡量,也即环境在智能体每采取一个动作后给予的即时反馈 B:智能体总是朝着最大化奖励的方向去学习的,因此奖励的设计会影响学习效果 C:环境模型定义了不同状态之间的转移概率以及智能体在当前状态下采取某个动作所能获得的奖励 D:策略是从状态到行为的一种映射,它定义了智能体的行为
  7. 强化学习没有标签,它根据环境的反馈来判断行为的好坏,通过奖励和惩罚来学习最大化行为序列的长期收益。( )

  8. A:错 B:对
  9. 在用蚁群算法解决TSP问题时,转移函数的设置仅与两个城市之间的距离有关。( )

  10. A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(4) dxwkbang
返回
顶部