第六章测试
1.下列属于强化学习组成部分有哪些( )
A:状态 B:行动 C:环境 D:智能体
答案:ABCD
2.下列属于机器学习中的应改为强化学习算法有哪些( )
A:策略迭代算法 B:值迭代算法 C:时间差分方法 D:蒙特卡洛法 3.下列哪个是求解决策过程最优化的数学方法( )
A:动态规划方法 B:策略迭代算法 C:时间差分方法 D:蒙特卡洛法 4.采用时间差分法的强化学习可以分为哪几类( )
A:离线控制 B:统计试验法 C:统计模拟法 D:在线控制 5.强化学习的主要特点有哪些( )
A:基于评估 B:序列决策过程 C:单步 D:交互性

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(183) dxwkbang
返回
顶部