⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

人工智能引论章节测试课后答案2024春

905 阅读 0 评论 1 点赞

第七章测试

1. 下面对强化学习、监督学习和深度卷积神经网络学习的描述正确的是（）
A:评估学习方式、端到端学习方式、端到端学习方式 B:评估学习方式、有标注信息学习方式、端到端学习方式 C:无标注学习、有标注信息学习方式、端到端学习方式 D:有标注信息学习方式、端到端学习方式、端到端学习方式
答案:B
2. 在强化学习中，通过哪两个步骤的迭代，来学习得到最佳策略（）
A:贪心策略优化与Q-learning B:策略优化与策略评估 C:价值函数计算与动作-价值函数计算 D:动态规划与Q-Learning

内容已经隐藏，点击付费后查看

3. 在强化学习中，哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力（）
A:蒙特卡洛采样 B: