1. 在深度学习中行人重识别是一种目标检测方法。( )

  2. 答案:对
  3. 反向传播算法涉及计算梯度并使用梯度下降来更新神经网络的参数。( )

  4. 答案:对
  5. CBOW模型的目标是通过上下文词汇来预测目标词汇。( )

  6. 答案:对
  7. 在文本翻译模型中,编码器得到的上下文向量是不固定长度的。( )

  8. 答案:错
  9. 训练数据的主要目的是评估模型的性能。( )

  10. 答案:错
  11. Skip-gram模型的目标是根据上下文词汇来预测目标词汇。( )

  12. 答案:错
  13. 梯度下降算法的目标是最小化损失函数。( )

  14. 答案:对
  15. TF-IDF可以用于评估一个词语对于整个语料库中的其中一份文件的重要程度。( )

  16. 答案:对
  17. 动量梯度下降算法是一种改进的梯度下降算法,利用历史梯度的加权平均进行参数更新。( )

  18. 答案:对
  19. 在全连接网络中,隐藏层的数量越多,模型的容量越小。( )

  20. 答案:错
  21. Batch Normalization的优势有( )。

  22. 答案:加速收敛###提高模型的稳定性###减少过拟合
  23. 在中文分词中,哪些方法常用于解决切词的歧义问题( )。
  24. 在简单全连接网络中,使用ReLU作为激活函数的优点是( )。
  25. 下列属于超分辨率重建的方法有( )。
  26. 卷积神经网络(CNN)常用于哪些计算机视觉任务?( )。
  27. 在Pytorch中,可以使用哪些函数实现张量最小值的求取。( )
  28. 在Pytorch中,可以使用哪些函数实现张量元素的和求取。( )
  29. 对于早停法,以下说法正确的是( )。
  30. 在文本翻译模型中,解码器输入包含哪些内容( )。
  31. 属于生成型深度结构的深度学习模型有( )。
  32. 对于卷积神经网络,以下说法错误的是。( )
  33. 在手写数字识别中,交叉熵损失函数常用于( )。
  34. 过拟合现象在全连接网络中可能出现的原因是( )。
  35. 交叉验证的主要优点是什么( )。
  36. 对于L2正则化,以下说法错误的是( )
  37. 关于梯度下降算法的哪些描述是正确的( )。
  38. 对于文本翻译任务,以下哪种技术不会被用到。( )
  39. 对于代码搜索任务来说,从下面哪个网站获取数据较好( )
  40. 池化层在卷积神经网络中的作用是( )。
  41. 反向传播是深度学习中用于什么目的的( )。
  42. 在全连接网络中,输出层的激活函数常常选择( )。
  43. 在手写数字识别中,全连接网络的输入层应该是( )。
  44. 词嵌入通过将单词表示为什么类型的向量,使计算机更好地理解单词之间的语义和关联关系( )。
  45. 为了提高全连接网络的性能,可以尝试的方法包括( )。
  46. 哪种训练/测试数据分割方法将数据集划分为k个互斥子集,然后使用其中k-1个子集作为训练集,1个子集作为测试集( )。
  47. 在Pytorch中,可以使用哪种函数实现张量标准差的求取。( )
  48. 在目标检测中,以下哪些是常用的优化算法( )。
  49. 关于深度学习中的注意力机制,以下说法错误的是。( )
  50. 在文本翻译模型中,解码器初始输入是什么。( )
  51. 在非线性建模中,深度学习可以通过使用多层非线性变换。以下说法错误的是。( )
  52. 用什么工具可以将GitHub上面的项目下载到本地( )
  53. 在卷积神经网络中,激活函数常用的选择是( )。
  54. 为什么神经网络模型不能直接应用梯度下降算法进行训练( )。
  55. 在全连接网络中,隐藏层的作用是( )。
  56. 文本分类模型中的哪个层通常用于计算所有词向量的平均值( )。
  57. 在Pytorch中,将张量移动到GPU上可以使用哪种函数实现。( )
  58. 词嵌入是一种将单词或短语映射到什么类型的空间( )。
  59. 分词是自然语言处理中的哪一步骤( )。
  60. 用什么方法将自然语言文本和代码这两种异构数据进行匹配( )
  61. 如果计算输入张量中每个元素的绝对值,可以采用哪种方法( )。
  62. 相较于离线语音识别,实时在线语音识别不同处在于( )。
  63. 在深度学习被广泛应用后,语音识别任务不在使用HMM模型。( )
  64. 声音采集一般的采样率为( )。
  65. 对于语音识别,一个完整的流程包含哪些步骤。( )
  66. 人发出声频率一般的范围是( )。
  67. 在TensorBoard中可以查看训练过程的损失值。( )
  68. 以下哪些方式是正则化方法( )。
  69. 对于L1正则化方法,以下说法错误的是( )。
  70. 对于权重零初始化方法,以下说法错误的是( )。
  71. 对于代码搜索任务,数据预处理包含哪些步骤。( )
  72. 对于LSTM模型,以下说法错误的是( )。
  73. 在深度学习中,注意力机制实现方式包括( )
  74. 在深度学习中Batch Normalization的一个缺点是需要较大的batchsize才能合理训练数据的均值和方差。( )
  75. 在文本翻译模型的编码器中,Embedding的作用是( )。
  76. 在深度学习中,批处理的优势有( )。
  77. 分词可能会产生哪些挑战( )。
  78. 训练数据和测试数据的主要区别在于它们的用途。训练数据用于什么( )。
  79. 早停是一种策略,当模型在验证集上的性能开始下降时,停止训练以防止过拟合。( )
  80. 以下哪个因素不属于TF-IDF的特点之一( )。
  81. 下面哪些任务可以使用TF-IDF作为特征抽取方法?( )。
  82. 以下哪些指标可以用来评估损失函数的性能( )
  83. 反向传播算法的主要目的是( )。
  84. 反向传播算法的主要目的是计算神经网络的输出值。( )
  85. 损失函数的作用是( )。
  86. 在反向传播算法中,哪些参数会被更新( )
  87. 数据预处理在卷积神经网络中的作用是什么?( )
  88. 数据增强是一种常用的方法,用于增加训练数据集的多样性和数量。( )
  89. 卷积神经网络(CNN)的基本结构包括哪些组成部分?( )。
  90. 在图像分类问题中,我们常用的损失函数是什么?( )。
  91. 下列哪个是经典的卷积神经网络模型( )。
  92. 手写数字识别的过程包括了( )
  93. 池化的方式主要有( )。
  94. 神经网络中用于接收数据的层是( )。
  95. 以下哪个函数不是激活函数( )。
  96. 神经网络可以处理多分类问题。( )
  97. 在pytorch中可以使用max()/amax()/argmax()/maximum()等4种函数实现最大值的求取,其中,max()返回最大值和对应的索引,amax()返回索引,argmax()返回最大值。( )
  98. 如果想求张量元素的平均值,在pytorch中可以使用哪些函数实现。( )
  99. 在pytorch中可以使用哪种函数实现众数的求取。( )
  100. 如果想求张量元素的分位数,在pytorch中可以使用哪些函数实现。( )
  101. 在pytorch中可以使用哪种函数实现累计求积。( )
  102. 在深度学习中目标检测核心任务是筛选出给定图像中所有感兴趣的目标,确定其位置和大小。( )
  103. 句子分析的主要任务包括( )。
  104. 在深度学习中,梯度下降算法基本思想包括( )。
  105. 对于机器学习,以下说法错误的是( )。
  106. 在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法知道了神经元准确的权重和偏差,就可以近似任何函数。实现这个最佳的方法是( )。
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(8) dxwkbang
返回
顶部