1. 自然语言处理的难点主要来自哪些选项?( )

  2. 答案:抽象性和组合性###主观性和知识性###歧义性和进化性###非规范性
  3. PyTorch的三要素是哪些?( )

  4. 答案:表达式###张量###模块
  5. 语义学的研究大致可以分为哪些层面?( )

  6. 答案:话语语义学###句子语义学###词汇语义学
  7. BART模型使用了哪些方式在输入文本上引入噪音?( )

  8. 答案:单词删除###句子排列变换###文本填充###单词掩码
  9. 词汇间的关系包含哪些种类?( )

  10. 答案:意义关系###形体关系###实体关系
  11. ELMO具有哪些特点?( )

  12. 答案:动态###鲁棒###层次
  13. “bank”的上位词包含哪些?( )

  14. 答案:slope###incline###side
  15. 下列哪些技术能被用于计算两个词向量之间的距离?( )

  16. 答案:欧氏距离(Euclidean Distance)###余弦相似度(Cosine Similarity)
  17. 量词包含哪些?( )

  18. 答案:存在量词###全称量词
  19. 假设二元分类的输出是概率值,一般设定输出概率大于或等于 0.5,则预测为正类;若输出概率小于 0.5,则预测为负类。那么,如果将阈值 0.5 提高,例如 0.6,大于或等于 0.6 的才预测为正类。则准确率(Precision)和召回率(Recall)变化变化正确的选项是哪些?( )

  20. 答案:准确率(Precision)增加或者不变###召回率(Recall)减小或者不变
  21. 有哪些常见的语言单元打分(评分)方法?( )

  22. 答案:指定概率分布###直接分配分数###用深度学习模型自动学习###用机器学习模型自动学习
  23. 下列哪些是关键词归一化技术?( )
  24. 连接从逻辑语义关系类型上,可以包含哪些类型?( )
  25. 下列哪些是机器阅读理解任务的常用评测指标?( )
  26. PDTB标注的一级语义类别包含哪些?( )
  27. 句子语义学主要包含哪些理论?( )
  28. 指代消解中的表述对特征包含哪些?( )
  29. 计算两个句子的相似度有哪些方法?( )
  30. 人们认识和描述客观世界时通常遵循哪些认知模式?( )
  31. 循环神经网络解决长距离的依赖的方案是哪些?( )
  32. 以下哪项属于词汇语义学研究内容?( )
  33. 排列语言模型(Permutation Language Models)是下列哪项模型的特点?( )
  34. 下列哪项技术能被用于关键词归一化,即把关键词转化为其基本形式?( )
  35. 序列标注任务一般都会采用BIO表示方式来定义序列标注的标签集,其中‘I’指哪项?( )
  36. 不是PDTB的三级语义标注的选项是?( )
  37. 下面属于异类的是哪项?( )
  38. 条件熵和无条件熵的关系是哪项?( )
  39. 用于产生词嵌入的单向语言模型是哪项?( )
  40. 相同的词可以通过哪项来实现多个词嵌入?( )
  41. 对于一个给定的token,其输入表示为它的token嵌入、段嵌入(Segment Embedding)、位置嵌入(Position Embedding)的总和的模型是哪项?( )
  42. 提示学习是通过一些方法编辑下游任务的输入,使其形式上模拟模型预训练过程使用的数据与任务。( )
  43. 线性回归是最简单的回归模型。( )
  44. 事件A发生的可能性大小称为事件的概率,记作P(A)。( )
  45. 词干提取的后缀剥离算法缺点是无法处理特殊变形。( )
  46. Softmax回归不能用于处理二分类问题。( )
  47. 在给到任何神经网络之前,Tokens都会被转换成数字。( )
  48. 自然语言处理技术发展历史经历了理性主义到经验主义的转变。( )
  49. 语义角色标注是一种浅层语义分析技术,目标是分析句子的谓词-论元结构,揭示句子中概念范畴之间的语义关系。( )
  50. BERT模型包含掩码语言模型和下一个句子预测两个预训练任务。( )
  51. 在下面两句话中:“我吃了一个冰淇淋”和“这个冰淇淋融化了”,“冰淇淋”的语义角色分别是受事和施事。( )
  52. 基于图的依存句法分析核心是构造评分函数,对句子S 所有依存句法树G进行评分。( )
  53. 文本匹配问题通常有单塔结构和双塔结构两种解决方案。( )
  54. 用余弦相似度表示的词之间的差异将显著高于0.5。( )
  55. 负采样方法提供了一种新的任务视角:给定当前词与其上下文,最大化两者的共现的概率。( )
  56. 利用人工智能技术对阿尔茨海默症以及轻度认知障碍的准确诊断具有低成本和高效性。( )
  57. TF-IDF帮你建立文档中最重要的词。( )
  58. 从整体上理解篇章,篇章分析最重要的是对篇章的连贯性和衔接性进行分析。( )
  59. 矩阵的转置和数乘运算对加法满足分配律。( )
  60. “人人都爱护环境”对应的谓词公式为(∀X)[MAN(X) → PROTECT(X, ENVIRONMENT)]。( )
  61. 语言模型是计算一段自然语言的概率或给定上文时下一个词出现的概率。( )
  62. 基于人工智能的谣言检测具有哪些特点?( )
  63. 知识图谱的三元组有“实体-关系-实体”和“实体-属性-属性值“两种形式。( )
  64. 关于序列标注的框架BIESO中的标记正确的是( )。
  65. 安装openai的命令是哪项?( )
  66. RLHF算法包含奖励模型训练和生成策略优化两个阶段。( )
  67. 大部分基于深度学习的模型均使用早期或者中期融合。( )
  68. 多模态摘要包含哪些?( )
  69. 多模态对话与视觉对话的差异包含哪些?( )
  70. 图模型融合可处理具有复杂结构的异构数据,并且具备一定的关系推理能力和可解释性。( )
  71. 图像描述是对给定的一幅自然图像生成一句自然语言描述的任务。( )
  72. BERT Base版本包含多少层Transformer模型?( )
  73. BERT的输入表示不包含哪项?( )
  74. 预训练模型包含哪些要素?( )
  75. BigBird使用的注意力模式,正确的是?( )
  76. TextBrewer工具包提供了方便、快捷、易用的知识蒸馏框架,通过少量性能损失换取大幅速度提升。( )
  77. 分布式表示有哪些缺点?( )
  78. 分布式表示直接使用低维、稠密、连续的向量表示词,通过“自监督”的方法直接学习词向量。( )
  79. ELMo有哪些特点?( )
  80. 关于Word2vec和GloVe,说法 正确的是?( )
  81. Word2Vec中的Skip-Gram模型是根据中间词独立地预测周围词(上下文)。( )
  82. 循环神经网络语言模型沿用了马尔可夫假设。( )
  83. 常见的数据平滑方法包含哪些?( )
  84. 交叉熵和困惑度越小,语言模型性能就越好。( )
  85. 语言模型是计算给定的词序列 w1w2...wm作为一个句子出现的可能性大小。( )
  86. 前馈神经网络语言模型不再基于马尔可夫假设。( )
  87. 基于表述对的指代消解核心思想是将该任务转换为二分类问题,分别对每个表述与其所有先行词所构成的表述对是否构成指代关系进行分类。( )
  88. 语法衔接手段包含哪些?( )
  89. 篇章同时具有线性结构和等级结构。( )
  90. 隐式篇章关系是除显式篇章关系以外,需要靠读者通过推断判断的篇章关系。( )
  91. 在PDTB显式关系中,Arg1一般为句法上关联的论据,Arg2则为另一个论据。( )
  92. 常用的语义表示法包含哪些?( )。
  93. 义元理论核心思想是自然语言中包含非常少部分的词语,这些词语可以用于解释绝大部分词汇的意义。( )
  94. “有机器人都是红色的”对应的谓词公式是(∃X)[ROBOT(X) ∧ COLOR(X, RED)]。( )
  95. 词频-逆文档频率(TF-IDF)和fastText是篇章表示模型。( )
  96. 词汇语义理论包含哪些?( )。
  97. 句子之间存在哪些语义关系?( )。
  98. 依存语法理论需要解决哪些问题?( )
  99. PCFG句法分析树概率计算需要遵循哪些独立假设?( )
  100. 根据依存语法理论,两个成分之间的依存关系是二元的非对称关系,具有方向性,一个成分是中心语,另外一个成分是依附于中心语存在。( )
  101. 移进-归约成分句法分析算法包含哪些操作?( )
  102. 句法范畴包含哪些类型?( )。
  103. 切分歧义包含哪些类型?( )。
  104. 词最主要的语素是什么?( )
  105. 实义词能表达具体的意义,主要包含名词、动词、形容词等;而功能词主要是为了满足语法功能需求。( )
  106. 在不同的语料集中所采用的划分粒度和标记符号也都不尽相同。( )
  107. 基于规则的词性标注是利用词典和搭配规则针对词语和上下文进行分析,从而确定每个词语的词性。( )
  108. GRU模型的特点有哪些?( )
  109. 对于每个特征图谱沿着“宽”、“高”的维度进行降采样。( )
  110. 关于Hard attention和Soft attention,叙述正确的是( )
  111. Sigmoid型函数包含哪些种类?( )
  112. Transformer架构正确的是?( )
  113. 自然语言处理基础任务包含哪些?( )
  114. 分布语义假设认为词的含义可由其上下文词的分布进行表示。( )
  115. 基于符号(字符串)表示的专家知识缺点是哪些 ?( )
  116. 根据数据来源的不同,问答系统可以分为哪些主要的类型?( )。
  117. 典型的结构预测问题包含哪些?( )
  118. 判断题:SentiWordNet是基于WrodNet标注的词语情感倾向性词典,标注了三个情感值(褒义、贬义和中性)。( )
  119. LTP4.0基于哪些技术?( )
  120. torch的升维是什么函数?( )
  121. torch.nn模块提供了灵活的神经网络库,提供多种神经网络层。( )
  122. PyTorch的优势有哪些?( ) 。
  123. 词性标注是根据词语所处的上下文,确定其具体的词性。( )
  124. 所有矩阵都存在逆矩阵。( )
  125. 方阵A的行列式(determinant)是一个将方阵映射到标量的函数,记作 det(A)。( )
  126. 隐马尔可夫过程三个问题是什么?( )。
  127. 若A为一个 m×n的矩阵,且B为一个n×r的矩阵,则AB = C为一个m×r的矩阵。( )。
  128. 如果一组向量中的任意一个向量都不能表示成其他向量的线性组合,那么称这组向量为线性无关。( )
  129. 随机事件有哪些特点?( )。
  130. 随机变量的两个重要的数字特征是什么?( )
  131. 对应语言符号的研究对象是什么?( )
  132. 经验主义范式包含哪些?( )
  133. 自然语言处理任务层级包含哪些?( )
  134. 自然语言处理的歧义性主要是由于语言的形式和语义之间存在多对多的对应关系导致的。( )
  135. 自然语言处理主要研究用计算机理解和生成自然语言的各种理论和方法,属于人工智能领域的一个重要甚至核心分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。( )
  136. 语言智能是人工智能皇冠上的明珠
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(7) dxwkbang
返回
顶部