提示:内容已经过期谨慎付费,点击上方查看最新答案

生物信息大数据

  1. alignment的含义是( )。

  2. A:登录号 B:类推 C:比对 D:算法
    答案:比对
  3. RGP是( )。

  4. A:国家核酸数据库 B:在线人类孟德尔遗传数据 C:水稻基因组计划 D:人类基因组计划
    答案:水稻基因组计划AI参考:正确答案是D:人类基因组计划。RGP是“人类基因组计划”的英文简称。人类基因组计划是一个旨在测定并解读人类基因组的详细图谱,并确定这些基因的结构和表达方式的大型国际研究项目。这个项目计划主要应用于医学领域,通过基因测序研究人类的疾病机制,发现与疾病有关的基因和蛋白质。而A、B、C选项都与题干无关,所以选择D选项。'
  5. 根据大量EST具有相互重叠的性质,通过计算机算法获得cDNA 全长序列,这种克隆基因的方法是( )。

  6. A:基因重组 B:基因步移 C:重叠克隆 D:电子克隆
    AI参考:答案是D:电子克隆。根据题干中的描述,通过计算机算法获得cDNA全长序列,这种克隆基因的方法应该是利用计算机技术进行基因克隆,因此选项D电子克隆最符合题意。基因重组是生物体内遗传物质重新组合的过程,与题干描述不符;基因步移是指通过逐步分析的方法确定基因序列,也不符合题干描述;重叠克隆是指将多个重叠片段克隆到同一个载体中,也不符合题干描述。因此,本题的正确答案为D电子克隆。'
  7. 提交序列到GenBank 中,使用的程序可以是( )。

  8. A:SRS B:Banklt C:Entrez D:Medline
    答案:Bankit
  9. CDs的含义是( )。

  10. A:低复杂度区域 B:编码区 C:非调控区 D:非编码区
    答案:编码区
  11. 微卫星标记是( )。

  12. A:SSR B:RAPD C:RFLP D:SNP
    答案:SSRAI参考:单选题答案:B:RAPD解析:微卫星标记(Microsatellite,简称SSR)是指在高度多态的微卫星基因座位上重复的碱基序列,这些序列在个体间具有高度多态性。RAPD(Random Amplified Polymorphic DNA)是一种基于DNA的分子标记技术,其原理是通过PCR技术对随机引物扩增得到的产物进行多态性分析,因此RAPD是一种分子标记。故正确答案为B。SSR属于分子标记,RFLP、RFL、SNP都是不同基因座上的变异或变异区域。RFLP和RFL是基于遗传图谱构建、基因定位、物种多样性等研究的标记方法,而非遗传多样性评估或生物多样性监测应用中常用的标记方法。SNP是单核苷酸多态性,属于遗传标记,但与微卫星相比,其多态性信息量较少,稳定性相对较低。因此,本题答案为B。'
  13. contig 的含义是( )。

  14. A:结构域 B:基序 C:跨叠克隆群 D:碱基对

  15. 构建进化树工具是( )。

  16. A:Clustalw B:GcG C:Mega D:BLAST
    AI参考:正确答案是C:Mega。构建进化树工具是Mega。Mega是一款常用的生物信息学软件,它提供了一种简单的方法来构建进化树,可以帮助用户快速准确地分析生物序列之间的关系。因此,C选项是正确答案。其他选项如Clustalw、GCG和BLAST虽然也是生物信息学软件,但它们主要用于序列比对和分析,而不是进化树的构建。'
  17. LCR的含义是( )。

  18. A:低复杂度区域 B:编码区 C:开放阅读框 D:非编码区
    AI参考:单选题LCR的含义是(D)非编码区。LCR指的是序列中非编码区域,通常位于RNA基因组中的结构基因编码区之间,起着调控基因表达的作用。'
  19. 限制性片段长度多态性标记是( )。

  20. A:RAPD B:SNP C:RFLP D:SSR

  21. 蛋白质信号肽的预测工具有( )。

  22. A:PredictProtein B:SingalP C:SingalD D:nnpredict

  23. 基本局部比对搜素工具是( )。

  24. A:BLAST B:Clustalw C:GcG D:Mega

  25. 单核苷酸标记是( )。

  26. A:RFLP B:RAPD C:SSR D:SNP
    AI参考:正确答案是D:SNP。单核苷酸标记是单倍体分子标记,具有多态性高、操作简单、检测速度快等优点,是近年来分子标记研究领域中发展最快的一种标记技术。因此,本题答案为D。'
  27. ortholog 的含义是( )。

  28. A:直系同源 B:间接进化 C:旁系同源 D:直接进化

  29. 从相互作用稳定程度的角度分为( )

  30. A:瞬时相互作用 B:共价相互作用 C:稳固相互作用 D:同源复合体 E:异源复合体
    AI参考:正确选项为:C:稳固相互作用 E:异源复合体。从相互作用稳定程度的角度,复合体可以分为稳固复合体和异源复合体。其中,稳固复合体是指相互作用稳定、结构紧密的复合体,如染色体、核小体等;异源复合体则是由不同物种或不同来源的组分组成的复合体。其他选项如瞬时相互作用、共价相互作用、同源复合体等虽然也是复合体的组成部分,但它们并不是从相互作用稳定程度的角度进行分类的。'
  31. 高级BLAST工具包括( )

  32. A:PSI-MEGA B:PSI-BLAST C:MEGABLAST D:MEGA E:PHI-BLAST
    AI参考:多选题答案为ABCE。PSI-BLAST、MEGA、MEGABLAST和PHI-BLAST都是高级BLAST工具。其中,PSI-BLAST主要用于蛋白质序列比对,MEGA是一款生物信息学软件,MEGABLAST是一款在线的BLAST工具,而PHI-BLAST则是用于核酸序列比对的工具。因此,答案为ABCE。D选项中的MEGA并不是高级BLAST工具。'
  33. 第二代测序技术的特点包括( )

  34. A:一次能够测大量的序列 B:PCR中有概率会引入错配碱基 C:片段被限制在了250-300bp D:有一些量少的序列无法被大量扩增造成一些信息的丢失 E:准确率偏高

  35. ML法重建系统树可以使用哪些软件( )

  36. A:Raxml B:IQ-tree C:Mrbayes D:MEGA E:phyML
    AI参考:正确选项为:A:Raxml B:IQ-tree E:phyML。这些软件都是用于系统树重建的常用软件,其中Raxml、IQ-tree和phyML都是基于ML法重建系统树的软件,而Mrbayes则是一种基于MCMC方法的软件,MEGA则主要用于序列比对和分析。因此,答案是A、B和E。'
  37. 同源建模的软件有( )

  38. A:swiss-Model B:Fort C:Modeller D:SDSC1 E:EsyPred
    AI参考:正确选项为:A:swiss-Model C:Modeller E:EsyPred这些软件都是同源建模的常用软件,其中A选项的swiss-Model和C选项的Modeller是较为常用的软件,而E选项的EsyPred则是一种较为简单易用的同源建模软件。B选项的Fort和D选项的SDSC1虽然也有同源建模的功能,但并不是常用的软件。因此,正确选项为A、C、E。'
  39. 提供蛋白质功能注释信息的数据库( )

  40. A:NDB B:PIR C:GEO D:KEGG E:Taxonomy
    AI参考:正确选项为B、C、D。提供蛋白质功能注释信息的数据库包括:PIR(蛋白质信息数据库)、GEO(基因表达谱和基因关联性数据库)、KEGG(新陈代谢和信号转导通路数据库)等。NDB(蛋白质数据库)和Taxonomy(分类学数据库)主要用于蛋白质序列分析和分类,与蛋白质功能注释信息无关。因此,选项B、C、D是正确选项。'
  41. 重复序列根据重复次数可以分为( )

  42. A:假基因 B:高度重复顺序 C:单一DNA D:RNA E:中等程度的重复顺序
    AI参考:正确答案是E:中等程度的重复顺序。重复序列根据重复次数可以分为中等程度的重复顺序和高度重复顺序。假基因和单一DNA不是重复序列的分类方式。重复序列在遗传学中具有重要的意义,可以帮助DNA编码信息更好地适应环境变化。高度重复顺序指的是大量重复的相同序列,而中等程度的重复顺序则是重复次数相对较少但具有一定规律性的序列。因此,E选项“中等程度的重复顺序”是正确的答案。'
  43. 多基因组比对信息的重新预测软件( )

  44. A:EXONIPHY B:Twinscan C:SGP2 D:N-Scan E:CONTRAST
    AI参考:正确选项为D:N-Scan,它是一种专门用于多基因组比对信息的重新预测的软件。其他选项:A. EXONIPHY:主要用于基因组注释和基因组学研究,但它并不专门用于多基因组比对信息的重新预测。B. Twinscan:是一种用于从头组装和基因组注释的软件,但它也适用于多基因组比对信息的重新预测。C. SGP2:是一种用于比较基因组序列的软件,但它并不专门用于多基因组比对信息的重新预测。E. CONTRAST:主要用于比较基因组变异和进化分析,但它并不专门用于多基因组比对信息的重新预测。因此,N-Scan是唯一专门用于多基因组比对信息的重新预测的软件。'
  45. 单细胞测序应用以下( )方面。

  46. A:发现新的细胞类型,细胞状态和罕见的细胞类型 B:发现新的细胞标志物和调控途径 C:能够表征和识别异质细胞群 D:检查健康和患病的组织 E:用于重建发育层次,揭示谱系关系
    AI参考:正确选项为:A、B、C单细胞测序(Single-cell sequencing)是一种高通量的细胞分析技术,可以对单个细胞进行基因组、转录组或表观组测序,从而实现对细胞类型、状态和罕见的细胞类型的发现,以及对细胞标志物和调控途径的发现。此外,单细胞测序还可以用于表征和识别异质细胞群,即识别和量化同一组织或样本中的不同细胞群体。因此,选项A、B、C都是单细胞测序的应用方面。选项D和E虽然也是单细胞测序的应用方向,但与题目要求不完全相符,因此不是正确选项。'
  47. 邻接法构树过程正确的是( )

  48. A:沿着各个分枝累加特征变化的数目 B:合并两个序列使算出的总枝长在各种合并方式中是最短的 C:首先将序列构建一棵星状树 D:全部序列合并完后,即整个循环直到只剩下一个类为止,画出进化树 E:然后将两个序列作为聚合群与其他序列分离开来,再算总枝长
    AI参考:正确选项为:ADE解析如下:A. 邻接法构树过程,通常沿着各个分枝累加特征变化的数目,建立各个分枝间的联系。B. 在邻接法构树过程中,一般采用“分而治之”的思想,即在合并过程中寻找最优合并方式,而非最短的枝长。但题目中也提到“使算出的总枝长在各种合并方式中是最短的”,因此选项B也有一定道理。C. 在邻接法构树过程中,首先需要将序列构建成一棵星状树,即将各个序列视为不同的节点,并根据序列之间的距离构建边。但这并非构建进化树的前提条件。D. 在邻接法构树完成后,需要画出进化树,通常通过选择不同的分支进行合并或分割,以达到最优的进化树结构。因此选项D是正确的。E. 在邻接法构树过程中,将两个序列作为聚合群与其他序列分离开来,是常见的处理方式之一。通过将相似或相关的序列聚合在一起,可以提高进化树的清晰度和准确性。然后,再算总枝长。综上所述,正确选项为ADE。其他选项与邻接法构树过程的主要步骤和思想不完全相符。'
  49. β 折叠的结构特征为( )

  50. A:多肽链 180°回折时的转角上 B:侧链基团分别交替位于片层的上、下方 C:若干条肽链或肽段平行或反平行排列成片 D:主链骨架围绕中心轴盘绕形成右手螺旋 E:所有肽键的 C—O 和 N—H 形成链间氢键
    AI参考:正确选项为:B,C,E。β折叠的结构特征为:若干条肽链或肽段平行或反平行排列成片,侧链基团分别交替位于片层的上、下方,所有肽键的C—O和N—H形成链间氢键。选项A和D描述的是转角和螺旋结构,与β折叠的结构特征不符。选项B和C描述了β折叠的平行或反平行排列的特征。因此,正确选项为B、C和E。'
  51. 下面序列哪些为反向重复序列( )

  52. A:…GCACTAGCTAGCGG… …CGTGATCGATCGCC… B:…GCACTTG--CAAGTGC… …CGTGAAC…GTTCACG… C:…GCACTTGCAAGTGC… …CGTGAACGTTCACG… D:…GCACTTG…GCACTTG… …CGTGAAC…CGTGAAC…
    AI参考:正确选项为C:…GCACTTGCAAGTGC… …CGTGAACGTTCACG…。反向重复序列通常由两个或多个连续的、互补的核苷酸序列组成,其中包含一个或多个终止密码子,通常用于转录终止和RNA剪接。选项C中的序列符合反向重复序列的特征,即包含两个连续的互补序列,且最后一个碱基为终止密码子。其他选项中不包含反向重复序列的特征。'
  53. 下列哪些分子类型属于非蛋白质编码区( )

  54. A:伪基因 B:增强子 C:内含子 D:启动子 E:卫星 DNA
    AI参考:正确选项为:A:伪基因;B:增强子;E:卫星 DNA。 非蛋白质编码区包括: 1. 伪基因(Pseudo-genes):是基因在基因组中发生重复和突变后形成的非功能基因,通常不编码蛋白质。 2. 增强子(Enhancers):是一种调控序列,它可以使某个基因的转录水平上调,对其他基因起调节作用。 3. 卫星DNA(Satellite DNA):是一类高度重复序列的DNA,主要存在于真核生物染色体臂的末端,通常是作为调控元件用于控制染色体的结构或形状。 此外,内含子(Introns)和启动子(Promoters)属于转录调控区,编码蛋白质的基因区段通常不会包含内含子和启动子。因此,选项C和D不属于非蛋白质编码区。"
  55. 以下说法正确的是( )

  56. A:BLOSAM矩阵后缀数字越小,处理进化上距离近的蛋白质序列效果越差。 B:PAM矩阵后缀数字越小,处理进化上距离远的蛋白质序列效果越好 C:BLOSAM矩阵后缀数字越大,处理进化上距离近的蛋白质序列效果越好。 D:PAM矩阵后缀数字越大,处理进化上距离远的蛋白质序列效果越好 E:BLOSAM矩阵后缀数字越大,处理进化上距离近的蛋白质序列效果越差。
    AI参考:正确选项是【C:BLOSAM矩阵后缀数字越大,处理进化上距离近的蛋白质序列效果越好;D:PAM矩阵后缀数字越大,处理进化上距离远的蛋白质序列效果越好】。BLOSAM矩阵和PAM矩阵都是用于蛋白质序列比对的方法,其中后缀数字越大,表示在处理进化上距离远的蛋白质序列时效果越好。对于BLOSAM矩阵,后缀数字越小,表示处理进化上距离近的蛋白质序列效果越好。因此,选项C和D是正确的。而其他选项中的说法都是不准确的。'
  57. 根据比对的序列数量( )

  58. A:双序列比对 B:多重比对 C:全局比对 D:局部比对 E:多序列比对
    AI参考:正确选项是【E:多序列比对】。多序列比对是指对多个序列进行比对的过程,通常用于蛋白质序列的分析和比较。与其他选项相比,多序列比对更加复杂,因为它需要考虑多个序列之间的相似性和差异性,而不仅仅是单个序列之间的比较。因此,选项E是多序列比对的正确答案。其他选项中,双序列比对、多重比对、全局比对和局部比对都涉及到了序列比对,但与多序列比对相比,它们的范围和复杂性有所不同。'
  59. 串联重复序列包括( )

  60. A:小卫星序列 B:转录因子 C:微卫星序列 D:卫星序列 E:转座元件

  61. 编码区包括( )

  62. A:增强子 B:外显子 C:内含子 D:沉默子 E:启动子

  63. DNA甲基化测序方法按原理可以分成( )

  64. A:重亚硫酸盐测序 B:基于限制性内切酶的测序 C:化学降解法测序 D:靶向富集甲基化位点测序 E:焦磷酸测序
    AI参考:正确选项为【ABCE】。DNA甲基化测序方法按原理可以分成:基于限制性内切酶的测序、重亚硫酸盐测序、化学降解法测序、焦磷酸测序。其中靶向富集甲基化位点测序是一种特异性的甲基化测序方法,但不是按原理划分的分类项。'
  65. 蛋白质编码基因组成特征( )

  66. A:高 GC 含量 B:碱基出现周期 C:密码子组成 D:核糖体结合位点 E:六联核苷酸组成
    AI参考:正确选项为【BCDE】蛋白质编码基因组成特征包括:碱基出现周期、六联核苷酸组成、密码子组成、核糖体结合位点以及高GC含量。其中,碱基出现周期和六联核苷酸组成是基因序列的基本特征,而密码子组成、核糖体结合位点和GC含量则与蛋白质编码基因的编码效率、转录效率和翻译效率等有关。因此,选项BCDE都是正确的。'
  67. 折叠识别预测的软件有( )

  68. A:Fugue B:FFAS03 C:Phyre D:Fort E:Inub
    AI参考:正确选项为:A:Fugue C:PhyreFugue是一款基于深度学习的折叠识别预测软件,可以用于语音识别和语音合成。FFAS03是一款基于隐马尔科夫模型的语音识别软件,虽然也支持折叠识别预测,但是它并不专攻于折叠识别预测。Phyre是一款基于深度学习的语音识别软件,也支持折叠识别预测。Inub和Fort不是专门用于折叠识别预测的软件。因此,答案为A和C。'
  69. 比对软件中,比对速度:Muscle>MAFFT> Clustal W>T-Coffee,准确性:MAFFT>Muscle>T-Coffee> Clustal W。( )

  70. A:错 B:对
    AI参考:正确答案是B:对。 根据题目描述,比对速度的顺序是Muscle>MAFFT> Clustal W>T-Coffee,准确性是MAFFT>Muscle>T-Coffee> Clustal W,因此可以得出结论,这个判断题是正确的,即B选项为正确答案。"
  71. 发展新的数理和信息科学的技术和方法用于管理和分析生物数据主要是生物工作者,BioTech, BT人士。( )

  72. A:对 B:错
    AI参考:答案:B:错。 生物工作者主要关注生物数据的管理和分析,而新的数理和信息科学的技术和方法主要用于管理和分析各种类型的数据,不仅仅是生物数据。因此,发展新的数理和信息科学的技术和方法用于管理和分析生物数据不仅仅是生物工作者的任务,而是多个领域的工作人员的任务。"
  73. 相似性是一种很直接的数量关系,无需实验验证。( )

  74. A:错 B:对

  75. ORF一定就是CDS。( )

  76. A:对 B:错
    AI参考:B 错ORF通常是指编码区,也即可以转录和翻译产生蛋白质的部分。CDS是蛋白编码区,通常指的是经过剪接修饰后的mRNA序列。因此,ORF并不一定就是CDS,还需要经过进一步的剪接修饰才能确定。所以这个判断题是错误的。"
  77. 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,C值越大,这是真核生物基因组的特点之一。( )

  78. A:错 B:对
    AI参考:答案是B:对。 根据生物学的知识,生物体的结构和功能越复杂的种类需要的基因也越多,这是真核生物基因组的特点之一。因此,选项B是正确的。而选项A是错误的,不需要分析。"
  79. 目前应用于基因芯片表达数据统计分析的主要方法是聚类分析。( )

  80. A:对 B:错

  81. 在哺乳动物中,甲基化一般发生在CpG的胞嘧啶3位碳原子上。( )

  82. A:对 B:错
    AI参考:答案是B:错。甲基化是指在DNA或RNA甲基转移酶的催化下,在CpG二核苷酸中的胞嘧啶的5位碳原子上添加一个甲基基团的过程。因此,甲基化通常发生在CpG的胞嘧啶5位碳原子上,而不是3位碳原子上。"
  83. RFLP是 DNA多态性中最多见的一种,它产生的机制包括DNA分子产生突变,使某些酶切位点数增加。( )

  84. A:错 B:对
    AI参考:答案是B:对。 RFLP(限制性片段长度多态性)是DNA多态性中最多见的一种,它产生的机制包括DNA分子产生突变,使某些酶切位点数增加。因此,这个判断题是正确的。"
  85. 第三代测序总体上单读长的错误率依然偏高,成为限制其商业应用开展的重要原因。( )

  86. A:对 B:错
    AI参考:答案:B:错。 第三代测序技术的错误率已经大大降低,已经可以满足商业应用的需求。因此,选项中的说法是错误的。"
  87. 柔性对接方法计算量相对较小,适合处理多数蛋白质结合的问题。( )

  88. A:错 B:对
    AI参考:答案:B:对。 柔性对接方法可以处理多数蛋白质结合的问题,因为它计算量相对较小,适合处理大规模数据。柔性对接方法通过模拟蛋白质分子与配体分子之间的相互作用,可以更好地模拟蛋白质与配体之间的结合过程,从而为药物设计提供更准确的数据支持。因此,柔性对接方法在蛋白质对接领域中得到了广泛应用。"
  89. HTGS是指高通量基因组序列( )。

  90. A:对 B:错
    AI参考:HTGS是指高通量基因组序列,因此答案为A:对。"
  91. Illumina Genome Analyzer测序时如果被测序片段中含有几个连续的相同碱基,在测序时就会连续发出同样的光信号,由于没有终止的原件来终止反应,信号会不断发出,这样就无法得知究竟有多少重复碱基。( )

  92. A:错 B:对
    AI参考:答案是B:对。 Illumina Genome Analyzer测序是一种高通量测序技术,其原理是通过碱基的互补配对原则将DNA片段进行测序。如果被测序片段中含有几个连续的相同碱基,在测序时,由于没有终止的原件来终止反应,信号会不断发出,但这并不意味着无法得知究竟有多少重复碱基。实际上,测序仪能够通过计算连续发出光信号的次数来估计重复碱基的数量。因此,这个说法是错误的,正确答案为B选项。"
  93. 中国学者解析维持血糖平衡重要蛋白结构,发现虽然只含12个氨基酸,但这个连接肽却发挥着如此重要的作用,有助于糖尿病新药研发。( )

  94. A:错 B:对
    AI参考:答案是B:对。 根据题干中的描述,中国学者解析了维持血糖平衡的重要蛋白结构,发现这个连接肽虽然只含12个氨基酸,但发挥着重要的作用,有助于糖尿病新药研发。因此,答案为B,即“对”。"
  95. 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以不同。( )

  96. A:对 B:错

  97. 蛋白质基序中[ST]的含义是除掉S和T之外的任意氨基酸。( )

  98. A:对 B:错
    AI参考:蛋白质基序中[ST]的含义是“疏水”的缩写,表示该位置应该填充疏水的氨基酸,而非除掉S和T之外的任意氨基酸。因此,这个判断题是错误的。B选项“错”是正确的答案。"

温馨提示支付 ¥1.00 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部