山东第一医科大学
  1. 简述什么是序列比对和序列比对的基本原理?


  2. 答案:序列比对是指将两个或多个生物学序列(如DNA、RNA、蛋白质序列)按照一定的规则排列,以标识它们之间的相似性、差异性和可能的同源关系。在比对过程中,相同或相似的分子单元(如核苷酸或氨基酸)被排列在同一位置上,而差异则通过错配、插入或缺失来表示。序列比对结果通常以对齐的形式呈现,其中对应位置的匹配项、替代(突变)、插入和删除(空位)清晰可见。 序列比对的基本原理基于以下几点: 1. **进化保守性**:生物序列在长期演化过程中,尽管会积累变异,但具有重要生物学功能的区域往往相对稳定,表现为不同物种间的同源序列具有高度相似性。序列比对就是通过识别这种相似性来推断序列间的亲缘关系和功能一致性。 2. **字符匹配原则**:比对过程遵循字符匹配规则,即比较序列中的每个分子单元(如A、T、C、G对于DNA,或特定氨基酸对于蛋白质)是否在对应位置上相同或相似(考虑氨基酸的化学性质或结构相似性)。匹配程度可以量化为相似性得分或通过替换矩阵(如PAM或BLOSUM)计算。 3. **优化准则**:比对算法采用特定的优化准则(如全局比对的Needleman-Wunsch算法、局部比对的Smith-Waterman算法)来寻找最优的对齐路径,该路径在考虑到匹配得分、罚分(对错配、插入、删除的惩罚)的基础上,最大化整体比对得分。这些算法确保比对结果不仅反映直接的字符匹配,还考虑了生物学上合理的变异模式。 4. **统计显著性**:在大规模数据库搜索中,如使用BLAST算法,序列比对结合了快速过滤和精确比对步骤,以确定查询序列与数据库中序列之间的显著相似性。这涉及到E-value等统计指标,用于评估比对结果的随机性,确保找到的是真正的生物学关联而非偶然巧合。 综上所述,序列比对是一种通过比较分子序列的字符组成、应用优化算法并考虑进化保守性和统计显著性,以揭示序列之间结构、功能关系及进化联系的方法。
  3. FASTA格式


  4. 答案:上条序列的结束###本条序列的开始
  5. 基因组与基因组学及其研究内容?


  6. 答案:基因组:生物体内所有遗传物质的总和,包括其DNA序列以及相关的非编码RNA序列,通常指一个物种的单倍体细胞中全套染色体所包含的遗传信息。 基因组学:一门研究生物基因组结构、组成、存在方式、表达调控模式、基因功能及其相互作用的学科,旨在全面表征和量化一个生物体的所有基因,并探究这些基因之间的关系及其对生物体性状的影响。研究内容包括基因组测序、组装、功能基因组学、结构基因组学、基因表达调控、基因间相互作用(如上位性、多效性、杂种优势等),以及基因组内基因座和等位基因间的交互作用等。
  7. 生物信息学涉及的生物大分子信息有哪些?


  8. 答案:DNA、RNA、蛋白质
  9. 维系蛋白质分子空间结构的作用力包括:____、____、____和____。


  10. 答案:二硫键
  11. NCBI维护的文献摘要数据库是____。


  12. 答案:PubMed
  13. 序列比对动态规划算法有:____和____


  14. 答案:全局比对、局部比对
  15. PCR实验时需要自己设计一对____。


  16. 答案:引物
  17. 英国博物学家达尔文于____年发表了____一书。


  18. 答案:《物种起源》
  19. 全局序列比对软件有:____等。

  20. 基因组测序的基本策略有:____和____。

  21. ORF finder是预测查询序列中____的软件。

  22. 1970年Needleman和Wunsch提出了著名的____,是生物信息学的重要贡献。

  23. 数据库常用的检索工具有:____和____。

  24. 序列相似就一定是同源序列。( )

  25. A:对 B:错
  26. 序列比对时打分矩阵可以随意选择。( )

  27. A:对 B:错
  28. 进化树构建可以使用Bootstrap进行统计检验。( )

  29. A:错 B:对
  30. 蛋白质结构改变可能会不影响蛋白功能。( )

  31. A:错 B:对
  32. fasta文件的第一行以“>”开头,第二行开始才是序列。( )

  33. A:错 B:对
  34. NJ法是利用序列之间的相似程度进行进化树构建。( )

  35. A:对 B:错
  36. blast程序不能进行两个序列间的比较。( )

  37. A:对 B:错
  38. 等电聚焦电泳利用了氨基酸是两性分子。( )

  39. A:错 B:对
  40. DDBJ是日本维护的核酸序列数据库库,是亚洲唯一的核酸序列数据库。( ) 注:我们现在也有数据库

  41. A:错 B:对
  42. 物种的C值和它进化的复杂性之间有对应关系,但是也不是完全一致。( )

  43. A:错 B:对
  44. 基因本体数据库是GO组织构建的一个结构化的标准生物学模型,建立基因及其产物知识的标准词汇体系,涵盖了基因的哪些方面( )① 细胞组分(cellular component) ② 分子功能(molecular function) ③ 生物学过程(biological process) ④ KEGG ⑤ Protein-protein相互作用

  45. A:②③④⑤
    B:①③④⑤ C:①②③ D:①②⑤
  46. 三大核酸数据库美间隔多长时间就相互交换数据库数据( )

  47. A:每小时 B:每天 C:10天 D:一个月
  48. Illumina公司测序数据raw reads的格式的是( )

  49. A:FASTA B:ab1 C:FASTQ D:seq
  50. 利用基因组重测序不可以用来( )

  51. A:拼接转录组
    B:遗传突变诊断
    C:进行GWAS分析
    D:检测个体差异
  52. fastq数据中每一条记录有多少行?( )

  53. A:4
    B:2 C:3 D:1
  54. 二代测序技术不包括( )

  55. A:ABI公司SOLiD测序技术
    B:Roche 454焦磷酸测序技术
    C:桑格尔荧光测序法 D:Illumina的Solexa边合成边测序
  56. 不属于Perl语言特点的是( )

  57. A:用于高效的文本处理过程,具有模式匹配和文件处理的功能
    B:支持正则表达式引擎
    C:是一种解释型语言(脚本语言)
    D:程序运行需要预编译
  58. 长度为N的序列,所有可能的长度为K的子序列数量为( )。

  59. A:N-K+1
    B:N+1
    C:N-K
    D:N
  60. 下列数据库中不能用来搜索核酸序列( )

  61. A:EMBL B:PDB C:GenBank D:DDBJ
  62. 序列比对算法不包括( )。

  63. A:点阵法
    B:动态规划算法(the dynamic programming method)
    C:词或者K串法(BLAST)
    D:冒泡排序法
  64. 通过哪个软件可以预测序列中是否含有CpG岛( )

  65. A:CpG plot B:SWISS-MODEL C:ORF Finder D:Dock
  66. 下列哪个是一代测序仪包括( )

  67. A:Illumina公司Solexa基因组分析仪
    B:ABI3730XL荧光自动测序仪
    C:ABI公司的SOLiD测序仪
    D:Roche公司454测序仪
  68. 文献信息数据库不包括( )

  69. A:知网 B:百度文库 C:PubMed D:Web of Science
  70. 下列可以产生生物信息的分子类型的是( )① DNA ② RNA ③ Protein ④ 代谢物 ⑤ 脂类分子

  71. A:①②③④⑤ B:①③④⑤ C:②③④⑤
    D:①②③⑤
  72. fastq是哪个测序仪产出的数据格式为( )

  73. A:SOLiD测序
    B:Roche 454
    C:毛细管电泳测序
    D:Illumina公司Solexa基因组分析仪
  74. 林华安 博士获得哪个学科之父称谓( )

  75. A:农学
    B:分子生物学 C:生物信息学 D:遗传学
  76. 桑格尔对DNA测序技术提出的是( )方法。

  77. A:双脱氧链终止法
    B:桥式PCR
    C:焦磷酸测序技术
    D:利用单分子测序
  78. PDB是蛋白质的( )

  79. A:核酸数据库 B:模体数据库
    C:结构数据库 D:分类数据库
  80. 真核生物基因组特点不包括:( )

  81. A:有内含子
    B:有的有CpG岛
    C:基因有很长的连续ORF
    D:基因组巨大,序列复杂,有很多重复序列
  82. 下列哪位获得“生物信息学之父”称谓( )

  83. A:摩尔根 B:克里克
    C:孟德尔 D:林华安 博士

温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部