生物信息学解题技巧

合集下载

生物信息学中的基因序列分析方法与技巧

生物信息学中的基因序列分析方法与技巧生物信息学是研究生物学数据的存储、检索、分析和解释的学科领域，其中基因序列分析是生物信息学的重要组成部分。

基因序列分析帮助科学家理解基因的组成和功能，并揭示生物体内的生物学过程。

在本文中，我们将介绍生物信息学中常用的基因序列分析方法和技巧。

1. 基因序列获取和处理在进行基因序列分析之前，我们首先需要获取正确的基因序列。

这可以通过多种方式来实现，例如从数据库中下载已知的基因序列，使用测序技术获得新的基因序列，或者通过在线工具从物种基因组中提取基因序列。

获取基因序列后，我们需要对其进行处理。

最常见的处理方式是去除序列中的空白字符和特殊字符，并将所有字母转换为大写或小写，以确保一致性和准确性。

此外，还可以利用生物信息学软件和工具进行序列长度修剪、质量评估和碱基配对修正等操作。

2. 序列比对和比对工具基因序列比对是将一个或多个基因序列与参考序列进行比较的过程，以便确定它们的相似性和差异性。

这对于研究基因组结构和功能非常重要。

目前，有许多比对工具可供选择，包括BLAST（Basic Local Alignment Search Tool）、Clustal Omega、Bowtie和BWA（Burrows-Wheeler Aligner）等。

BLAST 是最常用的工具之一，它可以在数据库中快速搜索相似的序列并进行比对。

Clustal Omega可以用于多序列比对，它可以同时比对多个序列并生成序列间的进化树。

Bowtie和BWA则主要用于高通量测序数据的比对。

3. 寻找开放阅读框（ORFs）开放阅读框是基因序列中的编码区域，通常由起始密码子（通常是ATG）和终止密码子（TAA，TAG或TGA）组成。

通过寻找ORFs，科学家可以确定基因的位置和可能的编码蛋白质序列。

在寻找ORFs时，可以使用生物信息学工具，如ORFfinder或EMBOSS中的getorf函数。

这些工具可以自动确定基因序列中的ORFs，并提供基因的位置、长度和推测的蛋白质序列。

高三生物信息题的解题方法与技巧PPT学习教案

第26页/共43页
[变式题]知识迁移能力和逻辑推理能力训练
现用体重等方面大体相同的三组兔子进行实验。将含有放射性碘的注射液注射到A、B、C三组兔子的体内，然后，定时测定兔子甲状腺的放射量。 4d后，进行第二次
注射，向A组兔子注射无放射性的甲状腺激素，向B组兔子注射无放射性的促甲状腺激素，向C组兔子注射生理盐水，实验结果如图所示。对于第二次注射后，三组兔子甲状腺的放射量速率下降不同的原因下列说法不正确的是
化碳的浓度变化影响暗反应中二氧化碳的固定，从而影响三碳化合物的产量。三
碳化合物的产量影响有机物的合成。
3、温度：温度通过影响酶的催化效率2来、影底响物光浓合度作对用酶。催作化为速复度杂的的影化响学反应，光合作用需要大量的酶进行催化，温度3的、适氧当浓提度高对可呼以吸大速幅率度的提影高响酶的催化效率
A．若a点在a，b点b2时 B．若a点在a1，b点在b1时 C．若a点在a2，b点在b1时 D．若a点在a1，b点在b2时
D
第5页/共43页
③述线是根本。如2004年高考上海卷第34题（3）小题：
例3 胰蛋白酶作用于一定量的某种物质（底物），温度保持 37℃，pH保持在最适值，生成
水（平1，物请）这在量回是14因与答0为分反下钟后应列，时问曲线间题变。关：成系如下图，
5
6
1
23
4
5
6
7 8 9 10 系谱丙（基因用C、c表示）
7 8 9 10 系谱丁（基因用D、d表示）
A．系谱甲为常染色体显性遗传，系谱乙为X染色体显性遗传，系谱丙为X染色体隐性遗传，系谱丁为常染色体隐性遗传 B．系谱甲为常染色体显性遗传，系谱乙为X染色体显性遗传，系谱丙为常染色体隐性遗传，系谱丁为X染色体隐性遗传 C．系谱甲—2基因型Aa，系谱乙—2基因型XBXb，系谱丙—8基因型Cc，系谱丁—9基因型XDXd， D．系谱甲—5基因型Aa，系谱乙—9基因型XBXb，系谱丙—6基因型cc，系谱丁—6基因型XDXd

(高考生物)浅谈生物信息题解题策略与技巧

（生物科技行业）浅谈生物信息题解题策略与技巧浅谈生物信息题解题策略与技巧阳羡高级中学屠菊芬胡振杰21420708.10生物科考试说明对学生的能力要求，其中之一就是“获取信息的能力”。

即要求学生会鉴别、选择试题中给出的相关生物学信息，结合所学知识解决相关的生物学问题，并且关注具有重大意义的生物学新进展。

根据这一要求拟定的试题，常常会在题中给考生一个新的问题情境，使考生在新问题情境中应用他们所学到的生物学知识或原理来解决这一问题。

这类题目能更多地体现出生物高考“既遵循大纲，又不拘泥于大纲”的指导思想，着重考查考生对生物学知识深入理解和灵活运用的情况。

在近几年的高考题中，材料信息题频频出现，成为高考题中一道靓丽的风景。

那么，材料信息题究竟有怎样的特点?考生在解答这类题时有哪些策略和技巧呢？一、材料信息题的特点（1）题材新，知识活创设情景的题材一般取材较新,富有时代气息,材料信息主要来自科技、社会、环保等热点问题，涉及一些学科或社会热点知识。

考生必须对新情景进行认真的分析、归纳，通过检索旧知识，吸纳新知识，探索出试题设置的实际问题与中学基础知识的相似点，从而将所学知识迁移到新情景中去。

（2）起点高，落点低信息题的命题多取材于重大的生物学成果或经典的生物学实验，也有可能是大学知识的选摘，富有时代气息。

这些材料都是考生所不熟悉的，即材料的“起点高”。

但是，不管是多么新颖的材料，其解决问题的知识，始终在我们的课本中，即落点低”。

比如癌症、艾滋病、毒品、兴奋剂等素材，其知识落点一般是我们高中课本中的“癌症的发病机理、癌细胞的特征”等等；艾滋病材料的知识落点一般为病毒的特征、艾滋病的发病机理以及免疫方面的知识；可持续发展一般与课本中的生态系统的结构、稳态、调节等知识点联系；而生物高科技材料则一般与“DNA分子结构、遗传和变异、生殖方式”等知识点联系。

一般情况下，新颖的材料只为了引出需要考查的具体知识。

（3）即时学，即时用正因为信息题创设的情景新，所问的问题课本中并没有涉及，在这种情况下，问题的答案一般会隐藏在材料之中，这就要求考生现学现用，迅速捕捉信息并且利用信息。

高考生物信息题的解法

高考生物信息题的解法资料信息题是《理科综合能力测试》中的主要题型之一，无论选择题和供答题中，凡是以研究性资料为命题材料的题目均属于资料信息类。

这类题目通常是以现代科技、日常生活、社会或生产实际中的某个事件为命题材料，用文字、数据、图表、图形、图线等形式向学生提供资料信息，学生通过分析和处理信息把握事件呈现的特征，进而选择或提供有关问题的答案。

因此，资料信息题的结构主要是由"事件、信息、问题"三部分组成的。

其命题特点是：信息新，考查知识点低，考查能力高，考查知识面广，解题方法巧。

资料信息题适用于考查学生收集和处理科学信息的能力、获取新知识的能力、分析和解决问题的能力。

由信息资料构建的问题情境，对学生来说，为半新半旧或全新的情境，这样的问题情境对于考查学生理解信息、处理信息和运用信息的能力，尤其是考查学生的综合应用能力是十分有效的。

解题难度大，因为这类题目不仅要考查学生思维的结果，而且要考查学生思维的过程，往往依据资料信息提出一组相关的问题，解答这组问题会涉及多个知识点。

这类题的一般解题思路是：阅读资料、理解信息；整合信息、抓住关键；运用信息、组织答案。

例题：植物的新陈代谢受外部环境因子（如阳光，温度）和内部因子（如激素）的影响，研究内外因子对植物生命活动的影响真有重要意义：下图表示野外松树（阳生植物）光合作用强度与光照强度的关系。

其中的纵坐标表示松树整体表现出的吸收CO2和释放CO2量的状况。

请分析回答：（1）当光照强度为B时，光合作用强度。

（2）光照强度为A时，光合作用吸收CO2的量等于呼吸作用放出的CO2的量。

如果白天光照强度较长时间为A，植物能不能正常生长？为什么？（3）如果该曲线绘为人参（阴生植物）光照强度与光合作用的强度关系的曲线，B点的位置应如何移动？为什么？事件：影响光合作用的外界因素信息类型：松的光合强度与光照强度关系的曲线图-光饱和点与光补偿点问题：识别光饱和现象，推断植物生活的最低光照强度，阐明人参的光饱和点题干的文字信息，明确题目中提供的X-Y关系图表示阳生植物（松）的光合强度与光照强度的关系，因此，该题的知识载体是光照对光合作用的影响。

生物信息学中的注意事项及常见问题解答

生物信息学中的注意事项及常见问题解答生物信息学是一门综合性学科，综合了生物学、计算机科学和统计学等多个学科的知识，用于处理和分析生物学数据以及解决生物学问题。

在生物信息学研究中，因为涉及到数据量大、计算复杂等特点，有一些注意事项和常见问题需要我们了解和解决。

本文将针对生物信息学中的注意事项和常见问题进行解答。

注意事项：1. 数据的质量控制与预处理：生物信息学中的数据往往来源于高通量测序技术，如基因测序和转录组测序等。

因此，在使用这些数据之前，首先需要对数据进行质量控制和预处理。

质量控制可以通过评估序列的准确性、读长和测序深度等指标来完成。

预处理包括去除低质量序列、去除接头污染以及对序列进行剪切、切割和整合等操作。

2. 数据库的选择和使用：在生物信息学中，有许多数据库可供选择，如NCBI、Ensembl和UniProt等。

选择适合自己研究需要的数据库是至关重要的。

此外，了解数据库中的数据结构和查询语言，如SQL或API的使用，也是必要的技能。

3. 多样性和差异性的处理：生物信息学中常常需要处理多样性和差异性的数据。

例如，转录组测序数据可用于比较不同组织、不同时间点或不同实验条件下的基因表达模式差异。

在处理这些数据时，需要进行差异表达基因分析、聚类分析和功能富集分析等。

因此，了解不同的分析方法和统计学原理是非常重要的。

4. 算法和工具的选择：生物信息学中有许多用于数据分析和处理的算法和工具。

在选择算法和工具时，需要根据数据类型和研究问题的特定要求进行选择。

同时，要对常用的数据分析软件和脚本语言，如R或Python等进行熟练掌握。

常见问题解答：1. 如何处理缺失数据？在生物信息学中，数据的缺失是一个常见的问题。

对于小规模的数据集，可以使用插值方法进行填充，如均值、中位数或最近邻法。

对于大规模的数据集，可以使用机器学习算法进行预测和填充。

2. 如何对转录组数据进行差异表达分析？差异表达分析是转录组数据分析中最常见的任务之一。

生物信息学算法的使用教程

生物信息学算法的使用教程生物信息学算法是指应用计算机科学和统计学的方法来解决生物学问题的一类算法。

其主要目标是通过收集、存储和分析生物学数据，从中提取有意义的信息。

生物信息学算法在基因组学、转录组学、蛋白质组学等领域发挥着重要作用，帮助科学家们更好地理解生命现象和人类疾病。

本文将介绍几种常用的生物信息学算法，包括序列比对、基因预测、蛋白质结构预测和系统生物学分析，帮助读者了解这些算法的原理和使用方法。

1. 序列比对算法序列比对算法是生物信息学中最常用的算法之一，用于比较两个或多个生物序列的相似性。

这些序列可以是DNA序列、RNA序列或蛋白质序列。

其中，最常见的算法是Smith-Waterman算法和Needleman-Wunsch算法。

Smith-Waterman算法是一种动态规划算法，通过寻找一个最优的局部序列比对。

该算法可以用于比对相似的序列片段，从而发现具有功能相似性的区域。

Needleman-Wunsch算法是一种全局序列比对算法，帮助比对整个序列。

该算法可以用于比对不同物种之间的序列，以及预测序列间的进化关系。

2. 基因预测算法基因预测算法是用于预测DNA序列中的基因位置和结构的算法。

这些算法主要基于类似于启动子、剪接位点、终止子等信号序列的模式识别。

常见的基因预测算法有基于统计模型的算法（如Glimmer和GeneMark）和基于机器学习的算法（如SVM和随机森林）。

这些算法能够从原始DNA序列中识别出编码基因的位置和边界，对基因功能的研究具有重要意义。

3. 蛋白质结构预测算法蛋白质结构预测算法是用于预测蛋白质的三维立体结构的算法。

蛋白质的结构决定了它的功能，因此预测蛋白质结构对于理解蛋白质功能至关重要。

常用的蛋白质结构预测算法有模板比对、序列相似性、碳氮化合物二次结构预测等。

模板比对算法通过比对蛋白质序列与已知的结构相似的模板蛋白质，来预测目标蛋白质的结构。

序列相似性算法将目标蛋白质序列与已知的蛋白质序列比较，从类似的序列中推断出目标蛋白质的结构。

生物信息学分析方法

生物信息学分析方法生物信息学是一门综合应用信息学、生物学和统计学等相关知识和技术的学科，旨在通过利用计算机和信息技术处理和分析生物学数据，揭示生物系统的结构和功能，并解决生物学研究中的问题。

生物信息学分析方法主要包括序列比对、基因预测、蛋白质结构与功能预测、基因表达谱分析、基因调控网络构建和演化分析等。

以下将对其中几种常见的生物信息学分析方法进行详细介绍。

1. 序列比对：序列比对是生物信息学中最基本、最常用的方法之一、通过将待比对的序列与已知数据库中的序列进行比对，可以判断序列的相似性和进化关系，从而推断序列的功能和结构。

序列比对方法主要包括全局比对、局部比对和多序列比对等。

常用的序列比对工具有BLAST、ClustalW等。

2.基因预测：基因预测是指通过对DNA序列进行分析和预测，确定其中的基因位置和结构。

基因预测方法主要包括基于序列、基于比对和基于表达等方法。

其中，基于序列的方法依据基因的核苷酸组成、序列保守性和启动子顺应性等特征进行预测；基于比对的方法通过将待预测序列与已知基因进行比对，从而确定基因位置和结构；基于表达的方法则通过分析基因的表达模式和转录组数据，推断基因的存在和功能。

3.蛋白质结构与功能预测：蛋白质结构与功能预测是指通过分析蛋白质序列和结构，预测其二级结构、三级结构和功能。

蛋白质结构预测方法主要包括同源建模、蛋白质折叠动力学和序列匹配等方法。

同源建模是最常用的蛋白质结构预测方法，其基本原理是通过将待预测蛋白质序列与已知结构的同源蛋白质进行比对，并从中找到最佳匹配。

蛋白质功能预测方法主要包括结构域分析、功能域预测和功能注释等方法。

4.基因表达谱分析：基因表达谱分析是通过对基因在不同组织或条件下的表达水平进行比较和分析，揭示基因在生物体内的功能和调控机制。

常见的基因表达谱分析方法有RT-PCR、微阵列和高通量测序等。

RT-PCR是一种常用的基因表达定量方法，可以通过测定特定基因在RNA水平的表达量推断基因的转录水平；微阵列技术则可以同时检测数千个基因的表达水平，从而了解基因在不同组织和条件下的表达情况；高通量测序技术可以对整个转录组进行测序，从而揭示基因的全局表达谱。

基因测序中的生物信息学分析技巧

基因测序中的生物信息学分析技巧基因测序是通过测定DNA或RNA序列来研究生物基因信息的一种方法，而生物信息学则是用于处理和分析测序数据的学科。

生物信息学的发展迅猛，为研究人员提供了更多的工具和技巧来分析基因测序数据。

在本文中，我们将探讨基因测序中的生物信息学分析技巧。

1. 序列比对和比对算法序列比对是生物信息学中最常用的分析任务之一。

它可以将测序的DNA或RNA序列与已知序列进行比对，以确定相似性和差异性。

比对算法有很多种，最常用的是Smith-Waterman算法和BLAST算法。

Smith-Waterman算法是一种精确比对算法，适用于小片段或特定区域的比对。

BLAST算法则是一种启发式比对算法，能够快速地在大型数据库中搜索相似序列。

研究人员在进行序列比对时，可以根据具体需求选择合适的比对算法。

2. 基因组装和组装算法基因组装是将测序数据中的短序列片段组合成完整的基因组序列的过程。

组装算法根据序列片段之间的共有特征，通过寻找重叠区域和重复序列来将它们组合起来。

最常用的组装算法是重叠布局和de Bruijn图算法。

重叠布局方法基于序列片段之间的重叠关系来组装基因组，而de Bruijn图方法则将序列分成短k-mer序列，通过生成图形来组装基因组。

不同的算法有不同的适用范围和复杂度，研究人员需要结合实际情况选择合适的组装算法。

3. 基因表达分析基因测序可以帮助研究人员了解基因在不同条件下的表达情况。

基因表达分析主要包括差异表达分析和功能注释。

差异表达分析用于比较不同样本组的基因表达水平，以寻找差异表达的基因。

功能注释则是根据已知的基因信息和功能数据库，对差异表达基因进行功能分析，以了解其潜在的生物学功能。

常用的差异表达分析方法包括DESeq2和edgeR，而功能注释则可以利用GO和KEGG数据库等工具进行。

4. RNA-Seq分析RNA-Seq是一种用于测量和分析转录组的方法。

它通过将RNA转录为cDNA，并进行测序，来研究基因的转录水平、可变剪接以及新基因的发现等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

该序列对应的蛋白质具有什么样的保守功能结构域？
FAD_bind
【MGVNAVHWFRKGLRLHDNPALKECIQGADTIRCVYILDPWFAGSSNVGINRWRFLLQCLEDLDANLRKLNSRLFVIRGQPADVFPRLFKEWNITKL ing_7
SIEYDSEPFGKERDAAIKKLATEAGVEVIVRISHTLYDLDKIIELNGGQPPLTYKRFQTLISKMEPLEIPVETITSEVIEKCTTPLSDDHDEKYGVPSLEELGFDT
TGGACGTTCTAAATGAGGTAGATGAATATTCTGGTTCTTCAGAGAAAATAGACTTACTGGCCAGTGATCCTCATGAGGCTTTAATATGTAAAAGT GAAAGAGTTCACTCCAAATCAGTAGAGAGTAATATTGAAGACAAAATATTTGGGAAAACCTATCGGAAGAAGGCAAGCCTCCCCAACTTAAGC
某天，你在实验中发现一个有趣的表型，经过一系列实验锁定某个基因，测序结果如下：
stp
GATGGGCTGGAAGTAAGGAAACATGTAATGATAGGCGGACTCCCAGCACAGAAAAAAAGGTAGATCTGAATGCTGATCCCCTGTGTGAGAGA AAAGAATGGAATAAGCAGAAACTGCCATGCTCAGAGAATCCTAGAGATACTGAAGATGTTCCTTGGATAACACTAAATAGCAGCATTCAGAAA GTTAATGAGTGGTTTTCCAGAAGTGATGAACTGTTAGGTTCTGATGACTCACATGATGGGGAGTCTGAATCAAATGCCAAAGTAGCTGATGTAT
基因组信息学
2017年4月4日 18:44
题目
答案
()是指进化树的拓扑形状由两两序列的进化距离决定的。
距离依靠
法 (distance methods)
已知某蛋白质部分序列如下：
跨膜
MAHAGRTGYDNREIVMKYIHYKLSQRGYEWDAGDVGAAPPGAAPAPGIFSSQPGHTPHPAASRDPVARTSPLQTPAAPGAAAGPALSPVPPVVHLTLRQAGDDFSRRYRRDFAE MSSQLHLTPFTARGRFATVVEELFRDGVNWGRIVAFFEFGGVMCVESVNREMSPLVDNIALWMTEYLNRHLHTWIQDNGGWDAFVELYGPSMRPLFDFSWLSLKTLLSLALVGAC
VLGTSGYDYYHVDDLENLAKCHEHLMQYGKGKSCYYRFLTKGQQWIWLQTHYYITYHQWNSRPEFIVCTHTVVSYAEVRAERRRELGIEESLPETAAD
KSQDSGSDNRINTVSLKEALERFDHSPTPSASSRSSRKSSHTAVSDPSSTPTKIPTDTSTPPRQHLPAHEKMTQRRSSFSSQSINSQSVGPSLTQPAMS
WMWLSCSSFFQQFFHCYCPVGFGRRTDPNGDYIRRYLPVLRGFPAKYIYDPWNAPEGIQKVAKCLIGVNYPKPMVNHAEASRLNIERMKQIYQQLSR
YRGLGLLASVPSNPNGNGGFMGYSAENIPGCSSSGSCSQGSGILHYAHGDSQQTHLLKQGRSSMGTGLSGGKRPSQEEDTQSIGPKVQRQSTN】
以下哪个软件通过对特征序列(GT-AG)的分析进行直接内含子/外显子剪接位点识别？
NetGene 2
某天，你在实验中发现一个有趣的表型，经过一系列实验锁定某个基因，测序结果如下：
BRCA1
GATGGGCTGGAAGTAAGGAAACATGTAATGATAGGCGGACTCCCAGCACAGAAAAAAAGGTAGATCTGAATGCTGATCCCCTGTGTGAGAGA
有
GATGGGCTGGAAGTAAGGAAACATGTAATGATAGGCGGACTCCCAGCACAGAAAAAAAGGTAGATCTGAATGCTGATCCCCTGTGTGAGAGA AAAGAATGGAATAAGCAGAAACTGCCATGCTCAGAGAATCCTAGAGATACTGAAGATGTTCCTTGGATAACACTAAATAGCAGCATTCAGAAA GTTAATGAGTGGTTTTCCAGAAGTGATGAACTGTTAGGTTCTGATGACTCACATGATGGGGAGTCTGAATCAAATGCCAAAGTAGCTGATGTAT TGGACGTTCTAAATGAGGTAGATGAATATTCTGGTTCTTCAGAGAAAATAGACTTACTGGCCAGTGATCCTCATGAGGCTTTAATATGTAAAAGT GAAAGAGTTCACTCCAAATCAGTAGAGAGTAATATTGAAGACAAAATATTTGGGAAAACCTATCGGAAGAAGGCAAGCCTCCCCAACTTAAGC
况下哪一个数据库搜索获得的匹配序列多？
62
做blastp时使用下列哪个打分矩阵？
BLOSUM 矩阵
下面哪个选项比较正确的描述了该序列所编码的基因？
看家基因
【CATCCTCTTCCTCCCTGGAGAAGAGCTATGAGCTGCCTGACGGCCAGGTCATCACTATTGGCAACGAGCGGTTCCGATGCCCTGAGGCTCTTT
ITLGAYLGHK。
该蛋白质的第212-233氨基酸序列具有以下功能？
亲缘关系远的序列之间的比对选用下面哪个打分矩阵合适？
PAM250
当所考虑的谱系间进化速率可变时,()比较适用
邻位相连法（Neighb orjoining）
该蛋白质来源于哪个基因？
Clock
【MVFTVSCSKMSSIVDRDDSSIFDGLVEEDDKDKAKRVSRNKSEKKRRDQFNVLIKELGSMLPGNARKMDKSTVLQKSIDFLRKHKETTAQSDASEIR
在药物和受体之间的识别中起重要作用的非键相互作用主要包括（）
疏水作用、立体相互作用、包括离子-偶极作用等在内的静电作用
定义能被受体所识别的、与受体受点所识别结合起关键作用的药物分子的分子片断及三维空间位置的排布为（）药效基团
以下属于蛋白质结构分类数据库的有（）
CATH、SCOP
分区生物信息学的第 1 页
DGLSSAVWPGGETEALTRLERHLERKAWVANFERPRMNANSLLASPTGLSPYLRFGCLSCRLFYFKLTDLYKKVKKNSSPPLSLYGQLLWREFFYTAAT
NNPRFDKMEGNPICVQIPWDKNPEALAKWAEGRTGFPWIDAIMTQLRQEGWIHHLARHAVACFLTRGDLWISWEEGMKVFEELLLDADWSINAGS
以下哪个命令是blast 2.2.30+用来格式化数据库的？
formatdb
下列哪个程序是将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库?
blastx
Tblastx是核酸-核酸比对。此种查询将库中的核酸序列和查询的核酸序列都翻译成蛋白质（每条核酸序列会产生3条可能的蛋白序列）。这种说法否是否正确？
邻位相连法（Neighbor-joining）
“基因组学”这个术语是1986年由（）在芬兰的一次会议上提出
Tom
DNA microarray技术的生物学原理？碱基互补配对利用EST可以做哪些工作？发现新基因
Serial analysis of gene expression (SAGE)技术中，测定出来的代表基因表达的序列长度一般有多长？同源建模方法搜索模板时当序列相似度低于（）时则一般不考虑采用该方法。
QDWKPTFLSNEEFTQLMLEALDGFFLAIMTDGSIIYVSESVTSLLEHLPSDLVDQSIFNFIPEGEHSEVYKILSTHLLESDSLTPEYLKSKNQLEFCCHMLRG
TIDPKEPSTYEYVRFIGNFKSLTSVSTSTHNGFEGTIQRTHRPSYEDRVCFVATVRLATPQFIKEMCTVEEPNEEFTSRHSLEWKFLFLDHRAPPIIGYLPFE
零碎
2017年3月14日
19:48
低阶PAM矩阵适合用来比较亲缘较近的序列，而低阶BLOSUM矩阵更多是用来比较亲缘较远的序列。 Blast是局部比对工具构建进化树前不需要进行多序列比对
()是指进化树的拓扑形状由两两序列的进化距离决定的。
距离依靠法(distance methods)
当所考虑的谱系间进化速率可变时,()比较适用
QAANLPIPQGMSQFQFSAQLGAMQHLKDQLEQRTRMIEANIHRQQEELRKIQEQLQMVHGQGLQMFLQQSNPGLNFGSVQLSSGNSNIQQLTPV
NMQGQVVPANQVQSGHISTGQHMIQQQTLQSTSTQQSQQSVMSGHSQQTSLPSQTPSTLTAPLYNTMVISQPAAGSMVQIPSSMPQNSTQSAT
分区生物信息学的第 2 页
GAAAGAGTTCACTCCAAATCAGTAGAGAGTAATATTGAAGACAAAATATTTGGGAAAACCTATCGGAAGAAGGCAAGCCTCCCCAACTTAAGC CATGTAACTGAAAATCTAATTAT
这部分序列对应的蛋白质在PDB库中有三级结构吗？
10-20 30%
同源建模方法搜索模板时当序列相似度低于（）时则一般不考虑采用该方法。
30%
Chou-Fasman是一种基于（）的预测方法
经验参数
PDB是蛋白质的（）