进化树的构建

合集下载

构建进化树的步骤

构建进化树的步骤

构建进化树的步骤通常包括以下几个关键环节:
1. 数据收集:收集相关的生物序列数据,这些数据可以来自于公共数据库,如NCBI的GenBank,也可以通过实验获得。

序列数据包括DNA或蛋白质序列。

2. 序列alignment(序列比对):使用比对软件如Clustal Omega、MAFFT、MUSCLE等,将收集到的序列进行比对,以确保序列的同源性,并消除由于序列变异导致的噪音。

3. 序列拼接和校正:对测序得到的正向和反向序列进行拼接和校正,以获得完整的序列。

常用的拼接软件有Contig Express、Geneious 和Sequencher等。

4. 选择合适的模型:根据序列数据选择合适的进化模型。

可以使用软件如Modeltest来评估不同的进化模型,选择BIC(Bayesian Information Criterion)分数最低的模型。

5. 建树:选择合适的软件和建树方法来构建进化树。

常用的软件有MEGA、PhyML、MrBayes等,建树方法包括NJ(邻接法)、MP (最大简约法)、ML(最大似然法)等。

6. 建树检验:使用如Bootstrap方法等来检验所建树的稳定性和可靠性。

Bootstrap方法通过重复抽样来检验建树的节点支持度。

7. 绘制进化树:使用软件如TreeDraw、FigTree或在线工具来绘制进化树的图像,以便于分析和展示。

植物基因家族进化树的构建

植物基因家族进化树的构建

植物基因家族进化树的构建一、数据收集在构建植物基因家族进化树之前,需要收集相关的基因序列数据。

这些数据可以通过各种数据库,如NCBI、Ensembl等获取。

在收集数据时,需要注意以下几点:1. 选择具有代表性的物种,覆盖尽可能多的系统发育分支;2. 确保所收集的基因序列数据质量可靠,无测序错误和拼接错误;3. 对于每个基因家族,应尽可能收集多个成员的序列,以便进行多序列比对和树的构建。

二、序列比对在获得基因序列数据后,需要进行多序列比对。

比对的目的是为了找到不同物种间基因序列的相似性和差异性,从而确定它们之间的系统发育关系。

常用的多序列比对软件有MUSCLE、CLUSTAL W等。

在进行多序列比对时,需要注意以下几点:1. 选择合适的比对参数,以保证比对结果的准确性和可靠性;2. 在比对过程中,需要注意保持基因序列的原始阅读框,避免引入不必要的拼接错误;3. 对于较长的基因序列,可以分段进行比对,以提高计算效率和准确性。

三、距离矩阵计算在多序列比对的基础上,需要计算不同物种间基因序列之间的距离。

距离矩阵的计算是树构建的重要步骤之一。

常用的距离矩阵计算方法有:1. 欧氏距离法:直接计算不同物种间基因序列的差异数目,得到距离矩阵;2. Kimura距离法:基于Kimura模型计算不同物种间基因序列的差异概率,得到距离矩阵;3. Jukes-Cantor距离法:考虑基因序列的突变率和进化速率,计算不同物种间基因序列的差异概率,得到距离矩阵。

在选择距离矩阵计算方法时,需要根据具体情况选择适合的方法。

如果数据量较大或序列较短时,可以考虑使用欧氏距离法;如果数据量较小或序列较长时,可以考虑使用Kimura或Jukes-Cantor距离法。

四、树构建方法选择在获得距离矩阵后,需要选择合适的树构建方法来构建进化树。

常用的树构建方法有:1. UPGMA(Unweighted Pair Group Method with Arithmetic Mean):将距离矩阵中的行或列进行聚类分析,根据聚类结果构建树;2. Neighbor Joining:基于距离矩阵中的最近邻关系构建树;3. Maximum Parsimony:基于树的构建准则函数(如最小改变数、最小代价等)构建树。

菌株系统进化树的构建-概述说明以及解释

菌株系统进化树的构建-概述说明以及解释

菌株系统进化树的构建-概述说明以及解释1.引言1.1 概述概述菌株系统进化树的构建是一项重要的研究工作,它能够帮助我们了解不同菌株之间的进化关系和演化历史。

菌株系统进化树可以被看作是一种表示不同菌株间亲缘关系的有向无环图,它能够揭示这些菌株之间的共同祖先和演化路径。

菌株系统进化树是基于菌株间的遗传差异来构建的。

通过对不同菌株的基因组、基因序列和遗传标记进行比较分析,我们可以获得它们之间的遗传距离或相异度。

这些数据可以用来构建菌株系统进化树,从而揭示菌株间的进化关系。

构建菌株系统进化树的过程通常包括以下几个步骤:首先收集不同菌株的样本,提取其基因组或基因序列;然后对这些样本进行测序并得到相应的遗传数据;接着利用生物信息学方法对这些数据进行分析和比较,计算出菌株间的遗传距离;最后利用分子进化模型和统计方法构建进化树,并对其进行进一步的验证和分析。

菌株系统进化树的构建具有重要的应用价值。

首先,它可以帮助我们确定不同菌株之间的亲缘关系,进一步理解它们之间的演化过程和机制。

其次,菌株系统进化树可以为微生物分类学和菌群动态变化研究提供重要的参考和指导。

此外,对于研究菌株的致病性、抗药性和生物学特性等方面,菌株系统进化树也具有重要意义。

综上所述,构建菌株系统进化树是一个重要而复杂的研究课题。

通过比较和分析菌株间的遗传数据,我们可以揭示菌株间的亲缘关系和进化历史,进一步推动微生物学和生物进化学的发展。

在接下来的内容中,我们将详细介绍构建菌株系统进化树的方法和应用,以及对未来研究的展望。

1.2 文章结构文章结构是指文章的组织框架和各个部分的排列顺序。

一个良好的文章结构能够帮助读者更好地理解和掌握文章的内容,并且能够使文章的逻辑关系更加清晰和流畅。

本文的结构分为引言、正文和结论三个部分,具体如下:引言部分(Introduction):在引言部分,首先要对菌株系统进化树的概念进行介绍,解释其所涉及的基本概念和理论背景。

生物大数据分析中的进化遗传树构建方法与技巧

生物大数据分析中的进化遗传树构建方法与技巧

生物大数据分析中的进化遗传树构建方法与技巧进化遗传树(Phylogenetic Tree)是生物学研究中用于分析物种关系和演化历程的重要工具。

通过构建进化树,我们可以了解不同物种之间的进化关系,揭示物种的演化历史以及预测它们之间的共同祖先。

在生物大数据分析中,构建进化遗传树有着重要的意义,因为它可以帮助我们理解生物的遗传多样性、物种起源以及群体分化等重要生物学问题。

在构建进化遗传树的过程中,我们需要根据生物学数据来推断物种间的关系。

这些生物学数据可以是DNA或RNA序列、蛋白质序列、形态特征等。

为了准确地构建进化遗传树,我们需要选择合适的方法和技巧。

下面将介绍一些常用的进化遗传树构建方法和技巧。

1. 距离法(Distance-based methods):距离法是通过计算物种间的相似度或差异度来构建进化遗传树的方法。

常用的距离法包括最邻近法(Neighbor Joining)、最小进化法(Minimum Evolution)和最大简约法(Maximum Parsimony)等。

这些方法根据不同的算法和模型,通过计算物种间的距离矩阵来构建进化关系。

2. 贝叶斯方法(Bayesian methods):贝叶斯方法是一种基于统计模型和概率推断的进化遗传树构建方法。

它通过采用贝叶斯推断和蒙特卡洛马尔科夫链蒙特卡洛算法(MCMC)来估计进化树的拓扑结构和参数。

贝叶斯方法具有高度灵活性和更准确的模型,适用于复杂的进化树推断问题。

3. 最大似然方法(Maximum likelihood methods):最大似然方法是一种常用的基于概率统计的进化遗传树构建方法。

它通过最大化观测到的数据出现的概率,推断出可能的进化树。

最大似然方法考虑了模型中的参数估计问题,并用参数化的模型来描述进化过程,从而提高了推断结果的准确性。

在进行进化遗传树构建时,还有一些技巧需要注意,以保证结果的准确性和可靠性:1. 数据质量的控制:数据质量是构建进化遗传树的关键因素之一。

单倍型构建进化树流程

单倍型构建进化树流程

单倍型构建进化树流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!单倍型构建进化树是一种用于研究物种进化关系的方法。

以下是一般的单倍型构建进化树的流程:1. 数据收集:收集需要分析的物种的基因序列数据。

系统进化树的构建

系统进化树的构建

系统进化树的构建一、什么是系统进化树系统进化树,又称为生命进化树或物种树,是描述生物进化关系的一种图形表达方式。

它通过比较不同物种之间的形态、生理特征以及遗传信息等多方面的数据,将它们按照演化顺序排列在一个分枝结构图中,以展示各个物种之间的亲缘关系和演化历程。

二、系统进化树的构建方法1. 形态学比较法形态学比较法是最早被使用的构建系统进化树的方法。

该方法主要通过对不同物种之间形态特征的比较,确定它们之间的亲缘关系。

例如,通过对鸟类翅膀长度和颜色等特征进行比较,可以确定它们之间的亲缘关系,并将它们排列在一个分枝结构图中。

2. 分子生物学方法随着分子生物学技术的发展,越来越多的研究者开始使用DNA序列等遗传信息来构建系统进化树。

这种方法主要是通过比较不同物种DNA 序列或蛋白质序列之间的差异性,来推断它们之间的亲缘关系。

例如,通过对人类、猩猩和大猩猩的DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。

3. 综合方法综合方法是将形态学比较法和分子生物学方法结合起来,以获得更准确的系统进化树。

该方法主要是通过对不同物种之间形态特征和遗传信息等多方面的数据进行综合分析,来推断它们之间的亲缘关系。

例如,通过对恐龙化石的形态特征和DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。

三、系统进化树的构建步骤1. 收集数据构建系统进化树需要收集大量的数据,包括形态特征、遗传信息等多方面的数据。

这些数据可以通过实验、文献调查等方式获取。

2. 数据处理收集到的数据需要进行处理和分析,以便于构建系统进化树。

这些处理包括序列比对、计算差异性等操作。

3. 构建树型结构在经过数据处理后,就可以开始构建系统进化树了。

该步骤主要是将不同物种之间的亲缘关系按照演化顺序排列在一个分枝结构图中。

4. 树型验证构建完系统进化树后,需要对其进行验证。

这可以通过计算分支长度、计算拓扑稳定性等方式来实现。

四、系统进化树的应用1. 生物分类学研究系统进化树可以帮助生物学家更准确地确定不同物种之间的亲缘关系,从而更好地进行生物分类学研究。

构建生物进化树的方法比较

构建生物进化树的方法比较

极为详细的建树方法,新手入门推荐生物进化树的构建目录前言 (2)一、 NCBI (6)二、 Mega (9)三、 DNAMAN (15)四、DNAStar (18)五、 Bio edit (21)前言1.背景资料进化树(evolutionary tree)又名系统树(phylogenetie tree)进化树,用来表示物种间亲缘关系远近的树状结构图。

在进化树中,各个分类单元(物种)依据进化关系的远近,被安放在树状图表上的不同位置。

所以,进化树简单地表示生物的进化历程和亲缘关系。

已发展成为多学科(包括生命科学中的进化论、遗传学、分类学、分子生物学、生物化学、生物物理学和生态学,又包括数学中的概率统计、图论、计算机科学和群论)交叉形成的一个边缘领域。

归纳总结生物进化的总趋势有以下几类:①结构上:由简单到复杂②生活环境上:由水生到陆生③进化水平上:由低等到高等一般来说,进化树是一个二叉树。

它由很多的分支和节点构成。

根据位置的不同,进化树的节点分为外部节点和内部节点,外部节点就是我们要进行分类的分类单元(物种)。

而物种之间的进化关系则用节点之间的连线表示。

内部节点表示进化事件发生的地方,或表示分类单元进化的祖先。

在同一个进化树中,分类单元的选择应当标准一致。

进化树上不同节点之间的连线称为分支,其中有一端与叶子节点相连的分支称为外枝,不与叶子节点相连的分支称为内枝。

进化树一般有两种:有根树和无根树。

有根树有一个鲜明的特征,那就是它有一个唯一的根节点。

这个根节点可以理解为所有其他节点的共同祖先。

所以,有根树能可以准确地反映各个物种的进化顺序,从根节点进化到任何其他节点只有能有一条惟一的路径。

无根树则不能直接给出根节点,无根树只反映各个不同节点之间的进化关系的远近,没有物种如何进化的过程。

但是,我们可以在无根树种指派根节点,从而找出各个物种的进化路径。

无根树有根树放射树分子进化树(以分子数据为依据构建的进化树)不仅精确地反映物种间或群体间在进化过程中发生的极微细的遗传变异(小至一个氨基酸或一个核昔酸差异),而且借助化石提供的大分子类群的分化年代能定量地估计出物种间或群体间的分化年代,这对进化论的研究而言无疑是一场革命。

分子进化学中的进化树构建方法

分子进化学中的进化树构建方法

分子进化学中的进化树构建方法随着科技的进步和生物技术的广泛应用,分子生物学的研究逐渐深入,成为生物学、生物技术和医药学等领域的重要研究方向。

而分子进化学作为分子生物学中的一个重要分支,研究物种间的分子差异和进化关系。

其中,构建进化树是分子进化学研究中的重要工作,下面我们来了解一下进化树构建的方法。

一、进化树的基本概念进化树是描述不同物种、不同基因或不同蛋白质之间进化关系的图形化表示。

在进化树中,每一个分支代表了一个物种、一个基因或一个蛋白质序列,分支的长度表示了物种、基因或序列的进化距离,而进化距离则是衡量不同物种或不同序列之间关系的基本参数。

而构建进化树的过程则是根据分子序列数据的重构得到物种或基因的进化树。

二、进化树的构建方法构建进化树有多种方法,主要有距离矩阵法、系统发育学法、最大似然法和贝叶斯法等。

下面我们逐一介绍这些方法的基本原理。

1.距离矩阵法距离矩阵法是最早采用的一种构建进化树的方法,它基于序列之间的距离矩阵计算和聚类方法来得到进化树。

该方法首先计算所有分子序列之间的距离(距离可由序列相似性计算得出),然后根据聚类方法构建进化树。

聚类方法包括单链接聚类、均链接聚类和最大链接聚类等。

距离矩阵法的优点是构建速度快、适用性广,但是对于高变异的序列来说,该方法可能会产生误导性的结果。

2.系统发育学法系统发育学法是基于系统学原理,采用系统发生学的理论和方法来构建进化树。

该方法主要是通过分子序列的相似性构建系统发育分析矩阵,然后利用不同的计算方法(如UPGMA、NJ和ML等)推断进化树。

系统发育学法的优点是能够更准确地反映分子序列的演化,并且可以通过不同的方法比较结果,但是该方法需要大量的计算资源和长时间的计算。

3.最大似然法最大似然法是一种统计学上的方法,通过最大化序列数据与观测数据的相似度,来推断出最可能的进化树。

该方法需要整合进化模型和数据,然后计算不同进化模型下数据的似然函数,最终选择似然度最大的进化树。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

烦请各位看看,有没有什么大的问题,请直接贴上你的意见和建议,我会尽快修改。

主要是针对初学者,写得尽量简单一些。

谢谢!phylogentics_lylover.doc (73.0k)lz还真勤劳,一个字:顶Amazing!Thank you for your hard work!oldfish的批评意见也一并上传。

写得不错。

呵呵phylogentics_lylover_with_comments.doc (105.5k)晕,出丑了...改过来了。

谢谢再贴一个来自yzwpf 的批评意见。

写得很不错。

NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。

MrBayes和MAC5均可利用gap信息构建进化树。

ml法无需比对应该是错误的。

至少在paup中未比对会出错。

计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。

在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!>楼主,这是我写的帖子呀!怎么变成了mediocrebeing,呵呵!NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。

MrBayes和MAC5均可利用gap信息构建进化树。

ml法无需比对应该是错误的。

至少在paup中未比对会出错。

计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。

在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!1Mega的功能:▲数据输入▲排序功能数据处理▲密码子分析▲序列综合编辑▲序列阅读▲Substitution Pattern Homogeneity Test 单因子模式替换分析▲遗传距离▲选择测试▲分子钟▲进化树构建▲距离矩阵▲系统树分析2Bioedit的功能:序列处理和编辑功能▲用于序列处理和编辑的简单的图形界面▲使用编辑选项包括残基的select and drag 选择和拖动和grab and drag 抓取和拖动变量选择选项鼠标点击插入和删除缺口全框选择全屏编辑中剪切复制和粘贴编辑窗口的自动刷新。

▲固定序列框保护排列中的固定残基▲自动的和手动的注解序列使用一个模板序列自动注解同一排列中的其他序列。

▲序列分组分为各个颜色编码家族为同步手动排列锁定组成员。

▲根本的多基因树图阅读器支持节点翻转和打印。

▲链接多基因树图到排列并保存到BioEdit格式排列文件。

▲在ABI自动序列模型377 373 3700中显示打印和编辑ABI痕迹文件在版本2和3中有SCF文件就象用Licor序列输出文件。

RNA比较分析功能▲ RNA比较分析工具包括共变,可能配对和互交信息分析。

▲使用鼠标指示的动态数据视图的互交信息输出2 D矩阵图表,关于互交信息矩阵行和框的互交式的1 D图表。

▲用BioEdit或GanBank格式保存序列注解信息。

▲通过氨基酸翻译排列蛋白质编码核酸序列在排列中搜索保存的残基寻找好的PCR目标或帮助定义基序。

▲在核酸或蛋白质序列中搜索用户定义的基序或用通配符搜索精确的文本并选择包括或忽略缺口。

▲使用自动更新的排列蛋白质全标题和GenBank区域信息进行ClustalW多序列排列。

▲基本序列处理在文档之间复制粘贴序列翻译和还原编码RNA DNA RNA 反转/互补,大写字母/小写字母。

▲多文档界面最多同时打开20个文档但是在其他打开的窗口不能设置限制六框翻译核酸序列为Fasta格式ORF表用矢量图进行半自动质粒矢量绘图和注解自动酶切位点和位置标记自动多接头视图和用户控制绘图工具将质粒文件保存为可编辑的矢量图形文件如位图复制到其他图形程序并可以打印氨基酸和核苷酸成分摘要和图表Revert to Saved 恢复保存和undo 撤销功能编辑氨基酸和核酸序列简单的指定色彩表编辑蛋白质和核酸序列使用不同的色彩表排列易感的描影法以信息为根据其中包括排列位置BioEdit 能够读写GenBank, Fasta, NBRF/PIR, Phylip 3.2 和Phylip 4格式能够读ClustalW 和GCG格式.10个附加格式的导入输出过滤器使用Don Gilbert的ReadSeq导入/添加一个文件到最后的另一个文件上(不考虑文件格式)基本的多文本编辑器限制性内切酶图谱用于任何或所有形式的翻译复酶和输出选项包括酶的提供者和环状DNA选项游览限制性内切酶创造商自动连接到你喜欢的网页游览器如Netscape 或Internet Explorer。

Paup的功能:PAUP(简约法和其他方法的亲缘分析)是由简约法、最大似然法和距离法用于亲缘分析的程序,为系统发育分析提供一个简单的,带有菜单界面的,与平台无关的,拥有多种功能(包括进化树图)的程序。

▲管理数据(排除元素、删除分类)▲定义假设(增加元素权重、设置元素类型、保存当前假设、重新打开假设)▲查找树(定义最佳标准、定义查找策略)、打印树(显示树、描述树、打印低决议树、打印高决议树)▲设置最优标准为距离依靠法(设置最优标准、显示距离、构建邻位相连树、建立最小平方树)、可能性法(设置最优标准、评价简约性树、设置可能性模式参数、开始查找树)▲在批文件中提交命令(四)、DAMBE的功能:单倍型归纳,基因频率和碱基组成分析,遗传距离计算,序列排序,其中以单倍型归纳最为常用。

▲ DNA and protein sequence editing DNA和蛋白质序列的编辑▲ DNA sequence conversion DNA序列的格式转换▲ Multiple sequence alignment, alignment editing and analysis多序列比对,序列编辑和分析▲ Phylogenetic tree analysis系统发生树分析▲ Dot-matrix comparison of DNA or protein sequences DNA或蛋白质的点矩阵比较▲ DNA sequence assembly and editing DNA序列装配编辑▲ Generating BLAST documents for accessing the BLAST E-mail Server产生BLAST文档,以供联系BLAST的E-mail服务器▲ Enhanced motif search in sequence and database在序列和数据库方面增强了主题搜索的功能▲ Restriction analysis限定分析▲ Drawing sequence maps with publication-quality 以公众出版物的质量画出序列的分析图▲ Restriction pattern prediction模式限定▲ Electronic cloning 模拟的无性繁殖系化▲ Reconstructing restriction maps from restriction fragments从已定的碎片中重建DNA的限制性分析图▲ Silent mutation analysis to create/destroy restriction sites沉默的转变分析▲ Directed mismatch to create/destroy restriction sites有指导的修正错配碱基▲ Translation and codon usage analysis密码子分析及其翻译▲ Protein hydrophobic/hydrophilic profile analys is蛋白质亲水/疏水基团的分析▲ Protein characterization: sequence composition and prediction of isoelectric point.蛋白质描述:序列合成和等电点预测▲ Protein secondary structure prediction蛋白质的二级结构预测▲ Reverse translation反转录▲ Design of PCR and sequencing primers PCR反应的引物设计▲ Characterization of thermodynamic properties of DNA or primer sequences DNA或引物序列的热力学特征分析▲ Mispriming analysis底物分析▲ Management of oligo, DNA and protein databases DNA和蛋白质的数据库管理▲ Generation of random sequences随机序列的产生▲ Internet access with integrated Web browser自动连接到你喜欢的因特网浏览器▲ Multi-processing to unleash computer power计算机扩展Fasta格式:Fasta格式,又叫Person(Fasta的主要作者)格式,是最简单的格式,使用最多。

A sequence in FASTA format begins with a single-line description, followed by lines of sequence data. The description line is distinguished from the sequence data by a greater-than (">") symbol in the first column. It is recommended that all lines of text be shorter than 80 characters in length.Fasta格式先以一单行的描述开始,后接序列的详细数据。

FASTA格式第一行是描述行,第一个字符必须是“>”字符;随后的行是序列本身,一般每行序列不要超过80个字符,回车符不会影响程序对序列连续性的看法。

序列由标准的IUB/IUPAC氨基酸和核酸代码代表;小写字符会全部转换成大写;单个“-”号代表不明长度的空位;在氨基酸序列里允许出现“U”和“*”号;任何数字都应该被去掉或换成字母(如,不明核酸用“N”,不明氨基酸用“X”)。

相关文档
最新文档