如何做系统进化树
植物基因家族进化树的构建

植物基因家族进化树的构建一、数据收集在构建植物基因家族进化树之前,需要收集相关的基因序列数据。
这些数据可以通过各种数据库,如NCBI、Ensembl等获取。
在收集数据时,需要注意以下几点:1. 选择具有代表性的物种,覆盖尽可能多的系统发育分支;2. 确保所收集的基因序列数据质量可靠,无测序错误和拼接错误;3. 对于每个基因家族,应尽可能收集多个成员的序列,以便进行多序列比对和树的构建。
二、序列比对在获得基因序列数据后,需要进行多序列比对。
比对的目的是为了找到不同物种间基因序列的相似性和差异性,从而确定它们之间的系统发育关系。
常用的多序列比对软件有MUSCLE、CLUSTAL W等。
在进行多序列比对时,需要注意以下几点:1. 选择合适的比对参数,以保证比对结果的准确性和可靠性;2. 在比对过程中,需要注意保持基因序列的原始阅读框,避免引入不必要的拼接错误;3. 对于较长的基因序列,可以分段进行比对,以提高计算效率和准确性。
三、距离矩阵计算在多序列比对的基础上,需要计算不同物种间基因序列之间的距离。
距离矩阵的计算是树构建的重要步骤之一。
常用的距离矩阵计算方法有:1. 欧氏距离法:直接计算不同物种间基因序列的差异数目,得到距离矩阵;2. Kimura距离法:基于Kimura模型计算不同物种间基因序列的差异概率,得到距离矩阵;3. Jukes-Cantor距离法:考虑基因序列的突变率和进化速率,计算不同物种间基因序列的差异概率,得到距离矩阵。
在选择距离矩阵计算方法时,需要根据具体情况选择适合的方法。
如果数据量较大或序列较短时,可以考虑使用欧氏距离法;如果数据量较小或序列较长时,可以考虑使用Kimura或Jukes-Cantor距离法。
四、树构建方法选择在获得距离矩阵后,需要选择合适的树构建方法来构建进化树。
常用的树构建方法有:1. UPGMA(Unweighted Pair Group Method with Arithmetic Mean):将距离矩阵中的行或列进行聚类分析,根据聚类结果构建树;2. Neighbor Joining:基于距离矩阵中的最近邻关系构建树;3. Maximum Parsimony:基于树的构建准则函数(如最小改变数、最小代价等)构建树。
系统进化树的构建方法

系统进化树的构建方法系统进化树(systematic phylogenetic tree)是用于描述不同物种之间进化关系的一种图形化表示方法,可以帮助我们理解物种的起源、演化和分类。
构建系统进化树主要涉及到物种的分类学和进化生物学知识,以及系统发育分析方法。
下面将介绍系统进化树的构建方法。
1.选择研究对象:确定研究的物种范围,通常会选择有代表性的物种,包括已知的和新发现的物种。
2.收集DNA序列数据:从每个研究对象中提取DNA样本,并通过PCR扩增得到所需的基因序列。
常用的基因包括线粒体基因COI、核基因ITS 等,根据具体研究目的和对象进行选择。
3.序列比对:将收集到的DNA序列进行比对,通常采用计算机程序进行全局比对,比对结果会显示序列之间的同源区域和差异。
4. 构建系统进化树:有多种方法可以构建系统进化树,其中最常用的是系统发育建模方法,如最大简约法(maximum parsimony)、最大似然法(maximum likelihood)和贝叶斯推断(Bayesian inference)等。
最大简约法是最简单和最常用的构建系统进化树的方法之一、它基于简约原则,认为进化过程中最少的演化步骤是最可能的。
方法将不同物种的序列进行比对,统计共有的字符以及不同的字符,根据最小化改变的原则,得到进化树。
最大似然法使用概率模型来计算物种之间的进化关系,根据序列数据的概率分布确定最可能的进化树。
这种方法考虑了不同序列字符的不同演化速率以及序列之间的相关性。
贝叶斯推断方法基于贝叶斯统计学原理,通过计算不同进化树的后验概率来确定最有可能的进化树。
该方法能够对不同进化模型和参数进行全面的推断,但计算复杂度较高。
5.进行分支长度调整和进化树根的定位:进化树的分支长度表示物种间的差异,可以根据各个物种间的差异大小进行调整。
进化树的根通常是已知的进化历史或已知的进化事件,如灭绝事件等,可以通过分析群体间的基因流动等信息进行推断。
作系统进化树的方法

作系统进化树的方法系统进化树(Phylogenetic tree)是一种表示生物物种之间进化关系的图形结构。
它基于生物的遗传物质或形态特征等数据,通过一定的算法和模型来构建,以揭示物种之间的亲缘关系和进化历程。
以下是构建系统进化树的一般步骤:1. 数据收集:首先需要收集用于构建进化树的基因或形态特征数据。
这通常涉及从各种来源获取DNA、蛋白质或其他分子序列数据,或者从博物馆和标本馆获取生物形态特征数据。
2. 序列比对:对于DNA或蛋白质序列数据,需要将这些序列进行比对,以确保它们可以一起进行比较和分析。
3. 选择适当的距离度量:在构建系统进化树时,需要计算物种之间的“距离”。
这些距离是基于序列或形态特征的差异来计算的。
有多种方法可以计算这些距离,例如基于遗传物质的p距离(代表两个序列之间的差异比例)或形态特征的欧几里得距离。
4. 选择合适的建树算法:系统进化树可以通过多种算法来构建,包括但不限于UPGMA(Unweighted Pair Group Method with Arithmetic Mean)、WPGMA(Weighted Pair Group Method with Arithmetic Mean)、WPGMC(Weighted Pair Group Method with Centroid Linkage)、Neighbor Joining、Fitch-Margoliash、Maximum Parsimony、Maximum Likelihood等。
选择哪种算法取决于你的具体需求和所处理数据的性质。
5. 构建系统进化树:使用选择的算法和距离度量,将物种按照它们的亲缘关系分组。
这一步通常涉及到一个迭代过程,其中算法会尝试不同的分组方案,直到找到一个最优解。
6. 评估和验证树:一旦构建了系统进化树,就需要对其进行评估和验证,以确保其合理性和可靠性。
这通常涉及使用多种统计测试和可视化工具,例如Bootstrapping、P-distance、Tree-bisection-reconnection (TBR) 操作等。
最大似然法系统发育树原理步骤

一、概述系统发育树是生物学领域中常用的一种分类学方法,通过比较不同物种的遗传信息,构建它们之间的亲缘关系,从而揭示它们的进化历史和演化路径。
而最大似然法则是系统发育树构建的常用方法之一,它基于遗传信息的统计学原理,通过计算各种拓扑结构的概率来确定系统发育树的最优结构。
二、最大似然法的原理在构建系统发育树时,我们首先需要收集物种的遗传信息,比如DNA 序列,蛋白质序列等。
然后我们需要假设一个系统发育树的拓扑结构,即物种之间的亲缘关系,接着利用这些遗传信息来评估这个拓扑结构的合理性。
而最大似然法则就是基于遗传信息的统计学原理,来评估不同拓扑结构的合理性。
三、最大似然法的步骤最大似然法构建系统发育树的步骤通常可以分为以下几个步骤:1. 假设模型:我们需要选择一个适当的进化模型,用来描述物种进化的过程。
比较常用的模型包括Jukes-Cantor模型、Kimura模型、GTR模型等。
这些模型会考虑不同的进化因素,比如碱基替换率、碱基组成偏好等。
2. 构建系统发育树:在选择好模型后,我们需要利用这些遗传信息来构建系统发育树。
通常我们会有多个不同拓扑结构的备选方案,比如三叉结构、四叉结构等。
而最大似然法则会根据已有的遗传信息来评估这些备选方案的合理性。
3. 计算概率:最大似然法则通过计算每个拓扑结构出现的概率来评估其合理性。
这里的概率通常是指给定遗传信息的情况下,某拓扑结构出现的可能性。
而这个概率通常是利用进化模型和统计学原理计算得来的。
4. 确定最优结构:通过比较不同拓扑结构的概率,我们可以确定系统发育树的最优结构。
通常我们会选择概率最大的那个拓扑结构作为最终的系统发育树。
四、总结通过最大似然法则构建系统发育树的步骤,我们可以在遗传信息的基础上,找到最优的物种亲缘关系,从而揭示它们的进化历史和演化路径。
最大似然法则基于遗传信息的统计学原理,通过计算不同拓扑结构的概率来评估其合理性,从而确定系统发育树的最优结构。
菌株系统进化树的构建-概述说明以及解释

菌株系统进化树的构建-概述说明以及解释1.引言1.1 概述概述菌株系统进化树的构建是一项重要的研究工作,它能够帮助我们了解不同菌株之间的进化关系和演化历史。
菌株系统进化树可以被看作是一种表示不同菌株间亲缘关系的有向无环图,它能够揭示这些菌株之间的共同祖先和演化路径。
菌株系统进化树是基于菌株间的遗传差异来构建的。
通过对不同菌株的基因组、基因序列和遗传标记进行比较分析,我们可以获得它们之间的遗传距离或相异度。
这些数据可以用来构建菌株系统进化树,从而揭示菌株间的进化关系。
构建菌株系统进化树的过程通常包括以下几个步骤:首先收集不同菌株的样本,提取其基因组或基因序列;然后对这些样本进行测序并得到相应的遗传数据;接着利用生物信息学方法对这些数据进行分析和比较,计算出菌株间的遗传距离;最后利用分子进化模型和统计方法构建进化树,并对其进行进一步的验证和分析。
菌株系统进化树的构建具有重要的应用价值。
首先,它可以帮助我们确定不同菌株之间的亲缘关系,进一步理解它们之间的演化过程和机制。
其次,菌株系统进化树可以为微生物分类学和菌群动态变化研究提供重要的参考和指导。
此外,对于研究菌株的致病性、抗药性和生物学特性等方面,菌株系统进化树也具有重要意义。
综上所述,构建菌株系统进化树是一个重要而复杂的研究课题。
通过比较和分析菌株间的遗传数据,我们可以揭示菌株间的亲缘关系和进化历史,进一步推动微生物学和生物进化学的发展。
在接下来的内容中,我们将详细介绍构建菌株系统进化树的方法和应用,以及对未来研究的展望。
1.2 文章结构文章结构是指文章的组织框架和各个部分的排列顺序。
一个良好的文章结构能够帮助读者更好地理解和掌握文章的内容,并且能够使文章的逻辑关系更加清晰和流畅。
本文的结构分为引言、正文和结论三个部分,具体如下:引言部分(Introduction):在引言部分,首先要对菌株系统进化树的概念进行介绍,解释其所涉及的基本概念和理论背景。
手把手教你构建系统进化树(2021年)

97 NR 116489.1 Pseudomonas stutzeri strain VKM B-975 16S ribosomal RNA partial sequence NR 113652.1 Pseudomonas stutzeri strain NBRC 14165 16S ribosomal RNA partial sequence
进化分析流程
测序组装
• 将克隆扩增测序得到的基因进行测序。
Blast
• 比对找到相似度最高的几个基因,将这几个基因的 序列(Fasta格式文件)下载下来,整合在一个*.txt 文档中。
比对序列
• 用Mega 7.0的ClustalW做多序列联配,比对结果用*.meg格式 保存。或者用Clustal X软件进行比对,比对结果保存为*.aln, 再用Mega 转化为*.meg格式。
DNA→ DNA
ezbiocloud https:///identify
cDNA→蛋 白质
蛋白质 →cDNA
蛋白质→蛋白 质
NCBI
输入测序组装后的序列
ezbiocloud
输入序列名称 输入测序组装后的序列
比对序列
MEGA可识别fasta格式文件比对前将xxx.txt 重命名为xxx.fasta
构建系统进化树
1) 在构建系统树时,使用了Bootstrap法进行检验。在做Bootstrap时,以原序列为蓝本随机重组生成新的序列, 重复估算模型。如果原序列计算得到的分枝在新Bootstrap中依然频繁出现,则该分枝的可信度高。分枝在 Bootstrap中出现的频率就是表征分枝可信度的参数。 2) Original Tree是应用估算模型形成的最优系统树。在Original Tree上有计算得到的距离数据,可以表征两个基 因的亲缘远近;MEGA形成的Original Tree上也有频率参数,实际来自Bootstrap Consensus Tree的对应分枝。 3) Bootstrap Consensus Tree 是很多次Bootstrap得到的平均结果,它不包含进化距离信息(在设置View时无法 调用,也没有意义),分枝上的数字代表该分枝的频率参数。另外,它的拓扑结构也可能与Original Tree很不相同。
系统进化树的构建

系统进化树的构建一、什么是系统进化树系统进化树,又称为生命进化树或物种树,是描述生物进化关系的一种图形表达方式。
它通过比较不同物种之间的形态、生理特征以及遗传信息等多方面的数据,将它们按照演化顺序排列在一个分枝结构图中,以展示各个物种之间的亲缘关系和演化历程。
二、系统进化树的构建方法1. 形态学比较法形态学比较法是最早被使用的构建系统进化树的方法。
该方法主要通过对不同物种之间形态特征的比较,确定它们之间的亲缘关系。
例如,通过对鸟类翅膀长度和颜色等特征进行比较,可以确定它们之间的亲缘关系,并将它们排列在一个分枝结构图中。
2. 分子生物学方法随着分子生物学技术的发展,越来越多的研究者开始使用DNA序列等遗传信息来构建系统进化树。
这种方法主要是通过比较不同物种DNA 序列或蛋白质序列之间的差异性,来推断它们之间的亲缘关系。
例如,通过对人类、猩猩和大猩猩的DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
3. 综合方法综合方法是将形态学比较法和分子生物学方法结合起来,以获得更准确的系统进化树。
该方法主要是通过对不同物种之间形态特征和遗传信息等多方面的数据进行综合分析,来推断它们之间的亲缘关系。
例如,通过对恐龙化石的形态特征和DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
三、系统进化树的构建步骤1. 收集数据构建系统进化树需要收集大量的数据,包括形态特征、遗传信息等多方面的数据。
这些数据可以通过实验、文献调查等方式获取。
2. 数据处理收集到的数据需要进行处理和分析,以便于构建系统进化树。
这些处理包括序列比对、计算差异性等操作。
3. 构建树型结构在经过数据处理后,就可以开始构建系统进化树了。
该步骤主要是将不同物种之间的亲缘关系按照演化顺序排列在一个分枝结构图中。
4. 树型验证构建完系统进化树后,需要对其进行验证。
这可以通过计算分支长度、计算拓扑稳定性等方式来实现。
四、系统进化树的应用1. 生物分类学研究系统进化树可以帮助生物学家更准确地确定不同物种之间的亲缘关系,从而更好地进行生物分类学研究。
MEGA构建系统进化树的步骤(以MEGA7为例)

MEGA构建系统进化树的步骤(以MEGA7为例)本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。
研究某个基因的进化,是用它的DNA序列,还是翻译后的蛋白质序列呢?序列的选取要遵循以下原则:1)如果DNA序列的两两间的一致度≥70%,选用DNA 序列。
因为,如果DNA序列都如此相似,它的蛋白质会相似到看不出区别,这对构建系统发生树是不利的。
所以这种情况下应该选用DNA序列,而不选蛋白质序列。
2)如果DNA序列的两两间的一致度≤70%,DNA序列和蛋白质序列都可以选用。
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
想要做系统发生树先要做多序列比对,然后把多序列比对的结果提交给建树软件进行建树,所以在用MEGA建树时可以输入一个已经比对好的多序列比对,也可以输入一条原始序列,让MEGA先来做多序列比对,再建树(一般我们都是原始序列)。
所以我们以后者为例。
2.打开MEGA软件,选择主窗口的”File”→“Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,我们是原始序列,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对(MEGA提供了ClustalW和Muscle两种多序列比对方法,这里选择熟悉的ClustalW),弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4. 之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大家好:我在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN (LINUX)。
在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree”。
对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行排列(To align sequences)。
做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。
⑵要构建一个进化树(To reconstrut phyligenetic tree)。
构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
⑶对进化树进行评估。
主要采用Bootstraping法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。
模拟的进化树需要一种数学方法来对其进行评估。
不同的算法有不同的适用目标。
一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。
如果分析的序列较多,有可能要花上几天的时间才能计算完毕。
UPGMAM(Unweighted pair group method with arithmetic mean)假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。
这种算法得到的进化树相对来说不是很准确,现在已经很少使用。
邻位相连法是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷。
其缺点是序列上的所有位点都被同等对待,而且,所分析的序列的进化距离不能太大。
另外,需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。
最好是我们来发展一个更好的算法来解决它。
但无疑这是非常难的。
我想如果有人能建立这样一个算法的话,那他(她)完全可以在A.上发一篇高质量的文章。
下面介绍几个软件的使用。
首先是PHYLIP。
其是多个软件的压缩包,下载后双击则自动解压。
当你解压后就挥发现PHYLIP的功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。
ii,序列数据转变成距离数据后,对距离数据分析的软件。
iii,对基因频率和连续的元素分析的软件。
iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v,按照DOLLO简约性算法对序列进行分析的软件。
vi,绘制和修改进化树的软件。
在此,我主要对前两种功能软件进行说明。
我们现在有几个序列如下:Mo3 A TGTA TTTCGTACA TTACTGCCAGCCACCA TGAA TA TTGCACGGTACCA TMo5 A TGTA TTTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACGGTACCA TMo6 A TGTA TTTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACGGTACCA TMo7 A TGTA TTTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACAGTACCA TMo8 A TGTA TTTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACAGTACCA TMo9 A TGTA TCTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACGGTACCA TMo12 A TGTA TTTCGTACA TTACTG CCAGCCACCA TGAA TA TTGTACGGTACCA TMo13 A TGTA TCTCGTACA TTACTGCCAGCCACCA TGAA TA TTGTACGGTACCA T要对这8个序列进行进化树分析,按照上面的步骤,首先用CLUSTALX排列序列,输出格式为*.PHY。
用记事本打开如下图:图中的8和50分别表示8个序列和每个序列有50个碱基。
然后,打开软件SEQBOOT,如下图:按路径输入刚才生成的*.PHY文件,并在Random number seed (must be odd) ?的下面输入一个4N+1的数字后,屏幕显示如下:图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。
D选项无须改变。
J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。
文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。
这样,一个序列就可以变成了许多序列。
一个多序列组也就可以变成许多个多序列组。
根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。
将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。
Jackknife则是另外一种随机选取序列的方法。
它与Bootstrap 法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。
Permute 是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。
R选项让使用者输入republicate的数目。
所谓republicate就是用Bootstrap法生成的一个多序列组。
根据多序列中所含的序列的数目的不同可以选取不同的republicate。
当我们设置好条件后,键入Y按回车。
得到一个文件outfile Outfile用记事本打开如下:这个文件包括了100个republicate。
打开DNAPARS(最大简约性法)或DNAML(最大可能性法)软件。
将刚才生成的outfile文件更名后输入。
如下图:选项O是让使用者设定一个序列作为outgroup。
一般选择一个亲缘关系与所分析序列组很接近的序列作为outgroup(本例子不选outgroup),outgroup选择的好坏将直接影响到最后的进化树的好坏。
选项M是输入刚才设置的republicate的数目。
设置好条件后,键入Y按回车。
生成两个文件outfile和treefile。
Outfile打开如下图:该文件包括了227个进化树。
Treefile可以用TREEVIEW软件打开同样包含了这227个进化树。
打开CONSENSE软件,将刚才生成的treefile文件更名后输入。
如下图:键入Y按回车。
生成两个文件outfile和treefile。
Treefile用TREEVIEW打开,如下图:Outfile打开如下图:我们看出两个树是同样的。
但在outfile的树上的数字表示该枝条的Bootstrap支持率(除以100.6)。
到现在,8个序列的进化树分析(最大简约法)已经完成。
如果要用邻位相连法对这8个序列进行分析的话,也首先执行SEQBOOT软件将这8个序列变成100个republicate。
然后,打开DNADIST软件,把SEQBOOT 生成的文件输入,如下图:选项D有四种距离模式可以选择,分别是Kimura 2-parameter、Jin/Nei、Maximum-likelihood和Jukes-Cantor。
选项T一般键入一个15-30之间的数字。
选项M键入100。
运行后生成文件如下图:这个文件包含了与输入文件相同的100个republicate,只不过每个republicate是以两两序列的进化距离来表示。
文件中的每个republicate都省略了第一排的Mo3 Mo5 Mo6 Mo7 Mo8 Mo9 Mo12 Mo13。
以这个输出文件为输入文件,执行NEIGHBOR软件。
如下图:选项M键入100。
生成两个文件outfile和treefile用记事本和TREEVIEW打开后,发现这两个文件都含有100个进化树。
再将treefile文件更名后输入CONSENSE软件,又得到两个文件outfile和treefile,这就是最后的结果。
以上是对DNA序列的分析,如果要对蛋白质序列进行分析,PROTDIST、PROTPARS 等软件。
其他软件的用法可以参照PHYLIP的documents。
下面介绍PUZZLE软件。
它是用最大可能性的方法来构建进化树的一个软件,并且对树进行bootstrap评估。
该软件搜寻进化树时用的算法是quartet puzzling,这个算法相对较快,但如要分析的序列较多时,也相当耗时。
另有LINUX版,运行起来相对较快。
PUZZLE的输入格式为PHYLIP INTERLEAVED。
CLUSTAL可以生成此格式文件。
PUZZLE的界面与PHYLIP类似,也是MS-DOS 下的软件。
PHYLO-WIN是LINUX下的一个软件。
界面友好,极易操作。
该界面如下图:Puzzle: http//:www.tree-puzzle.dePhylo-win: http//:www.evolution.bmc.uu.sePhylip、Treeview and Clustalx: http//:更多资料请访问:基因时代(),是一个全新的生物医药网站,致力于为生物医学工作者提供前沿的生物医学研究进展,提供一系列生物医学实验技术解决方案以及文献检索,论文写作相关经验技巧。
同时基因时代也为各生物企业提供了一个产品展示,信息发布的平台,以其与各生物企业一道共同推动中国生物产业的进一步发展。