进化树的研究

合集下载

系统进化树的解读

系统进化树的解读

系统进化树的解读
系统进化树,也称为分子进化树,是生物进化研究中的一个重要工具。

它通过分析不同生物的基因或蛋白质序列,揭示了生物之间的亲缘关系和进化顺序。

系统进化树的基础是假设所有生物都共享一个共同的祖先,并且随着时间的推移,这个祖先的子孙后代发生了分歧和变化。

这些变化体现在他们的基因或蛋白质序列上,因此可以通过对这些序列进行分析,来构建一个表示生物进化历程的树形图。

解读系统进化树需要一定的专业知识。

首先,你需要了解树中的各个物种是如何被分类的,以及它们在进化树中的位置。

这通常需要参考一些专业的生物学资料或数据库。

其次,你需要理解树中的分支长度和分支角度的含义。

分支长度通常表示从一个共同祖先到两个物种之间的进化距离,而分支角度则表示了这些物种之间的亲缘关系。

例如,如果两个物种在树的同一分支上,说明它们之间的亲缘关系较近;如果它们在不同的分支上,则说明它们之间的亲缘关系较远。

此外,你还需要考虑树的可靠性。

一些因素,如样本数量、采样范围和数据质量等,都会影响树的可靠性。

因此,解读系统进化树时需要谨慎对待,避免过度解读或误
导。

总的来说,系统进化树是一种强大的工具,可以帮助我们理解生物之间的亲缘关系和进化历程。

然而,解读系统进化树需要一定的专业知识和谨慎的态度。

只有这样,我们才能从这些树中获取准确的信息,并对生物进化有更深入的理解。

生物进化中的演化树

生物进化中的演化树

生物进化中的演化树生物进化是指生物在漫长的时间内通过遗传变异和适应环境的选择而逐渐发展和改变的过程。

而演化树(也称为系统进化树或谱系树)是一种用来描述不同物种之间进化关系的图形工具。

本文将就生物进化中的演化树进行探讨,分析其构建方法、意义以及应用。

一、演化树的构建方法演化树的构建基于大量的分子生物学和遗传学数据,包括DNA序列、蛋白质序列及其他分子标记。

通过对这些数据进行分析和比较,可以揭示出不同物种之间的遗传关系和进化距离。

常用的演化树构建方法包括距离法、最大似然法和贝叶斯法等。

距离法是通过计算不同物种之间的遗传距离来构建演化树,距离越短表示亲缘关系越近。

最大似然法则是通过估计进化模型参数,找到使观测数据出现概率最大的树形结构。

贝叶斯法则是根据贝叶斯定理,通过计算概率分布来构建演化树。

这些方法都具有各自的优缺点,研究者应根据实际情况选择合适的方法。

二、演化树的意义演化树能够揭示物种之间的进化关系,显示出不同物种的分支和演化路径。

通过演化树,我们可以了解物种的起源、扩散和分化过程,推测不同物种之间的共同祖先以及进化速率的差异。

此外,演化树还可以用来研究生物的起源和进化动力学,揭示生物多样性的形成和演化的规律。

三、演化树的应用演化树在生物学研究中有着广泛的应用。

在系统发育学中,演化树可以用来分类和鉴定物种,帮助我们了解物种间的亲缘关系以及演化的历史。

在人类起源和进化研究中,通过演化树可以追溯人类的进化历程和与其他灵长类动物的亲缘关系。

在遗传学研究中,演化树可以用于分析基因家族的起源和进化,研究基因表达的差异以及基因功能的演化等。

此外,演化树还可以应用于生物多样性保护和物种保护的决策制定。

通过了解物种的进化历史和亲缘关系,可以指导保护工作的开展,制定合理的保护策略和措施,保护濒危物种和生态系统的完整性。

总结:生物进化中的演化树是一种用来描述不同物种之间进化关系的图形工具,通过构建演化树可以揭示物种的起源、进化历程以及亲缘关系。

生物信息学进化树

生物信息学进化树

生物信息学进化树进化树是生物信息学中的一项重要工具,用于揭示生物物种之间的进化关系。

通过分析不同物种的基因组序列,可以推断它们之间的亲缘关系和进化历史。

进化树可以帮助我们了解生物的演化过程,揭示不同物种的共同祖先以及它们之间的分支关系。

在构建进化树的过程中,首先需要收集各个物种的基因组数据。

这些数据可以是DNA序列、蛋白质序列或其他形式的生物分子序列。

然后,通过比较这些序列之间的相似性和差异性,可以计算出它们之间的进化距离或相似性分数。

接下来,利用计算机算法可以根据这些进化距离或相似性分数构建进化树。

常见的算法包括最大简约法、邻接法和最大似然法。

这些算法会根据进化距离或相似性分数来确定物种之间的分支关系,从而构建出一棵树状图。

进化树的树枝代表物种的分支演化,而树叶代表当前的物种。

树枝的长度通常表示进化时间的长短,较长的树枝表示较早的分支,较短的树枝表示较晚的分支。

进化树的形态可以有很多种,例如二叉树、无根树和有根树等。

通过观察进化树,我们可以了解到不同物种之间的共同祖先以及它们之间的分支关系。

进化树的分支点代表物种的分裂事件,分支越早代表物种差异越大,分支越近代表物种差异越小。

进化树还可以显示出一些重要的进化事件,例如物种的起源、灭绝、迁移和适应等。

进化树在生物分类学、系统发育学和进化生物学等领域有着广泛的应用。

它可以帮助科学家研究物种的起源和演化过程,揭示生物多样性的来源和演变规律。

进化树还可以用于判断物种的分类和命名,帮助我们更好地理解和研究生物界的多样性。

近年来,随着高通量测序技术的发展,获得大规模的基因组数据变得越来越容易。

这使得构建进化树变得更加准确和可靠。

同时,生物信息学的快速发展也为进化树的构建提供了更多的工具和方法。

例如,基于分子标记的进化树、基于基因组的进化树和基于大数据的进化树等。

生物信息学进化树是一种重要的工具,可以帮助我们揭示生物物种之间的进化关系和演化历史。

通过构建进化树,我们可以了解到不同物种之间的共同祖先以及它们之间的分支关系。

动物进化的进化树物种关系与进化历程

动物进化的进化树物种关系与进化历程

动物进化的进化树物种关系与进化历程动物进化的进化树物种关系与进化历程是生物学中一个重要的研究领域。

通过构建进化树,我们可以了解不同物种之间的亲缘关系以及它们的进化历程。

本文将介绍动物进化的进化树、物种关系以及动物的进化历程。

一、动物进化的进化树动物进化的进化树是基于其遗传信息和形态特征的演化关系图。

这些树状图显示了不同物种之间的演化关系。

在进化树中,物种之间的分支表示它们之间的共同祖先,而分支之间的距离则表示演化的时间跨度。

进化树的分支越长,物种与物种之间的差距越大。

以鸟类为例,鸟类的进化树可以追溯到恐龙的共同祖先。

在进化树上,鸟类与鳄鱼和恐龙有共同的祖先,但与哺乳动物和爬行动物的共同祖先则远离。

这样的进化树分析可以帮助我们了解不同动物类群之间的演化关系,以及它们的共同起源。

二、物种关系通过进化树的构建,我们可以了解不同物种之间的亲缘关系。

物种之间的亲缘关系可以分为近缘种和远缘种。

近缘种指的是演化树上靠近的分支,它们有着较近的共同祖先,并且在进化过程中的分化时间相对较近。

例如,猫科动物中的狮子和老虎就是近缘种,它们有着共同的祖先,并且在较短的时间内分化出了不同的物种。

远缘种指的是演化树上较远的分支,它们之间的共同祖先更为遥远,并且在进化历程中的分化时间相对较长。

例如,鸟类和爬行动物就是远缘种,它们的共同祖先可以追溯到几亿年前。

三、动物的进化历程动物的进化历程是指动物从原始形态到现代多样化形态的演化过程。

通过对化石记录和遗传分析的研究,可以揭示动物的进化历程。

例如,鸟类进化历程的研究表明,鸟类起源于具有带状牙齿的小型肉食恐龙。

随着时间的推移,恐龙逐渐演化出了羽毛和飞行的适应性特征,并形成了现代鸟类。

这一进化历程的揭示对于我们理解鸟类的起源和多样化具有重要意义。

另一个例子是人类的进化历程。

通过研究早期人类化石和现代人类的遗传信息,科学家可以了解人类从灵长类到现代人的演化历程。

人类的进化历程包括了步行直立、大脑发展以及文化与语言能力的演化。

生物大数据分析中的进化遗传树构建方法与技巧

生物大数据分析中的进化遗传树构建方法与技巧

生物大数据分析中的进化遗传树构建方法与技巧进化遗传树(Phylogenetic Tree)是生物学研究中用于分析物种关系和演化历程的重要工具。

通过构建进化树,我们可以了解不同物种之间的进化关系,揭示物种的演化历史以及预测它们之间的共同祖先。

在生物大数据分析中,构建进化遗传树有着重要的意义,因为它可以帮助我们理解生物的遗传多样性、物种起源以及群体分化等重要生物学问题。

在构建进化遗传树的过程中,我们需要根据生物学数据来推断物种间的关系。

这些生物学数据可以是DNA或RNA序列、蛋白质序列、形态特征等。

为了准确地构建进化遗传树,我们需要选择合适的方法和技巧。

下面将介绍一些常用的进化遗传树构建方法和技巧。

1. 距离法(Distance-based methods):距离法是通过计算物种间的相似度或差异度来构建进化遗传树的方法。

常用的距离法包括最邻近法(Neighbor Joining)、最小进化法(Minimum Evolution)和最大简约法(Maximum Parsimony)等。

这些方法根据不同的算法和模型,通过计算物种间的距离矩阵来构建进化关系。

2. 贝叶斯方法(Bayesian methods):贝叶斯方法是一种基于统计模型和概率推断的进化遗传树构建方法。

它通过采用贝叶斯推断和蒙特卡洛马尔科夫链蒙特卡洛算法(MCMC)来估计进化树的拓扑结构和参数。

贝叶斯方法具有高度灵活性和更准确的模型,适用于复杂的进化树推断问题。

3. 最大似然方法(Maximum likelihood methods):最大似然方法是一种常用的基于概率统计的进化遗传树构建方法。

它通过最大化观测到的数据出现的概率,推断出可能的进化树。

最大似然方法考虑了模型中的参数估计问题,并用参数化的模型来描述进化过程,从而提高了推断结果的准确性。

在进行进化遗传树构建时,还有一些技巧需要注意,以保证结果的准确性和可靠性:1. 数据质量的控制:数据质量是构建进化遗传树的关键因素之一。

生物信息学中的序列比对与进化树构建算法研究

生物信息学中的序列比对与进化树构建算法研究

生物信息学中的序列比对与进化树构建算法研究序列比对是生物信息学中重要的分析方法之一,通过比对不同生物种类的DNA、RNA或蛋白质序列,可以揭示它们之间的相似性和差异性,并为分析进化关系、功能预测等提供基础。

序列比对的基本思想是将两个或多个序列进行比对,并找出它们之间的相似性。

在序列比对中,常用的方法有全局比对、局部比对和多序列比对。

全局比对方法是将整个序列进行比对,一般采用Needleman-Wunsch算法或Smith-Waterman算法。

这些算法根据序列间的单个碱基或氨基酸之间的匹配、错配和缺失情况,计算出序列的相似度得分。

全局比对方法适用于较短的序列,优点是能够找到完全匹配的区域,但是对长序列不适用,计算复杂度较高。

局部比对方法主要用于比对较长的序列或存在较大插入缺失的序列。

常用的算法有BLAST和FASTA算法。

这些算法采用快速搜索的策略,先找出序列间的高度相似的片段,然后再进行比对和分析。

局部比对方法能够找到较长序列内的相似片段,但可能无法找到全局的最优比对。

多序列比对方法用于比对三个或更多序列,揭示它们之间的共同特征和区别。

常用的方法有多重序列比对和进化树构建。

多重序列比对旨在将多个序列按照匹配和错配的原则进行比对,以找到共同的序列区域。

进化树构建方法基于序列的相似性和进化关系,将多个序列构建成进化树,以揭示它们之间的进化关系。

在序列比对的过程中,常用的比对算法还包括Pairwise比对、局部比对、多重比对等方法。

这些方法都有自己的特点和适用范围,根据具体的研究目的和数据特点选择合适的方法进行序列比对。

进化树构建是生物信息学中的重要研究方向之一,用于揭示不同生物种类之间的进化关系。

进化树是一种图形化的表示方式,能够清晰地展示物种间的分支关系、共同祖先以及进化时间。

进化树的构建主要基于序列的相似性和进化关系。

在进化树构建中,常见的方法包括距离法、最大简约法和最大似然法。

距离法基于序列间的距离矩阵,通过测量序列间的差异程度来构建进化树。

纯菌鉴定进化树

纯菌鉴定进化树

纯菌鉴定进化树纯菌鉴定进化树是一种通过分析微生物的遗传信息,构建菌株间进化关系的方法。

在微生物学和生物分类学中,了解不同菌株的进化关系对于研究它们的功能、生态和传播方式非常重要。

一、纯菌鉴定进化树的原理纯菌鉴定进化树的构建基于微生物遗传信息的比较。

微生物的遗传信息主要通过核酸序列(如16S rRNA序列)来表达。

通过测定不同菌株的核酸序列,并将这些序列进行比较,可以揭示它们之间的进化关系。

在构建进化树时,常用的方法是计算菌株间的遗传距离或相似性,并根据这些距离或相似性构建树状结构。

常用的计算方法包括最小进化距离法、最大似然法和贝叶斯推断等。

这些方法可以帮助确定菌株之间的亲缘关系,并揭示它们的进化历史。

二、纯菌鉴定进化树的方法构建纯菌鉴定进化树的方法通常包括以下几个步骤:1. 菌株的筛选和培养:从样品中筛选出需要鉴定的菌株,并进行纯化培养,确保研究对象的纯度和可重复性。

2. DNA提取和测序:从纯化的菌株中提取DNA,并进行测序。

常用的测序方法包括Sanger测序和高通量测序技术(如二代测序和三代测序)。

3. 序列比对和分析:将获得的核酸序列与数据库中已知的序列进行比对,计算菌株之间的遗传距离或相似性。

4. 进化树构建:根据菌株之间的遗传距离或相似性,使用适当的计算方法构建进化树。

常用的构建方法包括最小进化距离法、最大似然法和贝叶斯推断等。

5. 进化树的验证和解读:对构建的进化树进行验证和解读,评估其可靠性和解释其意义。

可以使用统计方法对进化树进行Bootstrap 分析,评估节点的支持度。

三、纯菌鉴定进化树的应用纯菌鉴定进化树在微生物学领域有广泛的应用。

以下是一些常见的应用:1. 物种鉴定:通过构建纯菌鉴定进化树,可以确定未知微生物菌株的物种归属,帮助进行准确的分类和鉴定。

2. 进化关系研究:纯菌鉴定进化树可以揭示不同菌株之间的进化关系,帮助研究者了解它们的起源和演化历史。

3. 功能预测:通过比较不同菌株的进化树,可以推断它们的功能差异和共同点,为研究微生物的功能和代谢途径提供线索。

基因进化树意义

基因进化树意义

基因进化树意义基因进化树是基于生物学家对生物基因及其关系的研究,根据相同基因序列和序列间不同之处构建起来的一种树状结构。

这种结构以浅色为根,深色为枝,树干上的节点代表基因的共同祖先,树枝代表了基因的演化历程和进化关系,而叶子则表示基因的存在状态。

基因进化树的意义是研究基因进化关系的重要工具之一,也是生物分类学、演化生物学、种群遗传学、分子进化、生物系统学等领域的基础。

首先,基因进化树可以揭示生物进化的关系。

生物进化受到环境和基因的影响,进而在漫长的进化史中形成了多样化的生物形态。

基因序列是生物进化最为基础的组成部分之一。

基因在不同物种间的变异、突变以及分离等环节,携带的信息也有所不同,经过多次变异和选择后,就能由单个基因发展演化而来。

因此,基因进化树可以反映不同物种之间的进化关系和演化过程,有助于逐一还原和分析生物种类的演化流程。

其次,基因进化树的研究可以帮助构建基因家族。

同一个种类的生物,都有着相似或相同的基因家族类型,这些基因家族的产生和演化的关系都通过基因进化树来反映。

对研究生物家族的形成过程,有助于加深对某些生物的组成和属性的科学认知,使人们对生命的认识更加深化。

第三,基因进化树还能研究群体遗传学与进化过程。

进入二十一世纪,随着生物技术的发展,基因序列比对和分析技术也相应的发展和进步了。

基因进化树可以揭示不同种群间的遗传标记,推断种群遗传结构和演化路线,更好地解决种群遗传学和进化生物学中的问题。

例如,在生命树中,通过基因进化树的系统发育分析,可以推断在哺乳动物之类的动物中,不同物种的共同祖先、进化路线和演化模式,以及不同物种间的生物地理分布等。

第四,基因进化树还可以揭示分类学。

现代分类学起源于卡尔·林奈的工作,随后发展成为若干分类学派别,旨在将不同物种归类为不同的种类,同时研究物种间的相似性和差异性。

基因进化树将不同物种的基因序列联系起来,有助于将不同的有机体归类和分析它们之间的关系,以更好地反映生命的本质和分类学。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 引言生物信息学是生物技术的核心,是在分子生物学和信息科学共同发展的基础上产生的一门交叉学科,包含对生物数据的获取、处理、存储、分发、分析、挖掘等方面的研究内容。

生物信息学的研究对于最终改善人类自身生活质量,解决健康问题等也有重大的作用。

随着分子生物学的不断发展,人们惊奇地发现DNA 的双螺旋结构中蕴涵着生命的密码,四种核苷酸的排列、变化包含着许多遗传、进化信息。

人类基因组计划以来,有关核酸(或蛋白质)序列和结构的数据成指数增长,而面对如此复杂的数据,计算机在此方面的应用必不可少。

因此,生物信息学研究的目的就在于,人们通过数学、计算机科学等各种工具,可以阐明和理解大量数据包含的生物学意义。

由于深度测序和基因芯片技术的不断完善和发展,表达谱、转录组、基因组等数据不断增长。

到目前为止,已被测序的昆虫基因至少有10个,被报道的转录组数据也有30多个。

生物信息学在昆虫学研究中的应用价值随着昆虫学研究的不断深入和昆虫生物数据的大量积累越来越明显。

大量医学昆虫、经济昆虫和农业昆虫的基因组在模式昆虫果蝇的基因组测序成功之后也相继被测序。

昆虫种类繁多、进化关系复杂、个体发育系统多样对于生物的多样性组成也占有举足轻重的地位。

此外,昆虫与人类的日常生活和生产亦有密切的关系。

例如,家蚕、蜜蜂等经济类益虫能够为人类提供日常生产资料和生活资源,害虫能给人类带来巨大的损失。

对昆虫基因组进行深入研究不仅能为传统昆虫学科的发展提供崭新的机遇,而且对深入了解昆虫的多样性及其生物学特征与本质具有重大意义。

所有生物都可以追溯到共同的祖先,生物的产生和分化就像树一样的生长,分叉,因此以树的形式来表示生物间的进化关系是非常合理的。

根据各类生物间的亲缘关系的远近,把生物安置在树状图表上,简明地表示生物的进化历程和亲缘关系的树状结构就是进化树。

在进化树上每个叶子结点代表一个物种,每一条边都被赋予一个适当的权值的话,两个物种之间的差异程度就可以用两个叶子结点间的最短距离来表示。

2 生物信息学2.1 生物信息学的诞生1953年Watson 和Crick发现了DNA的双螺旋结构,开辟了现代分子生物学的新纪元。

遗传中心法则的提出大大推动了分子生物学的发展。

随后,限制性内切酶的发现、重组DNA克隆技术的实现是新一代深度测序的基础,同时也是海量生物数据产生的重要推动力[1]。

1961年,计算科学首次被应用于基因和蛋白质的进化分析中。

1990年人类基因组计划正式启动。

此后更多的生物基因组测序计划开始进行,生物数据不断积累。

然而缓慢的信息挖掘速度与成指数级增长的生物数据形成了巨大差距,这种差距进一步推动了生物信息学的发展。

2.2 生物信息学的概念生物信息学以数学、信息学和计算机科学为主要手段,运用计算机软、硬件和计算机网络,对核酸、蛋白质等生物大分子数据库进行研究;对数据库中的原始数据进行存储、管理、注释、加工等, 形成具有明确生物意义的生物信息;通过信息查询、搜索、分析、比较,获取基因编码、核酸和蛋白质结构功能及其相互关系等知识;在大量信息和知识基础上, 探索生命起源、进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学问题, 搞清它们的基本规律和时空联系,建立“生物学周期表”。

广义地说, 生物信息学是一门使用数学和信息学的观点、理论和方法研究生命现象、组织和分析迅速增长的生物信息数据的学科。

主要研究的是遗传物质的载体DNA 及其编码的大分子物质量,以计算机为主要工具,对各种学科交叉的生物信息学进行研究,找其规律性,发展出适合它的各种软件,对不断增长的DNA(蛋白质)序列和结构进行收集、整理、提取、加工、分析等。

狭义地说,生物信息学是以计算机科学和数学为主要工具,对生物大分子进行信息的获取、加工、存储、分类、检索等。

通过分析逐步认识生命的起源、进化、遗传和发育的本质,逐步破译隐藏在DNA 序列中的遗传语言,在分子基础上解释人体生理和病理过程,为人类疾病的诊断、预防和治疗提供最合理、有效的方法或途径是生物信息学研究的最终目的[2]。

2.3生物信息学在昆虫研究中的前景和展望由于测序技术不断发展,10年左右可能会形成昆虫测序的高峰期。

但昆虫种类多、进化关系复杂、基因杂合度大,基因组测序工作和分析工作仍有很大困难。

昆虫基因数据虽然获得了大量积累,并且正成指数级增加,但相对自然界丰富的物种来说,目前已获得的遗传信息仍然是非常渺小的。

生物信息学在昆虫学领域的应用仍处于起步阶段,有很大的发展空间。

昆虫基因数据的大量积累也将大大推动对资源昆虫的利用和害虫的控制,甚至有可能开辟资源昆虫利用的新领域,催生出全新的害虫控制技术。

3 基于基因组的昆虫学研究应用随着越来越多的昆虫正在进行或已经完成基因组测序,现阶段昆虫学的研究已经步入了基因组时代。

基因组时代的昆虫学研究方法相比于传统的昆虫学研究被赋予新的时代特征,其中基因组时代昆虫学研究应用包括:1)在个体生物学研究中的应用2)在多物种间及种群研究中的应用3)在系统生物学研究中的应用4 基因组时代昆虫学研究所面临的挑战4.1 未来发展趋势预计未来5到10年,随着大量昆虫的基因组测序工作的完成,昆虫学研究将迈向基因组时代的全盛期。

昆虫学的研究也将步入后基因组时代,即功能基因组时代。

我们要逐渐将个体生物学、进化学向多物种间或种群内不同个体间的基因组学过渡;将传统的生态学、生理学、行为学以及分子生物学相关研究逐步向更为全面的系统生物学过渡。

4.2 存在的问题与对策综合国内外现有的有关昆虫功能基因组学及结构基因组学的研究,发现虽然基因组时代的昆虫学研究进展迅速,但也存在以下4个主要问题和不足[3]。

1)全基因组测序的昆虫样本准备起来较为困难,导致难以获得纯和的DNA。

2)测序方法选择错误:选择第2代测序方法产生的片段较短,后续拼接组装难度较大,易造成测序缺口。

3)多重视结构基因组草图绘制时,遗传图谱构建和遗传标记的筛选被忽视,缺乏绘制精细物理图谱的有效手段。

4)大多非模式昆虫缺少遗传群体和突变体库。

针对基因组时代昆虫学研究存在的4大困难,提出以下对策:1)建立并优化供试昆虫多代自交、继代饲养体系。

2)采用第2代测序技术与传统建立人工染色体库相结合的方法。

3)在开展昆虫全基因组测序工作之前,先初步完成对供试昆虫遗传图谱构建和遗传分子标记筛选。

4)根据昆虫自身特征,对已完成的全基因组测序工作的昆虫基因的编码和非编码基因序列选择合适的功能基因组学研究手段开展研究。

5 进化树5.1 进化树的定义及形式利用DNA序列进行发育分析,推断并评价在分子水平上物种的进化关系,并用分支图的形式表现出来,这种图就是进化树。

进化树有多叉树,但通常情况是二叉树。

它分为有根(rooted)树和无根(unrooted)树两种。

有根树反映了树上物种的时间顺序,而无根树只反映分类单元之间的距离不涉及谁是祖先的问题。

也就是说,有根树的根节点为全部分类单元最近的共同祖先,它反映了分类单元间的进化关系,而无根树仅反映出分类单元间的分类关系[4]。

如图5.1,表示了4个物种(A、B、C、D)的2种有根树和1种无根树形式。

图5.1 4个物种(A、B、C、D)的2种有根树和1种无根树形式。

5.2 构建进化树的目的和作用构建进化树的目的是重塑物种(分类群)之间的进化关系,并以进化树的形式描述和展现:树的叶子结点代表某个序列的来源物种,数的拓扑结构表现了各物种间亲缘关系的远近,树的分枝长度刻画了进化树距离的大小。

根据进化树的拓扑结构可以研究生物蛋白质分子以及病毒、细菌以至大型哺乳动物等各种有机体之间的生物进化关系。

通过进化树的支长长度可以近似估计分类群的分化时间。

进化树的理论意义是在于它有助于了解物种的进化历史,为生物学中物种的分类提供可靠依据;实际应用价值在于它在预测DNA分子的高级结构、蛋白质、基因的表达过程、辅助药物设计、结构多序列比对等方面均有重要作用。

5.3 构建进化树的主要过程构建进化树的主要过程包括:1)获取同源序列数据2) 确定进化模型3) 进行多序列比对4)根据比对结果提取信息5)选择建树算法与参数构建进化树6 同源数据的获取所谓同源序列简单的说:是指从某一共同祖先经趋异进化而形成的不同序列。

NCBI(National Center for Biotechnology Information)美国国立生物技术信息中心,负责管理GeneBank。

GeneBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核苷酸序列。

GeneBank是最常用的数据库,同时还有DDBJ(DNA Data Bank of Japan)日本DNA数据库,以及EMBL(European Molecular Biology Laboratory)欧洲生物信息研究所的欧洲分子生物学实验室核苷酸数据库。

这三个中心都可以独立地接受数据提交,而且3个中心之间逐日交换信息,并制成相同的充分详细的数据库向公众开放。

因此,同源序列可以通过网络在NCBI等数据库中获取。

根据NCBI数据库记载,已经完成拼接或正在绘制的昆虫基因草图已有50多个。

7 构建进化树的方法及特点系统进化树的构建从方法上可以分为2类:距离法和离散特征法。

距离法首先构造一个距离矩阵,矩阵上的元素代表每两个生物之间的距离,利用不同的聚类方法得到系统进化树。

典型的基于距离的方法有UPGMA、NJ、和Fitch –Margoliash。

UPGMA只适用于进化树中各个分支进化速率相同的情况;NJ法能够较快地生成单一亲缘的进化树,但构建的进化树不够准确;Fitch-Margoliash法比UPGMA准确。

距离法是基于距离的聚类算法,运算量小,但不能确定进化分支时间。

离散特征法根据最优原则不同分为最大似然法(ML)和最大简约法(MP)。

ML和MP是基于特征或符号的构建进化树的方法,事先不需要规定距离测度计算距离矩阵,而是直接通过各分类群序列的碱基或氨基酸顺序来构建进化树。

其计算量比距离矩阵法大,对于大种系发育分析来说距离矩阵法比较常用。

距离法、最大简约法、最大似然法在分子序列间的分歧度不高且序列较多时往往构建出具有相似拓扑结构的进化树。

但是还是存在着存在拓扑差异。

因此有必要了解进化树的构建特点,以便对特定的序列选择合适的构建进化树的方法。

UPGMA(Unweighted Pair Group Method with Arithmetic mean)假设存在一个分子钟,即在进化过程中所有的核苷酸或氨基酸有相同的变异率。

在不同谱系间进化速率差异较大、有同源序列的平行进化或进化树的状态空间大示,一般不宜采用此方法。

NJ法经常被使用,它计算速度最快,并且构建的进化树相对准确。

相关文档
最新文档