浅谈系统发育分析

合集下载

第九章 系统发育分析

第九章 系统发育分析

第九章系统发育分析Mark A. Hershkovitz and Detlef D.LeipeNational Center for Biotechnology InformationNational Library of MedicineNational Institutes of HealthBethesda,Maryland系统发育学研究的是进化关系,系统发育分析就是要推断或者评估这些进化关系。

通过系统发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同一谱系的进化关系,包括了分子进化(基因树)、物种进化以及分子进化和物种进化的综合。

因为”clade”这个词(拥有共同祖先的同一谱系)在希腊文中的本意是分支,所以系统发育学有时被称为遗传分类学(cladistics)。

在现代系统发育学研究中,研究的重点已经不再是生物的形态学特征或者其他特性,而是生物大分子尤其是序列。

尽管本章的目的是想描述一个万能的系统发育分析方法,但是这个目标过于天真,是不可能实现的(Hills et al.,1993)。

虽然人们已经设计了大量的用于系统发育的算法、过程和计算机程序,这些方法的可靠性和实用性还是依赖于数据的结构和大小,因此关于这些方法的优点和缺点的激烈争论成了分类学和系统发育学期刊的热门课题(Avise, 1994:Saitou, 1996; Li, 1997; Swofford et al., 1996a)。

Hillis等人(1993)曾经极其简单地介绍过系统发育学。

比起许多其它学科而言,用计算的方法进行系统发育分析很容易得到错误的结果,而且出错的危险几乎是不可避免的;其它学科一般都会有实验基础,而系统发育分析不太可能会拥有实验基础,至多也就是一些模拟实验或者病毒实验(Hillis et al., 1994);实际上,系统发育的发生过程都是已经完成的历史,只能去推断或者评估,而无法再现了。

浅谈系统发育分析及进化树制作课件

浅谈系统发育分析及进化树制作课件
浅谈系统发育分析及 进化树制作课件
THE FIRST LESSON OF THE SCHOOL YEAR
目录CONTENTS
• 系统发育分析简介 • 进化树基本概念 • 进化树的制作方法 • 系统发育分析的挑战与未来发展 • 实践案例分享 • 总结与展望
01
系统发育分析简介
定义与重要性
定义
系统发育分析是一种研究生物种群进化历程和亲缘关系的方法,通过比较不同 物种间的基因、蛋白质等分子序列差异,构建进化树来揭示生物的演化关系。
重复构建
为确保结果的稳定性,对同一数据集进行多次重复构 建进化树。
01
系统发育分析的挑 战与未来发展
当前面临的主要问题
数据获取与整合
系统发育分析需要大量的基因序 列数据,如何高效获取和整合这 些数据是一个挑战。
算法复杂度与计算
资源
随着数据量的增长,传统的系统 发育分析算法面临计算效率和资 源消耗的挑战。
物种间基因序列差

不同物种的基因序列存在较大差 异,如何准确识别和比较这些差 异是系统发育分析的关键。
未来发展方向与趋势
Байду номын сангаас
01
大数据技术的应用
利用大数据技术对海量基因序列 数据进行处理和分析,提高系统 发育分析的效率和准确性。
02
算法优化和并行计 算
通过算法优化和并行计算技术, 降低系统发育分析的计算复杂度 ,提高计算效率。
基于已知物种的进化关系 ,构建一棵假设树,常用 软件如RAxML。
贝叶斯法
基于贝叶斯统计理论,模 拟基因序列的进化过程, 常用软件如MrBayes。
参数设置与优化
模型选择
根据基因序列的特点选择合适的进化模型,如GTR、 GTR+I+G等。

实习五:系统发育分析-PHYLIP,MEGA, MrBayes

实习五:系统发育分析-PHYLIP,MEGA, MrBayes

实习五:系统发育分析-PHYLIP,MEGA, MrBayes学号姓名专业年级实验时间提交报告时间实验目的:1. 学会使用PHYLIP,MEGA和MrBayes构建进化树2. 学会分析建树结果,体会各种方法差异实验内容:系统发育(phylogeny)也称系统发展,是与个体发育相对而言的,它是指某一个类群的形成和发展过程。

系统发育学的目的是研究进化关系,系统发育分析就是要推断或者评估这些进化关系。

通过系统发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同一谱系的进化关系,包括了分子进化(基因树)、物种进化以及分子进化和物种进化的综合。

多序列比对的目标是发现多条序列的共性。

本次实验旨在使用PHYLIP,MEGA和MrBayes构建进化树,并通过分析构树的结果,了解各方法的差异性。

作业:1. List the title of the orthologous nucleotide and protein sequences you found from Practice 1. Build phylogenetic trees with PHYLIP, MEGA and MrBayes respectively. Make a simple comparison the trees you have got, and try to explain the difference.核酸序列使用的是来自Trifolium repens(白车轴草)硬粒小麦(Triticum durum)Camellia sinensis(山茶)Cicer arietinum (鹰嘴豆)及Glycine max(大豆)dehydrin的编码脱水素(dehydrin)的DNA序列,这些物种将分别以TF,TC,Cam,Cic及Gly表示;首先对于PHYLIP中的关系,通过五种算法的构树结果可以发现其树形的差异不大。

如何利用生物大数据进行系统发育分析

如何利用生物大数据进行系统发育分析

如何利用生物大数据进行系统发育分析生物大数据的迅速积累和高精度的分析工具的发展,为生物学研究提供了前所未有的机会。

其中,生物大数据在系统发育分析方面的应用尤其引人关注。

系统发育学旨在揭示物种之间的进化关系,了解生命的起源、进化和分布等基本问题。

本文将介绍如何利用生物大数据进行系统发育分析,并探讨其在生物学研究中的潜在价值。

1. 数据收集与整理首先,要进行系统发育分析,需要收集和整理一定数量和质量的生物序列数据。

这些数据可以是DNA、RNA或蛋白质序列,可以通过公开数据库(如GenBank、NCBI等)获取。

为了确保数据的准确性,可以对获取的数据进行筛选和清理,去除低质量序列和存在缺失的数据。

2. 序列比对与建立进化树获取和整理好的生物序列数据,可以通过序列比对软件进行比对。

常用的序列比对软件包括BLAST、MAFFT、Clustal等。

通过比对,可以找到序列之间的相似性,为后续的进化树构建提供基础。

建立进化树是系统发育分析的核心步骤之一。

进化树揭示了物种之间的亲缘关系,可以指导物种分类和演化研究。

常用的建树方法有最大简约法、最大似然法和贝叶斯推演法等。

这些方法可以结合已知的物种分类信息和序列比对结果,构建出一棵合理的进化树。

3. 进化模型选择与分析在建立进化树之前,需要选择合适的进化模型。

进化模型描述了序列的进化过程,不同模型具有不同的复杂度和解释能力。

选择合适的进化模型可以提高分析结果的准确性。

常用的进化模型选择方法有AIC(赤池信息准则)、BIC(贝叶斯信息准则)和LRT(似然比检验)等。

这些方法通过对比不同模型的假设和数据拟合情况,选择最合适的模型进行进化分析。

4. 分子钟估计与进化速率分析在建立进化树的基础上,可以通过分子钟推断方法估计物种分化的时间。

这需要根据已知的地质事件等时间点,将进化树的分支长度与时间进行关联。

分子钟估计方法包括最小二乘法、贝叶斯方法等。

进化速率可以用来研究物种的演化速度和适应性。

浅谈系统发育分析方法

浅谈系统发育分析方法
(2) 基 于 最 优 原 则 的 方 法 I:I 基 于 最 优原则的方法从数学 角度讲就 是在 评价 树 的 最 优 标 准 的 基 础 上 ,找 到 使 得 目标 函 数 最 优 的 树 。 目前 最 常 用 两 种 基 于 最 优 原 则 的 方 法 有 最 大 简 约 标 准 (m a x i m U m P a r sim OnY, 简 称 M P)和 最 大 似 然 (maximum likelihood,简称 ML)标准 。 虽 然 每 种 最 优 原 则 都 有 不 尽 相 同 之 处 , 但是不论是基于最大 简约标准 的方法还是 基于 最 大似 然标 准 的方 法 ,它们 构建 系 统 发 育 树 的 最 根 本 的 思 路 是 相 同 的 , 即 首 先 找 出 由 对 象 形 成 的 所 有 可 能 的 树 ,
分 子 生 物 学 技 术 的 发 展 以 及 生 物 分 子 数 据 的 积累 ,系统发 育分析进 入 了分 子层次 。 分子 系统发 育分 析中常用的生物大分子是 作 为生 命机 器的蛋白质和作为遗传物质的 核酸 。早期 的研 究工作主要是 利用不同物 种 中同一种 基因 /蛋 白质序列 的异 同重建 系统 发育树 ,并研 究各物种 的进化关 系 。 近年来 ,较多模式生 物基 因组测序 任务的 完 成 以 及 蛋 白质 组 学 的发 展 ,为 从 “组 ”水 平 进 行 系 统 发 育 研 究 提 供 了条 件 ,但 同 时也对现有的 系统发 育分析 方法提 出了挑 战 。 源自l§I曩 ◇ 0≮ ◇≮器 毒羹 一
系统 发育 分析 ; 分 子进 化 ; 序 列 比 对
引言
地 球上 的一 切生 命形 式 ,不 管是 现 存 的还 是 已 经 灭 绝 了的 ,都 由于 一 个 共 同 的进化 历史而有着不 同程度的关联 ,这种 关联也使研究物种之 间进化关 系的学科一 系统 发育学 变得非常有意 义。追溯 生物 界 不同生物类型的起源及进化关系 ,即重 建 生 物 类 群 的 系 统 发 育 树 已经 成 为 生 物 信 息 学中一个十分重要的研究内容 ,并 日益受 到 广 泛 的 关 注 。

系统发育树的构建与分析方法

系统发育树的构建与分析方法

系统发育树的构建与分析方法概述系统发育树是生物学中重要的研究工具,通过构建系统发育树可以探究生物之间的关系,研究进化过程和生物多样性。

本文将介绍系统发育树的构建和分析方法。

系统发育树的构建方法系统发育树的构建方法可以分为以下几种:1. 相似性分析法相似性分析法是最简单和常用的构建系统发育树的方法之一。

该方法通过比较不同物种的形态、行为、生理等特征的相似性,判断它们之间的亲缘关系。

这种方法的局限性在于很多特征可能出现多次独立进化,而不是从共同祖先继承的。

2. 分子序列分析法由于DNA或蛋白质序列的进化是按照分子钟模型进行的,因此分子序列分析成为当前构建系统发育树的最常用和最准确的方法之一。

该方法通过比较生物体DNA或蛋白质序列的差异,建立相似度矩阵,并在此基础上运用数学模型进行树的构建。

3. 基因组分析法基因组分析法通过直接比较不同生物体的基因组,从而确定它们之间的进化关系。

这种方法包括全基因组比较和重构古基因组。

4. 形态-分子组合分析法形态-分子组合分析法是将形态特征和分子特征结合起来分析生物之间的进化关系。

在这种方法中,形态特征通常用于解决分子序列存在误差的问题。

系统发育树的分析方法系统发育树的分析方法包括静态分析和动态分析两种。

静态分析静态分析是指对系统发育树形态和拓扑关系的分析,这种方法主要依靠人工分析和软件分析两种方式。

1. 人工分析法人工分析法主要是通过比较不同树之间的拓扑结构和相应的节点值,判断它们之间的相关性。

人工分析法需要手动绘制树,并用统计方法比较不同树之间的相似性。

2. 软件分析法软件分析法主要是应用多种专业软件进行计算和模拟,比如molecular evolution software suite (MEGA)、PAUP和PhyML等。

这种方法可以减少人力工作,提高分析准确性。

动态分析动态分析是指以时间序列为基础,考察系统发育树演化的过程和趋势。

这种方法主要依靠统计分析方法,如马尔科夫链蒙特卡罗(MCMC)、Bayesian标记链蒙特卡罗(MCMC)等。

人体生殖系统发育解析

人体生殖系统发育解析

人体生殖系统发育解析人体的繁衍后代对于动物来说是至关重要的生命活动,而人体的生殖系统就是实现这一目标的管道。

生殖系统的发育经历了一系列复杂的过程,其中涉及到多个器官和激素的调节作用。

本文将对人体生殖系统的发育进行细致的解析。

发育的起点可以追溯到胎儿期。

在胎儿期,性腺已经开始形成,男性胎儿的性腺是睾丸,女性胎儿的性腺是卵巢。

初级性腺内含有原始生殖细胞,这些细胞是胚胎时期形成的。

在胚胎发育的过程中,原始生殖细胞从胚胎的上胚层迁移到生殖脊,并最终进入性腺。

随着胚胎的发育,性腺经历着逐渐成熟的过程。

在这个过程中,性腺不仅增大,还逐渐分化为男性或女性的特殊结构。

在男性胎儿身上,睾丸开始产生睾丸素,它是男性生殖系统的关键激素。

睾丸素的作用是促进男性性征的形成,如阴茎和睾丸的发育。

而在女性胎儿身上,卵巢产生雌激素,它是女性生殖系统的关键激素。

雌激素的作用是促进女性性征的形成,如乳房和子宫的发育。

到了青春期,人体生殖系统进一步发育。

青春期是性腺发育的关键阶段,随着性腺的发育,性激素的分泌水平逐渐上升。

在男性身上,睾丸素的分泌导致睾丸迅速增大,并促进精子的形成。

男性性征如声音突变、面部和体毛的生长也会随着睾丸素的增加而出现。

而在女性身上,卵巢持续产生雌激素,导致乳房发育、月经周期的建立以及骨骼的生长。

除了性腺的发育,其他器官例如输精管、子宫、阴道等也在青春期发生相应的变化。

输精管、子宫和阴道的发育对于女性的生殖功能起着至关重要的作用。

在女性身上,子宫内膜的发育和排除是月经周期的重要表现。

而在男性身上,输精管的发育和睾丸中的精子形成一起构成了精液的运输通道。

总结起来,人体生殖系统的发育是一个多器官、多激素共同作用的复杂过程。

从胎儿期到青春期,性腺和其他相关器官的发育逐渐完成,进而实现生殖功能。

生殖系统的发育对于个体的性别特征和繁殖能力起着决定性的作用。

通过深入了解生殖系统的发育过程,我们可以更好地理解人类的繁殖机制,以及性别特征的形成。

浅谈系统发育分析

浅谈系统发育分析

评估进化树和数据
系统发育信号
数据信号和随机数据作对比实验(偏斜和排 列实验)
进化树的稳健性
对观察到的数据重新取样,进行进化树的支 持实验(非参数自引导和对折方法)
实际应用中应注意的问题
输入数据的质量; 从尽可能多的角度观察数据; 分类群(外围、内在)选择; 如何看待处理结果?
一个令人苦恼的问题:How to get a real tree?
理论依据(2)
进化及遗传模型(Penny et al., 1994) 模型组成:
1、序列有指定的来源并且正确无误。 2、序列是同源的,而序列不是“paralog“的混合物。 3、序列比对中,不同序列的同一个位点都是同源的 4、在接受分析的一个序列组中,序列之间的系统发育史 是相同的。 5、样本足以解决感兴趣的问题。
距离建树方法
非加权配对组算术方法(UPGMA, unweighted pair group method with arithmetic mean) 相邻连接方法(NJ,neighbor joining) 最小进化方法(ME,Minimum Evolution)
Distance-based methods
理论依据(1)
分子时钟假说:
对于每一个给定的基因(或者蛋白质),其分子 进化大致是恒定的。
意义:
如果蛋白质序列的进化保持一个恒定的速率,那么 这个速率就能被用于推算不同物种序列的发生分化的时 间。 分子时钟假说并不适用于所有的蛋白质。分子时钟 只能用于在长期进化历程中仍保持其生物学功能的那些 基因。
PAUP
scavotto@或) ftp:///paup8
MEGA5 q
http://bioinfo.weizmann.ac.il/da tabases/info/mega.sof
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 序列相似性:序列比对过程中用来描 述检测序列和目标序列之间相似DNA碱基或 氨基酸残基序列所占比例 同源性:两个基因或蛋白质序列具有共同祖 先的结论 备注:同源序列多表现一致性,相似不一定 同源
直系同源
旁系同源
• 单系类群(monophyletic group)包含一个祖先 类群所有子裔的群组称为单系类群,其成员间存在共同祖 先关系 • 并系类群(paraphyletic group)和复系类群 (polyphyletic group):不满足单系类群要求,各成员间 又具有共同祖先特征的群组称为并系类群;各成员不具有 共同衍生特征也不具有共同祖先特征,只具有同型特征的 分类群组称为复系类群 • 内类群(ingroup):一项研究所涉及的某一特定类群可 称为内类群 • 外类群(outgroup):不包含在内类群中又与之有一定关 系的类群,为了比较内类群中各成员的特征差异.
序列比对 • 序列比对分为双序列比对和多重序列 比对。双序列比对表示两条序列之间的变化 • 分类群数目较少且序列较短的对位排列, 可以用手工排序,但数目多且序列较长的 对位排列,一般使用计算机软件进行处理 ,如CLUSTAL系列软件正是必不可少的常 用软件,利用软件进行排序会有一些偏差 ,这时就需要手工进行校正 实现软件:ClustalX、BioEdit
外类群选择 • 选择一个或多个已知与分析序列关系较远 的序列作为外类群; • 外类群可以辅助定位树根; • 外类群序列必须与剩余序列关系较近,但 外类群序列与其他序列间的差异必须比其 他序列之间的差异更显著
确定核苷酸替代模型——似然法
• 对于氨基酸序列的替代通常使用 P 距离、泊松校 正距离或Г距离来计算距离矩阵 • 对于 DNA序列恢复突变与同义替代的可能性大大增加, 需要选择适合的核苷酸替代模型将序列中的碱基替换比率 信息加入到距离测度 • 常用的替换模型包括Jukes-Cantor 模型、Kimura 模型、 Tamura-Nei 模型 实现软件:Modeltest,对56个DNA进化模型进行检验,目 前jModelTest能实现88个
1
进化树 进化树
6
时间度量树 时间度量树
Taxon B Taxon B
1
Taxon C
Taxon C
Taxon A Taxon D
Taxon A Taxon D
无意义
遗传变化
时间
• 系统树分为两种树,有根树(含外类群)和无根树 (不含外类群) • 有根树的根节点为全部分类单元最近共同祖先, 它反映了 分类单元间的进化关系, 而无根树仅反映出分类单元间的 分类关系
距离法包括UPGMA、ME法、NJ法等 实现软件MEGA、PHYLIP等
距离矩阵法-UPGMA法 • 基本假设是各分类群的进化速率相同,因 此从祖先节点分离的两个分类群到该祖先 节点的分支长度相等 • 首先计算各分类群两两间的进化距离,将进 化距离最小的两个分类群(如A、B)最先聚 合,将A、B合并成一个聚合群C,用C代替A 和B,计算C与剩余分类群两两间的进化距离, 再次将距离最小的两个分类群聚合,合并为 一个聚合群D,依此循环计算,直至所有分类 群都包含在一棵树中
替代
插入
缺失
倒位
分子钟:在各种不同的发育系谱(lineage )及 足够大的进化时间尺度中,许多序列的进 化速率几乎是衡定不变的 中性进化学说:大多数突变基因在选择上是 中立的,即无益又无害,中立突变基因在 群体中的固定是随机漂变引起的因此功能 上重要的 基因受到更多的选择压力而进化 速率较慢新基因产生的主要方式是基因重 复和不等交换.
构建系统树的方法
距离矩阵法 最大似然法
最大简约法 Mrbayes法等
计算速度:距离法
>最大简约法 >最大似然

距离矩阵法
• 不同DNA域进化模式不一致,通常用于系统发生 分析的DNA序列均来自编码区, 若不考虑密码子的简并, 并 假定所有位点的替代速率均相同,就能根据核苷酸替代模 型估算出进化距离 ( 如 JC 距离、Kimura 距离等) 。若替 代速率服从分布,则为相应的距离。距离法首先估算序列 两两间的进化距离,然后根据不同的算法,从进化距离最短 的开始依次聚类,利用距离方阵计算出最优树,或将分枝长 度之和最小化,获得优化树。
二、基本概念介绍
• DNA有四种碱基(A、T、C、G)组成,基因是有这 四种碱基线性排成的长链 基因:DNA转录区、5'和3'非转录侧翼区3个部分构成。
GT..AG DNA 5'调节区 前mRNA 5'非翻译区 内含子1 外显子1 内含子剪接 翻译 外显子 3 3'非翻译区 外显子1 转录 内含子2 GT..AG 3'末端
• 树的拓扑结构表现了各物种间的亲缘关系 • 树的分枝长度刻画了进化距离的大小
分支/世系
末端节点 代表最终分 类,可以是 B 物种,群体 C ,或者蛋白 质、DNA、 D RNA分子等
A
祖先节点/ 树根
内部节点/分歧点,该 分支可能的祖先结点
E
系统发育树类型
分支图 分支图
Taxon B Taxon C Taxon A Taxon D
理想的途径通常用化石作为证据,但是化 石零散不完整 大多数研究者转向形态比较学和比较生理 学的方法,得到有机体进化关系的主要框 架,详细的进化关系无法得出,较主观 DNA遗传物质的发现,考虑基因的进化是 否有其规律性?能否用数学模型来描述其 Yes 规律性? 系统树的产生
Background • 1964年,Linus Pauling提出分子进化 理论 • 从物种的一些分子特性出发,从而了解物 种之间的生物系统发生的关系。 • 发生在分子层面的进化过程:DNA, RNA和 蛋白质分子 • 基本假设:核苷酸和氨基酸序列中含有生 物进化历史的全部信息。
• 缺点:UPGMA 法在不同谱系间进化速 率有较大差异或有同源序列的平行进化时常 得出错误的拓扑结构,而且当进化树的状态 空间较大时,UPGMA法的可操作性极差, 因 而该建树方法的使用极为有限 现在这种建树方法很少用
距离矩阵法-ME法
• 最小进化法(ME)的理论基础源于Rzhetsky 和Nei的 数学证明:当距离使用无偏估计时,树的真实拓扑结构的分支 长度和的期望值最小 • 基本假设是:在所有可能的拓扑结构中,真实树对应的进 化过程所需的突变或替代次数最少,即系统树的分支之和 具有最小值 • 该方法需要处理所有可能的拓扑结构,5节点的无根树具 有15种可能拓扑,10节点时就有2027025种可能拓扑,因 此当分类群数量增大时该方法并不实用
பைடு நூலகம்
MP-最大简约法
• 对系统发生分析而言,该法则有两层含义[11]: 一是用最少的进化事件( 如突变) 去解释观察到的数据; 二是 在任何进化模型或机制下,假设尽可能少。具体来说最优 树就是在解释整个进化过程时,全部位点的最小核苷酸替 代数之和最小的树 i: AGGGTAACTG j: ACGATTATTA k: ATAATTGTCT l: AATGTTGTCG
浅谈分子进化与系统 发育分析
Molecular Evolution and Phylogenetics
李杨坤 Tell:13141385040 Email:lyk_caf@
报告内容
介绍其发展背景
针对相关基本概念介绍
系统发育树的构建方法与原理 正确树后期处理软件应用
一、研究背景
自达尔文时期,许多生物学家梦想着,能用一种 树的形式来描述地球上所有生命的进化历史
树A( 0 3 2 2 0 1 1 1 1 3) ;树 B( 0 3 2 2 0 1 2 1 2 3) ; 树 C( 0 3 2 1 0 1 2 1 2 3)
简约法是一种不依赖任何进化模型的统计方 法,能快速地分析出大量序列之间的系统发生关系, 所构建的树中的短分支更接近真实。 缺点:简约树的分值完全决定于所有重建祖先序列 中的最小突变数,而突变是否按照事先约定的核苷 酸最少替代的途径进行是不得而知的,单一的突变 图谱可能会得出是似而非的结论。 当序列单位位点上核苷酸替代数相对较大时,MP 法 则极可能得出错误拓扑结构的树。 实现软件:PAUP
• 替代模型:基于距离的方法和最大似然法 都是用参数模型描述序列间突变的过程。 直系同源:由于物种形成事件,从共同祖先 进化而来的基因, 通常具有相同或者相似的 基因功能。 旁系同源:由基因复制而分离的同源基因, 同时基因复制通常伴随着基因功能的分化, 因此旁系同源基因会进化出不同的功能 异系同源:由某一个基因水平转移事件而得 到的同源序列。水平转移的基因功能主要 根据在前后宿主中变化而确定,然而功能 却常常相似
距离矩阵-NJ法(ME方法的发展)
• 邻接法( NJ):从星形树出发,假定X为共同祖先, 事先不知哪两个分类群为一对邻居,因而首先应分别计算任 意两个分类群为第一对邻居时树的分支长度和,选取值最 小时的两个分类群作为邻居,连接它们的内节点为第一个 内节点,然后在剩余分类群中选取任意两个分类群为第二 对邻居,类似地找到第二个内节点,依此,直至找到所有内节 点
ML-极大似然法 • 假设:不同的性状进化是独立的;物种 发生分歧后进化独立。单个位点的似然值是 指在核苷酸替代模型中该位点每个可能被 取代或再现的概率之和,将所有位点似然值 相乘就得到进化树的似然值 • 最大似然法似乎是几种常用方法中最为近 似的方法,它考虑了所有可能的突变路径, 能 完全利用数据的系统发生信息。然而, 最大 似然法构建的系统树在很大程度上依赖于 对核苷酸替代模型的选择
多肽
备注:前mRNA是有编码区和非编码区组成,某些非编码区被剪切,剪 切片段为内含子
• 进化第一原因:基因突变 • DNA突变的模式:替代,插入,缺失,倒 位; • 核苷酸替代:转换 (Transition) & 颠换 (Transversion) • 转换:嘌呤被嘌呤替代,或者嘧啶被嘧啶 替代 • 颠换:嘌呤被嘧啶替代,或者嘧啶被嘌呤 替代
相关文档
最新文档