进化树分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GAATC GAGTT GAATC 序列1 GAGTT 序列2
GA(A/G) T(C/T)
祖先序列
一个可靠的系统发育的推断,将揭示出有关生物 进化过程的顺序,有助于我们了解生物进化的历 史和进化机制 在分子水平上进行系统发育分析具有许多优势, 所得到的结果更加科学、可靠。 关于现代人起源的研究: 线粒体DNA ——所有现代人都是一个非洲女性的后代
现代系统发育学发展过程
在分子水平上研究生物之间的关系早在20世纪初 就开始了 (免疫反应) 。 直到20世纪中期,分子数据才开始被广泛应用于 系统发育研究。蛋白质电泳使得我们可以在一些 浅层特征上,如分子大小和电荷,来分离和比较 相关的蛋白质。 20世纪60年代,蛋白质测序成为可能; 20世纪70年代,研究者开始能够获得基因组信 息,特别是DNA序列。蛋白质序列和DNA序列为分 子系统发育分析提供了可靠的数据。
Â功能上重要的大分子或大分子的局部在进化速率上明显 低于那些在功能上不重要的大分子或者大分子局部。 (引起表型发生显著改变的突变发生的频率要低于无明显 表型发生显著改变得突变发生的频率)
V 氨基酸
 例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率 是内区进化速率的10倍。
V 核苷酸
 例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核 苷酸替代频率较高。
V Nature Genetics 31, 205 - 209 (2002)
关于分子钟的讨论和争议
1、对长期进化而言,不存在以恒定速率替换的生物 大分子一级结构;(基因功能的改变、基因数目 的增加) 2、不存在通用的分子钟; 3、争议:
V 分子钟的准确性 V 中性理论(分子钟成立的基础)
分子钟的最明显的例外之一是分子序列证据与化 石证据在人类起源时间上的差异。60年代中期, 许多人类学家认为人类在3000万年前与我们最近 的亲属——非洲猿分歧。根据分子钟假设,分歧 3000万年的物种氨基酸序列差异的应达4~5%、非 重复序列DNA差异应约为8%,但实测值分别为0.8% 与1.1%。对这种6倍左右的差别有两种解释。许多 人类学家倾向于怀疑钟的存在,并认为在高等灵 长类中分子进化速率下降
基因树、物种树
基于单个同源基因差异构建的系统发育树称为基 因树(gene tree),代表的仅仅是单个基因的进 化历史 两个物种分歧的时间:两个物种发育生殖隔离的 时间 物种树一般是通过综合多个基因数据的分析结果 而产生,代表物种的进化历史。 两个基因分歧点:表示基因分离的时间。
Speciation event
无根树
eukaryote
通过外围支 来确定树根
bacteria outgroup
archaea archaea archaea eukaryote
外群
有根树

eukaryote eukaryote eukaryote
a
b
c
d a
c b
d a
d
b
c
a
b
百度文库
c
d a
c
b
d a
d
b
c
b
a
c
d b
c
a
d b
a
基因与物种的分离时间未必同步
物种树(矩形)和基因树(实心点)
树只代表分支的拓扑结构
A BC D F E† G D C E† F G A B
分子进化的两个特点
生物大分子进化速率的相对恒定
V 分子进化速率
Â生物大分子随时间的改变主要表现为核苷酸、蛋白质的 一级结构的改变速率,即分子序列中核苷酸、氨基酸的 替换速率
二、系统发育树重建分析步骤
多序列比对(自动比对,手工校正) 确定替换模型 建立进化树 进化树评估
2.1多序列比对
序列多重比对的结果反映了序列之间的相似性, 为系统发育树的构建提供了有价值的信息。为提 高模型估算的精确性,不仅需要选择合适的比对 方法和参数,还需要对后续比对结果进行合理修 正,从中提取有意义的数据集用于系统发育树的 构建。
a
c
c
a
b
d c
b
a
d c
d
a
b
d
a
b c d b a c d c 考虑4个分类群时,共有15种可能的有根树
a
b
a b a d
c d
a c b c
b d
考虑4个分类群时,共有3种可能的无根树
考察类群数为 m ( m ≥ 3 )的系统树,其可能的拓扑结构数目为:
有根树
( 2 m − 3 )! 2 m − 2 ⋅ (m − 2 )!
现代系统发育学
现代系统发育学 利用从遗传物质中提取的信息作为物种特征 核酸序列或蛋白质分子 现今世界上存在的核酸和蛋白质分子都是从共同的祖先经 过不断的进化而形成的 作为生物遗传物质的核酸和作为生命机器的蛋白质分子中 存在着关于生物进化的信息 这些分子不仅在序列上保留进化的痕迹,它们的结构也保 留着进化的痕迹
系统发育分析术语
直系同源(orthologs): 同源的基因是由于共同的 祖先基因进化而产生的. 旁系同源(paralogs): 同源的基因是由于基因复 制产生的.
以上定义源自Fitch, W.M. (1970) Distinguishing homologous from analogous proteins. Syst. Zool. 19, 99–113
分子系统发育分析
一、分子进化的基本理论
系统发育(或种系发育、系统发生,phylogeny) 是指生物形成或进化的历史。 系统发育学(phylogenetics)研究物种之间的进化 关系,其基本思想是比较物种的特征,并认为特 征相似的物种在遗传学上接近。
一、分子进化的基本理论
系统发育学是进化生物学的一个重要研究领域, 系统发育分析早在达尔文时代就已经开始。从那 时起,科学家们就开始寻找物种的源头,分析物 种之间的进化关系,给各个物种分门别类。
系统发育树:三种类型
分支图
Taxon B Taxon C Taxon A Taxon D
1 1
进化树
6
时间度量树
Taxon B Taxon B Taxon C Taxon A Taxon D
Taxon C
Taxon A Taxon D
只用分支 信息,无 支长信息
遗传变化
时间
以上三种类型的系统发育树表示相同的分支状 况,相同的进化关系
一、分子进化的基本理论
所有的生物都可以追溯到共同的祖先,生物的产 生和分化就像树一样地生长、分叉,以树的形式 来表示生物之间的进化关系是非常自然的事。可 以用树中的各个分支点代表一类生物起源的相对 时间,两个分支点靠得越近,则对应的两群生物 进化关系越密切。
经典系统发育学
经典系统发育学 主要是物理或表型特征 如生物体的大小、颜色、触角个数 通过表型比较来推断生物体的基因型 (genotype),研究物种之间的进化关系
虽然大部分分子进化学家同意序列进化与分歧时 间密相关,但进化是以年限还是以代限为刻度则 仍有分歧与争议;而且因为众多因素的影响,与 分子钟相左的数据,无论是用氨基酸、核苷酸序 列差异、免疫学距离,还是用DNA杂交复性等参 数,均不断有所报道,其论争预计将继续下去。
分子进化中性论揭示了分子进化的规律,这是他 的主要贡献;其次中性论强调随机因素和突变压 在进化中的作用,这正是对现代综合进化论的纠 正和补充。 分子进化中性论虽然很好地解释了分子多样性的 起源,但未能解释表现型的适应进化。 中性论所涉及的只是生物大分子一级结构单元的 替换,并不能包含和解释分子进化的全部。
无根树
( 2 m − 5 )! 2 m − 3 ⋅ ( m − 3 )!
无根树和有根树:潜在的数目
#Taxa 3 4 5 6 7 … 30 无根树 1 3 15 105 945 ~3.58X1036 有根树 3 15 105 945 10,395 ~2.04X1038
Taxa增大,计算量急剧增加,因此,目前算法都 为优化算法,不能保证最优解
分子钟: 进化时间的估计
1. 遗传距离d的计算:
V A. 氨基酸序列:p-距离,d-距离,Γ-距离; V B. DNA序列: Jukes-Cantor距离,Kimura距离;
2. 物种分歧点:使用考古数据确定共有祖先;确 定分化时间T; 3. 计算分子的分化/进化的速率:r=d/2T; 4. 对新的序列,计算分化时间: Tnew=dnew/2r
物种分化时间:化石证据
1. 2. 3. 4. 5. 灵长目-啮齿动物: ~80 Myr ago 哺乳动物-鸟类: ~310 Myr ago 哺乳动物-两栖类: ~350 Myr ago 四肢动物-硬骨鱼: ~430 Myr ago 脊椎动物-果蝇(昆虫): ~830 Myr ago
V 中性突变、连续突变压、随机固定
换句话说,分子中性论虽然承认自然选择在表现型进 化中的作用,但否认自然选择在分子进化中的作用, 认为生物大分子的进化主要因素是机会和突变压力。
系统发育分析一般是建立在分子钟 (molecular clock)基础上的
分子钟假说是在20世纪60年代首次提出 序列之间的遗传差异的数量与分歧时间 接近正线性关系;分子变化的速率相当 稳定,可以用来预测分化的时间。
V不同物种同源大分子的分子进化速率大体相同
Â例子:比较不同物种血红蛋白氨基酸序列差异
人、马——0.8×10-9/AA.a 人、鲤鱼——0.6×10-9/AA.a
V分子进化速率远远比表型进化速率稳定
Â原因? Â序列的核苷酸或氨基酸替换是否随机过程?…
分子进化的两个特点
生物大分子进化的保守性
V 保守性
经典系统发育学局限性
表型有时候会误导我们,表型相似并不总是反映 基因相似。关系很远的物种也能进化出相似的表 型,这是由趋同进化的过程造成的。 用表型来判定进化关系的另一个问题是,对于许 多生物体很难检测到可用来进行比较的表型特征。 比较关系较远的生物体,什么样的表型特征能用 来比较呢?
paralogs
orthologs
paralogs orthologs
Erik L.L, et al TRENDS in Genetics, 2002
异同源(xenology)
系统发育树术语
分支/世系 末端节点
A B C D
祖先节点/ 树根
内部节点/分歧点,该 分支可能的祖先结点
E
代表最终 分类,可 以是物种 ,群体, 或者蛋白 质、DNA、 RNA分子等
单系类群 包含一个 祖先类群所有子裔, 存在共同祖先 并系类群 非单系类 群,存在共同祖先 复系类群 非单系类 群,不存在共同衍生 祖先
内类群 研究所涉及的 某一特定类群 外类群 不包括在 内类群中又与之有一 定关系 姐妹群 与某一类 群关系最为密切的类 群
无根树,有根树,外群
archaea archaea archaea eukaryote eukaryote eukaryote
2.1多序列比对
一个典型的比对过程包括:
 首先应用CLUSTALW程序,然后进行手工比对,最后提交给一个建树程 序。
这个过程有如下特征选项:
 (1)部分依赖于计算机(也就是说,需要手工调整);  (2)需要一个先验的系统发育标准(即需要一个前导树);  (3)使用先验评估方法和动态评估方法(推荐)对比对参数进行评 估;  (4)对基本结构(序列)进行比对(对于亲水氨基酸,推荐引入部 分二级结构特征);  (5)应用非统计数学优化。
根据现有生物基因或物种多样性来重建生物的进 化史 基本原理 从一条序列转变为另一条序列所需要的变换越 多,那么,这两条序列的相关性就越小,从共同 祖先分歧的时间就越早,进化距离就越大;相 反,两个序列越相似,那么它们之间的进化距离 就可能越小。为了便于分析,一般假设序列变化 的速率相对恒定。
V 生物大分子进化并非完全随机 V 存在某种制约因素,存在某种机制……?
分子进化中性论
V 20世纪60年代末基于对蛋白质和核酸分子的进化改变(表现为蛋 白质分子中的氨基酸替换和DNA分子的碱基替换)的比较研究, 1968年,日本遗传学家木村资生提出分子进化中性学说:
“在生物分子层次上的进化改变不是由自然选择作用 于有利突变而引起的,而是在连续的突变压之下由选 择中性或非常接近中性的突变的随机固定造成的。中 性突变是指对当前适应度无影响的突变。”
相关文档
最新文档