构建分子进化树

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、为便于识别 每条序列,可在 >后输入物种名 称,并用空格和 其它描述内容分 开,如: 2、序列文件所在路径不能有空格和 中文字符(如放在系统桌面),否则 ClustalX无法载入
>Human gi|301129180|ref|NP_001180303.1| resistin [Homo sapiens]
Gene tree
a b
A B
Species tree
c
C
We often assume that gene trees give us species trees
为什么要做MSA?
Contig assembly
怎么做MSA?
动态规划算法(dynamic programming):MSA 改进算法(heuristic algorithm):
可进一步对排列好的序列进行修饰(2)
ESPript 多种修饰 功能,突出相同或相似位点 http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi 在EBI ClustalW结果网页下载“Alignments”(CLUSTALW format)
第二步:设定比对参数
第三步:进行序列比对,得到结果
第四步:评价比对质量
打开比对结果: 1、可在ClustalX中直接输出打印 2、可用写字板打开aln文件
3、可将aln文件以图形展示,更直观
更改参数、手动编辑,使之具有生物学意义
可进一步对排列好的序列进行修饰(1)
Boxshade 突出相同或相似位点 (http://www.ch.embnet.org/software/BOX_form.html)
1. 渐进法(progressive methods):Clustal, T-Coffee, MUSCLE 2. 迭代法(iterative methods):PRRP, DIALIGN 3. 其它算法:Partial Order Algorithm、profile HMM、 meta-methods (MAFFT)… http://www.ebi.ac.uk/Tools/msa/ Current Opinion in Structural Biology 2006, 16:368–373
在EBI ClustalW结果网页复制序列比对结果
在“Boxshade”网页粘贴序列,在“Input sequence format”栏目选择“ALN”,在“Output format”栏目 选择“RTF_new”
在结果网页点击“here is your output number 1”
修饰过的排列结果
Output ALN
NBRF/PIR GCG/MSF PHYLIP NEXUS GDE/FASTA
Clustal W/X算法基础
两两比对 构建距离矩阵
构建指导树 (guide tree)
Baidu Nhomakorabea
将距离最近的两条 序列用动态规划的 算法进行比对; “渐进”的加上其 他的序列
Clustal在线分析方法(ClustalW) EBI的ClustalW分析网页
生物信息学
第五章
多序列对位排列和进化分析 ( I)
多序列对位排列
Multiple Sequence Alignment (MSA)
chicken
xenopus human
PLVSS---PLRGEAGVLPFQQEEYEKVKRGIVEQCCHNTCSLYQLENYCN
ALVSG---PQDNELDGMQLQPQEYQKMKRGIVEQCCHSTCSLFQLESYCN LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
monkey
dog hamster bovine
PQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
LQVRDVELAGAPGEGGLQPLALEGALQKRGIVEQCCTSICSLYQLENYCN PQVAQLELGGGPGADDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCN PQVGALELAGGPGAGG-----LEGPPQKRGIVEQCCASVCSLYQLENYCN
Clustal使用方法
Clustal:目前应用最广泛的 MSA 方法
可在线分析
可在本地计算机运行 序列输入、输出格式
Input FASTA
NBRF/PIR EMBL/SWISSPROT ALN GCG/MSF GCG9/RSF GDE
http://www.clustal.org/
>sequence 1 ATTGCAGTTCG CA …… >sequence 2 ATAGCACATCG CA…… >sequence 3 ATGCCACTCCG CC……
Using ClustalX for multiple sequence alignment
by Jarno Tuimala
两种工作模式:
Multiple Alignment
Profile Alignment
第一步:输入序列
File
Load sequences
1、序列为多重fasta格式(可进行编 辑,保存为txt文件)
guinea pig PQVEQTELGMGLGAGGLQPLALEMALQKRGIVDQCCTGTCTRHQLQSYCN
Bring the greatest number of similar characters into the same column of the alignment
为什么要做MSA?
用于描述一组序列之间的相似性关系,以便了解一个基因家族 的基本特征,寻找motif,保守区域等。用于预测新序列的二 级和三级结构,进而推测其生物学功能。
Find out which parts “do the same thing”
为什么要做MSA?
用于描述同源序列之间的亲缘关系的远近,应用到分子进化 分析中。是构建分子进化树的基础。
http://www.ebi.ac.uk/Tools/msa/clustalw2/
粘贴或上载序列
调整参数 多序列对位排列结果 Alignments
Result Summary
http://www.ebi.ac.uk/Tools/msa/clustalw/help/
Clustal离线分析方法(ClustalX) 下载安装 自带Help文件
相关文档
最新文档