用MEGA构建进化树
用MEGA构建进化树

如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
运用mega5构建系统发生进化树

运用mega5构建系统发生进化树1. 准备序列文件准备 fasta 格式序列文件(fasta 格式:大于号 >后紧跟序列名,换行后是序列。
举例如下)。
每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。
核酸序列:>sequence1_nameCCTGGCTCAGGATGAACGCT氨基酸序列:>sequence2_nameMQSPINSFKKALAEGRTQIGF2. 多序列比对打开 MEGA 5,点击 Align ,选择 Edit/Build Alignment,选择 Create a new alignment,点击 OK 。
这时需要选择序列类型,核酸(DNA )或氨基酸(Protein )。
选择之后,在弹出的窗口中直接 Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。
也可以:点击 Edit ,选择 Insert Sequence From File ,选择序列文件(可多选)。
序列文件加载之后,呈蓝色背景(为选中状态)。
点击按钮 ,选择 Align DNA (如果是氨基酸序列, 则会出现 Align Protein ) 。
弹出的窗口中设置比对参数, 一般都是采用默认参数即可。
点击 OK ,开始多序列比对。
比对完成后,呈现以下状态。
这时需要截齐两端含有 ---的序列:选中含有 ---的序列,按键 Delete 删除(注意:两端都需要截齐)。
截齐之后,保存文件为:filename.mas3.构建系统进化树多序列比对窗口,点击 Data ,选择 Phylogenetic Analysis ,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择 Yes 或 No 。
此时,多序列比对文件就激活了,可以返回 MEGA 5主界面建树了。
MEGA 5主界面。
点击 Phylogeny , 选择 Construct/Test Neighbor-Joining Tree … 弹出的对话框询问:是否使用当前激活的数据,选择 Yes 。
用MEGA构建进化树

若何用MEGA构建进化树是一个关于序列剖析以及比较统计的对象包,个中包含有距离建树法和MP建树法;可主动或手动进行序列比对,揣摸进化树,估算分子进化率,进行进化假设磨练,还能联机的Web数据库检索.下载后可直接应用,重要包含几个方面的功效软件:i)DNA和蛋白质序列数据的剖析软件.ii)序列数据转变成距离数据后,对距离数据剖析的软件. iii)对基因频率和持续的元素剖析的软件.iv)把序列的每个碱基/氨基酸自力对待(碱基/氨基酸只有0和1的状况)时,对序列进行剖析的软件.v)绘制和修正良化树的软件,进行网上blast搜刮.用MEGA构建进化树有以下步调:1. 16S rDNA测序和参考序列拔取从情况平分别到单克隆,去反复后扩增16S rDNA序列并测序,然后与数据库比对,找到类似度最高的几个序列,肯定一下你分别的细菌大约属于哪个科哪个属,假如类似度达到百分之百那根本可以肯定你分别得到的就是Blast到的谁人,然后找一到两个同科的,再找一到两个同目标,再找一到两个同纲的细菌,把序列全手下下来,以FSATA情势整合在TXT文档中,如>TS1 GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGATTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACC GGATAGGACCTCGGGATGCATGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCA AGTCGAACGATGAAGCCCAGCTTGCTGGGTGGATTAGTGGCGAACGGGTGAGTAACA CGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGG AT>TS2 TGCAAGTCGAGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGT GAGTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCT AATACCGGATAACATTTTGAACTGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGT CACT GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAATGGATTAAGAGCTT GCTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAG ACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGG TTC………………………….………………………….参考序列选择有几个原则:a,不选非造就(unclutured)微生物为参比;b,所选参考序列要准确,里面无错误碱基;c,在包管同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,假如本身的序列中统一属的较多,可恰当选择两个参考序列.2. 序列比对将整顿好的序列导入,如图接着程序主动运行,得出成果,主动输出 .aln和.dnd 为后缀的两个文件.序列比对也可以直接用MEGA来做.MEGA,如下图所示:4.只能打开meg格局的文件,但是它可以把其他格局的多序列比对文件转换过来,用.aln格局(Clustal的输出文件)转换.meg文件.点File:Convert to MEGA Format,打开转换文件对话框,从目标文件夹中选中Clustal 比较剖析后所产生的.aln文件,点击打开.5. 转换好的meg文件,会弹出一个提醒信息,点击ok.检讨meg序列文件最后是否正常,若消失clustal. *行,即可删除.点存盘保管meg文件,meg文件会和aln文件保管在统一个目次.6. 封闭转换窗口,回到主窗口,如今点面板上的“Click me to activate a data file”打开适才的meg文件.假如为蛋白质序列,选择“protein sequence”,电击“OK”,得到以下图示,数据输入之后的样子,窗口下面有序列文件名和类型.而在别的一个窗口内,消失以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可.序列编辑完成后,可进行保管,点击保管后消失以下界面,点击ok 即可.7. 构建进化树的算法重要分为两类:自力元素法(discrete character methods)和距离依附法(distance methods).所谓自力元素法是指进化树的拓扑外形是由序列上的每个碱基/氨基酸的状况决议的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的消失与否是由几个碱基的状况决议的,也就是说一个序列碱基的状况决议着它的酶切位点状况,当多个序列进行进化树剖析时,进化树的拓扑外形也就由这些碱基的状况决议了).而距离依附法是指进化树的拓扑外形由两两序列的进化距离决议的.进化树枝条的长度代表着进化距离.自力元素法包含最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依附法包含除权配对法(UPGMAM)和邻位相连法(Neighbor-joining).(1)phylogeny→UPGMA(2)用Bootstrap构建进化树,MEGA的重要功效就是做Bootstrap验证的进化树剖析,Bootstrap验证是对进化树进行统计验证的一种办法,可以作为进化树靠得住性的一个器量.各类算法固然不合,但是操纵办法根本一致.进化树的构建是一个统计学问题.我们所构建出来的进化树只是对真实的进化关系的评估或者模仿.假如我们采取了一个恰当的办法,那么所构建的进化树就会接近真实的“进化树”.模仿的进化树须要一种数学办法来对其进行评估.不合的算法有不合的实用目标.一般来说,最大简约性法实用于相符以下前提的多序列:i 所要比较的序列的碱基不同小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的偏向,iv 所磨练的序列的碱基数量较多(大于几千个碱基);用最大可能性法剖析序列则不需以上的诸多前提,但是此种办法盘算极其耗时.假如剖析的序列较多,有可能要花上几天的时光才干盘算完毕.进程如下①参数的设置:phylogeny→bootstrap test of phylogeny→NJ②体系进化树的测试办法,可以选择用Bootstrap,也可以选择不进行测试.反复次数(Replications)平日设定至少要大于100比较好,随机数种子可以本身随便设定,不会影响盘算成果.一般选择500或1000.有很多Model供选择,默以为Kimura 2-paramete r,不合的Model有不合的算法,具体请参考专业的生物信息学书本.设定完成,点compute,开端盘算.②成果输出:这个进程所耗时光和序列的数量和长短成正比,程序就会产生这么一个树,该窗口中有两个属性页,一个是原始树,一个是bootstrap验证过的一致树.树枝上的数字暗示bootstrap验证中该树枝可托度的百分比.成果如下:8. 进化树的优化:1)应用该软件可得到不合树型,如下图所示:除此之外,还可以有多种树型,依据须要来选择.2)显示建树的相干信息:点击图标i.3)点击优化图标,可进行各项优化:Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree.每种树都可以进行长度,宽度或角度等的设定Branch:可对树枝上的信息进行修正.Lable:可对树枝的名字进行修正.Scale:标尺设置Cutoff:cutoff for consensus tree.一般为50%. 9.进化树的分类优化Place root on branch:可以来反转展转换.Flip subtree:180度翻转分枝,名字翻转180度.Swab subtree:交流分枝,名字不翻转.Compress/expand subtree与Set divergent time:可以把统一分枝的基因紧缩或扩大.点击Compress/expand subtree后,在要紧缩的分枝处点击,消失以下界面,在name/caption 中输入文件名(例如wwww),其他还有很多的选项,设置好了,点击OK.所得到的成果,可以在紧缩和扩大之间转换.10. 调剂进化树依据所的进化树的后果,要进行调剂,包含过剩序列删除.缺少序列添加.种属名称标注等等,还要依据投稿杂志请求在PHOTOSHOP中修正等.完成后的进化树应包含充足的信息.本身所做进化树完成图如下:。
Mega构建进化树的方法

Open a saved alignment session:使用它可以打开一 个已经比对好的序列文件;
Retieve a sequence from a file :这种情况同第一种情
况相似。
3
选择选项1,弹出下面对话框
4
• 根据情况选择“yes”或“no”
5
从”Data”菜单中读取序列文件,如6 选择保存的fasta格式的序列文件,如7
MEGA构建进化树的方法
MEGA简介
Molecular Evolutionary Genetics Analysis Functions
• conducting automatic and manual sequence alignment • inferring phylogenetic trees • mining web-based databases • estimating rates of molecular evolution • testing evolutionary hypotheses.
9
10
在窗口10中点击“Phylogeny”下拉菜单
11
然后选择Bootstrap Test of Phylogeny。最大简 约法 Maximum Parsimony;邻接法 Neighbor Joining;最小进化法 Minimum Evolution。
三种方法中选择Neighbor Joining,出现窗口12
12
在12窗口设置好各种参数,然后,点击“Compute”进 行运算,构建进化树
结果如窗口13所示:在实际运行得到拓扑图之后, 上面有两个选项,点击 Original tree,可以选择查 看计算所得到的所有结构树。
使用mega构建进化树的流程

使用mega构建进化树的流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!使用 MEGA 构建进化树的流程如下:1. 数据准备:收集需要构建进化树的序列数据,可以是 DNA 序列或蛋白质序列。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
2. 序列比对将整理好的序列导入clustalx1.83,如图接着程序自动运行,得出结果,自动输出.aln和.dnd 为后缀的两个文件。
序列比对也可以直接用MEGA来做。
3. 打开程序MEGA,如下图所示:4. MEGA3.1只能打开meg格式的文件,但是它可以把其他格式的多序列比对文件转换过来,用.aln格式(Clustal的输出文件)转换.meg文件。
点File:Convert to MEGA Format,打开转换文件对话框,从目的文件夹中选中Clustal 对比分析后所产生的.aln文件,点击打开。
5. 转换好的meg文件,会弹出一个提示信息,点击ok。
查看meg序列文件最后是否正常,若存在clustal. *行,即可删除。
点存盘保存meg文件,meg文件会和aln文件保存在同一个目录。
6. 关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的meg文件。
如果为蛋白质序列,选择“protein sequence”,电击“OK”,得到以下图示,数据输入之后的样子,窗口下面有序列文件名和类型。
而在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可。
序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。
7. 构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
(1)phylogeny→UPGMA(2)用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。
各种算法虽然不同,但是操作方法基本一致。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。
模拟的进化树需要一种数学方法来对其进行评估。
不同的算法有不同的适用目标。
一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。
如果分析的序列较多,有可能要花上几天的时间才能计算完毕。
过程如下①参数的设置:phylogeny→bootstrap test of phylogeny→NJ②系统进化树的测试方法,可以选择用Bootstrap,也可以选择不进行测试。
重复次数(Replications)通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。
一般选择500或1000。
有许多Model供选择,默认为Kimura 2-paramete r,不同的Model有不同的算法,具体请参考专业的生物信息学书籍。
设定完成,点compute,开始计算。
②结果输出:这个过程所耗时间和序列的数量和长短成正比,程序就会产生这么一个树,该窗口中有两个属性页,一个是原始树,一个是bootstrap验证过的一致树。
树枝上的数字表示bootstrap验证中该树枝可信度的百分比。
结果如下:8. 进化树的优化:1)利用该软件可得到不同树型,如下图所示:除此之外,还可以有多种树型,根据需要来选择。
2)显示建树的相关信息:点击图标i。
3)点击优化图标,可进行各项优化:Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree。
每种树都可以进行长度,宽度或角度等的设定Branch:可对树枝上的信息进行修改。
Lable:可对树枝的名字进行修改。
Scale:标尺设置Cutoff:cut off for consensus tree。
一般为50%。
9、进化树的分类优化Place root on branch:可以来回转换。
Flip subtree:180度翻转分枝,名字翻转180度。
Swab subtree:交换分枝,名字不翻转。
Compress/expand subtree与Set divergent time:可以把同一分枝的基因压缩或扩展。
点击Compress/expand subtree后,在要压缩的分枝处点击,出现以下界面,在name/caption 中输入文件名(例如wwww),其他还有很多的选项,设置好了,点击OK。
所得到的结果,可以在压缩和扩展之间转换。
10. 调整进化树根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在PHOTOSHOP 中修改等。
完成后的进化树应包含充足的信息。
本人所做进化树完成图如下:。