如何用MEGA5.0以及Clustalx1.83构建进化树
用MEGA构建进化树

如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
如何用MEGA5.0和Clustalx1.83构建进化树

如何用MEGA和Clustalx构建进化树MEGA是一个关于序列分析以与比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast/blast/Blast.cgi找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>#### AGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGG AATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATC TTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATAC CGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTG GTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA………………………….参考序列选择须知:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
系统进化树的建立(完整)

系统进化树的建立(完整)1. 进化树的建立软件:MEGA输入文件:fas格式文件输出文件:nwk格式文件建立过程1)将要用于构建系统进化树的所有序列合并到同一个fasta格式文件;2)打开MEGA软件,选择主窗口的”File” → “Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3)打开的Alignment Explorer窗口中选择”Alignment”“Align by -ClustalW” 进行多序列比对,弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4)之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。
MEGA的所有默认参数都是经过反复考量设置的,这保证了MEGA傻瓜机全自动档的品质,所以当你无从下手,或者没有什么特别要求的时候,直接点击“OK”,接受这些默认参数,开始多序列比对。
5)比对过程是先进行双序列比对,在进行多序列比对,最后会出现一个多序列比对结果。
将之作为中间结果保存下来。
在Alignment Explorer窗口中选择“Data”→“Export Alignment”→选择要保存文件的格式(一般用meg格式)4)生成的“.meg”文件可以双击直接导入MEGA。
点击data-Phylogenetic Analysis,回到MEGA主界面。
5)开始建树。
点击MEGA主窗口上的Phylogeny下拉菜单,选择Neighbor Joining(最近邻居法)。
保存为nwk格式文件2.进化树美化软件:Rstudio(ggtree包)输入文件:nwk文件输出文件:建立的彩色进化树美化过程R语言代码:#加载R包install.packages('ggtree')install.packages('ggplot2')library(ggplot2)library(ggtree)#读取树文件x <- read.tree('***自己的文件(一定注意路径***)')#读取分组信息groupInfo <- split(x$bel, gsub('_\\w+', '', x$bel))#按类分组y <- groupOTU(x, groupInfo)#将分组信息添加到树中tree <- groupOTU(x, groupInfo)#绘制进化树ggtree(tree, layout='fan', ladderize = FALSE, branch.length = 'none',aes(color=group)) + geom_tiplab2(size=3) + theme(legend.position = 'right')。
Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
进化树的建立

进化树的建立
§总思路:NCBI中Protein数据库里下载FSATA格式的各个蛋白→Clustalx蛋白序列比对→MEGA6转换为meg格式→MEGA6进化树的建立
一.NCBI中选择Protein数据库,搜索PD-1相关蛋白
二.选择兴趣蛋白,在Send to选项中选择File-FASTA格式
三.利用Clustalx1.83进行蛋白比对,在文件夹中找到执行文件clustalx.exe进入程序
四.File—load sequence—载入刚刚下载的文件“sequence .fasta”。
点Alignment—Do Complete Alignment出现以下界面点击ALIGN,在目标文件夹下会出现“aln”格式文件。
五.打开MEGA6主程序,File—convert file format to MEGA按照下图选择文件格式及刚刚做好的“aln”文件
六.若最下行出现非氨基酸代号如“#”等删除掉,点保存键在文件名后面加上“.meg”
七.将转化好的序列导入程序中,主程序File打开上步完成的文件Untitled.meg,第一个选择窗口选择第二个“Protein”,在出现的界面中点保存将文件输入程序,新的界面中再次保存输出序列
八.关掉所有窗口重进主程序,选择Phylogeny—第二个(Neighbor)之后出现一系列个性化窗口,无特别需要的话直接全点下一步
九.进化树做好后可用MEGA继续优化,在序列比对后产生的“aln”程序中各个蛋白的名称被对应的数据库代号所替换,可手动修改,也
可用bioedit软件进行比对以避免这个问题。
用MEGA构建进化树

如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA 序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1 GCAGTCGAACGATGAAGCCCAGCTTGCTGGGT GGATTAGTGGCGAACGGGTGAGTAACACGTGG GTGATCTGCCCTGCACTTCGGGATAAGCCTGGG AAACTGGGTCTAATACCGGATAGGACCTCGGGA TGCATGTTCCGGGGTGGAAAGGTTTTCCGGTG CAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGATCCTGGCTCAGGACGAACG CTGGCGGCGTGCTTAACACATGCAAGTCGAACG ATGAAGCCCAGCTTGCTGGGTGGATTAGTGGC GAACGGGTGAGTAACACGTGGGTGATCTGCCC TGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGAT>TS2 TGCAAGTCGAGCGAATGGATTAAGAGCTTGCTC TTATGAAGTTAGCGGCGGACGGGTGAGTAACA CGTGGGTAACCTGCCCATAAGACTGGGATAACT CCGGGAAACCGGGGCTAATACCGGATAACATTT TGAACTGCATGGTTCGAAATTGAAAGGCGGCTT CGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383 GATGAACGCTGGCGGCGTGCCTAATACATGCAA GTCGAGCGAATGGATTAAGAGCTTGCTCTTATG AAGTTAGCGGCGGACGGGTGAGTAACACGTGG GTAACCTGCCCATAAGACTGGGATAACTCCGGG AAACCGGGGCTAATACCGGATAACATTTTGAAC YGCATGGTTC………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
干货师兄,我想用MEGA建个树,咋整?

干货师兄,我想用MEGA建个树,咋整?作者:解螺旋.冬至转载需授权并注明来源:解螺旋,医生科研助手师妹:师兄,我想建个树。
师兄:啥树啊!你家的family tree啊?师妹:师兄,你不要调戏我,我就建一个简单的进化树!这个怎么做啊?简单呀,你可以用MEGA,先去MEGA官网(/)下载这个软件,免费的啊。
MEGA(Molecular Evolutionary Genetics Analysis )是一个功能非常强大的分子进化遗传分析软件,可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。
下面师兄给你详细介绍如何利用Mega软件构建进化树。
1.首先将需要进行建树的序列保存为fasta格式,并将文件扩展名改为.fasta。
.fasta序列格式以“>”开头。
“>”后面这一行写名称,回车,下一行写序列,氨基酸序列类似,所有序列保存在一个txt文件中。
例如:>gene1/speciesname NCBI accession numberATCGGCGTAGCTAGATGCTAGTATCGTA>gene1/speciesname NCBI accession numberAGTAGCTAGTGATGTA2. 点击Align--Edit/built Alignment,选择创建一个新的比对,点OK根据要求选择DNA或者蛋白质序列3.打开需要比对的.fasta文件4. 点击Alignment-Align by Clustal W,选择所有序列,出现下图,所有参数为默认,点击OK。
5. 我们看到在未对齐之前,由于序列长度不一样,有些序列长出来很多,而有的序列在这些位点全是gap,为了排除gap位点的干扰。
我们需要将序列两端对齐。
两端以比对上最短的序列为准,删除其他序列5’和3’多余的部分,可以看到在序列比对上的部分,最上面一行软件标记为“*”,我们需要将没有标记“*”的位点删除,可以用shift一起选择没有标记“*”开始和末端的位点,选好后点击鼠标右键,单击delete删除。