mega操作过程多序列比对进化树

合集下载

进化树构建方法-MEGA

利用MEGA 来构建进化树（molecular evolutionary genetics analysis 分子进化遗传分析）打开mega5，选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后，出现下面的页面双击文件名可以进行修改的。

我的就是从这里开始修改把A,B,C 都去掉，只留号码就好右键菜单点击delete 删除带※的那一行。

得到下面的图示，点击保存，重新起名字。

之后点击此图内的Alignment 选择Align by clustalW即可。

默认设置即可，点击OK就进行比对了，此后会出现一个过渡对话框，显示的是两两比对和多序列比对的过程之后回到初始页面，就是这个页面之后点File---点开，把刚才保留的文件点开然后出现下面的页面多了几个内容，点击TA的那个框框。

之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的，该图为我已经改变好的，把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了，而且还带有必需的支持率即自展值，是用来检验你所计算的进化树分支可信度的。

简单地讲就是把序列的位点都重排，重排后的序列再用相同的办法构树，如果原来树的分枝在重排后构的树中也出现了，就给这个分枝打上一分，如果没出现就给0分，这样经过你给定的repetitions 次（至少1000次）重排构树打分后，每个分枝就都得出分值，计算机会给你换算成bootstrap值。

重排的序列有很多组合，值越小说明分枝的可信度越低，最好根据数据的情况选用不同的构树方法和模型。

系统进化树的建立（完整）

系统进化树的建立（完整）1. 进化树的建立软件：MEGA输入文件：fas格式文件输出文件：nwk格式文件建立过程1）将要用于构建系统进化树的所有序列合并到同一个fasta格式文件；2）打开MEGA软件，选择主窗口的”File” → “Open A File”→找到并打开fasta文件，这时会询问以何种方式打开，需要先进行多序列比对，所以选择“Align”。

如果是比对好的多序列比对可以直接选择“Analyze”。

3）打开的Alignment Explorer窗口中选择”Alignment”“Align by -ClustalW” 进行多序列比对，弹出窗口询问“Nothing selected for alignment，Select all？”选择“OK”。

4）之后，弹出多序列比对参数设置窗口。

这个窗口和EMBL在线多序列比对一样，可以设置替换记分矩阵、不同的空位罚分（罚分填写的是正数，计算时按负数计算）等参数。

MEGA的所有默认参数都是经过反复考量设置的，这保证了MEGA傻瓜机全自动档的品质，所以当你无从下手，或者没有什么特别要求的时候，直接点击“OK”，接受这些默认参数，开始多序列比对。

5）比对过程是先进行双序列比对，在进行多序列比对，最后会出现一个多序列比对结果。

将之作为中间结果保存下来。

在Alignment Explorer窗口中选择“Data”→“Export Alignment”→选择要保存文件的格式（一般用meg格式）4）生成的“.meg”文件可以双击直接导入MEGA。

点击data-Phylogenetic Analysis，回到MEGA主界面。

5）开始建树。

点击MEGA主窗口上的Phylogeny下拉菜单，选择Neighbor Joining（最近邻居法）。

保存为nwk格式文件2.进化树美化软件：Rstudio（ggtree包）输入文件：nwk文件输出文件：建立的彩色进化树美化过程R语言代码：#加载R包install.packages('ggtree')install.packages('ggplot2')library(ggplot2)library(ggtree)#读取树文件x <- read.tree('***自己的文件（一定注意路径***）')#读取分组信息groupInfo <- split(x$bel, gsub('_\\w+', '', x$bel))#按类分组y <- groupOTU(x, groupInfo)#将分组信息添加到树中tree <- groupOTU(x, groupInfo)#绘制进化树ggtree(tree, layout='fan', ladderize = FALSE, branch.length = 'none',aes(color=group)) + geom_tiplab2(size=3) + theme(legend.position = 'right')。

Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致( 5’-3’)。

如图：2. 打开MEGA软件，选择"Alignment" - "Alignment Explorer/CLUSTAL"，在对话框中选择Retrieve sequences from a file, 然后点OK，找到准备好的序列文件并打开，如图：。

3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐，对齐过程需要一段时间，对齐完成后，最好将序列两端切齐，选择两端不齐的部分，单击右键，选择delete即可，如图：。

4. 关闭当前窗口，关闭的时候会提示两次否保存，第一次无所谓，保存不保存都可以，第二次一定要保存，保存的文件格式是.meg。

根据提示输入Title，然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。

最后出现一个对话框询问是否打开，选择Yes，如图：。

5. 回到MEGA主窗口，在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”，打开一个窗口，里面有很多参数可以设置，如何设置这些参数请参考详细的MEGA说明书，不会设置就暂且使用默认值，不要修改，点击下面的Compute按钮，系统进化树就画出来了，如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”，如图：6. 最后，使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。

Mega的使用以及进化树的绘制

4. 关闭当前窗口，关闭的时候会提示两次否保存，第一次无所谓，保存不保存都可以，第二次一定要保存，保存的文件格式是.meg。

根据提示输入Title，然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。

最后出现一个对话框询问是否打开，选择Yes，如图：。

使用mega构建进化树的流程

使用mega构建进化树的流程下载温馨提示:该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。

文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，如想了解不同资料格式和写法，敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!使用 MEGA 构建进化树的流程如下：1. 数据准备：收集需要构建进化树的序列数据，可以是 DNA 序列或蛋白质序列。

mega操作过程-多序列比对、进化树、

DCA (Divide-and-Conquer Alignment）：a web-based program that is semiexhaustive http://bibiserv.techfak.uni-bielefeld.de/dca/
启发式算法
启发式算法（heuristic algorithms）：
计算机程序自动比对通过特定的算法（如穷举法，启发式算法等），由计算机程序自动搜索exhaustive alignment method）
将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用矩阵的维数来反映比对的序列数目。这种方法的计算量很大，对于计算机系统的资源要求比较高，一般只有在进行少数的较短的序列的比对的时候才会用到这个方法
大多数实用的多序列比对程序采用启发式算法（heuristic algorithms），以降低运算复杂度。
随着序列数量的增加，算法复杂性也不断增加。用O （m1m2m3…mn）表示对n个序列进行比对时的算法复杂性，其中mn是最后一条序列的长度。若序列长度相差不大，则可简化成O（mn），其中n表示序列的数目，m表示序列的长度。显然，随着序列数量的增加，序列比对的算法复杂性按指数规律增长。
根据自己的需要选择合适的输出格式。
用ClustalW得到的多序列比对结果中，所有序列排列在一起，
并以特定的符号代表各个位点上残基的保守性，“*”号表示保守性极高的残基位点；“.”号代表保守性略低的残基位点。
Progressive Alignment Method
Clustal W 使用
输入地址：/clustalw/ 设置选项（next）
用于描述一组同源序列之间的亲缘关系的远近，应用到分子进化分析中。序列同源性分析：是将待研究序列加入到一组与之同源，但来自不同物种的序列中进行多序列同时比较，以确定该序列与其它序列间的同源性大小。

系统发育树mega使用流程

系统发育树mega使用流程下载温馨提示:该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。

文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，如想了解不同资料格式和写法，敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!1. 数据准备：收集要分析的序列数据，可以是 DNA、RNA 或蛋白质序列。

使用mega6做进化树

假如你要对比你所测序列E的序列与其他物质的亲缘关系，步骤如下：一，首先要先把你获得E的序列去NCBI网站进行比对，步骤如下：1.登录NCBI网站https:///2.找到右侧的BLAST，点进去；3.找到页面下方的这个图标，点Nucleotide BLAST4.将测得的序列全部粘贴到页面上的这个框里：5.找到页面最下方的Algorithm parameters，在最下面的BLAST旁边勾选“Show XXXX”后点击BLAST6.然后就会弹出另一个页面，你就得耐心等待了，因为它在比对，比对好后就会出现这样一个界面：7.然后往下拉，就看到好多序列的结果，可以选择所有的序列下载，也可以选择你想要的序列来下载（All/None可全选或都不选），选好后点击“GenBank”。

8.把所有的序列都勾选后，点右上角的“send”9.出现这个框格，File-FASTA按框格里选择好点Create File就可以批量下载内含你所选的序列的“fasta”格式的文件；11改好后打开，把自己的序列按“>名称+序列”的格式紧接在已下好的序列后面，添加好后再把后缀改回“fasta”,便可进行下一步8. 312.双击fasta文件，由MEGA6.0打开，如图13.单击W图标中的“Align DNA”,会提醒你选择序列，单击确定即可，如下图14.比对后的序列如下图。

15.然后我们需要把“*”号之外的序列全部删除，只留下"*"标注的序列，保存，保存后得到的是“mas”格式文件16.回到MEGA6.0主页面，在”DATA”中选“Open A file /Session”,然后会弹出一个选择文件的窗口，去选择刚刚保存的“mas”后缀名的文件，选择后弹出下方窗口，点“Analyze”。

17.回到MEGA5.0的主界面，在菜单栏中选择“Phylogeny”-“Construct/ Test Neighbor-Joining Tree…”-“yes”，会弹出一个窗口，里面有很多参数可以设置，以下是Bootstrap consensus tree基本的设置，可以参考：18.可能由于版本的不同，在形成的树上无相似度的数字标明，可以参照以下步骤进行标注：。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

息
➢ The program has been shown to be especially suitable for
学
aligning divergent sequences with only local similarity.
及
应
用
Block-Based Alignment
Match-Box：
PRRN：
➢ web-based program
基
http://prrn.ims.u-tokyo.ac.jp/
础生
➢ Uses a double nested iterative strategy for multiple alignment.
物
➢ Based on the idea that an optimal solution can be found by
基
➢ 将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用
础
矩阵的维数来反映比对的序列数目。这种方法的计算量很大，
生
对于计算机系统的资源要求比较高，一般只有在进行少数的较
物
短的序列的比对的时候才会用到这个方法
信
息
➢ DCA (Divide-and-Conquer Alignment）：a web-based
基
alignment Evaluation）：
础
➢ Progressive alignment method
生
/software/TCoffee.html
物信
➢ In processing a query, T-Coffee performs both global and
基
➢ web-based server
础
http://www.fundp.ac.be/sciences/biologie/bms/matchbox_su
http://igbmc.u-strasbg.fr:8080/DbClustal/dbclustal.html
基础
Poa (Partial order alignments):
生
/poa/
物
信
息
学
及
应
用
2、Iterative Alignment
物
说是非常必要的。
信
息
➢ 为了便于进行交互式手工比对，通常使用不同颜色表示具有
学
不同特性的残基，以帮助判别序列之间的相似性。
及计算机程序自动比对
应
用
➢ 通过特定的算法（如穷举法，启发式算法等），由计算机程
序自动搜索最佳的多序列比对状态。
穷举法
穷举法（exhaustive alignment method）
应
守性极高的残基位点；“.”号代表保守性略低的残基位点。
用
Progressive Alignment Method
Clustal W 使用
基
➢ 输入地址：/clustalw/
础
➢ 设置选项（next）
生
物
信
息
学
及
应
用
Progressive Alignment Method
应
修正。因为观察到的距离要比真实的进化距离低。
用
IGNORE GAPS：选择on，序列中的任何空位将被忽视。
➢ 详细说明参见
/clustalw/clustalw_frame.html
Progressive Alignment Method
Clustal W 使用
基
➢ 输入5个16S RNA 基因序列
础
AF310602
生物
AF308147
信
AF283499
息学
AF012090
及
AF447394
应
➢ 点击“RUN”
用
Progressive Alignment Method
T-Coffee (Tree-based Consistency Objective Function for
学
program that is semiexhaustive
及
http://bibiserv.techfak.uni-bielefeld.de/dca/
应
用
启发式算法
启发式算法（heuristic algorithms）：
基础
➢ 大多数实用的多序列比对程序采用启发式算法
生
（heuristic algorithms），以降低运算复杂度。
息
local pairwise alignment for all possible pairs involved.
学
A distance matrix is built to derive a guide tree, which is
及
then used to direct a full multiple alignment using the
础生
➢ Clustal程序有许多版本
物
ClustalW（Thompson等，1994）是目前使用最广泛的多序列
信
比对程序
息学
它的PC版本是ClustalX
及
➢ 作为程序的一部分，Clustal 可以输出用于构建进化
应用
树的数据。
Progressive Alignment Method
ClustalW 程序：ClustalW 程序可以自由使用
础生
➢ It places emphasis on block-to-block comparison rather than
物
residue-to-residue comparison. The sequence regions between
信
the blocks are left unaligned.
用
profile scores.
➢ Perhaps the most sophisticated and accurate alignment program
available.
➢ Extremely slow computation.
Progressive Alignment Method
DbClustal:
基
http://ibivu.cs.vu.nl/programs/pralinewww/
础
➢ First build profiles for each sequence using PSI-BLAST database
生
searching.
物
➢ Each profile is then used for multiple alignment using the
Clustal W 使用
基
➢ 一些选项说明
础生
PHYLOGENETIC TREE有三个选项
物
TREE TYPE：构建系统发育树的算法，有四个个选择none、nj
信
（neighbour joining）、phylip、dist
息学及
CORRECT DIST：决定是否做距离修正。对于小的序列歧异（＜ 10％），选择与否不会产生差异；对于大的序列歧异，需做出
础
以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。
生
物
➢ 输出格式也可以选择，有ALN、GCG、PHYLIP和GDE等，用户可以
信
根据自己的需要选择合适的输出格式。
息学
➢ 用ClustalW得到的多序列比对结果中，所有序列排列在一起，
及
并以特定的符号代表各个位点上残基的保守性，“*”号表示保
1 2 3 4 5 6 7 8 91
ⅠY D G G A V - E AL
基
础
ⅡY D G G - - - E AL
生
物
ⅢF E G G I L V E AL
信
息
学
ⅣF D - G I L V Q AV
及
应
ⅤY E G G A V V Q AL
用
表1 多序列比对的定义
表示五个短序列（I-V）的比对结果。通过插入空位，使5个序列中大多数相同或相似残基放入同一列，并保持每个序列残基顺序不变
物
信
随着序列数量的增加，算法复杂性也不断增加。用O
息
（m1m2m3…mn）表示对n个序列进行比对时的算法复杂性，
学
其中mn是最后一条序列的长度。若序列长度相差不大，则
及
可简化成O（mn），其中n表示序列的数目，m表示序列的长
应用
度。显然，随着序列数量的增加，序列比对的算法复杂性
按指数规律增长。
第二节多序列比对程序及应用
基
➢ 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础生
ClustalW 程序用选项单逐步指导用户进行操作，用户
物
可根据需要选择打分矩阵、设置空位罚分等。
信
ftp:///pub/software/
息
学
➢ EBI的主页还提供了基于Web的ClustalW服务，用户可以
基础生物信息学及应用
王兴平
内容
基
础
多序列比对
生
物信
分子进化分析——系统发生树构建
息学
核酸序列的预测与鉴定
及
应
酶切图谱制作
用
引物设计
基
础
多序列比对
生
物
信
息
学
及

应
用
内容：

mega操作过程 多序列比对 进化树

进化树构建方法-MEGA

系统进化树的建立（完整）

Mega的使用以及进化树的绘制

Mega的使用以及进化树的绘制

使用mega构建进化树的流程

mega操作过程-多序列比对、进化树、

系统发育树mega使用流程

使用mega6做进化树

mega操作过程多序列比对进化树