MEGA软件系统进化分析内容和同源性分析等
mega的使用

mega的使⽤MEGA的使⽤产⽣背景及简介随着不同物种基因组测序的快速发展,产⽣了⼤量的DNA序列信息,这时就需要⼀种简便⽽快速的统计分析⼯具来对这些数据进⾏有效的分析,以提取其中包含的⼤量信息。
MEGA就是基于这种需求开发的。
MEGA 软件的⽬的就是提供⼀个以进化的⾓度从DNA和蛋⽩序列中提取有⽤的信息的⼯具,并且,此软件可以免费下载使⽤。
现在我们使⽤的是MEGA4的版本。
它主要集中于进化分析获得的综合的序列信息。
使⽤它我们可以编辑序列数据、序列⽐对、构建系统发育树、推测物种间的进化距离等。
此软件的输出结果资源管理器允许⽤户浏览、编辑、打印输⼊所得到的结果⽽且所得到的结果具有不同形式的可视化效果。
此外,该软件还能够得出不同序列间的距离矩阵,这是他不同与其他分析软件的地⽅。
在计算矩阵⽅⾯有⼀些⾃⼰的特点:1.推测序列或者物种间的进化距离2.根据MCL(Maximum Composite Likeliood method)的⽅法构建系统发育树3.考虑到了不同碱基替换的不同的⽐率,考虑到了碱基转换和颠换的差别。
4.随时可以使⽤标注:所以的结果输⼊都可以使⽤标注,⽽且标注的内容可以被保存,复制。
具体使⽤我们以分析20个物种的⾎红蛋⽩为例来具体说明此软件的具体使⽤情况。
⼀.启动程序1.运⾏环境:在Windows 95/98, NT, ME, 2000, XP, vista等操作系统下均可使⽤。
2.下载安装:可以直接登陆/doc/d5e9bde30722192e4436f6c6.html 进⾏下载安装,另外还可以从/doc/d5e9bde30722192e4436f6c6.html /tools/phylogeny.php中的链接进去。
3.双击桌⾯快捷⽅式图标,进⼊主界⾯;或者从开始菜单,单击图标启动。
⼆.序列分析。
1.启动单击后,会出现如下界⾯:这⾥有三个选项,分别对应三种不同的情况:以下分别予以介绍:Create a new alignment :是在你没有任何⽐对的时候使⽤,⽐如你只有⼀个fasta 格式的序列就可以选择这个选项。
BioEdit及MEGA分析序列同源性简介

利用系统进化分析软件对序列进行同源性分析1.0目的1.1为了保持国际上各个耐药性实验室的高检验水准,进行分子进化分析是有很重要作用的。
它不仅可以保证流行病学目的顺利实现,而且有利于发现检测阶段可能产生的潜在的交叉污染。
1.2利用此软件进行分析所得的信息对于进行艾滋病毒在人群中传播的流行病学研究具有十分重要的意义。
1.3通过对实验室之前分析的数据与当前数据进行比较,可以发现在此前实验过程中由于标本处理不当所导致的潜在的实验室污染。
1.4对于确保得到高质量的实验结果并及时发现可能出现在实验室里的问题具有重要意义。
2.0仪器设备2.1计算机一台。
2.2Windows 95以上的操作系统。
2.3BioEdit 以及MEGA 4 分析软件。
2.3.1均为免费软件,可以从互联网上下载,在计算机上进行安装。
3.0操作过程3.1局限及要求3.1.1经过序列编辑软件拼接处理后的txt文件或fasta文件均可,例如ChromasPro软件。
3.1.2可以在MEGA上分析的分子序列或距离矩阵数据。
3.1.3Mega 4软件只能将长度相等的序列转换为MEGA输出文件,因此,任何多序列文件必须通过BioEdit软件进行对齐修剪,然后才能进入通过Mega软件转换成*.meg格式进行分析。
3.1.4该数据集的大小受限于计算机上可用的物理(RAM)和虚拟内存。
3.1.5分析的序列必须包括两个或两个以上长度相同的序列,所有序列分析之前必须用MEGA软件对齐。
3.1.6核苷酸和氨基酸序列应该用英文字母连续书写,不区分大小写。
一些特殊的特殊符号,例如表示对齐缺口,碱基缺失等的符号也可以包含在序列中。
3.1.7空格和制表符经常用于数据文件中,因此会被MEGA忽略。
ASCII字符,如(.)(- )(?),一般都作为特殊符号来表示序列中的不同碱基,分别表示第一个序列,对齐缺口及碱基缺失。
3.1.8BioEdit 软件进行序列比对3.1.9双击BioEdit图标打开BioEdit 序列对比编辑器窗口。
MEGA软件的使用

MEGA软件的使用Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手。
1、数据的录入及编辑Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUP数据格式等等。
而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。
首先,打开Mega程序,有如下图所示的操作界面:单击工具栏中的“File”按钮,会出现如下图所示的菜单:从上图可以看出,下拉菜单有“Open Data”(打开数据)、“Reopen Data”(打开曾经打开的数据,一般会保留新近打开的几个数据)、“Close Data”(关闭数据)、“Export Data”(导出数据)、“Conver To MEGA Format”(将数据转化为MEGA 格式)、“Text Editor”(数据文本编辑)、“Printer Setup”(启动打印)、“Exit”(退出MEGA程序)。
单击“Open Data”选项,会弹出如下菜单:浏览文件,选择要分析的数据打开,单击“打开”按钮,会弹出如下操作界面:此程序操作界面,提供了三种选择数据选择:Nucleotide Sequences(核苷酸序列)、Protein Sequences(蛋白质序列)、Pairwise Distance(遗传距离矩阵)。
根据输入数据的类型,选择一种,点击“OK”即可。
如果选择“Pairwise Distance”,则操作界面有所不同;如下图所示:根据遗传距离矩阵的类型,如果是下三角矩阵,选择“Lower Left Matrix”即可;如果是上三角矩阵,选择“Upper Right Matrix”即可。
点击“OK”按钮,即可导入数据。
如果是核苷酸数据,则读完之后,会弹出如下对话框:如上图,如果是编码蛋白质的核苷酸序列,则选择“Yes”按钮;如果是不编码蛋白质的核苷酸序列,则点击“No”按钮。
之后,会弹出如下操作窗口:此作界面的名称是“Sequence Data Explorer”,在其最上方是工具栏“Data”、“Display”、“Highlight”等,然后是一些数据处理方式的快捷按钮,在操作界面的左下方是每个序列的名称。
mega操作过程-多序列比对、进化树、

基 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础 生
ClustalW 程序用选项单逐步指导用户进行操作,用户
物
可根据需要选择打分矩阵、设置空位罚分等。
信 息
ftp:///pub/software/
学
EBI的主页还提供了基于Web的ClustalW服务,用户可以
物
信
随着序列数量的增加,算法复杂性也不断增加。用O
息
(m1m2m3…mn)表示对n个序列进行比对时的算法复杂性,
学
其中mn是最后一条序列的长度。若序列长度相差不大,则
及 应
可简化成O(mn),其中n表示序列的数目,m表示序列的长
用
度。显然,随着序列数量的增加,序列比对的算法复杂性
按指数规律增长。
第二节 多序列比对程序及应用
及 应
把序列和各种要求通过表单提交到服务器上,服务器
用
把计算的结果用Email返回用户(或在线交互使用)。
/clustalw/
Progressive Alignment Method
ClustalW 程序
基
ClustalW对输入序列的格式比较灵活,可以是FASTA格式,还可
1 2 3 4 5 6 7 8 91
ⅠY D G G A V - E AL
基
础
ⅡY D G G - - - E AL
生
物
ⅢF E G G I L V E AL
信
息
学
ⅣF D - G I L V Q AV
及
应
ⅤY E G G A V V Q AL
用
表1 多序列比对的定义
表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变
MEGA_3.1分子进化遗传分析软件

分子进化分析软件MEGA 3.1的使用操作作者:Dxyer- lzf战友(山东大学生命科学学院微生物国家重点实验室)受益的话,请到下列地址给我投一票,谢谢☺/bbs/post/view?bid=73&id=5059255&sty=1&tpg=1&ppg=1&age=0#5059255进化树也称种系树,英文名叫“Phyligenetic tree”,主要通过蛋白质序列/核酸序列的同源性比较进而了解基因或物种进化发生的内在关系和规律。
完整的进化分析需要以下几个步骤[1]:A.了解进化树的一些基本的概念和定义;B.集合一个待分析的数据组;C.对数据组进行多重序列比对;D.比对结果的校正;E.进化树的构建:为了说明进化分析结果的真实性,往往需要对校正后的比对结果选择不同的算法、模型和程序进行进化树的构建(必要的话,可利用Gblocks:http://molevol.ibmb.csic.es/Gblocks/Gblocks.html等软件提取数据组中的保守区后再进行进化树构建);F.树枝可信度评估:可利用bootstrap和interior-branch等测试方法;G.发表数据的优化及展示:可利用MEGA3.1软件打开多种软件所做的进化树并对其进行分枝合并、排序等优化,最后利用Photoshop、Macromedia Fireworks MX 等作图软件对图的清晰度进行优化以获得高质量的发表展示图.目前树状进化树的分析软件很多,其中MEGA 3.1(/)[2]最大的优点在于易于上手操作并可对图形进行优化展示,是分子进化分析最理想的软件之一。
但MEGA软件包中没有目前蛋白序列进化分析中推崇的“最大可能性(maximum likelyhood,ML)”和“贝叶斯推论(bayesian inferences)”这两种算法[3]。
ML算法可使用软件phyml(http://atgc.lirmm.fr/phyml/),贝叶斯分析使用软件MrBayes(/)。
mega 6 构建系统发育树

根树只反映分类单元之间的距离而不涉及谁是谁 的祖先问题。
有根树与无根树
两个临近的分支的 连接处称为节点 (node) 表示推断祖先的现 存类群在树最底部 的分支点成为根节 (root node) 分支(branches) 分类(taxa,the singular form is taxon)
评估系统发育树: bootstrap,使构建的tree有统计上的 意义。
的。(分子钟理论, Molecular clock 1965 )
• 实际情况:虽然很多时候仍然存在争议,但是分子 进化确实能阐述一些生物系统发生的内在规律。
(用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。)
系统发生树
系统发生树(英文:Phylogenetic tree)又称为 演化树(evolutionary tree)。以树的表现形式, 描述被认为具有共同祖先的各物种间演化关系。
五、总结
构建系统进化树的一般原则 1、可靠的待分析数据; 2、准确的多序列比对; 3、选择合适的建树方法: 序列相似程度高,MP最大简约性法(Maximum Parsimony methods)首选; 序列相似程度较低,距离法即除权配对法(UPGMAM)和 邻位相连法(Neighbor-joining); 其他,ML最大可能性法(Maximum Likelihood methods) 一般采用两种及以上方法构建进化树,无显著区别可接受。
MEGA 6 构建系统发育树
MEGA
全称是Molecular Evolutionary Genetics Analysis 即分子进化遗传分析 MEGA 可用于序列比对、进化树的推断、估计分子进化速
进化树软件MEGA最新6.06说明书

第一步:打开软件下面介绍菜单的使用:Data菜单:Creat a new :创建一个新的数据比对文件,也就是说当我们比对完一组后,想接着比对另一组,那么使用它就可以不用退出直接把数据文件导入;Open :打开先前已经比对并保存好的文件,它包含两个子菜单:retive sequence from file 和saved aligment session ;Close: 关闭当前的比对数据文件;Save session :保存当前比对结果,可以给比对的结果一个文件名;Export alignment :将当前的序列比对结果输出到指定文件,有两种输入格式可供选择:MGTA 和FASTA.DNA sequence :使用它来选择输入的数据DNA 序列,这里需要说明的是如果你输入的数据是氨基酸序列的话,比对窗口只显示一个标签,若是DNA 序列的话则显示两个标签,一个是DNA 序列的,另一个是氨基酸序列的。
Protein sequences :选择输入的氨基酸序列,选择后,所以的位点就被当作氨基酸残基位点来对待。
Translate/untranslate :只有比对的序列是编码蛋白的DNA序列的时候才可用。
它可以根据指定的遗传密码表将DNA 序列翻译成特定的氨基酸序列。
Select genetic code table :使用它将编码蛋白的DNA 翻译成特定的蛋白序列。
R everse complement :将选择的一整行的DNA 序列变为与之互补配对碱基序列。
Exit alignment explorer :退出序列比对的资源管理窗口Edit 菜单:使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为Undo:撤销上一步操作;Copy:复制;Cut:剪切;Paste:粘贴;这三个操作都可以只针对一个碱基或氨基酸残基也可以是一段甚至是整个序列;Delete:从比对表格中删除一段序列;Delete gaps:去掉序列中的空缺;Insert blank sequence:重新插入一空行;标签和序列都是空的;Insert sequence from file :从已保存的文件中插入新的序列;Select sites :选择一列序列,与点击比对表上方的灰白空格作用类似;Select sequence:选择一行序列,与点击比对表格左侧的标签名作用类似;Select all:全选;Allow base editing :只读保护,只有选择后才能对序列进行编辑操作,否则所以的序列为只读格式,不能进行任何编辑操作。
MEGA使用说明书

MEGA使用说明书MEGA软件构建系统发育树摘要:以白色念珠菌属下面的十个种的18s RNA 为例,构建系统发育树来说明MEGA 软件的使用方法。
1背景简介1.1 MEGA(分子进化遗传分析)MEGA 的全称是Molecular Evolutionary Genetics Analysis。
MEGA is an integrated tool for automatic and manual sequence alignment, inferring phylogenetic trees, mining web-based databases, estimating rates of molecular evolution, and testing evolutionary hypotheses. MEGA 可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。
MEGA 还可以通过网络(NCBI)进行序列的比对和数据的搜索。
最新版本:MEGA 5.1 Beta (软件开发者建议其结果不用于发表文章)建议下载版本:MEGA 5.05 for Windows and Mac OS。
MEGA 5 has been tested on the following Microsoft Windows? operating systems: Windows 95/98, NT, 2000, XP, Vista, version 7, Linux and Mac OS [1].MEGA 5.05 可免费下载,只需输入名字及有效邮箱,下载链接会发送至邮箱,点击可下载。
1.2 系统发育树定义系统发育树(英文:Phylogenetic tree)又称为演化树(evolutionary tree),是表明被认为具有共同祖先的各物种间演化关系的树。
是一种亲缘分支分类方法(cladogram)。
在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)1.3 系统发育树的分类根据有根和无根来区分:树可分为有根树和无根树两类。