Mega的使用以及进化树的绘制
系统进化树制作步骤MEGA5.10

系统进化树制作步骤MEGA5.10系统进化树制作步骤MEGA5.1
先要把格式弄成该软件识别的meg格式,fasta格式也⾏,只要能够导⼊1导⼊,点击左上⾓Align,选择创建新的⽐对Alignment,点击OK,
2提⽰创建DNA分析⽂件,进⼊如下右边界⾯
3打开fasta格式的序列⽂件,如下
4选择Alignment中的⽐对选项,使⽤Clastaw⽐对,会有⽐对参数,默认即可,点OK,会⾃⾏完成⽐对。
5⽐对好的⽂件须保存,选Data中的save session,提⽰保存命名
即导⼊数据如右。
7选中带有TA的⽅框,如上图,点击主界⾯上的进化树选项,如下图中间,可选择不同的进化树类型,⼀般⽤NJ树。
8出现提⽰参数,默认即可,点compute执⾏。
会完成进化树
9做好的进化树可以以图⽚⽅式保存。
系统进化树绘制

MEGA:系统进化树绘制1.从测序公司获取可以用TXT格式打开的菌株16SrDNA序列文本信息;2.打开NCBI网站(https:///),依次点击BlAST—>Microbes,进入最下图所示界面。
3.将序列信息粘贴到黄色文本框内,点击BLAST按钮,进入比对结果页面,根据所需选择20条(参考)相似序列信息,点击Download,下载FASTA(aligned sequences)格式序列信息到电脑;4.将测序所得序列信息与Blast所得序列信息合并到同一个Text文件中;5.打开MEGA软件(以MEGA6.06为例),点击Align—>Edit/Build Alignment,选择Creat a new alignment并点击OK,点击DNA,进入最下图界面,最大化子界面;6.点击下图红线圈出的图标或通过Edit—>Insert Sequence From File Ctrl+I,进入第二个图所示界面,将文件格式由ABI改为Text,选择所选序列信息文件,点击打开;7.按住Shift,鼠标点击首条和最后一条多余的序列信息,即可选择某一需要删除的序列信息区域,点击Delete删除多余序列信息,并编辑各序列名称,点击保存编辑好的序列信息;8.点击Data—>Phylogenetic Analysis(系统进化分析),点击“Yes”完成系统进化分析;9.回到MEGA主页面,依次点击Analysis—>Phylogeny—>Construct/Test Neighbor-Joining Tree...,在跳出的界面中点击“Yes”,接着将跳出页面中的Test of Phylogeny项的None改为Bootstrap method,点击Compute,系统完成运算,生成系统进化树;10.依次点击Image—>Save as PDF file,保存成PDF格式系统发育树图谱。
用MEGA构建进化树

如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
mega操作过程-多序列比对、进化树、

启发式算法
启发式算法(heuristic algorithms):
1 2 3 4 5 6 7 8 91 ⅠY D G G A V - E AL ⅡY D G G - - - E AL ⅢF E G G I L V E AL
ⅣF D - G I L V Q AV ⅤY E G G A V V Q AL
表1 多序列比对的定义 表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变
为了便于描述,对多序列比对过程可以给出下面的定义:把多序 列比对看作一张二维表,表中每一行代表一个序列,每一列代表 一个残基的位置。将序列依照下列规则填入表中:
(a)一个序列所有残基的相对位置保持不变; (b)将不同序列间相同或相似的残基放入同一列,即尽可能将序列
间相同或相似残基上下对齐(下表)。
ClustalW(Thompson等,1994)是目前使用最广泛的多序列 比对程序
它的PC版本是ClustalX
作为程序的一部分,Clustal 可以输出用于构建进化 树的数据。
Progressive Alignment Method
ClustalW 程序:ClustalW 程序可以自由使用
Outperforms Clustal when aligning moderately divergent sequences
Slower than Clustal
进化树构建方法-MEGA

利用MEGA 来构建进化树(molecular evolutionary genetics analysis 分子进化遗传分析)打开mega5,选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后,出现下面的页面双击文件名可以进行修改的。
我的就是从这里开始修改把A,B,C 都去掉,只留号码就好右键菜单点击delete 删除带※的那一行。
得到下面的图示,点击保存,重新起名字。
之后点击此图内的Alignment 选择Align by clustalW即可。
默认设置即可,点击OK就进行比对了,此后会出现一个过渡对话框,显示的是两两比对和多序列比对的过程之后回到初始页面,就是这个页面之后点File---点开,把刚才保留的文件点开然后出现下面的页面多了几个内容,点击TA的那个框框。
之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的,该图为我已经改变好的,把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了,而且还带有必需的支持率即自展值,是用来检验你所计算的进化树分支可信度的。
简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions 次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。
重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。
MEGA使用图解

用MEGA2做进化树的步骤(图示)1、打开程序如下图所示:2、MEGA2只能打开meg格式的文件,但是它可以把其他格式的多序列比对文件转换过来,我们在这里用aln格式(Clustal的输出文件)转换meg文件。
点File:Convert to MEGA Format...打开转换文件对话框如下图所示:3、选择文件和转换文件对话框,选择aln文件,点OK如下图所示:4、转换好的meg文件,点存盘保存meg文件,meg文件会和aln文件保存在同一个目录如下图所示:5、关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的meg 文件如下图所示:6、选择meg文件,点“打开”如下图所示:7、程序会自动识别序列的类型,如果识别错误,请手工选择数据类型。
然后点OK就行了如下图所示:8、数据输入之后的样子,窗口下面有序列文件名和类型如下图所示:9、现在终于可以开始做Bootstrap验证和进化树了,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。
各种算法虽然不同,但是操作方法基本一致,我们在此以UPGMA方法为例进行演示。
点下图所示的菜单项。
如下图所示:10、...会弹出如下的对话框,在此你可以选择计算参数。
如下图所示:11、Distance Options标签页中的Models可以下拉,其中有若干个计算距离的方法可以选择,在此默认泊松校验(Poisson Correction)作为计算距离的方法。
如下图所示:12、Include sites标签页中可以选择处理空缺或者缺失数据的方法,在此也用默认方法如下图所示:13、系统进化树的测试方法,可以选择用Bootstrap,也可以选择不进行测试。
重复次数(Replications)通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。
怎样使用MEGA建立进化树

怎样使用MEGAt 立进化树如何使用MEGA4.0#立进化树 1、首先是双击软件打开如下图所示|M| ijaKMr3 valj 141 Mrhr ArgrwricQt iVvta“qplii :护 忏冲 i 二客H - I 号筍需.廿星"LIF M ■ H 、-| II ■ DKi -Mjrsrze: H r« r-r r ^c>az^ LCS2、现在是处于DNA序列,而我们要做蛋白质的进化树的话,就如下操作M4. Aligmr>&nl Explof頁H L lQnmt*Ftji Editm e祁3、接下来我们要进行序列的输入,点击左边那个红箭头,贝U出现下面的窗口刚M4: Alfgnment Explorer匚;日屯EJrt S«ar di Aflgmnenl Wfrb $e<)□ d| D ◎日「蹇輻酋1 41象Protein S^quer匚弊1|主曲色"匕色丄4、然后右击sequenee 1,修改名字,如改成DPVFrotejn Sequence?5、然后从Word里复制蛋白质序列,然后在下面的位置粘贴G 辱CopfPTCtfiT X CU,書 f sterna6则可出现如下图的序列了□ QCW1C3 iRWfl Wq^ri[ V^i>n irequ^Ki 幷册枷・1話皿讥曲佰i"—喇・ct Mgeirc 惟■ sy7、然后点击窗口上的保存图标保存 8、重复从3开始,直到你的序列输入完9、序列输入元后进行最后的保存,方法如下垂邑trit 5|讨之斗和"1 of op«r * dow亠 P TOUMT 1 <io-jrr<n接下来打开册b M 罗哥 H*lpi t X t tt b要输入ul7两次保存名字一然后关闭这个窗口出现下面这个窗口■■■MM Jfc接下来就可以建立各种样式的进化树〜乜 MdngHie-r jein^ IMJL* &? Wrigym 佔抽杓也山-« UW3ML ■> ■小h,鼻 陆01申*貝Trfl 和 Hi^Tgrn^ ,HnNkk T ivn HnM "d i-Oi^4*cflArs R 协 FriWrt '^l^diCNHE軒I 匚 fkrti tiiitanr-ri : hy A 护产就 匸沁”-嗯,只是把过程写出来,方便大家建立进化树,不足的地方,大家补充好〜。
MEGA4.0构树步骤

MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
2. 打开MEGA软件,选择”Alignment” –“Alignment Explorer/CLUSTAL”,在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny”-“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了。
6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
另外,还可以用Word进一步编辑MEGA构建的进化树。
一般说来,MEGA适用于对少量的序列进行比对和画Tree,如需处理大量或海量的序列数据,建议使用ARB。
用BioEdit合并序列:1、打开BioEdit,点击“File”->”New Alignment”;2、“File”->”import”->”Sequence Alignment file”,将全部要合并的序列导入;3、”File“->”Save“ or “Save as”,保存为.fas格式文件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.MEGA构建系统进化树的步骤
2.CLUSTALX进行序列比对
1.MEGA构建系统进化树的步骤
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:
2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,
单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设
置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,
如图:
6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
CLUSTALX进行序列比对
1.将下载的序列放入一个Text文本文档中,序列按一定的格式,
>pig AGAGACGGCCGCATCTTCTTGTGCAGTGCCAGCCTCGTCCCGTA GACAAAATGGTGAAGGTCGGTGTGAACGGATTTGGCCGTATTG GGCGCCTGGTCACCAGGGCTGCCATTTGCAGTGGCAAAGTGGA GATTGTTGCCATCAA的格式复制过来,放在一个文本文档里。
新建文本文档.txt
注意:CLustal 1.83分析出了全序列比对,彩色比对区上门的*越多,表示这段序列越保守
2.在File--load sequence载入序列,如图所示
4.点击align
5.
在桌面上即可生成aln格式的文本文档(用于下面Mega5.02进行进化树构建)
Mega5.02序列比对及建进化树
序列比对
1.用文本格式的序列数据进行比对
2.Align---edit alignment即新建一个数据---0k---DNA
3.
Edit--insert sequence from file ---选择文本文档
4.Alignent---Align by ciust W--ok---关闭序列比对--并保存在桌面上---Phylogeny--MAX
5.两种不同的方法最大释然和邻近法
邻近法更准确
建进化树1.File--convert file format to mega
2.
3.点击文件夹从桌面载入aln格式的文本文档
4.
5.点击OK,再命名
6.
7.
8.关闭窗口
9.点击OK
10.phylogen--text neighbor -joining tree -或者Maximum的方式进行构建--从桌面上选择刚命名的文件
11.
点击打开
12.
13.
14.点击Yes
15.
16.
17.将Test phylogery中的None改成如图
18.
19.
20.进化树就构建成功--点击横线进行细节修改
21.
22.点击左边第五个蓝色的图标
进行细节修改
23.可以双击分类后的名称,进行名称修改,如
Primer 5设计引物
1.File---New--DNA sequence
2.将序列复制过来(序列的格式必须是文本格式)--as is --OK
3.点击Primer
4.点击S--File-perferences
Length设置为20
点击OK
6.Search
7.type--both-PCR size 100-1000--primer length 25-5--OK
、
点击OK
8.选择打分高的,且退火温度在55℃左右的温度。
9.可通过手动调节上面的序列,使得二者的打分最高,如退火温度较高,则可以把序列长度降低一点,如19,点击Edit Primer --可以把引物序列复制下来
引物的基本原则
1.引物的长度18-28,不能太长。
引物越长特征性高,要求的退火温度越高,但是扩张效率较低,容易形成引物二聚体。
2.G、C的含量在45-55%左右,但有时也可能比较高或者比较低,不是很重要,45-55%的范围只是最好的。
G、C含量高,退火温度高。
3.3’端是最重要的,是起始阶段。
最好是A、T、C、G随机均一分布,不能集中的分布;特别3‘端前段最好不要连续3个以上的G、C出现,不能很好的促发反应,只要3’端的前10个碱基结合得好就行。
5‘不是很重要,可以很多不配对。
实际上3‘端连续出现G/C 但是效果也比较好。
GCCTCGTCCCGTAGACAAAAT
CCAGGGGGGCTAAGCAGTT
10.
11.外套和内套的设计使得特异性更高
要没有false priming
打分不一定都要100分
退火温度在55度以上都行
内套序列必须位于外套内
设计外套228-818 sense CACGGCAAGTTCAACGGCAC Anti -Sense TTTCTCCAGGCGGCAGGTCAG
设计内套310-585
Sense CTGCCAACATCAAGTGGGGTG
Anti -sense GTCCCTCCACGATGCCAAAG
一般先用外套引物进行扩增,再用内套引物扩增。
12.设计交叉序列的引物(温度相差不超过5度)
注意;这两个引物必须包括整个序列的90%以上的序列。
31-944
Sensse CCGTAACTTCTGTGCTGTGCCA
Anti sense AGAAGAGTGAGTGTCGCTGTTGAAGT
226-1029
Sense GCAAGTTCAACGGCACAGTCAA
Anti -sense TGCTGTAGCCAAATTCATTGTCGTA
13.双重PCR设计同时进行两个PCR扩增两对引物之间碱基序列相差100左右
31-247 63.5-63.5 100分
Sense CCGTAACTTCTGTGCTGTGCCA
Anti-sense TTGACTGTGCCGTTGAACTTGC
311-628 87分62.1-62.4
Sense TGCCAACATCAAGTGGGGTG
Anti -sense ACAGTCTTCTGGGTGGCAGTGAT
14.上游引物试剂盒已知的:如规定退火温度在73.2℃,则设计下游引物序列的温度在73℃左右,最好一样,不能超过或者少于2℃,可以改变引物长度提高退火温度,但是最高不能超过26 外套位点464
Anti-sense CATCACAAACATGGGGGCATCGGC
内套位点101
Anti-sense GCCGAATCCGTTCACTCCGACCTT
注意:关键不能错配,如果有错配可以看下错配的位点,如果和引物是反向不相交的,则不需考虑。