常见系统发育软件使用

合集下载

phylosuite使用介绍

phylosuite使用介绍
PhyloSuite是一个用于分析和编辑分子进化数据的软件套件。

它是由中国科学院遗传与发育生物学研究所的谢威开发的。

该软件套件包括多个工具，可以用于序列比对、系统发育分析、基因结构预测、进化分析等多个方面。

PhyloSuite包含的工具如下：
1. SeqKit：一个用于序列处理的工具，可以进行序列格式转换、过滤、去除冗余等操作。

2. PRANK：一个用于多序列比对的工具，支持DNA和蛋白质序列比对。

3. PhyML：一个用于构建系统发育树的工具，支持多种模型，包括HKY、GTR等。

4. RAxML：一个用于构建系统发育树的工具，支持多种模型，包括GTR、CAT等。

5. Gblocks：一个用于去除进化序列中的低质量区域的工具，可以用于预处理比对序列。

6. Simple_phylogeny：一个用于构建简单系统发育树的工具，可以根据输入序列构建NJ树、UPGMA树等。

7. PhyloFlash：一个用于高通量测序数据分析的工具，可以用于构建系统发育树。

8. OrthoFinder：一个用于寻找同源基因的工具，可以用于基因家族分析。

9. Evolview：一个用于可视化系统发育树的工具，可以用于构建交互式系统发育树。

PhyloSuite提供了一个用户友好的图形界面，用户可以使用鼠标拖拽文件进行操作。

同时，也支持命令行操作，可以更加灵活地控制软件的使用。

PhyloSuite是一个免费的软件，可以在Windows、Mac OS、Linux等多个操作系统上使用。

用Phylomatic和PhyloCom进行

用Phylomatic和PhyloCom进行群落系统进化分析张金龙（中国科学院植物研究所）Phylomatic和PhyloCom软件，是哈佛大学的Cam Webb博士、俄勒冈大学的Steve Kembel博士、加州大学伯克利分校的David Ackerly教授编写的一套用于群落物种组成系统发育关系的软件。

Phylomatic是在线软件，可以利用植物名录，按照APGIII的被子植物科的拓扑结构，生成进化树。

由于当前物种测序还不够充分，某一个群落中或某一个地区所有物种的某几个基因的序列还不能全部拿到，因此可以用Phylomatic建立基于APGIII骨架的进化树。

PhyloCom软件是用来进行群落系统发育与进化分析的。

PhyloCom可以为Phylomatic软件得到的进化树拓扑结构，按照一定的规则拟合一定的枝长，其功能还包括：计算群落的系统发育多样性（PD），计算群落的系统发育结构(community structure)，计算群落的系统发育距离(community phylogenetic distance)，分析群落的性状进化(AOT)。

下面就介绍如何使用Phylomatic和Phylocom进行相应的分析。

一 Phylomatic 建立进化树1 物种名录的准备复制拉丁文属名，打开/kewlookup.html查询每个属所在的科等信息图1 查询属名所在的APG科输出结果如下：图2 属名查询结果新建一个Excel空白文档，将结果粘贴到Excel中选中粘贴过来的列，点击Excel的菜单，数据>分列>分隔符号>空格从中选择APG Fam列图 3 选取APG科名将没有查到的属，手动添加相应的科名。

整理种名，去掉去空格和括号，报名命名人等信息将种名中所有的空格用“.”或者“_”代替。

按照科/属/种的顺序，将各列粘贴到一个新的excel表格中。

图4 删除物种的命名人和括号图5 将物种内的空格用“_”替换，并粘贴到对应的科属删除其中的非被子植物。

系统发育软件使用流程_公开版(精)

系统发育及群体遗传统计分析软件使用流程(公开版谢磊左云娟徐新伟基础知识与注意事项:1 interleave vs. noninterleaveDNA序列数据分段显示为interleave格式,如果一行显示则为noninterleave 格式。

除了PAUP之外,几乎所有系统发育分析软件都要求noninterleave格式的数据。

但是当几个片段的序列combine时会得到interleave格式的数据,这时候PAUP 能够识别运输interleave格式的优点就显示出来了。

PAUP可以输出noninterleave 格式的数据,所以可以使用PAUP进行数据格式转换以得到能够用于其他软件的数据格式(MAC版PAUP进行菜单操作即可,PC版PAUP方法见附录1*。

export format=nexus interleaved=no file=temp.txt (生成noninterleave文件命令 2 log fileLog file就是在运算之前建立日志,运算的所有过程都会随时记录在一个文档当中便于以后查询。

建议在每次使用PAUP算树时首先进行Log file。

3 存树系统发育树的保存有两种方式,一种是存成nex格式的树文件,另一种是存成PICT格式的图文件。

Nex格式的树文件是用按层次加括号的方式表示类群之间关系,如((A,B(C,D,这个文件可以用PAUP、MacClade或Treeview 打开生成文章需要的图文件。

而图文件则是写文章时候需要的文件,一般可以用AI或WORD进行编辑修饰。

建议每次运算都要保存树文件,因为树文件可以随时生成图文件,如果只保存图文件一旦数据出现损坏或丢失则需要重新运算。

4 写文章时需要的参数运算PAUP时要注意细节,写文章需要的参数,如CI、RI、信息位点等数据一定不能忽略,每次运算都要生成这些数据。

PAUP的describetree和cstatus命令是每次运算必须进行的。

phylosuite使用介绍

phylosuite使用介绍PhyloSuite是一个用于分析系统发育的软件套件，可以在Windows、Linux和Mac OS X 平台上使用，并且支持各种分析方法和文件格式，包括序列比对、物种树、基因树的推断和可视化等功能。

以下是PhyloSuite使用的详细介绍。

1. 下载和安装PhyloSuitePhyloSuite是一个免费的软件，可以从其官方网站下载。

下载完成后，将PhyloSuite 解压缩并打开PhyloSuite的主界面，就可以开始使用PhyloSuite进行系统发育的分析了。

2. 总体流程使用PhyloSuite进行系统发育分析的流程大致分为以下五个步骤，具体如下：(1) 准备数据。

将需要分析的序列数据导入到PhyloSuite中，并将其按照要求进行格式转换和校准等操作。

(2) 序列比对。

使用PhyloSuite内置的多种比对工具进行数据的全局比对、局部比对和进化模型选择等操作，以得到高质量的序列比对结果。

(3) 系统发育分析。

在序列比对的基础上，使用PhyloSuite内置的多种方法推断物种树或基因树，并进行支持率计算和进化树的可视化等操作，以得到最终的系统发育信息。

(4) 结果评估。

对系统发育分析的结果进行统计分析、可视化评估和相关统计检验等操作，以确认分析的准确性和稳定性。

(5) 结果呈现和再利用。

将系统发育分析的结果导出并保存为文本或图片格式，以便用于科学研究、学术会议和出版文章等应用场景。

3. 具体操作在使用PhyloSuite进行系统发育分析时，需要了解各个功能模块的具体操作方法，以下是PhyloSuite中几个核心模块的简要介绍。

(2) Alignment模块。

该模块提供了多种序列比对工具，包括MAFFT, RAxML, MUSCLE 等，并提供多种比对质量评价和修改工具，以得到高质量的序列比对结果。

(3) Phylogeny模块。

此模块支持多种系统发育分析方法和工具，包括Maximum Likelihood, Bayesian Inference, Distance-based等，其可视化输出还包括多种图形化展示方式，以便于直观理解分析结果。

常见系统发育软件使用

常见系统发育软件使用方法Xie Lei BJFU1 Paup MP流程: Mac准备nex文件(interleave和noninterleave均可) → 存入新建文件夹→拖入paup或用paup打开→ execute → log file → cstatus → tstatus → hsearch → define outgroup → roottrees → savetrees → describetrees →contree(save to file) →save pict→bootstrap(save tree file) →print bootstrap tree→save pict. →stop log.PC版操作，可将附录批处理文件容粘贴至nex文件后面，execute即可。

2 Paup ML 流程：Mac准备nex文件(interleave和noninterleave均可) → 存入新建文件夹→拖入paup或用paup打开→execute→从modeltest软件中打开paupblock运算检测模型→生成score file→打开modeltest中的bin读取score数据→生成结果文档→存档并打开此文档→AIC→将begin paup的运算模块贴至原nex数据文件后面→重新将其拖入paup运行→选择ML运算模式→hsearch→打印树图→save pict. →bootstrap.PC版操作，可将附录5批处理文件容粘贴至nex文件后面，execute即可。

3 Garli运算ML流程：准备nex文件(interleave) → 存入新建文件夹→拖入paup或用paup打开→execute→输出noninterleave文档（若直接是noninterleave上述过程省略，又如果是PC机paup，无菜单操作，可在paup命令行中输入附录1*的命令回车即可生成noninterleave数据）。

MEGA-系统发育树-快速入门

系统发育树
1.软件准备
DNAman、MEGA
2.序列文件转换格式
2.1先准备一个txt记事本文件，在序列的上一行添加字符>和名称（如>R31-ITS1），然后用MEGA打
开seq格式的序列文件，复制序列到名称下一行
2.2将所需要的比对的所有序列以相同方式写入同一个txt文件中
2.3在MEGA中用ALIGN功能打开准备好的txt文件，选择create a new alignment，数据类型选DNA，
然后从编辑edit中导入新的序列文件（即txt文本）即可导入所需序列
2.4删除无关序列后，先对序列进行分析然后再把序列对齐，类型选DNA，参数默认
颜色一致即为对齐，不一致的就是突变的位点。

然后通常需要把首尾两端没有对齐的序列删掉（只处理首尾两端未对其的序列）
对齐部分
未对齐的删掉
2.5处理完后保存文件并关闭当前窗口，如果不是连续使用的话，切换不同功能时一般点close date
关闭之前的数据
3.构建系统发育树
3.1邻接法构建系统发育树。

系统发育分析教程

系统发育分析教程大致流程：1.从18个mtDNA基因组中提取rRNA基因12S、16S和蛋白质基因ND1、ND2、CytB2.分别进行序列比对，并进行比对精制3.将精制比对结果串联成一个独立的分析文件，记录基因位置4.NJ分析(MEGA)5.MP分析(PAUP)6.ML分析（RAXML）7.贝叶斯分析（MRBAYES）1.安装DNASTAR软件（又名Lasergene），软件内包含很多组件。

2.例子中有18个转录组的数据，ctrl+A,点住第一个文件拖到DNASTAR的MegAlign里。

确保MegAlign左侧的序列名称完全按照英文字母顺序来排。

3.双击第一条序列，在出来的选框中选取12S序列，点击NEXT。

不断重复，直至将所有物种的12S序列挑出来。

4.然后ctrl+A全选，点击OPTION下面的Genetic Codes,选择编码方式，根据基因来选，这里选择Vertebrate Mito。

点击Align下面的By Clustal w Method等待程序对齐完成。

这时的序列应该已经对齐了。

5.将结果存为12S.MSF,MSF格式可以同时保存多个序列文件。

6.重复2-5步，分别挑出16S、ND1、ND2、CytB，存为相应的名称。

7.安装GeneStudioPro软件8. 打开GeneStudioPro的SeqVerter软件。

点击Import sequences导入序列，保留gaps全选序列，点击右侧Merge为一个Fasta序列。

点击Clear清空，如此将所有序列处理完，将文件的后缀改为fas9.将改好名的文件复制入GBlocks的目录底下。

10.打开GBlock.exe，输入o,回车输入上一步的文件名，回车输入t,回车，直到第一项t项为所选的序列类型输入g，回车，这时出现了两个文件重命名文件将-gb移动到.fas之前重复此步，将所有序列处理完，注意所选序列类型要正确。

检查所有序列是否已切整齐，且为3的倍数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

常见系统发育软件使用方法Xie Lei BJFU1 Paup MP流程: Mac准备nex文件(interleave和noninterleave均可) →存入新建文件夹→拖入paup或用paup打开→ execute → log file → cstatus → tstatus → hsearch →define outgroup →roottrees →savetrees →describetrees →contree(save to file) →save pict→bootstrap(save tree file) →print bootstrap tree→save pict. →stop log.PC版操作，可将附录批处理文件内容粘贴至nex文件后面，execute即可。

2 Paup ML 流程：Mac准备nex文件(interleave和noninterleave均可) →存入新建文件夹→拖入paup或用paup打开→execute→从modeltest软件中打开paupblock运算检测模型→生成score file→打开modeltest中的bin读取score数据→生成结果文档→存档并打开此文档→AIC→将begin paup的运算模块贴至原nex数据文件后面→重新将其拖入paup运行→选择ML运算模式→hsearch→打印树图→save pict. →bootstrap.PC版操作，可将附录5批处理文件内容粘贴至nex文件后面，execute即可。

3 Garli运算ML流程：准备nex文件(interleave) →存入新建文件夹→拖入paup或用paup打开→execute→输出noninterleave文档（若直接是noninterleave上述过程省略，又如果是PC机paup，无菜单操作，可在paup命令行中输入附录1*的命令回车即可生成noninterleave数据）。

使用noninterleave文档（数据中类群名称不得有单引号，空格，所有方括号中内容删除）→新建文件夹存入→按照流程2进行modeltest→在苹果机上打开Garli→导入数据→把model定好→run(切记此处不要激bootstrap选项)将上次运算数据拷贝至一新建文件夹→导入苹果版Garli→激活bootstrap选项→定好model→run所有结果用paup软件打开→save pict→打开bootstrap树→做50% majority rule contree→save pict.注：Garli苹果和PC版都有，但是操作不同。

数据格式：和算PAUP一样的nexus格式，但是这个格式有很多注意事项，一些常见的小错误会造成软件无法运行。

参见下列常见问题：1 一定要noninterleave的数据，否则软件无法运算2 [ ]虽然在mrbayes和paup中不成问题但是在garli中有影响，里面内容在算之前全部删除为好。

3 taxon名称中可以有下划线但是不得有空格，逗号句点等，否则无法运行。

Mac版GUI的菜单界面，只要有上述正确的nexus格式的数据文件即可运算。

PC版Nex format plus a command file每次使用时拷贝一个软件的文件夹，将此文件夹重新命名（尽量清楚易查询）。

将正确的数据文件拷贝到此文件夹下（与garli运行程序在同一目录下）。

编辑命令文档（名称是garli），进行参数设置。

完成后双击garli运行程序图标即可运算。

4 Bayes 流程Noninterleave 文件→贴运算程序到文件后面（见附录）→将其拷贝至MrBayes 文件夹下→打开运行程序→execute 文件名.扩展名→运算结束后用paup运行源文件→从.t文件中取树→burnin→做50% majority rule contree→save pict.5 r8s流程按照流程2进行modeltest→按照流程2进行ML运算→运算结束print tree→检查这棵带枝长的树是否有分支长度为0的分支→如果有在restore和delete taxa中将这些类群去除→存储带枝长的树到file(nex格式) →将树的taxa名称更换为实际类群名称→将树文件贴至运算模版（见附录）→首先进行第一步cross validate→得到smooth值→替换smooth值再算一遍即可。

注：r8s:该软件与BEAST不同，是对已存在的树进行操作，校订分子钟。

算法为PL法。

先选择模型算出一个ML树（要带枝长），注意如果要用这个树算r8s要保证该树各个分支清晰，有较高的分辨率，没有0枝长分枝和polytomy。

在这个树的tre的nexus文件上面编辑各种命令，然后输入r8s进行运算。

一定要固定root，ingroup最好有一个以上的constraints.运算两次，第一次为cross-validation得出smooth value，第二次再设置这个值算出最终结果。

6 BEAST流程Noninterleave 文档→BEAUTI打开→定义节点→基本设置→化石点标定→生成xml文档→BEAST打开运算→运算完成→Tacer打开log文件→TreeAnnotator打开树文件→生成out文件→Figtree打开out文件。

7 DIVA在数据文件中确定树形，标注分布区，然后运算1 open DIVA2 proc filename.txt;3 optimize;Batch: optimize maxareas=8 weight=0.5 bound=200 hold=10000;8 Haplotype network简明流程：1、NETWORK 4.5用DNASP软件打开fas或者nex文件→另存为Roehl File Format文件（rdf 格式）→用NETWORK打开→进行编辑（更改名称、连续的gap合并、添加删除序列等）后保存→选择Median Joining进行calculate network →在新出现的窗口中导入rdf文件（也可以在这一步直接导入noninterleave的nex 文件而省去以上步骤，但是不能重新编辑）→设置参数后进行计算，生成out 格式的输出文件→选择draw network，在新窗口中导入out文件→按照提示就可以生成network图，保存fdi文件或可另存为bmp或者pdf文件。

2、TCS 1.21准备noninterleave的nex或者phy文件→导入TCS →设置Parsimony Limit或Fix connection Limit，并定义gap后点击run →运行完成后就会自动生成network图，编辑后保存GML文件或可另存为postscript 或者PICT 文件。

9．推荐使用：Mega 5.全能系统发育分析软件，从序列校对到系统发育分析、分子钟、性状演化、居群分析全能做。

Mesquite 2.7也很全能，但是主要还是做性状演化分析。

McClade是其收费版。

TNT是原来的Hennig86，做系统发育分析。

PAST十分强大的统计软件，居群分析，分类学的morphometric分析很好。

S-DIVA川大开发的带统计功能的地理分析软件。

建议访问：/phylip/software.html附录1.最大简约法分析批处理文件1.begin PAUP;log file=hsearch1.log;set autoclose=yes;set maxtrees=100 increase=auto;hsearch start=stepwise addseq=random nreps=1000 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes nchuck=200 chuckscore=1;savetrees file=hsearch1.all.tre brlens=yes;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;gettrees file=hsearch1.best.tre;contree all/majrule=yes treefile=contree.tre;log stop;end;2.begin PAUP;log file=hsearch1.log;set autoclose=yes;set maxtrees=100 increase=auto;hsearch start=stepwise addseq=random nreps=1000 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes; savetrees file=hsearch1.all.tre brlens=yes;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;gettrees file=hsearch1.best.tre;contree all/majrule=yes treefile=contree.tre;log stop;end;2的策略较好，是hsearch中首选，而如果此程序运算时间太长则用上面一个程序。

本实用方法只提供hsearch，而branch and bound和exhaustive方法省略。

附录1*export format=nexus interleaved=no file=temp.txt （此为生成noninterleave文件命令）附录2. ILD分析;endblock;charpartition dna=ITS:1-848,trnLF:849-3051;begin paup;set criterion=parsimony;log file=iscap.hom;hompart part=dna nreps=100/addseq=random;hsearch swap=tbr;endblock;附录3. Bayes分析1. 单一模型begin mrbayes;lset nst=6 rates=gamma;mcmcp ngen=2000000 printfreq=1000 samplefreq=100 nchains=4 savebrlens=yes filename=P_combined;mcmc;sumt filename=P_combined.t burnin=2000;end;Begin mrbayes;2. 多模型begin mrbayes;charset its=1-622;charset trnlf=623-1696;charset matk=1697-3221;charset chs=3222-4406;charset psbm2trnd=4407-5506;charset psbm=5507-6279;charset gpd=6280-6972;charset LFY=6973-8426;partition Names = 8: its, trnlf, matk, chs, psbm2trnd, psbm, gpd, LFY; end;begin mrbayes;[The following lines set up a model in which all four genes have their unique GTR + gamma+ propinv model]set partition=Names;prset ratepr=variable;lset applyto=(1,2,3,4,5,6,7) nst=6;lset applyto=(8) nst=2 rates=gamma;unlink shape=(all) pinvar=(all);end;begin mrbayes;mcmcp ngen=100000 printfreq=1000 samplefreq=100 nchains=4 savebrlens=yes filename=solms8mys;mcmc;sumt filename=solms8.t burnin=3000;end;3. 带支长contree的运算batchbegin mrbayes;log start filename=cp.log;mcmc filename=cp ngen=2000000 samplefreq=100;sump burnin=5000 filename=cp printtofile=yes outputname=cp.sump;sumt burnin=5000 filename=cp contype=allcompat;log stop;end;附录4. bootstrap分析begin paup;log file=bootstrap.log;set maxtrees=100 increase=auto;set criterion=parsimony;set root=outgroup;outgroup 56 57;bootstrap nreps=1000 conlevel=50 treefile=bootstrap.tre keepall=yes cutoffpct=50/start=stepwise addseq=random nreps=100 savereps=yes nchuck=20 chuckscore=5 dstatus=none;log stop;end;附录5. Paup运行ML分析苹果机：BEGIN PAUP;Lset Base=(0.3271 0.1847 0.1967) Nst=6 Rmat=(0.9731 1.0473 0.2212 0.4660 1.5241) Rates=gamma Shape=0.8160 Pinvar=0.6410; END;PC机：Begin Paup;Set criterion=likelihood;Lset Base=(0.3413 0.2847 0.0895) Nst=6 Rmat=(0.3885 3.5246 0.5305 0.4364 3.2970) Rates=gamma Shape=0.5232 Pinvar=0.2613; Hsearch start=nj nchuck=2 chuckscore=5 dstatus=none;savetrees format=nexus brlens=yes append=yes file=likelihood; lscores 1/scorefile=likelihood.sf append=yes;set root=outgroup; outgroup 27 28; showtrees all; end;感谢下载!欢迎您的下载，资料仅供参考感谢下载!欢迎您的下载，资料仅供参考。

常见系统发育软件使用

phylosuite使用介绍

用Phylomatic和PhyloCom进行

最新MEGA5使用说明

系统发育软件使用流程_公开版(精)

phylosuite使用介绍

常见系统发育软件使用

MEGA-系统发育树-快速入门

系统发育分析教程