本地Blast

本地Blast
本地Blast

本地Blast使用说明

一、软件的下载安装

1.1安装流程

建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。

1.2 设置环境变量

右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。

二、查看程序版本信息

点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。

三、使用

3.1本地数据库的构建

下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化

数据库,命令为:

makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name

格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。

3.2核酸序列相似性搜索

blastn -db database_name -query input_file -out output_file

-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"

备注:qacc:查询序列Acession号;sacc:目标序列Acession号;

qstart qend:分别表示查询序列比对上的起始、终止位置;

sstart send:分别表示目标序列比对上的起始、终止位置;

length:长度; bitscore:得分; evalue:E-Value值;

pident:一致性; ppos:相似性

3.3 查看并获取目标序列:

blastdbcmd -db refseq_rna -entry 224071016 -out test.fa

可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文

3.4蛋白质序列相似性搜索

Blastp -db database_name-query input_file -out output_file

-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"

3.5 查看并获取目标序列:重复3.3

Blast本地化详细流程

Blast 2.4.0+本地化详细流程(基于Windows系统) 1.程序获得。从NCBI上下载Blast本地化程序,下载地址: ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/LATEST/ 64×安装版▲ 64×解压(绿色)版▲ 最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。 2.原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta 或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的ftp 库下载所需要库,链ftp://https://www.360docs.net/doc/1d9184098.html,/blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 3.用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下 面内容:[NCBI]Data="C:\blast\data\" 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows 4.将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来 方便),方法: a)右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量 b)系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化 程序所在路径,E:\blast 点击确定,将安装路径添加到path。 5.运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输 入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。

图解blast验证引物教程

图解blast验证引物教程 1、进入网页:https://www.360docs.net/doc/1d9184098.html,/BLAST/ 2、点击Search for short, nearly exact matches 3、在search栏中输入引物系列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ (1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。 (2)简便的做法是同时输入上下游引物:有以下两种方法。输入上下游引物系列都从5’——3’。 A、输入上游引物空格输入下游引物

B、输入上游引物回车输入下游引物 4、在options for advanced blasting中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字改为10 5、在format中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字填上0 10

6、点击网页中最下面的“BLAST!” 7、出现新的网页,点击Format! 果。

(1)图形格式: 图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分 图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补 图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配 通过点击相应的bar可以得到匹配情况的详细信息。 (2)结果信息概要: 从左到右分别为: A、数据库系列的身份证:点击之后可以获得该序列的信息 B、系列的简单描述 C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。按照得分的高低由大到小排列。得分的计算公式=匹配的碱基×2+0.1。举例:如果有20个碱基匹配,则其得分为40.1。 D、E值:代表被比对的两个序列不相关的可能性。【The E value decreases exponentially as the Score (S) that is assigned to a match between two sequences increases】。E值最低的最有意义,也就是说序列的相似性最大。设定的E值是我们限定的上限,E值太高的就不显示了 E、最后一栏有的有UEG的字样,其中: U代表:Unigene数据库 E代表:GEO profiles数据库 G代表:Gene数据库

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

本地blast的详细用法∷柳城

本地blast的详细用法 Posted on 03 四月 2009 by 柳城,阅读 9,626 本地blast的详细使用方法 blast all -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10 解释如下: blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的) -p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸 blastp 是蛋白质对蛋白质序列等等,一共5个自程序。 -i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式) -d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb) -o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径) *注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值! -a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU -F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能) -T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T -e: 是Expectation value,期望值,默认是10,我用的10-10! BLASTALL 用法 a.格式化序列数据库 格式化序列数据库— —formatdb formatdb简单介绍: formatdb处理的都是格式为 ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb命令行参数: formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍, 主要参数的说明:

blast验证引物教程1

图解blast验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、进入网页:https://www.360docs.net/doc/1d9184098.html,/BLAST/ 2、点击Basic BLAST中的nucleotide blast选项 3、完成2操作后就进入了Basic Local Alignment Search Tool界面 (1)在Enter Query Sequence栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’—3’。输入上游引物后,加上≥20个字母n,再输入下游引物,如下图:

(2)在Choose Search Set栏中: Database根据预操作基因的种属定了,本引物可选Human genomic + transcript或 Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 Show results in a new window项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters中:Expect thresshold期望阈值须改为1000,大于1000也可以; 在Word size的下拉框将数字改为7。如下图:

图解blast验证引物教程1

图解blast 验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、 进入网页:https://www.360docs.net/doc/1d9184098.html,/BLAST/ 2、 点击Basic BLAST 中的nucleotide blast 选项 3、 完成2操作后就进入了Basic Local Alignment Search Tool 界面 (1)在Enter Query Sequence 栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’— 3’。 输入上游引物后,加上≥20个字母n ,再输入下游引物,如下图: 生 物 秀

(2)在Choose Search Set 栏中: Database 根据预操作基因的种属定了,本引物可选Human genomic + transcript 或Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection 中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 生物秀-专心做生物 w w w .b b i o o .c o m

Show results in a new window 项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters 参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters 中:Expect thresshold 期望阈值须改为1000,大于1000也可以;在Word size 的下拉框将数字改为7。如下图: (2)Scoring Parameters 无须修改 (3)Filters and Masking 中,一般来说也没有必要改 5.点击最下面一栏的BLAST 按钮,如图: 6.点击BLAST 按钮后,跳转出现如下界面: 7. 等待若干秒之后,自动跳转出现显示BLAST 结果的网页。该网页用三种形式来显示blast 的结果。 生物秀-专心做生物 w w w .b b i o o .c o m

本地Blast

本地Blast使用说明 一、软件的下载安装 1.1安装流程 建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。 1.2 设置环境变量 右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。 二、查看程序版本信息 点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。 三、使用 3.1本地数据库的构建 下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化

数据库,命令为: makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name 格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。 3.2核酸序列相似性搜索 blastn -db database_name -query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 备注:qacc:查询序列Acession号;sacc:目标序列Acession号; qstart qend:分别表示查询序列比对上的起始、终止位置; sstart send:分别表示目标序列比对上的起始、终止位置; length:长度; bitscore:得分; evalue:E-Value值; pident:一致性; ppos:相似性 3.3 查看并获取目标序列: blastdbcmd -db refseq_rna -entry 224071016 -out test.fa 可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文 件 3.4蛋白质序列相似性搜索 Blastp -db database_name-query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 3.5 查看并获取目标序列:重复3.3

Blast本地化安装图解

Blast本地化:window平台下blast软件的安装boyun发表于 2009-07-09 17:08 | 阅读 1 views 1.对于windows 2000/xp 用户,下载blast- 2.2.18-ia32-win32.exe安装文件 ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/LATEST/blast- 2.2.18-ia32-win32.exe 2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,双击这个文件,自解压产生bin、data、doc 三个目录,bin是程序目录,data是程序使用数据的目录,doc是文档目录。 表:bin目录中的程序 程序说明 bl2seq.exe进行两条序列比对 blastall.exe做普通的blast比对 blastclust.exe blastpgp.exe copymat.exe fastacmd.exe通过gi号,接收号等,在数据库中检索序 列 formatdb.exe格式化数据库 formatrpsdb.exe impala.exe makemat.exe megablast.exe megablast程序 rpsblast.exe seedtop.exe 3.用文本编辑器创建一个ncbi.ini文件,文件包含下面内容:[NCBI] Data="C:\blast\data\" 将ncbi.ini文件存放到系统的Windows 或者 WINNT目录。 4.将”C:\blast\bin”目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法:

核酸BLAST

核酸BLAST: ?blastn程式——核酸序列比对。 ?MegaBLAST——可搜寻一批EST序列、长序列cDNA或基因体序列。 BLAST——Basic Local Alignment Search Tool——核酸与蛋白质序列比对工具。BLAST网页提供BLAST(Basic Local Alignment Search Tool)程式、概述、使用说明与常见问题解答(网址:https://www.360docs.net/doc/1d9184098.html,/BLAST/)。 BLAST Program Selection Guide: https://www.360docs.net/doc/1d9184098.html,/blast/producttable.shtml#tab31

在做BLASTn的时候,系统会给出三个程序选项,分别是Highly similar sequences (megablast), More dissimilar sequences (discontiguous megablast),Somewhat similar sequences (blastn) 。 第一个选项megablast是对高度相似DNA序列间的比较。鉴别一段未知DNA序列的最好办法就是看看在公共数据库中这段序列是否存在。Megablast就是对那些具有高度相似(相似性95% 以上)的长序列片断所特别设计的一种序列比较工具。Megablast除了提供序列联配的显著性期望值域之外,还提供了一种百分值域。在进行序列比较时,用户可以同时调整这两个参数以优化搜索结果。 第二个选项discontiguous megablast,当序列之间的差异比megablast大时,一般选用这个程序。其算法的基本原理是将查询序列分为一个一个的小片断,我们把它叫做字,通过字与数据库序列相比较,如果能够精确匹配,则以这个字为种子向两边延伸,从而获得符合我们要求的相似性序列。discontiguous megablast所应用的字是不连续的,这使得他的搜索精确性在三种搜索程序中是最高的。其模板类型选项分为三种编码(0),非编码(1),两者都有(2)。在编码模式中,根据第三位碱基的摆动原理,只要第一个和第二个碱基能够精确匹配,那么第三个碱基可以忽略,不做比较。在字的长度相同的情况下,discontiguous megablast的精确度要高于blastn。 第三个选项Somewhat similar sequences (blastn),这个程序比较的序列其相似程度可以非常低。它采用的算法与discontiguous megablast相同,只不过它的字是连续的。Blastn的字要比megablast短,所以其精确度要高于megablast,但是运算速度要慢一些。 注:字是影响blast灵敏度的一个主要参数,其取值要根据具体情况具体而定。 NCBI BLASTn: https://www.360docs.net/doc/1d9184098.html,/public_documents/vibe/details/NcbiBlastn.html

NCBI中Blast种类及使用简介

NCBI中Blast种类及使用简介 NCBI中Blast种类简介 1. Blast Assembled Genomes 在一个选择的物种基因组序列中去搜索。 2.Basic Blast 2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序 2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。 2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较 2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。 2.2 Protein Blast 2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。 2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。 2.3 Translating BLAST 2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。 2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA 数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。

2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。

新版blast本地化构建+数据库下载+序列间的相似性检索

新版blast本地化构建+数据库下载+序列间的相似性检索 Ethnobotany 前面记录了blast-2.2.23-ia32-win32的本地化构建及相似性检索,NCBI新近对blast程序做了一些修改推出了blast+,这里结合网上资料、blast+的user manual对blast+的本地化构建及使用作一引荐。 1blast+的本地化构建 链接到:ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/LATEST 下载ncbi-blast-2.2.23+-ia32-win32.tar.gz(绿色版),解压到d盘,并将文件夹更名为blast(我习惯这样做,因为在dos中写命令时方便),这样就安装完毕了,blast下具2个文件即bin 和doc。 2 数据库下载 2.1法1:直接从NCBI下载subject序列去掉txt的扩展名做成数据库即*db,然后将query 序列的txt扩展名掉做成查询文件*in。(格式必须是fasta,名字可以自己随便命名) 2.2法2:从NCBI中的ftp库下载所需要的某一个库或几个库,其链接为 ftp://https://www.360docs.net/doc/1d9184098.html,/blast/db/ 2.3法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 2.3.1 perl程序的下载和安装 可google“Perl for Windows”获得,也可直接按此连接 https://www.360docs.net/doc/1d9184098.html,/releases.html下载并,安装到任何盘均可。 2.3.2运行update_blastdb.pl进行下载 2.3.2.1开始>运行>cmd+确认>进入dos系统>输入以下命令打开bin文件夹。 2.3.2.2接着输入下述命令回车查看操作帮助(这一步可以不做,不妨碍后续操作) 2.3.2.3还可输入下述命令回车查看NCBI中的库(无需登录NCBI你就可以看到你所需要的库) 2.3.2.4以下载载体库(vector)为例演示如何下载库。输入如下命令回车即可。 直到后面出现done即表示已经下载完毕。如果下载其他数据库,你就可以在上面的perl update_blastdb.pl 后面的vector换成其它数据库的名字即可。 再做本地blast时即可以你下载的压缩文件名代替你bin中*db数据库,进行搜索。 上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用 方法与结果详解 This model paper was revised by the Standardization Office on December 10, 2020

N C B I在线B L A S T使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序

blast2.2.28-详解---本人亲测-20170424

BLAST 2.2.28详解本人亲测 1程序下载 链接到:ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/2.2.28/ 下载最新的BLAST+ 程序包,推荐版本ncbi-blast-2.2.28+-win32.exe,版本:ncbi-blast-2.2.28+-win32.exe适用于windows32 位系统,ncbi-blast-2.2.28+-win64.exe 适用Windows 64位系统,请注意选择。 2安装流程 建议安装在非系统盘,如将下载的BLAST 程序安装到D:\blast-2.2.28+ ,生成bin、doc两个子目录,其中bin是程序目录,doc是文档目录,这样就安装完毕了。如图1 图1 程序安装位置 3用户环境变量设置 右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“D:\blast-2.2.28+\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“D:\blast-2.2.28+\db”(即数据库路径)。如图2

图2 用户环境变量设置 4查看程序版本信息 点击Windows的“开始”菜单,点击“运行”,输入“cmd”(图3-1,图3-2),调出MS-DOS命令行,在命令行中输入“D:”,输入后按下enter键就进入D盘中,输入cd blast-2.2.28+,转到D:\blast-2.2.28+\。安装目录,输入命令“blastn-version”即可查看版本(图3-3): 图3查看程序版本信息 看到图3 显示说明本地blast已经安装成功。 5blast-2.2.28+本地数据库的构建 数据的获取 法1 :直接从NCBI 或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式必须是fasta,名字可以自己随便命名,具体做法下面有说明)。 法2 :从NCBI中的ftp库下载所需要的某一个库或几个库,其链接为ftp://https://www.360docs.net/doc/1d9184098.html,/blast/db/FASTA/其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用winrar 解压缩,然后用makeblastdb.exe格式化。 法3 :利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl

linux下BLAST+(新版blast)本地化步骤

64位LINUX下BLAST+的本地化 以我的计算机(用户名为yonpen)和数据库nr为例,运行psiblast得到PSSM矩阵。 2012-02-18 1下载程序 在ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/LATEST/下载 ncbi-blast-2.2.25+-x64-linux.tar.gz 2 解压 如解压到用户的主目录(/home/yonpen)下,把解压后的文件夹重新命名为blast,则BLAST+的所有程序在目录/home/yonpen/blast/bin下。 3 添加环境变量 打开终端(Terminal),切换为root用户,执行vim /etc/profile 在最末尾添加export PATH=”/home/yonpen/blast/bin:$PATH”,保存退出。 或直接找到/etc/profile这个文件,在最末尾添加export PATH=”/home/yonpen/blast/bin:$PA TH” 此处若成功,则执行blastn -version会出现版本信息。 4 新建 在目录/home/yonpen/blast下新建一个文件夹,命名为db 在/home/yonpen下新建一个文件,命名为.ncbirc 在文件中添加内容 [BLAST] BLASTDB=/home/yonpen/blast/db 5 下载FASTA格式的数据库 ftp://https://www.360docs.net/doc/1d9184098.html,/blast/db/FASTA/ 如下载nr.gz 6 建立BLAST+可用的数据库 打开终端(Terminal),切换到/home/yonpen/blast/db目录下,执行: makeblastdb –in nr -parse_seqids -hash_index -dbtypeprot 7 使用程序 如使用psiblast 在目录/home/yonpen/blast下新建3个文件夹,分别命名为pssm,input,output 设待查询序列所在文件的名字为3.fasta(一个文件放一条序列,且必须为fasta格式) 执行命令: psiblast -comp_based_stats 1 -evalue 0.001 -num_iterations 3 -db nr -query input/3.fasta -out output/3.txt -out_ascii_pssmpssm/3.pssm

新版blast2.2.24+本地化及本地数据库构建

Windows平台下新版blast(2.2.24+)本地化构建+数据库下载+序列间的相似性检索从blast-2.2.23-ia32-win32这个版本开始,本地化blast的参数有了很大改变,NCBI新近对blast 程序做了一些修改推出了blast+,目前最新版本为ncbi-blast-2.2.24+-ia32-win32。与之前的blast相比,新的blast+将blastn,blastx 等合作与blastall命令分隔开来,对各个命令的参数定制更加方便而网上相关的一些教程大同小异,一部分操作已经不适用了,遂整理如下,仅供参考,不当之处,敬请指正。 blast+的本地化构建 1.1程序下载链接到:ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/LATEST 下载最新的BLAST+程序包,推荐版本ncbi-blast-2.2.24+-ia32-win32.tar.gz(绿色版windows32位系统),其他版本:ncbi-blast-2.2.24+-win32.exe适用于windows32位系统,ncbi-blast-2.2.24+-win64.exe 适用Windows 64 位系统,请注意选择。 1.2安装流程 建议安装在非系统盘,如将下载的BLAST 程序安装到E:\blast,生成bin、doc 两个子目录,其中bin 是程序目录,doc是文档目录,这样就安装完毕了。 1.3用户环境变量设置 右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。

Blast软件的详细使用方法

Blast软件的详细使用方法 blastall -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10 解释如下: blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的) -p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸blastp 是蛋白质对蛋白质序列等等,一共5个自程序。 -i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式)-d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb) -o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径) *注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值! -a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU -F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能) -T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T -e: 是Expectation value,期望值,默认是10,我用的10-10! BLASTALL 用法 a.格式化序列数据库 格式化序列数据库——formatdb formatdb简单介绍: formatdb处理的都是格式为ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb命令行参数: formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍, 主要参数的说明: -i 输入需要格式化的源数据库名称Optional -p 文件类型,是核苷酸序列数据库,还是蛋白质序列数据库 T – protein F - nucleotide [T/F] Optional default = T -a 输入数据库的格式是ASN.1(否则是FASTA) T - True, F - False. [T/F] Optional default = F

实验室 Linux下BLAST的使用

Linux下BLAST+的使用 注意,此blast已更名为blast+,目前网上中文教程多为11年之前的老版本的blast的教程,此教程为最新版本 1.软件简介 核苷酸及蛋白质序列比对 2.软件获取及安装 2.1.获取 在window系统下,利用浏览器,进入: ftp://https://www.360docs.net/doc/1d9184098.html,/blast/executables/blast+/LATEST/中下载blast linux64位(目前最新版本:ncbi-blast-2.2.29+x64-linux.tar)。 2.2.官方文档 见本文件夹中的CmdLineAppsManual.pdf文档 2.3.安装步骤 2.3.1利用putty软件进入home文件夹 # cd /home 2.3.2创建一个自己的英文文件夹 # mkdir XX 2.3.3进入xx文件夹 # cd /XX 2.3.4利用winscp软件将在windows中下载的blast压缩文件包放入其中xx文件夹中 直接拖拽即可 2.3.5利用putty软件解压下载后被拖拽近XX文件夹的blast压缩文件包 # tar -xvzf 文件名 2.3.6 修改文件夹名为blast # mv 解压后的文件夹名称blast 2.3.7利用winscp软件将blast文件夹中bin目录下的文件全部拷贝至/usr/local/bin下 2.3.8利用putty软件在自己建立的XX文件夹中制作软链接,将解压后的文件中bin目录链接至/home/XX下 # ln -s /home/xx/blast/bin 2.3.9利用winscp软件直接在当前目录(blast文件夹)下,建立.bashrc文件(注意文件名称

相关文档
最新文档