NCBI中Blast种类及使用简介

合集下载

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解BLAST（Basic Local Alignment Search Tool）是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

下面是具体操作方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

筛选的标准。

最后会说明一下。

4，注意一下你输入的序列长度。

注意一下比对的数据库的说明。

5，blast结果的图形显示。

没啥好说的。

6，blast结果的描述区域。

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】N C B I在线B L A S T使用方法与结果详解BLAST（BasicLocalAlignmentSearchTool）是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

NCBI的在线BLAST：下面是具体操作方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解BLAST（Basic Local Alignment Search Tool）是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

下面是具体操作方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

筛选的标准。

最后会说明一下。

4，注意一下你输入的序列长度。

注意一下比对的数据库的说明。

5，blast结果的图形显示。

没啥好说的。

6，blast结果的描述区域。

BLAST种类及使用方法

BLAST种类及使用方法BLAST（Basic Local Alignment Search Tool）是一种常用的生物信息学工具，用于在数据库中和比对生物序列。

BLAST工具有多种不同的变体，每种都有不同的用途和适用范围。

下面将介绍几种常见的BLAST工具及其使用方法。

1.BLASTN：BLASTN用于比对核酸序列（DNA或RNA）。

它可以识别相似的核酸序列，并计算相似度和比对长度。

通过对两个序列之间的匹配和错配进行比较，BLASTN可以找到最佳的比对结果。

BLASTN对于找到相似的基因和寻找保守序列非常有用。

使用方法：a.输入待比对的核酸序列。

b.选择合适的数据库（如NCBI的NR数据库）。

c.选择期望的输出格式。

d.运行BLASTN比对。

e.分析比对结果，并根据需要进行相关的进一步分析。

2.BLASTP：BLASTP用于比对蛋白质序列。

它可以找到相似的蛋白质序列，并计算相似度和比对长度。

BLASTP通过比较两个蛋白质序列之间的氨基酸匹配和错配来找到最佳的比对结果。

BLASTP对于找到相似的蛋白质序列、预测蛋白质结构和功能非常有用。

使用方法：a.输入待比对的蛋白质序列。

b. 选择合适的数据库（如NCBI的RefSeq数据库）。

c.选择期望的输出格式。

d.运行BLASTP比对。

e.分析比对结果，并根据需要进行相关的进一步分析。

3.BLASTX：使用方法：a.输入待比对的核酸序列。

b. 选择合适的数据库（如NCBI的RefSeq数据库）。

c.选择期望的输出格式。

d.运行BLASTX比对。

e.分析比对结果，并根据需要进行相关的进一步分析。

4. BLAST2Seq：使用方法：a.输入两个待比对的生物序列。

b.选择合适的数据库（如NCBI的NR数据库）。

c.选择期望的输出格式。

d. 运行BLAST2Seq比对。

e.分析比对结果，并根据需要进行相关的进一步分析。

5.tBLASTn：tBLASTn用于比对核酸序列，并将其翻译成六个阅读框的蛋白质序列，然后与蛋白质序列进行比对。

blast分类及特点

blast分类及特点BLAST是“局部相似性基本查询工具”（Basic Local Alignment Search Tool）的缩写，是由美国国立生物技术信息中心（NCBI）开发的一个基于序列相似性的数据库搜索程序，是目前最常用的数据库搜索程序。

BLAST实际上是综合在一起的一组工具的统称，它不仅可用于直接对核酸序列数据库和蛋白质序列数据库进行搜索，而且可以将带搜索的核酸序列翻译成蛋白质序列后再进行搜索，或反之，以提高搜索效率。

BLAST的分类主要有以下几种：1. 标准BLAST：包括Blastn、Blastp、Blastx、tBlastn、tBlastx。

2. PSI-BLAST：PSI-BLAST（Position-Specific Iterated BLAST，位点特异性迭代BLAST）的特色是每次用位置特异权重矩阵（Position-Specific Scoring Matrix，PSSM）搜索数据库后再利用搜索的结果重新构建PSSM，然后用新的PSSM再次搜索数据库，如此反复（iteration）直至没有新的结果产生为止。

3. PHI-BLAST：PHI-BLAST（Pattern-Hit Initiated BLAST，模式识别BLAST）能找到与输入序列相似的并符合某种特定模式（Pattern）的序列，这种序列特征模式可能代表某个翻译后修饰的发生位点，也可以代表一个酶的活性位点，或者一个蛋白质家族的结构域、功能域。

此外，BLAST还有以下特点：1. BLAST基本原理很简单，它的要点是片段对的概念。

所谓片段对是指两个给定序列中的一对子序列，它们的长度相等且可形成无空位的完全匹配。

2. BLAST从头至尾将两条序列扫描一遍并找出所有片段对，并在允许的阈值范围内对片段对进行延伸，最终找出高分值片段对（high-scoring pairs, HSPs）。

这样的计算复杂度是n的一次方（n是序列的长度）。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与成果详解之袁州冬雪创作BLAST（Basic Local Alignment Search Tool）是一套在蛋白质数据库或DNA数据库中停止相似性比较的分析工具.BLAST程序能迅速与公开数据库停止相似性序列比较.BLAST成果中的得分是对一种对相似性的统计说明. BLAST 采取一种部分的算法获得两个序列中具有相似性的序列.Blast中常常使用的程序先容：1、BLASTP是蛋白序列到蛋白库中的一种查询.库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对.2、BLASTX是核酸序列到蛋白库中的一种查询.先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成能够的六条蛋白），再对每条作一对一的蛋白序列比对.3、BLASTN是核酸序列到核酸库中的一种查询.库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对.4、TBLASTN是蛋白序列到核酸库中的一种查询.与BLASTX 相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对.5、TBLASTX是核酸序列到核酸库中的一种查询.此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会发生6条能够的蛋白序列），这样每次比对会发生36种比对阵列.下面是详细操纵方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列.分歧的blast程序上面已经有了先容.这里以常常使用的核酸库作为例子.2，粘贴fasta格式的序列.选择一个要比对的数据库.关于数据库的说明请看NCBI在线blast数据库的简要说明.一般的话参数默许.3，blast参数的设置.注意显示的最大的成果数跟E值，E 值是比较重要的.筛选的尺度.最后会说明一下.4，注意一下你输入的序列长度.注意一下比对的数据库的说明.5，blast成果的图形显示.没啥好说的.6，blast成果的描绘区域.注意分值与E值.分值越大越靠前了，E值越小也是这样.7，blast成果的详细比对成果.注意比对到的序列长度.评价一个blast成果的尺度主要有三项，E值（Expect)，一致性(Identities)，缺失或拔出（Gaps）.加上长度的话，就有四个尺度了.如图中显示，比对到的序列长度为1405，看Identities这一值，才匹配到1344bp,而输入的序列长度也是为1344bp（看上面的图），就说明比对到的序列要长一点.由Qurey（起始1）和Sbjct(起始35)的起始位置可知，5'端是是多了一段的.有时也要注意3'端的.附：E值（Expect)：暗示随机匹配的能够性，E值越大，随机匹配的能够性也越大.E值接近零或为零时，具本上就是完全匹配了.一致性(Identities)：或相似性.匹配上的碱基数占总序列长的百分数.缺失或拔出（Gaps）：拔出或缺失.用"—"来暗示.。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解BLAST（Basic Local Alignment Search Tool）是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

下面是具体操作方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

筛选的标准。

最后会说明一下。

4，注意一下你输入的序列长度。

注意一下比对的数据库的说明。

5，blast结果的图形显示。

没啥好说的。

6，blast结果的描述区域。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解NCBI在线BLAST（Basic Local Alignment Search Tool）是一种广泛使用的生物信息学工具，用于比对和分析DNA、RNA或蛋白质序列。

它可以对已知和未知序列进行，找到与查询序列相似的序列，并提供有关相似性和功能的信息。

使用NCBI在线BLAST可以分为四个主要步骤：选择BLAST程序，输入查询序列，选择目标数据库，解析和分析结果。

第一步：选择BLAST程序NCBI提供了多种BLAST程序可供选择，包括BLASTN（DNA对DNA的比对）、BLASTP（蛋白质对蛋白质的比对）、BLASTX（DNA对蛋白质的比对）等。

根据实际需求选择相应的BLAST程序。

第二步：输入查询序列在查询序列的文本框中输入待比对的序列。

可以输入单个序列，也可以上传包含多个序列的文件。

如果输入的序列是DNA或RNA序列，需要选择相应的序列类型。

此外，还可以选择是否使用掩码序列或低复杂性筛选来优化比对结果。

第三步：选择目标数据库用户可以选择目标数据库来与查询序列相似的序列。

NCBI提供了多个常用的数据库，如nr（非冗余蛋白质数据库）、nt（核酸数据库）等。

此外，还可以选择特定的物种数据库来限制比对范围。

第四步：解析和分析结果在BLAST运行完成后，会生成一个结果页面，其中包含了比对结果的详细信息。

结果页面包括比对统计信息、序列比对图、E值、分数等。

通过分析这些信息，可以了解查询序列与目标数据库中的序列之间的相似性和可能的功能。

此外，NCBI在线BLAST还提供了一些高级选项，例如使用特定的算法或参数来进行比对、设置比对阈值、选择比对输出格式等。

这些选项可以根据实际需求进行调整。

总结起来，使用NCBI在线BLAST可以通过选择BLAST程序、输入查询序列、选择目标数据库以及解析和分析结果来比对和分析序列。

通过权衡算法和参数选择，在特定数据库中找到与查询序列相似的序列，从而获得有关其相似性和功能的信息。

ncbi blast的功能和种类

ncbi blast的功能和种类
x
NCBI BLAST 功能和种类
NCBI BLAST（全称：Basic Local Alignment Search Tool）是一款基于局部比对的序列搜索工具，是世界上使用最广泛的DNA/RNA 序列相似性搜索软件。

它的有效计算能力非常强大，搜索数据量大，可以快速准确的实现序列匹配和比对。

NCBI BLAST 的功能：
1、提供快速灵活的局部序列比对
2、提供可靠的序列相似性分析结果
3、不仅可以搜索和比对较长序列，也可以搜索和比对较短序列
4、搜索非常大的数据库，比如NCBI的nr数据库
5、支持多种输入格式，比如FASTA、Genbank、EMBL、UniProt 等
6、支持多种输出格式，比如HTML、ASN.1、GFF3、FASTA等
NCBI BLAST 已知有四种类型：
1、核苷酸序列比对：BLASTN和TBLASTN；
2、氨基酸序列比对：BLASTP、BLASTX、TBLASTX和 TBLASTN；
3、BLAT：只能在特定的物种组织中比对序列；
4、序列排序：megaBLAST可以对大量序列进行排序，提高搜索效率；
NCBI BLAST是一种强大而灵活的工具，可以帮助生物学家们快
速、准确地搜索和比对序列，并获得可信的结果。

BLAST种类及使用方法

BLAST种类及使用方法BLAST（Basic Local Alignment Search Tool）是一种广泛使用的序列比对算法，可用于比较DNA，RNA或蛋白质序列的相似性。

它是生物信息学领域中最常用的工具之一，可以帮助研究人员识别新的序列，注释基因功能，鉴定物种间的进化关系等。

1.BLASTN：BLASTN用于比对DNA序列。

它可以将一个查询DNA序列与已知的DNA序列数据库进行比较，找到相似的序列。

BLASTN通常用于物种鉴定、基因组注释和寻找同源基因等方面的研究。

2.BLASTP：BLASTP用于比对蛋白质序列。

它可以将一个查询蛋白质序列与已知的蛋白质数据库进行比较，找到相似的蛋白质序列。

BLASTP 通常用于寻找同源蛋白质，预测蛋白质功能和结构，以及识别蛋白质家族等方面的研究。

3.BLASTX：BLASTX用于比对DNA序列与蛋白质数据库的比对。

它通过将DNA序列翻译成蛋白质序列，然后与已知的蛋白质数据库进行比对，找到相似的蛋白质序列。

BLASTX通常用于从未知的DNA序列中预测蛋白质编码区域，注释基因功能等方面的研究。

4. TBlastN：TBlastN用于比对蛋白质序列与DNA数据库的比对。

与BLASTX相反，TBlastN将已知的蛋白质序列与DNA数据库进行比对，找到相似的DNA序列。

TBlastN通常用于寻找蛋白质在基因组中的编码区域，确定启动子和转录因子结合位点等方面的研究。

5. TBlastX：TBlastX用于比对转录本与转录本数据库的比对。

它可以将一个查询转录本序列与已知的转录本数据库进行比对，找到相似的转录本。

TBlastX通常用于寻找新的转录本和预测基因表达模式等方面的研究。

使用BLAST有以下几个步骤：1.准备查询序列：将待比对的DNA、RNA或蛋白质序列准备成文本文件，确保序列格式正确，并确保序列长度适合比对任务。

2. 选择数据库：根据研究需求，选择适当的数据库。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

NCBI中Blast种类及使用简介NCBI中Blast种类简介1． Blast Assembled Genomes在一个选择的物种基因组序列中去搜索。

2．Basic Blast2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索，包括3个程序2.1.1 Blastn----核酸序列（n）到核酸序列数据库中搜索，是一种标准的搜索。

2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。

可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。

2.2 Protein Blast2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索，是一种标准的搜索。

2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。

所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐，从这个对齐，一个位置特异的分值矩阵建立起来。

这个矩阵被用来搜索资料库，以找到额外的显著对齐，这个过程可能被反复迭代一直到没有新的对齐可以被发现。

2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。

2.3 Translating BLAST2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。

2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成蛋白质序列,然后将待查询的蛋白质序列与翻译结果进行比较。

2.3.3 tblastx----先将待查询的核酸序列和核酸序列数据库中的核酸序列按6 种读框翻译成蛋白质序列,然后再将两种翻译结果在蛋白质水平上进行比较3．Specialized Blast Specialized BLAST pages 可以对特殊生物或特殊研究领域的序列数据库进行检索。

例：CD - SearchCD - Search 是使用RPS - BLAST程序以一个蛋白质序列与保守结构域数据库(Conserved Domain Database) 做比较。

Pairwise BLASTPairwise BLAST是用BLAST程序实现两个序列之间的比较。

选择“序列1”为待比较序列,则“序列2”就是被比较序列。

IgBLAST —IgBLAST被开发出来以便於分析在GenBank中的免疫球蛋白的序列。

它允许用blastp或blastn来搜索nr资料库或一个由免疫球蛋白生殖系变化区基因的特殊的资料库。

搜索可以限制在人类或小鼠的基因。

IgBLAST执行三个主要的功能∶1）报告与查询序列最相似的可变，D，或J区，2）根据Kabat et al.来注解免疫球蛋白domains（从FWR1到FWR3），3）对於搜索核酸或蛋白nr 资料库，通过匹配IgBLAST的发现和最接近的生殖系变化区基因来简化识别相关序列的过程。

等等。

在线BLAST的使用方法1、登陆blast主页：/BLAST/2、根据数据类型，选择合适的程序3、填写表单信息序列的输入、比对搜索区域的选择、数据库的选择：_/ [&限制调节、打分矩阵及其他参数的设置：图中各参数的含义：（不同的平台有少许差异，请对比参照）9 L4 N3 I) u+ N0 {$ qWord siez选项：4 c, r* F* g" t' g) B, j9 uBLAST 程序是通过比对未知序列与数据库序列中的短序列来发现最佳匹配序列的。

最初进行“扫描”(scanning)就是确定匹配片段。

序列的匹配程序由短序列(定义为“word”,即字)的联配得分总和来决定。

联配时，“字”的每个碱基均被计分：如果碱基对完全相同(如 A 与 A)，得某一正值；如果碱基对不很匹配(W与A或 T)，则得某一略小的正值；如果两个碱基不匹配，则得一负值。

总的合计得分便决定了序列间的相似程度。

得分高的匹配序列被称为高比值片段对(high-scoring segment pairs, HSP)。

BLAST 程序在两个方向扩展 HSP，直至序列结束或联配已变为不显著。

替换矩阵在扫描(scanning)和扩展过程被应用。

最后在 BLAST 报告中被列出的序列都是所有得分最高的序列。

以上述及的初始字长便是由Word siez值设定。

BLAST只对字长为W的“字”进行扩展联配。

BLAST 的字长缺省值为 11，即 BLASTN 将扫描数据库，直到发现那些与未知序列的 11 个连续碱基完全匹配的11个连续碱基长度片段为止。

然后这些片段(即字)被扩展。

11个碱基的字长已能有效地排除中等分叉的同源性和几乎所有随机产生的显著联配。

“Filter”(过滤器)选项：BLAST 2.0版本的新功能，过滤器将锁定诸如组成低复杂(low compositional complexity)序列区(如Alu序列)，用一系列N(NNNNNN)替代这些程序。

N 代表任意碱基(IUB-code)。

只有未知待检序列被过滤替代，而数据库的序列将不被过滤。

过滤对绝大多数序列都是有益的，例如，多A 碱基的尾部和脯氨酸富积的序列，会得到人为的高联配得分而误导分析。

这是因为这类序列数量极大，遍布整个基因组，直至整个数据库。

# p$ r4 W! O1 x5 n8 i! j3 m“Matrix”(矩阵)选项：联配的显著性是由返回的比对分值决定的，该分值反映的是所得到的联配随机产生的概率有多大。

矩阵被用于鉴别数据库中的序列，同时又用来预测匹配的显著性大小。

一般应接受运行程序推荐的矩阵。

BLAST系列程序主要使用两种类型矩阵(PAM和BLOSUM，前面都有介绍)。

要准确地选择矩阵，必须了解矩阵和矩阵的具体计分方式。

值得注意的是，直接比较使用不同替换矩阵而获得的联配得分是没有意义的。

“EXPECT”选项：您可以为搜索设定一个期望值阀值(EXPECT)，例如缺省值设为10。

这一设置则表示联配结果中将有10个匹配序列是由随机产生，如果联配的统计显著性值(E值)小于该值(10)，则该联配将被检出。

换句话说，比较低的阀值将使搜索的匹配要求更严格，结果报告中随机产生的匹配序列减少。

“Score Value”(分值)选项：（有些平台上没有此选项）6 [- q+ J# k9 ?6 N( M( d0 a在“wordsize”选项中曾论及碱基对匹配程度的赋分问题，其赋分的标准可由分值选项的M和N 两个参数设置。

M 参数为匹配碱基的赋值，必需为一正整数；N 参数为不匹配碱基的赋值，必需为一负整数。

M/N 的比率决定了你所接受的进化分歧程度(degree of divergence)，M 和N 的缺省值为5和-4。

该比率(1.25)相当于在100个残基中约有47可以观测到的核酸点突变(PAM)。

PAM 是被用来预测分子序列从祖先序列进化而来的程度。

如果你调整M和N使比率提高，则 PAM 矩阵也应选择大些(指PAM矩阵后的数字)，以适应相应的较大的分歧程度。

NCBI使用方法2010-07-19 20:22NCBI使用方法NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心/NCBI是NIH的国立医学图书馆（NLM）的一个分支。

NCBI提供检索的服务包括：1．GenBank（NIH遗传序列数据库）：一个可以公开获得所有的DNA序列的注释过的收集。

GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库（EMBL和DDBJ）交换数据建立起数据库的。

它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。

这三个组织每天交换数据。

其中的数据以指数形式增长，最近的数据为它已经有来自47000个物种的30亿个碱基。

2．Molecular Databases（分子数据库）：Nucleotide Sequence（核酸序列库）：从NCBI其他如Genbank数据库中收集整理核酸序列，提供直接的检索。

Protein Sequence （蛋白质序列库）：与核酸类似，也是从NCBI多个不同资源中编译整理的，方便研究者的直接查询。

Structure（结构）-——关于NCBI结构小组的一般信息和他们的研究计划，另外也可以访问三维蛋白质结构的分子模型数据库（MMDB）和用来搜索和显示结构的相关工具。

MMDB：分子模型数据库—一个关于三维生物分子结构的数据库，结构来自于X-ray晶体衍射和NMR色谱分析。

Taxonomy（分类学）——NCBI的分类数据库，包括大于7万余个物种的名字和种系，这些物种都至少在遗传数据库中有一条核酸或蛋白序列。

其目的是为序列数据库建立一个一致的种系发生分类学。

3．Literature Databases（文献数据库）（1）PubMed是NLM提供的一项服务，能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问，并可以连接到参与的出版商网络站点的全文文章和其他相关资源。

（2）PMC/PubMed Center：也是NLM的生命科学期刊文献的数字化存储数据库，用户可以免费获取PMC的文章全文，除了部分期刊要求对近期的文章付费。

（3）OMIM（孟德尔人类遗传）：有关人类基因和无序基因的目录数据库由Victor A.McKusick和他的同事共同创造和编辑的，由NCBI网站负责开发，其中也包括对MEDINE众多资源和Entrez系统的序列记录，以及NCBI中其他有关资源的链接。

（4）Books：NCBI的书库不断收集生物医学方面的书籍，提供这些书籍的出版信息、摘要、目录和全文的连接，用户可以直接在检索文本框内输入一个观念就可以查询。

4．NCBI提供的附加的软件工具有：开放阅读框寻觅器（ORF Finder），电子PCR，和序列提交工具Sequin和BankIt。

所有的NCBI数据库和软件工具可以从WWW或FTP来获得。

NCBI还有E-mail服务器，提供用文本搜索或序列相似搜索访问数据库一种可选方法。

NCBI网站上还提供了一些诸如研究热点问题、研究小组情况、教育培训、联系方式等信息，还提供了到NIH、NLM等的链接。