blast核酸氨基酸序列相似性比较

合集下载

BLAST检索和比对

BLAST检索和比对Alignment: 序列比对。

将两个或多个序列排在一起，以达到最大一致性的过程（对于氨基酸序列是比较它们的保守性），这样可以评估序列间的相似性和同源性。

Algorithm: 算法。

在计算机程序中包含的一种固定过程。

Bioinformatics: 生物信息学。

一门结合生物技术和信息技术从而揭示生物学中新原理的科学。

Bit score: 二进制。

二进制值S＇源于统计性质被数量化的打分系统中产生的原始比对分数S。

由于二进制值相对于打分系统已经被标准化，它们常用于比较不同搜索之间的比对分数。

BLAST: 基本的局部相似性比对搜索工具。

在序列数据库中快速查找与给定序列具有最优局部对准结果的序列的一种序列比对算法。

初步搜索是对打分至少为T、长度为W的词进行的。

打分的过程是用一个替代矩阵对查询序列和该词作比较。

然后词长可以试着向两端伸长以获得一个超过阈值S的打分。

参数T反映了搜索的速度大小和敏感性。

可以参见BLAST的用户指南和BLAST使用指导来获得更详细的信息。

BLOSUM: 模块替换矩阵。

在替换矩阵中，每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的。

每个矩阵被修改成一个特殊的进化距离。

例如，在BLOSUM62矩阵中，是使用一致性不超过62%的序列进行配对来获得打分值的。

一致性大于62%的序列在配对时用单个序列表示，以避免过于强调密切相关的家族成员。

Conservation: 保守。

指氨基酸或DNA（普遍性较小）序列某个特殊位置上的改变，并不影响原始序列的物理化学性质。

Domain: 结构域。

蛋白质在折叠时与其他部分相独立的一个不连续的部分，它有着自己独特的功能。

DUST: 一个低复杂性区段过滤程序。

E value: E值。

期望值。

在一个数据库中所搜索到的打分值等于或大于S的不同比对的个数。

E值越低，表明该打分值的显著性越好。

Filtering: 过滤，也叫掩蔽（masking）。

序列比对BLAST案列分析

的一部分：
MRCLVVLLAA LALSQASGIT RIPLHKGKTL RKALKERGLL EDFLQRQQYA VSSKYSSLGK VAREPLTSYL DSQYFGKIYI
• 首选分析1),2)中的字母组成可知，1)为核酸序列， 2)为氨基酸序列；
• 其次根据个人喜好分别登陆NCBI，EMBL，DDBJ相关位点进行序列比对（Blast）
最相似的5个发序布列人的默检认索核号酸序列比对考入核酸序列
得分最高的序列，最可能是查询的序列的全长，点击
DDBJ查询2）的结果
2）中序列是氨基酸序列，所以选取Blastp进入蛋白质/氨基酸序该序列为chymosin凝乳酶的一部分列比考对入界2面）中序列
NCBI
基因名称拷贝1）中的序列粘贴到对话框
发布时间
核酸比对发布人员蛋白质/氨基酸比对
匹配率最高最高先做1）题选择核酸比对
最相似的序列检索号
2）
则2）中序列为Chymosin凝乳酶的一部分
对话框中考入2）中序列
核酸序列比对蛋白质/氨基酸序列比对
2）中序列选择蛋白质/氨基酸比对
前两个匹配率相等，名字相同，可任选一个
序列比对BLAST案列分析
• 1）运用Blast工具检索一下序列的信息：基因名称、发布时间、发布人员和与其最相似的5个序列的检索号
atggggccaa gctactgctc tcctctcttc ctctgtctcc tgctgtgcgg gggcacggag ctgtgctgtg ccctgcctct gtggctcttg cccggtggaa ctgcgaaccc agtgacgtct • 2）综合运用BLAST方法检索以下信息属于什么基因

实验2 序列查询(Entrez)、BLAST序列相似性搜索

实验二：序列查询(Entrez)、BLAST序列相似性搜索实验目的：1.学会用Entrez系统查找目标序列2.学会使用BLAST在数据库中搜索相似序列3.学会分析数据库搜索结果实验内容：一、EntrezEntrez是一个由NCBI创建并维护的基于Web界面的综合生物信息数据库检索系统。

用户不仅可以方便地检索Genbank的核酸数据，还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。

网址：/Entrez/（或在NCBI主页默认All Databases时点击搜索框右边的Search进入）。

如Figure 2.1所示：Figure 2.1 entrez 检索系统子数据库点击搜索框右边的help按钮，即可进入Entrez帮助页面。

在搜索栏输入你要查找的关键词，点击“GO”即可开始搜索。

如果输入多个关键词，它们之间默认的是“与”（AND）的关系。

Ｔｉｐｓ：搜索的关键词可以是一个单词，短语，句子，数据库的识别号，基因名字等等，但必须明确，不能是“ｇｅｎｅ”，　“ｐｒｏｔｅｉｎ”等没有明确指向的词语。

但“ｔｒａｎｓｃｒｉｐｔｉｏｎ　ｆａｃｔｏｒ”这样有一定范围的词是可以接受的。

可以用你感兴趣的领域的专业术语，也可以是非专业术语，比如：ｈ１ｎ１，ｌｕｎｇ　ｃａｎｃｅｒ，ａｌｂｉｎｉｓｍ；　ｓｕｂｔｉｌｉｓｍ，　ｐｅｒｏｘｉｄａｓｅ，　ｍｙｏｇｌｏｂｉｎ。

　输入关键词，点击“GO”之后，每个数据库图标前方出现了数字,代表的是在相对应的数据库里搜索到的条目数。

点击进入对应的数据库，可以查看搜索到的条目。

如果在数据库图标前面为灰色，显示“none”,说明在对应的数据库里没有搜索到任何结果。

也可以直接通过NCBI任一页面上的搜索栏进行Entrez搜索。

点击“search”后面的下拉菜单，选择数据库，在下面的文本框里输入关键词，点击“Search”即可(Figure 2.2)。

生物信息学中的序列比对工具对比总结

生物信息学中的序列比对工具对比总结序列比对是生物信息学中的核心技术之一，它是通过对比两个或多个生物序列的相似性和差异性来研究其结构、功能和演化关系的重要方法。

为了进行序列比对，科学家们开发了许多不同的序列比对工具。

本文将对一些常用的序列比对工具进行对比和总结。

1. BLAST (Basic Local Alignment Search Tool)BLAST 是最常用的序列比对工具之一。

它可以在短时间内快速比对大量生物序列。

BLAST 提供了多种不同的比对算法，包括常见的BLASTN（nucleotide序列比对）和BLASTP（蛋白质序列比对）。

BLAST 的优点是速度快、易用性好，适用于快速筛选大量相似序列。

2. ClustalWClustalW 是多序列比对的常用工具之一。

它使用多重序列比对算法，将多个序列的相似部分按照最佳的方式对齐。

ClustalW 可以在网页界面或命令行中使用，对于中小规模的序列比对非常高效。

3. MUSCLE (MUltiple Sequence Comparison by Log-Expectation)与ClustalW 类似，MUSCLE 也是一种常用的多序列比对工具。

它采用较新的比对算法，能够更加准确和高效地进行大规模序列比对。

MUSCLE 的优点是能处理大量序列，且能够生成高质量的比对结果。

4. MAFFT (Multiple Alignment using Fast Fourier Transform)MAFFT 是一种高性能的多序列比对工具，其算法基于快速傅立叶变换。

它可以处理大规模序列，且比对结果质量高。

MAFFT还提供了许多可选参数，以满足用户对比对过程的个性化需求。

5. T-Coffee (Tree-based Consistency Objective Function for Alignment Evaluation)T-Coffee 是一种基于树的多序列比对工具，它利用树模型来提高序列比对的准确性。

BLAST序列相似性检索

BLAST序列相似性检索<zt>序列类似性检索就是将新测定的核酸或蛋白质序列对核酸或蛋白质序列数据库进行检索，找出与之相似的序列，从而评判新测定的序列是重复别人的工作，还是在前人的基础上有所创新，或是发现了新的序列。

现在用于序列类似性检索的软件很多，下面主要介绍GenBank的序列类似性检索工具棗BLAST。

1. BLAST简介BLAST是Basic Local Alignment Search Tool的英文缩写，意即碱基局部对准检索工具，是一种序列类似性检索工具。

它采用统计学记分系统，能将真正配对的序列同随机产生的干扰序列区别开来；同时采用启发式算法系统，即采用的是局部对准算法(Local Alignment Algorithm)，而不是全序列对准算法(Global Alignment Algorithm)。

全序列对准算法是在检索结果中两个被比较序列所有片断均类似；而局部对准算法是找出两个被比较序列的“最类似”片断，并得出可能只包含两个序列的某个部分的对准结果。

在BLAST的基础上，NCBI又开发了BLAST 2.0、Gapped BLAST和PSI-BLAST。

BLAST 2.0•是一种新的BLAST 检索工具，它对BLAST作了改进，运行速度更快，灵敏度更高，同时具有Gapped BLAST和PSI-BLAST两种软件的新功能。

Gapped BLAST允许在对准的序列中引入空位(•碱基缺失或插入)，引入“空位”(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。

这些空位对准的记分系统更能反映相关序列的类似程度。

PSI-BLAST的全称是Position-Specific •Iterated BLAST，意即特殊位置重复BLAST，它提供了自动、易用的概貌(Profile)检索，是查找序列同源(Sequence Homologues)的有效方法。

目前，PSI-BLAST•仅用于比较蛋白质查询序列与蛋白质数据库中的序列的类似程度。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解BLAST（Basic Local Alignment Search Tool）是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

下面是具体操作方法1，进入在线BLAST界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

筛选的标准。

最后会说明一下。

4，注意一下你输入的序列长度。

注意一下比对的数据库的说明。

5，blast结果的图形显示。

没啥好说的。

6，blast结果的描述区域。

核酸氨基酸序列相似性比较

BLAST 核酸/氨基酸序列相似性比较Blast (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLA ST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

如果您想进一步了解B LAST算法，您可以参考NCBI的BLAST Course ，该页有BLAST算法的介绍。

BLAST的功能BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。

BLAST还能发现具有缺口的能比对上的序列。

BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。

从最初的BLAST发展到现在NCBI提供的BLAST2.0,已将有缺口的比对序列也考虑在内了。

BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。

所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。

BLAST包含的程序：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

BLAST_核酸氨基酸序列相似性比较

BLAST核酸/氨基酸序列相似性比较Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLA ST结果中的得分是对一种对相似性的统计说明。

BLAST采用一种局部的算法获得两个序列中具有相似性的序列。

如果您想进一步了解BLAST算法，您可以参考NCBI的BLAST Course，该页有BLAST算法的介绍。

BLAST的功能BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。

BLAST还能发现具有缺口的能比对上的序列。

BLAST是基于Altschul等人在J.M ol.Biol上发表的方法(J.M ol.Biol.215:403-410(19 90)),在序列数据库中对查询序列进行同源性比对工作。

从最初的BLAST发展到现在NC BI提供的BLAST2.0,已将有缺口的比对序列也考虑在内了。

BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。

所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。

BLAST包含的程序：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

blastp搜氨基酸特异序列

一、什么是blastp搜氨基酸特异序列blastp是一种用于搜索氨基酸特异序列的生物信息学工具。

它可以在蛋白质数据库中寻找与给定氨基酸序列相似的蛋白质序列。

这种工具可以帮助科研人员识别出与已知蛋白质相似或具有同源性的蛋白质序列，为蛋白质功能研究和进化分析提供重要的信息。

二、blastp搜氨基酸特异序列的原理blastp采用了基于统计学的算法，对输入的氨基酸序列与数据库中的蛋白质序列进行比对，从而找出相似性最大的序列。

其原理主要包括序列比对、分值计算和统计学检验等步骤。

1.序列比对blastp首先对输入的氨基酸序列与数据库中的蛋白质序列进行局部比对。

它使用一种称为“种子”的方法，从输入序列中选取长度为W的窗口，并计算其与数据库中序列的相似性。

它在数据库中搜索与这些“种子”相似的蛋白质序列片段。

2.分值计算在找到相似的蛋白质片段之后，blastp会计算它们与输入序列的相似性得分。

这个得分是由序列相似性所产生的一系列匹配、不匹配和间隔的比例来确定的，用来衡量两个序列之间的相似程度。

3.统计学检验blastp会对得到的相似性得分进行统计学检验，以确定是否这种相似是显著的，而不仅仅是随机的。

这个检验通常采用卡方分布或正态分布来进行，可以帮助排除由于随机巧合而产生的相似性。

三、如何运用blastp搜氨基酸特异序列blastp可以应用于多个领域的研究中，包括蛋白质功能注释、蛋白质结构预测、药物设计和进化分析等。

1.蛋白质功能注释在已知蛋白质的功能注释过程中，科研人员可以使用blastp来寻找与未知蛋白质相似或同源的已知蛋白质序列。

这些相似的序列往往具有相似的功能，可以为未知蛋白质的功能预测提供线索。

2.蛋白质结构预测通过识别与已知蛋白质相似的序列，blastp可以帮助科研人员预测未知蛋白质的结构。

这对于理解蛋白质的功能和相互作用机制非常重要。

3.药物设计在药物设计研究中，blastp可以用来寻找与靶标蛋白质相似的蛋白质序列，以确定潜在的药物靶点和药物作用机制。

实验六序列相似性的比对和搜索

实验六序列相似性的比对和搜索一、实验目的1．能够熟练使用NCBI网站的BLAST系列工具，通过NCBI中的BLAST功能，对所提供的基因组序列或蛋白质序列进行相似性比对，找到在GenBank中与之相似的序列，推测所比对序列的功能。

2．能够熟练掌握用Clustalx软件进行双序列和多序列比对。

3．学会使用EMBL上的Clustalw工具进行比对。

二、实验内容及操作步骤（一）BLAST的使用1．Blastn：进入NCBI主页下载关于AY125911、AF513548、AF525146、AF492473、AY497910、AY497911等核酸序列或其它你感兴趣的核酸序列（Fasta格式）。

1)进入/BLAST/；2)选择Nucleotide→Nucleotide-nucleotide BLAST (blastn)进行核酸相似性数据库搜索；3)在search对话框中粘贴入下载的相关核酸序列(Fasta格式)；4)调整各参数值，直到获得最佳比对；5)点击进行比对；6)点击Format!对结果进行格式化，可在下面的选项中自行设计结果的显示方式；7)查看比对结果，看在数据库中找到的序列与你的序列是否相似或相同。

2．Blastp：进入NCBI主页下载某一蛋白质序列(Fasta格式)，如cytochrome oxidase, peroxidase, SOD (Superoxide Dimutase)。

1)选择Protein→Protein-protein BLAST (blastp)进行蛋白质相似性数据库搜索；2)在search对话框中粘贴入下载的蛋白质序列(Fasta格式)；3)调整各参数值，直到获得最佳比对；4)点击进行比对；5)点击Format!对结果进行格式化，可自行设计结果的显示方式；6)查看比对结果，看在数据库中找到的序列与你的序列是否相似或相同。

3．Bl2seq：进入NCBI主页下载某两条核酸或蛋白质序列(Fasta格式)1)进入/BLAST/；2)点击Special目录下的Align two sequences (bl2seq)；3)将两条序列分别输入Sequence 1和Sequence 1区域；4)点Align进行比对；5)根据结果查看bl2seq是否允许插入空位。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

BLAST 核酸/氨基酸序列相似性比较Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。

BLAST程序能迅速与公开数据库进行相似性序列比较。

BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

如果您想进一步了解BLAST算法，您可以参考NCBI的BLAST Course ，该页有BLAST算法的介绍。

BLAST的功能BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。

BLAST还能发现具有缺口的能比对上的序列。

BLAST是基于Altschul等人在上发表的方法在序列数据库中对查询序列进行同源性比对工作。

从最初的BLAST发展到现在NCBI提供的,已将有缺口的比对序列也考虑在内了。

BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。

所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。

BLAST包含的程序：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

通常根据查询序列的类型（蛋白或核酸）来决定选用何种BLAST。

假如是作核酸－核酸查询，有两种BLAST供选择，通常默认为BLASTN。

如要用TBLASTX也可，但记住此时不考虑缺口。

BLAST适用于本地查询。

可以下载公共数据库，对于该数据库的更新和维护是必不可少的。

如果要直接到网上查询也可以（即ＮetＢlast），但记住如果你认为自己的序列很有价值的话，还是谨慎为宜。

如何访问在线的BLAST功能服务您只要通过浏览器访问Blast主页( 。

所有的查询和分析都通过浏览器来完成，就象您在您的本地机上一样方便和快捷。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。

Blast中常用的程序介绍：1、BLASTP是蛋白序列到蛋白库中的一种查询。

库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

2、BLASTX是核酸序列到蛋白库中的一种查询。

先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对。

3、BLASTN是核酸序列到核酸库中的一种查询。

库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

4、TBLASTN是蛋白序列到核酸库中的一种查询。

与BLASTX相反，它是将库中的核酸序列翻译成蛋白序列，再同所查序列作蛋白与蛋白的比对。

5、TBLASTX是核酸序列到核酸库中的一种查询。

此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白（每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

NCBI的在线blast：，进入在线blast界面，可以选择blast特定的物种（如人，小鼠，水稻等），也可以选择blast所有的核酸或蛋白序列。

不同的blast程序上面已经有了介绍。

这里以常用的核酸库作为例子。

2，粘贴fasta格式的序列。

选择一个要比对的数据库。

关于数据库的说明请看NCBI在线blast数据库的简要说明。

一般的话参数默认。

3，blast参数的设置。

注意显示的最大的结果数跟E值，E值是比较重要的。

筛选的标准。

最后会说明一下。

4，注意一下你输入的序列长度。

注意一下比对的数据库的说明。

5，blast结果的图形显示。

没啥好说的。

6，blast结果的描述区域。

注意分值与E值。

分值越大越靠前了，E值越小也是这样。

7，blast结果的详细比对结果。

注意比对到的序列长度。

评价一个blast结果的标准主要有三项，E值（Expect)，一致性(Identities)，缺失或插入（Gaps）。

加上长度的话，就有四个标准了。

如图中显示，比对到的序列长度为1405，看Identities这一值，才匹配到1344bp,而输入的序列长度也是为1344bp（看上面的图），就说明比对到的序列要长一点。

由Qurey（起始1）和Sbjct(起始35)的起始位置可知，5'端是是多了一段的。

有时也要注意3'端的。

附：E值（Expect)：表示随机匹配的可能性，E值越大，随机匹配的可能性也越大。

E值接近零或为零时，具本上就是完全匹配了。

一致性(Identities)：或相似性。

匹配上的碱基数占总序列长的百分数。

缺失或插入（Gaps）：插入或缺失。

用"—"来表示。

BlastN/MegaBlast/Discontiguous MegaBlast 的区别：三者之间的共同之处就是 BlastN/Megablast/Discontiguous megablast 都是BlastN,就是核酸序列比对核酸序列的算法。

简单而言BlastN : 应该是出现较早的算法。

比对的速度慢，但允许更短序列的比对（如短到7个碱基的序列）。

MEGABLAST : 主要用来鉴定一段新的核酸序列，它并不注重比对各个碱基的不同和序列片断的同源性，而只注重被比对序列是否是数据库未收录的，是否为新的提交序列或基因。

速度快。

同一物种间的。

Discontiguous MEGABLAST : 灵敏度（sensitivity）更高，用于更精确的比对。

主要用于跨物种之间的同源比对。

详细解释1，MEGABLAST 常被用于鉴定核酸序列MEGABLAST is the tool of choice to identify a nucleotide sequence.MegaBLAST也是一种BLASTN程序，不过它主要是用来在非常相似的序列之间（来自同一物种）比对同源性的。

鉴定某一段核酸序列是否存在于数据库，最好的方法是选择MEGABLAST。

如果比对到的序列在数据库中注释完整的话，那该序列丰富的注释可以当作新序列的参考。

当然，Bl astN/MEGABLAST/Discontiguous MEGABLAST，都可以完成这种事情。

但MEGABLAST就是特别设计用于非常相似序列之间的比对，可用于寻找查询序列的最佳匹配的序列。

2，Discontiguous MEGABLAST 更好地用于查找不同物种的相似的核酸序列，而不是与查询序列相同（identical）物种的。

Discontiguous MEGABLAST is better at finding nucleotide sequences similar, but not identical, to your nucleotide query.Discontiguous MEGABLAST，用于跨物种核酸序列快速比对。

它使用非重叠群字段匹配算法（noncontiguous word match）来进行核酸比对。

Discontiguous MegaBLAST比bl astx等翻译后比对要快得多，同时它在比较编码区时也具有相当高的敏感度。

但是需要指出的是，核酸与核酸之间的比对并不是发现同源蛋白编码区域的最佳方法，直接在蛋白水平用Blastp比对更好。

这是因为密码子的简并性。

(Lc.注：翻译得有些拗口，多多见谅！)Discontiguous MEGABLAST详细介绍：原文：本文详细出处参考：1009/#more-10091，Blastp: 标准的蛋白序列与蛋白序列之间的比对Standard protein BLAST is designed for protein searches.Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。

跟其它的Blast程序一样，目的是要找到相似的区域。

2，PSI-BLAST : 敏感度更高的蛋白序列与蛋白序列之间的比对PSI-BLAST is designed for more sensitive protein-protein similarity searche s.Position-Specific Iterated (PSI)-BLAST，是一种更加高灵敏的Blastp程序，对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效。

当你使用标准的Blastp比对失败时，或比对的结果仅仅是一些假基因或推测的基因序列时（"hypothetical pr otein" or "similar to..."），你可以选择PSI-BLAST重新试试。

3，PHI-BLAST : 模式发现迭代BLASTPHI-BLAST can do a restricted protein pattern search.PHI-BLAST, 模式发现迭代BLAST, 用蛋白查询来搜索蛋白数据库的一个程序。

仅仅找出那些查询序列中含有的特殊模式的对齐。

PHI的语法详细介绍看这里：Peptide Sequence Databases蛋白序列的数据库nrAll non-redundant GenBank CDS translations + RefSeq Proteins + PDB + Swis sProt + PIR + PRF所有非冗余的的GenBank CDS区的翻译序列 + 参考序列的蛋白 + PDB数据库+ Swis sProt蛋白数据库 + PRF蛋白数据库refseqRefSeq protein sequences from NCBI's Reference Sequence Project.所有NCBI的参考序列swissprotLast major release of the SWISS-PROT protein sequence database (no updates). swissprot的蛋白数据库Proteins from the Patent division of GenPept.专利的蛋白数据库pdbSequences derived from the 3-dimensional structure from Brookhaven Protein Data Bank.PDB数据库monthAll new or revised GenBank CDS translation+PDB+SwissProt+PIR+PRF released i n the last 30 days.一个月内新增加的蛋白序列env_nrProtein sequences from environmental samples.来自environmental samples的蛋白序列Nucleotide Sequence Databases核酸数据库nrAll GenBank + RefSeq Nucleotides + EMBL + DDBJ + PDB sequences (excluding H TGS0,1,2, EST, GSS, STS, PAT, WGS). No longer "non-redundant".所有GenBank的核酸序列 + 参考序列中的核酸序列+ EMBL +DDBJ +PDB核酸序列（但不包括HTG，EST，GSS等序列）refseq_rnaRNA entries from NCBI's Reference Sequence projectNCBI参考序列中的核酸序列refseq_genomicGenomic entries from NCBI's Reference Sequence projectNCBI参考序列中的基因组序列estDatabase of GenBank + EMBL + DDBJ sequences from EST Divisions来自GenBank + EMBL + DDBJ 的EST序列est_humanHuman subset of est.人的EST序列est_mouseMouse subset.小鼠的EST序列est_othersNon-Mouse, non-Human subset of est.、除了人与小鼠之外的EST序列Genome Survey Sequence, includes single-pass genomic data, exon-trapped seq uences, and Alu PCR sequences.htgsUnfinished High Throughput Genomic Sequences: phases 0, 1 and 2 (finished, phase 3 HTG sequences are in nr)未发布的高通量的基因组测序patNucleotides from the Patent division of GenBank.专利的核酸序列pdbSequences derived from the 3-dimensional structure from Brookhaven Protein Data BankPDB核酸序列monthAll new or revised GenBank + EMBL + DDBJ + PDB sequences released in the la st 30 days.一个月内新增的核酸序列dbstsDatabase of GenBank+EMBL+DDBJ sequences from STS Divisions .STS数据库chromosomeA database with complete genomes and chromosomes from the NCBI Reference Se quence project..NCBI参考序列计划中所有的完整基因组和染色体序列wgsA database for whole genome shotgun sequence entries.基因组鸟枪法测序得到的序列env_ntNucleotide sequences from environmental samples, including those from Sarga sso Sea and Mine Drainageprojects.来自environmental samples的核酸序列。