DNA序列比对同源性分析图解BLAST

合集下载

如何运用BLAST进行序列比对、检验引物特异性

如何运用BLAST进行序列比对、检验引物特异性

序列比对,绝大多数战友都会想到BLAST,但BLAST的使用确实又是一个很大的难题,因为他的功能比较强悍,里面涉及到的知识比较多,而且比对结束后输出的结果参数(指标)又很多.如果把BLAST的使用详细的都讲出来,我想我发帖发到明天也发不完,更何况我自己也不是完全懂得BLAST的使用。

所以我在这里也就“画龙点睛"——以比对核酸序列为例来给大家介绍一下BLAST的使用,也算是BLAST的入门课程吧。

请看帖的战友好好体会,如果你用心看,在看帖完毕之后BLAST的基本使用(包括其他序列的比对)应该没有问题了。

一、打开BLAST 页面,http://www。

ncbi.nlm.nih。

go/BLAST/ 打开后如图所示:(缩略图,点击图片链接看原图)对上面这个页面进行一下必要的介绍:BLAST的这个页面主体部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLAST、Specialized BLAST.相信大家可以看懂这三个短语的意思,我就不多说了;我要说的是,可以认为这是三种序列比对的方法,或者说是BLAST的三条途径。

第一部分BLAST Assembled Genomes就是让你选择你要比对的物种,点击相应物种之后即可进入比对页面.第二部分Basic BLAST包含了5个常用的BLAST,每一个都附有简短的介绍。

第三部分Specialized BLAST是一些特殊目的的BLAST,如IgBLAST、SNP等等,这个时候你就需要在Specialized BLAST部分做出适当的选择了。

总之,这是一个导航页面,它的目的是让你根据自己的比对目的选择相应的BLAST 途径。

下面以最基本的核酸序列比对来谈一下BLAST的使用,期间我也会含沙射影的说一下其他序列比对的方法.二、点击Basic BLAST部分的nucleotide blast链接到一个新的页面.打开后如图所示:screen.width-333)this。

生物序列的同源性搜索 -blast简介及其应用

生物序列的同源性搜索 -blast简介及其应用
29
分析过程(三)
6.限制条件,我们限制 在病毒里面找。
7.其他选项保持默认值
打分矩阵
30
分析过程(四)
8.输出格式选项保持 默认值
9.点击开始搜索
31
分析过程(五)
10.查询序列的一些 相关信息 在cdd库里面找到 两个保守区域, 点击可以进入
32
分析过程(六)
图形结果
33
分析过程(七)
15
本地WEB版的Blast
在NCBI的FTP上,在blast程序的目录 下,还提供了一种供用户在自己的服务器 上建立Blast网页服务的软件包(wwwblast)。 使用该软件包,用户可以建立一个简 易的进行Blast运算的网站供实验室人员使 用。用于搜索的数据库同样可以灵活的定 义。
16
Blast程序评价序列相似性的两个数据
39
单机版的Blast使用(三)
3.获取Blast数据库 a.直接从ncbi下载 ftp:///blast/db/ b.用Blast程序包提供的formatdb工具自己格 式化序列数据成数据库。 假设有一序列数据(sequence.fa,多序列,fasta 格式),欲自己做成Blast数据库,典型的命令 如下:
Score:使用打分矩阵对匹配的片段进行打分,这是
对各片段越长、 相似性越高则Score值越大。
E value:在相同长度的情况下,两个氨基酸残基(或
碱基)随机排列的序列进行打分,得到上述Score值的 概率的大小。E值越小表示随机情况下得到该Score值的 可能性越低。
2.其他站点:
/blast/ /ncbi_blast.html /blast/(果蝇)

12
Blast结果给出的信息

DNA序列比对同源性分析图解BLAST

DNA序列比对同源性分析图解BLAST

1、进入网页:/BLAST/2、点击Search for short, nearly exact matches3、在search栏中输入引物系列:注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’;5’-TGCCCATCACAACATCATCT-3’(1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。

这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。

(2)简便的做法是同时输入上下游引物:有以下两种方法。

输入上下游引物系列都从5’——3’。

A、输入上游引物空格输入下游引物B、输入上游引物回车输入下游引物4、在options for advanced blasting中:select from 栏通过菜单选择Homo sapiensExpect后面的数字改为105、在format中:select from 栏通过菜单选择Homo sapiens Expect后面的数字填上0 106、点击网页中最下面的“BLAST!”7、出现新的网页,点击Format!8、等待若干秒之后,出现results of BLAST的网页。

该网页用三种形式来显示blast的结果。

(1)图形格式:图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配通过点击相应的bar可以得到匹配情况的详细信息。

(2)结果信息概要:从左到右分别为:A、数据库系列的身份证:点击之后可以获得该序列的信息B、系列的简单描述C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。

按照得分的高低由大到小排列。

得分的计算公式=匹配的碱基×2+0.1。

生物信息学:第五讲BLAST序列比对PPT课件

生物信息学:第五讲BLAST序列比对PPT课件

7
精选ppt
8
精选ppt
9
精选ppt
10
精选ppt
11
精选ppt
12
精选ppt
13
精选ppt
14
例2:对给定的olfactory receptor基因进行blastn,目 标数据库为nt,物种为Eukaryota
精选ppt
15精Biblioteka ppt16精选ppt
17
精选ppt
18
精选ppt
19
精选ppt
20
精选ppt
21
精选ppt
22
作业:对给定的2个基因(test1,test2)分别进行 blastn, blastp, tblastn, tblastx, blastx
精选ppt
23
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
24
对给定的2个基因test1test2分别进行blastnblastptblastntblastxblastx感谢亲观看此幻灯片此课件部分内容来源于网络如有侵权请及时联系我们删除谢谢配合
第五讲:BLAST 序列比对
精选ppt
1
1. Basic Local Alignment Search Tool
2. Compare a query sequence to all the sequences in a specified database
精选ppt
2
BLAST的常用种类(详细见教材): 1、blastn 2、blastp 3、tblastn 4、blastx 5、tblastx
精选ppt
3
例1:对给定的opsin蛋白进行blastp,目标数据库为 nt,物种为Eukaryota

生物序列的同源性搜索blast简介及其应用

生物序列的同源性搜索blast简介及其应用
用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
序列同源性分析: 是将待研究序列加入到一组与之同源,但来自不同物种 的序列中进行多序列同时比较,以确定该序列与其它序 列间的同源性大小。这是理论分析方法中最关键的一步。 完成这一工作必须使用多序列比较算法。常用的程序包 有CLUSTAL等;
生物序列的同源性搜索blast简介及其应用
PPT文档演模板
2020/11/26
生物序列的同源性搜索blast简介及其 应用
•生物信息学常见的应用与软件
PPT文档演模板
序列数据的保存格式与相关数据库资源 在数据库中进行序列相似性搜索 多序列比对 进化树构建与分子进化分析 Motif的寻找与序列的模式识别 RNA二级结构,蛋白质二、三级结构的预测 基因芯片的数据分析
核酸序列6框翻译成蛋白质序列后和蛋白 质数据库中的序列逐一搜索。
蛋白质序列和核酸数据库中的核酸序列6 框翻译后的蛋白质序列逐一比对。
核酸序列6框翻译成蛋白质序列,再和核 酸数据库中的核酸序列6框翻译成的蛋 白质序列逐一进行比对。
PPT文档演模板
生物序列的同源性搜索blast简介及其 应用
Blast相关的问题
结果页面(一)
•图形示意结果
PPT文档演模板
生物序列的同源性搜索blast简介及其 应用
结果页面(二)
PPT文档演模板
•目标序列描述部分
•带有genbank的链接,点击可以进入
•匹配情况,分值,e
相应的genbank序列
生物序列的同源性搜索blast值简介及其
应用
结果页面(三)
PPT文档演模板

生物序列的相似性搜索NCBI_blast_使用教程

生物序列的相似性搜索NCBI_blast_使用教程
17
NCBI提供的Blast服务
登陆ncbi的 blast主页
核酸序列
蛋白序列
翻译序列
底下有其他一些针对 特殊数据库的和查看 以往的比对结果等
18
Blast任务提交表单(一)
序列范围 (默认全部)
1.序列信息部分
填入查询(query)的序列 选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索
单机版的Blast程序包,把基本的blast分析, 包括blastn,blastp,blastx等都整合到了 blastall一个程序里面。
42Biblioteka 单机版的Blast使用(六)
以下是一个典型的blastn分析命令: (待分析序列seq.fa,数据库nt_db)
我们选上
29
分析过程(三)
6.限制条件,我们限制 在病毒里面找。
7.其他选项保持默认值
打分矩阵
30
分析过程(四)
8.输出格式选项保持 默认值
9.点击开始搜索
31
分析过程(五)
10.查询序列的一些 相关信息 在cdd库里面找到 两个保守区域, 点击可以进入
32
分析过程(六)
图形结果
33
分析过程(七)
序列同源性分析: 是将待研究序列加入到一组与之同源,但来自不同物种 的序列中进行多序列同时比较,以确定该序列与其它序 列间的同源性大小。这是理论分析方法中最关键的一步。 完成这一工作必须使用多序列比较算法。常用的程序包 有CLUSTAL等;
7
Blast简介(一)
BLAST 是由美国国立生物技术信息 中心(NCBI) 开发的一个基于序列相似性的数据库搜 索程序。
我们通过blast搜索来获取一些这个序列 的信息。

生物信息学-blast

生物信息学-blast

筛选结果
点击开始搜索
其他一些显示格式参数
18
提交任务
返回查询号(request id)
修改完显示格式后点 击进入结果界面
可以修改显示结果格式
19
结果页面(一)
图形示意结果
20
结果页面(二)
目标序列描述部分
带有genbank的链接,点击可以进入 相应的genbank序列
匹配情况,分值,e值
21
结果页面(三)
匹配序列列表
31
分析过程(八)
具体匹配情况
32
单机版的Blast使用(一)
为什么使用单机版的Blast? 1.特殊的数据库要求。 2.涉及序列的隐私与价值。 3.批量处理 4.其他原因??
33
单机版的Blast使用(二)
单机版Blast的基本操作过程 1.下载单机版的Blast程序 ftp:///blast/executables/ 目录下,下载对应的操作系统版本。 2.解压程序包(blast.tar.gz) 命令是: $ tar zxvf blast.tar.gz
5
序列相似性比较和序列同源性分析
序列相似性比较: 就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
序列同源性分析: 是将待研究序列加入到一组与之同源,但来自不同物种 的序列中进行多序列同时比较,以确定该序列与其它序 列间的同源性大小。这是理论分析方法中最关键的一步。 完成这一工作必须使用多序列比较算法。常用的程序包 有CLUSTAL等;
6
Blast简介(一)

如何找同源基因并用DNAman比对序列

如何找同源基因并用DNAman比对序列

A
18
A
9
然后一直点击下一步
注意输入的序列是 DNA或者是蛋白质序 列,打勾相应的选项
A
10
选项不需要修 改,默认就行
A
11
选项不需要修 改,默认就行
A
12
选项不需要修 改,默认就行
A
13
序列前面一般会加上CREATED..FEATURESLCATINQUALIFIERS这一段标记
注意,由于是用了免费的版本,它 会在这里加上了一段标记,手工 去除它.
A
4
这是结果,得分越高说明同源性越高
A
5
点击第一个前面字母G,得到如图可以看到 CDS sequence和Peptide equence
A
6
把基因名和CDS序列如图复制到记事本,把 txt格式改为SEQ格式(直接更改扩展名)
A
7
接下来就是用DNAman分析了
选择输入序列
A
8
选择序列文件所 在位置
如何在phytozome中找物种同源基因 并用DNAman比对序列
Zakery 2016年5月26日
A
1
首先到phytozome网站上选择你要找的物种,比如 水稻Oryza sativa v7_JGI (Rice)
A
2
点击BLAST search
A
3
在target type中选择proteome,把氨基酸 序列复制到BLAST框中,点
点击这个按钮, 出现下拉菜单
A
16
保持EMF格式的文件即 可,然后用图片查看器打 开可以放大缩小而不改 变像素
A
17
前面软件演 示所用的序 列比对后做 出来的图
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、进入网页:/BLAST/
2、点击Search for short, nearly exact matches
3、在search栏中输入引物系列:
注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’;
5’-TGCCCATCACAACATCATCT-3’
(1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。

这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。

(2)简便的做法是同时输入上下游引物:有以下两种方法。

输入上下游引物系列都从5’——3’。

A、输入上游引物空格输入下游引物
B、输入上游引物回车输入下游引物
4、在options for advanced blasting中:
select from 栏通过菜单选择Homo sapiens
Expect后面的数字改为10
5、在format中:
select from 栏通过菜单选择Homo sapiens Expect后面的数字填上0 10
6、点击网页中最下面的“BLAST!”
7、出现新的网页,点击Format!
8、等待若干秒之后,出现results of BLAST的网页。

该网页用三种形式来显示blast的结果。

(1)图形格式:
图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分
图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补
图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配
通过点击相应的bar可以得到匹配情况的详细信息。

(2)结果信息概要:
从左到右分别为:
A、数据库系列的身份证:点击之后可以获得该序列的信息
B、系列的简单描述
C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。

按照得分的高低由大到小排列。

得分的计算公式=匹配的碱基×2+0.1。

举例:如果有20个碱基匹配,则其得分为40.1。

D、E值:代表被比对的两个序列不相关的可能性。

E值最低的最有意义,也就是说序列的相似性最大。

设定的E值是我们限定的上限,E值太高的就不显示了
E、最后一栏有的有UEG的字样,其中:
U代表:Unigene数据库
E代表:GEO profiles数据库
G代表:Gene数据库
(3)结果详细信息:
①圈出来的部分代表序列的信息
②第一个大括号代表上游引物与该序列的正链的匹配情况:
共有21个碱基匹配,得分42.1分,E值为0.020
上游引物与序列的2143~2163位点匹配
③第二个大括号代表下游引物与该序列的负链的匹配情况:
共有20个碱基匹配,得分40.1分,E值为0.077。

下游引物与该序列的29360~29379位点互补
注意点:
①上游引物为20个碱基,为什么会变成21个碱基呢?这是因为下游引物的第一个碱基为T,刚好与系列的2163位点的T匹配,因此下游引物的开头的第一个碱基被当成了上游引物了。

同理,上游引物的最后一个碱基为G,被当成了下游引物了。

通过寻找有没有与1~20位点、20~40位点完全匹配的序列,就可以避免这个因素的干扰了。

②为什么与上下游引物匹配的ABCG2序列有多种?
A、为同一个基因来源的不同的mRNA片段
B、为该基因的DNA系列
C、为同一个基因来源的不同的cDNA片段。

结果判断:
①验证文献报道的引物是否正确:如果你可以在所显示的结果中找出你的目的基因,一般说明你的引物正确性没问题。

如果你blast后没有发现你的目的基因,或者分值很低,该引物就可能不适合用
②检测该对引物是否可与其它序列匹配,引起PCR的非特异性扩增。

如果找到了你的目的基因名称,而且找到了一大批同物种的不同基因,(上下游引物分别搜索到相同的基因),而且分数也较高。

这时表明你的引物设计的特异性不高,极有可能在你的扩增产物中出现非特异性产物。

相关文档
最新文档