图解blast验证引物教程1

图解blast验证引物教程1
图解blast验证引物教程1

图解blast 验证引物教程

——以文献报道的人类的ABCG2的引物为例

1、 进入网页:https://www.360docs.net/doc/1918185489.html,/BLAST/

2、 点击Basic BLAST 中的nucleotide blast 选项

3、 完成2操作后就进入了Basic Local Alignment Search Tool 界面 (1)在Enter Query Sequence 栏中输入引物序列:

注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’;

5’-TGCCCATCACAACATCATCT-3’

简便的做法是同时输入上下游引物。输入上下游引物系列都从5’— 3’。 输入上游引物后,加上≥20个字母n ,再输入下游引物,如下图:

生 物 秀

(2)在Choose Search Set 栏中:

Database 根据预操作基因的种属定了,本引物可选Human genomic + transcript

或Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图:

(3)在Program Selection 中:选择Somewhat similar sequences (blastn)项,如下图:

(4)在此界面最下面:如下图

生物秀-专心做生物

w w w .b b i o o .c o m

Show results in a new window 项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters 参数设置,进入参数设置界面。

4. 参数设置:

(1)在General Parameters 中:Expect thresshold 期望阈值须改为1000,大于1000也可以;在Word size 的下拉框将数字改为7。如下图:

(2)Scoring Parameters 无须修改

(3)Filters and Masking 中,一般来说也没有必要改

5.点击最下面一栏的BLAST 按钮,如图:

6.点击BLAST 按钮后,跳转出现如下界面:

7. 等待若干秒之后,自动跳转出现显示BLAST 结果的网页。该网页用三种形式来显示blast 的结果。

生物秀-专心做生物

w w w .b b i o o .c o m

(1)图形格式:

图中①代表这些序列与引物匹配的得分值小于40分

图中②代表这些序列与引物匹配的得分值位于40~50分

图中③代表这些序列与引物匹配的得分值位于80~120分,

分值越高,特异性越好。线段代表上或下游引物,其颜色和上面对照后就可得出该条引物的分值。

图中两线段间有连线的代表这些序列与上游引物匹配(Strand=Plus/Plus)、并与下游引物互补(Strand=Plus/Minus),理论上可以扩增出基因片断。没有连线的,表示单条引物与该基因一致。

点击线段,就能跳转到该基因的结果信息概要。

(2)结果信息概要:

Accession 、数据库系列的身份证:点击之后可以获得该序列的信息 Desscription 、系列的简单描述

Total score 高的就是有两线段间有连线的,如图划线的。 E value :代表被比对的两个序列不相关的可能性。【The E value decreases exponentially as the Score (S) that is assigned to a match between two sequences increases 】。E 值最低的最有意义,也就是说序列的相似性最大。设定的E 值是我们限定的上限,E 值太高的就不显示了

E 、最后一栏有的有UEG 的字样,其中: U 代表:Unigene 数据库

E 代表:GEO profiles 数据库 G 代表:Gene 数据库

(3)结果详细信息:

生物秀-专心做生物

w w w .b b i o o .c o m

划线上代表上游引物与该序列的正链【Plus/Plus 】的匹配情况: 划线下代表下游引物与该序列的负链【Plus/Minus 】的匹配情况: 共有20个碱基匹配,得分40.1分【20×2+0.1=40.1】,E 值为0.077。

为什么与上下游引物匹配的ABCG2序列有多种? A 、 为同一个基因来源的不同的mRNA 片段 B 、 为该基因的DNA 系列 C 、 为同一个基因来源的不同的cDNA 克隆片段。

结果判断:

①验证文献报道的引物是否正确:如果你可以在所显示的结果中找出你的目的基因,一般说明你的引物正确性没问题。如果你blast 后没有发现你的目的基因,或者分值很低,该引物就可能不适合用

②检测该对引物是否可与其它序列匹配,引起PCR 的非特异性扩增。如果找到了你的目的基因名称,而且找到了一大批同物种的不同基因,(上下游引物分别搜索到相同的基因),而且分数也较高。这时表明你的引物设计的特异性不高,极有可能在你的扩增产物中出现非特异性产物。

生物秀-专心做生物

w w w .b b i o o .c o m

生物秀-专心做生物https://www.360docs.net/doc/1918185489.html,

生物秀论坛—学术交流、资源共享与互助社区

http:// https://www.360docs.net/doc/1918185489.html,

生物部落—生物医药人网络家园

http:// https://www.360docs.net/doc/1918185489.html,

生物百科—生命科学第一百科

http:// https://www.360docs.net/doc/1918185489.html,

生物秀知道—生命科学问题解决之道!

http:// https://www.360docs.net/doc/1918185489.html,

易生物-领先的生物医药商务平台

https://www.360docs.net/doc/1918185489.html,

图解blast验证引物教程

图解blast验证引物教程 1、进入网页:https://www.360docs.net/doc/1918185489.html,/BLAST/ 2、点击Search for short, nearly exact matches 3、在search栏中输入引物系列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ (1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。 (2)简便的做法是同时输入上下游引物:有以下两种方法。输入上下游引物系列都从5’——3’。 A、输入上游引物空格输入下游引物

B、输入上游引物回车输入下游引物 4、在options for advanced blasting中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字改为10 5、在format中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字填上0 10

6、点击网页中最下面的“BLAST!” 7、出现新的网页,点击Format! 果。

(1)图形格式: 图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分 图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补 图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配 通过点击相应的bar可以得到匹配情况的详细信息。 (2)结果信息概要: 从左到右分别为: A、数据库系列的身份证:点击之后可以获得该序列的信息 B、系列的简单描述 C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。按照得分的高低由大到小排列。得分的计算公式=匹配的碱基×2+0.1。举例:如果有20个碱基匹配,则其得分为40.1。 D、E值:代表被比对的两个序列不相关的可能性。【The E value decreases exponentially as the Score (S) that is assigned to a match between two sequences increases】。E值最低的最有意义,也就是说序列的相似性最大。设定的E值是我们限定的上限,E值太高的就不显示了 E、最后一栏有的有UEG的字样,其中: U代表:Unigene数据库 E代表:GEO profiles数据库 G代表:Gene数据库

Blast本地化详细流程

Blast 2.4.0+本地化详细流程(基于Windows系统) 1.程序获得。从NCBI上下载Blast本地化程序,下载地址: ftp://https://www.360docs.net/doc/1918185489.html,/blast/executables/blast+/LATEST/ 64×安装版▲ 64×解压(绿色)版▲ 最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。 2.原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta 或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的ftp 库下载所需要库,链ftp://https://www.360docs.net/doc/1918185489.html,/blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 3.用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下 面内容:[NCBI]Data="C:\blast\data\" 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows 4.将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来 方便),方法: a)右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量 b)系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化 程序所在路径,E:\blast 点击确定,将安装路径添加到path。 5.运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输 入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。

NCBI中Blast序列比对小总结

NCBI中Blast可以用来进行序列比对、检验引物特异性Blast导航主页面主体包括三部分 BLAST Assembled Genomes选择你要对比的物种,点击物种之后即可进入对比页面Basic BLAST包含5个常用的Blast,每一个都附有简单介绍 Specialized BLAST是一些特殊目的的Blast,如Primer-BLAST、IgBLAST 根据需要做出选择 本学期学习了最基本的核苷酸序列的比对 点击Basic BLAST部分的nucleotide链接到一个新的页面,打开后的页面特征: 大体上包括三个部分 Enter Query Sequence部分可以让我们输入序列,其中的Job Title部分可以为本次工作命一个名字 Choose Search Set部分可以选择要与目的序列比对的物种或序列种类。 其中的Entrez Query可以对比对结果进行适当的限制。 Program Selection部分可以选择本次对比的精确度,种内种间等等。 其次Blast按钮下面有一个“Algorithm parameters”算法参数,可设置参数。 点击Blast后,出现的页面大体上包括四个部分 一.所询问和比对序列的简单信息 1.询问序列的简单信息——名称、描述、分子类型、序列长度 2.所比对数据库的名称、描述和所用程序 二.Graphic Summary——blast结果图形显示 相似度颜色图(黑、蓝、绿、粉红、红,相似度由低到高)三.Descriptions——blast结果描述区 1.到其他数据库的链接 2.描述以表格的形式呈现(以匹配分值从大到小排序) (1)Accession下程序比对的序列名称,点击相应的可以进入更为详细的map viewer (2)Descriptions下是对所比对序列的简单描述 接下来是5个结果数值: (3)Max score匹配分值,点击可进入第四部分相应序列的blast的详细比对结果 (4)Total score总体分值 (5)Query coverage覆盖率 (6)E value——E(Expect)值,表示随机匹配的可能性。 E值越大,随机匹配的可能性也越大。 E值接近零或为零时,具本上就是完全匹配了。 (7)Max ident——匹配一致性,即匹配上的碱基数占总序列长的百分数。 (8)Links——到其他数据库的链接。 四.各序列blast的详细比对结果 数据库中不同序列比对的详细结果,每一个结果大体上包括3部分 1.所比对序列的名称、简单描述、长度。到其他数据库的链接。

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

本地blast的详细用法∷柳城

本地blast的详细用法 Posted on 03 四月 2009 by 柳城,阅读 9,626 本地blast的详细使用方法 blast all -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10 解释如下: blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的) -p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸 blastp 是蛋白质对蛋白质序列等等,一共5个自程序。 -i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式) -d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb) -o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径) *注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值! -a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU -F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能) -T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T -e: 是Expectation value,期望值,默认是10,我用的10-10! BLASTALL 用法 a.格式化序列数据库 格式化序列数据库— —formatdb formatdb简单介绍: formatdb处理的都是格式为 ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb命令行参数: formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍, 主要参数的说明:

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST 序列比对等

一步一步教你使用NCBI 查找DNA、 mRNA、cDNA、Protein、promoter、引 物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在NCBI 上都可以方便的找到答案。现在我就结合我自 己使用NCBI的一些经历(经验)跟大家交流一下BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS 查找已经公布的引物序列 Part four 如何运用BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.360docs.net/doc/1918185489.html,/mapview/index.html 在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

blast验证引物教程1

图解blast验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、进入网页:https://www.360docs.net/doc/1918185489.html,/BLAST/ 2、点击Basic BLAST中的nucleotide blast选项 3、完成2操作后就进入了Basic Local Alignment Search Tool界面 (1)在Enter Query Sequence栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’—3’。输入上游引物后,加上≥20个字母n,再输入下游引物,如下图:

(2)在Choose Search Set栏中: Database根据预操作基因的种属定了,本引物可选Human genomic + transcript或 Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 Show results in a new window项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters中:Expect thresshold期望阈值须改为1000,大于1000也可以; 在Word size的下拉框将数字改为7。如下图:

如何运用BLAST进行序列比对、检验引物特异性

序列比对,绝大多数战友都会想到BLAST,但BLAST的使用确实又是一个很大的难题,因为他的功能比较强悍,里面涉及到的知识比较多,而且比对结束后输出的结果参数(指标)又很多。如果把BLAST的使用详细的都讲出来,我想我发帖发到明天也发不完,更何况我自己也不是完全懂得BLAST的使用。所以我在这里也就“画龙点睛”——以比对核酸序列为例来给大家介绍一下BLAST的使用,也算是BLAST 的入门课程吧。请看帖的战友好好体会,如果你用心看,在看帖完毕之后BLAST 的基本使用(包括其他序列的比对)应该没有问题了。一、打开BLAST页面, 打开后如图所示: (缩略图,点击图片链接看原图)对上面这个页面进行一下必要的介绍: BLAST的这个页面主体部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。相信大家可以看懂这三个短语的意思,我就不多说了;我要说的是,可以认为这是三种序列比对的方法,或者说是BLAST的三条途径。 第一部分BLAST Assembled Genomes就是让你选择你要比对的物种,点击相应物种之后即可进入比对页面。 第二部分Basic BLAST包含了5个常用的BLAST,每一个都附有简短的介绍。 第三部分Specialized BLAST是一些特殊目的的BLAST,如IgBLAST、SNP等等,这个时候你就需要在Specialized BLAST部分做出适当的选择了。 总之,这是一个导航页面,它的目的是让你根据自己的比对目的选择相应的BLAST 途径。下面以最基本的核酸序列比对来谈一下BLAST的使用,期间我也会含沙射影的说一下其他序列比对的方法。 二、点击Basic BLAST部分的nucleotide blast链接到一个新的页面。打开后如图所示: =" width=640 height=462 title="Click to iew full 2.JPG (849 X 613)" border=0 align=absmiddle> 介绍一下上述页面: Enter Query Sequence部分是让我们输入序列的,你可以直接把序列粘贴进去,也可以上传序列,还可以选择你要比对的序列的范围(留空就代表要比对你要输入的整个序列)。Job Title部分还可以为本次工作命一个名字。 Choose Search Set部分是让我们选择要与目的序列比对的物种或序列种类(genome DNA、mRNA等等)。如果是人或老鼠的话,就可以直接选择了如果是其他物种就要选择“others”了,这时候网页会主动跳出一个下拉对话框和一个输入

图解blast验证引物教程1

图解blast 验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、 进入网页:https://www.360docs.net/doc/1918185489.html,/BLAST/ 2、 点击Basic BLAST 中的nucleotide blast 选项 3、 完成2操作后就进入了Basic Local Alignment Search Tool 界面 (1)在Enter Query Sequence 栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’— 3’。 输入上游引物后,加上≥20个字母n ,再输入下游引物,如下图: 生 物 秀

(2)在Choose Search Set 栏中: Database 根据预操作基因的种属定了,本引物可选Human genomic + transcript 或Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection 中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 生物秀-专心做生物 w w w .b b i o o .c o m

Show results in a new window 项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters 参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters 中:Expect thresshold 期望阈值须改为1000,大于1000也可以;在Word size 的下拉框将数字改为7。如下图: (2)Scoring Parameters 无须修改 (3)Filters and Masking 中,一般来说也没有必要改 5.点击最下面一栏的BLAST 按钮,如图: 6.点击BLAST 按钮后,跳转出现如下界面: 7. 等待若干秒之后,自动跳转出现显示BLAST 结果的网页。该网页用三种形式来显示blast 的结果。 生物秀-专心做生物 w w w .b b i o o .c o m

本地Blast

本地Blast使用说明 一、软件的下载安装 1.1安装流程 建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。 1.2 设置环境变量 右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。 二、查看程序版本信息 点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。 三、使用 3.1本地数据库的构建 下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化

数据库,命令为: makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name 格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。 3.2核酸序列相似性搜索 blastn -db database_name -query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 备注:qacc:查询序列Acession号;sacc:目标序列Acession号; qstart qend:分别表示查询序列比对上的起始、终止位置; sstart send:分别表示目标序列比对上的起始、终止位置; length:长度; bitscore:得分; evalue:E-Value值; pident:一致性; ppos:相似性 3.3 查看并获取目标序列: blastdbcmd -db refseq_rna -entry 224071016 -out test.fa 可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文 件 3.4蛋白质序列相似性搜索 Blastp -db database_name-query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 3.5 查看并获取目标序列:重复3.3

一步一步教你使用NCBI查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等

一步一步教你使用 NCBI 查找DNA、mRNA、 cDNA、Protein、promoter、引物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感,各位战友! 请大家对以下我发表的容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.360docs.net/doc/1918185489.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

核酸BLAST

核酸BLAST: ?blastn程式——核酸序列比对。 ?MegaBLAST——可搜寻一批EST序列、长序列cDNA或基因体序列。 BLAST——Basic Local Alignment Search Tool——核酸与蛋白质序列比对工具。BLAST网页提供BLAST(Basic Local Alignment Search Tool)程式、概述、使用说明与常见问题解答(网址:https://www.360docs.net/doc/1918185489.html,/BLAST/)。 BLAST Program Selection Guide: https://www.360docs.net/doc/1918185489.html,/blast/producttable.shtml#tab31

在做BLASTn的时候,系统会给出三个程序选项,分别是Highly similar sequences (megablast), More dissimilar sequences (discontiguous megablast),Somewhat similar sequences (blastn) 。 第一个选项megablast是对高度相似DNA序列间的比较。鉴别一段未知DNA序列的最好办法就是看看在公共数据库中这段序列是否存在。Megablast就是对那些具有高度相似(相似性95% 以上)的长序列片断所特别设计的一种序列比较工具。Megablast除了提供序列联配的显著性期望值域之外,还提供了一种百分值域。在进行序列比较时,用户可以同时调整这两个参数以优化搜索结果。 第二个选项discontiguous megablast,当序列之间的差异比megablast大时,一般选用这个程序。其算法的基本原理是将查询序列分为一个一个的小片断,我们把它叫做字,通过字与数据库序列相比较,如果能够精确匹配,则以这个字为种子向两边延伸,从而获得符合我们要求的相似性序列。discontiguous megablast所应用的字是不连续的,这使得他的搜索精确性在三种搜索程序中是最高的。其模板类型选项分为三种编码(0),非编码(1),两者都有(2)。在编码模式中,根据第三位碱基的摆动原理,只要第一个和第二个碱基能够精确匹配,那么第三个碱基可以忽略,不做比较。在字的长度相同的情况下,discontiguous megablast的精确度要高于blastn。 第三个选项Somewhat similar sequences (blastn),这个程序比较的序列其相似程度可以非常低。它采用的算法与discontiguous megablast相同,只不过它的字是连续的。Blastn的字要比megablast短,所以其精确度要高于megablast,但是运算速度要慢一些。 注:字是影响blast灵敏度的一个主要参数,其取值要根据具体情况具体而定。 NCBI BLASTn: https://www.360docs.net/doc/1918185489.html,/public_documents/vibe/details/NcbiBlastn.html

NCBI中Blast种类及使用简介

NCBI中Blast种类及使用简介 NCBI中Blast种类简介 1. Blast Assembled Genomes 在一个选择的物种基因组序列中去搜索。 2.Basic Blast 2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序 2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。 2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较 2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。 2.2 Protein Blast 2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。 2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。 2.3 Translating BLAST 2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。 2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成

primer BLAST在线设计引物扩增未知菌种

进修生日志:primer BLAST在线设计引物扩增未知菌种 兰会华1整理屈平华2审校 1广西壮族自治区人民医院检验科, 2广东省中医院检验科 PCR的第一步就是引物设计。引物设计的好坏,直接影响PCR的结果。引物设计的软件很多,但是,多数时候是引物设计出来了,PCR也能扩增到目的条带,但非特异性的条带好几条,甚至比目的条带还要亮的,郁闷的有木有?再有,分离到一个新菌种,要扩增管家基因或蛋白基因,可引用参考文献的引物,却怎么也扩增不出来,泪奔的有木有?小编在这里给大家介绍利用细菌的全基因组序列,以primer BLAST在线设计引物和PCR扩增新菌种的方法,让您找到高大上的感觉。 一、实验目的:设计属特异性引物PCR扩增一未知菌弗朗西斯菌的sdhA基因 二、引物设计过程 (一)获得目的基因序列 1、进入NCBI,点击gemone,搜索待扩增菌的属名Francisella

2、点击search,结果得了相关菌种的全基因组序列。 2、点击其中的一个全基因组,如“广州弗朗西斯菌”

4. 全基因组1658482 bp,这么大。人海茫茫,该如何找到sdhA? 这时,可使用网页搜索功能,按热键Ctrl+F,再输入要查找基因名称“sdhA”,如上图。然后,就找到sdhA基因了。 请看,sdhA基因的位置在全基因组的第174351..176144之间哦(见下图)。 5. 再点击左侧的gene(上图),就得到了广州弗朗西斯菌1741bp的sdhA基因全序列,text文本保存。

(二)序列拼接,获得合并序列 如果要扩增的是一个已知的菌种,如广州弗朗西斯菌,那么,只要得到上面的引物,你就可以直接去设计引物了。但如果要扩增的是一个未知菌种呢?1个序列可不够;总之,你的序列得尽可能多,而且是完全不同的序列尽可能多;最好是弗朗西斯菌属内所有的已知的sdhA基因,甚至是与弗朗西斯菌亲缘关系相对较近的军团菌的sdhA基因当然,军团菌没有sdhA基因,这是后话。 小编最终只找了弗朗西斯菌属内8个sdhA基因。DNAMAN软件进行了序列拼接,Sequence,Sequence Assembly,加载序列文件。当然,为了防止序列差异过大,应该适当修改参数,如Identity 90%,应该修改为80%,甚至70%。 拼接后的序列,有除A、G、C、T外,还有Y、R、W等兼并碱基什么的。对了,要的就是这个结果。

Blast本地化安装图解

Blast本地化:window平台下blast软件的安装boyun发表于 2009-07-09 17:08 | 阅读 1 views 1.对于windows 2000/xp 用户,下载blast- 2.2.18-ia32-win32.exe安装文件 ftp://https://www.360docs.net/doc/1918185489.html,/blast/executables/LATEST/blast- 2.2.18-ia32-win32.exe 2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,双击这个文件,自解压产生bin、data、doc 三个目录,bin是程序目录,data是程序使用数据的目录,doc是文档目录。 表:bin目录中的程序 程序说明 bl2seq.exe进行两条序列比对 blastall.exe做普通的blast比对 blastclust.exe blastpgp.exe copymat.exe fastacmd.exe通过gi号,接收号等,在数据库中检索序 列 formatdb.exe格式化数据库 formatrpsdb.exe impala.exe makemat.exe megablast.exe megablast程序 rpsblast.exe seedtop.exe 3.用文本编辑器创建一个ncbi.ini文件,文件包含下面内容:[NCBI] Data="C:\blast\data\" 将ncbi.ini文件存放到系统的Windows 或者 WINNT目录。 4.将”C:\blast\bin”目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法:

NCBI Primer-BLAST使用方法

Primer-BLAST是NCBI的引物设计和特异性检验工具。 Primer-Blast介绍 Primer-BLAST,在线设计用于聚合酶链反应(PCR)的特异性寡核苷酸引物。Primer-BLAST可以直接从Blast主页(https://www.360docs.net/doc/1918185489.html,/)找到,或是直接用下面的链接进入: https://www.360docs.net/doc/1918185489.html,/tools/primer-blast/ 这个工具整合了目前流行的Primer3软件,再加上NCBI的 Blast进行引物特异性的验证。Primer-BLAST免除了用另一个站点或工具设计引物的步骤,设计好的引物程序直接用Blast进行引物特异性验证。并且,Primer-BLAST能设计出只扩增某一特定剪接变异体基因的引物–an important feature for PCR protocols measuring tissue specific expression(注:没办法准确的翻译,只好作罢,汗!)。Primer-BLAST有许多改进的功能,这样在选择引物方面比单个的用 Primer3和NCBI BLAST更加准确。 Primer-BLAST的输入 Primer-BLAST界面包括了Primer3和BLAST的功能。提交的界面主要包括三个部分:target template(模板区), the primers(引物区), 和specificity check(特异性验证区)。跟其它的BLAST一样,点击底部的“Advanced parameters”有更多的参数设置。 在“PCR Template”下面的文本框,输入目标模板的序列,FASTA格式或直接用Accession Number。如果你在这里输入了序列,是用于引物的设计。Primer-BLAST 就会根据你输入的序列设计特异性引物,并且在目标数据库(在specificity check区选择)是唯一的。

一步一步教你使用 NCBI 查找DNAmRNAcDNAProteinpromoter引物设计BLAST 序列比对等

一步一步教你使用NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST 序列 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自 己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.360docs.net/doc/1918185489.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用 方法与结果详解 This model paper was revised by the Standardization Office on December 10, 2020

N C B I在线B L A S T使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序

相关文档
最新文档