06_蛋白质序列比对与分子进化分析_2014-1

合集下载

蛋白质序列分析

蛋白质序列分析

(四)、蛋白质功能预测
2、通过数据库搜索蛋白质家族、保守结构域和 功能位点来预测蛋白质功能。
相关的数据库很多,以下主要介绍两个相 对独立的数据库(PROSITE、SMART)和两 个综合性数据库(InterPro Scan、CDD)。均 可从ExPASy找到。
相关概念
模体或指纹(motif,fingerprint) 属于蛋白质的超二级结构范畴,由两个或
Post-translational Modification prediction
(翻译后修饰预测)
SignalP 信号肽分析
SignalP 3.0 Server (信号肽分析)
S score(绿色) C score(红色) 分析发现第1~23位 为信号肽
4、信号肽与蛋白质定位
以下我们仍然利用ExPASy 来寻找相关工具 SignalP (信号肽分析) TargetP (蛋白质亚细胞定位) PSORT(蛋白质亚细胞定位)
Protsite 数据库
Protsite 数据库是基于对蛋白质家族中同源序 列多序列比对得到的保守性区域,这些区域通 常与生物学功能有关,例如酶的活性位点、配 体或金属结合位点等。
(三)、蛋白质基本性质分析
蛋白质序列的基本性质分析是蛋白质序列分析 的基本方面,一般包括: 蛋白质的氨基酸组成 分子量 等电点(pI) 疏水性分析 跨膜区分析 信号肽分析
4、信号肽与蛋白质定位
信号肽(Signal peptide) 是分泌性蛋白质在分泌出膜外时其肽链的
蛋白质序列分析
蛋白质序列分析
教材 Page 84~96 蛋白质序列分析 教材 Page 138~152 生物大分子结构数据的浏
览(RasMol 软件) 教材 Page 175~184 蛋白质结构的同源模建

蛋白质序列分析精品课件

蛋白质序列分析精品课件

二、蛋白质二级结构预测
1、基于单一序列的分析——成功率不高 2、基于多重序列对齐的分析 PHD程序提供了从二级结构到折叠方面分析 的多种资源。
http://www.emblheidelberg.de/predictprotein/predictprotein、穿针引线(threading) 原理 所有可能的蛋白质形状中哪个适应于我的序 列? →成千上万种可能 我已经观察到了己知结构蛋白质结构中的折 叠方式,我的序列是否也能够折叠为此种方 式? →1000种
二、基于motif、结构位点、结构 功能域数据库的蛋白质功能预测
1、 PROSITE 2、HITS 3、InterProscan 4、SMART
1、 PROSITE 数据库
由专家根据生物学知识审编的SWISSPROT蛋白质序列中有生物学意义的位 点(sites)、模式(patterns)和轮廓 (profile)建立的数据库
一、蛋白质分类数据库(ProtoMap)
是对SWISS-PROT数据库中的全部蛋白质 由计算机自动进行层次分类,把相关者聚 集分组所得到的数据库。 http://www.protomap.cs.huji.ac.il/
9、 人的价值,在招收诱惑的一瞬间被决定 。20.9.1920.9.19Satur day, September 19, 2020 10、低头要有勇气,抬头要有低气。13:24:1713:24: 1713:249/19/ 2020 1:24:17 PM 11、人总是珍惜为得到。20.9.1913:24:1713: 24Sep-2019-Sep-20 12、人乱于心,不宽余请。13:24:1713:24:1713:24Saturday, September 19, 2020 13、生气是拿别人做错的事来惩罚自 己。20.9.1920.9.1913: 24:1713:24:17September 19, 2020 14、抱最大的希望,作最大的努力。2020年9月19日 星期六 下午1时24分17秒13: 24:1720.9.19 15、一个人炫耀什么,说明他内心缺 少什么 。。2020年9月 下午1时24分20.9.1913:24September 19, 2020 16、业余生活要有意义,不要越轨。2020年9月19日 星期六 1时24分17秒13:24:1719 September 2020 17、一个人即使已登上顶峰,也仍要 自强不 息。下 午1时24分17秒 下午1时24分13:24:1720.9.19

蛋白质序列分析方法比较和性能评估

蛋白质序列分析方法比较和性能评估

蛋白质序列分析方法比较和性能评估蛋白质是生物体内功能最为复杂且多样的分子之一,对于深入了解蛋白质的结构、功能和相互作用等方面至关重要。

蛋白质序列分析方法在质谱学、生物信息学等领域得到广泛应用,以帮助科研人员研究和解决与蛋白质相关的各种问题。

本文将对常用的蛋白质序列分析方法进行比较和性能评估,以期提供科研人员选择合适的方法和工具的参考。

一、蛋白质序列分析方法概述1.1 蛋白质序列比对蛋白质序列比对是指将目标蛋白质序列与数据库中已知的蛋白质序列进行比较,以发现序列间的相似性和结构域等信息。

常见的蛋白质序列比对方法包括基于局部序列相似性的BLAST(Basic Local Alignment Search Tool)和基于全局序列相似性的Smith-Waterman算法。

1.2 蛋白质二级结构预测蛋白质二级结构预测是指根据蛋白质的氨基酸序列预测其二级结构(α-螺旋、β-折叠、无规卷曲等)。

常用的预测方法包括基于机器学习的PSIPRED和基于深度学习的CNFold。

1.3 蛋白质三维结构建模蛋白质三维结构建模是指通过蛋白质的氨基酸序列预测其三维结构,包括全原子模拟方法、基于比较模型和基于序列模型等。

常见的工具有I-TASSER、SWISS-MODEL和ROSETTA等。

1.4 蛋白质功能注释蛋白质功能注释是指对已知蛋白质序列进行功能预测和注释,以了解蛋白质在细胞内的作用和功能。

常见的工具包括InterPro、SMART和Pfam等。

二、蛋白质序列分析方法比较和性能评估2.1 准确性准确性是评估蛋白质序列分析方法优劣的重要指标。

对于蛋白质序列比对方法,准确性表示在给定的阈值下,对于已知结构和功能的蛋白质序列,能够找到多少相似性高的序列。

对于蛋白质二级和三维结构预测方法,准确性表示预测结果与实际结构的一致性程度。

对于蛋白质功能注释方法,准确性表示对已知功能的蛋白质能够正确预测其功能。

2.2 效率效率是评估蛋白质序列分析方法性能的另一个关键指标。

生物信息学中的序列比对与序列分析研究

生物信息学中的序列比对与序列分析研究

生物信息学中的序列比对与序列分析研究序列比对与序列分析是生物信息学领域中非常重要的研究内容之一。

在基因组学和蛋白质组学的快速发展下,对生物序列的比对和分析需求不断增长。

本文将介绍序列比对和序列分析的概念、方法和应用,并探讨其在生物学研究中的重要性。

一、序列比对的概念与方法:1. 序列比对的概念:序列比对是将两个或多个生物序列进行对比,确定它们之间的相似性和差异性的过程。

在生物信息学中,序列通常是DNA、RNA或蛋白质的一连串碱基或氨基酸。

序列比对可以用来寻找相似性,例如发现新的基因家族、识别保守的结构域或区分不同的物种。

2. 序列比对的方法:序列比对的方法可以分为两大类:全局比对和局部比对。

全局比对将整个序列进行比对,用于高度相似的序列。

而局部比对则将两个序列的某个片段进行比对,用于相对较低的相似性。

最常用的序列比对算法是Smith-Waterman算法和Needleman-Wunsch算法。

Smith-Waterman算法是一种动态规划算法,它在考虑不同区域的匹配得分时,考虑到了负分数,适用于寻找局部相似性。

而Needleman-Wunsch算法是一种全局比对算法,通过动态规划计算最佳匹配得分和最佳比对方式。

二、序列比对在生物学研究中的应用:1. 基因组比对:序列比对在基因组学中具有广泛的应用。

它可以帮助研究人员对特定基因进行鉴定,发现重要的调控元件以及揭示物种间的基因结构和功能差异。

此外,基因组比对还可以用于揭示突变引起的遗传疾病和肿瘤等疾病的发病机制。

2. 蛋白质结构预测:序列比对在蛋白质结构预测中也起着重要的作用。

通过将待预测蛋白质序列与已知结构的蛋白质序列进行比对,可以预测其二级和三级结构以及可能的功能区域。

这些预测结果对于理解蛋白质的功能和相互作用至关重要。

3. 分子进化分析:序列比对在分子进化研究中也扮演着重要的角色。

通过将源自不同物种的基因或蛋白质序列进行比对,可以构建进化树,研究物种的亲缘关系和演化历史。

蛋白质序列比对

蛋白质序列比对

蛋白质序列比对蛋白质序列比对是生物信息学领域中的一项重要技术,是分析和理解蛋白质功能及演化关系的关键手段。

在蛋白质序列比对中,通过将不同蛋白质序列进行比对,发现它们之间的相似性和差异性,进而推断它们之间可能存在的共同祖先以及演化历程。

本文将对蛋白质序列比对的原理、方法及应用进行详细介绍。

一、蛋白质序列比对的原理蛋白质序列比对的原理是将两个或多个蛋白质序列进行比较,并找出它们之间的相同或相似的部分。

蛋白质序列比对的基本思想是根据它们的氨基酸序列相似性来推断它们之间的同源性和演化关系。

在蛋白质序列比对中,一般通过计算不同蛋白质序列之间的匹配得分来评估它们之间的相似性。

匹配得分是指在相同的位置上出现相同的氨基酸所得到的分数,而不同位置上出现不同氨基酸的得分则为不匹配得分。

匹配得分越高,说明相同位置上的氨基酸越多,相似性越高。

不匹配得分越低,说明不同位置上的氨基酸越少,相似性越高。

在蛋白质序列比对中常常用到的方法包括全局比对和局部比对。

全局比对是将整个蛋白质序列进行比对,适用于相似性较高的序列比对。

局部比对则是将蛋白质序列中较短的区域进行比对,适用于相似性较低的序列比对。

在进行蛋白质序列比对时,同时需要考虑序列长度、序列特征、突变率等因素。

二、蛋白质序列比对的方法1、精确比对方法精确比对方法是指根据序列相同的部分进行比对并得出匹配得分。

其中最常用的方法包括Needleman-Wunsch算法和Smith-Waterman算法。

Needleman-Wunsch算法是一种全局比对算法,其基本思想是基于动态规划方法将两个蛋白质序列进行比对,通过计算匹配得分推断它们的相似性。

该算法的核心是构建一个m×n的得分矩阵,并在矩阵中进行搜索,以求得最优匹配路径。

Smith-Waterman算法是一种局部比对算法,与Needleman-Wunsch算法相似,但它将注意力集中在两个序列中的相似性最高处,从而得到更精细的匹配结果。

蛋白质序列分析精品课件.ppt

蛋白质序列分析精品课件.ppt
(/) ▪ FSSP 基于蛋白质结构-结构比对的折叠分类
(Fold classification based on Structure-Structure alignment of Proteins)
(http://ekhidna.biocenter.helsinki.fi/dali)
(profile),能更敏感地发现序列中的信息。
/prosite/
Pfam(蛋白质家族序列比对蛋白质结构数据库PDB
(/pdb/home/home.do) PDB包括蛋白质、核酸、蛋白质-核酸复合体以及病毒等生物 大分子结构数据,主要是蛋白质结构数据
➢ 能依据这些特征、属性快速可靠地鉴定出一个未知功能蛋 白质序列属于哪个蛋白质家族,
➢ 即使在蛋白质序列相似性很低的情况下,可以通过搜索隐 含的功能结构模体(motif)来鉴定
➢ 因此,是一个有效的序列分析数据库。
PROSITE中涉及的序列模式
➢ 酶的催化位点 ➢ 配体结合位点 ➢ 金属离子结合位点 ➢ 二硫键、小分子或者蛋白质结合区域等 ➢ PROSITE还包括由多序列比对构建的序列特征谱
第一行为该区域出现的氨基酸,每一行为蛋白序列 中一个位置,在该位置对各种氨基酸的保守情况都给出 一个分值,分值越高表示出现概率越大
PROSITE 使用注意事项
▪ Pattern主要可以用来预测某些生物活性位 点,如磷酸化位点、甲基化位点。profile 预测可靠性高,可以用来对新蛋白进行分 类和提供功能提示。
第六章 蛋白质序列分析
主讲人:胡银岗 西北农林科技大学农学院遗传组
第一节 蛋白质数据库
1.数据库的分类
▪ 蛋白质的功能主要是由它的结构所决定的,蛋白质的结构主要分为四级, 依据这种结构层次,将蛋白质数据库分为:

生物进化知识:蛋白质进化——解析生物分子的进化历程

生物进化知识:蛋白质进化——解析生物分子的进化历程

生物进化知识:蛋白质进化——解析生物分子的进化历程生物进化是生物学中一个非常重要的研究领域,其中包括了许多关于物种形态发展、繁衍及功能变化的研究。

而蛋白质进化是生物学中的一部分,它帮助我们更好地了解生物分子的进化历程。

在本文中,我们将会介绍蛋白质进化的相关内容,以帮助大家进一步了解生物学中的科学研究。

首先,让我们来看看什么是蛋白质。

蛋白质是构成生命体的基础分子之一,它主要由氨基酸组成。

氨基酸通过不同的链接方式形成多种不同的蛋白质。

每种蛋白质具有独特的空间结构和功能,如酶、激素、抗体等。

进化是自然界中不可避免的过程,蛋白质同样也在不断地进化和改变。

蛋白质进化的研究可以帮助我们更好地了解它们的结构功能,以及不同物种之间的相似性和差异性。

蛋白质进化的主要过程是基因突变和选择压力。

基因突变是指基因内部DNA序列的改变。

这种变化可能包括点突变、插入和缺失等。

这些突变会影响蛋白质的氨基酸序列和结构,从而影响它的功能。

选择压力是指自然环境中的一些因素会影响蛋白质的进化方向。

例如,捕食者的压力可能会促使猎物进化出更强的防御机制。

研究蛋白质进化的主要方法是比较分析。

这种方法可以比较不同样本中的蛋白质序列或结构,并推断它们之间的进化历程。

比较分析方法包括多序列比对、基于物种的比较和分子进化时钟。

多序列比对是指将多个蛋白质序列进行比较,找到它们之间的共同点和差异点。

这种方法可以揭示不同物种之间蛋白质序列和结构的相似性和差异性。

基于物种的比较是指比较不同物种中的蛋白质序列和结构,以揭示它们之间的进化关系。

这种方法可以帮助我们了解物种之间的亲缘关系。

分子进化时钟是一种通过比较不同物种中分子序列的时间和进化距离来推断进化历程的方法。

这种方法可以帮助我们了解不同物种之间的进化速度和时间。

通过研究蛋白质进化,生物学家们可以更好地了解生命体的进化历程。

此外,蛋白质进化还具有广泛的应用,如药物设计、生物技术和生物制造等。

药物设计是指在蛋白质水平上设计药物以治疗疾病。

蛋白质结构演化及其在分子进化中的作用

蛋白质结构演化及其在分子进化中的作用

蛋白质结构演化及其在分子进化中的作用蛋白质是构成生命体系的基本分子之一,其功能多种多样,是细胞中的关键元素。

蛋白质结构演化是一个广泛而丰富的研究领域,涉及到组成蛋白质的氨基酸序列、三级结构、功能以及分子进化等多个方面。

本文从蛋白质结构演化及其在分子进化中的作用两个方面,对此进行探讨。

一、蛋白质结构演化1、氨基酸序列的演化蛋白质的结构来自于其氨基酸序列,这个序列是由DNA转录和翻译得到的。

氨基酸序列的演化是蛋白质结构演化的基础。

当一个氨基酸序列经过演化,它的生物学功能可能发生改变。

氨基酸序列的演化通常取决于两个因素:突变和选择。

突变是指不同孩子中出现的基因差异,而选择则是指表现出特定功能的基因更容易被遗传。

因此,选择可以促进某些突变,并抑制其他突变,从而塑造氨基酸序列。

2、三级结构的演化三级结构是蛋白质结构中最重要的一部分,它决定了蛋白质的功能。

氨基酸序列中存在的某些序列特征能够跨越几百万年的演化过程,因此,三级结构的演化比较缓慢。

然而,不同的氨基酸序列可以以各种方式折叠成相似的三级结构,这说明相似的序列可能在演化过程中以不同的方式折叠形成了相同的三级结构。

3、功能的演化蛋白质的功能是非常多样化的,它们包括催化、结构支撑、信息处理等多个方面。

在进化过程中,由于环境变化或生物体自身发生变异,蛋白质的功能也可能会发生改变。

二、蛋白质结构在分子进化中的作用1、确定种系发生关系蛋白质结构的相似性可以用于确定物种或群体之间的亲缘关系。

不同的生物之间,由于其蛋白质序列或结构的相似性,可以推测它们之间的共同祖先以及分化差异的时间和程度,从而得出它们之间的进化关系。

2、分子计算模型蛋白质结构的演化可以为分子计算模型提供一个实验依据。

对于一些分子进化问题,如时间尺度、转化率等,通过对一些具有清晰亲缘关系的模板分子的结构和序列进行比较,可以发现分子的进化规律,提供各种生命现象的合理理论解释。

3、蛋白质工程蛋白质结构演化的研究对于蛋白质工程也具有重要意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

段序列在结构与功能上的同源关系,故更具
有实际意义。
序列相似性与序列同源性是两个不同的概念。
序列相似性(similarity)是一量化参数,反映序列之
间相似或相同的程度。也可用序列一致性(identity)
来表示。
序列同源性(homology)则是反映序列之间在进化
上亲缘关系的远近。
一般说来,序列相似性或一致性越大,则序列之间具 有同源关系的可能性越大。
标准的核苷酸 - 核苷酸比对服务程序,用
于单条待检索序列的鉴定,或查找与之相 似的核苷酸序列。
② Protein BLAST(blastp) 标准的蛋白质 - 蛋白质 BLAST ,用于待检 索序列的鉴定,或查找与之相似的蛋白质 序列。
序列输入区
数据库选择
检索程序选择
运算参数选择
③ Translated query vs. protein database (blastx) 翻译的核苷酸检索序列-蛋白质数据库,
⑤ Translated query vs. translated database (tblastx) 翻译的核苷酸检索序列-核苷酸序列翻译数
据库,即将用户提交的核苷酸序列按6个
读码框翻译为蛋白质序列,再与NCBI核苷 酸数据库的6个读码框翻译序列进行比对。
⑶ Specialized BLAST(特殊的BLAST)
如不同残基的分值越高,则
表示其在进化过程中越容易 发生相互突变,相似性越高; 如不同残基的分值为负数, 则表示其在进化过程中不易 发生相互替换,相似性较低。
第二类为突变数据矩阵(mutation
data
matrix,MD),主要来自于单个残基之间 的相似性,它是基于可接受突变点(point accepted mutation,PAM)的概念。
由于二者的实际检索过程具有许多相似之处,
故这里仅介绍BLAST服务程序。
6.1.1 BLAST检索服务程序 局部比对基本检索工具(Basic Local Alignment Search Tool,BLAST),是由 NCBI开发的一种局部序列比对检索系统,主
要用于将用户所提交的核苷酸或蛋白质序列
④实际的序列比对结果
⑤检索参数及其他统计学资料
考核作业题(第九次) 自行在UNIPROT蛋白质数据库内检索并选择 一段蛋白质序列,使用Blastp程序与蛋白质数
据库进行比对分析,报告评分值最高或期望值
最低的10段序列,并对这些匹配的序列进行分
析评估(10分)。
请将作业的电子文档发送至:lihong7188@
与已知的数据库序列资料进行相似性比对。
相对于全序列比对而言,BLAST采用启发式
比对方式进行局部序列比对,因而能够检测出 存在于各个不同区段的、具有相似性的序列。
直接利用Web浏览器获得BLAST服务是最便捷
的途径之一。
用户在启动IE浏览器后,在地址栏中输入
“http://blast.ncbi.Biblioteka /Blast.cgi”并 回车,即可进入BLAST服务程序的主页。此时, 用户可以根据自己的检索目的,选择不同的 BLAST检索服务程序。
期望值阈值 启发式检索最小初始值
评分矩阵系统 缺口值(终止/延伸)
6.1.8
检索结果
所有BLAST程序以大致相同的格式输出检索
结果,其内容依次为: ① 检索程序简介及一般信息; ② 匹配序列的图形化总结; ③ 匹配序列的在线描述; ④ 实际的序列比对结果; ⑤ 检索参数及其他统计学资料。
Blastp蛋白质序列比对操作实例 1.用浏览器打开Blastp检索界面:
6.1.2 序列格式 为了将待检索序列与数据库序列进行比对,用 户必须按照一定的格式提交欲比对的序列。 ⑴ FASTA Format 即贮存蛋白质或核苷酸序列的文本文件格式, 首行为描述行。
⑵ Net Sequence Format 纯序列格式是不带有FASTA格式描述行定义 的序列数据,不允许出现空行,但可嵌入空格 和/或数字。 ⑶ Sequence Identifier Format 序列标识格式即只输入注册号或GI,不允许出 现空格符。
6.1 局部序列相似性的两两比对
局部序列相似性的两两比对就是将用户提交的
一段蛋白质序列,与数据库中已知的蛋白质序
列进行局部序列相似性比对,以确定二者在序
列结构与功能上的同源关系。
目前,进行局部序列相似性比对十分有用的网 络工具软件是 NCBI 的 BLAST 服务程序和 EBI 的FASTA服务程序。
告满足用户所选择的统计学界值的匹配片段。
6.1.7 运算参数
在进行BLAST检索比对时,用户可根据自己
的检索目的,按一定的格式输入待检索序列,
选择并设定必要的参数。
需要注意的是,相关的运算参数可因BLAST 程序不同,或因程序或网页的更新而改变。
Blastp程序的运算参数(可选)
显示目标序列最大值(可改为10)
即将用户提交的核苷酸序列全部翻译为
蛋白质序列,并与NCBI的蛋白质序列 数据库进行比对。
遗传密码选择
④ Protein query vs. translated database (tblastn) 蛋白质检索序列-核苷酸序列翻译数据
库,即将用户提交的蛋白质序列与
NCBI核苷酸数据库按全部读码框动态 翻译的序列进行比对。
这两段序列的局部比对程度最大,且比对分值
达到或超过界值(或截止分值)。
在BLAST比对分析中,每对HSP由一来自于 待检索序列的片段与一来自于数据库序列的片 段构成。
BLAST程序所采用的相似性检索过程,首先 是在待检索序列与数据库序列之间查找相似的 片段(HSP),然后对任何找到的匹配片段进 行统计学意义的评估(期望值E),最后只报
/Blast.cgi?PROGRAM=blastp&BL AST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch&SHOW_ DEFAULTS=on&LINK_LOC=blasthome
2. 在文本框中输入待分析的蛋白质序列。
substitution matrix,BLOSUM),该矩阵 是由Henikoff夫妇于1992年建立的,它以序 列片段为基础,基于蛋白质模块数据库 BLOCKS,考虑了序列片段中相邻残基之间 的关系。
BLOSUM Score Matrix
在进行相似性比对时,如相 同残基的分值越高,则表示 其越保守,越不易发生突变;
1个PAM表示在一定进化距离中,1%的残
基发生突变的频数。
Relationship of BLOSUM with PAM Matrixes
6.1.6 检索策略 BLAST比对结果输出的基本单位是高分值片 段对(High-scoring Segment Pair,HSP)。
HSP由两段任意的、长度相等的序列片段构成,
6.1.3 BLAST比对数据库的选择 用户应根据自己的检索目的,选择不同的 NCBI数据库以用于待检索序列的比对分析。 可供用户选择的数据库包括核苷酸序列数据库、
多肽序列数据库及人类基因组序列数据库等。
需注意某些数据库对蛋白质或核苷酸序列是有 选择的,不能与某一特定的 BLAST 检索服务 程序相结合使用。 例如,不能使用 BLASTN 程序检索 UniProt 蛋
Chapter 6
Analysis of Sequence Alignment —— Part One
and Molecular Evolution of Proteins
利用网络数据库资源,将用户所测定的蛋白
质序列与已知序列进行相似性比对,是推断
该序列的结构、功能以及同源关系的强有力
的手段。 序列相似性比对包括全局序列比对(整体比 对)与局部序列比对。 由于局部序列相似性比对更能反映蛋白质片
输入蛋白质序列
3.
数据库、检索程序使用默认值,运算参数中调整“ Max target sequence”为10。
4. 点击“blast”按纽提交。
点击按纽
5. 等待结果返回(屏幕将会自动刷新)。
6. 结果解读(将网页向下拖动)。
①检索程序简介及一般信息
②匹配序列的图形化总结
③匹配序列的在线描述
① ②

⑴ BLAST Assembled Refseq Genomes(基 因组参考序列BLAST)
允许用户检索与特定种属的生物相关的序列,包括人 类基因组、大鼠和小鼠基因组、果蝇基因组、微生物 基因组、植物基因组等。 主要用于:
① 对待检索序列作图;
② 决定基因组的结构;
③ 鉴定新的基因。
⑵ Basic BLAST(基本BLAST) 基本BLAST检索服务程序包括: ① Nucleotide BLAST(blastn)
白质序列数据库。
6.1.4 遗传密码表
对于需进行翻译的序列,可供选 择的遗传密码表及其相关联的值 有:
1 —— Standard(标准密码); 2 —— Vertebrate Mitochondrial(脊椎动物线 粒体密码);
3 —— Yeast Mitochondrial (酵母线粒体密码);
4 —— Mold Mitochondrial and Mycoplasma/ Spiroplasma(霉菌线粒体和 支原体/螺旋体密码)等。
6.1.5 评分系统
BLASTP、BLASTX、TBLASTN 和TBLASTX 程序所使用的评分系统为评分矩阵,主要有两大 类:
第一类为模块替换矩阵(blocks
相关文档
最新文档