蛋白质工程 第四章 蛋白质结构预测

合集下载

蛋白质结构的预测与设计

蛋白质结构的预测与设计

蛋白质结构的预测与设计蛋白质是构成所有生物体的重要组分之一,其功能包括催化化学反应、运输分子、感知环境、维持细胞结构等。

蛋白质结构的预测和设计是目前生物学领域的热门研究方向之一,其重要性不言而喻。

本文将探讨蛋白质结构的预测与设计的意义、方法和应用。

一、蛋白质结构的预测蛋白质的结构包括一级结构、二级结构、三级结构和四级结构,其中一级结构是指蛋白质的氨基酸序列,二级结构是指α-螺旋和β-折叠等局部的空间结构,三级结构是指蛋白质的整体三维折叠结构,四级结构是指蛋白质与蛋白质间或蛋白质与其他小分子间的结构。

蛋白质结构的预测可以通过多种方法进行,其中最常用的方法是计算机模拟和实验结合的方法。

计算机模拟包括分子动力学模拟和蛋白质折叠模型等,通过对分子间相互作用力的计算可以预测蛋白质结构。

实验结合的方法包括核磁共振谱学、X射线衍射、圆二色谱等技术,可以通过测量蛋白质的一些物理化学性质来预测结构。

蛋白质结构的预测可以应用于新药物设计、酶工程、纳米材料等领域,具有重要的科学和经济价值。

二、蛋白质结构的设计蛋白质结构的设计是指通过改变蛋白质分子的氨基酸序列和结构来获得具有指定性质的新蛋白质。

蛋白质结构的设计可以基于自然蛋白质的模板,也可以设计新型蛋白质。

蛋白质结构的设计有多种方法,其中最常用的方法是基于蛋白质工程和自由能计算的方法。

基于蛋白质工程的方法包括突变-筛选法和突变-选择法,可以通过改变蛋白质序列中的氨基酸来改变其结构和性质。

自由能计算的方法主要包括蒙特卡罗模拟和分子动力学模拟等,通过计算蛋白质的自由能可以预测蛋白质的结构和性质。

蛋白质结构的设计可以应用于生物医药、能源材料、环境保护等领域,是当前生物学和化学研究的前沿热点之一。

三、结论蛋白质结构的预测和设计在当前的生物学和化学研究中具有重要的应用和研究意义。

通过计算机模拟和实验结合的方法,可以预测和探索蛋白质的结构和性质,为新药物设计、酶工程等领域的研究提供支持。

蛋白质结构与功能预测

蛋白质结构与功能预测

蛋白质结构与功能预测在生命的微观世界里,蛋白质扮演着至关重要的角色。

它们如同一个个小巧而精密的机器,执行着各种各样的生物功能,从催化化学反应到传递信号,从构建细胞结构到抵御病原体。

要理解蛋白质如何发挥这些作用,关键在于揭示其结构与功能之间的神秘关系。

而蛋白质结构与功能的预测,正是现代生物学和医学领域中的一项关键挑战。

蛋白质的结构可以说是其功能的基础。

就像一座建筑的设计决定了它的用途,蛋白质的三维结构决定了它能够与哪些分子相互作用,从而实现特定的功能。

想象一下,一个蛋白质就像是一把精心设计的钥匙,只有其结构与目标“锁孔”(即其他分子)完美匹配,才能顺利地开启相应的生物过程。

那么,如何进行蛋白质结构的预测呢?一种常见的方法是基于同源建模。

这就好比找到了一把已知形状的钥匙(已知结构的同源蛋白质),然后根据新蛋白质与这把已知钥匙的相似性,来推测新蛋白质这把“钥匙”的形状。

然而,这种方法并非总是万无一失。

如果找不到足够相似的同源蛋白质,或者新蛋白质具有独特的结构特征,那么预测的准确性就会大打折扣。

除了同源建模,还有从头预测的方法。

这就像是在没有任何参考的情况下,完全凭借对蛋白质结构形成原理的理解来构建模型。

这需要对蛋白质折叠的物理化学规律有深入的认识,以及强大的计算能力。

但目前,从头预测仍然面临着诸多困难,例如计算量巨大、难以准确模拟复杂的分子相互作用等。

在预测蛋白质结构的道路上,实验技术也在不断发展。

X 射线晶体学和核磁共振(NMR)技术曾经是获取蛋白质结构的“黄金标准”。

通过 X 射线衍射,我们可以得到蛋白质晶体中原子的排列信息,从而精确地确定其结构。

而 NMR 则可以在溶液状态下研究蛋白质的结构动态变化。

然而,这些技术都有各自的局限性。

获取高质量的蛋白质晶体并非易事,而且对于一些大分子量、柔性较大的蛋白质,X 射线晶体学和 NMR 可能都难以给出满意的结果。

近年来,冷冻电镜技术的出现为蛋白质结构研究带来了新的曙光。

蛋白质结构预测及其在结构生物学中的应用

蛋白质结构预测及其在结构生物学中的应用

蛋白质结构预测及其在结构生物学中的应用蛋白质是生命体内最基础的分子,是构成生命物质的基本单位。

每个蛋白质都具有一定的空间结构,这个结构决定了蛋白质的功能。

因此,蛋白质结构的预测对于生命科学、药物设计等领域具有重要的意义。

本文将探讨蛋白质结构预测的基本原理以及在结构生物学中的应用。

一、蛋白质结构预测的基本原理蛋白质的空间结构可以分为四个层次:一级结构(序列)、二级结构(α-螺旋、β-折叠等)、三级结构(多肽链的空间构象)和四级结构(多个多肽链之间的空间关系)。

预测蛋白质的空间结构,从根本上来说就是预测其三级结构的问题。

目前,大部分蛋白质结构预测方法都是基于基因组学的大规模测序数据的,结合一些现有的晶体结构数据库和序列数据库。

基本上,它们都大致包含以下三个步骤:第一步,根据蛋白质的氨基酸序列和模板数据,在蛋白质数据库中寻找最相似的结构;第二步,将找到的最相似的结构作为一个初始模型,使用蛋白质结构预测算法进行优化;第三步,选择最优解或者最优模型。

目前使用最广泛的预测方法是同源建模和蒙特卡罗模拟。

同源建模通过寻找蛋白质序列和已经被解析的蛋白质晶体或者核磁共振数据的相似性,构建一个已知的三维模型。

蒙特卡罗模拟是一种基于优化的预测方法,模拟蛋白质在空间中不同构象的状态,最后得到最佳的构象。

二、蛋白质结构预测在结构生物学中的应用蛋白质的结构预测对于结构生物学的发展起到了重要的推动作用。

此外,它还可以在多个领域中发挥重要的应用。

1.药物设计药物设计是利用化学或者生物学方法开发药品的过程。

在药物设计过程中,蛋白质结构预测是不可或缺的一步。

通过预测蛋白质的结构,科学家可以根据药物和靶标蛋白质之间的相互作用原理来精确设计和优化药物分子结构。

2.蛋白质工程蛋白质工程是指利用基因工程技术对蛋白质分子进行改造的过程。

结合蛋白质结构预测的结果,科学家可以从理论上探究如何改变蛋白质的某些特性,例如抗原性、稳定性、活性等,以实现特定的应用需求。

蛋白质结构的预测与分析

蛋白质结构的预测与分析

蛋白质结构的预测与分析蛋白质是生命体中的重要分子,在生物体内起着承担生命活动的重要作用。

蛋白质结构的预测和分析是生物学研究中的重要一环,旨在揭示蛋白质的三维空间结构和功能。

本文将从蛋白质结构的基本概念入手,介绍蛋白质结构预测的方法和流程,并探讨蛋白质结构与功能的关系。

一、蛋白质结构的基本概念蛋白质结构指的是确定蛋白质分子在三维空间中的构象和构型,即确定蛋白质的三级结构(即原生结构)和四级结构(即蛋白质超级结构)。

蛋白质结构的决定因素是蛋白质的氨基酸序列和环境条件。

氨基酸序列由多种氨基酸组成,每种氨基酸都有其特定的结构和性质,进而决定了蛋白质的空间构象。

环境条件包括温度、ph值、离子浓度等。

二、蛋白质结构预测的方法和流程蛋白质结构预测是指在已知蛋白质的氨基酸序列的情况下,利用计算方法推断其三维空间结构。

目前蛋白质结构预测的方法主要包括基于序列的预测方法和基于结构的预测方法。

一、基于序列的预测方法:利用多种生物信息学分析技术,根据给定的氨基酸序列进行分析和比对,预测蛋白质的二级结构(α-螺旋、β-折叠、无规卷曲),从而推断出蛋白质的三维结构。

基于序列的方法主要包括BLAST、PSI-BLAST、HMM等。

二、基于结构的预测方法:利用已经解析出的蛋白质结构库,根据已确定的结构进行预测。

基于结构的方法主要有模板比对法、蒙特卡罗模拟法、分子动力学模拟法等。

针对蛋白质结构预测中的误差,现阶段也推出了一些错误校正的方法,如:模型修正法、模型优化法等。

三、蛋白质结构与功能的关系蛋白质结构与功能紧密相关,因为蛋白质的结构和功能是相互依存的。

蛋白质分子的结构决定了所处的环境和功能,如在水相环境下,螺旋和β折叠结构是最稳定的,而在疏水环境下,蛋白质的无规卷曲结构更稳定。

蛋白质的功能又与其结构密切相关,如蛋白质A酶的空间构象才使它能专一地与A底物结合反应,从而实现其催化。

因此,对蛋白质结构进行预测和分析,可以更好地理解和预测其功能,为生物学研究提供了更深入的认识。

蛋白质结构预测方法评估

蛋白质结构预测方法评估

蛋白质结构预测方法评估蛋白质是生命体中不可或缺的分子,它们在细胞的结构和功能中起着重要作用。

研究蛋白质的结构对于理解生物过程、疾病发展以及药物设计都具有重要意义。

然而,实验测定蛋白质结构的方法非常耗时耗力,因此科学家们提出了各种计算方法来预测蛋白质的结构。

本文将对蛋白质结构预测方法进行评估。

蛋白质结构可以分为四个层次:一级结构是指由氨基酸组成的线性多肽链;二级结构是指由氢键在多肽链内形成的α-螺旋、β-折叠等结构;三级结构是指多肽链在空间中的三维折叠形态;四级结构是指由多个多肽链相互作用形成的复合物结构。

蛋白质结构预测的目标就是根据蛋白质的一级结构(即氨基酸序列),预测出其二级、三级或四级结构。

根据预测的层次不同,预测方法可以分为一级结构、二级结构、三级结构和四级结构预测方法。

一级结构预测方法是最基础也是最简单的预测方法,它根据氨基酸序列之间的相似性进行预测。

常见的一级结构预测方法包括序列比对、蛋白质家族分析和序列模式识别等。

这些方法对于具有相似氨基酸序列的蛋白质的预测效果较好,但对于新颖的蛋白质序列或者一级结构之间差异较大的蛋白质的预测效果则较差。

二级结构预测方法是根据一级结构中氨基酸的相邻关系来预测蛋白质的二级结构。

这些方法基于统计学模型或者机器学习算法,如神经网络、支持向量机等。

二级结构预测方法的预测准确度已经逐渐提高,尤其是在使用复合模型和深度学习算法的情况下。

三级结构预测方法是预测蛋白质的三维空间结构,目前仍然面临很大的挑战。

传统的方法包括比对、碳热模型等,但由于计算复杂度很高,很难得到理想的结果。

近年来,一些新的方法如蛋白质碳热动力模拟、散射技术、核磁共振等相结合的方法得到了一些突破性的进展。

然而,准确地预测蛋白质的三级结构仍然是一个挑战,并且需要进一步的研究。

最后,四级结构是指多个多肽链相互作用形成的复合物结构。

由于涉及多个蛋白质的相互作用,四级结构预测方法更为困难,也是当前研究的热点之一。

蛋白质结构与功能预测

蛋白质结构与功能预测

蛋白质结构与功能预测在生命的微观世界里,蛋白质扮演着至关重要的角色。

它们如同一个个微小但功能强大的机器,参与着生命活动的方方面面。

而理解蛋白质的结构与功能,以及如何对其进行预测,是现代生物学和医学领域中的关键课题。

蛋白质的结构决定了其功能。

就好像一把钥匙对应着一把锁,蛋白质特定的结构使其能够与特定的分子相互作用,从而执行特定的生理功能。

蛋白质的结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。

一级结构指的是蛋白质中氨基酸的线性排列顺序。

这就像是一串珍珠项链,每颗珍珠就是一个氨基酸。

不同的氨基酸顺序决定了蛋白质后续可能形成的结构和功能。

二级结构则是在局部范围内形成的有规律的结构,如α螺旋和β折叠。

想象一下,这些就像是把项链的某些部分弯曲或者折叠成特定的形状。

三级结构是整个蛋白质分子的三维空间构象,是由二级结构进一步折叠、盘绕形成的。

这时候,蛋白质就像是一个精心折叠的复杂纸艺作品。

四级结构是指多个具有三级结构的亚基聚合形成的更复杂的结构。

那么,为什么要预测蛋白质的结构和功能呢?这有着极其重要的意义。

首先,它有助于我们理解生命活动的机制。

通过了解蛋白质的结构和功能,我们能够揭示细胞如何生长、分裂和执行各种生理过程。

其次,在疾病研究方面,许多疾病的发生与蛋白质的结构和功能异常有关。

例如,某些基因突变可能导致蛋白质结构改变,进而影响其功能,引发疾病。

预测蛋白质结构和功能可以帮助我们找到疾病的根源,并开发新的治疗方法。

再者,药物研发也离不开对蛋白质的研究。

如果我们能够准确预测药物靶点蛋白质的结构和功能,就能够更有针对性地设计药物,提高药物研发的效率和成功率。

在预测蛋白质结构的方法中,X 射线晶体学是一种经典的技术。

它就像是给蛋白质拍一张极其清晰的“照片”,通过分析 X 射线在晶体中的衍射图案,我们可以推算出蛋白质的原子坐标,从而确定其三维结构。

但这种方法也有局限性,比如需要获得高质量的蛋白质晶体,这并非总是容易的。

蛋白质结构预测和模拟方法

蛋白质结构预测和模拟方法

蛋白质结构预测和模拟方法蛋白质是生物体内的重要组成部分,对生命活动具有关键作用。

在了解蛋白质功能和相互作用等方面的研究中,蛋白质结构的预测和模拟方法发挥着重要的作用。

本文将介绍蛋白质结构预测的主要方法和蛋白质结构模拟的常见方法。

1. 蛋白质结构预测方法1.1 基于序列的预测方法基于序列的预测方法是根据蛋白质的氨基酸序列推测其结构。

这一方法通过将目标蛋白质的序列与已知结构的蛋白质序列进行比对,从而预测目标蛋白质的结构。

具体方法包括序列比对、蛋白质家族数据库搜索以及机器学习等等。

1.2 基于结构模板的预测方法基于结构模板的预测方法是根据已知结构的蛋白质来预测目标蛋白质的结构。

这一方法通过找到与目标蛋白质具有相似结构的蛋白质,从而预测目标蛋白质的结构。

具体方法包括结构比对、结构模板库搜索以及融合多个结构模板等等。

1.3 基于物理力学的预测方法基于物理力学的预测方法是利用物理力学原理来预测蛋白质的结构。

这一方法通过模拟蛋白质分子内的原子间相互作用,从而预测蛋白质的结构。

具体方法包括分子力学、蒙特卡洛模拟以及分子动力学模拟等等。

2. 蛋白质结构模拟方法2.1 分子力学模拟分子力学模拟是通过计算蛋白质分子内原子之间的相互作用力,来模拟蛋白质的结构和动力学性质。

这一方法可以对蛋白质进行模拟,从而获得与实验结果相一致的结构信息。

2.2 蒙特卡洛模拟蒙特卡洛模拟是通过引入随机性的方法来模拟蛋白质分子的运动和结构。

这一方法通常基于能量最小化原则,通过随机调整蛋白质的构象从而获得可能的结构。

2.3 分子动力学模拟分子动力学模拟是通过数值计算方法,模拟蛋白质分子静态和动态特性的一种方法。

这一方法可以模拟蛋白质的结构和动力学性质,并研究蛋白质在时间和空间尺度上的变化。

3. 蛋白质结构预测和模拟的应用蛋白质结构预测和模拟的方法在生物科学研究中发挥着重要的作用。

首先,它们可以帮助科学家深入了解蛋白质的结构与功能之间的关系。

其次,蛋白质结构预测和模拟方法还可以用于研究蛋白质的折叠机制、稳定性以及相互作用等。

蛋白质结构预测

蛋白质结构预测

蛋白质结构预测是生物信息学领域中的一个重要研究方向。

蛋白质是生物体内最重要的分子之一,它们存在于所有细胞和组织中,具有广泛的生物功能,包括催化反应、调节信号转导等。

因此,研究蛋白质的结构及其功能对于深入了解生物过程、疾病发生机理等方面具有重要意义。

但是,确定蛋白质的三维结构是一项复杂而费时的任务,因此,研究人员努力开发不同的方法来预测蛋白质结构。

一、的重要性是生物信息学领域中的一个热门研究方向,其重要性主要有以下几个方面:1、揭示蛋白质的结构与功能之间的关系。

蛋白质的结构与功能密切相关,结构决定了蛋白质的功能,而蛋白质功能的变化则往往伴随着其结构的变化。

因此,研究蛋白质的结构对于深入了解其功能具有重要意义。

2、解决实验求解蛋白质结构的难度。

确定蛋白质的三维结构是一项复杂而费时的任务,通常需要几个月到几年的时间才能进行。

因此,开发有效的方法可以大大缩短结构确认的时间和成本。

3、促进药物研发。

蛋白质是许多药物的靶标蛋白,因此,确定蛋白质结构可以为药物研发提供重要的信息和参考。

例如,理解药物分子与目标蛋白结合时的结构变化可以提供有关如何设计更优化的药物分子的线索。

二、的方法目前,方法主要可以分为两类,即序列比对法和物理化学模拟法。

1、序列比对法序列比对法是基于蛋白质序列的比对来预测其结构,通常采用的是蛋白质结构数据库中已知蛋白质序列的比对。

这种方法主要包括两种:同源建模和远源比对。

同源建模是将待预测的蛋白质序列与已知结构的同源蛋白质序列进行比对,并基于这些已知结构进行预测。

同源蛋白质的序列相似性越高,预测的结构准确率就越高。

远源比对是基于蛋白质成员的相关性对蛋白质序列进行比对,这些成员可能来自不同的物种并且与待预测的蛋白质序列相似度较低。

这种方法通常需要使用多序列比对工具并采用不同的算法来预测结构。

2、物理化学模拟法物理化学模拟法是基于分子动力学方法来预测蛋白质的三维结构的一种方法。

这种方法是基于蛋白质的物理和化学性质以及其内部相互作用来构建模型,并使用数学模型进行模拟。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


Backbone:金属丝模型, 表示出多肽主链的走向, 在比较同一种分子的两 种构象时有用。
Jmol Viewer模式

23
Ball and Stick:球棍 模型,能显示原子水平 上的结构细节。可以估 计原子之间的相对距离, 对于评价氨基酸之间的 相互作用很重要。
CPK:实心球模型,球体 大小对应每个原子的范 德华半径。对评估配体 与结合位点的适合程度 非常有用。
42
43
Jpred二级结构预测方法
(1) 进入Jpred首页 (/www-jpred/),
(2) 在“Sequence”下的空白处直接输入序列;也可以选择 “Advanced”高级模式,选择Email提交方式或留空为网页结 果显示,输入蛋白质序列或者从电脑文件夹中获取,最后点击 “Make Prediction”; (3) 在电子邮箱中找到结果地址,在弹出的结果显示界面 选择进行简单结果浏览、图形化输出等操作;
35
/proteomics
36
/proteomics
• 各种Database:序列数据库、结构数据库、 结构分类数据库 • 各种Tools:序列比对、二级结构预测、三 维结构预测、结构域预测等
一、序列比对
在生物信息学研究中,最常用和最经典的一个研 究手段,就是通过序列比对获得有用的信息和知 识。 从核酸及蛋白质的一级结构方面来分析序列的相 同点和不同点,从而能够推测它们的结构、功能 及进化上的联系。

24
蛋白质可视化免费软件Pymol
Pymol是强大的分子图形显示和基本特征测定系统。 Pymol可在/edu寻找链接下载 Pymol启动后显示双界面,对分子操作的常用命令界面, 多种分析功能界面。
25
蛋白质图形操作和性质测定
1. 图形界面左上侧列出主要的可操作对象并分成几个层 次,包括所选对象、蛋白质、整体等; 2. 每个层次的对象有五种主要操作:动作(A: action)、 显示(S: Show)、隐藏(H: hide)、标记(L: Label)、上色 (C: Color)。 3. Dispaly下拉菜单中可显示蛋白质中每条肽链的序列和 非蛋白质成分 ,鼠标左键单击序列选中特殊待操作的残 基可同时显示对象所在位置 ;还可设置背景(论文中这类 图一般用白色背景,而报告中常用黑色背景以增加视觉效 果); 4. Wizard中有对分子常用性质测定模块,包括距离、电 荷等以及尝试进行蛋白质分子改造的功能。
5
三、蛋白质结构分类数据库
一、 蛋白质序列数据库

6
1、从三大核酸数据库查找蛋白序列
GenBank、EMBL、DDBJ

2、从蛋白质序列数据库查找蛋白序列
SWISS-PROT、PIR、TreEMBL及三者合 并而成的UniProt
1、从三大核酸数据库找蛋白序列
(1)NCBI • National Center for Biotechnology Information,
15
• SWISS-PROT、PIR、TreEMBL见P170-173 • 目前UniProt数据库将以上3个数据库合并在一 起。 • 包括UniProtKB、UniRef和UniParc三部分 • UniProtKB:UniProt Knowledgebase
16
UniPort数据库链接:
/
47
SOPMA二级结构预测方法
(1) 进入SOPMA主页(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);
(2) 在“Paste a protein sequence below”下的空白处 提交蛋白序列(原始序列),可以在参数中进行符合我们要 求的设置,然后点击“SUBMIT”按钮进行分析;
蛋白质工程
Protein Engineering
2
教学内容
• • • • • • • • • 第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 绪论 蛋白质的结构与功能 蛋白质结构分析技术 蛋白质结构预测 蛋白质的修饰与克隆表达 蛋白质纯化 蛋白质分子设计 蛋白质组学 蛋白质工程的应用
26
2、MMDB: /Structure
4.1 常用蛋白质数据库
蓝皮本 P164、P165 表6-1 橙皮本 P69 一、蛋白质序列数据库 二、蛋白质结构数据库
27
三、蛋白质结构分类数据库
三、结构分类数据库
• • • • 参见P182 SCOP CATH PDBsum
7
NCBI,美国国家生物技术信息中心
• /
• GenBank等公共数据库
• 工具:
– PubMed 查找文献 – BLAST 序列比对
8
NCBI主页
9
以鼠伤寒沙门氏菌(Salmonella typhimurium) H-1-i基因为例
人类的拉丁文名:Homo sapiens
30
SCOP:/scop/
31
4.1 常用蛋白质数据库
P164、P165 表6-1
一、蛋白质序列数据库 二、蛋白质结构数据库 三、蛋白质结构分类数据库
32
4.2 蛋白质结构预测
一、序列比对
二、二级结构预测 三、结构域预测
33
四、三维结构预测
4.1 常用蛋白质数据库
蓝皮本 P164、P165 表6-1 橙皮本 P69 一、蛋白质序列数据库 二、蛋白质结构数据库
19
三、蛋白质结构分类数据库
二、蛋白质结构数据库

20
1、PDB(Protein Date bBank)

2、MMDB(Molecular Modeling
Database)
21
37
一、序列比对
• (1)NCBI的BLAST • /Blast.cgi
38
一、序列比对
• (2)DNAStar软件的MegAlign:把多序 列存成.seq后缀文件 • (3)ClustalW软件:把多序列存成.txt后 缀文件
39蛋白质分析专家系统
Expert Protein Analysis System,ExPASy / 1994 年由瑞士生物信息学院( Swiss Institute of Bioinformatics,SIB)创建的世界上第一个 分子生物学网站,专门从事蛋白质序列、结构、 功能和蛋白质2D-PAGE图谱等的分析。 通 过 该 网 站 可 以 链 接 到 国 际 上 包 括 ENZYME 、 PROSITE 、 TrEMBL 、 SWISS-PROT 、 SWISS-2DPAGE 、 SWISS-3DIMAGE 等 数 据 库 的 相 关 站 点 , 以 及 SWISS-MODEL等软件工具。
EMBL核酸序列数据库,以及美国NCBI的GenBank数据 库,并列为国际上最著名的三大核酸数据库。
一、 蛋白质序列数据库

14
1、从三大核酸数据库查找蛋白序列
GenBank、EMBL、DDBJ

2、从蛋白质序列数据库查找蛋白序列
SWISS-PROT、PIR、TreEMBL及三者合 并而成的UniProt
1、PDB: /pdb/home/home.do
在结构生物学中占有中心地位,收集蛋白质 和其它大分子的结构数据。
三维结构的呈现:Jmol Viewer、KiNG Viewer、 SWISS-PDB Viewer
Jmol Viewer模式

22
Cartoon:彩带模型,这 种显示法使二级结构折 叠容易辨认。
二、二级结构预测
• Jpred 在线二级结构预测: /wwwjpred/ • SOPMA在线二级结构预测: http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html
物信息学研究所
/
它是 EMBL 的一部分。 1992 年由欧盟资助建立
在英国的一个非盈利性学术机构,也是生物信 息学研究与服务的欧洲中心。
12

EBI开发多种生物学数据库,包括:
(1)核酸序列数据库(EMBL核酸序列数据库、Ensembl、 ENEST、MitBase Server、EDGP、Parasites等); (2)蛋白质序列数据库(SWISS-PROT、TrEMBL、InterPro 等); (3)基因组数据库; (4)序列结构分类数据库(DSSP、HSSP、DALI等); (5)大分子结构数据库(EBI-MSD等); (6)人类蛋白质数据库(HPI等); (7)序列图谱数据库(RHdb Server、GenomeMaps98等)
1、从三大核酸数据库找蛋白序列
(3)DDBJ
13
• National Institute of Genetics,NIG,日本国立遗传学研究
所 • http://www.nig.ac.jg/ • 是日本遗传学各方面研究的中心研究机构及生命科学所 有领域的研究基地。
• NIG建立的日本DNA数据库(DDBJ)、欧洲EBI维护的
28
29
SCOP:/scop/
• SCOP(Structural Classification of Protein)数 据库是一个蛋白质结构分类数据库。 • 依据不同蛋白质的氨基酸组成的相似性及三 级结构,分为全螺旋、全折叠、 /等11 个结构类型,再按照折叠、超家族、家族进 一步细分。
17
蛋白质基本性质分析
18
蛋白质基本性质分析 P186
• 如前图所示,在UniPort结果里可看到: (1)Computer pI/MW:蛋白质的等电点和分子量 (2)ProtParam:蛋白质的理化参数 (3)ProtScale:蛋白质的疏水性区域 (4)PeptideMass:蛋白质被特异切割(如胰蛋白 酶、糜蛋白酶、CNBr)的产物
相关文档
最新文档