蛋白质结构与功能预测

合集下载

蛋白质结构和功能预测研究及其应用

蛋白质结构和功能预测研究及其应用

蛋白质结构和功能预测研究及其应用蛋白质是生命的基础单位,它们在细胞内扮演着重要的角色。

了解蛋白质的结构和功能预测对于生物学、药学等领域有着重要的意义。

本文将介绍蛋白质结构和功能预测的研究现状及其应用。

一、蛋白质结构预测蛋白质结构预测是一项重要的研究领域。

蛋白质结构的预测可以帮助我们理解蛋白质的功能、作用机制以及与其他分子的相互作用。

目前,蛋白质结构预测的方法主要有两种:实验方法和计算方法。

实验方法包括X射线晶体学、核磁共振、电镜等,这些方法可以得到蛋白质的精确结构。

但是,这些实验方法费时费力,而且不适用于所有蛋白质。

计算方法包括基于序列的预测方法、基于比较模型的预测方法和基于物理模拟的预测方法。

其中,基于序列的预测方法是最常用的方法之一。

这种方法利用蛋白质序列信息来预测它的三维结构。

基于比较模型的预测方法则是通过比较已经知道结构的同源蛋白质来预测目标蛋白质的结构。

基于物理模拟的预测方法则是通过计算机模拟蛋白质的物理过程来预测其结构。

现在,计算方法已经成为蛋白质结构预测的主流。

不断提高的计算机性能、先进的算法和更多的实验数据为蛋白质结构预测提供了更好的基础。

在未来,蛋白质结构预测将继续发展和完善,为生物科技的发展奠定更加坚实的基础。

二、蛋白质功能预测蛋白质的功能是由其结构所决定的。

因此,对蛋白质结构的预测也间接预测了其功能。

但是,对于很多蛋白质来说,只知道其结构并不能完全揭示其功能。

在大规模测序的时代,生物学家们面对着海量的序列数据。

对于这些序列,不仅需要进行结构预测,还需要进行功能预测。

目前,蛋白质功能预测的主要方法有三种:基于相似性、基于机器学习和基于结构。

基于相似性的功能预测方法依赖于已知功能的同源蛋白质。

这种方法的基本思想是,如果两个蛋白质的序列相似度高,则它们的功能也可能相似。

但是,这种方法有其局限性,因为不同的蛋白质可能具有相似的结构和序列,但是它们的功能却不同。

基于机器学习的功能预测方法则是通过构建模型来预测蛋白质的功能。

蛋白质结构和功能预测方法

蛋白质结构和功能预测方法

蛋白质结构和功能预测方法蛋白质是生物体中最重要的分子之一,它们参与了几乎所有生命活动的调控。

了解蛋白质的结构和功能对于深入研究生物学、药物设计以及疾病治疗都至关重要。

然而,实验方法获得蛋白质的结构和功能信息并不容易,费时费力。

因此,开发蛋白质结构和功能预测方法成为了科学家们的追求。

蛋白质结构预测是指通过计算机模拟和建模方法,预测未知蛋白质的三维结构。

理论上,已知蛋白质序列可以由这样的方法推测出其三维结构。

然而,蛋白质的三维结构由于受到许多因素的影响,如氨基酸之间的相互作用力、构象空间的限制等,因此结构预测的准确性较低。

目前,蛋白质结构预测方法主要有两类:序列比对和结构比对。

序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。

这些方法基于两个基本原理:序列保守性和序列-结构相关性。

序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。

序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。

基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。

另一种常用的蛋白质结构预测方法是通过结构比对来实现的。

结构比对方法将待预测的蛋白质结构与已知蛋白质结构进行比对,从而推测出其三维结构。

这些方法通过比较蛋白质间的结构相似性,来预测待预测蛋白质的结构。

结构比对方法主要有两种:序列比对和结构比对。

序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。

这些方法基于两个基本原理:序列保守性和序列-结构相关性。

序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。

序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。

基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。

另一种蛋白质结构预测方法是通过结构比对来实现的。

蛋白质结构与功能预测

蛋白质结构与功能预测

蛋白质结构与功能预测蛋白质是生命活动的主要承担者,它们在细胞内执行着各种各样的功能,从催化化学反应到传递信号、运输物质等等。

要深入理解蛋白质的作用机制以及设计新的药物和生物技术应用,准确预测蛋白质的结构和功能至关重要。

蛋白质的结构决定其功能。

蛋白质的结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。

一级结构指的是蛋白质中氨基酸的线性排列顺序。

这就像是一串珠子,每个珠子就是一个氨基酸。

不同的氨基酸有着不同的性质,它们的排列顺序蕴含着蛋白质功能的最初密码。

二级结构则是局部的规律性结构,常见的有α螺旋和β折叠。

想象一下,这就像是把绳子按照一定规律拧成麻花或者折叠起来。

α螺旋就像是一个弹簧,β折叠则像是把纸张反复折叠。

三级结构是整个蛋白质分子的三维空间构象,是由二级结构进一步折叠、盘绕形成的。

这时候,蛋白质已经有了比较完整的形状,各个部分相互作用,共同决定了蛋白质的功能。

四级结构是指多个具有独立三级结构的多肽链通过非共价键相互结合形成的更复杂的结构。

就好比几个独立的小团队组合在一起,形成一个大的团队,发挥更强大的作用。

那么,如何预测蛋白质的结构呢?传统的方法包括基于同源建模的技术。

如果我们已经知道了一个与目标蛋白质相似的蛋白质的结构,就可以以这个已知结构为模板,来构建目标蛋白质的结构模型。

这就像是照着一个相似的样板来制作新的物品。

还有基于物理化学原理的方法,通过计算蛋白质中原子之间的相互作用来预测结构。

这就像是通过分析每个零部件之间的相互作用力,来推测整个机器的最终形态。

近年来,随着技术的发展,深度学习方法在蛋白质结构预测中取得了显著的成果。

这些方法可以自动从大量的蛋白质数据中学习到结构的特征和规律,从而提高预测的准确性。

了解了蛋白质的结构,接下来谈谈如何预测其功能。

功能预测的一种常见方法是基于序列相似性。

如果一个新发现的蛋白质与已知功能的蛋白质在序列上有很高的相似性,那么很可能它们具有相似的功能。

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测生物信息学是运用计算机和统计学的方法研究生物领域的科学,其涉及的内容十分广泛,包括基因组学、转录组学、蛋白质组学等等。

其中,蛋白质结构与功能预测是生物信息学中一个重要的研究方向。

蛋白质是生命体内最重要的分子之一,也是功能最为复杂的分子之一。

蛋白质的生物学功能与其折叠结构息息相关。

因此,了解蛋白质的结构和功能对研究生命科学和药物研发至关重要。

生物实验方法可以确定蛋白质的结构和功能,但其费时费力、成本高昂,因此生物信息学成为了研究蛋白质结构和功能的重要手段之一。

蛋白质结构预测是生物信息学中一个重要的研究方向,其目的是根据蛋白质的氨基酸序列,预测出其具体的三维结构。

目前,蛋白质结构预测的主要方法是通过计算机模拟来实现。

生物信息学家通过收集已知的蛋白质结构信息,运用计算机和统计学的方法进行分析,从而预测目标蛋白质的结构。

其中,在蛋白质结构拟合中,分子动力学和蒙特卡洛方法被广泛应用。

然而,蛋白质的结构预测仍然存在许多挑战。

首先,目前现有技术无法预测所有蛋白质的结构;其次,存在“蛋白质折叠难题”,即如何将线性的氨基酸序列过渡为三维结构,这是困扰生物科学界多年的问题。

因此,蛋白质结构预测仍需要进一步研究发展。

除了蛋白质结构预测,蛋白质功能预测也是生物信息学中的重要研究方向。

蛋白质功能包括催化反应、结合配体、参与信号传导等各种生物学过程。

因此,对蛋白质功能的研究对于生命科学和药物研发具有重要的意义。

目前,蛋白质功能预测的主要方法包括结构化学、功能基因组、蛋白质相互作用和机器学习等方法。

其中,机器学习主要指神经网络、决策树、朴素贝叶斯等算法,通过对已知蛋白质功能信息的学习,预测新的蛋白质功能。

机器学习在生物信息学中已有广泛的应用,例如在新药设计、疾病诊断和基因功能注释中被广泛应用。

然而,蛋白质功能预测依然面临着许多困难,其应用场景和数据背景也各不相同,因此需要在不断尝试和探索中加强改进。

蛋白质结构与功能的计算预测与设计

蛋白质结构与功能的计算预测与设计

蛋白质结构与功能的计算预测与设计在生命科学领域中,蛋白质是最为重要的分子之一。

蛋白质的结构与功能紧密相关,因此准确地预测和设计蛋白质的结构与功能具有非常重要的意义。

这篇文章将探讨蛋白质结构与功能的计算预测与设计方法。

一、蛋白质结构的计算预测蛋白质的结构预测是研究蛋白质的三维立体结构的问题。

由于传统实验方法如X射线晶体学和核磁共振技术需要耗费大量时间和资源,因此发展计算方法成为研究蛋白质结构的重要途径。

1.同源建模同源建模是蛋白质结构预测中最常用的方法之一。

该方法基于已知结构的同源蛋白质,通过比对并建立同源蛋白质的模型来预测目标蛋白质的结构。

同源建模方法可以快速高效地预测目标蛋白质的结构,但前提是目标蛋白质的同源蛋白质已知。

2.蛋白质折叠动力学模拟蛋白质折叠动力学模拟是通过计算机模拟蛋白质的折叠过程来预测其结构。

该方法通常基于分子动力学原理,利用蛋白质的力场参数,通过模拟分子之间的相互作用力来计算蛋白质的折叠过程。

这种方法对于复杂的蛋白质结构预测具有一定优势,但其计算量较大,需要高性能计算设备支持。

二、蛋白质功能的计算预测与设计除了预测蛋白质的结构,还可以通过计算方法来预测蛋白质的功能。

蛋白质的功能预测有助于理解蛋白质的生物学作用和开发新的药物。

1.序列比对分析蛋白质序列比对是功能预测的重要手段之一。

通过将目标蛋白质的氨基酸序列与已知功能蛋白质的序列进行比对,可以预测目标蛋白质的功能。

这种方法是基于蛋白质序列保守性的假设,适用于与已知功能蛋白质具有较高相似性的目标蛋白质。

2.基于结构的功能预测除了利用序列比对进行功能预测外,还可以基于蛋白质的结构进行功能预测。

通过分析蛋白质结构中的结构域、功能位点等特征,结合结构数据库和功能数据库的信息,可以预测目标蛋白质的功能。

这种方法适用于已知蛋白质结构但功能未知的情况。

三、蛋白质的计算设计蛋白质的计算设计是指基于计算方法,通过设计蛋白质的氨基酸序列来实现特定的结构和功能。

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测蛋白质是生物体内的重要分子,它们在维持生命活动中起着至关重要的作用。

了解蛋白质的结构和功能对于深入理解生物学过程、疾病发展以及药物设计具有重要意义。

然而,实验测定蛋白质的结构及其功能是一项耗时费力且成本高昂的工作。

为了解决这一问题,生物信息学中的蛋白质结构与功能预测成为一种有效的方法。

蛋白质结构预测是生物信息学中的重要研究领域之一。

根据蛋白质的氨基酸序列,结合生物化学、物理化学以及计算机科学的方法,可以建立一系列模型和算法,预测蛋白质的三维结构。

蛋白质的结构是决定其功能的基础,通过结构预测可以揭示蛋白质的功能和相互作用,为后续进一步的研究提供指导。

在蛋白质结构预测中,常用的方法有同源建模、折叠动力学模拟和密度泛函理论等。

同源建模是基于已知蛋白质结构和与待预测蛋白质具有较高相似性的蛋白质序列进行模拟和比对,从而预测待预测蛋白质的结构。

折叠动力学模拟则模拟蛋白质在空间中折叠成稳定结构的过程,通过分子力学和数值计算方法,获得预测蛋白质结构的可能构型。

而密度泛函理论则是利用量子力学的计算方法,建立不同蛋白质结构和功能之间的关联,实现蛋白质结构预测和功能预测的目的。

除了蛋白质结构预测,生物信息学中的蛋白质功能预测也是一个重要领域。

蛋白质功能是指蛋白质在生物体内扮演的具体角色,如催化反应、运输分子以及信号传导等。

通过分析蛋白质的序列、结构、水平和进化等特征,可以预测蛋白质的功能。

常见的蛋白质功能预测方法包括序列比对、结构域分析和机器学习等。

序列比对是常用的蛋白质功能预测方法之一,它通过比对待预测蛋白质序列与已知功能蛋白质序列的相似性,推断待预测蛋白质的功能。

对于已知功能蛋白质序列,可以通过蛋白质数据库的检索和分析来获取。

结构域分析则是基于蛋白质中的功能结构域来预测其功能。

功能结构域是指蛋白质中识别和结合特定物质的功能区域,可以通过各种软件工具进行识别和注释。

机器学习是一种颇有潜力的蛋白质功能预测方法,它借助计算机算法和统计模型,通过对已知功能蛋白质的训练,预测待预测蛋白质的功能。

蛋白质的3D结构和功能预测

蛋白质的3D结构和功能预测

蛋白质的3D结构和功能预测蛋白质是构成生命体系的基本成分,在生物学领域中具有非常重要的地位。

为了更好地理解蛋白质的性质和功能,科学家们需要了解蛋白质的3D结构,以及如何从蛋白质的结构中预测出其功能。

在本篇文章中,我们将介绍蛋白质的3D结构和功能预测的相关知识,并探讨其中的一些挑战和前沿技术。

1. 蛋白质的3D结构蛋白质的3D结构是指蛋白质分子中氨基酸残基之间的空间排列方式。

蛋白质的3D结构对于其生物活性和功能起着至关重要的作用。

蛋白质的3D结构主要由其一级、二级、三级和四级结构的组合决定。

蛋白质的一级结构是指其氨基酸序列,而二级结构则是指氨基酸之间的氢键和羧基与氨基间的胺基合成物所构成的局部结构。

三级结构指的是整个蛋白质分子的立体结构,包括各个区域之间的相互作用。

四级结构指的是多个蛋白质子单位之间的互相组合形成的高级别结构。

2. 蛋白质的功能预测蛋白质的功能预测是指通过分析和预测蛋白质的氨基酸序列、3D结构和一些物理、化学和生物学特性,来预测蛋白质的功能。

蛋白质的功能很多,包括酶活性、信号传导、分子运输等等。

对于大多数蛋白质,特别是那些没有与已知蛋白质完全相同的序列(即没有同源性)的蛋白质,功能预测是非常具有挑战性的任务。

3. 蛋白质的功能预测挑战不同的蛋白质可能具有非常相似的3D结构,但是它们的功能可能完全不同。

这就意味着,蛋白质的3D结构与功能之间的关联是非常复杂而模糊的,这也是功能预测面临的主要挑战之一。

此外,蛋白质的结构和功能与环境有很大的关系,因此对于一些在特定环境下发挥作用的蛋白质,预测其功能也更加困难。

4. 蛋白质的功能预测技术针对以上挑战,科学家们开发了许多蛋白质功能预测方法。

其中一种常见的方法是对蛋白质进行结构生物信息学分析,该方法可以通过比对已知蛋白质的3D结构、同源序列、功能特征和一些生物学信息,来预测新的蛋白质的功能。

另外,一些计算机模型也能帮助预测蛋白质的功能。

例如,基于机器学习的方法可以通过对大量已知的蛋白质的结构和功能进行分析,来学习和预测新的蛋白质的功能。

蛋白质结构和功能的预测和设计

蛋白质结构和功能的预测和设计

蛋白质结构和功能的预测和设计蛋白质是生命体中最基本、最复杂、最有特异性的分子。

它们通过三维结构中的折叠和交互作用发挥各种生物学功能,如从催化酶到信号传递、免疫响应、基因调控和细胞骨架等。

因此,对蛋白质结构和功能的预测和设计一直是生物学和生物技术领域研究的热点。

一、蛋白结构预测:1. 基于序列:蛋白质结构预测最早是基于序列,即通过分析蛋白质的氨基酸序列来预测其可能的三维结构。

目前常见的方法有两种:1. 基于模板的方法,通过比对蛋白质序列与已知结构的相似性,预测目标蛋白质的结构;2. 基于物理化学原理等的方法,利用复杂的数学模型对蛋白质序列进行计算,以求出其可能的空间结构。

2. 基于模板:在蛋白质结构预测中,基于模板的方法被广泛应用。

该方法是通过对已知结构的蛋白质与目标蛋白质之间的比对,利用模板进行预测。

目前,主要的数据库有PDB、SCOP和CATH等,它们保存了数以千计的已知三维结构的蛋白质序列。

这些数据库提供了研究者们预测蛋白质结构的重要平台。

3. 基于物理化学原理:基于物理化学原理的方法则是通过计算氨基酸间的相互作用,预测出蛋白质的三维结构。

目前常见的方法有:(1)分子力学法和(2)分子动力学模拟法。

但是这种方法因其极为复杂的计算工作量而不是很实用。

二、蛋白功能设计:蛋白质功能设计是指通过蛋白质的结构和序列信息,以及相关性质的了解,来设计人工合成的具有特定生物学功能的蛋白。

这种设计需要深入了解蛋白质的原理,并配合高速计算技术和实验手段来实现。

1.设计基本原理:蛋白质功能设计的基本原理是依据天然蛋白的结构、功能和特征及其相互作用,利用生物信息学技术等工具,设计出具有新功能和应用价值的蛋白质。

当前,蛋白质功能设计主要分成两种方法:一种是依靠自然演化过程中的进化选择,可以通过利用遗传变异产生的自然蛋白质来筛选,并将所需的性质纳入自然蛋白质中,达到细微修改的目的;另一种是通过借鉴蛋白质中所需的结构、特征等,设计出符合目的性要求的全新蛋白质。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Phyre • Phyre
-/~phyre/
• 3d-PSSM的升级版,增加了fold数据,并且性 能上提高10%-15%,采用了新的分析界面
输入用户Email(必需) 蛋白质描述(选填)
序列提交框(氨基酸单字母)
+ 在既没有已知结构的同源蛋白质、也没有 已知结构的远程同源蛋白质的情况下,上 述两种蛋白质结构预测的方法都不能用, 这时只能采用从头预测方法,即直接或仅 仅根据序列本身来预测其结构。
从头预测方法一般由下列3个部分组成:
+ 蛋白质几何的表示方法
– 由于表示和处理所有原子和溶剂环境的计算量 非常大,因此需要对蛋白质和溶剂的表示形式 作近似处理。
二级结 构预测
序列比对 靶 标 蛋 一 致 性 白模型
序列比对 结果
模板 长度
折叠子描述 模板蛋白结 构分类信息
+ 可视化分析蛋白质的高级结构,有利于从 原子间相互作用的层次理解生命活动过程 的信息控制机制,更加有效地揭示分子在 完成其功能过程中的演化情况,了解蛋白 质分子结构和各种微观性质与宏观性质之 间的定量关系。
a. 人谷胱甘肽-S-转硫酶pi第56到59位残基的β转角连接了来自相同主 链的两段β折叠链,β转角区域内第一个Asp的α羰基氧与其后第三位α
氨基成氢键; b. 来自人细胞珠蛋白的两段α螺旋由β转角连接。
+ 无规卷曲的结构特征为:
– 无规卷曲的特点为在主链骨架上无规则盘绕, 其构象状态仍遵循物理化学原理,但波动性较 大,对温度变化敏感;
– 通过表面对应区域的形状和理化性质互补以及 多位点协同实现与相应分子的特异性相互作用, 通常表面粗糙;
– 球状蛋白结构有柔韧性,且总处于亚稳定状态; 可通过动态结构变化改变其活性
a. 飘带显示全α螺旋人血清白蛋白单体三级结构,结构略微松 散(2T2Z.pdb);b. 飘带显示全α螺旋人血清白蛋白单体三级结
nbpinr/endpicsta._hatmutlomat.pl?page=npsa_sopma.ht 的氨结酸果拉,链也结可构输和出卷曲“螺一旋致性
ml
结果”
http://coot.embl.de/~fmilpetz/SSPRED/ssp 基于数据库搜索相似蛋白并
red.html
构建多重序列比对
人基质金属蛋白酶MMP14(Matrix metalloproteinase, MMP14)氨基酸序列的fasta形式 可从NCBI的蛋白质数据库获得 (>gi|4826834|ref|NP_004986.1|matrix metalloproteinase 14 preproprotein [Homo sapiens])。
+ 蛋白质三级结构的稳定主要靠氨基酸侧链 之间的疏水相互作用、氢键、二硫键、范 德华力和静电作用维持。
+ 不同类型的蛋白质尽管局部结构分解后具 有很高的相似性,但是在三级结构层面不 同的蛋白质将体现各自整体的结构特征通
+ 水溶性蛋白质三级结构的基本特征:
– 各二级结构恰当折叠尽可能使疏水氨基酸集中 在内部,亲水氨基酸分布在表面
Jpred二级结构预测
分析结果 H:代表α-螺旋;E:代表β-折叠;-: 代表无规则卷曲。由图看出:Jpred方法预测的 MMP14二级结构有8个α螺旋区(H)和23个β折叠 区(E),其他区域均为无规则卷曲区(-)。
2. SOMPA二级结构预测方 (1) 进入SO法MPA主页
(http://npsa-pbil.ibcp.fr/cgi-
其中Hh有150个氨基酸,占25.77%;Ee有110个氨基 酸,占18.90%;Tt有52个氨基酸,占8.93%;Cc有270个氨 基酸,占46.39%。Hh、Cc和Ee贯穿于整个氨基酸链,Tt主 要分布在氨基酸链的第300个氨基酸之后。
SOMPA预测结 果
+ 三级结构(protein tertiary structure),即 蛋白质分子处于它的天然折叠状态的三维 构象,它是在二级结构的基础上进一步盘 绕,折叠形成的。
0.54nm; – 相邻螺旋圈之间形成许多氢键; – 侧链基团位于螺旋的外侧。
人细胞珠蛋白(2DC3.pdb)的第121到140位残基 对应的a-螺旋侧面和顶部(N端)视图
β折叠示意图
b,c.人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分β折叠,可见转角(turn);d. 人信号传递蛋白的一个亚基中部分β折叠结构顶部视图,可见到大的环区。
bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);
(2) 在“Paste a protein sequence below”下 的空白处提交蛋白序列(原始序列),可以在参数 中进行符合我们要求的设置,然后点击“SUBMIT” 按钮进行分析;
(3) 查看结果,主要含有alpha helix (Hh)-螺旋 ,Extended strand (Ee)延伸链,Beta turn (Tt)转角,Random coil(Cc)无规卷曲。
– 按二级结构组装模式对蛋白质进行分类,对解析 蛋白质高级结构形成规律和预测蛋白质功能有 重要帮助。
– 蛋白质二级结构组装模式主要是全α螺旋、全β 折叠、α螺旋/β折叠,还有少量α螺旋+β折叠 类。

比较建模(comparative modeling)


的 结
穿线(threading)



自由建模(free modeling)
+ 一级结构 + 如何决定?
1
+ 蛋白质的初级结构指的是20种氨基酸有序的排列
主链
a-C原子
侧链
➢ 由于R的差异,氨基酸具有不同的构象和性质
2
+ 氨基酸大小
– 较小侧链的残基 或较大侧链的残基都使蛋白质 结构的不稳定
+ 极性
– 主链、侧链、溶剂分子两两之间形成氢键
+ 疏水性
– 在蛋白质折叠和结构稳定中起重要作用!
同源模型化方法,是蛋白质三维结构预测的主要方法。
+ 主要思想:
– 对于一个未知结构的蛋白质,找到一个已知结 构的同源蛋白质,以该蛋白质的结构为模板, 为未知结构的蛋白质建立结构模型。
+ 依据:
– 任何一对蛋白质,如果两者的序列相似部分超 过30%,则它们具有相似的三维结构,即两个 蛋白质的基本折叠相同,只是在非螺旋和非折
‫ ﺟ‬MODELLER
又称线索化方法 + 有很多蛋白质具有相似的空间结构,但它
们的序列相似部分小于25%,即属于远程同 源。
+ 对于这类蛋白质,很难通过序列比对找出 它们之间的关系,必须设计新的分析方法。
+ 基于“在众多蛋白质结构中,其折叠类型 (fold)是有限的(1000-2000个?)”
– 实验测定三级结构时往往无法识别无规卷曲(缺 失其座标),即使有座标则其温度因子也较高。 无规卷曲同Ω环的区分主要是其长度和其形状 的波动性。
+ 蛋白质二级结构预测的依据是:
– 每一段相邻的氨基酸序列都有形成特定二级结 构的倾向
➢ 蛋白质二级结构预测的问题是模式分类问题
‫ ﺟ‬判断每一段中心氨基酸残疾是否处于α螺旋、β折叠、β 转角之一的状态
jpred/submit.html
序 , 并 采 用 PSI-BLAST 来 构
建 序 列 Profile 进 行 预 测 , 对
于序列较短、结构单一的蛋
白预测较好
nSnOPPrMedAict SSPRED
hhttttpp::////anlpesxaa-npdbeirl.icbocmpp.fbr//~nomi/n 可预以测比蛋较白各质种序分列析中方潜法在得的到亮
+ 目标是为目标蛋白质U寻找合适的蛋白质模 板,这些模板蛋白质与U没有显著的序列相 似性,但却是远程同源的,即具有相匹配 的折叠结构。
+ 基本思想:首先将目标序列分割成若干片 段,并且匹配到已知的折叠结构中,根据 计算匹配得分、计算能量得分等进行分类
➢排代序表性、分评析估工;具选择最优的折叠结构作为模 板‫ ﺟ‬来Ph构yre建目标蛋白的三维结构。
构,树枝状显示氨基酸侧链,结构明显紧密;
+ 膜蛋白三级结构的基本特征:
– 难结晶,构型形成依然遵循基本规律
– 最常见的二级结构是α螺旋,且可以独立稳定 存在
– β折叠作为二级结构在膜蛋白中主要位于三级 结构内部,全β折叠膜蛋白必须采用特殊组装 模式,即形成β折叠桶。
+ 蛋白质三级结构中二级结构的折叠和组装:
网上免费下载至本地计算机进行蛋白二级
结构预测,也可以进行在线计算。
工具
网站
备注
HNN
http://npsa-pbil.ibcp.fr/cgi-
基于神经网络的分析工具,
bin/npsa_automat.pl?page=npsa_nn.html 含序列到结构过程和结构到
结构处理
Jpred
/~www- 基于Jnet神经网络的分析程
二、蛋白质二级结构的分析方法
– 二基于统计和机器学习方法进行预测 ➢Chou-Fasman算法 ➢GOR算法 ➢多序列列线预测 ➢基于神经网络的序列预测 ➢基于已有知识的预测方法 – (knowledge based method) ➢混合方法(hybrid system method)
+ 许多蛋白质二级结构预测程序可以从因特
+ 势函数及其参数
– 通过对已知结构的蛋白质进行统计分析确定势 函数中的各个参数。
+ 构象空间搜索技术
– 构象空间搜索和势函数的建立是从头预测方法 的关键。
1.SWISS-MODEL服务器自动模式 + 第一步:进入SWISS-MODEL三级结构预测 服务器主页
相关文档
最新文档