蛋白质结构与功能预测
蛋白质结构和功能预测研究及其应用

蛋白质结构和功能预测研究及其应用蛋白质是生命的基础单位,它们在细胞内扮演着重要的角色。
了解蛋白质的结构和功能预测对于生物学、药学等领域有着重要的意义。
本文将介绍蛋白质结构和功能预测的研究现状及其应用。
一、蛋白质结构预测蛋白质结构预测是一项重要的研究领域。
蛋白质结构的预测可以帮助我们理解蛋白质的功能、作用机制以及与其他分子的相互作用。
目前,蛋白质结构预测的方法主要有两种:实验方法和计算方法。
实验方法包括X射线晶体学、核磁共振、电镜等,这些方法可以得到蛋白质的精确结构。
但是,这些实验方法费时费力,而且不适用于所有蛋白质。
计算方法包括基于序列的预测方法、基于比较模型的预测方法和基于物理模拟的预测方法。
其中,基于序列的预测方法是最常用的方法之一。
这种方法利用蛋白质序列信息来预测它的三维结构。
基于比较模型的预测方法则是通过比较已经知道结构的同源蛋白质来预测目标蛋白质的结构。
基于物理模拟的预测方法则是通过计算机模拟蛋白质的物理过程来预测其结构。
现在,计算方法已经成为蛋白质结构预测的主流。
不断提高的计算机性能、先进的算法和更多的实验数据为蛋白质结构预测提供了更好的基础。
在未来,蛋白质结构预测将继续发展和完善,为生物科技的发展奠定更加坚实的基础。
二、蛋白质功能预测蛋白质的功能是由其结构所决定的。
因此,对蛋白质结构的预测也间接预测了其功能。
但是,对于很多蛋白质来说,只知道其结构并不能完全揭示其功能。
在大规模测序的时代,生物学家们面对着海量的序列数据。
对于这些序列,不仅需要进行结构预测,还需要进行功能预测。
目前,蛋白质功能预测的主要方法有三种:基于相似性、基于机器学习和基于结构。
基于相似性的功能预测方法依赖于已知功能的同源蛋白质。
这种方法的基本思想是,如果两个蛋白质的序列相似度高,则它们的功能也可能相似。
但是,这种方法有其局限性,因为不同的蛋白质可能具有相似的结构和序列,但是它们的功能却不同。
基于机器学习的功能预测方法则是通过构建模型来预测蛋白质的功能。
蛋白质结构和功能预测方法

蛋白质结构和功能预测方法蛋白质是生物体中最重要的分子之一,它们参与了几乎所有生命活动的调控。
了解蛋白质的结构和功能对于深入研究生物学、药物设计以及疾病治疗都至关重要。
然而,实验方法获得蛋白质的结构和功能信息并不容易,费时费力。
因此,开发蛋白质结构和功能预测方法成为了科学家们的追求。
蛋白质结构预测是指通过计算机模拟和建模方法,预测未知蛋白质的三维结构。
理论上,已知蛋白质序列可以由这样的方法推测出其三维结构。
然而,蛋白质的三维结构由于受到许多因素的影响,如氨基酸之间的相互作用力、构象空间的限制等,因此结构预测的准确性较低。
目前,蛋白质结构预测方法主要有两类:序列比对和结构比对。
序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。
这些方法基于两个基本原理:序列保守性和序列-结构相关性。
序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。
序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。
基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。
另一种常用的蛋白质结构预测方法是通过结构比对来实现的。
结构比对方法将待预测的蛋白质结构与已知蛋白质结构进行比对,从而推测出其三维结构。
这些方法通过比较蛋白质间的结构相似性,来预测待预测蛋白质的结构。
结构比对方法主要有两种:序列比对和结构比对。
序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。
这些方法基于两个基本原理:序列保守性和序列-结构相关性。
序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。
序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。
基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。
另一种蛋白质结构预测方法是通过结构比对来实现的。
蛋白质结构与功能预测

蛋白质结构与功能预测蛋白质是生命活动的主要承担者,它们在细胞内执行着各种各样的功能,从催化化学反应到传递信号、运输物质等等。
要深入理解蛋白质的作用机制以及设计新的药物和生物技术应用,准确预测蛋白质的结构和功能至关重要。
蛋白质的结构决定其功能。
蛋白质的结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。
一级结构指的是蛋白质中氨基酸的线性排列顺序。
这就像是一串珠子,每个珠子就是一个氨基酸。
不同的氨基酸有着不同的性质,它们的排列顺序蕴含着蛋白质功能的最初密码。
二级结构则是局部的规律性结构,常见的有α螺旋和β折叠。
想象一下,这就像是把绳子按照一定规律拧成麻花或者折叠起来。
α螺旋就像是一个弹簧,β折叠则像是把纸张反复折叠。
三级结构是整个蛋白质分子的三维空间构象,是由二级结构进一步折叠、盘绕形成的。
这时候,蛋白质已经有了比较完整的形状,各个部分相互作用,共同决定了蛋白质的功能。
四级结构是指多个具有独立三级结构的多肽链通过非共价键相互结合形成的更复杂的结构。
就好比几个独立的小团队组合在一起,形成一个大的团队,发挥更强大的作用。
那么,如何预测蛋白质的结构呢?传统的方法包括基于同源建模的技术。
如果我们已经知道了一个与目标蛋白质相似的蛋白质的结构,就可以以这个已知结构为模板,来构建目标蛋白质的结构模型。
这就像是照着一个相似的样板来制作新的物品。
还有基于物理化学原理的方法,通过计算蛋白质中原子之间的相互作用来预测结构。
这就像是通过分析每个零部件之间的相互作用力,来推测整个机器的最终形态。
近年来,随着技术的发展,深度学习方法在蛋白质结构预测中取得了显著的成果。
这些方法可以自动从大量的蛋白质数据中学习到结构的特征和规律,从而提高预测的准确性。
了解了蛋白质的结构,接下来谈谈如何预测其功能。
功能预测的一种常见方法是基于序列相似性。
如果一个新发现的蛋白质与已知功能的蛋白质在序列上有很高的相似性,那么很可能它们具有相似的功能。
生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测生物信息学是运用计算机和统计学的方法研究生物领域的科学,其涉及的内容十分广泛,包括基因组学、转录组学、蛋白质组学等等。
其中,蛋白质结构与功能预测是生物信息学中一个重要的研究方向。
蛋白质是生命体内最重要的分子之一,也是功能最为复杂的分子之一。
蛋白质的生物学功能与其折叠结构息息相关。
因此,了解蛋白质的结构和功能对研究生命科学和药物研发至关重要。
生物实验方法可以确定蛋白质的结构和功能,但其费时费力、成本高昂,因此生物信息学成为了研究蛋白质结构和功能的重要手段之一。
蛋白质结构预测是生物信息学中一个重要的研究方向,其目的是根据蛋白质的氨基酸序列,预测出其具体的三维结构。
目前,蛋白质结构预测的主要方法是通过计算机模拟来实现。
生物信息学家通过收集已知的蛋白质结构信息,运用计算机和统计学的方法进行分析,从而预测目标蛋白质的结构。
其中,在蛋白质结构拟合中,分子动力学和蒙特卡洛方法被广泛应用。
然而,蛋白质的结构预测仍然存在许多挑战。
首先,目前现有技术无法预测所有蛋白质的结构;其次,存在“蛋白质折叠难题”,即如何将线性的氨基酸序列过渡为三维结构,这是困扰生物科学界多年的问题。
因此,蛋白质结构预测仍需要进一步研究发展。
除了蛋白质结构预测,蛋白质功能预测也是生物信息学中的重要研究方向。
蛋白质功能包括催化反应、结合配体、参与信号传导等各种生物学过程。
因此,对蛋白质功能的研究对于生命科学和药物研发具有重要的意义。
目前,蛋白质功能预测的主要方法包括结构化学、功能基因组、蛋白质相互作用和机器学习等方法。
其中,机器学习主要指神经网络、决策树、朴素贝叶斯等算法,通过对已知蛋白质功能信息的学习,预测新的蛋白质功能。
机器学习在生物信息学中已有广泛的应用,例如在新药设计、疾病诊断和基因功能注释中被广泛应用。
然而,蛋白质功能预测依然面临着许多困难,其应用场景和数据背景也各不相同,因此需要在不断尝试和探索中加强改进。
蛋白质结构与功能预测

Phyre • Phyre
-/~phyre/
• 3d-PSSM的升级版,增加了fold数据,并且性 能上提高10%-15%,采用了新的分析界面
输入用户Email(必需) 蛋白质描述(选填)
序列提交框(氨基酸单字母)
+ 在既没有已知结构的同源蛋白质、也没有 已知结构的远程同源蛋白质的情况下,上 述两种蛋白质结构预测的方法都不能用, 这时只能采用从头预测方法,即直接或仅 仅根据序列本身来预测其结构。
从头预测方法一般由下列3个部分组成:
+ 蛋白质几何的表示方法
– 由于表示和处理所有原子和溶剂环境的计算量 非常大,因此需要对蛋白质和溶剂的表示形式 作近似处理。
二级结 构预测
序列比对 靶 标 蛋 一 致 性 白模型
序列比对 结果
模板 长度
折叠子描述 模板蛋白结 构分类信息
+ 可视化分析蛋白质的高级结构,有利于从 原子间相互作用的层次理解生命活动过程 的信息控制机制,更加有效地揭示分子在 完成其功能过程中的演化情况,了解蛋白 质分子结构和各种微观性质与宏观性质之 间的定量关系。
a. 人谷胱甘肽-S-转硫酶pi第56到59位残基的β转角连接了来自相同主 链的两段β折叠链,β转角区域内第一个Asp的α羰基氧与其后第三位α
氨基成氢键; b. 来自人细胞珠蛋白的两段α螺旋由β转角连接。
+ 无规卷曲的结构特征为:
– 无规卷曲的特点为在主链骨架上无规则盘绕, 其构象状态仍遵循物理化学原理,但波动性较 大,对温度变化敏感;
– 通过表面对应区域的形状和理化性质互补以及 多位点协同实现与相应分子的特异性相互作用, 通常表面粗糙;
– 球状蛋白结构有柔韧性,且总处于亚稳定状态; 可通过动态结构变化改变其活性
蛋白质结构与功能的计算预测与设计

蛋白质结构与功能的计算预测与设计在生命科学领域中,蛋白质是最为重要的分子之一。
蛋白质的结构与功能紧密相关,因此准确地预测和设计蛋白质的结构与功能具有非常重要的意义。
这篇文章将探讨蛋白质结构与功能的计算预测与设计方法。
一、蛋白质结构的计算预测蛋白质的结构预测是研究蛋白质的三维立体结构的问题。
由于传统实验方法如X射线晶体学和核磁共振技术需要耗费大量时间和资源,因此发展计算方法成为研究蛋白质结构的重要途径。
1.同源建模同源建模是蛋白质结构预测中最常用的方法之一。
该方法基于已知结构的同源蛋白质,通过比对并建立同源蛋白质的模型来预测目标蛋白质的结构。
同源建模方法可以快速高效地预测目标蛋白质的结构,但前提是目标蛋白质的同源蛋白质已知。
2.蛋白质折叠动力学模拟蛋白质折叠动力学模拟是通过计算机模拟蛋白质的折叠过程来预测其结构。
该方法通常基于分子动力学原理,利用蛋白质的力场参数,通过模拟分子之间的相互作用力来计算蛋白质的折叠过程。
这种方法对于复杂的蛋白质结构预测具有一定优势,但其计算量较大,需要高性能计算设备支持。
二、蛋白质功能的计算预测与设计除了预测蛋白质的结构,还可以通过计算方法来预测蛋白质的功能。
蛋白质的功能预测有助于理解蛋白质的生物学作用和开发新的药物。
1.序列比对分析蛋白质序列比对是功能预测的重要手段之一。
通过将目标蛋白质的氨基酸序列与已知功能蛋白质的序列进行比对,可以预测目标蛋白质的功能。
这种方法是基于蛋白质序列保守性的假设,适用于与已知功能蛋白质具有较高相似性的目标蛋白质。
2.基于结构的功能预测除了利用序列比对进行功能预测外,还可以基于蛋白质的结构进行功能预测。
通过分析蛋白质结构中的结构域、功能位点等特征,结合结构数据库和功能数据库的信息,可以预测目标蛋白质的功能。
这种方法适用于已知蛋白质结构但功能未知的情况。
三、蛋白质的计算设计蛋白质的计算设计是指基于计算方法,通过设计蛋白质的氨基酸序列来实现特定的结构和功能。
生物信息学中的蛋白质结构与功能预测
生物信息学中的蛋白质结构与功能预测蛋白质是生物体内的重要分子,它们在维持生命活动中起着至关重要的作用。
了解蛋白质的结构和功能对于深入理解生物学过程、疾病发展以及药物设计具有重要意义。
然而,实验测定蛋白质的结构及其功能是一项耗时费力且成本高昂的工作。
为了解决这一问题,生物信息学中的蛋白质结构与功能预测成为一种有效的方法。
蛋白质结构预测是生物信息学中的重要研究领域之一。
根据蛋白质的氨基酸序列,结合生物化学、物理化学以及计算机科学的方法,可以建立一系列模型和算法,预测蛋白质的三维结构。
蛋白质的结构是决定其功能的基础,通过结构预测可以揭示蛋白质的功能和相互作用,为后续进一步的研究提供指导。
在蛋白质结构预测中,常用的方法有同源建模、折叠动力学模拟和密度泛函理论等。
同源建模是基于已知蛋白质结构和与待预测蛋白质具有较高相似性的蛋白质序列进行模拟和比对,从而预测待预测蛋白质的结构。
折叠动力学模拟则模拟蛋白质在空间中折叠成稳定结构的过程,通过分子力学和数值计算方法,获得预测蛋白质结构的可能构型。
而密度泛函理论则是利用量子力学的计算方法,建立不同蛋白质结构和功能之间的关联,实现蛋白质结构预测和功能预测的目的。
除了蛋白质结构预测,生物信息学中的蛋白质功能预测也是一个重要领域。
蛋白质功能是指蛋白质在生物体内扮演的具体角色,如催化反应、运输分子以及信号传导等。
通过分析蛋白质的序列、结构、水平和进化等特征,可以预测蛋白质的功能。
常见的蛋白质功能预测方法包括序列比对、结构域分析和机器学习等。
序列比对是常用的蛋白质功能预测方法之一,它通过比对待预测蛋白质序列与已知功能蛋白质序列的相似性,推断待预测蛋白质的功能。
对于已知功能蛋白质序列,可以通过蛋白质数据库的检索和分析来获取。
结构域分析则是基于蛋白质中的功能结构域来预测其功能。
功能结构域是指蛋白质中识别和结合特定物质的功能区域,可以通过各种软件工具进行识别和注释。
机器学习是一种颇有潜力的蛋白质功能预测方法,它借助计算机算法和统计模型,通过对已知功能蛋白质的训练,预测待预测蛋白质的功能。
蛋白质的3D结构和功能预测
蛋白质的3D结构和功能预测蛋白质是构成生命体系的基本成分,在生物学领域中具有非常重要的地位。
为了更好地理解蛋白质的性质和功能,科学家们需要了解蛋白质的3D结构,以及如何从蛋白质的结构中预测出其功能。
在本篇文章中,我们将介绍蛋白质的3D结构和功能预测的相关知识,并探讨其中的一些挑战和前沿技术。
1. 蛋白质的3D结构蛋白质的3D结构是指蛋白质分子中氨基酸残基之间的空间排列方式。
蛋白质的3D结构对于其生物活性和功能起着至关重要的作用。
蛋白质的3D结构主要由其一级、二级、三级和四级结构的组合决定。
蛋白质的一级结构是指其氨基酸序列,而二级结构则是指氨基酸之间的氢键和羧基与氨基间的胺基合成物所构成的局部结构。
三级结构指的是整个蛋白质分子的立体结构,包括各个区域之间的相互作用。
四级结构指的是多个蛋白质子单位之间的互相组合形成的高级别结构。
2. 蛋白质的功能预测蛋白质的功能预测是指通过分析和预测蛋白质的氨基酸序列、3D结构和一些物理、化学和生物学特性,来预测蛋白质的功能。
蛋白质的功能很多,包括酶活性、信号传导、分子运输等等。
对于大多数蛋白质,特别是那些没有与已知蛋白质完全相同的序列(即没有同源性)的蛋白质,功能预测是非常具有挑战性的任务。
3. 蛋白质的功能预测挑战不同的蛋白质可能具有非常相似的3D结构,但是它们的功能可能完全不同。
这就意味着,蛋白质的3D结构与功能之间的关联是非常复杂而模糊的,这也是功能预测面临的主要挑战之一。
此外,蛋白质的结构和功能与环境有很大的关系,因此对于一些在特定环境下发挥作用的蛋白质,预测其功能也更加困难。
4. 蛋白质的功能预测技术针对以上挑战,科学家们开发了许多蛋白质功能预测方法。
其中一种常见的方法是对蛋白质进行结构生物信息学分析,该方法可以通过比对已知蛋白质的3D结构、同源序列、功能特征和一些生物学信息,来预测新的蛋白质的功能。
另外,一些计算机模型也能帮助预测蛋白质的功能。
例如,基于机器学习的方法可以通过对大量已知的蛋白质的结构和功能进行分析,来学习和预测新的蛋白质的功能。
蛋白质结构和功能的预测和设计
蛋白质结构和功能的预测和设计蛋白质是生命体中最基本、最复杂、最有特异性的分子。
它们通过三维结构中的折叠和交互作用发挥各种生物学功能,如从催化酶到信号传递、免疫响应、基因调控和细胞骨架等。
因此,对蛋白质结构和功能的预测和设计一直是生物学和生物技术领域研究的热点。
一、蛋白结构预测:1. 基于序列:蛋白质结构预测最早是基于序列,即通过分析蛋白质的氨基酸序列来预测其可能的三维结构。
目前常见的方法有两种:1. 基于模板的方法,通过比对蛋白质序列与已知结构的相似性,预测目标蛋白质的结构;2. 基于物理化学原理等的方法,利用复杂的数学模型对蛋白质序列进行计算,以求出其可能的空间结构。
2. 基于模板:在蛋白质结构预测中,基于模板的方法被广泛应用。
该方法是通过对已知结构的蛋白质与目标蛋白质之间的比对,利用模板进行预测。
目前,主要的数据库有PDB、SCOP和CATH等,它们保存了数以千计的已知三维结构的蛋白质序列。
这些数据库提供了研究者们预测蛋白质结构的重要平台。
3. 基于物理化学原理:基于物理化学原理的方法则是通过计算氨基酸间的相互作用,预测出蛋白质的三维结构。
目前常见的方法有:(1)分子力学法和(2)分子动力学模拟法。
但是这种方法因其极为复杂的计算工作量而不是很实用。
二、蛋白功能设计:蛋白质功能设计是指通过蛋白质的结构和序列信息,以及相关性质的了解,来设计人工合成的具有特定生物学功能的蛋白。
这种设计需要深入了解蛋白质的原理,并配合高速计算技术和实验手段来实现。
1.设计基本原理:蛋白质功能设计的基本原理是依据天然蛋白的结构、功能和特征及其相互作用,利用生物信息学技术等工具,设计出具有新功能和应用价值的蛋白质。
当前,蛋白质功能设计主要分成两种方法:一种是依靠自然演化过程中的进化选择,可以通过利用遗传变异产生的自然蛋白质来筛选,并将所需的性质纳入自然蛋白质中,达到细微修改的目的;另一种是通过借鉴蛋白质中所需的结构、特征等,设计出符合目的性要求的全新蛋白质。
蛋白质结构预测和功能预测的生物信息学算法研究
蛋白质结构预测和功能预测的生物信息学算法研究蛋白质是生物体中一种非常重要的分子,它们在细胞代谢过程中扮演着重要的角色,例如:催化反应、运输物质、支撑结构、调节信号传导等等。
我们人类的身体中,就有数以百万计的不同种类的蛋白质,而这些蛋白质都是由氨基酸(Amino Acids)构成的。
在国际上,对蛋白质立体构型(Protein Conformation)和功能的研究一直是生物信息学领域的一个热点。
因此,本文就来探讨一下蛋白质结构预测和功能预测的生物信息学算法研究。
一、蛋白质结构预测算法1. 介绍蛋白质的结构预测是对蛋白质分子结构进行预测的过程,可以分为三种类型:一级结构、二级结构和三级结构预测。
一级结构是指蛋白质的氨基酸序列,二级结构是指蛋白质中α螺旋和β折叠的相对排列,三级结构是指蛋白质的完整三维结构。
蛋白质结构预测的研究可以追溯到上世纪50年代,当时是通过实验方法来寻找蛋白质结构的。
而随着计算机技术的发展,蛋白质结构预测的研究逐渐趋于计算机模拟方法。
2. 常见的蛋白质结构预测算法(1)序列比对序列比对是通过比较不同蛋白质的氨基酸序列,找出它们的相同区域来推测蛋白质结构。
这种方法通常适用于寻找已知结构的蛋白质的未知序列,而对于全新的未知蛋白质序列,这种方法存在较大的误差。
(2)拓扑结构模拟拓扑结构模拟是建立在拓扑学基础上的一种新型方法,通过模拟拓扑结构的各种表现形式,例如多面体和环等,在根据实验数据优化模拟结果,获得预测结论。
拓扑结构模拟方法克服了许多传统算法存在的局限性,并且在计算时间上也得到了较大的改善,因此具有广泛应用价值。
(3)机器学习机器学习方法在蛋白质结构预测中也有广泛应用,这种方法主要是利用大量已知的蛋白质结构和对应的氨基酸序列,通过机器学习算法建立预测模型,再使用模型对未知蛋白质结构进行预测。
这种方法不仅准确度高,而且预测速度也非常快。
二、蛋白质功能预测算法1. 介绍蛋白质的功能预测是指比较已知的功能和未知蛋白质序列之间的相似性来预测其功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质亲疏水性分析
• 疏水作用是蛋白质折叠的主要驱动力 • 分析蛋白质氨基酸亲疏水性是了解蛋白
质折叠的第一步 • 氨基酸疏水分析为蛋白质二级结构预测
提供佐证 • 可用于分析蛋白质相互作用位点-抗原位
点预测(预测准确率达56%) • 是分析蛋白质跨膜区重要一步
蛋白质跨膜区分析
• α螺旋跨膜区主要是由20-30个疏水性氨基酸 (Leu、Ile、Val、Met、Gly、Ala等)组成
蛋白质结构与功能预测
2007年12月
DNA sequence Protein sequence Protein structure Protein function
蛋白质序列分析主要内容
蛋白质序列分析
蛋白质一级序列
蛋白质二级结构 蛋白质超二级结构 蛋白质三级结构
蛋白质分类
蛋白质基本理化性质分析
蛋白质亲疏水性分析 跨膜区结构预测 卷曲螺旋预测
TMHMM
蛋白质亲疏水性分析
• ProtScale工具
/tools/protscale.html • 氨基酸标度
– 表示氨基酸在某种实验状态下相对其他氨基酸在某些性 质的差异,如疏水性、亲水性等
• 收集56多个文献中提供的氨基酸标度 • 默认值以Hphob. Kyte & Doolittle做疏水性分析 • 特异性氨基酸标度,如Hopp & Woods(1981)针对抗原片
翻译后修饰位点预测 蛋白质二级结构预测 蛋白质序列信号位点分析 蛋白质结构域分析 蛋白质三维结构模拟
蛋白质家族分析
ExPASy(Expert Protein Analysis System)Tools (/tools/)
1.蛋白质基本理化性质分析
蛋白质理化性质是蛋白质研究的基础
蛋白质的基本性质:
相对分子质量 氨基酸组成
等电点(PI) 消光系数
半衰期
不稳定系数
总平均亲水性 ……
实验方法:
• 相对分子质量的测定、等电点实验、沉降实验 • 缺点:费时、耗资
基于实验经验值的计算机分析方法
基于一级序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 • Expasy 开发的针对蛋白质基本理化性质的分析:
主要选项/参数
序列在线提交形式: • 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
打开protein.txt, 将蛋白质序列 粘贴在搜索框中
利用蛋白质序列统计分析方 法给出待测蛋白的物理化学 信息
AACompIdent PeptideMass
蛋白质理化性质Biblioteka 析• Protparam 工具
http:// 计算以下物理化学性质: • 相对分子质量 理论 pI 值 • 氨基酸组成 原子组成 • 消光系数 半衰期 • 不稳定系数 脂肪系数 • 总平均亲水性
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域 用户自定义区段
点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果
氨基酸数目 相对分子质量
理论 pI 值 氨基酸组成
正/负电荷残基数
原子组成 分子式
总原子数 消光系数
半衰期
14
不稳定系数
脂肪系数 总平均亲水性
– Protparam 工具 http://
相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 ……
蛋白质理化性质分析工具
工具
AACompldent
网站
/tools/aacomp/
Compute pI/Mw /tools/pi_tool.html
段定位;Accessible residues(1979)针对氨基酸溶剂可及 性定位;Chou & Fasman (1978)针对氨基酸二级结构疏 水性分析
主要选项/参数
序列在线提交形式:
• 如果分析SWISS-PORT和TrEMBL数据库中序列 – 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 亲水残基往往出现在疏水残基之间,对功能有 重要的作用
• 基于亲/疏水量和蛋白质膜区每个氨基酸的统计 学分布偏好性量
• TMpred- http:// • SOSUI- /
常用蛋白质跨膜区域分析工具
工具 DAS
HMMTOP
SOSUI TMAP TMHMM TMpred
TopPred
http:///
ProtParam
/tools/protparam.html
PeptideMass SAPS
备注
利用未知蛋白质的氨基酸组 成确认具有相同组成的已知 蛋白 计算蛋白质序列的等电点和 分子量
对氨基酸序列多个物理和化 学参数(分子量、等电点、 吸光系数等)进行计算
计算相应肽段的pI和分子量
网站
http:///
/ http://bioinfo.limbo.ifm.liu.se/tmap/
http://
http://bioweb.pasteur.fr/seqanal/interfaces/ toppred.html
备注
用Dense Alignment Surface (DAS)算法来预测无同源 家族的蛋白跨膜区 由 Enzymology 研 究 所 开 发 的蛋白质跨膜区和拓扑结构 预测程序 由Nagoya大学开发一个具有 图形显示跨膜区的程序 基于多序列比对来预测跨膜 区的程序 基于HMM方法的蛋白质跨 膜区预测工具 基于对TMbase 数据库的统 计分析来预测蛋白质跨膜区 和跨膜方向 是一个位于法国的蛋白质拓 扑结构预测程序
<40 stable >40 unstable
蛋白质亲疏水性/跨膜区分析
(a)-Type I membrane protein (b)-Type II membrane protein (c)-Multipass transmembrane proteins (d)-Lipid chain-anchored membrane proteins (e)-GPI-anchored membrane proteins