第六章 蛋白质结构预测的原理与方法

合集下载

蛋白质结构预测的算法原理与误差评价

蛋白质结构预测的算法原理与误差评价

蛋白质结构预测的算法原理与误差评价随着生物科技的高速发展,预测蛋白质结构的能力和方法也越来越成熟。

蛋白质是生物体内最重要和最基本的分子机器之一,是生命活动不可或缺的基础物质。

因此研究蛋白质结构预测的算法原理和误差评价具有重要的科学价值和应用前景。

一、蛋白质结构预测算法原理蛋白质结构预测算法的基本原理是根据蛋白质序列推测其三维空间构像。

这个过程具有复杂的数学和物理学基础,其中大部分利用了分子力学、能量函数和机器学习等现代科学理论和技术。

(一)分子力学模拟分子力学模拟是指通过计算机程序模拟分子之间的相互作用力,推算分子结构的一个常用方法。

最初,分子模拟技术主要应用于液态和气态分子系统研究,近年来逐渐发展为在蛋白质结构预测方面的重要手段之一。

分子力学模拟的基本过程是构建分子结构模型,确定分子模拟的力场,进行模拟计算,并根据结果进行结构优化。

力场通常由多种力量构成,包括化学键能、静电势能、分子间排斥相互作用等。

然后,通过经过反复调整的动力学方程组进行模拟计算,并通过分析分子的能量、构形、热力学性质等参数来确定结构最终的优化结果。

(二)能量函数模拟能量函数模拟是蛋白质结构预测中非常重要的一个算法。

其基本原理是假设蛋白质结构具有最低能量状态,通过计算和比较不同结构的能量差异来选择最佳结构。

能量函数模拟的结果不仅与依据哪种算法、借鉴哪些数据等有关,而且还与计算能力和CPU 速度等因素密切相关。

因此,在建立蛋白质结构能量函数模拟时考虑了大量物理、化学、能量和几何因素。

其中物理因素包括分子构象能、非键相互作用和氢键能;化学因素包括氨基酸侧链和与水分子和离子的相互作用等;而几何因素包括键角、键长、二面角等。

(三)机器学习方法机器学习作为当前人工智能领域的重要技术之一,在蛋白质结构预测中也得以广泛运用。

机器学习方法一般根据已知的蛋白质结构和序列构建训练集,使用经过训练的模型对新的序列进行预测。

不同于上面两种方法,机器学习的方法主要是通过在大量的数据集和模型中训练来提高预测精度。

蛋白质结构和功能预测方法

蛋白质结构和功能预测方法

蛋白质结构和功能预测方法蛋白质是生物体中最重要的分子之一,它们参与了几乎所有生命活动的调控。

了解蛋白质的结构和功能对于深入研究生物学、药物设计以及疾病治疗都至关重要。

然而,实验方法获得蛋白质的结构和功能信息并不容易,费时费力。

因此,开发蛋白质结构和功能预测方法成为了科学家们的追求。

蛋白质结构预测是指通过计算机模拟和建模方法,预测未知蛋白质的三维结构。

理论上,已知蛋白质序列可以由这样的方法推测出其三维结构。

然而,蛋白质的三维结构由于受到许多因素的影响,如氨基酸之间的相互作用力、构象空间的限制等,因此结构预测的准确性较低。

目前,蛋白质结构预测方法主要有两类:序列比对和结构比对。

序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。

这些方法基于两个基本原理:序列保守性和序列-结构相关性。

序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。

序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。

基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。

另一种常用的蛋白质结构预测方法是通过结构比对来实现的。

结构比对方法将待预测的蛋白质结构与已知蛋白质结构进行比对,从而推测出其三维结构。

这些方法通过比较蛋白质间的结构相似性,来预测待预测蛋白质的结构。

结构比对方法主要有两种:序列比对和结构比对。

序列比对方法通过比较已知蛋白质序列与待预测的蛋白质序列之间的相似性,来预测其结构。

这些方法基于两个基本原理:序列保守性和序列-结构相关性。

序列保守性指的是在进化过程中,蛋白质序列的某些部分往往会保持不变,这是因为这些部分具有重要的功能。

序列-结构相关性则指的是蛋白质序列和其结构之间存在一定的统计关系。

基于这些原理,序列比对方法可以将待预测的蛋白质序列与已知蛋白质序列进行比较,从而推测出其结构。

另一种蛋白质结构预测方法是通过结构比对来实现的。

蛋白质结构预测算法设计与实现原理介绍

蛋白质结构预测算法设计与实现原理介绍

蛋白质结构预测算法设计与实现原理介绍蛋白质是细胞中最基本的功能性分子之一,它们在细胞的各个过程中起着重要的作用。

了解蛋白质的结构能够帮助我们理解其功能和相互作用的机制。

然而,实验方法对于蛋白质结构的解析过程十分耗时和昂贵,因此开发高效准确的蛋白质结构预测算法成为当今生物信息学领域的重要任务之一。

蛋白质结构预测算法可以被分为三个主要的方法:序列比对方法、折叠模型方法和基于机器学习的方法。

下面将详细介绍这些方法的原理和实现。

序列比对方法是最早也是最常用的蛋白质结构预测方法之一。

其基本原理是根据蛋白质的氨基酸序列和已知结构的蛋白质进行比对,找出相似序列并据此推测出目标蛋白质的结构。

这一方法的实现过程一般包括以下几个步骤:首先,使用相似性搜索算法,如BLAST或PSI-BLAST,在数据库中找到与目标序列相似的序列。

然后,利用序列比对算法,如CLUSTALW或MUSCLE,将目标序列与相似序列进行比对并生成多序列比对结果。

最后,利用结构比对算法,如RaptorX或HHpred,将多序列比对结果与已知结构的蛋白质进行比对,并通过拟合分析和模板生成,预测目标蛋白质的结构。

折叠模型方法是一种基于物理力学原理的蛋白质结构预测方法。

其基本原理是通过描述蛋白质的理化特性,如二面角、键角和键长等,建立蛋白质的势能函数,并通过寻找最低自由能状态来预测蛋白质的结构。

这一方法的实现过程一般包括以下几个步骤:首先,建立蛋白质的力场函数,如AMBER、CHARMM或GROMOS。

然后,使用蒙特卡洛或分子动力学模拟方法在构象空间中搜索蛋白质的最稳定构象。

最后,根据搜索得到的构象,通过拟合分析和模板生成,预测目标蛋白质的结构。

基于机器学习的方法是近年来发展起来的一类蛋白质结构预测方法。

其基本原理是利用机器学习算法,如神经网络、支持向量机或随机森林,从大量已知蛋白质结构和序列的数据库中学习特征并预测目标蛋白质的结构。

这一方法的实现过程一般包括以下几个步骤:首先,从已知结构的蛋白质数据库中提取特征,如残基组成、二级结构和残基间距等。

蛋白质结构预测方法综述

蛋白质结构预测方法综述

蛋白质结构预测方法综述蛋白质是构成生命体的基本单元之一,它们在生命过程中扮演着重要的角色。

蛋白质的功能通常与其三维结构密切相关,因此,准确地预测蛋白质的结构对于深入理解其功能和生命过程至关重要。

本文将综述几种常见的蛋白质结构预测方法。

一、基于模板的方法基于模板的方法是指利用已知蛋白质结构作为模板,预测未知蛋白质结构的方法。

这种方法又可分为序列比对和结构比对两种。

1. 序列比对序列比对是将待预测蛋白质的氨基酸序列与已知蛋白质结构的氨基酸序列进行比对,通过寻找序列相似性来预测未知蛋白质的结构。

这种方法的关键是在序列比对时找到相较于已知蛋白质更多的同源序列。

常见的序列比对工具包括BLAST、PSI-BLAST、HMMER等。

2. 结构比对结构比对是将待预测蛋白质的氨基酸序列与已知蛋白质结构的三维结构进行比对,通过寻找结构相似性来预测未知蛋白质的结构。

这种方法的关键是在结构比对时找到相较于已知蛋白质更多的同源结构。

常见的结构比对工具包括DALI、CE、TM-align等。

二、基于物理力学的方法基于物理力学的方法是指根据蛋白质结构和物理力学原理,通过计算机模拟和数学建模来预测蛋白质的结构。

这种方法的基本思路是根据蛋白质的氨基酸序列和结构参数作为输入,通过计算机模拟和数学建模来组织蛋白质的三维结构。

常见的基于物理力学的方法包括能量函数法和蒙特卡洛法。

1. 能量函数法能量函数法是指利用能量最优化原则,将蛋白质的三维结构作为一个能量函数的最小值,通过调整结构参数来最小化能量函数,得到最优化的蛋白质结构。

常见的能量函数包括力场法、分子动力学法、蛋白质力学法等。

2. 蒙特卡洛法蒙特卡洛法是指通过数值方法,在结构空间内进行搜索,采样概率分布,得到蛋白质的稳定结构。

该方法通过调整结构参数,使得目标函数(通常是能量函数)最小,从而得到最优化的蛋白质结构。

三、神经网络方法神经网络方法是指通过深度学习算法,利用大量的蛋白质序列和结构数据,以自主学习的方式预测蛋白质的结构。

第六章蛋白质结构预测的原理与方法

第六章蛋白质结构预测的原理与方法

第六章蛋白质结构预测的原理与方法蛋白质是生物体内重要的功能分子,其结构决定了其功能和相互作用。

然而,实验测定蛋白质的结构是一项复杂且费时费力的工作。

因此,使用计算方法预测蛋白质的结构就变得尤为重要。

本文将介绍蛋白质结构预测的原理与方法。

蛋白质结构可分为四个级别:一级结构为线性的氨基酸序列,二级结构为α-螺旋、β-折叠等规则的空间构象,三级结构为蛋白质的整体立体结构,四级结构为蛋白质与其他蛋白质或分子的相互作用。

蛋白质结构预测的主要目标是预测其二级、三级和四级结构。

1.二级结构预测:二级结构预测是预测蛋白质中α-螺旋、β-折叠等规则的空间构象。

常用的预测方法有基于规则的方法和基于机器学习方法。

基于规则的方法根据氨基酸的性质和邻近氨基酸的相互作用,使用启发式规则进行预测。

基于机器学习方法使用已知蛋白质的二级结构信息作为训练集,通过特征提取和分类器构建来预测未知蛋白质的二级结构。

2.三级结构预测:三级结构预测是以目前研究最为活跃的领域之一、三级结构预测可以分为基于比较法和基于物理化学原理的方法。

基于比较法利用已知的蛋白质结构作为模板,通过比对目标蛋白质的序列和已知蛋白质的序列来预测目标蛋白质的结构。

基于物理化学原理的方法则通过计算每个氨基酸的构象和相互作用能力,使用一系列的优化算法来预测蛋白质的三级结构。

3.四级结构预测:四级结构预测是预测蛋白质与其他蛋白质或分子的相互作用。

随着蛋白质相互作用网络的不断深入研究,越来越多的方法被提出来预测蛋白质的相互作用。

这些方法包括基于结构的方法、基于序列的方法和基于结构与序列的综合方法。

蛋白质结构预测的方法有其优缺点。

基于比较法的方法可以预测高相似性的蛋白质结构,但对于低相似性的蛋白质结构预测效果较差。

基于物理化学原理的方法能够精确计算氨基酸的构象和相互作用能力,但需要大量的计算资源和时间。

机器学习方法可以较快地预测蛋白质的结构,但预测结果可能存在误差。

综上所述,蛋白质结构预测是一个复杂且具有挑战性的任务。

生物信息学中的蛋白质结构预测与分析

生物信息学中的蛋白质结构预测与分析

生物信息学中的蛋白质结构预测与分析蛋白质是生物体内的重要组分,负责多种生物功能的实现。

在生物信息学领域,蛋白质结构预测与分析是一个重要任务。

本文将介绍蛋白质结构预测与分析的基本概念、方法和应用。

蛋白质结构预测是指通过计算机模拟和理论推断等方法,预测出蛋白质的三维空间结构。

这对于了解蛋白质的功能和作用机制具有重要意义。

蛋白质的结构决定其功能,而蛋白质结构预测可以帮助科学家们理解蛋白质的功能和结构与功能之间的关系。

蛋白质结构预测的方法可以分为基于实验和基于计算两类。

基于实验的方法主要包括X射线晶体学和核磁共振等技术,可以直接确定蛋白质的原子级结构。

然而,由于实验条件的限制和技术的复杂性,直接实验法仅能获得少量蛋白质结构信息。

相比之下,基于计算的方法则更加高效、经济。

基于计算的方法主要包括序列比对、拓扑结构预测、折叠模拟等,可以提供大量的蛋白质结构预测信息。

序列比对是蛋白质结构预测的基础。

蛋白质的氨基酸序列决定了其最终的结构。

通过比对已知结构的蛋白质序列与目标蛋白质序列之间的相似性,可以预测目标蛋白质的结构。

拓扑结构预测是一种常用的方法,它利用蛋白质序列中存在的序列特征(如氨基酸窗口、氨基酸特异性突变等)来推断蛋白质的二级结构,并通过二级结构的拓扑关系来预测蛋白质的整体结构。

折叠模拟是一种较为高级的方法,通过模拟蛋白质氨基酸链的折叠过程,预测蛋白质的三维结构。

这些方法不仅可以单独应用,还可以相互结合,提高预测的准确性。

蛋白质结构预测的应用领域广泛,涵盖了生物学、医学、农业等多个领域。

在生物学研究中,蛋白质结构预测可以帮助科学家们理解蛋白质的功能和相互作用网络,探索生命的本质。

在药物研发中,蛋白质结构预测可以帮助科学家们设计更精确的药物靶点,并预测药物与靶点之间的相互作用方式。

在农业领域,蛋白质结构预测可以帮助科学家们改良作物,增加产量和抗病性。

此外,蛋白质结构预测还可以应用于食品科学、环境保护等多个领域。

生物信息学 第六章 蛋白质结构预测及分子设计

生物信息学 第六章 蛋白质结构预测及分子设计

将protein.txt蛋白质序列 粘贴在文本框中
返回结果
氨基酸数目 相对分子质量
氨基酸组成
正/负电荷残基数
原子组成
分子式 总原子数 消光系数
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine) proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125 Absorb(Prot) = E(Prot) / Molecular_weight
蛋白质跨膜区特性
▪ 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、
Ala等)组成;
▪ 亲水残基往往出现在疏水残基之间,对功能有重要的作用; ▪ 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。
跨膜蛋白序列“边界”原则
▪ 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) ▪ 胞外-内分界区:Trp(色氨酸)
半衰期
不稳定系数
<40 stable >40 unstable
脂肪系数
总平均亲水性
注意: ProtParam 没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用 户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。
蛋白质结构预测
一、跨膜区分析
跨膜区预测:膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,同时发
蛋白家族(family)
检测(2D-PAGE,质谱仪,蛋白质芯片) 研究方法 基因组测序 蛋白预言

蛋白质结构预测

蛋白质结构预测

蛋白质结构预测是生物信息学领域中的一个重要研究方向。

蛋白质是生物体内最重要的分子之一,它们存在于所有细胞和组织中,具有广泛的生物功能,包括催化反应、调节信号转导等。

因此,研究蛋白质的结构及其功能对于深入了解生物过程、疾病发生机理等方面具有重要意义。

但是,确定蛋白质的三维结构是一项复杂而费时的任务,因此,研究人员努力开发不同的方法来预测蛋白质结构。

一、的重要性是生物信息学领域中的一个热门研究方向,其重要性主要有以下几个方面:1、揭示蛋白质的结构与功能之间的关系。

蛋白质的结构与功能密切相关,结构决定了蛋白质的功能,而蛋白质功能的变化则往往伴随着其结构的变化。

因此,研究蛋白质的结构对于深入了解其功能具有重要意义。

2、解决实验求解蛋白质结构的难度。

确定蛋白质的三维结构是一项复杂而费时的任务,通常需要几个月到几年的时间才能进行。

因此,开发有效的方法可以大大缩短结构确认的时间和成本。

3、促进药物研发。

蛋白质是许多药物的靶标蛋白,因此,确定蛋白质结构可以为药物研发提供重要的信息和参考。

例如,理解药物分子与目标蛋白结合时的结构变化可以提供有关如何设计更优化的药物分子的线索。

二、的方法目前,方法主要可以分为两类,即序列比对法和物理化学模拟法。

1、序列比对法序列比对法是基于蛋白质序列的比对来预测其结构,通常采用的是蛋白质结构数据库中已知蛋白质序列的比对。

这种方法主要包括两种:同源建模和远源比对。

同源建模是将待预测的蛋白质序列与已知结构的同源蛋白质序列进行比对,并基于这些已知结构进行预测。

同源蛋白质的序列相似性越高,预测的结构准确率就越高。

远源比对是基于蛋白质成员的相关性对蛋白质序列进行比对,这些成员可能来自不同的物种并且与待预测的蛋白质序列相似度较低。

这种方法通常需要使用多序列比对工具并采用不同的算法来预测结构。

2、物理化学模拟法物理化学模拟法是基于分子动力学方法来预测蛋白质的三维结构的一种方法。

这种方法是基于蛋白质的物理和化学性质以及其内部相互作用来构建模型,并使用数学模型进行模拟。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

25
五、蛋白质结构域的折叠模式与蛋白质结构分类数据库
26
1 蛋白质结构域的折叠模式
蛋白质结构域(domain): 是蛋白质分子中介于二级结构 和三级结构之间的结构层次。在分子量较大的球形蛋白质分 子中,一条多肽链可能折叠成两个或多个空间上互相独立的 区域,称为结构域。 结构域可以按照二级结构的种类及排列方式进行分类:
可以进行二级结构在线预测两个网站为: 1.PHD算法
PredictProtein网站的地址为:
/ 2.SSPro 4.0(神经网络) /
41
• PredictProtein
三、蛋白质二级结构预测的主要方法
35
• 二级结构预测的方法大体分为三代:
第一代是基于单个氨基酸残基统计分析
• 从有限的数据集中提取各种残基形成特定二级结构的 倾向,以此作为二级结构预测的依据。
第二代预测方法是基于氨基酸片段的统计分析
• 统计的对象是氨基酸片段
• 片段的长度通常为11-21
• 片段体现了中心残基所处的环境 • 在预测中心残基的二级结构时,以残基在特定环境形 成特定二级结构的倾向作为预测依据
16
④氢键。氢键是形成蛋白质中规则二级结构的主要作用力。
⑤熵效应。
17
熵效应:是热力学的一个概念。它是指在一 个封闭的并存在能量差异的系统中,虽然系 统内总能量保持守衡,但能量却总是不可逆 转地由高能区向低能区流动,最终达到能量
的分散与平衡的一种状态和趋势。
§6.2 蛋白质结构分析
一、蛋白质结构分类 蛋白质结构依据不同的层次可以分为四类: 1)一级结构(氨基酸序列)
③反平行的β折叠形成的β发夹具有特定的结构。 α螺旋间的短连接具有特定的结构与堆积。
④当较大的环区的N端与C端靠近时就形成环。 ⑤非规则性环区也可以按照其平面性、手性及N端与C 端的相对位臵进行分类。
24 α折叠
β折叠
α/β折叠
α+β折叠
四、超二级结构 二级结构间特定的组合构成超二级结构。 1)α螺旋一般以特定的角度相堆积,使得一个螺旋的突出 部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相 嵌合。 2)β折叠片/β折叠片、α螺旋/β折叠片间的堆积有常出 现的特定模式。 β折叠片中的β折叠股以多种拓扑结构 相连接,如希腊钥匙型结构等。平行的β折叠股间的连接 (特别是βαβ单元)总是右手型的。 随着已知蛋白质结构的增加,不断有新的超二级结构 类型出现。
29
(例如丝氨酸蛋白酶)并采取相似的三维结构。
2)序列的相似性有时可低到20%以下,但三维结 构在总体上是保守的。 3)蛋白质结构的核心在序列上及三维结构上均比 表面环区更保守。 同源的蛋白质往往具有相似的三维结构;但具有 相似的三维结构的蛋白质序列不一定是同源的。
§6.3 二级结构预测
31 蛋白质二级结构预测是蛋白质结构预测的 主要组成部分之一 。
42
43
分析方法程序详解
PROFsec(默认) PROFacc(默认) 1D序列预测
是PHDsec的改进版本:基于轮廓(profile) 的神经网络算法预测蛋白质二级结构 基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
PHDhtm(默认)
ASP(默认) COILS(默认) PROFtmb ProSite(默认) SEG(默认) PredictNLS(默认) DISULFIND(默认) AGAPE PROFcon ProDom(默认) CHOP ConSeq
9
• 蛋白质结构预测问题 “序列-结构-功能 ” 三者之间的关系
….-Gly-Ala-Glu-Phe-….
FUNCTION
案例:朊病毒 又称蛋白质侵染因子。朊病毒是一类能侵染动物 并在宿主细胞内复制的小分子无免疫性疏水蛋白 质。
10
目前发现的由朊病毒引起的疾病并不多, 主要 有:人类中的库鲁病(Kuru病)、克—雅氏综合症 (CJD)、格斯特曼综合症(GSS)及致死性家族 性失眠症(FFI),动物中的水貂脑软化病,羊搔 症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵 状脑病,疯牛病。这些疾病主要是引起神经系统和 肌肉组织的损坏。
33
基本策略(1) 相似序列→相似结构
QLMGERIRARRKKLK QLMGAERIRARRKKLK
二、蛋白质二级结构预测的意义
34
蛋白质二级结构预测不仅仅可以给出二级结构信息,在 实际工作中有广泛的用途。 ① 由蛋白质二级结构统计分析得到的规则可用于全新蛋白 质设计或蛋白质突变体的设计。 ② 当序列同源性较低时,二级结构的指认有助于确定蛋白 质间结构与功能的关系。 ③ 在同源蛋白质模建中,二级结构预测有助于建立正确的 序列比对关系。 ④ 在基于二级结构片段堆积的三级结构预测中正确的二级 结构预测是第一步。 ⑤ 二级结构的预测有助于多维核磁共振中二级结构的指认 ,同时也有助于晶体结构的解析。
分子的用左右圆偏振光吸收差异谱表示的光学活性。在 160-240nm的CD光谱可以快速了解蛋白质的二级结构, 因为α螺旋,β折叠和卷曲产生不同的CD谱。
• •
X射线晶体衍射
核磁共振光谱(nuclear magnetic resonance
spectroscopy, NMR)
三、蛋白质结构预测要解决的问题
五级结构(quinternary structure):蛋白质 与蛋白质、蛋白质与核酸相互作用时的空 间位臵关系。
二、周期性的二级结构 1)α螺旋是蛋白质结构中最常见的二级结构,由于在α 螺旋内部每隔3- 4个氨基酸残基形成氢键,因而本身的
22
稳定性较好。α螺旋由于与溶剂的作用或中间有脯氨酸 等也会发生弯曲。不同的残基对于α螺旋中间部位及N端 或C端出现的倾向性不同。 2) β折叠片是由带状的β折叠股间形成氢键而构成的, 在氨基酸序列上往往是不连续的。几乎所有的β折叠片 在沿着β折叠股的方向均发生右手的扭曲,在β折叠股 间形成左手的扭曲。某些残基倾向于出现在β折叠中。
GOR(Garnier-Osguthorpe-Robson) 方 法 基 于 信息论算法,是所有统计算法中理论基础最好的。 3 最近邻居方法
在最近邻居方法( nearest neighbor method)中 新测定的序列被归类于与已知的最相近的序列具有相同 的二级结构。
38 4 神经网络方法 相对而言神经网络方法便于应用,有较高的预测
当务之急 发展快速的能够对蛋白质的折叠类型进行识别的方法。
28
3 蛋白质分类数据库
蛋白质结构分类数据库 对于蛋白质预测 具有重要的意义。
两个重要的蛋白质结构分类数据库: 1)SCOP数据库 2)CATH数据库
六、蛋白质的进化 1 )同源性的蛋白质( homologous protein)是 从一个共同的祖先进化而来的,往往具有相关的功能
39
二级结构预测方法针对不同蛋白质所给出的 准确度可能会有很大差别。 1)单序列的预测准确度在60%左右。 2)应用多重序列对比信息的二级结构预测准 确度在 65%~85%之间。
五、二级结构在线预测
40
许多蛋白质二级结构预测程序可以从因特网上免费下载 至本地计算机进行蛋白二级结构预测。另外,还可以进行在 线计算:可以通过送 Email 的方式,也可以在因特网上实时 计算。
第六章 蛋白质结构预测 的原理与方法
2
主要内容 §6.1 概述 §6.2 蛋白质结构分析 §6.3 二级结构预测 §6.4 三级结构预测
3
主要分析软件资源
ExPASy
/p念 蛋白质结构预测:指从蛋白质的氨基酸序列预测出 其三维空间结构。
– / • 可以获得功能预测、二级结构、基序、二硫键结构、结构域 等许多蛋白质序列的结构信息 • 该方法的平均准确率超过72%,最佳残基预测准确率达90% 以上。因此,被视为蛋白质二级结构预测的标准。 • 需要学术邮箱注册
PredictProtein提交界面
6
第二套遗传密码:蛋白质的氨基酸序列与其三维空 间结构间的关系。
蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有 生物活性的三维空间结构。
7
序列模体(motif):通常指蛋白质序列中相邻或相 近的一组具有保守性的残基(或称基序),它与蛋 白质分子及其家族的功能有关。
二、蛋白质结构数据的获得
8

圆二色性(circular dichroism, CD),描绘了不对称
19
2)二级结构(规则结构,如a螺旋、 折叠)
3)三级结构(简单蛋白质的三维空间结构,或复 杂蛋白质亚基的三维空间结构) 4)四级结构(亚基的组装)
一级结构
20
….-Gly-Ala-Glu-Phe-….
二级结构
三级结构
四级结构
21
四级结构(quaternary structure):由多个亚 基组成的蛋白质分子的空间结构。
准确度。最大的缺点是没有明确的物理化学意义。 其
中PHD方法 是广泛应用的预测方法。 5 基于多重序列比对的二级结构预测
基于单个序列的二级结构预测方法的预测准确
度相对较低,大约在 58%左右。而基于多重序列比 对的二级结构预测方法 PSI-PRED 的预测准确度可达 到77%。
四、二级结构预测的准确度
蛋白质 序列: 二级结构:
一、蛋白质二级结构预测概述
32
• 蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二级 结构的倾向。 • 二级结构预测问题是模式分类问题
• 二级结构预测的目标:
• 判断每一段中心的残基是否处于螺旋、折叠、 转角(或其它状态)之一的二级结构态,即三态。
11
β折叠,正 常3% 致病43%
12
致病机理
1982年普鲁辛纳提出了朊病毒致病的“蛋白质构象致 病假说”,以后魏斯曼等人对其逐步完善。其要点如 下:①朊病毒蛋白有两种构象:细胞型(正常型PrPc )和瘙痒型(致病型PrPsc)。两者的主要区别在于其 空间构象上的差异。PrPc仅存在a螺旋,而PrPsc有多 个β折叠存在,后者溶解度低,且抗蛋白酶解;② Prpsc可胁迫PrPc转化为PrPsc,实现自我复制,并产 生病理效应;③基因突变可导致细胞型PrPsc中的α螺 旋结构不稳定,至一定量时产生自发性转化,β片层 增加,最终变为PrPsc型,并通过多米诺效应倍增致病 。
相关文档
最新文档