生物信息学原理与方法第九讲 蛋白质序列分析与预测

合集下载

生物信息学讲义 第九章 蛋白质序列分析与结构预测

生物信息学讲义 第九章 蛋白质序列分析与结构预测

第九章 蛋白质序列分析与结构预测一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基酸序列。

虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能具有相应的活性和相应的生物学功能。

了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。

确定蛋白质的结构对于生物学研究是非常重要的。

目前,蛋白质序列数据库的数据积累的速度非常快,但是,已知结构的蛋白质相对比较少。

尽管蛋白质结构测定技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高。

因此,实验测定的蛋白质结构比已知的蛋白质序列要少得多。

另一方面,随着DNA测序技术的发展,人类基因组及更多的模式生物基因组已经或将要被完全测序,DNA序列数量将会急增,而由于DNA序列分析技术和基因识别方法的进步,我们可以从DNA推导出大量的蛋白质序列。

这意味着已知序列的蛋白质数量和已测定结构的蛋白质数量(如蛋白质结构数据库PDB中的数据)的差距将会越来越大。

人们希望产生蛋白质结构的速度能够跟上产生蛋白质序列的速度,或者减小两者的差距。

那么如何缩小这种差距呢?我们不能完全依赖现有的结构测定技术,需要发展理论分析方法,这对蛋白质结构预测提出了极大的挑战。

20世纪60年代后期,Anfinsen首先发现去折叠蛋白或者说变性(denatured)蛋白质在允许重新折叠的实验条件下可以重新折叠到原来的结构,这种天然结构(native structure)对于蛋白质行使生物功能具有重要作用,大多数蛋白质只有在折叠成其天然结构的时候才能具有完全的生物活性。

自从Anfinsen提出蛋白质折叠的信息隐含在蛋白质的一级结构中,科学家们对蛋白质结构的预测进行了大量的研究,分子生物学家将有可能直接运用适当的算法,从氨基酸序列出发,预测蛋白质的结构。

本章主要着重介绍蛋白质二级结构及空间结构预测的方法。

生物信息学中的蛋白质序列分析与预测研究

生物信息学中的蛋白质序列分析与预测研究

生物信息学中的蛋白质序列分析与预测研究蛋白质是生命体中至关重要的分子,它们在细胞功能和结构的调控中发挥着重要的作用。

蛋白质的序列决定了其结构和功能,因此蛋白质序列的分析和预测成为生物信息学研究的重要方向之一。

本文将重点介绍蛋白质序列分析和预测的方法与技术,以及在生物学研究中的应用。

蛋白质序列的分析是指根据蛋白质的氨基酸序列,通过一系列的计算和分析方法,对其结构和功能进行研究的过程。

蛋白质序列分析的方法有很多,其中最常用的包括:比对分析、同源建模、序列特征分析和亚细胞定位预测。

首先,比对分析是蛋白质序列分析的基础方法之一。

通过将待分析的蛋白质序列与已知的蛋白质序列数据库进行比对,可以找到与之相似的序列,进而推测蛋白质的结构和功能。

比对分析常用的工具有BLAST和PSI-BLAST等,它们通过比较序列之间的相似性和一致性,确定序列的保守区域和结构域,从而揭示蛋白质的功能。

其次,同源建模是一种根据已知蛋白质的结构来预测未知蛋白质的结构的方法。

在同源建模中,通过比对已知蛋白质的结构与待预测蛋白质的序列,找到与之相似的蛋白质结构作为模板,并利用模板的结构信息,预测待预测蛋白质的结构。

同源建模的常用工具有SWISS-MODEL和Phyre2等。

同源建模不仅可以预测蛋白质的三维结构,还可以提供结构功能的启示,从而推测其功能。

另外,序列特征分析也是蛋白质序列分析的重要方向之一。

序列特征分析通过对蛋白质序列中的特定模式、保守区域和功能位点进行分析,揭示蛋白质的结构和功能。

常用的序列特征分析方法包括信号肽预测、跨膜区域识别、功能位点预测和蛋白质域识别等。

这些方法通过分析蛋白质序列中的特定特征,揭示蛋白质的功能和结构。

最后,亚细胞定位预测是蛋白质序列分析的一个重要方向。

蛋白质在细胞中的定位决定了其在细胞内发挥的功能,因此准确预测蛋白质的亚细胞定位对于理解其功能至关重要。

亚细胞定位预测通过分析蛋白质序列中的亚细胞定位信号和保守区域,预测蛋白质的亚细胞定位位置。

生物信息学中的蛋白质序列预测问题研究

生物信息学中的蛋白质序列预测问题研究

生物信息学中的蛋白质序列预测问题研究生物信息学是一个涉及多个学科领域的交叉学科,它主要以生物学为基础,借助计算机科学、统计学等多个学科的相关知识,进行生命科学研究。

其应用广泛,尤其是在基因组学、蛋白质组学和代谢组学等领域,生物信息学发挥着无法替代的作用。

生物信息学中,蛋白质序列预测问题是一个重要且常见的研究课题。

在蛋白质组学中,通过预测蛋白质功能、结构和相互作用等方面,可以更好地理解蛋白质的生物学特性和机制,进而为药物研发、疾病治疗等领域提供重要参考。

蛋白质序列预测问题包括蛋白质序列分类、结构预测、功能预测等方面。

其中,蛋白质序列分类是预测蛋白质的种类,主要通过分析蛋白质序列特征和相似性进行分类。

蛋白质结构预测是预测蛋白质的三维结构,目前主要应用模型建立和模拟等方法进行预测。

蛋白质功能预测是预测蛋白质的生物学功能,包括酶活性、配体结合、信号传导等方面)蛋白质序列预测问题的研究成果主要基于大量蛋白质序列数据的分析和模型算法的优化。

同时,蛋白质序列预测问题也面临着如数据质量、样本数量、算法精度等多个方面的挑战。

下面,本文将分别对蛋白质序列分类、结构预测和功能预测问题的研究进展进行探讨。

一、蛋白质序列分类蛋白质序列分类是生物信息学中的一项基本任务。

它不仅涉及到蛋白质的分类,也关系到蛋白质序列之间的相似性分析,对于研究蛋白质在生物体中功能和调控的起源和演化以及药物研发和基因功能注释等都具有重要意义。

目前,基于膜蛋白、酶、信号蛋白、转录因子等多种类型的蛋白质,各种分类器模型和算法方法不断涌现。

常用的分类器包括向量机、决策树、随机森林和神经网络等。

这些模型的重要性在于能通过学习其训练样本,识别新的蛋白质序列的类别属性。

这些分类器的性能不仅取决于分类器的本身结构,也与该分类器所用训练数据样本、特征选择、以及数据预处理等方面的具体情况有关。

二、蛋白质结构预测蛋白质结构预测是生物信息学中的一个重要课题。

它能够通过模拟或预测蛋白质的三维空间结构,从而进一步探讨蛋白质的构成、功能以及作用机制等生物学问题。

蛋白质序列分析与结构预测

蛋白质序列分析与结构预测

蛋白质序列分析与结构预测概述:蛋白质是生物体内重要的功能分子,其结构与功能密切相关。

蛋白质序列分析和结构预测是在理解蛋白质结构和功能的基础上,对蛋白质进行更深入研究的重要工具。

本文将对蛋白质序列分析和结构预测进行详细介绍。

一、蛋白质序列分析1.1序列比对1.2序列标记蛋白质序列标记是根据其中一种特定的准则来标记氨基酸序列的功能或结构信息。

常用的标记方法有结构标记和功能标记。

结构标记根据氨基酸的二级结构特征来进行,如α-螺旋、β-折叠等;功能标记则是根据氨基酸序列所具有的特定功能进行,如酶活性、配体结合等。

1.3序列定位蛋白质序列定位是指确定蛋白质序列中特定区域的位置和范围。

常用的序列定位方法有Motif分析和Domain分析。

Motif分析可以识别蛋白质序列中的保守序列模式,从而找出具有特定功能的序列片段;Domain 分析可以识别蛋白质中具有自稳定结构和特定功能的结构域。

1.4序列功能预测二、蛋白质结构预测蛋白质结构预测是根据蛋白质的氨基酸序列预测蛋白质的三维结构。

蛋白质的结构决定了其功能和相互作用,因此准确预测蛋白质的结构对于理解蛋白质的功能和机制至关重要。

蛋白质结构预测的主要方法包括基于模板的建模方法和基于物理性质的全原子或粗粒化力场模拟方法。

2.1基于模板的建模方法基于模板的建模方法是利用已知的蛋白质结构作为模板,通过序列比对和结构比对来模拟未知蛋白质的结构。

常用的基于模板的建模方法有比对、模型构建和模型评估等。

2.2基于物理性质的模拟方法基于物理性质的模拟方法是使用物理原理和力场模拟来预测蛋白质的结构。

常用的模拟方法有分子力学模拟、蒙特卡洛模拟和蛋白质力场等。

结论:蛋白质序列分析和结构预测是对蛋白质进行深入研究的重要工具。

通过蛋白质序列分析可以了解蛋白质的进化关系、功能特征和结构信息;而蛋白质结构预测可以揭示蛋白质的三维结构,从而理解其功能和相互作用。

随着技术的不断发展,蛋白质序列分析和结构预测方法也在不断改进和完善,为研究蛋白质的机制和功能提供了更有力的工具。

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测蛋白质是生物体内的重要分子,它们在维持生命活动中起着至关重要的作用。

了解蛋白质的结构和功能对于深入理解生物学过程、疾病发展以及药物设计具有重要意义。

然而,实验测定蛋白质的结构及其功能是一项耗时费力且成本高昂的工作。

为了解决这一问题,生物信息学中的蛋白质结构与功能预测成为一种有效的方法。

蛋白质结构预测是生物信息学中的重要研究领域之一。

根据蛋白质的氨基酸序列,结合生物化学、物理化学以及计算机科学的方法,可以建立一系列模型和算法,预测蛋白质的三维结构。

蛋白质的结构是决定其功能的基础,通过结构预测可以揭示蛋白质的功能和相互作用,为后续进一步的研究提供指导。

在蛋白质结构预测中,常用的方法有同源建模、折叠动力学模拟和密度泛函理论等。

同源建模是基于已知蛋白质结构和与待预测蛋白质具有较高相似性的蛋白质序列进行模拟和比对,从而预测待预测蛋白质的结构。

折叠动力学模拟则模拟蛋白质在空间中折叠成稳定结构的过程,通过分子力学和数值计算方法,获得预测蛋白质结构的可能构型。

而密度泛函理论则是利用量子力学的计算方法,建立不同蛋白质结构和功能之间的关联,实现蛋白质结构预测和功能预测的目的。

除了蛋白质结构预测,生物信息学中的蛋白质功能预测也是一个重要领域。

蛋白质功能是指蛋白质在生物体内扮演的具体角色,如催化反应、运输分子以及信号传导等。

通过分析蛋白质的序列、结构、水平和进化等特征,可以预测蛋白质的功能。

常见的蛋白质功能预测方法包括序列比对、结构域分析和机器学习等。

序列比对是常用的蛋白质功能预测方法之一,它通过比对待预测蛋白质序列与已知功能蛋白质序列的相似性,推断待预测蛋白质的功能。

对于已知功能蛋白质序列,可以通过蛋白质数据库的检索和分析来获取。

结构域分析则是基于蛋白质中的功能结构域来预测其功能。

功能结构域是指蛋白质中识别和结合特定物质的功能区域,可以通过各种软件工具进行识别和注释。

机器学习是一种颇有潜力的蛋白质功能预测方法,它借助计算机算法和统计模型,通过对已知功能蛋白质的训练,预测待预测蛋白质的功能。

生物信息学中的蛋白质结构预测与分析方法研究

生物信息学中的蛋白质结构预测与分析方法研究

生物信息学中的蛋白质结构预测与分析方法研究生物信息学是将计算机科学、数学和生物学相结合的交叉学科,旨在利用计算机技术和算法来解决生物学中的问题。

在生物信息学领域中,蛋白质结构预测与分析一直是研究的热点之一。

蛋白质是生物体内执行生化功能的重要分子,其结构对其功能起着至关重要的作用。

因此,对蛋白质结构的预测和分析不仅有助于理解蛋白质的功能机制,还有助于药物设计和疾病治疗。

蛋白质结构预测方法主要分为多种:比对法、建模法和模拟法。

比对法是根据已知的结构相似蛋白质来预测目标蛋白质的结构,其中最常用的是同源建模方法。

同源建模方法通过寻找已知结构与目标蛋白质相似度高的结构模板,然后将模板结构与目标蛋白质序列进行比对,从而推断目标蛋白质的结构。

建模法是通过数学建模和计算方法来预测蛋白质的结构,其中较为常用的方法是蛋白质折叠模型和蒙特卡洛模拟法。

模拟法则是通过分子动力学模拟来模拟蛋白质的结构和动力学过程,从而预测蛋白质的结构。

在蛋白质结构分析方面,一些常用的方法包括结构比较、功能预测和网络分析。

结构比较是通过比较不同蛋白质的结构来揭示它们之间的相似性和差异性,从而探索其功能和进化关系。

功能预测则是根据已知结构和功能蛋白质的特征,来推断目标蛋白质的功能。

网络分析是通过建立蛋白质相互作用网络,来研究蛋白质在细胞内的相互作用关系和信号传递机制。

近年来,随着计算能力的不断提高和生物信息学算法的日益完善,蛋白质结构预测与分析方法也取得了长足的进步。

例如,深度学习技术在蛋白质结构预测中的应用不断扩大,通过训练大规模的数据集,可以有效地提高预测的准确性和可靠性。

另外,结合多种方法进行融合预测,如比对法和建模法的结合,也可以提高结构预测的准确性。

总的来说,蛋白质结构预测与分析方法的研究在生物信息学领域扮演着重要的角色,它不仅促进了对蛋白质功能的理解,还为药物设计和疾病治疗提供了有力的支持。

未来随着生物信息学技术的不断发展和创新,我们相信蛋白质结构预测与分析方法将会取得更大的突破,为生命科学领域的发展带来更多的可能性。

基于生物信息学的蛋白质序列分析与结构预测技术研究

基于生物信息学的蛋白质序列分析与结构预测技术研究

基于生物信息学的蛋白质序列分析与结构预测技术研究蛋白质是生物体内极为重要的分子,它们在细胞内担任着各种生物学功能,如催化化学反应、传递信号和支持细胞结构等。

蛋白质的结构对其功能至关重要,因此研究蛋白质序列分析与结构预测技术对于理解蛋白质功能和开发药物具有重要意义。

在现代生物学中,基于生物信息学的方法已成为研究蛋白质的重要工具。

生物信息学是将计算机科学、数学和统计学等方法应用于生物学研究的交叉学科。

在蛋白质序列分析与结构预测技术中,生物信息学起到了关键的作用。

通过分析蛋白质的序列,我们可以获得对蛋白质功能和结构的一些初步信息。

而结构预测技术则致力于根据蛋白质的序列信息,预测或推测蛋白质的三维结构。

下面,我们将详细介绍基于生物信息学的蛋白质序列分析和结构预测技术的研究进展。

蛋白质序列分析是了解蛋白质性质和功能的基础。

最直接的方法是使用蛋白质序列比对工具,比如BLAST和PSI-BLAST等,通过比对已知蛋白质序列数据库,从相似序列中寻找可能的蛋白质功能。

此外,序列保守性分析也可以揭示蛋白质功能区域和结构域。

这些分析可以帮助我们理解蛋白质序列上的特征以及与其他蛋白之间的关系。

蛋白质结构预测是一项具有挑战性的任务。

鉴于实验方法预测的成本高昂且耗时,利用生物信息学工具进行蛋白质结构预测成为了研究的重点。

生物信息学方法根据蛋白质序列和已知结构的相似性,利用分类、回归、聚类等机器学习算法来推测蛋白质的结构。

其中,蛋白质折叠分类方法将蛋白质分为不同的折叠类别,根据已知的蛋白质结构和折叠规律,预测蛋白质的折叠类型。

而蛋白质结构拟合方法则通过优化算法将蛋白质的结构与已知结构进行比对,从中选择最佳拟合模型。

除了这些常规方法,还出现了一些基于人工智能的蛋白质结构预测方法。

近年来,深度学习技术的发展使得利用神经网络进行蛋白质结构预测成为可能。

通过构建适用于蛋白质结构的深度学习模型,利用大规模蛋白质数据集进行训练,我们可以预测具有更高准确性和精度的蛋白质结构。

生物信息学中的蛋白质结构预测与分析

生物信息学中的蛋白质结构预测与分析

生物信息学中的蛋白质结构预测与分析蛋白质是生物体内的重要组分,负责多种生物功能的实现。

在生物信息学领域,蛋白质结构预测与分析是一个重要任务。

本文将介绍蛋白质结构预测与分析的基本概念、方法和应用。

蛋白质结构预测是指通过计算机模拟和理论推断等方法,预测出蛋白质的三维空间结构。

这对于了解蛋白质的功能和作用机制具有重要意义。

蛋白质的结构决定其功能,而蛋白质结构预测可以帮助科学家们理解蛋白质的功能和结构与功能之间的关系。

蛋白质结构预测的方法可以分为基于实验和基于计算两类。

基于实验的方法主要包括X射线晶体学和核磁共振等技术,可以直接确定蛋白质的原子级结构。

然而,由于实验条件的限制和技术的复杂性,直接实验法仅能获得少量蛋白质结构信息。

相比之下,基于计算的方法则更加高效、经济。

基于计算的方法主要包括序列比对、拓扑结构预测、折叠模拟等,可以提供大量的蛋白质结构预测信息。

序列比对是蛋白质结构预测的基础。

蛋白质的氨基酸序列决定了其最终的结构。

通过比对已知结构的蛋白质序列与目标蛋白质序列之间的相似性,可以预测目标蛋白质的结构。

拓扑结构预测是一种常用的方法,它利用蛋白质序列中存在的序列特征(如氨基酸窗口、氨基酸特异性突变等)来推断蛋白质的二级结构,并通过二级结构的拓扑关系来预测蛋白质的整体结构。

折叠模拟是一种较为高级的方法,通过模拟蛋白质氨基酸链的折叠过程,预测蛋白质的三维结构。

这些方法不仅可以单独应用,还可以相互结合,提高预测的准确性。

蛋白质结构预测的应用领域广泛,涵盖了生物学、医学、农业等多个领域。

在生物学研究中,蛋白质结构预测可以帮助科学家们理解蛋白质的功能和相互作用网络,探索生命的本质。

在药物研发中,蛋白质结构预测可以帮助科学家们设计更精确的药物靶点,并预测药物与靶点之间的相互作用方式。

在农业领域,蛋白质结构预测可以帮助科学家们改良作物,增加产量和抗病性。

此外,蛋白质结构预测还可以应用于食品科学、环境保护等多个领域。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8. Secondary structure prediction 二级结构预测
8-1 AGADIR – 预测肽链螺旋结构算法。 8-2 APSSP –高级蛋白质二级结构预测服务器。 8-3 GOR – Garnier1996年开发的蛋白质二级结构预测。 8-4 HNN – 神经网络方法预测蛋白质二级结构。 8-5 Jpred –趋同法预测蛋白质二级结构。 8-6 JUFO –神经网络法从序列预测蛋白质二级结构。 8-7 nnPredict -蛋白质二级结构预测。 8-8 PredictProtein -蛋白质二级结构预测。 8-9 Prof –利用Cascaded Multiple Classifiers进行蛋白质
2-3Graphical Codon Usage Analyser –以图形方式显 示密码子偏向性
2-4BCM search launcher – 以六种框架翻译DNA序 列
2-5Backtranslation – 将蛋白质序列翻译成DNA序列
2-6Genewise – 比较蛋白质序列与基因组的DNA序 列,允许内含子和读框错误
二级结构预测。 8-10PSA -蛋白质二级结构预测。 8-11SOPMA -蛋白质二级结构预测。 8-12SSpro –利用双向重复神经网络预测蛋白质二级结构。
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列

2-1Translate - 将DNA序列翻译成蛋白质序列。 2-2Transeq – 使用EMBOSS 软件包将DNA序列翻译 成蛋白质序列。
7-112ZIP -亮氨酸拉链的预测。 7-12PESTfind –PEST区域的预测。 7-13HLA_Bind –预测MHC type I (HLA) peptide binding。 7-14SYFPEITHI -预测MHC type I and II peptide binding。 7-15ProtScale –氨基酸比例图(疏水性及其相关参数等) 7-16Drawhca –蛋白质序列疏水性聚类分析HCA (Hydrophobic
6.Topology prediction 空间结构预测 7.Primary structure analysis 一级结构分析 8. Secondary structure prediction 二级结构预测 9.Tertiary structure 三级结构预测 10. Sequence alignment 序列比对(已讲) 11. Biological text analysis 生物学文本分析(不讲)
1-4 PeptIdent –以肽指纹数据识别蛋白质、等电点、实验测定的分子量、 以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提 供数据库的注释。
1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并检出与所给等 电点和分子量最接近的蛋白质序列列表。
1-6 FindMod –预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被取 代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用户 输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。
6.Topology prediction 空间结构预测
6-1PSORT – 预测蛋白质次细胞的位置。 6-2TargetP -预测蛋白质次细胞的位置。 6-3DAS -利用Dense Alignment Surface法预测原核
生物的跨膜区。
6-4HMMTOP -预测蛋白质的跨膜螺旋及空间结构。 6-5PredictProtein -预测蛋白质的跨膜螺旋及空间
3-1 BLAST 3-2 Bic ultra -Smith/Waterman序列搜索 3-3MPsrch - EBI的Smith/Waterman序列比对。 3-4DeCypher – Smith/Waterman序列搜索 3-5Fasta3 – EBI的FASTA version 3 3-6FDF - Smith/Waterman序列搜索 3-7PropSearch –使用氨基酸组成来进行结构同源搜索。
2-7FSED – 读框错误检测
2-8LabOnWeb -使用Compugen LEADS clusters延伸 EST、表达模式及ESTs序列分析。
2-9List of gene identification software sites 列出基
3.Similarity searches 相似搜索
7-1ProtParam -蛋白质序列的物化性质分析(氨基酸、原子组 成、等电点….等)
7-2Compute pI/Mw -以Swiss-Prot或TrEMBL条目或用户的序 列计算理论的等电点和分子量。
7-3MW, pI, Titration curve –计算等电点及组成并可见其滴 定曲线图。
1.Protein identification and characterization 蛋白质识别与特证描述
1-1 AACompIdent - 以氨基酸组织识别蛋白质
1-2 AACompSim -比较Swiss-Port条目与其他条目的差异
1-3 MultiIdent -以等电点、分子量、氨基酸组成、序列特征及肽指纹数 据识别蛋白质。
DNA序列搜索。 4-5 Pfam HMM search-在Washington University及Sanger Centre对Pfam数据库
进行搜索。
4-6 FingerPRINTScan - 对PRINTS 数据库进行蛋白质指纹搜索。 4-7 FPAT - 蛋白质数据库中的表达搜索。 4-8 PRATT - EBI 及ExPASy的识别蛋白质保守模式 4-9 PPSEARCH - EBI的对PROSITE进行序列搜索。 4-10 PROSITE scan – PBIL的对PROSITE进行序列搜索。 4-11 PATTINPROT - 在PBIL搜索一段蛋白质序列或蛋白质数据库中的模式。 4-12 SMART – EMBL的简单分子结构研究工具。 4-13 TEIRESIAS - IBM的从不匹配的(unaligned)蛋白质或DNA序列生成蛋白
7-4REP –搜索蛋白质重复片段。 7-5REPRO –检测蛋白质序列的重复片段。 7-6 Radar -检测蛋白质序列的重复片段。 7-7SAPS –蛋白质序列的统计学分析。 7-8Coils –蛋白质的卷曲预测。 7-9Paircoil –蛋白质两级卷曲螺旋预测。 7-10Multicoil –蛋白质两级或三级卷曲螺旋预测。
结构。
6-6SOSUI -预测跨膜区。 6-7TMAP – 基于多序列比对的跨膜区预测。 6-8TMHMM -预测蛋白质的跨膜螺旋。 6-9TMpred -预测蛋白质的跨膜区及蛋白质方向。 6-10TopPred 2 -膜蛋白的空间结构预测。
7.Primary structure analysis 一级结构分析
1-15PepSea -由Protana, Denmark提供的从肽质谱和肽序列识别 蛋白质。
1-16PeptideSearch -由EMBL Heidelberg提供的肽质谱识别工具。
1-17ProteinProspector -由UCSF提供的多种质谱分析工具。
1-18PROWL -由Rockefeller和NY Universities提供蛋白质化学性 质及质谱仪资源。
质模式。
4-14 Hits – 蛋白质序列与motifs的关系。
5.Post-translational modification prediction 翻译后修饰预测
5-1 ChloroP - 叶绿体转换肽的预测。 5-2 LipoP - Gram阴性细菌脂蛋白质和信号肽的预测 5-3 MITOPROT – 预测线粒体的目标序列。 5-4 PATS –预测apicoplast的目标序列 5-5 PlasMit- 预测Plasmodium falciparum的线粒体转换肽 5-6 Predotar –预测线粒体和质体的目标序列 5-7 PTS1 –预测peroxisomal targeting signal 1 containing proteins 5-8 SignalP – 预测信号肽剪工切位点。 5-9 NetOGlyc – 预测哺乳动物粘蛋白的糖化位点。 5-10NetNGlyc – 预测人类N型蛋白质糖化位点。 5-11DictyOGlyc – 预测粘菌O型蛋白质糖化位点。 5-12YinOYang - 真核生物蛋白质序列的O-beta-GlcNAc的粘附位点。 5-13big-PI Predictor -预测GPI的修饰位点 5-14DGPI - 预测GPI的锚合点和剪刀切位点(鏡像站)。 5-15NetPhos - 预测真核生物蛋白质上Ser, Thr 及 Tyr phosphorylation位点。 5-16NetPicoRNA - 预测picornaviral proteins上蛋白质剪切位点。 5-17NMT –预测N-terminal N-myristoylation 5-18Sulfinator – 预测酪胺酸硫化位置。 5-19 SUMOplot – 预测SUMO蛋白质附着位置。
1-7 GlycoMod -以实验测定的质谱预测蛋白质可能出现的寡多醣结构。
1-8 GlycanMass - 以寡多醣结构预测其质谱。
1-9FindPept -由实验质谱识别蛋白质中的肽,并考虑到人工化学修饰、 翻译后修饰以及蛋白酶自体溶解等因素。
1-10PeptideMass-以Swiss-Prot 、TrEMBL 条目或用户提供的序列來预测其 肽质谱及翻译后修饰。
Cluster Analysis)点阵图 7-17Protein Colourer –给氨基酸序列着色工具 7-18Three To One –将三码的氨基酸序列转换成一码氨基酸序
相关文档
最新文档