基于静态网络的蛋白质复合物预测方法综述

合集下载

蛋白质结构预测方法与意义

蛋白质结构预测方法与意义

蛋白质结构预测方法与意义蛋白质是生物体中重要的大分子有机化合物,扮演着多种关键的生物功能角色。

然而,蛋白质的功能往往与其特定的三维结构密切相关。

因此,了解和预测蛋白质的三维结构对于理解其功能以及开发新药物等方面具有重要意义。

然而,实验方法通常是耗时且成本高昂的。

在此情况下,蛋白质结构预测方法的研究和应用变得至关重要。

本文将探讨几种常用的蛋白质结构预测方法,并讨论其意义和局限性。

1. 基于序列相似性的结构预测方法基于序列相似性的结构预测方法是最常见和最简单的方法之一。

这种方法的基本思想是假设具有相似氨基酸序列的蛋白质可能具有相似的结构。

通过在已知结构中找到与待预测蛋白质序列相似的蛋白质,可以借用已知结构来预测待测蛋白质的结构。

然而,这种方法的局限性在于它依赖于已知结构的蛋白质,并且无法预测新颖或没有相似结构的蛋白质。

2. 基于模板的结构预测方法基于模板的结构预测方法是一种更高级的预测方法。

它利用已知结构的蛋白质作为模板,通过比对待测蛋白质序列与已知结构的蛋白质序列的相似性,将预测蛋白质的结构与模板进行比对。

这种方法通常适用于具有相似序列的蛋白质,但对于无相似序列的蛋白质仍存在一定的局限性。

此外,模板的选择也是一个关键的环节,对于不同的蛋白质可能需要不同的模板选择策略。

3. 基于物理原理的结构预测方法基于物理原理的结构预测方法是相对较新的方法之一,它试图通过物理原理来理解蛋白质的折叠过程。

这些方法通常基于蛋白质的物理性质,如氨基酸的相互作用力场以及蛋白质内部的能量最优化原理。

此类方法通常将蛋白质折叠问题建模成一个优化问题,通过搜索最优解来预测蛋白质的结构。

然而,由于蛋白质折叠是一个复杂的过程,目前基于物理原理的结构预测方法还存在一定的局限性。

蛋白质结构预测方法的意义在于提供了一种高效和经济的方法来预测蛋白质的结构。

相比于实验方法,结构预测方法具有更快的速度和更低的成本。

这些方法可以在很短的时间内为科学家和医药研发人员提供关键信息,从而加速研究进展和新药物开发。

蛋白质定位预测方法综述及比较分析

蛋白质定位预测方法综述及比较分析

蛋白质定位预测方法综述及比较分析引言:蛋白质是细胞中最重要的生物大分子之一,其功能与其所处的亚细胞定位密切相关。

准确预测蛋白质定位是理解蛋白质功能的重要一环。

随着计算机科学和生物学的快速发展,越来越多的蛋白质定位预测方法被提出。

本文将对常见的蛋白质定位预测方法进行综述和比较分析,以期为进一步研究提供参考。

一、蛋白质定位预测的重要性蛋白质在细胞内发挥特定的功能,其定位信息对于理解和研究蛋白质功能至关重要。

准确预测蛋白质的定位可以为进一步研究蛋白质的功能和相互作用提供指导。

二、蛋白质定位预测方法的分类1. 基于氨基酸序列的方法这种方法根据蛋白质的氨基酸序列进行预测。

其中,物化性质(如蛋白质溶解性、亲水性等)、序列模式(如信号肽、跨膜蛋白等)及机器学习算法(如隐马尔科夫模型、支持向量机等)是常用的预测依据。

2. 基于蛋白质相似性的方法这种方法通过比对已知定位的蛋白质序列和待预测的蛋白质序列的相似性来预测其定位。

常用的方法有同源比对、核酸水平的序列相似性等。

3. 基于蛋白质结构的方法这种方法通过预测蛋白质的三维结构来预测其定位。

常见的方法有蛋白质结构模拟、蛋白质结构域预测等。

三、常见蛋白质定位预测方法的综述与分析1. 密集神经网络(DNN)方法DNN方法利用神经网络模型和大量的训练数据来预测蛋白质的定位。

该方法具有较高的准确性和可靠性,但需要大量的训练数据和计算资源。

2. 支持向量机(SVM)方法SVM方法利用训练集中已知定位的蛋白质特征,建立分类模型来预测待测蛋白质的定位。

该方法较为简单,但需要手动提取特征。

3. 隐马尔科夫模型(HMM)方法HMM方法通过使用隐马尔科夫模型对序列数据进行建模,预测蛋白质的定位。

该方法能够捕捉到序列中的潜在模式,但对训练数据的依赖较大。

四、基于机器学习的蛋白质定位预测方法比较分析1. 准确性比较DNN方法在大规模训练数据和计算资源的支持下,具有较高的准确性。

SVM方法相对简单,准确性较低。

蛋白质二级结构预测的算法及应用

蛋白质二级结构预测的算法及应用

蛋白质二级结构预测的算法及应用蛋白质是生命体中不可或缺的物质之一,在细胞代谢和生物学活动中起着重要的作用。

而蛋白质的功能则与其二级结构密切相关。

因此,蛋白质二级结构预测对于研究蛋白质的功能和结构起着至关重要的作用。

蛋白质的二级结构指的是蛋白质中的肽链段呈现出的α-螺旋、β-折叠、无规卷曲等几种形式。

因为蛋白质的功能和三维结构都与其二级结构密切相关,因此,预测蛋白质的二级结构成为了许多生物医学研究的重要环节。

蛋白质二级结构预测的算法和方法非常多。

其中,最常用的包括基于知识库的方法、机器学习方法和基于进化的方法等。

本文将详细介绍这几种算法和方法,并分析它们的优缺点。

1. 基于知识库的方法基于知识库的方法属于一种基础算法,它以早已知道的信息为基础,例如氨基酸序列和二级结构库等。

基于知识库的方法通过分析早期的实验数据,并将其存储在数据库中,构建起经验知识体系。

当遇到一个新的蛋白质时,这个方法将使用经验库中的信息来预测其二级结构。

使用经验知识体系的这种方法通常被认为具有较高的准确性。

但是,这种方法的的主要限制因素在于其仅限于基于库中以前存储的蛋白质的二级结构信息,因此无法挖掘数据潜力,或对尚未分类的样本进行预测。

2. 机器学习方法机器学习方法属于一种新型的蛋白质二级结构预测算法。

与基于经验库的方法不同,机器学习方法不依赖于早期的实验数据,并且可以执行高维度的数据挖掘,学习来自大量较新蛋白质样本的知识,并使用这些知识来构建蛋白质二级结构预测模型。

机器学习方法主要有基于神经网络的方法、支持向量机(SVM)等。

这些算法或模型的核心是:当接受样本时,利用已经被训练好的模型,输入相应的数据并预测出其二级结构。

相对而言,机器学习方法的预测精度更高,尤其是对于尚未分类的样本或者非基于库中已有数据的样本。

3. 基于进化的方法基于进化的方法,也称演化树方法,主要是通过利用氨基酸序列间的相互关系,来分析其可能的二级结构,其预测模型基于多序列比对的对齐方法。

蛋白质相互作用的预测方法

蛋白质相互作用的预测方法

蛋白质相互作用的预测方法全文共四篇示例,供读者参考第一篇示例:蛋白质相互作用是生物体内细胞信号传递以及代谢调控的核心机制之一。

研究蛋白质相互作用对于理解生命活动的规律以及疾病的发生发展具有重要意义。

在过去的几十年里,科学家们提出了许多方法来预测蛋白质相互作用,其中包括生物物理学方法、生物信息学方法以及机器学习方法等。

在生物物理学方法中,双杂交技术是最常用的方法之一。

这是一种通过将感兴趣的两个蛋白质分子分别与酵母细胞的DNA结合,来判断它们是否有相互作用的技术。

双杂交技术可以大规模地筛选出潜在的蛋白质相互作用,但是其结果需要后续的验证。

生物信息学方法主要利用蛋白质的序列信息以及结构信息来预测蛋白质相互作用。

基于同源结构的方法通过比对蛋白质序列及结构来发现具有相似结构的蛋白质,从而提前推测它们可能具有相似的功能与相互作用关系。

还有一些基于蛋白质结构的模拟方法,如分子对接技术,通过计算两个蛋白质的结构与相互作用方式,来预测它们之间的相互作用模式。

近年来,随着人工智能技术的发展,机器学习方法在蛋白质相互作用预测领域也取得了一定的进展。

机器学习方法通过训练大量的蛋白质相互作用数据,来构建预测模型并对新数据进行预测。

支持向量机、神经网络以及随机森林等方法都被广泛应用于蛋白质相互作用的预测。

除了以上提到的方法外,一些综合方法也被提出来提高蛋白质相互作用预测的准确性。

将生物物理学方法和生物信息学方法相结合,可以综合利用蛋白质序列、结构以及相互作用信息来进行预测。

还有一些基于网络的方法,通过构建蛋白质相互作用网络,来分析蛋白质之间的关联性以及预测潜在的相互作用关系。

预测蛋白质相互作用是一个复杂的问题,需要多种方法的综合应用。

随着科学技术的不断进步,我们相信未来会有更多更准确的方法被提出来帮助我们更好地理解蛋白质相互作用的规律,从而为生命科学研究和药物研发提供更多的帮助。

第二篇示例:蛋白质相互作用是细胞内复杂生物过程中的一部分,它对于细胞的正常功能以及疾病的发生起到非常重要的作用。

蛋白质结构预测方法

蛋白质结构预测方法

蛋白质结构预测方法随着生物科技和计算机技术的快速发展,蛋白质结构预测方法已经成为当今生物学中的热门话题。

蛋白质是生命体中最基本的一种生物大分子,对于许多生命活动和疾病的研究都具有重要的作用。

然而,了解蛋白质的结构对于研究其功能和相互作用至关重要。

本文将介绍一些常见的蛋白质结构预测方法。

一、亚氨酸序列分析法亚氨酸序列分析法是一种基于蛋白质多肽链上各个氨基酸的组成及其排列顺序来预测蛋白质空间结构的方法。

这种方法在理论上已经被证明是可行和准确的。

然而,由于该方法在预测过程中可能会受到亚氨酸序列中缺失信息的影响,因此需要借助其他方法进行补充。

二、同源建模法同源建模法是一种比较广泛使用的蛋白质结构预测方法。

该方法依据细胞中已知结构的蛋白质对于待预测蛋白质的模板效应进行预测,从而得到待预测蛋白质的结构。

该方法的优点在于它能够对大量的蛋白质进行预测,并且往往能获得高质量的结构预测结果。

然而,该方法的主要缺点是仅适用于那些与已知结构相似的蛋白质。

三、Ab initio方法Ab initio方法是一种从头开始预测蛋白质结构的方法,它不依赖于与已知结构相似的蛋白质。

这种方法基于物理力学和统计学知识进行计算,尝试预测分子的基本构筑原理。

这种方法在处理具有折叠密码学特性的蛋白质时比较准确,但是在面对大分子的复杂蛋白质时常常出现预测的误差。

四、网络方法网络方法是一种将蛋白质折叠预测看作一个大型优化问题的方法,它通过构建各种相互作用网络来预测蛋白质的结构。

这种方法在处理大分子蛋白质的折叠过程中具有较好的表现,也是目前研究中的热门和前沿方向之一。

五、机器学习方法机器学习方法是一种基于人工智能理论和算法的蛋白质结构预测方法。

该方法可以构建出一个有效的预测模型,然后通过灵活的机器学习算法对蛋白质信息进行分析来预测蛋白质的结构。

该方法在处理大分子的复杂蛋白质时常常具有很好的预测效果,但是它的缺点在于需要大量的已知数据用于训练模型。

蛋白质相互作用预测方法的研究

蛋白质相互作用预测方法的研究

蛋白质相互作用预测方法的研究一、本文概述蛋白质是生命体系中的关键分子,它们在细胞的各种生命活动中发挥着至关重要的作用。

蛋白质之间的相互作用是许多生物过程的基础,如信号转导、基因表达、细胞代谢等。

因此,研究蛋白质相互作用对于理解生命的本质和疾病的发生机制具有重要意义。

然而,由于蛋白质相互作用的复杂性和多样性,准确预测蛋白质相互作用仍然是一个巨大的挑战。

本文旨在探讨和研究蛋白质相互作用预测方法的发展和应用。

我们将首先介绍蛋白质相互作用的基本概念和研究背景,阐述蛋白质相互作用预测的重要性和挑战性。

接着,我们将综述现有的蛋白质相互作用预测方法,包括基于基因组学、蛋白质组学、结构生物学等多种方法的原理和优缺点。

我们还将介绍近年来新兴的预测方法,如基于机器学习和深度学习的预测模型,以及它们在蛋白质相互作用预测中的应用和前景。

通过本文的综述和探讨,我们希望能够为蛋白质相互作用预测领域的研究者提供全面的参考和启示,推动蛋白质相互作用预测方法的不断发展和完善。

我们也期望这些方法能够在实际的生物医学研究中发挥更大的作用,为疾病诊断和治疗提供新的思路和方法。

二、蛋白质相互作用预测方法的分类蛋白质相互作用预测方法根据其所采用的技术和策略,可以大致分为以下几类:基于基因组学的方法:这类方法主要利用大规模基因组测序数据,通过比对不同物种或同一物种不同条件下的基因表达谱,来预测蛋白质间的相互作用。

例如,基因共表达分析、基因敲除或敲降后的表达变化等,都可以为蛋白质相互作用提供线索。

基于生物化学的方法:这类方法通过生物化学实验,如酵母双杂交、免疫共沉淀等,直接检测蛋白质间的物理相互作用。

这类方法具有较高的准确性和可靠性,但通常成本较高,且难以在大规模范围内进行。

基于计算生物学的方法:计算生物学方法主要依赖于计算机算法和数学模型,通过分析蛋白质的序列、结构和功能信息,预测其可能的相互作用伙伴。

例如,序列比对、蛋白质结构预测、网络模型构建等,都属于计算生物学方法的范畴。

蛋白质结构预测方法总结

蛋白质结构预测方法总结

蛋白质结构预测方法总结蛋白质是生物体内最为重要的分子之一,其结构决定了功能和活性。

然而,实验性确定蛋白质的三维结构是一项复杂且昂贵的任务。

因此,研究人员发展了多种计算方法来预测蛋白质的结构。

本文将总结几种常见的蛋白质结构预测方法。

1. 基于比对的方法一种常用的蛋白质结构预测方法是基于比对。

这种方法使用已知结构的蛋白质作为模板,将目标蛋白质的序列与模板进行比对,从而预测其结构。

比对可以使用多种方法,如BLAST、PSI-BLAST和HHpred等。

这些方法根据序列之间的相似性来预测结构,通常适用于那些与已知结构相似的蛋白质。

2. 基于折叠的方法基于折叠的方法是通过在能量最小化的条件下预测蛋白质的结构。

这些方法利用原子间相互作用的物理性质来预测蛋白质的稳定结构。

其中,分子力学模拟是常用的方法之一,通过计算分子中原子的相互作用以及能量最小化来预测蛋白质的结构。

此外,还有蒙特卡洛模拟和分子动力学模拟等方法用于蛋白质结构的预测。

3. 基于碱基预测的方法基于碱基预测的方法是根据目标蛋白质的氨基酸序列来预测其结构。

这些方法利用氨基酸的特性,如溶解度、疏水性和电荷分布等,来推断蛋白质的结构。

在这种方法中,常用的技术包括人工神经网络和随机森林等。

4. 基于演化信息的方法基于演化信息的方法是利用多个序列的比较来预测蛋白质的结构。

这些方法假设在进化过程中,保守的残基通常对于结构和功能至关重要,因此可以通过比较不同蛋白质序列之间的保守性来预测其结构。

常用的技术包括多序列比对和物种树建构等。

5. 基于统计的方法基于统计的方法是从大量已知结构的蛋白质中提取统计学规律,以预测新蛋白质的结构。

在这种方法中,通过分析蛋白质的物理特性和氨基酸残基之间的相互作用,建立统计学模型,从而预测目标蛋白质的结构。

常见的方法包括聚类分析、SVM和隐马尔可夫模型等。

综上所述,蛋白质的结构预测是一项复杂而具有挑战性的任务。

虽然没有一种方法能够完美地预测蛋白质的结构,但结合不同的预测方法可以提高预测的准确性和可靠性。

蛋白质结构预测和模拟方法

蛋白质结构预测和模拟方法

蛋白质结构预测和模拟方法蛋白质是生物体内的重要组成部分,对生命活动具有关键作用。

在了解蛋白质功能和相互作用等方面的研究中,蛋白质结构的预测和模拟方法发挥着重要的作用。

本文将介绍蛋白质结构预测的主要方法和蛋白质结构模拟的常见方法。

1. 蛋白质结构预测方法1.1 基于序列的预测方法基于序列的预测方法是根据蛋白质的氨基酸序列推测其结构。

这一方法通过将目标蛋白质的序列与已知结构的蛋白质序列进行比对,从而预测目标蛋白质的结构。

具体方法包括序列比对、蛋白质家族数据库搜索以及机器学习等等。

1.2 基于结构模板的预测方法基于结构模板的预测方法是根据已知结构的蛋白质来预测目标蛋白质的结构。

这一方法通过找到与目标蛋白质具有相似结构的蛋白质,从而预测目标蛋白质的结构。

具体方法包括结构比对、结构模板库搜索以及融合多个结构模板等等。

1.3 基于物理力学的预测方法基于物理力学的预测方法是利用物理力学原理来预测蛋白质的结构。

这一方法通过模拟蛋白质分子内的原子间相互作用,从而预测蛋白质的结构。

具体方法包括分子力学、蒙特卡洛模拟以及分子动力学模拟等等。

2. 蛋白质结构模拟方法2.1 分子力学模拟分子力学模拟是通过计算蛋白质分子内原子之间的相互作用力,来模拟蛋白质的结构和动力学性质。

这一方法可以对蛋白质进行模拟,从而获得与实验结果相一致的结构信息。

2.2 蒙特卡洛模拟蒙特卡洛模拟是通过引入随机性的方法来模拟蛋白质分子的运动和结构。

这一方法通常基于能量最小化原则,通过随机调整蛋白质的构象从而获得可能的结构。

2.3 分子动力学模拟分子动力学模拟是通过数值计算方法,模拟蛋白质分子静态和动态特性的一种方法。

这一方法可以模拟蛋白质的结构和动力学性质,并研究蛋白质在时间和空间尺度上的变化。

3. 蛋白质结构预测和模拟的应用蛋白质结构预测和模拟的方法在生物科学研究中发挥着重要的作用。

首先,它们可以帮助科学家深入了解蛋白质的结构与功能之间的关系。

其次,蛋白质结构预测和模拟方法还可以用于研究蛋白质的折叠机制、稳定性以及相互作用等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Software Engineering and Applications 软件工程与应用, 2018, 7(3), 151-159Published Online June 2018 in Hans. /journal/seahttps:///10.12677/sea.2018.73018A Survey of Computational Methods forProtein Complexes Prediction Based onStatic PPI NetworksYang YuSoftware College, Shenyang Normal University, Shenyang LiaoningReceived: Jun. 6th, 2018; accepted: Jun. 20th, 2018; published: Jun. 27th, 2018AbstractProtein complexes are formed by interacting proteins and exhibit diverse biological functions.Protein complexes are predicted by computational methods from biological networks, which is not only important for understanding the mechanisms of biological activities and the pathogenesis of diseases, but also for making up the deficiencies of biological high-throughput experimental methods. In this paper, two types of prediction methods based on static network protein com-plexes are introduced and analyzed. Secondly, we discuss the deficiencies of protein complex al-gorithms and the challenges of this field.KeywordsProtein-Protein Interaction Network, Clustering, Complex Prediction, Computational Methods基于静态网络的蛋白质复合物预测方法综述于杨沈阳师范大学,软件学院,辽宁沈阳收稿日期:2018年6月6日;录用日期:2018年6月20日;发布日期:2018年6月27日摘要蛋白质复合物通过相互作用蛋白质形成,表现出多样的生物功能。

使用计算方法从生物网络中预测蛋白质复合物不仅对于理解生物活动的机制和疾病的发病机理具有重要意义,而且可以弥补生物高通量实验于杨方法的不足。

本文介绍分析两类基于静态网络蛋白质复合物预测的方法,讨论蛋白质复合物预测算法的不足,进一步分析探讨蛋白质复合物预测所面临的挑战。

关键词蛋白质网络,聚类,复合物预测,计算方法Copyright © 2018 by author and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY)./licenses/by/4.0/1. 引言蛋白质复合物是含有多个相互作用蛋白质并执行不同细胞功能的生物分子[1]。

从蛋白质相互作用(PPI)网络中识别蛋白质复合物可以更好地理解蛋白质在不同细胞系统中的作用。

复合物预测技术包括生物实验技术和计算技术。

早期研究人员主要是通过生物实验测定蛋白复合物,但此类技术周期长,成本较高,有些复合物需要在特定的环境下才能被发现。

高通量技术和计算技术的发展产生了大量的PPI数据,如何有效地利用这些数据构建蛋白质相互作用网络并预测复合物成为了一个巨大的挑战。

计算方法预测蛋白质复合不仅可以弥补生物实验技术的不足,而且有助于研究和了解复杂的更高层次细胞组织,预测未知蛋白质功能,研究疾病的发生机理和寻找新的药物靶标。

整个蛋白质相互作用网络可以看成一个图,其中蛋白质对应于网络中的点,相互作用对应于网络中的边[2]。

复合物预测是利用以机器学习、数据挖掘和复杂网络理论为基础的聚类技术从PPI网络数据中提取出具有相似功能蛋白质集合的过程。

近十年期间,涌现了大量的复合物预测的计算方法。

本文将静态网络蛋白质复合物预测的方法分成两大类进行分析,分类如图1所示,并进一步对蛋白质复合物预测所面临的挑战与未来的研究方向进行探讨。

Figure 1. Classification of protein complex detection图1.蛋白质复合物预测算法分类于杨2. 基于静态网络的蛋白质复合物预测方法2.1. 基于网络拓扑结构的复合物预测方法1) 基于划分的预测方法基于划分的预测方法将网络划分成不同的簇,需要预先确定模块的数量和目标函数。

当同个模块内部对象之间的相似度为最大,各模块间的相似度为最小时,则目标函数最小。

Vlasblom J等人采用近邻传播方法划分蛋白质相互作用网络[3]。

Dunn等人采用边介数的算法将蛋白质网络划分成不同的蛋白质簇[4]。

基于划分的预测方法简单且易于理解,但是不能预测重叠的蛋白质模块。

因此,如何预测重叠模块仍是此类方法需要完善的问题。

2) 基于密度的预测方法在一个簇内蛋白质倾向于表现较多相互作用,但与簇外蛋白质存在相对较弱的相互作用。

在此基础上,研究人员提出相应的方法预测蛋白质复合物。

MCODE检测网络中链接相对密集的簇为蛋白质复合物[5]。

Adamcsek等人基于团渗透方法设计在蛋白质相互作用网络中预测蛋白质复合物的Cfinder工具[6]。

DPCLus通过簇边界跟踪机制设计预测复合物[7]。

PCP采用基于FS权重的方法构造加权图,然后在加权网络中通过稠密子图预测蛋白质复合物[8];Abdullah等人首先获得信息富集的蛋白质,并使用聚类系数定位与蛋白质相互作用的最近蛋白质簇预测蛋白质复合物[9];Ovrlp基于桥蛋白概念提出计算重叠簇方法预测网络的模块化结构[10];MINE算法利用改进的节点权值和网络模块测量方法定义模块的边界,从而避免了邻接点的错误计算[11];PE-WCC 首先计算基于新测量的相互作用数据的可信度,然后使用加权聚类系数的概念决定哪些子图更接近最大团[12];王建新,李敏等人[13]通过考虑子图的密度和模块性来定义子图的适应度的LF_PIN算法,该算法通过将每个种子边缘延伸到一个子图,直到其适应度达到局部最大值实现复合物预测。

Hernandez等人[14]提出挖掘高度连通子图算法,该算法将PPI网络转换成有向无环图,减少表示的边的数目和识别子图的搜索空间,并考虑加权和未加权的PPI网络预测蛋白质复合物。

此类方法可以在不考虑低密度簇的情况下找到高密度的蛋白质团簇,如何找到其它拓扑类型模块是此类方法研究的重点目标。

3) 基于层次的预测方法这种方法已广泛应用于复杂网络的研究,如社交网络和生物网络。

GN方法不断删除网络中介数最大的边,直至删除网络中的所有边[15]。

文献[16]利用Suite Jerarca 有效地将相互作用的网络单元转化成树状图,进而通过层次聚类预测网络模块。

文献[17]提出基于边的层次聚类方法预测重叠的蛋白质复合物。

文献[18]考虑对共现复合物打分的方式,采用基于扩展传统集成聚类方法测蛋白质复合物。

层次聚类方法包含基于节点和基于边的聚类。

虽然通过使用层次树显示一个蛋白质相互作用网络,但是当使用基于节点的层次聚类方法时,通常并不容易检测到重叠的蛋白质模块。

4) 基于流模拟的预测方法流模拟方法模拟相互作网络内的生物学或功能流,并尝试以形成一个模型预测各种受外部刺激产生复杂网络的行为。

马尔可夫聚类可以在有权或者无权图中模拟节点随机游动预测蛋白质复合物[19]。

TRIBE-MCL通过使用序列相似性构图计算随机行走节点概率定位蛋白质模块。

受流模拟算法启发,Hwang等人通过构建动态信号转导的模型与图的拓扑信息迭代预测蛋白质复合物[20]。

CASCADE方法通过在蛋白质相互作用于杨网络中计算共享概率调节转导预测蛋白质复合物[21]。

Shen等人[22]提出了一种基于迭代执行R-MCL算法实现软聚类,允许识别高度重叠的簇。

Ochieng等人引入马尔可夫图聚类算法识别高度相互连接PPI 网络中的蛋白质复合物,算法首先构建PPI网络建立几何网络,然后利用马尔可夫聚类在构建的网络上检测蛋白质复合物[23]。

流模拟方法不强调聚类内连接和节点密度,从而避免了小规模或只有一个节点聚类结果。

因为所有节点的信息流需要考虑,该方法的时间复杂度非常高。

此外,一些蛋白质在聚类过程中会被丢掉。

5) 基于谱聚类的预测方法谱聚类方法采用矩阵理论和线性代数理论为研究基础,近年来已被广泛的应用到复杂网络和生物网络等研究领域。

文献[24]将谱聚类算法应用在果蝇的蛋白相互作用网络上,发现离散的谱密度与网络的拓扑结构相对应,擅长描述环状拓扑结构。

高琳等提出构建相似性矩阵和设定聚类数目,应用于谱聚类方法确定蛋白质模块[25]。

文献[26]提出基于扩散模型的谱聚类算法,它将蛋白相互作用网络的聚类结构解析为扩散过程中的随机游走问题。

谱聚类方法被用于计算和构造特征向量,该方法预测的簇通常不重叠。

从理论上讲,它也能收敛在全局最优解的任何形状的样本空间,但聚类初始化、聚类的个数、邻接矩阵构造以及特征向量的选择将直接影响最终聚类效果。

因此,如何确定这些问题和预测重叠簇仍是待解决的关键问题。

6) 基于群智能的预测方法群智能算法是基于生物学行为的一种全局概率搜索算法,该类算法考虑每个可用的解决方案作为一种生物实体,解决方案的搜索和优化过程被认为是进化过程,该类方法已经在生物网络中得到有效应用。

ACOPIN方法结合蚁群算法与旅行商方法在蛋白相互作用网络中预测群集的节点。

还有一些方法通过与功能流程聚类,将人工蜂群算法引入到蛋白质相互作用网络预测蛋白质复合物[27]。

雷秀娟等提出了一种结合萤火虫算法和基于同步的层次聚类(SHC)的复合物预测算法[28],首先,通过谱聚类对PPI数据进行预处理,将高维相似度矩阵转换为低维矩阵。

然后SHC算法用于执行聚类并采用萤火虫算法优化识别过程。

相关文档
最新文档