蛋白质相互作用网络分析的图聚类方法研究进展

合集下载

基于蛋白质相互作用网络图的聚类方法

基于蛋白质相互作用网络图的聚类方法

基于蛋白质相互作用网络图的聚类方法
彭利红;廖波;刘昊
【期刊名称】《计算机工程与应用》
【年(卷),期】2008(44)32
【摘要】依据人类AD(Alzheimer's Disease)相关蛋白质相互作用网络图,利用基于算术平均最小值--AAMV(Arithmetic Average Minimum Value)的K-means 聚类方法对蛋白质进行聚类并预测4个孤立蛋白质的功能.分析结果表明:所得结果与用Maryland Bridge法及Korbel法所得结果非常相似.
【总页数】3页(P132-133,164)
【作者】彭利红;廖波;刘昊
【作者单位】湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082
【正文语种】中文
【中图分类】TP311
【相关文献】
1.蛋白质相互作用网络的几种聚类方法综述 [J], 王正华;董蕴源;王勇献
2.基于元数据的异构蛋白质-蛋白质相互作用数据库整合 [J], 张智;张正国
3.基于集成支持向量机的蛋白质-蛋白质相互作用研究 [J], 周凌云
4.蛋白质相互作用网络分析的图聚类方法研究进展 [J], 李敏;武学鸿;王建新;潘毅
5.基于蛋白质相互作用网络的茶树抗假眼小绿叶蝉研究 [J], 王芬;裴会敏;文狄;陈志;李静
因版权原因,仅展示原文概要,查看原文内容请购买。

蛋白质相互作用网络分析的新方法

蛋白质相互作用网络分析的新方法

蛋白质相互作用网络分析的新方法近年来,基因组学、转录组学和蛋白质组学的快速发展,为系统生物学的研究提供了强有力的工具和方法。

蛋白质相互作用网络分析是系统生物学中的关键技术之一,也是比较常见的一种研究方法。

在很多领域中都得到了广泛的应用,例如药物发现、疾病发生机制探究等。

本文着重探讨一种新的蛋白质相互作用网络分析方法。

一、蛋白质相互作用网络简介蛋白质相互作用网络是指蛋白质之间的相互关系网络,也就是蛋白质相互作用图或者蛋白质互作网。

这个网络是由蛋白质相互作用所形成的一种复杂的有向图。

每一个节点代表了一个蛋白质分子,节点之间的连线代表着蛋白质之间的相互作用,它能够展示出蛋白质间的相互关系。

图像化的蛋白质相互作用网络有助于人们直观地了解蛋白质之间的联系。

人们可以从这个网络中获得很多有关蛋白质与蛋白质之间相互作用的信息,如蛋白质之间的联系强度、在这个网络上的中心蛋白质等。

同时,也可以进一步探索蛋白质的功能和复杂的生物学网络结构。

二、蛋白质相互作用网络分析的重要性蛋白质相互作用网络分析对于了解细胞内蛋白质互动关系具有极大的价值。

它能揭示蛋白质之间的信号传递和代谢途径。

通过分析蛋白质相互作用网络,能够发现大量难以察觉的互动关系,尤其是对于那些生物学复杂的系统中,主要的调控因素就是许多小型的蛋白质互动网络的情形而言,这种方法显得更为有用。

三、蛋白质相互作用网络分析方法的不足尽管蛋白质相互作用网络分析是一种受欢迎的研究方法,但其仍有一些不足之处。

较为常见的一个问题是网络分析方法的计算复杂度。

因为蛋白质相互作用网络是一个复杂的图结构,所以它是需要复杂计算的,目前为止还没有找到能够高效的计算的算法。

这使得蛋白质相互作用网络分析方法的应用受到了很大的限制。

四、新方法的介绍为了解决上述问题,近年来,关于蛋白质相互作用网络的新方法——邻居偏差调整网络分析方法被提出并逐步发展。

这种方法利用了蛋白质相互作用网络的拓扑信息,降低了计算复杂度,并取得了很好的结果。

蛋白质互作网络图谱构建及功能预测方法

蛋白质互作网络图谱构建及功能预测方法

蛋白质互作网络图谱构建及功能预测方法蛋白质是细胞内的重要功能分子,在维持细胞稳定性和调控生物过程中起着关键的作用。

蛋白质之间的相互作用是维持细胞正常功能的基础,因此,研究蛋白质互作网络图谱的构建和功能预测方法成为了生物学和生物信息学领域的热点研究方向。

蛋白质互作网络图谱构建是指通过实验或预测的方法,建立蛋白质之间的相互作用关系,并以网络图谱的形式呈现。

构建蛋白质互作网络图谱的方法主要分为两类:实验方法和预测方法。

实验方法是通过生物实验手段,如酵母双杂交技术、质谱分析等,来鉴定蛋白质之间的相互作用关系。

这些方法通过检测蛋白质之间的物理接触或共同参与特定生物过程,来确定它们之间的相互作用关系。

然而,实验方法受到技术限制和成本问题的限制,不能完全揭示细胞内所有蛋白质之间的相互作用,因此需要进一步发展预测方法。

预测方法是通过计算机模拟和数据挖掘等手段,利用已有的蛋白质互作数据来推测新的蛋白质相互作用关系。

预测方法主要包括基于同源性的方法、基于结构的方法、基于系统生物学的方法和基于机器学习的方法。

基于同源性的方法是通过寻找已知相互作用蛋白质的同源蛋白质,来预测新的蛋白质互作关系。

同源蛋白质一般具有较高的结构和功能相似性,因此可以合理地推测其相互作用关系。

这种方法可以通过基于序列的方法(如BLAST、PSI-BLAST)或基于结构的方法(如比对结构或模板建模)来实现。

基于结构的方法是通过分析蛋白质的结构信息,来预测蛋白质的相互作用关系。

蛋白质的结构决定了其功能和相互作用的方式,因此通过分析蛋白质的结构可以推测其互作关系。

这种方法包括基于结构域的方法、基于结构相似性的方法和基于分子对接的方法。

基于系统生物学的方法是通过分析蛋白质互作网络中的拓扑结构和动力学特性,来揭示蛋白质的相互作用关系。

蛋白质互作网络具有复杂的拓扑结构和模块化的特点,通过分析这些特征可以预测蛋白质的相互作用关系。

此外,基于系统生物学的方法还可以通过大规模实验数据和计算模型,来模拟和预测蛋白质互作网络的功能。

蛋白质的相互作用网络研究进展

蛋白质的相互作用网络研究进展

蛋白质的相互作用网络研究进展蛋白质是生物体中最重要的功能分子之一,它们通过相互作用构成复杂的蛋白质网络,调控细胞的生理过程和代谢途径。

研究蛋白质相互作用网络在揭示生物体内分子交互以及生物过程中关键的调控因子和途径方面具有重要意义。

本文将综述蛋白质相互作用网络研究的最新进展,包括实验方法和计算模型,并探讨其在生物学和医学领域的应用前景。

目前,研究蛋白质相互作用网络的实验方法主要包括串联亲和纯化和酵母双杂交技术。

串联亲和纯化技术通过将不同亲和标记的蛋白质逐步纯化,最终得到蛋白质相互作用的图谱。

酵母双杂交技术通过将目标蛋白质与转录激活子结合,观察是否发生荧光蛋白的表达。

这些实验方法已经在多个模式生物体中得到广泛应用,包括酵母、果蝇、线虫和小鼠等。

与实验方法相比,计算模型在研究蛋白质相互作用网络方面具有显著的优势。

计算模型可以快速构建蛋白质相互作用网络,预测和分析蛋白质相互作用的功能和调控机制。

目前最常用的计算模型是基于蛋白质-蛋白质互作结构的预测方法,包括基于结构域蛋白质相互作用(domain-domain)和蛋白质残基相互作用(residue-residue)的模型。

这些模型通过结构信息和进化保守性分析预测蛋白质相互作用,并且可以通过结合大规模基因组和蛋白质组数据进行实验验证和优化。

蛋白质相互作用网络的研究不仅在基础生物学领域具有重要意义,还在医学研究中有广泛的应用前景。

蛋白质相互作用网络可以用于研究疾病发生和发展的分子机制,并且可以用于发现新的药物靶点和治疗方法。

例如,通过分析蛋白质相互作用网络,可以发现与疾病相关的关键蛋白质和信号通路,从而推动药物研发和治疗策略的创新。

尽管蛋白质相互作用网络的研究已取得显著进展,但仍然存在一些挑战和难题。

首先,由于蛋白质相互作用的复杂性,目前的实验方法和计算模型仍然存在很大的局限性和误差。

其次,蛋白质相互作用网络的研究需要大量的数据整合和分析,这对数据科学和计算机科学的交叉研究提出了挑战。

蛋白质互作网络分析方法的研究

蛋白质互作网络分析方法的研究

蛋白质互作网络分析方法的研究生命科学研究一直是一个重要的研究领域,其中,蛋白质互作网络在分子生物学、生理学和病理学中扮演着重要的角色。

蛋白质互作网络是由大量蛋白质互相作用而形成的网络结构,研究这种网络结构对于了解蛋白质间的相互关系及其功能的发挥有着至关重要的作用。

因此,研究蛋白质互作网络的分析方法成为了当前生物学研究的热点问题之一。

定义蛋白质互作网络蛋白质互作网络是由一组蛋白质之间的相互作用而形成的,它可以用一个图形来表示,其中每个节点代表一个蛋白质,而边表示蛋白质之间的相互作用关系。

在这个图形中,节点数目越多,它的边数目也将更多,从而形成了一张庞大的网络。

目前,人们对蛋白质互作网络越来越关注,因为这种网络结构为我们了解蛋白质功能等诸多方面提供了很多的信息。

不仅如此,蛋白质互作网络的结构还能对不同细胞类型和不同个体间的差异进行研究,从而帮助我们了解不同生物体的生活表现和病理变化。

蛋白质互作网络分析方法随着技术和研究手段的发展,蛋白质互作网络的分析方法也变得更加成熟。

在这个领域,人们为了研究网络的特性和功能,不断开发新的分析方法,从而深入挖掘蛋白质互作网络的生物学意义。

蛋白质互作网络分析方法可以分为数据收集和数据分析两个部分。

数据收集包括基因组测序、质谱分析和荧光分析等生物技术手段,通过这些方法可以从生物样本中获得蛋白质互作网络数据。

数据分析部分则需要用到计算机技术,根据网络结构进行网络特征分析、功能模块发现、生物信息学数据集成等。

目前蛋白质互作网络分析方法主要包括网络建立、网络特征分析、功能模块发现和网络预测。

网络建立:网络建立是蛋白质互作网络分析的首要过程,需要选择合适的蛋白质互作数据集。

网络特征分析:网络特征分析是对网络结构进行定量和质量评估的方法,包括节点度分布、聚类系数、网络密度、小世界性和模块度等。

功能模块发现:功能模块发现是将网络中有关联、有生物学相关性的蛋白质聚集在一起,并从模块中鉴定功能相关性蛋白。

蛋白质相互作用网络构建与分析方法研究

蛋白质相互作用网络构建与分析方法研究

蛋白质相互作用网络构建与分析方法研究蛋白质相互作用网络是研究蛋白质相互作用关系的一种重要方法。

它能够帮助我们理解蛋白质在生物体内的功能及其相互作用方式。

本文将介绍蛋白质相互作用网络构建与分析的一些常用方法,并探讨其在生物学研究中的应用。

一、蛋白质相互作用网络构建方法1. 两亲性亲和纯化(TAP)方法TAP方法是一种常用的蛋白质相互作用筛选技术。

它通过标记蛋白质并与其相互作用的蛋白质一起纯化,从而实现筛选出相互作用的蛋白质。

纯化后的蛋白质可以通过质谱分析等方法进行鉴定和分析。

2. 酵母双杂交方法酵母双杂交方法可用于筛选出与目标蛋白质相互作用的蛋白质。

该方法基于转录因子和其识别序列之间的相互作用,通过构建酵母基因表达库和靶基因表达库,并将它们进行杂交筛选,最终确定相互作用蛋白。

3. 共免疫沉淀法共免疫沉淀法是一种依赖于抗体的技术,它通过特异性抗体对目标蛋白进行标记,然后与其相互作用的蛋白质一起进行免疫沉淀。

沉淀物中的蛋白质可以通过质谱分析等方法进行检测和鉴定。

二、蛋白质相互作用网络分析方法1. 图论分析蛋白质相互作用网络可以转化为图论中的图模型,从而利用图论分析方法进行分析。

常用的图论分析方法有最短路径分析、网络中心性分析、社团检测等。

这些方法可以帮助我们了解相互作用网络的整体结构和功能模块等。

2. 功能富集分析功能富集分析是通过对蛋白质相互作用网络中的若干蛋白质进行功能注释,从而了解相互作用网络中具有特定功能的模块。

常用的功能富集分析方法包括基因本体论分析、KEGG通路分析等。

3. 生物信息学分析生物信息学分析可以应用于蛋白质相互作用网络的研究中。

比如,可以利用序列同源性、结构域信息等进行蛋白质的功能注释和亚细胞定位的预测。

三、蛋白质相互作用网络的应用1. 生物学研究蛋白质相互作用网络可以帮助我们理解蛋白质在细胞内的相互作用关系,从而揭示生物体内复杂的生物学过程。

比如,可以研究蛋白质信号传导途径、基因调控网络等。

如何利用生物大数据技术进行蛋白质互作网络分析

如何利用生物大数据技术进行蛋白质互作网络分析

如何利用生物大数据技术进行蛋白质互作网络分析蛋白质互作网络分析是生物学、生物医学和药物发现领域中关键的研究方向之一。

它通过研究蛋白质间相互作用的复杂网络,揭示了生物体内蛋白质之间的相互关系,从而有助于理解细胞功能和疾病发展的机制。

随着生物技术的快速发展,生物大数据技术为蛋白质互作网络分析提供了强大的工具和解决方案。

首先,进行蛋白质互作网络分析的第一步是获取蛋白质相互作用的数据。

目前,公共数据库如STRING、BioGRID和MINT等收集了大量的蛋白质互作信息,并提供了免费的数据库查询服务。

研究人员可以通过这些数据库获取到已知的蛋白质相互作用数据,然后利用生物大数据技术对这些数据进行分析。

生物大数据技术在蛋白质互作网络分析中的一个重要应用是网络构建。

通过整合不同来源的蛋白质相互作用数据,可以构建一个完整的、可靠的蛋白质互作网络。

例如,可以利用聚类算法和图论分析方法,将蛋白质之间的相互作用关系组织成一个网络图,其中蛋白质表示节点,相互作用表示边。

通过网络分析工具,可以分析网络的拓扑结构,发现重要的蛋白质和关键的功能模块,有助于理解蛋白质相互作用网络的结构与功能。

其次,生物大数据技术在蛋白质互作网络分析中还可以用于预测未知的蛋白质相互作用。

利用机器学习算法和模式识别技术,可以根据已有的蛋白质相互作用数据,预测未知的蛋白质相互作用关系。

这些预测结果可以为进一步的生物实验提供指导,节省时间和资源。

同时,生物大数据技术还可以用于寻找与蛋白质相互作用相关的生物过程和信号通路。

利用生物大数据技术,可以将蛋白质互作网络与其他的生物学数据(如基因表达数据、突变数据)进行整合和分析。

通过这些分析,可以发现与蛋白质互作网络密切相关的生物过程和信号通路,有助于揭示细胞功能和疾病发生机制。

此外,生物大数据技术还可以用于挖掘蛋白质相互作用网络中的模式和规律。

通过利用大规模的蛋白质相互作用数据和计算方法,可以发现网络中的亚网络(子图)以及模块化的蛋白质群落。

基于蛋白质相互作用网络的聚类算法研究

基于蛋白质相互作用网络的聚类算法研究

E gn e i g a d A piain 。 0 8 4 ( 0 :4 - 4 . n ie r n p l t s 2 0 ,4 3 )1 2 1 4 n c o
Abs r t Prt i tac : o en—p oei i e a to n t r r fr a e r t n ntr ci n e wo k ee s n w r s ach r a f c m p t r ce eTh d sa c merc n u h e tn e e r a e o o u e s inc . e it n e ti i s c s ti g
◎ 据 库 、 号 与信 息 处 理◎ 数 信
基于蛋 白质相互作用 网络 的聚类算法研 究
刘 昊 , 廖 波 , 彭利 红
LI U Ha L AO Bo, o, I PE , 长沙 4 8 10 2 0
Sc o l f Co h o o mpu e & Co mu c to Hun n tr m nia in, a Unie st Ch ng ha 0 2。 i a v riy, a s 41 08 Ch n E—mal 471 99 q e n i: 99 @ q.o l
其关键点在于直到一个紧密连接的模块中多数节点已被访问过随机流才会离开这个模块并通过概率改变和反复修改矩阵以实现随机流模拟层次聚类的方法有其独特的研究优势因为生物系统的层次组织结构和层次聚类本身不需要事前知道网络中目标类的确定个数
C m u rE gnei n p l ai s o p t nier g ad A pi t n 计算机工程与应 用 e n c o
i p e e e Whih s s he n r to o n de a d dg s n h n t r t p un t e e r h pa e n a od o u e e — s r s ntd, c u e t i f mai n f o s n e e i t e ewo k o r e h s a c s c a d v i s me nn c s o s t dsa e o ay itnc c mpu ainsThe x rme a r s t i ia e h t h ag rt m a hiv hih fi e c fr clse i g o e i r l tt o . e pe i ntl e uls nd c t t a t e l o ih c e e g efcin y o u trn n d s n ea
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 基于图密度的局部搜索算法 • 优点:
• ①能够识别相对稠密子图,符合蛋白质复合物和功能模块内部蛋白质 趋向于密切联系的生物特性; • ②在扩充搜索的过程中允许某个蛋白质重复出现,能够实现同一个蛋 白质属于多个不同功能模块的目标;
• 缺点:
• 不是所有的蛋白质复合物的网络图结构都是稠密的,基于密度的局部 搜索方法无法挖掘蛋白质相互作用网络中那些非稠密网络子图。
• 层次化的聚类方法 优点:能够用于挖掘任意形状的cluster,并且能够以树状 结构呈现整个PPI网络的层次化组织。 缺点: ①对噪声非常敏感,而目前能够获得的蛋白质相互作用数 据都不可避免地存在着噪声。 ②在对蛋白质相互作用网络进行分析时很难获取交叠的功 能模块,即很难将一个蛋白质节点划分到多个cluster中。
1.3 层次化的聚类方法
• 层次化聚类方法通过定义任意两个蛋白质节点之间相似度 或距离来量化表示两个蛋白质节点位于同一个cluster的可 能性。
• 根据树状结构形成的方式,层次化聚类方法可以进一步分 为分裂法(Divisive Method)和凝聚法(Agglomerative Method)。
• 如何构建动态的PPI网络模型,体现真实蛋白质相互作用自身的 动态特性,并基于此进一步研究面向动态PPI网络的构建可靠的PPI网络。多元是指与蛋白质相关的不同 类型的信息,例如基因表达数据、蛋白质结构域信息、蛋 白质功能注释信息、亚细胞定位信息等等.
• 结构化聚类算法SCAN : 基本思想:两个顶点是否应该出现在同一个cluster中取决于它们共享的 邻居节点,SCAN是一个基于共邻居节点的方法 贡献点:不仅能够从蛋白质相互作用网络中获取有效的聚类结果,而 且能够识别hubs以及outliers 其他方法: • 用谱划分和贪婪优化质量评估参数Q来划分cluster • 功能模块识别算法STM
1.2 识别稠密子图的聚类方法
(1)识别稠密子图的聚类方法将目标cluster看作稠密子图, 并采用密度来衡量一个子图是否稠密。 密度 ds定义为 ds=2m/(n( 一1)),
其中n和m分别表示cluster中包含的蛋白质个数和相互作用对数。
• 枚举PPI网络中所有的极大团 超顺磁性聚类算法SPC、蒙特卡洛模拟 算法MC;局部团合并算法LCMA • 基于团渗透的算法CPM • 基于极大团扩展的蛋白质复合物识别算法 • 利用谱分析方法
1.4 其他启发式图聚类方法
• 基于随机流的快速聚类算法MCL • 一种基于代价函数的图划分算法RNSC,通过使用代价函数来探 索最优的网络划分。 过程:随机地将蛋白质网络划分成 k 个独立cluster,通过不断地 将一个cluster内的蛋白质节点移至另一个cluster来降低整体成本, 当这种移动次数超过事先设定的阈值而没有使整体成本下降时, 整个算法结束。 缺点:算法的结果质量与算法开始生成的k个cluster的质量密切 相关。
• 缺点:①很难确定分裂要进行到哪一步为止; ②分析过程中需要重复地计算边介数,计算复杂度高。 • 针对缺点一:用Modularity来评估网络划分质量 • 针对缺点二:自包含的G—N算法。 • 还有人提出应用基于图连通性的HCS(Highly Connected Sub— graph)算法来分析蛋白质相互作用网络的模块化结构,HCS算法 通过反复迭代,不断地移除图中的最小割集,进而将整个网络 分割成若干个独立的cluster。
• 3、图聚类方法的应用
• 4、PPI网络聚类分析的挑战及关键问题 • 5、未解决的问题
1、PPI网络的图聚类方法
1.1 PPI数据及PPI网络的图模型 1.2 识别稠密子图的聚类方法 1.3 层次化的聚类方法 1.4 其他启发式图聚类方法 1.5 融合多元数据的图聚类方法
1.1 PPI数据及PPI网络的图模型
• DPClus算法:在挖掘非交叠蛋白质复合物的基础上,通过 扩展其在原图中的邻居节点来实现交叠模块的挖掘; • 在密度的基础上引入了距离作为复合物识别的参数,提出 了基于距离测定的蛋白质复合物识别算法IPCA; • 结合迭代的加权计分方法提出了应用于加权蛋白质相互作 用网络聚类算法CMC; • 双杂交聚类算法、基于局部密度与随机游走的算法、参数 化局部相似性蛋白质复合物挖掘算法miPAILM
1.5 融合多元数据的图聚类方法
• 目的:为了减少或者降低数据本身带来的影响,提高聚类算法的鲁棒 性。
2、聚类分析方法评估
2.1 基于标准数据集的分析 2.2 功能富集分析 2.3 其他评估方法分析
2.1 基于标准数据集的分析
• 将算法预测出的cluster与已知的标准数据集进行匹配—— 最直接、最有效的方法
• 如何通过对这些多元信息的复杂关联关系的分析,进而构 建它们之间的关联模型,并用于构建可靠的PPI网络.
• 结合特定疾病进行基于网络水平的诊断分析。
• 目前,大部分PPI网络分析的图聚类算法都是基于无向图 模型的,其中有些方法是基于非加权图的,有些方法是基 于加权图的,还有些方法既可以用于加权图又可用于非加 权图。 • • 根据识别出的cluster是否允许交叠情况又可以将聚类算法 分为识别非交叠cluster的图聚类算法和识别交叠cluster的 图聚类算法; • • 根据聚类算法查找目标的不同又可以分为用于识别稠密子 图的聚类算法和其他可识别不同密度子图的聚类算法等。
• 凝聚法是一种自底向上的层次聚类方法
• 首先将每个蛋白质节点看做一个单独cluster,然后依据节点间的相似 度或距离循环地合并cluster,每次将两个相似度最高或者距离最近的 cluster进行合并,直到所有的节点属于同一个cluster为止。 • 代表算法:在G—N算法基础上提出的MoNet算法: • 利用G—N算法得到边从网络中被移除的顺序,并根据这个顺序的逆序 建立一个列表,以确定网络中节点合并的顺序。并给出功能模块的定 义,以明确凝聚过程中的终止条件。 • 基于局部变量边聚集系数的快速层次聚类算法HC—PIN。
• 常用的标准数据集: • MIPS中的已知蛋白质复合物数据 • Nature和Science公开发表的实验方法或者系统分析方法得 到的蛋白质复合物 • GO数据库中的功能注释信息等
• 算法识别出的cluster(记作Pc)与已知蛋白质复合物(记作Kc) 的匹配程度OS(Pc,Kc):
3、图聚类方法的应用
• 一个PPI网络可以用一个无向图G( V,E)来表示,图中的顶点表示蛋白质, 边表示蛋白质之间的相互作用。也有极特殊的情况,将一个PPI网络表 示为一个有向图,其中边的方向用来表示一个蛋白质对另一个蛋白质 的调节。
• 对无向图模型,根据其边取值的差异,又可以分为非加权图模型和加 权图模型。 • 非加权图模型,两个蛋白质之间的关系可以简单地用二进制值:0和1 来表示。其中,1表示两个蛋白质之间存在相互作用,而0则表示这两 个蛋白质问不存在相互作用。 • 加权图模型中,边的取值位于0到1之间。边权值的大小代表了该相互 作用真实存在的可能性。
• 分裂法是一种自顶向下的方法
• 首先将整个PPI网络看做一个完整的cluster,然后不断地将该网络按照 一定的规则进行分割,直到所有的节点都属于不同的cluster为止。 • 最经典的分裂法:G—N算法 • 基本思想:不同cluster的节点之间最短路径必经过连接两个cluster的 边,而这样的边具有比较高的介数。通过不断移除网络中的高介数来 分裂网络。
3.1 预测蛋白质功能 3.2 PPI预测及假阳性过滤 3.3 预测关键蛋白质
4、PPI网络聚类分析的挑战及关键问题
4.1 PPI网络数据的预处理 4.2 面向动态PPI网络的图模型和聚类算法 4.3 聚类结果的评估
5、未解决的问题
• PPI网络数据的可靠性问题; • PPI网络的层次化结构与模块化结构之间的关系; • PPI网络分析过程中如何实现交叠cluster的识别,cluster之间的 交叠机制是怎样的? • 随着PPI数据的不断增加,如何面向大规模PPI数据集设计快速而 有效的聚类方法?
蛋白质相互作用网络分析的 图聚类方法研究进展
CXW
2012.09.08
• 《计算机工程与科学》 COMPUTER ENGINEERING &SCIENCE • 2012年第34卷第l期 Vol.34,No.1,2012 • 中南大学、 佐治亚州立大学( 美国)
• 1、PPI网络的图聚类方法
• 2、聚类分析方法评估
(2)另一大类获取稠密子图的方法:基于种子—扩充模型 的聚类方法 • 三个步骤: (1)计算种子; (2)将种子初始化为一个cluster,并进行扩充; (3)输出扩充得到的cluster,然后重复步骤(1)和(2)。
最早的基于种子—扩充模型:MCODE算法 • 缺点:不能保证得到的cluster是稠密的,因为权值大的节 点彼此之间的连接不一定是稠密的。
相关文档
最新文档