蛋白质结构域划分方法及在线服务综述

合集下载

蛋白质功能区域的结构分析

蛋白质功能区域的结构分析

蛋白质功能区域的结构分析蛋白质是生命活动中不可或缺的组成部分,它们能够承担多种功能,如催化化学反应、运输物质、传递信号、提供结构支持等。

而蛋白质实现这些功能的基础,就是它们内部的功能区域结构。

本文将对蛋白质功能区域的结构进行分析。

一、功能区域介绍蛋白质的功能区域分为结构域和功能域两种。

结构域包括了保守性极高的二级、三级和四级结构区域,而功能域则是蛋白质内部功能分区的最小单元。

其根据不同的功能,可以分为催化酶活性域、配体结合区域、信号传递域、膜蛋白跨膜区域等。

其中,催化酶活性域是蛋白质进行催化反应的最重要结构域之一。

催化酶活性域一般由多个氨基酸组成,它们相互作用,形成一个略微凹陷的活性中心。

活性中心内存在着一些关键氨基酸残基,它们能够催化反应的进行。

二、功能区域结构的分析蛋白质的功能区域结构与其功能密切相关。

例如催化酶活性域,其结构具有很高的特异性,可以催化十分复杂的化学反应。

催化酶能够高效地转化反应底物,并在反应中不消耗本身,大大提高了生命体的代谢效率。

配体结合区域的结构也十分特殊,一般采用蛋白质和配体互补的结构。

这种结构能够保证配体和蛋白质之间的相互作用为最强,从而发挥最大的生物学效应。

例如药物的结合到蛋白质受体时,具备十分高的特异性,从而能够实现精准、高效的药物作用。

信号传递域则是进行信息传递的重要组成部分。

它能够将外界刺激转化为内部信号,从而启动一些生物学反应。

一些结构上的微小变化,可以使这些域从关闭状态切换到开放状态,启动信号传递过程。

三、功能区域的作用蛋白质的功能区域结构决定了它们的生物学功能。

这些功能区域在生理、病理、药物研究等各个方面都有着重要的应用。

例如:1、药物研究:研究药物和蛋白质结合的情况,能够发现新的靶点或设计更高效的药物。

2、疾病研究:了解蛋白质功能区域的结构,可以帮助研究疾病的发生机理和寻找治疗手段。

3、生物纳米技术:了解蛋白质功能区域的结构,可以帮助研发新型的生物传感器或纳米材料。

蛋白质三级结构结构域

蛋白质三级结构结构域

蛋白质三级结构结构域
蛋白质的三级结构由多个结构域(Domain)组成。

结构域是指蛋白质中具有稳定、可折叠的三级结构的独立结构单元,通常在序列和结构上都具有相对独立性。

蛋白质的结构域可以单独折叠、稳定、结合其它结构域、并参与蛋白质的功能表现。

结构域被广泛应用于蛋白质结构和功能的分析、蛋白质工程和新药发现等领域。

常见的蛋白质结构域包括:1.球状域(globular domain):通常是蛋白质的功能中心,具有折叠成球形或近球形的特点。

2.α/β域(α/βdomain):由α-螺旋和β-折叠交替排列而成的蛋白质结构域,广泛存在于许多酶和结构蛋白中。

3.螺旋交替域(helical bundle domain):由多个α-螺旋交替排列而成的蛋白质结构域,具有一般的膜蛋白结构。

4.β钩状域(β-barrel domain):由β-折叠交替排列而成的蛋白质结构域,通常存在于多孔蛋白质和一些酶中。

5.索链域(coiled-coil domain):由两根或多根α-螺旋以螺旋交替的方式排列而成的蛋白质结构域。

此外,还有一些特殊的结构域如:翅膀结构域(winged helix domain)、重复域(repeat domain)等。

结构域的存在使得蛋白质的各个功能模块可以相互独立地进化,进而利于蛋白质的功能多样性和适应性的形成。

因此,结构域分析对于深入理解蛋白质结构和功能、预测蛋白质的结构和功能、以及设计新的蛋白质具有重要的作用。

文献综述-蛋白质多级结构的表征方式及测定方法

文献综述-蛋白质多级结构的表征方式及测定方法

文献综述蛋白多级结构的表征及测定方式摘要研究蛋白质的结构对生命科学有重要意义,因为明确了蛋白质的结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于生物医学和生物药学,都是非常重要的。

蛋白质分子的多级结构可划分为四级,以描述其不同的方面,包括蛋白二级结构、超二级结构和结构域、三级结构、四级结构。

关键词:二级结构超二级结构和结构域三级结构四级结构表征和测定方式1 蛋白多级结构概述蛋白质分子是由氨基酸首尾相连缩合而成的共价多肽链,每一种天然蛋白质都有自己特有的空间结构或称三维结构,这种三维结构通常被称为蛋白质的构象,即蛋白质的结构。

1.1 蛋白质的二级结构蛋白质的二级结构(secondary structure)是指多肽链中主链原子的局部空间排布即构象,不涉及侧链部分的构象。

蛋白质主链构象的结构单元包括:α-螺旋(α-helix)、β-片层结构(β-pleated sheet)或称β-折迭、β-转角(β-turn或β-bend)、无规卷曲(random coil)。

α-螺旋有以下几个特点:①多个肽键平面通过α-碳原子旋转,相互之间紧密盘曲成稳固的右手螺旋。

②主链呈螺旋上升,每3.6个氨基酸残基上升一圈,相当于0.54nm。

③每一个氨基酸残基中的NH和前面相隔三个残基的C=O之间形成氢键。

④肽链中氨基酸侧链R,分布在螺旋外侧,其形状、大小及电荷影响α-螺旋的形成。

β-片层结构有以下几个特点:①是肽链相当伸展的结构,肽链平面之间折叠成锯齿状,相邻肽键平面间呈110°角。

氨基酸残基的R侧链伸出在锯齿的上方或下方。

②依靠两条肽链或一条肽链的两段肽链间的C=O与H形成氢键,使构象稳定。

③两段肽链可以是平行的,也可以是反平行的。

即前者两条链从“N端”到“C端”是同方向的,后者是反方向的。

β-片层结构的形式十分多样,正、反平行能相互交替。

蛋白质 结构域

蛋白质 结构域

蛋白质结构域蛋白质结构域是指蛋白质分子中具有特定功能的结构模块。

蛋白质是生命的基本组成部分,其功能和性质与其结构密切相关。

蛋白质结构域的研究对于理解蛋白质的功能和进化起着重要作用。

蛋白质结构域可以简单理解为蛋白质分子中具有特定功能的“模块”。

蛋白质分子通常由多个结构域组成,每个结构域都承担着不同的功能。

结构域可以是一个独立的蛋白质单元,也可以是由多个结构域组合而成的功能模块。

通过组合不同的结构域,蛋白质可以实现多样化的功能。

蛋白质结构域的研究主要通过实验和计算方法进行。

实验方法包括X射线晶体学、核磁共振、质谱等技术,可以直接观察和解析蛋白质的结构。

计算方法则主要利用计算机模拟和算法,通过分析蛋白质的序列和结构信息,预测和推测结构域的存在和功能。

蛋白质结构域的分类可以根据其结构和功能进行。

根据结构,可以将结构域分为α螺旋结构域、β折叠结构域和α/β结构域等。

α螺旋结构域是由螺旋结构组成的,具有良好的稳定性和结构可预测性。

β折叠结构域由平行或反平行的β片段组成,形成折叠的结构。

α/β结构域则是由α螺旋和β折叠相互交替组成的。

根据功能,结构域可以分为结合结构域、催化结构域和信号传导结构域等。

结合结构域可以与其他分子结合,参与信号传递和调控等过程。

催化结构域则具有催化反应的功能,如酶活性。

信号传导结构域参与细胞信号传导的过程,如激酶和受体结构域。

蛋白质结构域的研究有助于揭示蛋白质的功能和进化机制。

通过研究不同物种中蛋白质的结构域,可以了解蛋白质的功能演化和适应性变化。

同时,蛋白质结构域的研究还有助于药物设计和生物工程领域的应用。

通过结构域的组合和改造,可以设计出具有特定功能和性质的蛋白质分子,用于药物研发和生物工程的应用。

蛋白质结构域是蛋白质分子中具有特定功能的结构模块。

通过研究蛋白质结构域,可以揭示蛋白质的功能和进化机制,为药物设计和生物工程的应用提供理论基础。

蛋白质结构域的研究是蛋白质科学领域的重要研究方向,对于推动生命科学和医药领域的发展具有重要意义。

蛋白质结构域名词解释

蛋白质结构域名词解释

蛋白质结构域名词解释蛋白质结构域是一类序列相关的结构,可以在蛋白质序列上发现。

这些结构在蛋白质结构与功能之间具有重要的联系,因此被广泛应用于蛋白质的研究和分析。

本文将简要介绍蛋白质结构域的定义、划分方式,用例子解释蛋白质结构域的作用,并讨论一些已知的结构域和结构域数据库。

一、白质结构域的定义蛋白质结构域是蛋白质结构的基本结构单元,是蛋白质结构的典型特征,它们可以用不同的结构表示方式来描述,通常被认为是蛋白质聚集成团的结构基本组成部分。

它们是一类相对独立的生物体结构特征,具有分子功能的内部结构特点,常常由跨膜或跨膜的肽链组成。

根据结构的不同,可以将蛋白质结构域划分为内在域、合成域和嵌合域。

1.在域(Intrinsic Domain)内在域是蛋白质结构中存在的结构域,指那些未受外部因素影响,只依靠自身结构完成特定功能的结构域。

它们经常由氨基酸组成,其表现形式与蛋白质结构大致相同,但在保持稳定性上都有不同的表现方式,它们可以把整个蛋白质分成不同的结构块,以便蛋白质的结构及其功能的研究。

2.成域 (Synthetic Domain)合成域是来自不同蛋白质结构的独立小结构,而不属于任何一个蛋白质,它们可以理解为复合物,就是由不同蛋白质结构组合而成的新型结构。

它们可以用作蛋白质定向相互结合的“模版”,它们的结构特征可以预测蛋白质的功能,并为分析其不同的行为和作用提供依据。

3.合域 (Linked Domain)嵌合域是由多个域组成的结构,它们的功能受到多个域的影响,而不仅仅受到一个域的影响。

它们可以通过氨基酸链来实现它们之间的结合,从而控制蛋白质的功能和结构。

嵌合域中包括了元件域、定向双亲域、侧翼域和螺旋瘤域等。

二、白质结构域的解释对于蛋白质结构域,它们可以在蛋白质序列上发现,并且它们可以提供有关蛋白质功能的有价值的信息。

蛋白质结构域中的基本特性,决定着蛋白质的功能和结构,有助于看清蛋白质的工作原理。

另外,它们也可以用于功能域的研究,比如蛋白质干扰、蛋白质聚集、蛋白质-蛋白质相互作用等。

三种分析蛋白结构域的方法

三种分析蛋白结构域的方法

三种分析蛋白结构域的方法蛋白质是生命体内重要的功能分子,它们通过其特有的三维结构来实现其功能。

蛋白结构域是指蛋白质结构中具有独立功能和收缩性的区域。

分析蛋白结构域的方法对于理解蛋白的功能和机制有重要意义。

以下是三种常用的分析蛋白结构域的方法。

第一种方法是比对分析。

比对分析是通过比对已知结构域的蛋白质序列和结构与待研究蛋白质序列和结构进行对比,以此来鉴定待研究蛋白质中的结构域。

比对分析常用的工具有BLAST和HMMER等。

BLAST(基本局部序列比对工具)通过比对两个蛋白序列的共同片段来确定相似性,可以帮助确定蛋白质的结构域。

HMMER(隐含马尔可夫模型比对工具)则建立了一个隐含马尔可夫模型,将待研究的蛋白质序列与已知结构域的蛋白质序列进行比对,以此来确定结构域。

第二种方法是结构预测。

结构预测是通过计算机程序对蛋白质序列进行建模,以预测其三维结构。

常见的结构预测方法有基于比对的序列相似性建模、基于物理力学的方法和基于机器学习的方法等。

基于比对的序列相似性建模方法通过比对已知结构域的蛋白质序列与待研究蛋白质序列来构建模型,以此来预测待研究蛋白质的结构域。

基于物理力学的方法则基于分子力学和物理化学原理,通过计算机模拟来推测蛋白质的结构。

基于机器学习的方法则使用已知结构域的蛋白质数据来训练算法,以此来预测待研究蛋白质的结构域。

第三种方法是功能簇分析。

功能簇分析是通过聚类算法来将蛋白质分为不同的簇,以确定其中的结构域。

常见的聚类算法有层次聚类、基于密度的聚类和K均值聚类等。

层次聚类是将样本逐步合并成不同的簇,直到达到预定的停止条件。

基于密度的聚类则是根据样本的密度将其分为不同的簇。

K均值聚类是将样本分为K个不同的簇,使得簇内的样本之间的差异最小化。

通过功能簇分析可以鉴定出具有相似功能的蛋白质结构域。

综上所述,比对分析、结构预测和功能簇分析是常用的分析蛋白结构域的方法。

这些方法能够帮助鉴定蛋白质中的结构域,进而理解其功能和机制。

蛋白质结构分析原理及工具-文献综述【精选】

蛋白质结构分析原理及工具-文献综述【精选】

蛋白质结构分析原理及工具(南京农业大学生命科学学院生命基地111班)摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。

文章侧重于工具的列举,并没有对原理和方法做详细的介绍。

文章还列举了蛋白质分析中常用的数据库。

关键词:蛋白质;结构预测;跨膜域;保守结构域1 蛋白质相似性检测蛋白质数据库。

由一个物种分化而来的不同序列倾向于有相似的结构和功能。

物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。

因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。

表一列出了常用的蛋白质序列数据库和它们的特点。

表一常用蛋白质数据库网址可能有更新氨基酸替代模型。

进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。

氨基酸替代模型可用来估计氨基酸替换的速率。

目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。

序列相似性搜索工具。

序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。

成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。

分为局部联配和全局联配。

常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。

全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。

多序列相似性搜索常用于构建系统发育树,这里不阐述。

表二列举了常用的成对序列相似性比对搜索工具表二成对序列相似性比对搜索工具网址可能有更新2 蛋白质一级结构分析(含保守结构域)蛋白质结构的基本信息来源于它的一级结构,分析蛋白质一级结构的第一步是将它们分成其组成部分,然后处理每个部分的结构[4]。

三种分析蛋白结构域(Domains)的方法

三种分析蛋白结构域(Domains)的方法

三种分析蛋白结构域(Domains)的方法三种分析蛋白结构域(Domains)的方法1,SMART入门,蛋白结构和功能分析SMART介绍SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART.SMART(http://smart.embl-heidelberg.de/),可以说是蛋白结构预测和功能分析的工具集合。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 结构域识别问题
蛋白质结构域识别问题不仅要准确识别蛋白
收稿日期:2019-01-10; 修回日期:2019-02-28 基金项目:国家自然科学基金资助项目(61772217) 作者简介:王 燕(1976—),女,副教授,博士.Email:yanw@hust.edu.cn 通信作者.Email:zdxue@hust.edu.cn
括 DROP[11-12]、Dompro[13]、DOBO[14]、ThreaDom 等[15].
目前已建立一些结构域数据和在线预测的服务 系 统,例 如,Pfam[16-17]、SMART[18-19]、SCOP[20-21]、 CATH[22-23]、InterPro[24]、ThreaDomEx[25]等.据 2016 年 2月份的数据统计,当前最完整的蛋白质序列 数据库(UniProt)中去掉重复序列后有 74897059 条序列,该数据库的结构域注释主要来自 Pfam、 SMART、SCOP、CATH以及 InterPro等结构域数据 库,其中只有 36449183(487%)的序列有结构 域注释.其 中 被 研 究 工 作 者 熟 知、并 广 泛 使 用 的 Pfam结构域数据库注释了 33529428条序列.究 其主要原因:已 解 析 三 级 结 构 的 蛋 白 质 及 其 近 同 源蛋白质序 列 只 占 有 较 小 的 比 例,当 前 技 术 还 无 法较大规模地从序列注释远同源蛋白质结构域. 本文从蛋白 质 结 构 域 识 别 问 题 的 提 出、结 构 域 边 界预测、不连 续 结 构 域 检 测 及 相 关 在 线 服 务 情 况 进行介绍,供相关研究者参考.
随着大 量 物 种 全 基 因 组 测 序 的 完 成,以 测 定 蛋白质结构为目的的结构基因组学和以研究蛋白 质功能为目的的蛋白质组学成为当前研究热点之 一.根据蛋白质三级结构的测定和功能研究,有利 于增深对疾 病 发 生 的 分 子 机 制 理 解,从 而 有 助 于 开发新的手 段 与 方 法 来 预 防、诊 断 疾 病 和 新 药 研 发 . [1-2]
图 1 4α葡聚糖转移酶结构与结构域示意图 Fig.1 Schematicdiagram ofstructureanddomainof4αglucanotransferase
一个优秀的结构域划分工具需要准确的判断 出在 氨 基 酸 序 列 位 置 93(94)、158(159)、391 (392)3个位置附近存在结构域划分边界,即把序 列划分为(1~93))(94~158)(159~391)(392~ 441)4个片段;同时要应该具有将片段(1~93)和 片段(159~391)组 装 成 一 个 结 构 域 的 能 力 (不 连 续结构域检测).对不具备这 2种能力的结构域划 分的工具来说,至少是不完美的.
结构域是蛋白质的一个结构层次,可以看作 是蛋白质结 构、折 叠、功 能、进 化 和 设 计 的 基 本 单 位.根据 PDB数据库统计[3-4],已知结构蛋白质中 约 40%为多结构域蛋白[5].结构域的不同组合使 多结构域蛋 白 质 具 有 不 同 的 三 级 结 构 和 功 能.准 确识别蛋白质结构域对结构基因组学选择目标序 列、结构解析至关重要,也是预测和理解蛋白质功 能关键的一步.自 1973年以来,若干研究者就蛋 白质结构域 划 分 问 题 进 行 研 究,可 归 纳 为 从 实 验 测定三维结构着手的结构域划分方法和不依赖三 维结构仅从 序 列 出 发 的 结 构 域 划 分 方 法.前 者 的 代表性工作包括 Wetlaufer[6]首次提出的基于原子 间接触密度划分结构域的方法,以及后期 Domain Parser[7-9]、PDP等 方 法 [10];后 者 的 代 表 性 工 作 包
第 18卷 第 1期
2019年 2月
广州大学学报(自然科学版)
JournalofGuangzhouUniversity(NaturalScienceEdition)
文章编号:16714229(2019)01002010
Vol.18 No.1 Feb. 2019
蛋白质结构域划分方法及在线服务综述
2 1
质结构域划 分 边 界,还 要 准 确 检 测 出 组 成 蛋 白 质 结构域的序列片段(即不连续结构域).
以多结 构 域 蛋 白 4α葡 聚 糖 转 移 酶 (PDB: 1LWH)为例来说明结构域识别过程,从序列出发 的结构域识别过程包括结构域边界预测和不连续 结构域检测 2个步骤.图 1a是 4α葡聚糖转移酶 的蛋白质结构图,图 1b是该蛋白结构域示意图. 从图 1a可以看出该蛋白包含 3个结构域:[1~93 (紫红色)|159~391(红色)]、[94~158(黄色)]、
[392~441(蓝色)].识别该蛋白的结构域的过程: 首先确定结构域边界 HIS93、ASN158、ARG391,这 3个残基将该蛋白分为 4段;然后检测不连续结 构域.对该蛋白,第 1段[1~93]与第 3段[159~ 391]构成不连续结构域,这从图 1b中可以更清晰 的看出,A1[1~93]和 A2[159~391]在序列上不 临近,但在三级结构上是一个结构域(即不连续结 构域).
王 燕 a,石 强 b,薛 志 东 b
(华中科技大学 a.生命学院;b.软件学院,湖北 武汉 430074)
摘 要:蛋白质结构域是研究蛋白质结构、功能与进化的基本单位,不同的结构域可组合出更为复杂的蛋白质 分子.划分蛋白质结构域后,可以从结构域的角度研究蛋白质的结构、功能与进化,降低了研究复杂度.根据已 知结构的蛋白质统计,有约 40%的为多结构域蛋白质,其中还存在一级结构上不临近的氨基酸序列出现在同一 个结构域的情况,即不连续结构域.文章给出了当前国内外有关蛋白质结构域边界预测、不连续结构域检测及 结构域数据库与在线服务的研究进展,供相关研究者参考. 关键词:蛋白质;结构域;不连续结构域;预测;在线服务 中图分类号:Q518 文献标志码:A
相关文档
最新文档