11、结构生物信息学结构分析与预测2

合集下载

生物信息学中的基因组结构与功能预测

生物信息学中的基因组结构与功能预测第一章：基因组结构的概念与研究方法（200字）基因组是指生物体中的全部遗传信息的总和，包括基因序列、非编码DNA序列以及调控元件等。

研究基因组结构的目的是理解基因组的组织方式和基因之间的相互关系，以便深入探究基因功能的机制。

基因组结构与功能预测是生物信息学领域的重要研究课题，涉及到多种研究方法和技术。

第二章：基因组序列的特征与分析方法（400字）基因组序列是指一个生物体的全部DNA序列，它包含了基因以及其他非编码的DNA序列。

基因组序列的特征与分析方法是研究基因组结构的基础。

通过分析基因组序列，可以识别基因、预测基因的结构和功能，揭示基因组中的重要调控元件等。

基因识别是通过计算机算法和统计学方法来识别基因序列的起始位点和终止位点。

常用的基因识别方法包括基于序列比对的方法、基于统计模型的方法和基于机器学习的方法等。

此外，通过分析基因组序列的保守性、剪接位点和调控序列等特征，还可以预测基因的剪接事件和调控机制。

第三章：蛋白质编码基因的结构和功能预测（400字）蛋白质编码基因是基因组中的一类特殊基因，其编码产物是蛋白质。

对于蛋白质编码基因的结构和功能预测是生物信息学中的重要任务之一。

基因结构预测可以通过比对序列数据库、分析保守性和寻找编码框架等方法来实现。

功能预测则是通过比对已知蛋白质数据库、分析蛋白质结构、进行功能域和结构域的预测等来实现。

基于序列比对的方法和结构预测算法是较为常用的方法。

其中，比对方法可以通过相似性比对算法（如BLAST、Smith-Waterman算法）来进行。

蛋白质功能预测则可以通过预测功能域、分析结构、比对已知功能蛋白质等方法来实现。

第四章：非编码DNA的结构和功能研究（400字）非编码DNA是指基因组中不具有编码蛋白质的DNA序列。

尽管不编码蛋白质，但非编码DNA在调控基因表达、维持基因组稳定性等方面发挥着重要的功能。

对非编码DNA的结构和功能进行研究，可以深入理解生物体的基因组以及调控机制。

生物信息学中的序列分析和结构预测研究

生物信息学中的序列分析和结构预测研究生物信息学是一门可以将计算机科学与生物学相结合的学科。

生物信息学中的序列分析和结构预测是其中一个重要的研究方向。

随着DNA测序技术的发展，越来越多的生物数据被生成和解析，因此，对生物序列数据的分析和解释变得越来越重要。

本文将介绍生物信息学中的序列分析和结构预测的相关概念和方法。

一. 序列分析序列分析是通过对蛋白质、核酸、氨基酸或者整个基因组序列的分析，得到更深刻的生物学认识的一种方法。

序列分析是从原始的序列数据出发，提取特征，并进行分析、统计和比较的过程，可以用于证实两个生物体之间的亲缘关系、预测基因或蛋白质的功能、寻找生物学上的信号和标志，还可以发现新的蛋白质或RNA序列。

在序列分析中，最重要的任务是进行序列比对。

序列比对是找到两个以上的序列之间的相同部分或相似部分的过程。

基于全序列比对的方法，常见的是Smith-Waterman算法和Needleman-Wunsch算法。

虽然都是动态规划算法，但细节不同，算法时间复杂度、空间复杂度、对gap处理策略不同。

对于一些特殊的比对问题，如短序列比对、大规模序列比对，则需要采用一些高速的快速比对算法，如BLAST和FASTA。

基于序列比对的序列多重比对是一种常见的方式，它用于对多个序列进行分析。

一般有两种方法：动态规划算法和基于计算机Cluster算法。

其中动态规划算法包括POA（Partial Order Alignment）算法、MFA（Multiple sequence alignments by progressive alignment）算法、T-Coffee等，而Cluster算法则有CLUSTAL、MUSCLE等。

序列聚类是生物信息学中的一项重要任务。

序列聚类是指将已知的序列按照一定的规则分成若干个类别，从而对进化树或者结构预测等研究提供比对的基础。

经典的序列聚类算法有UPGMA、NJ、BOT等，通过这些算法可以从序列中找到相似性，更快地分析生物学中的相似性和差异性。

生物信息学中的蛋白质结构与功能预测

生物信息学中的蛋白质结构与功能预测蛋白质是生物体内的重要分子，它们在维持生命活动中起着至关重要的作用。

了解蛋白质的结构和功能对于深入理解生物学过程、疾病发展以及药物设计具有重要意义。

然而，实验测定蛋白质的结构及其功能是一项耗时费力且成本高昂的工作。

为了解决这一问题，生物信息学中的蛋白质结构与功能预测成为一种有效的方法。

蛋白质结构预测是生物信息学中的重要研究领域之一。

根据蛋白质的氨基酸序列，结合生物化学、物理化学以及计算机科学的方法，可以建立一系列模型和算法，预测蛋白质的三维结构。

蛋白质的结构是决定其功能的基础，通过结构预测可以揭示蛋白质的功能和相互作用，为后续进一步的研究提供指导。

在蛋白质结构预测中，常用的方法有同源建模、折叠动力学模拟和密度泛函理论等。

同源建模是基于已知蛋白质结构和与待预测蛋白质具有较高相似性的蛋白质序列进行模拟和比对，从而预测待预测蛋白质的结构。

折叠动力学模拟则模拟蛋白质在空间中折叠成稳定结构的过程，通过分子力学和数值计算方法，获得预测蛋白质结构的可能构型。

而密度泛函理论则是利用量子力学的计算方法，建立不同蛋白质结构和功能之间的关联，实现蛋白质结构预测和功能预测的目的。

除了蛋白质结构预测，生物信息学中的蛋白质功能预测也是一个重要领域。

蛋白质功能是指蛋白质在生物体内扮演的具体角色，如催化反应、运输分子以及信号传导等。

通过分析蛋白质的序列、结构、水平和进化等特征，可以预测蛋白质的功能。

常见的蛋白质功能预测方法包括序列比对、结构域分析和机器学习等。

序列比对是常用的蛋白质功能预测方法之一，它通过比对待预测蛋白质序列与已知功能蛋白质序列的相似性，推断待预测蛋白质的功能。

对于已知功能蛋白质序列，可以通过蛋白质数据库的检索和分析来获取。

结构域分析则是基于蛋白质中的功能结构域来预测其功能。

功能结构域是指蛋白质中识别和结合特定物质的功能区域，可以通过各种软件工具进行识别和注释。

机器学习是一种颇有潜力的蛋白质功能预测方法，它借助计算机算法和统计模型，通过对已知功能蛋白质的训练，预测待预测蛋白质的功能。

生物信息学中的蛋白质结构预测与分析方法研究

生物信息学中的蛋白质结构预测与分析方法研究生物信息学是将计算机科学、数学和生物学相结合的交叉学科，旨在利用计算机技术和算法来解决生物学中的问题。

在生物信息学领域中，蛋白质结构预测与分析一直是研究的热点之一。

蛋白质是生物体内执行生化功能的重要分子，其结构对其功能起着至关重要的作用。

因此，对蛋白质结构的预测和分析不仅有助于理解蛋白质的功能机制，还有助于药物设计和疾病治疗。

蛋白质结构预测方法主要分为多种：比对法、建模法和模拟法。

比对法是根据已知的结构相似蛋白质来预测目标蛋白质的结构，其中最常用的是同源建模方法。

同源建模方法通过寻找已知结构与目标蛋白质相似度高的结构模板，然后将模板结构与目标蛋白质序列进行比对，从而推断目标蛋白质的结构。

建模法是通过数学建模和计算方法来预测蛋白质的结构，其中较为常用的方法是蛋白质折叠模型和蒙特卡洛模拟法。

模拟法则是通过分子动力学模拟来模拟蛋白质的结构和动力学过程，从而预测蛋白质的结构。

在蛋白质结构分析方面，一些常用的方法包括结构比较、功能预测和网络分析。

结构比较是通过比较不同蛋白质的结构来揭示它们之间的相似性和差异性，从而探索其功能和进化关系。

功能预测则是根据已知结构和功能蛋白质的特征，来推断目标蛋白质的功能。

网络分析是通过建立蛋白质相互作用网络，来研究蛋白质在细胞内的相互作用关系和信号传递机制。

近年来，随着计算能力的不断提高和生物信息学算法的日益完善，蛋白质结构预测与分析方法也取得了长足的进步。

例如，深度学习技术在蛋白质结构预测中的应用不断扩大，通过训练大规模的数据集，可以有效地提高预测的准确性和可靠性。

另外，结合多种方法进行融合预测，如比对法和建模法的结合，也可以提高结构预测的准确性。

总的来说，蛋白质结构预测与分析方法的研究在生物信息学领域扮演着重要的角色，它不仅促进了对蛋白质功能的理解，还为药物设计和疾病治疗提供了有力的支持。

未来随着生物信息学技术的不断发展和创新，我们相信蛋白质结构预测与分析方法将会取得更大的突破，为生命科学领域的发展带来更多的可能性。

生物信息学中的蛋白质结构预测

生物信息学中的蛋白质结构预测蛋白质是生命活动中最为重要的一类生物大分子。

蛋白质的结构不仅决定了它的生物学功能，也决定了它与其他物质的相互作用。

因此，准确预测蛋白质的三维结构对于理解蛋白质生物学功能和设计新型药物具有重要意义。

蛋白质结构预测是生物信息学的重要研究领域之一。

整个蛋白质分子是由许多氨基酸残基组成的，而蛋白质的三维结构是由这些氨基酸残基的相对位置和某些其他的化学性质所决定的。

根据氨基酸序列来预测蛋白质的结构是一项十分复杂的任务，也是一个具有挑战性的问题。

目前，预测蛋白质结构的方法主要包括实验方法和计算方法两大类。

实验方法包括X射线衍射法、核磁共振法、电子显微镜等。

虽然实验方法可以得到高精度的蛋白质结构，但是时间和成本较高，且不适用于大规模的蛋白质结构的预测。

计算方法预测蛋白质结构是从氨基酸序列出发，通过分析氨基酸残基之间的相互作用力和空间构型来预测蛋白质的结构。

计算方法又可以分为基于比对的方法和基于物理力学的方法。

基于比对的方法是通过查找已知的蛋白质结构库，找到相似氨基酸序列的蛋白质结构，从而推测待预测蛋白质的结构。

这种方法可以获得结构精度较高的结果，但是对于新蛋白质的结构预测效果较差，因为其依赖于库中已有蛋白质的结构。

基于物理力学的方法是通过计算能量最小化来推测蛋白质的可能结构。

这种方法依赖于物理模型的建立，包括能量函数、模拟系统、模拟算法等。

能量函数是指一个复杂的计算模型，用来预测蛋白质的相互作用类型和强度。

模拟系统是指计算机模拟蛋白质分子的环境，包括水分子、离子等。

模拟算法是指用来求解最小能量状态的方法，如蒙特卡罗法、分子动力学法等。

在计算方法中，深度学习技术的应用为蛋白质结构预测带来了新的思路。

深度学习技术是一种通过训练神经网络来识别和分类数据的方法。

通过深度学习技术，可以从大量的结构数据中学习特征，并通过神经网络对蛋白质结构进行预测。

深度学习技术在蛋白质结构预测中的应用，可以通过提高结构预测的精度和速度，来为药物设计和生物学研究提供更多信息。

生物信息学中的蛋白质结构预测与分析

生物信息学中的蛋白质结构预测与分析蛋白质是生物体内的重要组分，负责多种生物功能的实现。

在生物信息学领域，蛋白质结构预测与分析是一个重要任务。

本文将介绍蛋白质结构预测与分析的基本概念、方法和应用。

蛋白质结构预测是指通过计算机模拟和理论推断等方法，预测出蛋白质的三维空间结构。

这对于了解蛋白质的功能和作用机制具有重要意义。

蛋白质的结构决定其功能，而蛋白质结构预测可以帮助科学家们理解蛋白质的功能和结构与功能之间的关系。

蛋白质结构预测的方法可以分为基于实验和基于计算两类。

基于实验的方法主要包括X射线晶体学和核磁共振等技术，可以直接确定蛋白质的原子级结构。

然而，由于实验条件的限制和技术的复杂性，直接实验法仅能获得少量蛋白质结构信息。

相比之下，基于计算的方法则更加高效、经济。

基于计算的方法主要包括序列比对、拓扑结构预测、折叠模拟等，可以提供大量的蛋白质结构预测信息。

序列比对是蛋白质结构预测的基础。

蛋白质的氨基酸序列决定了其最终的结构。

通过比对已知结构的蛋白质序列与目标蛋白质序列之间的相似性，可以预测目标蛋白质的结构。

拓扑结构预测是一种常用的方法，它利用蛋白质序列中存在的序列特征（如氨基酸窗口、氨基酸特异性突变等）来推断蛋白质的二级结构，并通过二级结构的拓扑关系来预测蛋白质的整体结构。

折叠模拟是一种较为高级的方法，通过模拟蛋白质氨基酸链的折叠过程，预测蛋白质的三维结构。

这些方法不仅可以单独应用，还可以相互结合，提高预测的准确性。

蛋白质结构预测的应用领域广泛，涵盖了生物学、医学、农业等多个领域。

在生物学研究中，蛋白质结构预测可以帮助科学家们理解蛋白质的功能和相互作用网络，探索生命的本质。

在药物研发中，蛋白质结构预测可以帮助科学家们设计更精确的药物靶点，并预测药物与靶点之间的相互作用方式。

在农业领域，蛋白质结构预测可以帮助科学家们改良作物，增加产量和抗病性。

此外，蛋白质结构预测还可以应用于食品科学、环境保护等多个领域。

生物信息学对基因结构与功能的预测与分析

生物信息学对基因结构与功能的预测与分析在过去的十年里，生物信息学的快速发展使得我们能够更深入地研究生命科学中的基因结构和功能。

生物信息学是一门使用计算机科学、数学和统计学等技术分析生物数据的学科。

生物数据的准确性和可靠性在生物信息学中显得极为重要。

生物信息学的目标是把海量的基因信息整合起来，用计算机模拟和处理这些数据来分析和预测基因的结构和功能。

1. 基因结构预测基因结构的预测是生物信息学中的一个重要问题。

人们早期推测推测基因有一定长度，随后发现基因不是在一个链上呈现的，也不是每一个基因都有类似的长度。

人们开发了一些基于遗传电子学、DNA序列、转录本、蛋白质、高通量基因识别和DNA芯片等技术的预测工具，以预测基因的结构。

例如：进行人类基因的注释工作时，借助于基因识别程序（如Glimmer、Genefinder、Fgenesh、TwinScan、Augustus、GeneID等）的帮助，可以为参考人类基因组、EST库、Unigene、mRNA、cDNA、序列等信息号召基因串和剪切位点。

这些工具可以在人工识别基因变体或顺序走私移位时自动过滤低质量的片段。

产生的基因注释结果可能在研究转录本的发生、组织特异性、基因家族、基因功能调控等方面提供科学家们上佳的泉源。

同时，生信分析人员可以选择各种合适的软件，根据不同的需求，进行各种精细化的注释分析，获得生物学意义较高的结果。

2. 基因功能预测基因功能的预测是通过在不同基因组的序列中查找相似性来确定特定的基因的功能。

生物信息学通过对基因序列和蛋白质结构的比较分析，确定基因功能。

从基因组测序数据中，我们可以获得大量的基因信息。

这些基因的特征就是由它们所编码的蛋白质组成的。

像BLAST这样的算法可以帮助我们在数据库中寻找相似的DNA序列和蛋白序列，以确定基因的功能。

此外，也可以用数据挖掘和机器学习技术来发现潜在的功能蛋白质家族。

生物信息技术在基因功能的预测中也扮演着重要的角色。

生物信息学中的序列分析与结构预测研究

生物信息学中的序列分析与结构预测研究序列分析与结构预测是生物信息学中的重要研究领域。

生物信息学是应用计算机科学、数据科学和统计学等技术来研究生物学问题的学科。

序列分析和结构预测是生物信息学中的两个核心任务，它们可以揭示生物分子的功能和结构，进而为疾病治疗、药物设计等领域提供重要的理论依据。

1. 序列分析序列分析是指对生物分子序列（如DNA、RNA和蛋白质序列）进行研究和分析的过程。

通过序列分析，我们可以了解到生物分子的组成、结构和功能。

在序列分析中，常用的方法包括序列比对、序列搜索以及序列分类等。

序列比对是将不同生物分子序列进行比对，找出它们之间的相似性。

通过比对分析，可以推测不同生物分子之间的亲缘关系，进而研究它们的功能和进化历史。

序列比对中的常见算法包括Smith-Waterman算法和Needleman-Wunsch算法。

序列搜索是从大量的生物序列数据库中搜索与目标序列相似的序列。

这种方法可以帮助研究人员找到与目标序列功能相似的已知序列，从而推断目标序列的功能和结构特征。

常用的序列搜索算法包括BLAST算法和FASTA算法。

序列分类是根据生物分子的序列特征将它们分为不同的家族或亚型。

通过序列分类，可以对生物分子进行分类研究，从而揭示它们的功能和结构变化。

常用的序列分类方法包括聚类分析、物种分类和基于机器学习的分类模型。

2. 结构预测结构预测是基于生物分子的序列信息来预测其三维结构的方法。

生物分子的结构决定了其功能和相互作用方式。

结构预测可以帮助我们理解生物分子的功能和相互作用机制，并为药物设计和疾病治疗等领域提供有力的支持。

蛋白质结构预测是结构预测中的重要任务之一。

蛋白质是生物体内最重要的功能分子，其结构与功能密切相关。

蛋白质结构预测可以通过多种方法进行，包括基于比对的模板建模、蛋白质折叠动力学模拟以及基于物理力学模型的结构预测等。

核酸结构预测是研究DNA和RNA分子的三维结构的过程。

DNA和RNA是生物体内的遗传物质，其结构和功能的解析对生物学的研究具有重要意义。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

脂肪族侧链：Ala、Ile、Leu、Met、Pro和Val。侧链的惰性很强，不易发生反应，极少直接参与蛋白质的功能，特别适于组装蛋白质的内部结构。
芳香族侧链：Phe、Trp、Tyr和His，参与‘堆积’ 相互作用。
氨基酸特性
小氨基酸：Ala、Cys、Gly、Pro、Ser和Thr。
His：pKa3 = 6.5,在生理pH值下大约只有10%的侧链带正电荷，而精确的pKa值取决于具体的微环境。
(Hydrophobic bond) 4. 范德华力(van der waals
force) 5. 二硫键 (Disulfide bond)
二级结构
•Secondary structure refers to highly regular local substructures. •蛋白质分子中某一段肽链的局部空间结构，即该段肽链主链骨架原子的相对空间位置，并不涉及氨基酸残基侧链的构象。 •二级结构的形成几乎全是由于肽链骨架中的羰基上的氧原子和亚胺基上氢之间的氢键所维持,其他作用力如范德华力等也有一定贡献。所以肽段间的氢键(Hydrogen bond)越多,他们形成的二级结构就越稳定 •周期性的结构模式： α-helix, β-sheet，loops, coils
•/scop/
2. CATH (Classification by Class, Architecture, Topology & Homology)
•/
3. DALI/FSSP: 蛋白质三级结构的比较
25
一些常见的结构性motifs
1. helix-turn-helix: e.g., DNA binding 2. helix-loop-helix: e.g., Calcium binding
3. : 2 adjacent antiparallel strands connected by short loop 4. Greek key: 4 adjacent antiparallel strands 5. : 2 parallel strands connected by helix
2. 不带电的极性氨基酸7种：Gly，Ser，Thr，Tyr， Cys，Asn，Gln。
3. 带正电荷的极性氨基酸3种（碱性氨基酸）：Lys， Arg，His。
4. 带负电荷的极性氨基酸2种（酸性氨基酸）：Asp， Glu。
氨基酸特性
两亲性：Arg、Lys、Gln和Glu，侧链中都包含有疏水和亲水部分，部分侧链可以包埋在蛋白质结构内部，另外部分则暴露在水环境中，是形成界面的理想分子。
Ala, Glu, Leu, Met：出现频率高 Pro, Gly Tyr, Ser：出现频率低
18
β-Strands & β-Sheets
1. 一般不单独出现，成对或多个出现 2. 链通过氢键连接，稳定结构 3. 相互作用的部分通过短的/长的loop连接 4. 平行或反平行的-sheet
19
反平行的β-Strands
球蛋白 (Globห้องสมุดไป่ตู้lar proteins): 疏水的内核 & 亲水的表面膜蛋白 (Membrane proteins): 特定的疏水表面
亚稳态 (marginally stable): 折叠之后的蛋白质无序性 (Intrinsically disordered): 许多蛋白质必须与其他蛋白质结合后才能够获得稳定的结构
可溶性球状蛋白质包装的主要原则：疏水侧链包在里面形成紧密核心，亲水侧链暴露在表面。
氨基酸特性
Amino acid properties：/aas/
氨基酸特性
另外有两种氨基酸：硒代半胱氨酸(Sec,U)和吡咯赖氨酸(Pyl,O)可以在蛋白质合成时插入到多肽链中，受遗传密码的修饰性阅读所指导。
称为肽键 • 主要化学键：肽键。键长为0.132nm。这个键长介于单键C-N（0.149nm）
和双键C＝N（0.127nm）之间，具有部分双键的性质。
一级结构是蛋白质空间构象和特异生物学功能的基础，但不是决定蛋白质空间构象的唯一因素。
13
Non-Bonded Interactions
1. 盐键 (Ionic bond) 2. 氢键 (Hydrogen bond) 3. 残基的亲、疏水性
3. MSD (Molecular Structure Database): 大分子的相互作用和结合位点 • /msd
45
蛋白质结构的分类
1. SCOP (Structural Classification of Proteins)：folds, superfamilies, and families
•DALI server
http://ekhidna.biocenter.helsinki.fi/dali_server/index.html
•DALI Database (fold classification)
http://ekhidna.biocenter.helsinki.fi/dali/start
结构生物信息学
内容提要
1. 蛋白质的结构与功能 2. 蛋白质结构的数据库、结构分类以及分子图形学 3. 蛋白质结构预测 ① 二级结构预测 ② 三级结构预测 4. 结构生物学 ① 核磁共振波谱学 ② X－射线晶体学 ③ 低温电镜技术
1. 蛋白质的结构与功能
蛋白质的结构 – 主要由一级序列所决定蛋白质的功能 – 主要由三级结构所决定
α-helix
1. 蛋白质中最多的二级结构 2. 平均长度：10个氨基酸残基 (10 Å)
• 长度范围：5-40aa • 每一圈：3.6个aa • 通过氢键 (~per 4aa) 稳定结构 • 通常在内核的表面，疏水残基向内，亲水残基向外
α-helix：氢键稳定结构
17
α-helix：氨基酸偏好
• 二级结构在空间上的排布 • 主要化学键：疏水键、离子键、氢键和 Van der Waals等四级结构
• 蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用，称为蛋白质的四级结构。
• 有些蛋白质分子含有二条或多条多肽链，每一条多肽链都有完整的三级结构，称为蛋白质的亚基 (subunit)
无序性 (Intrinsically disordered ): 介导蛋白质-蛋白质之间的相互作用，用来阐述没有确定规律性的那部分肽链结构。
24
模体（motif）：具有特殊功能的超二级结构
在许多蛋白质分子中，可发现二个或三个具有二级结构的肽段，在空间上相互接近，形成一个有规则的二级结构组合，被称为超二级结构。
Sec在许多生物中普遍存在，由UGA编码；Pyl很罕见，只存在于古生菌中，由UAG编码。
一级结构
• The primary structure refers to amino acid linear sequence of the polypeptide chain.
• 蛋白质的一级结构指在蛋白质分子从N-端至C-端的氨基酸排列顺序。 • Atomic compositions：C, H, N, O, P, S • 一个氨基酸的α羧基和另一个氨基酸的α氨基连接起来成为酰氨键，通常
蛋白质结构的数据库
1.PDB (Protein Data Bank): 蛋白质结构数据库 • /pdb/home/home.do
2. MMDB (Molecular Modeling Database): 分子模拟数据库 • /sites/entrez?db=structure
33
-Domain structures: 4-helix bundles
34
Up-and-down sheets and barrel
35
Greek key motifs
36
domains
TIM barrel fold
rossman
37
三级和四级结构
三级结构
• 整条肽链中全部氨基酸残基的相对空间位置。即肽链中所有原子在三维空间的排布位置。
26
H-T-H
H-L-H
27
ββ
28
Greek key
29
ββ
30
Domains：motifs 的组合
31
一个或多个domains
32
六种蛋白质的结构类型
(1) Domains: 螺旋束通过loops连接 (2) Domains: 主要是反平行片，两对片形成sandwich 结构 (3) Domains: 螺旋连接的平行的片 (4) Domains：螺旋和片各自形成单独的结构 (5) Multidomain ( ) ：包含多种domains (6) Membrane & cell-surface proteins
• 亚基之间的结合主要是氢键和离子键。
38
蛋白质功能与结构的主要类别——结合
Myoglobin (PDB: 1a6k)
39
蛋白质功能与结构的主要类别——结合
TATA binding protein (PDB: 1tgh)
40
蛋白质功能与结构的主要类别——催化
(DNA polymerase PDB:3pw0)
因此，预测蛋白质的结构和功能非常的困难
蛋白质结构的四个基本层面
Protein Structure 蛋白质结构进阶
5
氨基酸特性
考虑氨基酸理化性质时注意的主要因素：侧链基团的大小，和疏水性。常根据氨基酸侧链的疏水性进行分类。
1. 非极性氨基酸8种：Ala，Val，Leu，Ile，Pro，Phe， Trp，Met。
46
分子图形学
pymol
Discovery Studio
47
分子图形学