蛋白质三级结构预测

合集下载

蛋白质结构与功能预测

蛋白质结构与功能预测

蛋白质结构与功能预测蛋白质是生命活动的主要承担者,它们在细胞内执行着各种各样的功能,从催化化学反应到运输物质、传递信号,再到构成细胞结构等等。

要深入理解蛋白质的工作机制以及在生物过程中的作用,对其结构和功能的预测至关重要。

蛋白质的结构决定了其功能。

简单来说,蛋白质的结构就像是一个精心设计的机器,每个部件的形状和位置都对其整体的运行效果有着关键影响。

蛋白质的结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。

一级结构指的是蛋白质中氨基酸的线性排列顺序。

这就像是一串珠子按照特定的顺序串起来。

不同的氨基酸排列顺序决定了蛋白质后续可能形成的结构和功能。

二级结构则是在局部区域内形成的有规律的结构,比如常见的α螺旋和β折叠。

想象一下,这就像是把绳子折成特定的形状。

三级结构是整个蛋白质的三维空间构象,是由二级结构进一步折叠、盘绕形成的。

这时候,蛋白质就像是一个复杂的立体雕塑,各个部分相互作用,共同决定了其功能。

四级结构是指多个具有独立三级结构的多肽链通过非共价键相互结合形成的更复杂的结构。

那么,如何预测蛋白质的结构呢?传统的方法主要基于物理化学原理和实验技术。

例如,X 射线晶体学可以提供非常高分辨率的蛋白质结构信息,但这个方法需要获得高质量的蛋白质晶体,这往往是一个具有挑战性的步骤。

另一种常用的技术是核磁共振(NMR)光谱学,它能够在溶液状态下研究蛋白质的结构,但对于大分子量的蛋白质,其应用受到一定限制。

随着计算机技术和生物信息学的发展,基于理论计算的方法在蛋白质结构预测中发挥着越来越重要的作用。

这些方法大致可以分为同源建模、从头预测和折叠识别等。

同源建模是利用已知结构的同源蛋白质作为模板来构建目标蛋白质的结构模型。

这就好比如果我们知道了某个类似的“机器”是怎么构造的,就可以以此为参考来推测新“机器”的构造。

但这种方法的前提是要有与目标蛋白质高度相似且结构已知的同源蛋白。

从头预测则是在没有已知结构模板的情况下,完全基于物理化学原理和能量最小化原则来预测蛋白质的三维结构。

用DiscoverStuido所提供的蛋白质三级结构预测之同源模拟

用DiscoverStuido所提供的蛋白质三级结构预测之同源模拟

(一)摘要:利用Discover Stuido所提供的蛋白質三級結構預測之同源模擬(Homology Modeling)的方法,可以很快速及有效率的獲得離子通道蛋白之三維結構,再深入探討分析其結構所提供的資料,進一步了解離子通道蛋白的功能,可用來指引生物實驗,例如site - directed mutagenesis、rational drug design 和protein - protein interaction 等等。

模擬之後的結構再透過Discover Stuido所提供之LigandFit、LibDock 以及CDOCKER等計算方法,進行藥物與通道蛋白的對接,再經過Discover Stuido生物軟體計算預測藥物可能在通道上可能的結合位置以及可能相互作用的關鍵胺基酸。

(二)研究動機:細胞膜上的離子通道是所有生命體的基本要件,很多疾病,例如一些神經系統疾病和心血管疾病就是由於細胞上的離子通道功能發生紊亂或蛋白結構的缺陷所造成。

例如本實驗室研究項目之ㄧ的離子通道「NMDA受器」,在哺乳類動物中樞神經系統中扮演重要角色,從興奮性突觸的訊息傳遞、突觸的可塑性、到學習與記憶的整合此通道受器都參予其中,許多神經性疾病如急性腦中風或慢性的阿茲海默症、帕金森氏症、精神分裂症、癲癇等等都認為和NMDA受器有關,因此增加對它們的認識是幫助了解許多疾病狀態的重要基礎,目前許多離子通道已成為製藥界開發新藥的目標,離子通道的研究還有非常大的潛力和應用空間。

由於生物資訊近幾年來發展迅速,尤其基因體計劃的進行更增加了資料庫中的數量,包括核酸、蛋白質及結構等資料庫。

一般說來,蛋白質三維結構主要以實驗方法來決定,例如X-射線繞射法或NMR光譜法。

事實上,技術上的困難使得蛋白質三維結構決定的速度相當地緩慢,因此發展出利用電腦並依據蛋白質的序列來預測其三級結構的方法。

這些方法包含以物理化學原理的ab-initio methods 及以資料庫提供的序列和結構知識衍生的蛋白質摺疊認識fold- recognition methods(亦稱threading 穿針引線法),和同源模擬法(homology modeling)。

蛋白质三级结构的预测和分析方法

蛋白质三级结构的预测和分析方法

蛋白质三级结构的预测和分析方法蛋白质是由氨基酸组成的多肽链,是生命体中重要的组成部分。

蛋白质的功能由其三级结构决定,因此蛋白质三级结构的预测和分析是生物学研究的重要课题之一。

本文将介绍蛋白质三级结构的预测和分析方法。

一、蛋白质序列的预测蛋白质的三级结构是由其氨基酸序列决定的,因此蛋白质序列的预测是蛋白质三级结构预测的第一步。

蛋白质序列的预测分为两种方法:直接预测和间接预测。

直接预测方法是通过实验手段对蛋白质进行测定,并得到其序列。

其中,蛋白质测序是最常用的方法之一,目前已经非常成熟,在实验过程中准确率很高。

但是该方法耗时长、成本高,适用性窄。

间接预测方法则基于蛋白质序列的相似性进行预测,即通过基因组学、区域同源性、数据库、机器学习算法等,对已知的蛋白质序列进行比对和分析,得出未知蛋白质的序列。

其中,BLAST、PSI-BLAST等比对方法,能够在较短时间内对蛋白质序列进行预测,并在很大程度上提高了预测准确率。

此外,还有一些基于机器学习算法的预测方法,如SVM和神经网络方法等。

二、蛋白质结构预测蛋白质结构预测是指通过已知的蛋白质序列,预测出其原子级别的三维结构。

蛋白质结构预测目前主要分为三种方法:实验法、遗传算法和分子动力学模拟法。

实验法主要是通过分析蛋白质结晶体、核磁共振法和质谱分析等实验手段来预测蛋白质的空间结构。

这种方法具有实验数据来源充足、准确性高等特点,但是往往耗时长且成本高昂。

遗传算法是利用生物进化过程的基本原理,在计算机模拟中模拟蛋白质分子构象变化的过程,最终找到能够形成最稳定结构的构象。

这种方法通过逐代优化,逐渐提高预测蛋白质结构的准确度,但是也存在时间复杂度高、无法解释性和结果可重复性差等问题。

分子动力学模拟法是运用牛顿力学原理和一些计算模型,对蛋白质分子的运动进行数值模拟,从而得到蛋白质的三维结构。

这种方法的优点在于可以对蛋白质分子动力学过程进行模拟,具有可重复性高、得出结果的信息较多等特点,但是计算时间较长,计算机模拟结果的可信度也需要进一步验证。

蛋白质结构预测

蛋白质结构预测

6.picornaviral蛋白上的酶切位点(NetPicoRNA) 7.叶绿体传递蛋白(ChoroP) 8.跨膜螺旋(TMHMM) 9.跨膜螺旋的位臵(TOPPRED) 10.跨膜螺旋的位臵和方向(DAS) 数据库搜索: 1.基于预测的线程方法与完全基于序列的数据库搜 索(FRSVR) 2.查找远源同源蛋白序列的Markov model method (SAMT98)
评估: 1.二级结构预测准确性评估(EvalSec) 2. EVA:预测方法自动评估
PP工作原理
• PredictProtein是一项在因特网上提供氨 基酸序列分析,蛋白质结构和功能预测的服 务。通过电邮或因特网,您可以提交单一 蛋白序列或序列比对,PP将返回结果.
1.PP总流程
2. 序 列 分 析 流 程
• SWISS-MODEL反馈的第1封邮件 (Welcome to SwissModel) • SWISS-MODEL反馈的第2封邮件 (SwissModel-Fold-Recognition) • SWISS-MODEL反馈的第3封邮件 (SwissModelSecondaryStructureP...) • SWISS-MODEL反馈的第4封邮件 (SwissModel_TraceLog_AAAa06Zd K) • SWISS-MODEL反馈的第5封邮件 (SwissModel-Model-AAAa06ZdK) 中附有可用大分子结构展示软件 显示的文件AAAa06ZdK.pdb: • SWISS-MODEL反馈的第6封邮件 (SwissModel WhatCheck AAAa06ZdK...) • SWISS-MODEL反馈的第7封邮件 (PredictProtein results)
• META-PP提供单页界面,发送预测查询,到其他蛋白结 构预测服务器。在此界面提交待分析序列,选择所需要 的服务,您将以电子邮件的形式收到答复。在META-PP 提供的序列分析服务包括预测内容: 1.二级结构(JPRED) 2.模拟三维结构(automated modelling,SWISS-MODEL) 3.通过一系列方法和数据库推导三级结构(CPHmodels) 4.信号肽的剪切位点(SignalP) 5.哺乳动物体内黏蛋白的O-GalNAc(突变型)糖基化作用 位臵(NetOglyc)

蛋白质结构预测(PDF-37)

蛋白质结构预测(PDF-37)

蛋白质结构预测Protein Structure PredictionHaibo SunDepartment of BioinformaticsMininGene BiotechnologyG h lMarch 22, 2007背景结构分类:z一级结构也就是组成蛋白质的氨基酸序列z二级结构即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等l h b t lz三级结构即二级结构在更大范围内的堆积形成的空间结构z四级结构主要描述不同亚基之间的相互作用。

结构测定的实验方法z核磁共振z X光晶体衍射两种。

一级结构级结构预测基础预测基础:z 实验:在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构z 物理学的角度讲,系统的稳定状态通常是能量最小的状态二级结构反向β-折叠α-螺旋β-转角三级结构Turn or coilAlpha-helix Beta-sheetLoop and Turn蛋白质结构预测•Sequence secondary structure 3D structure Sequence →secondary structure →3D structure →functionProtein Structure PredictionProtein Structure Prediction •Prediction is possible because–Sequence information uniquely determines 3D structure–Sequence similarity (>50%) tends to imply structuralsimilarity•Prediction is necessary because–DNA sequence data »protein sequence data »structuredata199419972002.102007.3 Sequence (Swiss Port)40,00068,000114,033261,513 Sequence(Swiss-Port)4000068000114033261513 Structure (PDB)4,0457,00018,83842,474Methods预测方法Comparative (homology) modeling (同源建模法) Construct 3D model from alignment to proteinithsequences withknown structureg(g)(折识别法)Threading (fold recognition) (折叠识别法Pick best fit to sequences of known 2D / 3D structures (folds)Ab initio / de novo methods (从头预测法)Ab initio/de novo methods(Methods(1)同源性(Homology)方法:理论依据:如果两个蛋白质的序列比较相似,则其结构理论依据如果两个蛋白质的序列比较相似则其结构也有很大可能比较相似。

第11讲 蛋白质高级结构预测

第11讲 蛋白质高级结构预测

蛋白质结构分类数据库
SCOP (Structural Classification of Proteins) CATH (Class, Architecture, Topology,
Homology)
Number of folds is limited. Currently ~700,Total: 1,000 ~10,000
CATH的结构层次
ቤተ መጻሕፍቲ ባይዱ
有限的蛋白质折叠类型
258 种类型 165 种类型 141 种类型
334 种类型 50 种类型
90% of new structures submitted to PDB in the past three years have similar structural folds in PDB
If we can solve the above problem, then • Given a sequence, we can try each known fold,
the structure most compatible with the sequence
Concept of Threading
Thread (align or place) a query protein sequence
onto a template structure in “optimal” way Good alignment gives approximate backbone
Description
3D-JIGSAW
Fragment assembly
Automated webserver
RaptorX
remote homology detection, protein 3D modeling, binding site prediction

蛋白质三维结构预测及其功能鉴定

蛋白质三维结构预测及其功能鉴定

蛋白质三维结构预测及其功能鉴定蛋白质是生命的基本组成部分,具有多种生物学功能,如催化酶、结构蛋白、运输蛋白等。

了解蛋白质的结构和功能对于理解生命活动和研究相关疾病具有重要意义。

然而,实验方法获得蛋白质的三维结构所需的时间和资源较多,因此发展一种高效的蛋白质结构预测方法变得尤为重要。

蛋白质的结构主要由其氨基酸序列决定,即一维的氨基酸序列通过折叠作用形成其三维结构。

蛋白质折叠过程包括形成二级结构(α-螺旋、β-折叠)、三级结构(折叠成具有特定空间构象的形状)和四级结构(多个蛋白质相互作用形成的复合物)。

蛋白质预测的关键是预测其三级结构。

蛋白质三维结构预测有两种主要方法:实验方法和计算模型。

实验方法包括X射线晶体学、核磁共振和电子显微镜等,它们能够直接测定蛋白质的结构,但需要昂贵的设备和大量的时间。

相反,计算模型通过计算机算法估计蛋白质的结构,是一种高效的方式。

计算模型可以分为抽象建模和模拟折叠两种方法。

抽象建模方法根据已知的蛋白质结构去预测新蛋白质的结构,其中常用的方法是比对和比较。

比对方法根据已知的蛋白质结构和氨基酸序列的相似度进行预测。

比较方法则通过比较待测蛋白质的氨基酸序列与已知蛋白质结构数据库中的序列进行预测。

而模拟折叠方法则根据物理原理模拟蛋白质的折叠过程。

这些方法使用力场、动力学模拟和蒙特卡洛方法等来模拟蛋白质分子的运动和相互作用。

然而,模拟折叠方法仍然有许多挑战,例如计算复杂度高、时间和空间的限制以及准确性的限制。

在预测蛋白质结构的同时,功能鉴定也是重要的。

蛋白质的结构决定其功能,因此通过预测结构可以间接预测蛋白质的功能。

功能鉴定可以通过计算方法、结构比对和基因敲除等实验方法来实现。

计算方法利用统计学和模式识别来鉴定蛋白质的功能,例如通过分析氨基酸序列中的保守区域和功能域来预测。

结构比对方法则通过比较目标蛋白质的结构与已知功能蛋白质的结构相似性来预测功能。

基因敲除实验方法则通过对目标蛋白质基因进行敲除,观察蛋白质缺失后生物体的表型变化,从而推测其功能。

蛋白质结构预测和分子对接技术

蛋白质结构预测和分子对接技术

蛋白质结构预测和分子对接技术蛋白质是构成生物体的基础分子之一,包括酶、激素、抗体等各种生物大分子都是由蛋白质组成。

蛋白质具有多个级别的结构,通常被称为一级、二级、三级和四级结构。

一级结构指的是蛋白质的氨基酸序列,即在蛋白质分子中氨基酸的排列方式。

二级结构是指蛋白质中氨基酸残基在空间中的排列方式,通常包括α-螺旋和β-折叠。

三级结构是指蛋白质空间构型的整体结构。

四级结构则指蛋白质分子与其他蛋白质小分子之间的相互作用。

在蛋白质结构预测方面,具有重要意义的方法是基于比对的方法和基于物理学原理的方法。

基于比对的方法是通过对已知结构的蛋白质序列和目标蛋白质的序列进行比对,找出最接近的已知结构,并将该结构作为目标的预测结果。

这种方法的优点是速度快,但是预测精度较低。

基于物理学原理的方法则是通过模拟蛋白质分子内部的物理过程来得出蛋白质的结构,其精度比基于比对的方法更高,但计算量也更大。

在分子对接技术方面,分子对接技术是指通过计算机模拟来研究分子之间的相互作用,常用于新药研发和分子设计中。

目前常用的分子对接技术包括基于体积网格方法、基于可调节作用位点的对接方法和基于分子动力学模拟的方法。

基于体积网格方法通过将药物分子和蛋白质分子放置在一个三维空间网格中,以模拟药物分子与蛋白质分子之间的相互作用。

这种方法的优点是计算速度快,但往往忽略了蛋白质分子的柔性,导致预测结果可能不够准确。

基于可调节作用位点的对接方法则考虑到了蛋白质的柔性,将蛋白质的某些部分设定为可调节的作用位点,使得蛋白质可以自由地移动。

这种方法的优点是准确性比基于体积网格的方法更高。

基于分子动力学模拟的方法则是将蛋白质和药物分子看作一个整体,通过模拟它们的运动、相互作用等来研究它们的相互作用。

这种方法的优点是可以考虑到分子的柔性和运动过程,因此预测结果更加准确。

但是,这种方法的计算量也更大,需要使用超级计算机等大规模计算设备。

尽管蛋白质结构预测和分子对接技术现在已经取得了不少进展,但仍然存在许多问题和挑战。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

编辑版
20
此课件下载可自行编辑修改,此课件供参考! 部分内容来源于网络,如有侵权请与我联系删除!感谢你的观看!
蛋白质三级结构预测(Swissmodel)
编辑版
1
Swissmodel基于同源建模的方法 是目前三级结构预测当中基于同源建模方法做的最好 的一个之一 优点是:如果能得到结果往往很可靠 缺点是:很多时候得不到结果
编辑版
2
例:给定的example 进行三级结构预测
编辑版
3
主页
编辑版
4
编辑版
ห้องสมุดไป่ตู้
5
选用 Automated mode
编辑版
6
编辑版
7
输入序列、Email、姓名、序列名字,然后提交
编辑版
8
等待结果,结果发到邮箱中
编辑版
9
编辑版
10
三级结构可视化(Pdbviewer)
编辑版
11
编辑版
12
编辑版
13
编辑版
14
编辑版
15
编辑版
16
编辑版
17
编辑版
18
编辑版
19
作业:对给定的seq1 进行三级结构预测,并用Pdbview可 视化结果
相关文档
最新文档