第五章蛋白质分析及预测方法新
蛋白质的序列分析及结构预测

ratio of an ion.
精品课件
Peptide Fragmentation
Collision Induced Dissociation
H+
H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH
(1)直接测序
e.g. Protein Sequencing and Identification by Tandem Mass Spectrometry,
即用串联质谱仪测序
精品课件
串联质谱及其作用
• 两个或更多的质谱连接在一起,称为串联质谱。 •最简单的串联质谱(MS|MS)由两个质谱串联而 成,其中第一个质量分析器(MS1)将离子预分离 或加能量修饰,由第二级质量分析器(MS2)分析 结果。
蛋白质的序列分析及结构预测
精品课件
DNA sequence Protein sequence
Protein structure
精品课件
Protein function
一、蛋白质数据库介绍 二、蛋白质序列分析 三、蛋白质结构预测 四、应用 分子设计
精品课件
一、蛋白质数据库介绍
蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构 以及四级结构。依据这种结构层次, 将蛋白质数据库分为: 1. 蛋白质序列数据库:如PIR、SWISS-PROT、NCBI , 这些 数据库的数据主要以蛋白质的序列为主, 并赋予相应的注释; 2. 蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数 据库主要收集了蛋白质的保守结构域和功能域的特征序列; 3. 蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质 的结构测量数据为主; 4. 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中有 以序列比较为基础的序列分类数据库以及以结构比较为基础的 结构分类数据库之分。
蛋白质定位预测方法综述及比较分析

蛋白质定位预测方法综述及比较分析引言:蛋白质是细胞中最重要的生物大分子之一,其功能与其所处的亚细胞定位密切相关。
准确预测蛋白质定位是理解蛋白质功能的重要一环。
随着计算机科学和生物学的快速发展,越来越多的蛋白质定位预测方法被提出。
本文将对常见的蛋白质定位预测方法进行综述和比较分析,以期为进一步研究提供参考。
一、蛋白质定位预测的重要性蛋白质在细胞内发挥特定的功能,其定位信息对于理解和研究蛋白质功能至关重要。
准确预测蛋白质的定位可以为进一步研究蛋白质的功能和相互作用提供指导。
二、蛋白质定位预测方法的分类1. 基于氨基酸序列的方法这种方法根据蛋白质的氨基酸序列进行预测。
其中,物化性质(如蛋白质溶解性、亲水性等)、序列模式(如信号肽、跨膜蛋白等)及机器学习算法(如隐马尔科夫模型、支持向量机等)是常用的预测依据。
2. 基于蛋白质相似性的方法这种方法通过比对已知定位的蛋白质序列和待预测的蛋白质序列的相似性来预测其定位。
常用的方法有同源比对、核酸水平的序列相似性等。
3. 基于蛋白质结构的方法这种方法通过预测蛋白质的三维结构来预测其定位。
常见的方法有蛋白质结构模拟、蛋白质结构域预测等。
三、常见蛋白质定位预测方法的综述与分析1. 密集神经网络(DNN)方法DNN方法利用神经网络模型和大量的训练数据来预测蛋白质的定位。
该方法具有较高的准确性和可靠性,但需要大量的训练数据和计算资源。
2. 支持向量机(SVM)方法SVM方法利用训练集中已知定位的蛋白质特征,建立分类模型来预测待测蛋白质的定位。
该方法较为简单,但需要手动提取特征。
3. 隐马尔科夫模型(HMM)方法HMM方法通过使用隐马尔科夫模型对序列数据进行建模,预测蛋白质的定位。
该方法能够捕捉到序列中的潜在模式,但对训练数据的依赖较大。
四、基于机器学习的蛋白质定位预测方法比较分析1. 准确性比较DNN方法在大规模训练数据和计算资源的支持下,具有较高的准确性。
SVM方法相对简单,准确性较低。
蛋白质结构的分析和预测方法

蛋白质结构的分析和预测方法蛋白质是构成生物体质量的基础,具有广泛而重要的生物功能。
研究蛋白质的结构和功能是生物学和药学等领域的重要研究课题。
而蛋白质结构的分析和预测是对蛋白质研究的基础,也是解决人类疾病等领域的重要突破口。
本文将从分析和预测两个方面介绍蛋白质结构的研究方法。
一、蛋白质结构的分析方法1. X射线晶体学蛋白晶体学是最广泛采用的蛋白质结构分析方法之一。
该方法利用X射线探测蛋白质晶体中原子的位置,并通过该信息推断蛋白质的三维结构。
通过X射线晶体学的方法已获得了数万个蛋白质结构,大大提高了蛋白质研究的深度和广度。
2. 核磁共振核磁共振是另一种常用的蛋白质结构分析方法,它利用一个强磁场对蛋白质分子进行瞬时激发,旋转确定的核磁共振信号,通过空间磁场分布的变化揭示分子的三维构造。
此外,核磁共振与分子动力学模拟等计算方法相结合,能够更细致地揭示分子的结构细节,如构象变化、动态性质、生理相关解离构象等。
3. 电镜电子显微镜是一种近期快速发展的方法,它可以在不需要结晶的情况下直接观察蛋白质体系的图像,从而解析它们的立体结构。
这种方法非常适合研究大分子复合物的结构和功能,因为它们相对比较柔软,不太容易得到光学衍射数据。
二、蛋白质结构的预测方法1. 基于结构相似性的预测基于结构相似性的预测是一种利用已知结构的蛋白质来推断其它蛋白质的结构的方法。
这种方法假设结构相似的蛋白质在空间构型上也具有相似性,因此可以通过分析相似结构间的差异性和共性来预测未知结构的蛋白质。
如蛋白质家族、同源模型等就是基于结构相似性预测蛋白质结构的重要手段。
2. 基于能量最小化的预测通过基于物理化学原理设计的力场,在预测过程中能够通过优化相互作用势能最小化的方式,预测蛋白质的结构。
这种方法在预测局部构象、构像变化、蛋白质之间的相互作用以及酶与其底物结合等方面非常重要。
3. 基于模板匹配的预测模板匹配预测是在已知蛋白质结构库中,通过匹配新蛋白质的序列与已知蛋白的结构来预测其结构的方法。
5 蛋白质序列分析

实例分析,使用PHYRE系统 进行 RGDV P2蛋白的折叠识别预测
3.从头预测
• Abinitio prediction:直接从序列本身预测三 维结构。
5.4抗原表位预测分析
• 抗原抗体结合反应中,抗原参与的结合部 位称为抗原表位(epitope)
实例:TargetP对RSvc2蛋白细胞定 位预测
5.2结构与分析及motif搜索
• 结构域(structure domain)是在蛋白质结 构中介于二级结构和三级结构之间的可以 明显区分但又相对独立的折叠单元,每个 结构域自身形成紧实的三维结构,可以独 立存在或折叠,但结构域之间的关系较松 散。 • 常见工具:InterProSan, SMART,Pfam。
实例:使用PROSITE数据库对 RGDV P8 蛋白进行motif搜索。
5.3空间结构预测
• 二级结构预测的意义。 • 在线工具,SSPro 等。
• Amino Acids: MAGKLQDGVAIAKIKETINLFCEYSFGDLVNNRREIVGRVHDARKN AALAWPDLIMNCFLHSASHYGVVKFLLDIALSTRFGDFTLLGVSSQ NYPFYDLHVVMTKAFCNLDFAKDEYLMINDSFSSMMSAFLDEEGV HSAMSMELGIHDIEDRFVLRTKRLFYIIHEYHMSLDEIEPWLEKLPD ASGGTLLNQKSKEQMRVIFSNAKVRIANSINLYVTNNTNSYNEYVR EVAEYVADLWNIQATTNTQGHENELADEDFGVLASSSQMNGTKS ELGDSVIKSDGNEVKLEPAVFTRNDDEEELAGSEFTSLLSDDGRM G Predicted Secondary Structure (8 Class): CCCHHHHHHHHHHHHHHHHHHHHHCHTHHHTTTCEHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEHETCE EEEEEECCSCCTCCHHEEEEHHHEECTCCCCCEECCCHHHHHH HHHHHHHHHCCEEEEHEEECECHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHTCCCTTTTCHHCHHHHHHHHHHHHHHHHHHH HHHHEEEETHHHHHHHHHHHHHHHHHHHHHEEEECCCTCCHH HHHHHHTTEEEECHHCTCCHCHTTCEEEECTTCEEEECCEEEEE CCCHHHHHHHHHHHHHCTTTCCC
蛋白质结构预测与分析方法

蛋白质结构预测与分析方法蛋白质作为生命体中最基本的分子之一,不仅在生物体中发挥着重要的催化、运输、调节、防御、信号传递等功能,同时也受到了科学家们的广泛关注。
因为在蛋白质的分子结构中蕴藏着其生物学功能的秘密。
为了深入理解蛋白质在生物体中的作用,结构预测与分析方法成为了不可或缺的重要手段。
一、蛋白质结构预测方法蛋白质结构预测是指根据蛋白质的氨基酸序列信息,利用计算机模拟和数学建模预测出蛋白质的三维立体结构的技术。
蛋白质结构预测技术的发展历程大致可以分为以下四个阶段。
1.基于序列保守性推断的序列比对方法序列比对法是一种最早传统的结构预测方法之一,主要基于了分子生物学的序列保守性假设,即同族蛋白质序列之间的关系比异族蛋白质序列要更为接近,同时也利用了同源因子结构的技术。
该方法的缺点在于较为依赖生物物种数据库中已知的同源蛋白质序列,并且无法解决折叠状态中序列变异路径不同的问题。
2.基于从头构建法的物理模拟方法从头构建法是指利用高中生物化学、数学及计算机科学相关知识,对蛋白质分子的构成及其相互作用力的原理进行理解,以及从分子结构相空间机构的角度进行蛋白质结构模拟的技术。
该方法可以绕过序列比对路径不同的缺点,但准确率较低、计算时间较长,并且需要较高的数学和物理素养。
3.基于同源建模法的结构对比和补全方法同源建模法是一种结构对比与预测的重要手段,通过利用已知蛋白质结构作为种子结构的替代物,比较它们所共有的氨基酸序列和结构,以此预测蛋白质分子之间的空间排列。
同源建模法适用于那当前有完整的同源确定模板结构的情况,但需要较强的生物学知识支持。
4.基于机器学习的预测方法机器学习是数据挖掘、人工智能和统计学应用领域中的一种技术,并被广泛用于蛋白质的结构预测和设计。
与其他方法相比,机器学习方法具有更好的处理大量数据的能力,准确度更高,并且可以较快的体现出不同环境的影响。
二、蛋白质结构分析方法蛋白质结构分析是指对已有蛋白质结构的进一步分析研究,从而深入探讨蛋白质在生物学功能中所起的角色和机理,目前主要涉及到以下几种方法。
第五章 蛋白质分析及预测方法(新)

常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数
Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO) (N U)(N O)(P U)(P O)
三、二级结构预测的准确度 总的来讲,单序列的预测准确度在60%左右, 应用多重序列对比信息的二级结构预测准确 度在65%~85%之间。
从1994年起每两年国际上都要举行一届关于 蛋白质结构预测进展方面的评估(critical assessment of protein structure prediction, CASP)
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
Cuff J. A. and Barton G.(1999) Jones, D. T. (1999)
准确性
作者评测:Q3=57% CASP2:Q3=55.4%(41.9-62.5)
作者评测:Q3=63%
作者评测:Q3=70.1% CASP2:Q3=69.5% [57.3-87.2]
作者评测:Q3=75%
(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_seccons. html)服务,其二级结构预测可由用户从SOPM、 HNN、DPM、DSC、GOR、PHD、PREDATOR、 SIMPA96等12种方法中任选几种进行预测,然后根 据预测结果汇集整理成一个“一致的结果”
蛋白质的一级结构分析与预测方法

蛋白质的一级结构分析与预测方法蛋白质是一类生物分子,它们在机体中起到了举足轻重的作用。
蛋白质分子结构的研究是生物学、药学等领域的热门研究方向。
在研究蛋白质的结构、功能和特性时,常常需要对其一级结构进行分析和预测。
本文将介绍蛋白质一级结构的分析与预测方法。
一、蛋白质一级结构概述蛋白质的一级结构指的是其氨基酸序列。
蛋白质分子由20种左右的氨基酸组成,通过不同的排列组合构成不同的蛋白质。
氨基酸是一种含有羧基(-COOH)、氨基(-NH2)和一侧链的有机化合物,它们通过肽键相连构成肽链,进而构成蛋白质分子。
蛋白质的一级结构是其二级、三级结构和功能的基础。
因此,研究蛋白质的一级结构对于研究蛋白质的结构和功能具有非常重要的意义。
二、蛋白质一级结构分析方法1. 比对分析法:比对分析法是一种通过比对蛋白质序列进行分析的方法。
这种方法通过比对蛋白质序列与已知蛋白质数据库中的序列进行比较,从而推测出该序列可能具有的功能和结构。
比对分析法具有预测准确率高、速度较快等优点,因此被广泛应用于蛋白质序列的分析领域。
2. 生物物理学方法:生物物理学方法包括了一系列的实验方法,如X射线晶体衍射等,可以用来研究蛋白质的空间构象和形态。
通过对蛋白质分子的实验分析,可以进一步了解其一级结构及其对应的生物学功能。
3. 生物信息学方法:生物信息学方法是一种透过计算机程序对蛋白质序列进行分析的方法。
生物信息学方法可以预测蛋白质的物理化学性质、表观结构和功能等,包括常见的基于机器学习方法的蛋白质结构预测模型和关于序列特征分析、耦合谱分析的小标签搜索技术。
生物信息学方法是当前研究蛋白质的一级结构的热门方法之一。
它以深度学习模型和新算法为手段,对大量的已知蛋白质序列进行训练,然后使用预测模型对新蛋白质进行预测。
生物信息学方法具有速度快、预测准确率高等优点,因此仍在不断发展和完善。
三、蛋白质一级结构预测方法1. 基于比对分析法的蛋白质一级结构预测:由于氨基酸序列是蛋白质一级结构的关键,因此比对分析法也可以被用于预测蛋白质一级结构。
第五章 蛋白质结构预测和分子设计

• TMpred (/software/TMPRED_form.html)
预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨 膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通
过加权打分进行预测。
•SignalP (http://www.cbs.dtu.dk/services/SignalP/) 信号肽(signal peptide)是未成熟蛋白质中,可被细胞转运系统识别的 特征氨基酸序列。预测蛋白质序列中信号肽的剪切位点。
级结构则效果很差。
二级结构预测的基本策略: (1)相似序列→相似结构
QLMGERIRARRKKLK
QLMGAERIRARRKKLK
结构?
(2)分类分析
α 螺旋
提取样本
预测….-Gly-Ala-Glu-Phe-….
聚类分析
学习分类规则
二级结构预测的方法:
(1)
经验参数法 又称Chou-Fasman方法,是一种基于单个氨基酸残基统计的经验预测方法。 通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子, 进而利用这些倾向性因子预测蛋白质的二级结构。
蛋白质结构预测主要有两大类方法:
(1)理论分析方法
通过理论计算(如分子力学、分子动力学计算)进行结构预测。
这种方法由于折叠前后的能量差太小、蛋白质可能的构象空间庞大和 质折叠的计算量太大等原因不大可行。 (2)统计的方法 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型, 进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
预测每个氨基酸的二级结构类型。 它将蛋白质结构类型分为全α蛋白、
全β蛋白和α/β蛋白,输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。 这个方法对全α蛋白能达到79%的准确率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了避免需要大量的实验数据,GOR方法将信 息函数分为多项加和形式,并且只考虑双残基 及单残基所携带的信息:一个残基携带其自身 的二级结构信息,同时携带有另一个残基的二 级结构信息,包含不依赖于另一残基类型的和 依赖于另一残基类型的信息。
三、酶切及断裂位点
ExPASy的PeptideCutter (/tools/peptidecutter /)工具可预测蛋白质序列在特定蛋白酶或 化学试剂作用下的断裂位点
PeptideMass (/tools/peptidemass.html)是ExPASy中另一个分析内切产 物的工具,它可计算蛋白质经特定酶水解 得到的肽片段的分子量、理论等电点等。
用ProtScale中Kyte & Doolittle 算法分析人 NPD1蛋白结果示例
ProtScale除能分析蛋白质的亲/疏水性外,还能 计算蛋白质的分子量、极性,预测二级结构等, 共包括了50余种不同的算法。
除ProtScale外,蛋白质序列统计分析 (Statistical Analysis of Protein Sequences, SAPS)是另一个计算蛋白质序列性质的在线工 具(http://www.isrec.isbsib.ch/software/SAPS_form.html),它可给出 查询序列的氨基酸组成、电荷分布(包括正/负 电荷聚集区的位置,强带电或不带电区段,电 荷分布连续性和模式等)、高疏水性和跨膜区 段、重复结构及周期性分析等属性。
(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_seccons. html)服务,其二级结构预测可由用户从SOPM、 HNN、DPM、DSC、GOR、PHD、PREDATOR、 SIMPA96等12种方法中任选几种进行预测,然后根 据预测结果汇集整理成一个“一致的结果”
常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数
Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO) (N U)(N O)(P U)(P O)
北京大学生物信息中心有该网站的镜像: /mirror/predictpro tein/。
3.GOR:网址为
http://molbioቤተ መጻሕፍቲ ባይዱ/compute/GO R.html 。
4、综合分析:位于法国里昂的CNRS(Centre National de la Recherche Scientifique)提供NPS@
第八章 蛋白质分析及预测方法
一、分子量及等电点
蛋白质的一些基本性质可直接分析其一级序 列而获得,如蛋白质的氨基酸组成、分子质 量、等电点(pI)、亲水性和疏水性、信号肽、 跨膜区等。
蛋白质的分子量和等电点可用一些本地化的 软件如MacVector、OMIGA、DNAMAN、 BioEdit等分析计算
三、二级结构预测的准确度 总的来讲,单序列的预测准确度在60%左右, 应用多重序列对比信息的二级结构预测准确 度在65%~85%之间。
从1994年起每两年国际上都要举行一届关于 蛋白质结构预测进展方面的评估(critical assessment of protein structure prediction, CASP)
(四)、基于多重序列比对的二级结构预测
基于单个序列的二级结构预测方法经过近三十年的发 展,虽然可以利用的实验数据有了数十倍的增长,但 预测准确度提高得不明显。在单个残基基础上的预测 准确度在58%左右。
近年来将同源序列的信息引入二级结构预测中,可以 将二级结构预测的准确度提高到70%左右。基于同源 序列对比的二级结构预测方法有两类:一类是自动程 序算法,如改进的GOR方法及PHD;另一类是专家参 与的多重序列对比,然后进行二级结构预测。随着多 重序列搜寻方法PSI-BLAST的发展,基于PSI-BLAST 多重序列比对的二级结构预测方法PSIPRED也见诸报 道。PSIPRED利用PHD的算法,将PSI-BLAST产生的 多重序列比对用于训练及预测,使预测准确度从70% 提高到77%。
Cuff J. A. and Barton G.(1999) Jones, D. T. (1999)
准确性
作者评测:Q3=57% CASP2:Q3=55.4%(41.9-62.5)
作者评测:Q3=63%
作者评测:Q3=70.1% CASP2:Q3=69.5% [57.3-87.2]
作者评测:Q3=75%
第二节 蛋白质二级结构预测
预测方法可以分为三类: 统计/经验算法,其中最为著名的有基于经
验统计规则的Chou-Fasman方法及基于信息 论算法的GOR方法;
物理—化学方法,基于对于蛋白质结构的物 理及化学原理的预测,如Lim方法;
机器学习方法,致力于将前两种方法的优点 结合起来。
一、二级结构预测方法:
30℃ 0.001 0.01 SP S P
97 66
45
30 20
Effect of temperature on the expression of PG1605 gene
Compute pI/Mw对pI的确定基于早期Bjellqvist等的 实验,该实验根据多肽在含高浓度(9.2~9.8mol/L) 尿素缓冲液中,酸性pH梯度(pH4.5至pH7.5)电 泳中的迁移率来计算其pK值和pI值,然后根据氨基 酸序列和pI关系来预测,因此在计算碱性蛋白质的 理论pI值时可能不准确。
ProtParam可计算蛋白质分子量、理论等电点、氨 基酸组成、各原子组成、在280nm附近的吸光系数、 估计半衰期、稳定指数等,但如蛋白质中含翻译后 修饰过的氨基酸残基,则不计算在内。
二、蛋白质辨识
(一)、基于组成的蛋白质辨识
可利用ExPASy的AA CompIdent (/tools/aacomp/)去检索
(一)、Chou-Fasman方法 Chou-Fasman方法曾经是现在仍然是最为普
遍应用的方法。 其基本出发点在于对于蛋白质20种不同的氨
基酸残基在不同的二级结构中出现的几率进 行统计分析得出在不同二级结构中出现的倾 向性。利用这种倾向性,加之周围残基的信 息,在一定规则的指导下就可以进行预测了。
β折叠规则 相邻5个残基中若有3个倾向于形 成β折叠,则认为是折叠核,折叠核向两端延 伸直至4个残基的平均折叠倾向性因子Pβ<1.0。 若延伸后的片断Pβ>1.05,则预测为β折叠。
转角规则 四肽片断,若位置专一性转角形成 几率f i+1·f i+2·f i+3·f i+4> 0.75×10-4 ,Pt > 1.0,并大于Pα和Pβ,则预测为转角。
预测规则简述如下:
α螺旋规则: 沿着蛋白质序列寻找α螺旋核,相 邻6个残基中若有至少4个残基倾向于形成α螺旋, 则认为是螺旋核。然后螺旋核向两端延伸,直至 四肽片断的α螺旋倾向性因子的平均值Pα<1.0为 止。此外,Pro不容许在螺旋内部出现,但可出 现于C末端以及N端的前三位,这也用于终止螺 旋的延伸。最后,将螺旋两端各去掉3个残基, 剩余部分若长于6个残基,而且Pα>1.03,则 预测为螺旋。
四、疏水性
在线可用ExPASy的 ProtScale(/cgibin/protscale.pl )程序。疏水性预测的方法 依赖于疏水性的衡量尺度,这里每个氨基 酸根据其一系列的物理特性(例如,溶解 性、跨越水-汽相时产生的自由能等), 被赋予一个数值以代表其疏水性。
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
二、二级结构在线预测
1.PSIPRED:基于多重序列比对算法,服 务器网址为
/psipred/。
2.PredictProtein: 基于PHD算法,网址: /predictprotein
在线可通过ExPASy的Compute pI/Mw (/tools/pi_tool.html) 或ProtParam(/tools/ protparam.html)计算。
Temperature IPTG(mM)
M
22℃ 0.001 0.1 S PS P
(三)、神经网络方法
神经网络学习系统是一组有相互联系强度的 非线性的单元。用于二级结构预测的神经网 络多为误差回传式反馈网络。用于二级结构 预测的神经网络方法有许多种,其中代表性 的为最早发表的Qian和Sejnowski方法以及广 泛应用的PHD方法。相对而言神经网络方法 便于应用,有较高的预测准确度。最大的缺 点是没有明确的物理化学意义。
其中,Pα为预测是α螺旋且预测正确的残基数 (positive),Nα为非α螺旋预测正确残基数 ( negative ) , Oα 为 非 α 螺 旋 却 被 错 误 预 测 为α螺旋的残基数(false positives),Uα为 是α螺旋却未预测出的残基数(miss)。
算法 GOR1
GOR3 DSC
作者 Garnier J, Osguthorpe DJ, Robson B
(1978) Gibrat JF, Robson B, Garnier J (1987)
King RD, Sternberg MJE (1996)
PREDATOR Yi & Lander
NNSSP
Frishman D, Argos P (1996) Yi TM, and Lander S (1993) Salamov AA, Solovyev VV (1995)