蛋白质序列结构的分析与预测
蛋白质序列分析及结构预测

整理课件
13
蛋白质三级结构
二级结构进一步折叠形成的结构域
整理课件
14
三级结构:蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或 折迭形成具有一定规律的三维空间结构,称为蛋白质的三级结构( tertiary structure)。蛋白质三级结构的稳定主要靠次级键,包括氢 键、疏水键、盐键以及范德华力(Van der Wasls力)等。
b. 来自人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分β折叠结构(2DGQ.pdb)侧面视
图,可见转角(turn);
c. 来自人pi型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分β折叠结构顶部视图,可见转角
(turn);
d. 来自人信号传递蛋白SMAD4(1DD1.pdb)的一个亚基中部分β折叠结构顶部视图,可见到大
整理课件
24
3. 蛋白质结构数据库
PDB( protein data bank , PDB) /pdb/
PDB 包括了蛋白质、核酸、蛋白质-核酸复合体以及病 毒等生物大分子结构数据, 主要是蛋白质结构数据, 这些数据来源于几乎全世界所有从事生物大分子结 构研究的研究机构, 并由结构生物学合作研究协会( RCSB) 维护和注释。
整理课件
17
二、蛋白质数据库
依据蛋白质的结构层次, 将蛋白质数据库分为:
1. 蛋白质序列数据库:如PIR、SWISS-PROT、NCBI , 这些数据库的 数据主要以蛋白质的序列为主, 并赋予相应的注释; 2. 蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数据库主要 收集了蛋白质的保守结构域和功能域的特征序列; 3. 蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质的结构测 量数据为主; 4. 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中有以序列 比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据
蛋白质结构的分析和预测方法

蛋白质结构的分析和预测方法蛋白质是构成生物体质量的基础,具有广泛而重要的生物功能。
研究蛋白质的结构和功能是生物学和药学等领域的重要研究课题。
而蛋白质结构的分析和预测是对蛋白质研究的基础,也是解决人类疾病等领域的重要突破口。
本文将从分析和预测两个方面介绍蛋白质结构的研究方法。
一、蛋白质结构的分析方法1. X射线晶体学蛋白晶体学是最广泛采用的蛋白质结构分析方法之一。
该方法利用X射线探测蛋白质晶体中原子的位置,并通过该信息推断蛋白质的三维结构。
通过X射线晶体学的方法已获得了数万个蛋白质结构,大大提高了蛋白质研究的深度和广度。
2. 核磁共振核磁共振是另一种常用的蛋白质结构分析方法,它利用一个强磁场对蛋白质分子进行瞬时激发,旋转确定的核磁共振信号,通过空间磁场分布的变化揭示分子的三维构造。
此外,核磁共振与分子动力学模拟等计算方法相结合,能够更细致地揭示分子的结构细节,如构象变化、动态性质、生理相关解离构象等。
3. 电镜电子显微镜是一种近期快速发展的方法,它可以在不需要结晶的情况下直接观察蛋白质体系的图像,从而解析它们的立体结构。
这种方法非常适合研究大分子复合物的结构和功能,因为它们相对比较柔软,不太容易得到光学衍射数据。
二、蛋白质结构的预测方法1. 基于结构相似性的预测基于结构相似性的预测是一种利用已知结构的蛋白质来推断其它蛋白质的结构的方法。
这种方法假设结构相似的蛋白质在空间构型上也具有相似性,因此可以通过分析相似结构间的差异性和共性来预测未知结构的蛋白质。
如蛋白质家族、同源模型等就是基于结构相似性预测蛋白质结构的重要手段。
2. 基于能量最小化的预测通过基于物理化学原理设计的力场,在预测过程中能够通过优化相互作用势能最小化的方式,预测蛋白质的结构。
这种方法在预测局部构象、构像变化、蛋白质之间的相互作用以及酶与其底物结合等方面非常重要。
3. 基于模板匹配的预测模板匹配预测是在已知蛋白质结构库中,通过匹配新蛋白质的序列与已知蛋白的结构来预测其结构的方法。
蛋白质结构预测与分析方法

蛋白质结构预测与分析方法蛋白质作为生命体中最基本的分子之一,不仅在生物体中发挥着重要的催化、运输、调节、防御、信号传递等功能,同时也受到了科学家们的广泛关注。
因为在蛋白质的分子结构中蕴藏着其生物学功能的秘密。
为了深入理解蛋白质在生物体中的作用,结构预测与分析方法成为了不可或缺的重要手段。
一、蛋白质结构预测方法蛋白质结构预测是指根据蛋白质的氨基酸序列信息,利用计算机模拟和数学建模预测出蛋白质的三维立体结构的技术。
蛋白质结构预测技术的发展历程大致可以分为以下四个阶段。
1.基于序列保守性推断的序列比对方法序列比对法是一种最早传统的结构预测方法之一,主要基于了分子生物学的序列保守性假设,即同族蛋白质序列之间的关系比异族蛋白质序列要更为接近,同时也利用了同源因子结构的技术。
该方法的缺点在于较为依赖生物物种数据库中已知的同源蛋白质序列,并且无法解决折叠状态中序列变异路径不同的问题。
2.基于从头构建法的物理模拟方法从头构建法是指利用高中生物化学、数学及计算机科学相关知识,对蛋白质分子的构成及其相互作用力的原理进行理解,以及从分子结构相空间机构的角度进行蛋白质结构模拟的技术。
该方法可以绕过序列比对路径不同的缺点,但准确率较低、计算时间较长,并且需要较高的数学和物理素养。
3.基于同源建模法的结构对比和补全方法同源建模法是一种结构对比与预测的重要手段,通过利用已知蛋白质结构作为种子结构的替代物,比较它们所共有的氨基酸序列和结构,以此预测蛋白质分子之间的空间排列。
同源建模法适用于那当前有完整的同源确定模板结构的情况,但需要较强的生物学知识支持。
4.基于机器学习的预测方法机器学习是数据挖掘、人工智能和统计学应用领域中的一种技术,并被广泛用于蛋白质的结构预测和设计。
与其他方法相比,机器学习方法具有更好的处理大量数据的能力,准确度更高,并且可以较快的体现出不同环境的影响。
二、蛋白质结构分析方法蛋白质结构分析是指对已有蛋白质结构的进一步分析研究,从而深入探讨蛋白质在生物学功能中所起的角色和机理,目前主要涉及到以下几种方法。
蛋白质序列分析与结构预测

蛋白质序列分析与结构预测概述:蛋白质是生物体内重要的功能分子,其结构与功能密切相关。
蛋白质序列分析和结构预测是在理解蛋白质结构和功能的基础上,对蛋白质进行更深入研究的重要工具。
本文将对蛋白质序列分析和结构预测进行详细介绍。
一、蛋白质序列分析1.1序列比对1.2序列标记蛋白质序列标记是根据其中一种特定的准则来标记氨基酸序列的功能或结构信息。
常用的标记方法有结构标记和功能标记。
结构标记根据氨基酸的二级结构特征来进行,如α-螺旋、β-折叠等;功能标记则是根据氨基酸序列所具有的特定功能进行,如酶活性、配体结合等。
1.3序列定位蛋白质序列定位是指确定蛋白质序列中特定区域的位置和范围。
常用的序列定位方法有Motif分析和Domain分析。
Motif分析可以识别蛋白质序列中的保守序列模式,从而找出具有特定功能的序列片段;Domain 分析可以识别蛋白质中具有自稳定结构和特定功能的结构域。
1.4序列功能预测二、蛋白质结构预测蛋白质结构预测是根据蛋白质的氨基酸序列预测蛋白质的三维结构。
蛋白质的结构决定了其功能和相互作用,因此准确预测蛋白质的结构对于理解蛋白质的功能和机制至关重要。
蛋白质结构预测的主要方法包括基于模板的建模方法和基于物理性质的全原子或粗粒化力场模拟方法。
2.1基于模板的建模方法基于模板的建模方法是利用已知的蛋白质结构作为模板,通过序列比对和结构比对来模拟未知蛋白质的结构。
常用的基于模板的建模方法有比对、模型构建和模型评估等。
2.2基于物理性质的模拟方法基于物理性质的模拟方法是使用物理原理和力场模拟来预测蛋白质的结构。
常用的模拟方法有分子力学模拟、蒙特卡洛模拟和蛋白质力场等。
结论:蛋白质序列分析和结构预测是对蛋白质进行深入研究的重要工具。
通过蛋白质序列分析可以了解蛋白质的进化关系、功能特征和结构信息;而蛋白质结构预测可以揭示蛋白质的三维结构,从而理解其功能和相互作用。
随着技术的不断发展,蛋白质序列分析和结构预测方法也在不断改进和完善,为研究蛋白质的机制和功能提供了更有力的工具。
蛋白质结构预测方法总结

蛋白质结构预测方法总结蛋白质是生物体内最为重要的分子之一,其结构决定了功能和活性。
然而,实验性确定蛋白质的三维结构是一项复杂且昂贵的任务。
因此,研究人员发展了多种计算方法来预测蛋白质的结构。
本文将总结几种常见的蛋白质结构预测方法。
1. 基于比对的方法一种常用的蛋白质结构预测方法是基于比对。
这种方法使用已知结构的蛋白质作为模板,将目标蛋白质的序列与模板进行比对,从而预测其结构。
比对可以使用多种方法,如BLAST、PSI-BLAST和HHpred等。
这些方法根据序列之间的相似性来预测结构,通常适用于那些与已知结构相似的蛋白质。
2. 基于折叠的方法基于折叠的方法是通过在能量最小化的条件下预测蛋白质的结构。
这些方法利用原子间相互作用的物理性质来预测蛋白质的稳定结构。
其中,分子力学模拟是常用的方法之一,通过计算分子中原子的相互作用以及能量最小化来预测蛋白质的结构。
此外,还有蒙特卡洛模拟和分子动力学模拟等方法用于蛋白质结构的预测。
3. 基于碱基预测的方法基于碱基预测的方法是根据目标蛋白质的氨基酸序列来预测其结构。
这些方法利用氨基酸的特性,如溶解度、疏水性和电荷分布等,来推断蛋白质的结构。
在这种方法中,常用的技术包括人工神经网络和随机森林等。
4. 基于演化信息的方法基于演化信息的方法是利用多个序列的比较来预测蛋白质的结构。
这些方法假设在进化过程中,保守的残基通常对于结构和功能至关重要,因此可以通过比较不同蛋白质序列之间的保守性来预测其结构。
常用的技术包括多序列比对和物种树建构等。
5. 基于统计的方法基于统计的方法是从大量已知结构的蛋白质中提取统计学规律,以预测新蛋白质的结构。
在这种方法中,通过分析蛋白质的物理特性和氨基酸残基之间的相互作用,建立统计学模型,从而预测目标蛋白质的结构。
常见的方法包括聚类分析、SVM和隐马尔可夫模型等。
综上所述,蛋白质的结构预测是一项复杂而具有挑战性的任务。
虽然没有一种方法能够完美地预测蛋白质的结构,但结合不同的预测方法可以提高预测的准确性和可靠性。
蛋白质的3D结构和功能预测

蛋白质的3D结构和功能预测蛋白质是构成生命体系的基本成分,在生物学领域中具有非常重要的地位。
为了更好地理解蛋白质的性质和功能,科学家们需要了解蛋白质的3D结构,以及如何从蛋白质的结构中预测出其功能。
在本篇文章中,我们将介绍蛋白质的3D结构和功能预测的相关知识,并探讨其中的一些挑战和前沿技术。
1. 蛋白质的3D结构蛋白质的3D结构是指蛋白质分子中氨基酸残基之间的空间排列方式。
蛋白质的3D结构对于其生物活性和功能起着至关重要的作用。
蛋白质的3D结构主要由其一级、二级、三级和四级结构的组合决定。
蛋白质的一级结构是指其氨基酸序列,而二级结构则是指氨基酸之间的氢键和羧基与氨基间的胺基合成物所构成的局部结构。
三级结构指的是整个蛋白质分子的立体结构,包括各个区域之间的相互作用。
四级结构指的是多个蛋白质子单位之间的互相组合形成的高级别结构。
2. 蛋白质的功能预测蛋白质的功能预测是指通过分析和预测蛋白质的氨基酸序列、3D结构和一些物理、化学和生物学特性,来预测蛋白质的功能。
蛋白质的功能很多,包括酶活性、信号传导、分子运输等等。
对于大多数蛋白质,特别是那些没有与已知蛋白质完全相同的序列(即没有同源性)的蛋白质,功能预测是非常具有挑战性的任务。
3. 蛋白质的功能预测挑战不同的蛋白质可能具有非常相似的3D结构,但是它们的功能可能完全不同。
这就意味着,蛋白质的3D结构与功能之间的关联是非常复杂而模糊的,这也是功能预测面临的主要挑战之一。
此外,蛋白质的结构和功能与环境有很大的关系,因此对于一些在特定环境下发挥作用的蛋白质,预测其功能也更加困难。
4. 蛋白质的功能预测技术针对以上挑战,科学家们开发了许多蛋白质功能预测方法。
其中一种常见的方法是对蛋白质进行结构生物信息学分析,该方法可以通过比对已知蛋白质的3D结构、同源序列、功能特征和一些生物学信息,来预测新的蛋白质的功能。
另外,一些计算机模型也能帮助预测蛋白质的功能。
例如,基于机器学习的方法可以通过对大量已知的蛋白质的结构和功能进行分析,来学习和预测新的蛋白质的功能。
第五章蛋白质分析及预测方法

第五章蛋白质分析及预测方法蛋白质是生物体内最基本的功能分子之一,其功能与结构密切相关。
蛋白质分析及预测方法是研究蛋白质结构和功能的重要手段之一、随着生物信息学和计算机技术的发展,越来越多的蛋白质分析及预测方法被提出和应用。
一、蛋白质分析方法1.序列分析蛋白质序列是理解和预测蛋白质功能和结构的重要基础。
序列分析可以通过比对已知蛋白质序列数据库,找出与待研究蛋白质相似的序列,从而预测其功能和结构。
常用的序列分析方法包括同源序列比对、Motif和Domain分析等。
2.结构分析蛋白质结构是蛋白质功能的基础,因此结构分析对于研究蛋白质功能至关重要。
通常通过实验方法如X射线晶体学、核磁共振等获得蛋白质结构。
此外,还可以利用计算方法预测蛋白质的二级结构和三级结构。
常用的结构分析方法包括蛋白质结构比对、分子模拟等。
3.功能分析蛋白质功能是指蛋白质所具有的生物学功能,如催化反应、运输物质、信息传递等。
功能分析通过研究蛋白质的序列和结构,以及模拟蛋白质与其他生物分子的相互作用,来理解和预测蛋白质的功能。
常用的功能分析方法包括结构-功能关系预测、生物分子对接等。
二、蛋白质预测方法1.序列预测蛋白质序列预测是指通过分析蛋白质的氨基酸序列,预测其结构和功能。
常见的序列预测方法包括序列比对、Motif和Domain预测、蛋白质家族预测等。
这些预测方法可以通过比对已知蛋白质序列数据库,找出与待研究蛋白质相似的序列,从而推测其结构和功能。
2.结构预测蛋白质的三级结构是指蛋白质的原子级结构,包括蛋白质中氨基酸残基的空间排列。
结构预测是通过计算方法来预测蛋白质的三级结构。
常用的结构预测方法包括亚氨基酸残基建模、蛋白质折叠模拟等。
这些方法通过计算蛋白质中氨基酸之间的相互作用力和空间约束,来预测蛋白质的三级结构。
3.功能预测蛋白质功能预测是通过研究蛋白质的结构和序列,来预测蛋白质所具有的生物学功能。
常用的功能预测方法包括结构-功能关系预测、蛋白质分子对接等。
生物信息学第七章蛋白质结构分析和预测

3、从头预测
前两种方法的缺点是只能预测那些有合适模 板的蛋白质的结构。
从头预测的方法不需要任何结构信息,直接 由蛋白质序列预测其空间结构。缺点是会产 生庞大的数据。 ➢分子动力学模拟 ➢二级片段堆积法
蛋白质三级结构预测
蛋白质的结构层次:
一级结构(氨基酸序列) 二级结构 三级结构 四级结构
采用ProtParam软件[1] (/tools/protpa ram.html)分析蛋白质的分子量、理论 等电点、氨基酸组成、带正负电荷的氨 基酸残基数目、消光系数、吸光系数、 疏水系数和半衰期等基本理化性质。
构象分布概率、氨基酸在蛋白质中的相对出现 概率以及残基出现在结构中的频率,最后得到 构想参数,根据此参数得出氨基酸形成二级结 构的倾向性,从而预测二级结构。
Chou-Fasman二级结构预测经验规则
α螺旋规则
➢ 相邻的6个残基中如果有至少4个残基倾向于形 成α螺旋,则认为是螺旋核。
➢ 然后从螺旋核向两端延伸,直至四肽α螺旋倾 向性因子的平均值pα<1.0为止。此外,不容许 脯氨酸在螺旋内部出现,但可出现在C末端以 及N端的前三位。
例 3 : α/β水解酶折叠模式具有多种功能: 胆固醇酯酶、双烯内脂水解酶、神经趋 化素、三酰甘油脂肪酶、丝氨酸羧肽酶、 卤代烷烃脱卤酶等等。
一、蛋白质结构的价值
2、结构与功能的非一致性
➢ 尽管蛋白质的结构对于预测其功能十分有帮 助,但需注意:结构与功能之间并不是简单 的一对一的关系。蛋白质具有相似的结构但 经过进化以后可以执行不同的功能。
生物信息学第七章蛋白质结构分析和预测
蛋白质结构预测是指从蛋白质序列预测 出其三维空间结构。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质体学报告生物数据库简介蛋白质序列结构的分析与预测-Ⅱ(5/9)演讲老师:吕平江老师指导老师:李永安老师生命科学系四组长:曾瓘钧 488340444组员:林泰宏 488340030廖智凯 488340195李岳锜 488340547 前言:这本书之前的章节关于数据库得到知识的讨论,可以运用不同的数据库得到大量可用的序列讯息,当我们准备看核甘酸序列及所有的蛋白质序列时,无论是直接决定,或是经由核甘酸序列中open reading frame的转译,这些包含决定其结构及功能的内在讯息,不幸的,实验针对这些讯息不能用未加工的讯息数据来产生,一些判定的技术,像是circulardichroism spectroscopy、optical rototary dispersion、X-ray晶体绕射(X-ray crystallography)及核磁共振(NMR),对于结构的特性是非常强而有力,但这些费时的技术实行,需要高度熟练和技术性上高要求的操作,在蛋白质序列和结构数据库的大小上比较中,SWISS-PORT中有87143个蛋白质(Release 39.0),但只有12624的蛋白质结构在PDB 中出现(July, 2000),试图关掉环绕在预测结构跟功能的方法中的gap center,然后这些方式可以在生化资料缺乏时,提供一个看的见蛋白质特性的方法。
此章节焦点集中在计算的技术,可以提供学上的发现基于本身蛋白质序列或其本身蛋白质家族的比较,不像核甘酸序列,是由4个化学上相似的base所组成,蛋白质中找到20个胺基酸,提供了结构及功能非常大的变异,这些残基具有不同的化学构造,因为胺基酸是碱或是酸、是亲水性或是厌水性、还是直炼或是具有分支链、或是芳香族,所以每一个残基皆可影响蛋白质全部物理特性,因此,在蛋白质domain上,每一个残基具有某一倾向去形成不同型的结构,这些特性,基于一个生化中心的教条:序列详述构造。
不管用何种预测性的技术,它的结果都只是预测,不同的方法,用不同的规则系统,或许是、或许不是我们所预测的结果,重要的是,如何去操作一个特有的预测方法,而不是系统规则上的黑盒子:一个方法或许是适用一个特有的事件,但不能完全适用于另一个事件,即使如此,适当的利用这些技术和初期的生化数据,可以对于蛋白质结构及功能上提供有价值的鉴识。
PROTEIN IDENTITY BASED ON COMPOSTION20个胺基酸的物理及化学特性完全的了解,基于这些特性,许多有用的计算工具,已经发展用来预测未知蛋白质的辨别,在the Swiss Institute of Bioinformatics中,很多工具经由ExPASy server获得。
ExPASy的焦点是双倍功能,一个经由2-D电泳分离的未知蛋白质之协助分析,和预测已知蛋白质的未知特性,这些利用SWISS-PORT的批注来作它们的预测,虽然计算结果例如在电泳分析上是有用的,但是在很多的实验范围上是有价值的,例如一些色层分析和沉淀分析的研究,在这这段落及接下来的段落,在这个ExPASy suite中是可被辨识的,但是接下来的讨论也包含很多有用的程序,包括许多有用的程序internet资源和这些工具的关联,会在这个章节陆续列出来讨论。
AACompldent and AACompSim(ExPASy)与其利用胺基酸序列去搜寻SWISS-PORT,还不如AACompldent用未知蛋白质胺基酸的组成去辨识是同似组成的已知蛋白质,当输入时程序,需要合适胺基酸组成、等电点(pI)、和蛋白质的分子量(如果已知)、适当的分类taxonomic class和任何特殊的关键词,除此之外,使用者必须选择6个胺基酸中的一个(constellations),这个可以影响分析如何执行,例如某一群(constellations)结合残基像似Asp╱Asn(D╱N)、Gln╱Glu(Q╱E)变成为Asx(B)、Glx(Z),或某些残基从分析中完全被除去,为了在数据库每一个序列,规则系统基于不同的序列和查询的组成之间,计算出分数,这个的结果可以用e-mail答复,其中包含三个等级的列表:一个列表基于从记载从taxonomic class来的所有蛋白质,不用考虑pI或蛋白质的分子量。
一个列表基于所有的蛋白质,不管taxonomic class,不用考虑pI或蛋白质的分子量。
一个列表基于记载的taxonomic class但是要考虑pI和蛋白质的分子量。
因为计算的分数是不同的测定,分数为零暗只在查询组成按序列记载之间的有正确一致性。
AACompSim,它是AACompldent的变形,执行分析的类似型态,但是,与其利用实验上来的胺基酸组成作基本的组成搜寻,还不如用SWISS-PORT protein的序列,在不同分数的计算用于Compute pI╱MW之前,理论上的pI和分子量先被计算,它可以提供证据指出跨越种界线的胺基酸是可以很好的被保留下来,而且藉由考虑胺基酸的组成,研究员可以侦测蛋白质间的微弱相似性,(这些蛋白质序列falls below 25﹪),因此,除了执行典型的数据库搜寻之外,组成的考虑可以提供暂蛋白质之间,提供额外的鉴识。
PROPSEARCH顺着像AACompSim的同路径,PROPSEARCH利用蛋白质的胺基酸组成,去侦测蛋白质之间微弱的关系,而且作者已经说明这个技术,可以简单地被用于去辨识相同protein family的成员,然而,这个技术比具有144个物理特性的AACompSim来的费力,而被用于分析其中包含分子量案大量残基的内含物厌水值和平均电荷,这个物理特性的搜集称为查询载体(query vector),而且,在目标数据库中,先计算每一个相同型态载体可以被比较(SWISS-PORT 和PIR)这个载体的数据库的计算有利于促进查询的过程时间,输入PROPSEARCH Web server 可以查询序列,程序输猪的例子例如图11.1这里human autoantigen NOR-90的序列,被用于作输入的查询,这个结果可以藉由distance score被分类,然后这个score代表经由PROPSEARCH找到查询序列和新序列属于相同family可能性,因此,在多数的事件中暗示共同的功能,distance score为10或10以下,指出大于87﹪的机会在两个蛋白质之间是有相似性的,而这个分数低于于8.7,可增加可靠性达94﹪,而分数低于7.5则,可增加可靠性达99.6﹪,这个结果的检查显示NOR-90它和很多核仁转录因子、protein kinases、a retinoblastoma-binding protein、the actin-binding protein radixin,和RalBP1、假定的GTPase target有相似性,一但这些蛋白质的功能不相似时,没有任何的hit需要被预期的;然而,这些大多数为DNA-binding protein,这些蛋白质可以打开相似domain的可能性而被运用两者选一的功能上之状况,至少,BLASTP search对于证明结果和确认critical residues是不可或缺的。
MOWSEThe Molecular Weight Search(MOWSE)的运算法则,是利用mass spectrometric(MS)techniques所得到的讯息,完整的蛋白质分子量和一些因用特殊的protease得到的相同蛋白质的分解物,都可以一起使用,给予数个实验测定的结果,一个未知的蛋白质可以很清晰的被确认,一但未知蛋白质没有完整或部分被定序,这个方法大致上可以缩减实验的时间。
和经由试剂所产生的the resultant masses以及peptide的组成一样,The MOWSE Web front end需要一开始序列的分子量和化学试剂的使用,a tolerance value可能被记载,指出在决定the determined fragment massese的正确性中的错误许可,计算方式基于the OWL nonredudant protein sequence database中的讯息,得分基于如何在分子量给予范围内的蛋白质中,片段分子量的存在,而输出是回复分类列表顶端30个分数,用OWL entry the name、相配的peptide序列和其它统计上的知识,simulation studies用5个或较少的输入peptide重量可以产生99﹪的正确率。
PHYSICAL PROPERTIES BASED ON SEQUENCECompute pI╱MW and ProtParam(ExPASy)Compute pI╱MW这个工具可以计算输入序列的等电点和分子量,pI的决定基于pK值,描述从中性到酸性pH值的变性环境中,对于蛋白质迁徙的研究,因为这个原因,作者警告pI 对于碱性蛋白质的测定是不正确的,分子量藉由在序列中,每一个胺基酸的平均isotopic mass添加,再加上一个水分子,藉由这些东西被计算出来,藉由FASTA格式化中的使用者、或a SWISS-PORT identifier、或加入数目,序列可以被供应而被记载,假如序列是被供给的,工具可以自动计算晚整的序列长度的pI值和分子量,如果SWISS-PORT identifier 是被给予的,进去的定义和生物路径是被显示出来的,而使用者可以详述胺基酸的范围,已至于计算在片段而不是在完整的蛋白质中被做出来,ProtParam它是更进一步的过程,根据输入的序列,ProtParam计算分子量、等电点、全部的胺基酸组成、理论上的estinction coefficeient、脂肪性索引、the prote in’s grand average of hydrophobicity(GRAVY)value,和其它碱性的physicochemical parameters,虽然这些似乎是非常简单的程序,某一个可以开始推测关于蛋白质在细胞得所在地,例如,具有高度比例的lysine和arginine 残基的一个碱性蛋白质,也许是一个DNA-binding protein。
PeptideMass(ExPASy)设计用于peptide mapping的实验,PeptideMass在暴露于protease,或是化学试剂之后决定一个protein的分裂产物,PeptideMass中可用于裂解的酵素和试剂为trypsin,chymotrypisn,LysC,cyanogen bromite,ArgC,AspN,和GluC(bicarbonate或phosphste),在合成peptide的分子量计算之前,Cystenines和methionines可以被修饰,藉由供应一个SWISS-PORT identifier而不是过去一排的序列,PeptideMass在SWISS-PORT批注之内可以利用知识去促进计算,例如,在裂解之前,移除signal sequences,或是包含已知的posttransnational modifications;在tabular format中给予开始的protein理论上的pI值及分子量,然后从SWISS-PORT来的变异中的the mass位置,被修饰的masses,以及peptide片段的序列,其结果可以被回复。