蛋白质的一级结构分析与预测方法
蛋白质的结构和功能分析

蛋白质的结构和功能分析蛋白质是生命体系中非常重要的一个组成部分。
它们是由氨基酸构成的长链分子,通过肽键连接起来。
在生物学中,蛋白质能够担任多种生理学功能,例如酶促反应、结构支持、传递信息、运输分子等等,因此对蛋白质的结构和功能的研究一直是生命科学的重要研究领域。
蛋白质的结构可以从不同层次进行分析,这里我们就分别从其一级、二级和三级结构来阐述。
一级结构: 氨基酸序列一级结构是蛋白质最基本的结构层次,它是由20种不同的氨基酸的序列组成的。
每个氨基酸分子都含有一个氨基基团(NH2)和一个羧基(COOH)以及一个侧链(R)。
氨基酸链的两个羧基与两个氨基之间的化学反应形成的肽键,将氨基酸序列串联在一起。
这个氨基酸序列不仅仅是蛋白质的化学结构基础,同时也决定了蛋白质的生物学功能。
通过改变氨基酸序列,可以改变蛋白质的结构和功能。
例如,精氨酸和半胱氨酸的配合可以形成二硫键,对蛋白质的折叠和稳定具有重要的作用。
二级结构: α螺旋和β折叠二级结构是蛋白质的一种常见结构类型。
蛋白质在空间中可以形成α螺旋或β折叠结构。
α螺旋结构是由氢键形成的一种紧密螺旋结构。
这种结构形式非常紧密,非常适合用于蛋白质分子内部的结构支持和稳定,并且也有一定的水解稳定特性。
β折叠结构则是由一些平行或反平行的β纤维形成的。
这些折叠形式可以强化蛋白质的支撑作用,这些β纤维被不同的蛋白质使用率不等地采用。
三级结构: 复合体和功能区域三级结构是蛋白质的最高结构层次。
它涉及复合体和功能区域。
蛋白质是非常多样化的大分子。
在生物体内,蛋白质可以形成很多与其他生物分子复合体和功能区域。
在蛋白质的结构中,局部化的结构或局部化的氨基酸序列与其他复合体分子的特定部分相互作用,使得复合体结构更加紧密,从而更有效地完成生物活性。
在复合体中,蛋白质通常不仅仅是结构支持功能,它们同样可以作为传递信息通路、酶、运输载体等功能。
蛋白质三级结构与它们在细胞中的生物学角色相吻合。
蛋白质的序列分析及结构预测

ratio of an ion.
精品课件
Peptide Fragmentation
Collision Induced Dissociation
H+
H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH
(1)直接测序
e.g. Protein Sequencing and Identification by Tandem Mass Spectrometry,
即用串联质谱仪测序
精品课件
串联质谱及其作用
• 两个或更多的质谱连接在一起,称为串联质谱。 •最简单的串联质谱(MS|MS)由两个质谱串联而 成,其中第一个质量分析器(MS1)将离子预分离 或加能量修饰,由第二级质量分析器(MS2)分析 结果。
蛋白质的序列分析及结构预测
精品课件
DNA sequence Protein sequence
Protein structure
精品课件
Protein function
一、蛋白质数据库介绍 二、蛋白质序列分析 三、蛋白质结构预测 四、应用 分子设计
精品课件
一、蛋白质数据库介绍
蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构 以及四级结构。依据这种结构层次, 将蛋白质数据库分为: 1. 蛋白质序列数据库:如PIR、SWISS-PROT、NCBI , 这些 数据库的数据主要以蛋白质的序列为主, 并赋予相应的注释; 2. 蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数 据库主要收集了蛋白质的保守结构域和功能域的特征序列; 3. 蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质 的结构测量数据为主; 4. 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中有 以序列比较为基础的序列分类数据库以及以结构比较为基础的 结构分类数据库之分。
蛋白质一级结构测序解析

蛋白质顺 序测定基 本方法路 线
纯蛋白质
二硫键拆开
末端氨基酸测定 专一性裂解
将肽段分离并测出顺序
将肽段顺序进行叠联以确定完整的顺序
测定一级结构的基本方法
基本步骤: (1) 测定末端氨基酸数目,确定蛋白质分子是由几条 肽链构成的; (2) 拆分蛋白质分子的多肽链,断开多肽链内二硫键 并分离出每条肽链。 (3)将肽链完全水解,测定每条多肽链的氨基酸组成 (4)鉴定多肽链N-末端、C-末端氨基酸残基 (5)至少用两种方法将多肽链水解成较小的片段; (6)分离并测定各肽段的氨基酸序列; (7)片段重叠法重建完整多肽链一级结构; (8)确定半胱氨酸残基间形成二硫键交联桥的位置。
胰岛素
-巯基乙醇
碘乙酸
尿素和盐酸胍与蛋白质的可能作用方式: a.与肽链竞争氢键 b.增加非极性侧链在 水中的溶解度
(NH)
脲或胍 脲或胍
(四)氨基酸组成的分析
氨基酸分析仪进行测 定,测定每条多肽链 的AA组成,并计算出 AA成分的分子比。
(五)裂解多肽链成较小的片段
酶解法:如胰蛋白酶
胰凝乳蛋白酶 化学法:如溴化氰法 羟胺法
二硫键位置的确定
+
ቤተ መጻሕፍቲ ባይዱ第 二 向
a b
-
pH6.5 图中a、b两个斑点是 由一个二硫键断裂 产生的肽段
+
第一向
-
Brown和Hartlay对角线电泳图解
(九)蛋白质测序举例
• 胰岛素测序自学
胰岛素的分子量为5734道尔顿,由51个氨基酸组成。
含A、B两条链,(A链:21肽 ,B链:30肽)。 A链和B链之间由两个链间二硫键(A7-B7,A20B19)连接,A链本身第6位和第11位的2个Cys残基之 间形成一个链内二硫键。
第五章 蛋白质分析及预测方法(新)

常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数
Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO) (N U)(N O)(P U)(P O)
三、二级结构预测的准确度 总的来讲,单序列的预测准确度在60%左右, 应用多重序列对比信息的二级结构预测准确 度在65%~85%之间。
从1994年起每两年国际上都要举行一届关于 蛋白质结构预测进展方面的评估(critical assessment of protein structure prediction, CASP)
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
Cuff J. A. and Barton G.(1999) Jones, D. T. (1999)
准确性
作者评测:Q3=57% CASP2:Q3=55.4%(41.9-62.5)
作者评测:Q3=63%
作者评测:Q3=70.1% CASP2:Q3=69.5% [57.3-87.2]
作者评测:Q3=75%
(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_seccons. html)服务,其二级结构预测可由用户从SOPM、 HNN、DPM、DSC、GOR、PHD、PREDATOR、 SIMPA96等12种方法中任选几种进行预测,然后根 据预测结果汇集整理成一个“一致的结果”
测定蛋白质一级结构的方法进展

测定蛋白质一级结构的方法进展蛋白质的一级结构,指的是蛋白质分子中氨基酸的序列,其测定包括蛋白质分子多肽链 的数目和多肽链中的氨基酸的精确序列两方面。
蛋白质的氨基酸序列测定对了解其结构与功 能以及生物进化、遗传变异的关系极有意义,对生命科学的发展更是起到了推进作用,而当 今蛋白质组的研究更需其支持。
测定蛋白质一级结构并作出肽谱的重要性在于:①可用于分 子克隆中寡核苷酸探针的制备;②为cDNA推导的氨基酸序列提供证据;③为重组DNA产生 的蛋白质作指纹分析;④蛋白质的完整结构鉴定;⑤确定翻译后修饰的位点;⑥决定簇的定位;⑦二硫键的确定。
蛋白质测序的基本思路是先将蛋白质用化学法或酶法水解成肽段, 再对肽段进行氨基酸 序列测定,其中化学法裂解的肽段一般较大,适于自动序列分析仪测定;酶法的优点是专一 性强,降解后肽段易纯化,产率较高,副反应少。
得到纯肽后需对肽段进行氨基酸测序,测 定方法主要是化学法,酶法也有一定意义。
化学法以Edman降解法最为经典,它对所有氨基 酸残基具有的普适性和近乎定量的高产率,使其成为近50年来N端顺序分析技术的基础。
近 年来,在蛋白质序列测定方面出现了一些新的技术手段,现对这些新技术作一些简单的介绍。
一、液相色谱(LC)HPLC是肽谱分析常用的工具,常用粒度为5-10μm的大孔烷基化硅胶吸附剂为色谱柱的 填料,通过增加有机溶剂的浓度进行梯度洗脱,其发展目标是加快分析速度和提高灵敏度.对 小肽的分离可选用小孔径C18载体,粒度5-10μm。
1、微柱高效液相色谱普通柱通常为4.6mmI.D.,而微柱液相色谱柱直径<2.1mm,它是由科学家Ishii首次提出 的,现在已成为Edman降解自动序列分析仪分离低微克量蛋白质和肽的基础。
它一般重现良 好,且用样量少,并能快速地进行蛋白质分析。
其流速通常为10-200μl/min,出峰时间短, 峰型尖窄,从而大大提高了检测灵敏度,可达1pmol;回收率高,因为微柱的载体少,非专一性 吸附少。
蛋白质结构预测的物理模型及机理

蛋白质结构预测的物理模型及机理蛋白质是生命体中重要的分子之一,除了生命活动,还常常被应用到各个领域中。
为了更好地开发和利用蛋白质,研究人员需要了解蛋白质结构的预测。
蛋白质结构预测,是指通过计算机模拟等方法,预测蛋白质分子的三维结构。
蛋白质结构预测的物理模型和机理是预测蛋白质结构的基础。
一、蛋白质的结构蛋白质是由多个氨基酸残基组成的长链分子,具有四种结构层次:一级结构、二级结构、三级结构和四级结构。
一级结构是指氨基酸在多肽链中的顺序。
二级结构是由各种二级结构单元通过氢键组合而成的,主要包括α-螺旋、β-折叠和未定型区域。
三级结构指多个二级结构单元之间的空间排布关系。
四级结构是由多个蛋白质分子聚集形成的多聚体结构。
二、蛋白质结构预测蛋白质结构预测是目前生物信息学领域中最热门、最具挑战性的问题之一。
因为,预测蛋白质结构需要同时考虑数学、化学、物理和计算机科学等多个学科的知识。
此外,蛋白质分子巨大复杂的化学性质更加增加了预测难度。
预测蛋白质结构的方法主要分为两类:实验方法和计算机方法。
实验方法主要包括X射线晶体学、NMR技术、电子显微镜等,但这些方法不仅费时费力,而且成本高昂,大部分实验条件都很苛刻,适用范围也受到很大的限制。
计算机方法则是一种快速、准确、可靠的预测方法。
目前主要的计算机方法有互补式马尔科夫模型(HMM)方法、人工神经网络(ANN)方法、分子动力学(MD)模拟方法等。
三、物理模型模拟蛋白质结构的物理模型是预测蛋白质二级结构、三级结构和四级结构的关键。
总的来说,物理模型主要包括相互作用模型和势模型两类。
相互作用模型是基于蛋白质分子的多种变量之间的相互作用关系。
常见的相互作用模型有统计机器学习模型、多层感知器模型、决策树模型等。
势模型是预测蛋白质结构的经典方法,理论基础是势能函数和力学方程。
势能函数包含键能、角能、二面角能和库伦能等多种能量,并依据物理规律具有几何惩罚项、非平衡惯性项、电荷条件等。
蛋白质结构预测(PDF-37)

蛋白质结构预测Protein Structure PredictionHaibo SunDepartment of BioinformaticsMininGene BiotechnologyG h lMarch 22, 2007背景结构分类:z一级结构也就是组成蛋白质的氨基酸序列z二级结构即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等l h b t lz三级结构即二级结构在更大范围内的堆积形成的空间结构z四级结构主要描述不同亚基之间的相互作用。
结构测定的实验方法z核磁共振z X光晶体衍射两种。
一级结构级结构预测基础预测基础:z 实验:在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构z 物理学的角度讲,系统的稳定状态通常是能量最小的状态二级结构反向β-折叠α-螺旋β-转角三级结构Turn or coilAlpha-helix Beta-sheetLoop and Turn蛋白质结构预测•Sequence secondary structure 3D structure Sequence →secondary structure →3D structure →functionProtein Structure PredictionProtein Structure Prediction •Prediction is possible because–Sequence information uniquely determines 3D structure–Sequence similarity (>50%) tends to imply structuralsimilarity•Prediction is necessary because–DNA sequence data »protein sequence data »structuredata199419972002.102007.3 Sequence (Swiss Port)40,00068,000114,033261,513 Sequence(Swiss-Port)4000068000114033261513 Structure (PDB)4,0457,00018,83842,474Methods预测方法Comparative (homology) modeling (同源建模法) Construct 3D model from alignment to proteinithsequences withknown structureg(g)(折识别法)Threading (fold recognition) (折叠识别法Pick best fit to sequences of known 2D / 3D structures (folds)Ab initio / de novo methods (从头预测法)Ab initio/de novo methods(Methods(1)同源性(Homology)方法:理论依据:如果两个蛋白质的序列比较相似,则其结构理论依据如果两个蛋白质的序列比较相似则其结构也有很大可能比较相似。
第五章蛋白质分析及预测方法

第五章蛋白质分析及预测方法蛋白质是生物体内最基本的功能分子之一,其功能与结构密切相关。
蛋白质分析及预测方法是研究蛋白质结构和功能的重要手段之一、随着生物信息学和计算机技术的发展,越来越多的蛋白质分析及预测方法被提出和应用。
一、蛋白质分析方法1.序列分析蛋白质序列是理解和预测蛋白质功能和结构的重要基础。
序列分析可以通过比对已知蛋白质序列数据库,找出与待研究蛋白质相似的序列,从而预测其功能和结构。
常用的序列分析方法包括同源序列比对、Motif和Domain分析等。
2.结构分析蛋白质结构是蛋白质功能的基础,因此结构分析对于研究蛋白质功能至关重要。
通常通过实验方法如X射线晶体学、核磁共振等获得蛋白质结构。
此外,还可以利用计算方法预测蛋白质的二级结构和三级结构。
常用的结构分析方法包括蛋白质结构比对、分子模拟等。
3.功能分析蛋白质功能是指蛋白质所具有的生物学功能,如催化反应、运输物质、信息传递等。
功能分析通过研究蛋白质的序列和结构,以及模拟蛋白质与其他生物分子的相互作用,来理解和预测蛋白质的功能。
常用的功能分析方法包括结构-功能关系预测、生物分子对接等。
二、蛋白质预测方法1.序列预测蛋白质序列预测是指通过分析蛋白质的氨基酸序列,预测其结构和功能。
常见的序列预测方法包括序列比对、Motif和Domain预测、蛋白质家族预测等。
这些预测方法可以通过比对已知蛋白质序列数据库,找出与待研究蛋白质相似的序列,从而推测其结构和功能。
2.结构预测蛋白质的三级结构是指蛋白质的原子级结构,包括蛋白质中氨基酸残基的空间排列。
结构预测是通过计算方法来预测蛋白质的三级结构。
常用的结构预测方法包括亚氨基酸残基建模、蛋白质折叠模拟等。
这些方法通过计算蛋白质中氨基酸之间的相互作用力和空间约束,来预测蛋白质的三级结构。
3.功能预测蛋白质功能预测是通过研究蛋白质的结构和序列,来预测蛋白质所具有的生物学功能。
常用的功能预测方法包括结构-功能关系预测、蛋白质分子对接等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质的一级结构分析与预测方法
蛋白质是一类生物分子,它们在机体中起到了举足轻重的作用。
蛋白质分子结
构的研究是生物学、药学等领域的热门研究方向。
在研究蛋白质的结构、功能和特性时,常常需要对其一级结构进行分析和预测。
本文将介绍蛋白质一级结构的分析与预测方法。
一、蛋白质一级结构概述
蛋白质的一级结构指的是其氨基酸序列。
蛋白质分子由20种左右的氨基酸组成,通过不同的排列组合构成不同的蛋白质。
氨基酸是一种含有羧基(-COOH)、氨基(-NH2)和一侧链的有机化合物,它们通过肽键相连构成肽链,进而构成蛋
白质分子。
蛋白质的一级结构是其二级、三级结构和功能的基础。
因此,研究蛋白质的一
级结构对于研究蛋白质的结构和功能具有非常重要的意义。
二、蛋白质一级结构分析方法
1. 比对分析法:比对分析法是一种通过比对蛋白质序列进行分析的方法。
这种
方法通过比对蛋白质序列与已知蛋白质数据库中的序列进行比较,从而推测出该序列可能具有的功能和结构。
比对分析法具有预测准确率高、速度较快等优点,因此被广泛应用于蛋白质序列的分析领域。
2. 生物物理学方法:生物物理学方法包括了一系列的实验方法,如X射线晶体衍射等,可以用来研究蛋白质的空间构象和形态。
通过对蛋白质分子的实验分析,可以进一步了解其一级结构及其对应的生物学功能。
3. 生物信息学方法:生物信息学方法是一种透过计算机程序对蛋白质序列进行
分析的方法。
生物信息学方法可以预测蛋白质的物理化学性质、表观结构和功能等,
包括常见的基于机器学习方法的蛋白质结构预测模型和关于序列特征分析、耦合谱分析的小标签搜索技术。
生物信息学方法是当前研究蛋白质的一级结构的热门方法之一。
它以深度学习模型和新算法为手段,对大量的已知蛋白质序列进行训练,然后使用预测模型对新蛋白质进行预测。
生物信息学方法具有速度快、预测准确率高等优点,因此仍在不断发展和完善。
三、蛋白质一级结构预测方法
1. 基于比对分析法的蛋白质一级结构预测:由于氨基酸序列是蛋白质一级结构的关键,因此比对分析法也可以被用于预测蛋白质一级结构。
这种方法使用的算法会利用数据库中已有的蛋白质结构,对蛋白质序列进行比对,从而得到一个较为准确的预测结果。
2. 基于机器学习的蛋白质一级结构预测:机器学习技术也可以被应用于蛋白质一级结构的预测。
机器学习的思想是从大量的数据中学习,这种方法可以通过训练大量的蛋白质序列,从而预测出蛋白质一级结构。
机器学习方法在精度和速度方面都有很好的表现,并且还可以被用于研究蛋白质的三级结构和功能。
3. 基于生物物理学的蛋白质一级结构预测:在生物物理学方法中,通过一些已知的氨基酸序列,尝试预测未知的蛋白质一级结构。
这种方法需要极高的技术和设备指导,并且成本较高,但是也是目前对蛋白质一级结构预测最准确和可靠的方法之一。
四、总结
蛋白质的一级结构分析和预测是研究蛋白质结构和功能的基础。
随着生物信息学技术和机器学习算法的发展,研究蛋白质一级结构的方法也得到了不断升级和改进。
但是,目前各种预测方法的精度仍需要进一步提高。
我们相信,随着技术的不
断发展和完善,研究蛋白质的一级结构将会有更加深入的认识,并对人类健康和医学领域做出重要贡献。