5 蛋白质三级结构预测
5 蛋白质序列分析

实例分析,使用PHYRE系统 进行 RGDV P2蛋白的折叠识别预测
3.从头预测
• Abinitio prediction:直接从序列本身预测三 维结构。
5.4抗原表位预测分析
• 抗原抗体结合反应中,抗原参与的结合部 位称为抗原表位(epitope)
实例:TargetP对RSvc2蛋白细胞定 位预测
5.2结构与分析及motif搜索
• 结构域(structure domain)是在蛋白质结 构中介于二级结构和三级结构之间的可以 明显区分但又相对独立的折叠单元,每个 结构域自身形成紧实的三维结构,可以独 立存在或折叠,但结构域之间的关系较松 散。 • 常见工具:InterProSan, SMART,Pfam。
实例:使用PROSITE数据库对 RGDV P8 蛋白进行motif搜索。
5.3空间结构预测
• 二级结构预测的意义。 • 在线工具,SSPro 等。
• Amino Acids: MAGKLQDGVAIAKIKETINLFCEYSFGDLVNNRREIVGRVHDARKN AALAWPDLIMNCFLHSASHYGVVKFLLDIALSTRFGDFTLLGVSSQ NYPFYDLHVVMTKAFCNLDFAKDEYLMINDSFSSMMSAFLDEEGV HSAMSMELGIHDIEDRFVLRTKRLFYIIHEYHMSLDEIEPWLEKLPD ASGGTLLNQKSKEQMRVIFSNAKVRIANSINLYVTNNTNSYNEYVR EVAEYVADLWNIQATTNTQGHENELADEDFGVLASSSQMNGTKS ELGDSVIKSDGNEVKLEPAVFTRNDDEEELAGSEFTSLLSDDGRM G Predicted Secondary Structure (8 Class): CCCHHHHHHHHHHHHHHHHHHHHHCHTHHHTTTCEHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEHETCE EEEEEECCSCCTCCHHEEEEHHHEECTCCCCCEECCCHHHHHH HHHHHHHHHCCEEEEHEEECECHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHTCCCTTTTCHHCHHHHHHHHHHHHHHHHHHH HHHHEEEETHHHHHHHHHHHHHHHHHHHHHEEEECCCTCCHH HHHHHHTTEEEECHHCTCCHCHTTCEEEECTTCEEEECCEEEEE CCCHHHHHHHHHHHHHCTTTCCC
蛋白质三级结构的预测和分析方法

蛋白质三级结构的预测和分析方法蛋白质是由氨基酸组成的多肽链,是生命体中重要的组成部分。
蛋白质的功能由其三级结构决定,因此蛋白质三级结构的预测和分析是生物学研究的重要课题之一。
本文将介绍蛋白质三级结构的预测和分析方法。
一、蛋白质序列的预测蛋白质的三级结构是由其氨基酸序列决定的,因此蛋白质序列的预测是蛋白质三级结构预测的第一步。
蛋白质序列的预测分为两种方法:直接预测和间接预测。
直接预测方法是通过实验手段对蛋白质进行测定,并得到其序列。
其中,蛋白质测序是最常用的方法之一,目前已经非常成熟,在实验过程中准确率很高。
但是该方法耗时长、成本高,适用性窄。
间接预测方法则基于蛋白质序列的相似性进行预测,即通过基因组学、区域同源性、数据库、机器学习算法等,对已知的蛋白质序列进行比对和分析,得出未知蛋白质的序列。
其中,BLAST、PSI-BLAST等比对方法,能够在较短时间内对蛋白质序列进行预测,并在很大程度上提高了预测准确率。
此外,还有一些基于机器学习算法的预测方法,如SVM和神经网络方法等。
二、蛋白质结构预测蛋白质结构预测是指通过已知的蛋白质序列,预测出其原子级别的三维结构。
蛋白质结构预测目前主要分为三种方法:实验法、遗传算法和分子动力学模拟法。
实验法主要是通过分析蛋白质结晶体、核磁共振法和质谱分析等实验手段来预测蛋白质的空间结构。
这种方法具有实验数据来源充足、准确性高等特点,但是往往耗时长且成本高昂。
遗传算法是利用生物进化过程的基本原理,在计算机模拟中模拟蛋白质分子构象变化的过程,最终找到能够形成最稳定结构的构象。
这种方法通过逐代优化,逐渐提高预测蛋白质结构的准确度,但是也存在时间复杂度高、无法解释性和结果可重复性差等问题。
分子动力学模拟法是运用牛顿力学原理和一些计算模型,对蛋白质分子的运动进行数值模拟,从而得到蛋白质的三维结构。
这种方法的优点在于可以对蛋白质分子动力学过程进行模拟,具有可重复性高、得出结果的信息较多等特点,但是计算时间较长,计算机模拟结果的可信度也需要进一步验证。
第六章 蛋白质结构预测的原理与方法

25
五、蛋白质结构域的折叠模式与蛋白质结构分类数据库
26
1 蛋白质结构域的折叠模式
蛋白质结构域(domain): 是蛋白质分子中介于二级结构 和三级结构之间的结构层次。在分子量较大的球形蛋白质分 子中,一条多肽链可能折叠成两个或多个空间上互相独立的 区域,称为结构域。 结构域可以按照二级结构的种类及排列方式进行分类:
可以进行二级结构在线预测两个网站为: 1.PHD算法
PredictProtein网站的地址为:
/ 2.SSPro 4.0(神经网络) /
41
• PredictProtein
三、蛋白质二级结构预测的主要方法
35
• 二级结构预测的方法大体分为三代:
第一代是基于单个氨基酸残基统计分析
• 从有限的数据集中提取各种残基形成特定二级结构的 倾向,以此作为二级结构预测的依据。
第二代预测方法是基于氨基酸片段的统计分析
• 统计的对象是氨基酸片段
• 片段的长度通常为11-21
• 片段体现了中心残基所处的环境 • 在预测中心残基的二级结构时,以残基在特定环境形 成特定二级结构的倾向作为预测依据
16
④氢键。氢键是形成蛋白质中规则二级结构的主要作用力。
⑤熵效应。
17
熵效应:是热力学的一个概念。它是指在一 个封闭的并存在能量差异的系统中,虽然系 统内总能量保持守衡,但能量却总是不可逆 转地由高能区向低能区流动,最终达到能量
的分散与平衡的一种状态和趋势。
§6.2 蛋白质结构分析
一、蛋白质结构分类 蛋白质结构依据不同的层次可以分为四类: 1)一级结构(氨基酸序列)
③反平行的β折叠形成的β发夹具有特定的结构。 α螺旋间的短连接具有特定的结构与堆积。
蛋白质结构与功能的预测方法总结和资料汇总

蛋白质结构与功能的预测方法总结和资料汇总“折叠(fold)”的概念“折叠(fold)”是近年来蛋白质研究中应用较广的一个概念,它是介与二级和三级结构之间的蛋白质结构层次,它描述的是二级结构元素的混合组合方式。
二级结构的预测方法介绍:Chou-Fasman算法:是单序列预测方法中的一种,它是使用氨基酸物理化学数据中派生出来的规律来预测二级结构。
首先统计出20种氨基酸出现在α螺旋、β折叠和无规则卷曲中出现频率的大小,然后计算出每一种氨基酸在这几种构象中的构象参数Px.构象参数值的大小反映了该种残基出现在某种构象中的倾向性的大小。
按照构象参数值的大小可以把氨基酸分为六个组:Ha (强螺旋形成者)、ha(螺旋形成者)、Ia(弱螺旋形成者)、ia(螺旋形成不敏感者)、ba(螺旋中断者)、Ba(强螺旋中断者)。
Chou和Fasman根据残基的倾向性因子提出二级结构预测的经验规则,要点是沿蛋白序列寻找二级结构的成核位点和终止位点。
这种方法可能能够正确反映蛋白质二级结构的形成过程,但预测成功率并不高,仅有50%左右GOR算法:也是单序列预测方法中的一种,因其作者Garnier, Osguthorpe和 Robson而得名。
这种方法是以信息论为基础的,也属于统计学方法的一种,GOR方法不仅考虑被预测位置本身氨基酸残基种类对该位置构象的影响,也考虑到相邻残基种类对该位置构象的影响。
这样使预测的成功率提高到 65% 左右。
GOR方法的优点是物理意义清楚明确,数学表达严格,而且很容易写出相应的计算机程序,但缺点是表达式复杂。
多序列列线预测:对序列进行多序列比对,并利用多序列比对的信息进行结构的预测。
调查者可找到和未知序列相似的序列家族,然后假设序列家族中的同源区有同样的二级结构,预测不是基于一个序列而是一组序列中的所有序列的一致序列。
基于神经网络的序列预测:利用神经网络的方法进行序列的预测,BP (Back-Propagation Network) 网络即反馈式神经网络算法是目前二级结构预测应用最广的神经网络算法,它通常是由三层相同的神经元构成的层状网络,使用反馈式学习规则,底层为输入层,中间为隐含层,顶层是输出层,信号在相邻各层间逐层传递,不相邻的各层间无联系,在学习过程中根据输入的一级结构和二级结构的关系的信息不断调整各单元之间的权重,最终目标是找到一种好的输入与输出的映象,并对未知二级结构的蛋白进行预测。
蛋白质结构预测

6.picornaviral蛋白上的酶切位点(NetPicoRNA) 7.叶绿体传递蛋白(ChoroP) 8.跨膜螺旋(TMHMM) 9.跨膜螺旋的位臵(TOPPRED) 10.跨膜螺旋的位臵和方向(DAS) 数据库搜索: 1.基于预测的线程方法与完全基于序列的数据库搜 索(FRSVR) 2.查找远源同源蛋白序列的Markov model method (SAMT98)
评估: 1.二级结构预测准确性评估(EvalSec) 2. EVA:预测方法自动评估
PP工作原理
• PredictProtein是一项在因特网上提供氨 基酸序列分析,蛋白质结构和功能预测的服 务。通过电邮或因特网,您可以提交单一 蛋白序列或序列比对,PP将返回结果.
1.PP总流程
2. 序 列 分 析 流 程
• SWISS-MODEL反馈的第1封邮件 (Welcome to SwissModel) • SWISS-MODEL反馈的第2封邮件 (SwissModel-Fold-Recognition) • SWISS-MODEL反馈的第3封邮件 (SwissModelSecondaryStructureP...) • SWISS-MODEL反馈的第4封邮件 (SwissModel_TraceLog_AAAa06Zd K) • SWISS-MODEL反馈的第5封邮件 (SwissModel-Model-AAAa06ZdK) 中附有可用大分子结构展示软件 显示的文件AAAa06ZdK.pdb: • SWISS-MODEL反馈的第6封邮件 (SwissModel WhatCheck AAAa06ZdK...) • SWISS-MODEL反馈的第7封邮件 (PredictProtein results)
• META-PP提供单页界面,发送预测查询,到其他蛋白结 构预测服务器。在此界面提交待分析序列,选择所需要 的服务,您将以电子邮件的形式收到答复。在META-PP 提供的序列分析服务包括预测内容: 1.二级结构(JPRED) 2.模拟三维结构(automated modelling,SWISS-MODEL) 3.通过一系列方法和数据库推导三级结构(CPHmodels) 4.信号肽的剪切位点(SignalP) 5.哺乳动物体内黏蛋白的O-GalNAc(突变型)糖基化作用 位臵(NetOglyc)
第五章 蛋白质结构预测和分子设计

• TMpred (/software/TMPRED_form.html)
预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨 膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通
过加权打分进行预测。
•SignalP (http://www.cbs.dtu.dk/services/SignalP/) 信号肽(signal peptide)是未成熟蛋白质中,可被细胞转运系统识别的 特征氨基酸序列。预测蛋白质序列中信号肽的剪切位点。
级结构则效果很差。
二级结构预测的基本策略: (1)相似序列→相似结构
QLMGERIRARRKKLK
QLMGAERIRARRKKLK
结构?
(2)分类分析
α 螺旋
提取样本
预测….-Gly-Ala-Glu-Phe-….
聚类分析
学习分类规则
二级结构预测的方法:
(1)
经验参数法 又称Chou-Fasman方法,是一种基于单个氨基酸残基统计的经验预测方法。 通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子, 进而利用这些倾向性因子预测蛋白质的二级结构。
蛋白质结构预测主要有两大类方法:
(1)理论分析方法
通过理论计算(如分子力学、分子动力学计算)进行结构预测。
这种方法由于折叠前后的能量差太小、蛋白质可能的构象空间庞大和 质折叠的计算量太大等原因不大可行。 (2)统计的方法 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型, 进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
预测每个氨基酸的二级结构类型。 它将蛋白质结构类型分为全α蛋白、
全β蛋白和α/β蛋白,输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。 这个方法对全α蛋白能达到79%的准确率。
蛋白质结构预测(PDF-37)

蛋白质结构预测Protein Structure PredictionHaibo SunDepartment of BioinformaticsMininGene BiotechnologyG h lMarch 22, 2007背景结构分类:z一级结构也就是组成蛋白质的氨基酸序列z二级结构即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等l h b t lz三级结构即二级结构在更大范围内的堆积形成的空间结构z四级结构主要描述不同亚基之间的相互作用。
结构测定的实验方法z核磁共振z X光晶体衍射两种。
一级结构级结构预测基础预测基础:z 实验:在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构z 物理学的角度讲,系统的稳定状态通常是能量最小的状态二级结构反向β-折叠α-螺旋β-转角三级结构Turn or coilAlpha-helix Beta-sheetLoop and Turn蛋白质结构预测•Sequence secondary structure 3D structure Sequence →secondary structure →3D structure →functionProtein Structure PredictionProtein Structure Prediction •Prediction is possible because–Sequence information uniquely determines 3D structure–Sequence similarity (>50%) tends to imply structuralsimilarity•Prediction is necessary because–DNA sequence data »protein sequence data »structuredata199419972002.102007.3 Sequence (Swiss Port)40,00068,000114,033261,513 Sequence(Swiss-Port)4000068000114033261513 Structure (PDB)4,0457,00018,83842,474Methods预测方法Comparative (homology) modeling (同源建模法) Construct 3D model from alignment to proteinithsequences withknown structureg(g)(折识别法)Threading (fold recognition) (折叠识别法Pick best fit to sequences of known 2D / 3D structures (folds)Ab initio / de novo methods (从头预测法)Ab initio/de novo methods(Methods(1)同源性(Homology)方法:理论依据:如果两个蛋白质的序列比较相似,则其结构理论依据如果两个蛋白质的序列比较相似则其结构也有很大可能比较相似。
第11讲 蛋白质高级结构预测

蛋白质结构分类数据库
SCOP (Structural Classification of Proteins) CATH (Class, Architecture, Topology,
Homology)
Number of folds is limited. Currently ~700,Total: 1,000 ~10,000
CATH的结构层次
ቤተ መጻሕፍቲ ባይዱ
有限的蛋白质折叠类型
258 种类型 165 种类型 141 种类型
334 种类型 50 种类型
90% of new structures submitted to PDB in the past three years have similar structural folds in PDB
If we can solve the above problem, then • Given a sequence, we can try each known fold,
the structure most compatible with the sequence
Concept of Threading
Thread (align or place) a query protein sequence
onto a template structure in “optimal” way Good alignment gives approximate backbone
Description
3D-JIGSAW
Fragment assembly
Automated webserver
RaptorX
remote homology detection, protein 3D modeling, binding site prediction
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
穿针引线方法(折叠识别方法) • 有很多蛋白质具有相似的空间结构,但它们 的序列等同部分小于25%,即远程同源。
• 对于这类蛋白质,很难通过序列比对找出它 们之间的关系,必须设计新的分析方法。
• 对于一个未知结构的蛋白质(U), 如果找到一个已知结构的远程同源蛋白质 (T), 那么可以根据T的结构模板通过远程同源模型 化方法建立U的三维结构模型。
• 全局优化方法 遗传算法 分解-结合法 离散化方法
分子动力学
• 方法 对蛋白质中原子间的作用力进行建模 用动力学方程跟踪蛋白质折叠时每个原子的位置 求解这些方程的解析解是极其困难的 用离散动力系统的方法来确定数值解
• 问题 模拟蛋白质折叠过程是非常消耗时间的 模拟 10-9 秒的蛋白质折叠过程大约需要一天时间 蛋白质的实际折叠时间大约在 10-4 秒的数量级或者更 多 需要超级计算机
至于最后建立三维结构模型则是非常困难的
• 线索化的主要思想: 利用氨基酸的结构倾向(如形成二级结构 的倾向、疏水性、极性等),评价一个序 列所对应的结构是否能够适配到一个给定 的结构环境中。
• 建立序列到结构的线索的过程称为线索化, 线索技术又称折叠识别技术。 • 线索化或者折叠识别的目标是为目标蛋白质 U寻找合适的蛋白质模板,这些模板蛋白质 与U没有显著的序列相似性,但却是远程同 源的。
NO
结构合理性评估
YES
结构模型
分子式:pGlu-His-Trp-Ser-Tyr-Gly-Leu-Arg-Pro-Gly-NH
模 板 加模板
同源模建确定一对柔性分子相应功能团可能的空间取向
3. 同源建模法的局限性
传统的比较建模是通过 PSI-BLAST 找到 已知结构的相关蛋白。最近如进行 profile - profile 比较和有效利用结构信息的更加 复杂的方法已不仅显著增加了比对的质量而 且远程同源 (remote homologue) 检测的能力。 因此,比较建模和折叠识别在基于模板的建 模方法中的区别现已十分模糊。开发新的比 较建模和折叠识别的算法导致网上各种预测 方法的出现,这包括结构预测 meta- 服务器。
预测结果准确率: • 对于具有60%等同的序列,用上述方法所建 立的三维模型非常准确。若序列的等同部分 超过 60% ,则预测结果将接近于实验得到的 测试结果。 • 一般如果序列的等同部分大于 30%,则可以 期望得到比较好的预测结果。
同源建模
数据库搜索
选择模板
依据模板构建骨架模型
环状、侧链的构建,优化
• 令代表核心折叠C中的环到序列S中空位的 映射,显然是通过线索化而确定的。
令f(t)是进行比对的得分函数,其定义如下:
f(t) = g1 (v,t) + g2 (u,v,t) + g3 (,t)
• g1 (v,t) 评价氨基酸残基v所处的位置 • g2 (u,v,t) 评价残基u和v的相对位置,如果u和v 键合,则得 分高; • g3 (,t)评价环区,根据环区的大小进行打分。
C1, C2,„, Cm为数据库中核心折叠C的m个核心区域 Cij为第i个核心区域第j个氨基酸位置
每一个核心区域由若干个氨基酸残基构成
• 设t是一个从序列到核心折叠的线索,那么t 说明了序列S的哪些元素si,sj,sk,…代表核心 区域C1, C2, C3,…的起始位置。 这实际上是一种从序列S到核心折叠C的比对
新的趋势 混合预测方法 在比较建模法和折叠识别法中使用从头预 测法来预测部分难以找到模板的片断 在从头预测法中使用二级结构预测的结果 和其他已知结构信息辅助建模
• Meta-predictor 使用多个预测方法 对收集的结果进行综合比较和分析 改进收集的结果
本章小结
• 重点介绍一些常用的蛋白质结构分析技术 获取蛋白质结构的实验方法 预测蛋白质结构的理论方法 蛋白质结构比对 蛋白质二级结构预测 蛋白质三级结构预测 • 随着蛋白质分析技术的不断深入,将促进我们从 系统生物学的层次全面了解蛋白质的生物学功能
1)片段组装法:SWISS-MODEL 2)距离几何法:MODELLER
同源蛋白质结构预测的方法
SWISS-MODEL: //SWISS-MODEL.html
SWISS-MODEL: //SWISS-MODEL.html
U T(远程同源)
一个远程同源模型化方法要解决三个问题: (1)检测远程同源蛋白质(T); (2)U和T的序列必须被正确地对比排列; (3)修改一般的同源模型化过程,以应用于相似度 非常低的情况,即处理更多的环区,建立合理的三 维结构模型。 如何解决第一个和第二个问题? 序列→结构比对 • 基本思想是建立一个从U到已知结构T的线索,并通 过一些基于环境或基于知识的势,评价序列与结构 的适应性。
• 线索化方法一般有5个基本组成部分: (1)已知三维折叠结构的数据库; (2)一种适合于进行序列-结构比对的三维折 叠信息的表示方法; (3)一个序列-结构匹配函数,该函数对匹配 程度进行打分; (4)建立最优线索的策略,或者是进行序列结构比对的策略; (5)一种评价序列-结构比对显著性的方法。
提交查询序列
SWISS-MODEL的工作过程:
模板序列与查询 序列的装载 结构的精细比对
分子骨架的形成
侧链形成和优化 能量最小化、 结构封装
14
加入氢原子、 优化回环
最后的预测结果
15
穿针引线法
蛋白质具有很少的折叠类型(<1000)
• 基本步骤 将目标蛋白质序列与已知的折叠进行比对 将目标序列“安装”到选择的模板结构上 对模型进行优化、调整 检验模型的合理性 • 关键方法 序列-结构比对
假设存在有限数目的核心折叠(core folds) • 核心折叠实际上是构成蛋白质空间形状的基 本模式。 • 建立核心折叠数据库 • 预测---- 建立线索 U序列
与数据库核 心折叠比对
ቤተ መጻሕፍቲ ባይዱ取最佳核 心折叠
U结构模型
• 一种基于序列与结构比对的最优线索化算法 令: s1 ,
s2,„, sn为蛋白质序列S的n个元素
从头预测法
原子间作用力
蛋白质的势能
能量函数
蛋白质的势能
基于能量最小化的从头预测法 • 基本步骤 选择蛋白质能量函数模型 选择三维结构的表示方法 选择三维结构的评价函数 选择寻找最优结构的优化方法 •关键问题 大规模非线性规划 大量的局部极小点 在计算时间和准确度之间寻找平衡
最优化方法
非线性规划 最速下降法 牛顿法 共轭梯度法
4. 常用建模服务器和软件简介
蛋白质三维结构预测服务通过因特网对公众 免费开放(同源建模):
瑞士生物信息研究所 SWISS-MODEL 丹麦技术大学生物序列分析中心 CPHmodels 比利时拿摩大学 ESyPred3D 英国癌症研究中心 3DJigsaw Accelrys Discovery Studio 软件 InsightII FAMS
蛋白质结构预测
肖 飞
蛋白质三级结构预测的方法
1
2 3
方法比较
同源建模(比较建模)
基础 - 相似的序列结构相近 - PDB结构数据库的快速增长 - 结构基因组学的启动 - 发散进化 特点 - 相对精确可靠
• 假设待预测三维结构的目标蛋白质为U (Unknown),利用同源模型化方法建立结 构模型的过程包括下述6个步骤: (1)搜索结构模型的模板(T) (2)序列比对 U T (3)建立骨架 (4)构建目标蛋白质的侧链 (5)构建目标蛋白质的环区 (6)优化模型
线索化问题:
对于给定的序列S和核心折叠C,选择一个线索t,使得f(t)的 值最小,即寻找一个从S到C的最佳映射。
穿针引线法 • • • • • 动态规划 人工神经网络 分支定界法 线性规划 Monte Carlo方法
• 理论基础 蛋白质的天然构象是热力学最稳定构象、也是 能量最低构象 • 能量函数 通过原子间作用力计算出的热力学能量 精确,但难以计算 • 伪能量函数 根据已知的三维结构知识得到的势能函数 常见 的结构 → 低能量 • 不常见的结构 → 高能量 • 极罕见的结构 → 极高能量
Thanks for your attention!
The end~
用Swiss-model分析如下序列,进行三级 结构建模,取3个结果,并分析所得模型
• MSSGQCRSANAEDAQEFISDVERAIETLI IKNFHQSYSSVESNLAIGGKESTLTPSEL RDLVTQQLLLKSSKPHLMPSNCGLEEKI ASNLGSCKKNDSKLEEFRSFWAELLIGE AAKKSSVKLERPVRGH;