蛋白质抗原的表位分析

蛋白质抗原的表位分析
蛋白质抗原的表位分析

有鉴定表位的相关技术和文献。也有一些表位预测软件。

一般来说,目前研究主要集中在线性表位上,而构象表位的预测和鉴定方法目前不是很成熟。

找到一个帖子,楼主可以参考:

1、B细胞表位预测对于多种免疫学研究是必不可少的。针对不同的蛋白,应选择不同的方法。一般来说,蛋白质的C端具有较好的亲水性、表面可及性和柔性,所以是很好的抗原决定簇区域。本课题选用的蛋白质C-末端序列标签都是唯一的、或是其家族中的几个成员所共有的。在人蛋白质中,约81%的蛋白质其C末端的5个氨基酸残基的小肽是该蛋白质所特有的,制备针对蛋白质C末端小肽的抗体,常常能得到特异性识别该全蛋白的抗体。另外,蛋白的二级结构是B细胞表位计算机预测的重要参数之一,β转角为凸出结构,多出现在蛋白质抗原表面,有利于与抗体结合,较可能成为抗原表位。而α螺旋和β折叠结构规则不易变形,较难结合抗体,一般不作为抗原表位。含有5个以上的氨基酸残基的转角又常称为环(loop)。以往的研究表明,蛋白表面的loop区可能为功能性抗体的识别位点,特异性好,可及性强。本课题选用的HPO、G-CSF、HSA空间结构已明确,所以直接选择loop区或无规卷曲作为B细胞表位。

举例:

人Pif1基因编码至少两种蛋白亚型,分子量分别为74kDa和80kDa,与酵母具有高度的同源性,α型和β型Pif1只有C末端不同[20>,其余部分完全相同,并且二者的C末端在蛋白数据库中都是唯一的,选择α型和β型的C末端作为B细胞表位,既满足特异性的需要,也能区分亚型。

GPAA1是一种跨膜蛋白,原核表达非常困难,形成包涵体,且包涵体难以溶解和复性。对这一类型的蛋白,非常适合选择其特有的B细胞表位免疫动物,来最终制备识别全蛋白质的抗体。ABCpred是基于人工神经网络模型的线性B细胞表位预测工具,该系统检验了源于Bcipep数据库的700个非冗余B细胞表位和源于Swiss-Prot 数据库的700个长度为10~20个氨基酸的随机选择多肽,准确率近66%。Bepipred 结合隐马尔科夫模型和亲水性参数评分预测线性B细胞表位,AROC评分达到0.671。将两种预测方法得到的预测结果进行比较,其共有的预测表位是真正B细胞表位的几率更大,如果能进一步结合蛋白质二级结构预测结果,就可以选出可信度更高的B细胞表位。如何选择有效的B细胞表位是能否实现无完整蛋白质抗原条件下抗体制备的关键。

2、对于B细胞表位的选择,对于已有空间结构信息的蛋白质抗原,直接选择蛋白分子表面的loop区或无规卷曲区域的小肽序列作为候选B细胞表位;对于缺乏空间结构信息的蛋白质抗原,需要根据蛋白质抗原的特点具体分析。若蛋白质抗原C末端的序列亲水性好,可以选择C末端的6~10个氨基酸的序列作为候选B细胞表位,并且最好该序列为该蛋白质所特有;也可采用B细胞表位预测程序进行分析,选择不同程序预测的共有B细胞表位;对于同源性很高的家族蛋白,根据序列比对结果选择差异较大的区域,并且所选序列应该符合B细胞表位的特征。基于以上原则,本实验选择了10个蛋白的14个表位,并对其中的12个表位进行了验证。

3、对于B细胞表位的选择,

(1)对于空间结构已知的蛋白质,直接选择蛋白分子表面的loop区或无规卷曲区域的小肽序列。

(2)对于空间结构未知的蛋白质,可采用以下策略进行选择:

A:若蛋白质C末端序列的亲水性好,可以选择C末端的6~10氨基酸的序列作为候选B细胞表位,最好该序列为该蛋白质所特有。可采用SIB BLASTNetwork Service (http://www.expasy.ch/tools/blast/)的BLAST软件进行比对,数据库选择homo sapiens;

B:采用B细胞表位预测程序ABCpred和BepiPred等进行表位预测,选择不同程序预测的共有B细胞表位;

C:对于同源性很高的蛋白质,首先根据序列比对结果选择差异较大的区段,并且所选序列应该符合B细胞表位的特征。

4、二级结构预测分别应用EX-PASY服务器(http: //www. expasy. org/tools)上的GOR4[4>、HNN (Hierarchical Neural Network meth-od)、SOPMA、nnPredict[University ofCalifornia atSanFrancisco (UCSF)>等方法。

亲水性、柔韧性、表面可能性和抗原表位预测应用DNAstar软件的子程序Protean,采用Hopp-Woods和Kyte-Doolittle方案预测氨基酸的亲水性[5, 6>,采用Karplus-Schultz和Emini方案预测柔韧性及表面可能性[7, 8>,采用Jameson-Wolf方案[9>和吴氏抗原指数法[10>预测潜在的B细胞抗原表位。

5、对获取序列的生物信息学处理分析

使用DNASTAR软件分析获取的序列,结合NCBI上的BLAST寻找最匹配的短序列。用全部和部分肽序列查询各国专利数据库:

http: //appft1. uspto. gov/netahtml/PTO/search-adv. ht/

http: //www. freepatentsonline. com /5194592. htm /

http: //www. stcsm. gov. cn/resource/data/zhuanl.i asp#1

使用蛋白质在线分析工具分析多肽的疏水性、PI值、稳定性:

http: //www. expasy. org/

http: //www. rcsb. org/pdb/cgi/explore. cg?i pdbId=1fi6

http: //www. rcsb. org/pdb/search/searchSequence. do

http: //www. expasy. org/sitemap. html

http: //www. expasy. org/tools/#translate

http: //www. expasy. org/tools/blast/

常用数据库和预测工具:名称网址说明

ABCpred http://www.imtech.res.in/raghava/abcpred人工神经网络线性B 细胞表位预测工具

AgAbDb http://202.4 1.70.51:8080/agabdb2/ 抗原-抗体共结晶结构的分子相互作用数据库

AntiJen https://www.360docs.net/doc/f36199530.html,/AntiJen B 细胞表位定量结合数据库

Bcipep http://www.imtech.res.in/raghava/bcipep/ B 细胞表位数据库

Bepipred http://www.cbs.dtu.dk/services/BepiPred基于序列的线性表位预测工具CEP http://bioinfo.ernet.in/cep.htm基于结构的连续性和非连续性表位预测工具DiscoTope http://www.cbs.dtu.dk/services/DiscoTope基于序列/结构的非连续性表位预测工具

Epitome https://www.360docs.net/doc/f36199530.html,/services/epitome抗原-抗体相互作用残基数据库

HIV database https://www.360docs.net/doc/f36199530.html,/content/immunology HIV免疫表位数据库

IEDB https://www.360docs.net/doc/f36199530.html, T细胞和B细胞表位数据库含阴性数据

IEDB B-cell https://www.360docs.net/doc/f36199530.html,/tools/bcell/iedb_input基于序列的线性表位预测工具

epitope tools

6、B细胞表位预测的方法及应用

线性表位的预测方法

B细胞表位的预测方法主要集中于线性表位,在二十世纪七、八十年代发展起来的大量的预测B细胞表位的算法都是基于蛋白质序列。这些算法包括:⑴蛋白质的亲水性算法(Hydrophilicity):认为蛋白质各氨基酸残基可分为亲水残基和疏水残基两类。在机体内,疏水性残基一般被埋在蛋白内部,而亲水性残基位于蛋白质表面,因此,蛋白的亲水部位与蛋白抗原表位有着密切的联系。Hopp-Woods(Hoop TP et al.,1981)算法为最常用的。⑵可及性算法(Accessibility):常用的有Janin可及性参数,即指蛋白质抗原中氨基酸残基被溶剂分子接触的可能性(Rudolph R et al.,1990)。它反映了蛋白质抗原各个氨基酸残基的分布情况。⑶蛋白质可塑性算法(Flexibility):此算法认为蛋白质抗原构象的多肽链骨架具有一定程度的活动性,活动性强的氨基酸残基即可塑性大,易形成抗原表位(Karplus PA et al.,1985)。⑷蛋白质二级结构预测算法(Secondary structure):该算法认为蛋白质二级结构与蛋白质表位的分布关系密切。α螺旋、β折叠化学键键能比较高,形态固定,常处于蛋白质内部,难以与抗体嵌合,而β转角和无规则卷曲多处于蛋白质的表面,结构松散,易展示在蛋白质表面,有利于与抗体嵌合,成为抗原表位的可能性大(来鲁华,1993)。⑸蛋白质抗原性算法(Antigenicity):Welling(Welling GW.,1985)通过对20个已研究得很透的蛋白质的69个连续位点的606个氨基酸统计分析,用各氨基酸残基在已知B细胞表位中出现的百分率与其通常在蛋白质中出现的百分率比值的对数建立了抗原性刻度,并以此计算蛋白中各亚序列的抗原性。这些方法的代表软件有PEOPLE(Alix AJ et al.,1999)、PREDITOP(Pellequer JL et al.,1993)、BEPITOPE(Odorico M et al.,2003)、Bcepred(Saha S et al.,2004)等。但是最近Blythe及Flower(Blythe MJ et al.,2005)对氨基酸的性质与线性表位的关系做了一个评估,结果表明基于氨基酸序列信息来预测线性表位,即使很好的结合了氨基酸的各种性质,其预测结果仅略强于随机预测。近年来,一些应用隐形马尔可夫模型(HMM)、人工神经网络(ANN)、支持向量机算法(SVM)及其他技术的机器研究方法(Ponomarenko JV et al.,2007)已经被引入来预测B细胞表位,取得了较好的结果。代表软件有ABCpred(Saha S et al.,2006)、BepiPred(Larsen JEet al.,2006)、APP(Chen J et al.,2007)等。ABCpred采用人工神经网络来预测线性表位,从Bcipep和SwissProt数据库中提取非冗余的表位肽和非表位肽作为训练集,采用5-折交叉验证,预测敏感性约为67%,特异性约为64%。BepiPred结合氨基酸的性质(亲水性、柔韧性、可及性、极性、暴露表面、转角)和隐形马尔可夫模型来预测线性表位,预测结果表明,同那些仅依赖于氨基酸性质的预测方法相比,BepiPred 预测结果的准确性有一定程度的提高。Chen et al.(2007)发现氨基酸通常成对出现在抗原表位的频率要比其出现在非表位肽段的频率高,基于此,并联合支持向量机算法建立了APP方法。应用此方法在872个表位肽和872个非表位肽数据集中,采用5-折交叉验证,预测准确度为71%。Yasser EL-Manzalawy(EL-Manzalawy Y et al.,2008)等采用同一数据集对这三种方法进行比较,结果表明ABCpred预测表位的准确性略高于BepiPred及APP。

构象表位的预测方法目前,绝大多数B细胞表位预测方法都是基于蛋白质的一级或

二级结构的,但这些方法只能用来预测由连续的氨基酸残基构成的线性表位,而基于蛋白质的三级结构来预测构象表位的方法比较少,这是因为各种抗原的构象表位可获得的数据要远远少于线性表位,并且到目前为止,几乎没有哪个抗原的所有的表位都能够彻底的研究清楚(HasteAndersen P et al.,2006)。基于蛋白质三级结构来预测构象表位的方法CEP(Kulkarni-Kale U et al.,2005)(Conformational Epitope Prediction):这是第一个以抗原蛋白的三级结构PDB文件作为输入条件,以构象性表位预测为主要目的的网上免费服务软件。它提供了一个预测构象表位的web界面,这种方法除了能够预测构象表位,同时也能预测线性表位。它主要根据氨基酸残基的溶剂可及性及空间距离截值来预测表位,其公布的预测精度达75%。DiscoTope(Haste Andersen P et al.,2006):是通过蛋白质三级结构数据来预测构象表位的一种新方法,这种方法通过对X射线晶体衍射确定的76个抗原抗体复合物所组成的构象表位数据集进行大量统计度量、空间特征分析和表面可及性计算,对B细胞构象性表位进行预测,最终对组成蛋白序列的每个氨基酸打分,通过分值来反映某一氨基酸成为表位的可能性,并提供了阈值来确定组成表位的氨基酸残基。预测蛋白质与蛋白质相互作用位点的方法除以上两种方法之外,还有最近发展起来的一些预测蛋白质与蛋白质相互作用位点的方法。

由于抗原抗体之间的相互作用属于蛋白质与蛋白质之间相互作用中的一种,因此,可以参这些方法来预测B细胞表位。分子对接:主要用来研究分子间的相互作用与识别,进而预测复合物结构。常用的分子对接软件有ZDOCK(Chen R et al.,2003)、DOT(Shoichet BK et al.,1991)、DOCK(Mandell JG et al.,2001)、ClusPro(Comeau SR et al.,2004)等。其中ClusPro是一个提供网上服务的分子对接软件,其能够根据形状互补快速的筛选ZDOCK和DOT程序产生的对接结果,并对对接结果聚类,根据聚类情况对对接结果打分,最终返回10个得分最高的对接结果,再根据这些对接结果来确定蛋白质相互作用的位点。PPI-Pred(Bradford JR et al.,2005)(protein-protein interface prediction)将支持向量机的方法同曲面分析结合在一起预测蛋白质相互作用位点。ProMate(Neuvirth H et al.,2004)(Predicting the location of potential protein-protein binding sitesfor unbound proteins)是将一些蛋白质相互作用界面的重要性质综合起来预测蛋白质相互作用位点。这些性质包括:结合位点通常偏向位于β片层及非结构的链;芳香族氨基酸的侧链常会参与蛋白质与蛋白质的相互作用;疏水氨基酸和极性氨基酸常聚集在蛋白质与蛋白质相互作用的界面;以及在晶体结构中结合位点的周围有更多的水分子与之结合。Ponomarenko和Bourne采用以上几种方法预测构象表位并使用同一评估体系对其进行了比较,结果表明,这些方法的准确性均未超过40%,如果用ROC(Relative operating characteristic)曲线下面积的值来评估这些方法,则DiscoTope,和PPI-PRED的值大约是0.6,ClusPro的值高于0.65,但未超过0.7,而其它的方法接近于随机预测。尽管这些年来B细胞表位预测的方法得到了一定的发展和应用,但这些研究方法还存在一定的问题。首先,所有预测表位的方法都缺乏标准的ROC(Swets JAet al.,1988)评估,这使得各种预测方法的结果难以比较与评估;其次,大多数预测线性表位的方法都具有一定的局限性,它们仅仅是根据少数的几个表位的特征(氨基酸的性质,残基的表面可及性,空间分布,分子间接触)来预测表位,而最近对各种线性表位预测方法进行评估的结果表明,仅根据氨基酸的性质来预

测线性表位的方法并不可靠。要想提高预测的准确性,需将更多表位区别于非表位的特征结合起来预测;最后,目前预测表位的方法大多数是针对于线性表位的,而据研究表明(Barlow DJ etal.,1986)90%以上的表位为构象表位,因此在进一步完善线

性B细胞表位预测研究的基础上,从蛋白质的三级结构入手,深入对构象性B细胞表位预测算法与程序的研究。同时,我们也相信随着PDB数据库中抗原抗体复合物的增加,能够对各种抗原的构象表位进行更广泛的分析,人们对蛋白质抗原表位的研究将更加透彻。

以上都是前辈们总结的,我只是借平台和同我一样迷茫的人们一起分享,希望有助于解决问题。但有一点,大多数软件预测得到的是线性表位,需要构像表位,最好结合噬菌体肽库筛选。

转自:https://www.360docs.net/doc/f36199530.html,/s/blog_565b7ff10100pqn3.html

抗原表位研究方法进展_宋帅

动物医学进展,2010,31(12):87-91Pr ogress in Veterinary Medicine 抗原表位研究方法进展 宋 帅,李春玲* ,贾爱卿,杨冬霞,李 淼 (广东省农业科学院兽医研究所 广东省兽医公共卫生实验室,广东广州510640) 收稿日期:2010-05-18 基金项目:广东省农业攻关项目(2007A020300005-11) 作者简介:宋 帅(1982-),男,河南汝州人,研究实习员,硕士,主要从事动物疫病及综合防控技术研究。*通讯作者 摘 要:抗原表位是抗原分子中的主要功能单位,能有效刺激机体的细胞免疫和体液免疫。随着免疫学和生物信息学技术的不断发展,用于研究T 细胞表位和B 细胞表位的方法得到了很大的提高。论文中概述了近几年用于研究T 细胞表位的预测方法和鉴定方法,以及在B 细胞表位研究中所用的表位肽扫描技术、蛋白质/切割0法、噬菌体展示技术、X -衍射与核磁共振、表位预测方法等技术,并对每种研究方法进行了比较,为从事抗原表位研究的人员提供参考,从而更有利于表位肽疫苗的研制和诊断方法的建立。 关键词:T 细胞表位;B 细胞表位;预测;鉴定 中图分类号:S852.4 文献标识码:A 文章编号:1007-5038(2010)12-0087-05 抗原表位又称抗原决定簇,是指抗原分子表面具有特殊结构和免疫活性的化学基团,具有刺激机体产生抗体或致敏淋巴细胞并能够被其识别的一个 免疫活性区。根据抗原表位特异性免疫应答的程度,可将抗原表位分为免疫优势表位、亚优势表位和隐性表位。根据与抗原受体结合细胞的不同,分为B 细胞抗原表位和T 细胞抗原表位;其中B 细胞抗原表位则往往为亲水性肽段,一般位于抗原三维大分子的氨基酸长链折叠处[1],而T 细胞抗原表位往往仅为埋藏在蛋白质空间结构内部的疏水性肽段[2]。根据表位对机体的影响,可分为保护性表位(免疫位)、致病性表位(变应位)和耐受性表位(耐受位)。按抗原表位结构的不同分为连续性抗原表位和非连续性抗原表位,前者又称线型表位,是由肽链上顺序连续的氨基酸组成,后者又称构象型表位,是由那些空间邻近但顺序上不连续的氨基酸组成。线型表位见于T 细胞表位和部分B 细胞表位,构象型表位只见于B 细胞表位[3]。在机体的免疫系统中,免疫细胞通常难以借助其表面受体识别整个蛋白质分子,仅识别抗原分子上的抗原决定簇,也就是说抗体的特异性是针对抗原表位而不是针对完整的抗原分子的[4]。表位一般只占5个~7个氨基酸或单糖残基的大小,最多不超过20个氨基酸残基。抗原表位是蛋白质抗原性的基础,所以深入研究蛋白质抗原表位对疾病的诊断及预后判定,定点改造蛋白质分子以降低蛋白质药物的免疫原性,设计无毒副作 用的人工疫苗以及免疫干预治疗等具有重要意义。 1 T 细胞表位的研究方法 T 细胞表位是抗原蛋白中经抗原递呈细胞(an -tig en presenting cell,APC)处理,由主要组织相溶性复合物(major histocompatibility com plex,MH C)分子递呈给T 淋巴细胞受体的多肽片段。主要涉及细胞毒性T 细胞(cytotox ic T cell,CT L )抗原表位和辅助性T 细胞(helper T cell,Th)抗原表位的研究,其中CT L 抗原表位与MH C ?类分子亲和肽相关,Th 抗原表位与M H C ò类分子的亲和肽相关。所以对T 细胞表位的筛选主要基于候选肽能否和MH C 分子结合。与M H C ?类分子结合的多肽长度通常为8个~11个氨基酸,一般为9个,在序列特定位置上有锚点存在。而MH C ò分子亲和肽长度可达30个氨基酸以上,其结合基序存在不同程度的退化[5]。随着免疫学和生物信息学技术的不断发展,对T 细胞表位的研究主要有以下几种方法。 1.1 合成肽法 在机体的免疫系统中,T 细胞主要识别抗原分子上的线型表位。所以根据抗原蛋白质分子的氨基酸序列随机合成或连续合成一个或几个重叠氨基酸的一系列肽段,然后通过多肽活性的检测实验进一步确定T 细胞表位。此方法鉴定的T 细胞表位较可靠,且能发现一些不符合多肽结合基序(motif)的MH C 结合抗原肽。Gerner W 等[6]将口蹄疫病毒结

乙型脑炎病毒E蛋白结构域抗原表位鉴定

乙型脑炎病毒E 蛋白Ⅰ、Ⅱ结构域抗原表位鉴定 闫丽萍1,华荣虹2,亓文宝3,周艳君1,李国新1, 于 海1,姜一峰1,田志军2,童光志1* (1.中国农业科学院上海兽医研究所,上海200241;2.中国农业科学院哈尔滨兽医研究所兽医生物技术国家重点 实验室/猪传染病研究室,黑龙江哈尔滨150001;3.华南农业大学兽医学院,广东广州510642) 摘要:为鉴定乙型脑炎病毒(JEV)E 蛋白I ,II 结构域抗原表位,本研究设计了一系列针对E 蛋白的I 、II 结构域(1aa ~296aa)部分重叠短肽,分别进行GST 融合表达,用JEV 阳性血清进行western blot 和ELISA 反应性筛选,获得了5个线性抗原表位分别为:E1(1FNCLGMGNRDFIEGAS 16)、E10-4(77TGEAHNEK 84)、E11-2(83EKRADSS YVCKQ 94)、E19(145GTTTSENHGNYSAQVG 160)和E33(257SQEGGLHHALAGAIVV 272)。除E10和E19外,其它表位均为第一次通过实验方法确定的。将这5个融合蛋白对小鼠进行免疫,获得了高滴度的针对5个融合短肽的抗血清,研究证明了这些表位具有良好的免疫原性。本研究为乙型脑炎特异性诊断试剂及表位疫苗的开发奠定了基础。 关键词:乙型脑炎病毒;E 蛋白;抗原表位中图分类号:S852.65 文献标识码:A 文章编号:1008-0589(2010)01-0056-05 Antigenic epitopes mapping of domain I,II of Japanese encephalitis virus envelope protein YAN Li-ping 1,HUA Rong-hong 2,QI Wen-bao 3,ZHOU Yan-jun 1,LI Guo-xin 1, YU Hai 1,JIANG Yi-feng 1,TIAN Zhi-jun 2,TONG Guang-zhi 1* (1.Division of Swine Infectious Diseases,Shanghai Veterinary Research Institute,Chinese Academy of Agricultural Sciences,Shanghai 200241,China;2.Division of Swine Infectious Diseases,State Key Laboratory of Veterinary Biotechnology, Harbin Veterinary Research Institute,Chinese Academy of Agricultural Sciences,Harbin 150001,China;3.College of Veterinary Medicine,Southern China Agricultural University,Guangzhou 510642,China) Abstract:In order to map the antigenic epitopes domain Ⅰ,Ⅱof the envelope (E)protein of Japanese encephalitis virus (JEV),a set of partially overlapping fragments spanning the E protein were fused with GST and expressed.The reactivity of the fusion proteins was detected by western blot and ELISA.Five linear antigenic epitopes,E1(1FNCLGMGNRDFIEGAS 16),E10-4(77TGEA HNEK 84),E11-2(83EKRADSSYVCKQ 94),E19(145GTTTSENHGNYSAQVG 160)and E33(257SQEGGLHHALAGAIVV 272)were identified.Immunization of mice with the fusion proteins revealed that all five proteins could elicit short peptide specific antisera.These results provided important basis for study of the structure and function of domain I,II of the JEV E protein,and development of diagnostic techniques. Key words :Japanese encephalitis virus;envelope protein;epitope 收稿日期:2009-09-24 基金项目:院所长基金(2006-A-02) 作者简介:闫丽萍(1977-),女,黑龙江双鸭山人,助理研究员,博士,主要从事动物病毒分子生物学研究.*通信作者:E-mail :gztong@https://www.360docs.net/doc/f36199530.html, *Corresponding author 中国预防兽医学报 Chinese Journal of Preventive Veterinary Medicine 第32卷第1期2010年1月 Vol.32,No.1Jan.2010 流行性乙型脑炎(Japanese encephalitis ,JE),是由JE 病毒(JEV)引起的一种人与动物共同感染的蚊 媒病毒性疾病。JEV 主要侵害人的中枢神经系统,引起急性病毒性脑炎,导致高病死率(25%),或神经

甲型H1N1病毒HA、NA氨基酸序列比较及抗原性表位预测

龙源期刊网 https://www.360docs.net/doc/f36199530.html, 甲型H1N1病毒HA、NA氨基酸序列比较及抗原性表位预测 作者:邹泽红等 来源:《中国医学创新》2013年第19期 【摘要】目的:比较新型甲型H1N1流感病毒分离株HA、NA氨基酸序列之间的差异,分析HA、NA蛋白可能的抗原性细胞表位。方法:从GenBank中选取28株世界各地的新型甲型H1N1流感病毒分离株并下载各株HA、NA的氨基酸序列;使用Clustal X和MEGA 2.0软件对氨基酸序列的进行进化树分析;用Protean软件预测HA、NA蛋白的B细胞表位;用NetMHCⅡ 2.2预测T细胞抗原表位。结果:世界范围的毒株之间氨基酸序列相对保守,HA及NA均只有少数位点的变异,HA蛋白氨基酸序列之间较NA蛋白氨基酸序列之间变异较大; 预测HA蛋白具有8个B细胞表位和10个T细胞表位;NA蛋白有12个B细胞表位和7个T 细胞表位。结论:HA、NA蛋白的少数区域抗原性相对比较稳定,可以作为检测以及疫苗研究的靶区域。 【关键词】 H1N1流感病毒;抗原表位;血凝素;神经氨酸酶 2009年4月,在美国首次报道了两例感染新型甲型H1N1流感病毒患者[1],同时在墨西 哥出现了呼吸道感染的流行[2]。美国爆发的甲型H1N1流感迅速在北美洲地区蔓延,并很快波及亚洲、欧洲。新型甲型H1N1流感病毒是由禽流感、猪流感和人流感三种流感病毒的基因片段间的变异或重组产生的[3],已经引起世界性的大流行。 甲型H1N1流感能不断引起流行是由于其抗原性不断发生漂移所致[4],其中最重要是血凝素(hemagglutinin,HA)和神经氨酸酶(neuraminidase,NA)的变异[5]。血凝素是流感病毒最重要的蛋白,它的裂解性、受体特异性和糖基化是决定流感病毒感染性和致病性的重要因素。神经氨酸酶是病毒囊膜表面的另一种重要的糖蛋白,在决定病毒毒力和宿主特异性方面也具有重要作用,与HA共为流感病毒亚型分型的主要依据,NA同时也是抗流感病毒的重要作用靶点[6]。目前,国内虽然已经开发了H1N1流感疫苗并接种了2000多万人,但是,接种所致的不良反应事例的出现同样给健康的人们带来了灾难。有针对性地改造毒素的相应蛋白、获得更为安全有效的疫苗成为解决问题的关键,而解析甲型H1N1流感病毒HA、NA蛋白的抗 原性表位成为关键的突破口。 本研究分析了甲型H1N1流感病毒HA、NA蛋白抗原性变化的情况,并对其可能的抗原 性表位进行了分析预测,为新型甲型流感疫苗的制备提供依据,以便更有效及时地控制甲型流感的传播。 1 材料与方法

蛋白质序列分析

蛋白质序列、性质、功能和结构分析 基于网络的蛋白质序列检索与核酸类似,从NCBI或利用SRS系统从EMBL 检索。 1、疏水性分析 ExPASy的ProtScale程序(https://www.360docs.net/doc/f36199530.html,/cgi-bin/protscale.pl)可用来计算蛋白质的疏水性图谱。输入的数据可为蛋白质序列或SWISS-PROT数据库的序列接受号。也可用BioEdit、DNAMAN等软件进行分析。 2、跨膜区分析 蛋白质跨膜区域分析的网络资源有: TMPRED:https://www.360docs.net/doc/f36199530.html,/software/TMPRED_form.html PHDhtm: http:www.embl-heidelberg.de/Services/sander/predictprotein/predictpro tein.html MEMSAT: ftp://https://www.360docs.net/doc/f36199530.html, 3、前导肽和蛋白质定位 一般认为,蛋白质定位的信息存在于该蛋白自身结构中,并且通过与膜上特殊受体的相互作用得以表达。这就是信号肽假说的基础。这一假说认为,穿膜蛋白质是由mRNA编码的。在起始密码子后,有一段疏水性氨基酸序列的RNA片段,这个氨基酸序列就称为信号序列(signal sequence)。 蛋白质序列的信号肽分析可联网到http://genome.cbs.dtu.dk /services/SignalP/或其二版网址 http://genome.cbs.dtu.dk/services/SignalP-2.0/。该服务器也提供利用 e-mail进行批量蛋白质序列信号肽分析的方案 (http://genome.cbs.dtu.dk/services /SignalP/mailserver.html),e-mail 地址为signalp@ genome.cbs.dtu.dk。 蛋白质序列中含有的信号肽序列将有助于它们向细胞内特定区域的移动,如前导肽和面向特定细胞器的靶向肽。在线粒体蛋白质的跨膜运输过程中,通过线粒体膜的蛋白质在转运之前大多数以前体形式存在,它由成熟蛋白质和N端延伸出的一段前导肽或引肽(leader peptide)共同组成。迄今有40多种线粒体蛋白质前导肽的一级结构被阐明,它们约含有20~80个氨基酸残基,当前体蛋白跨膜时,前导肽被一种或两种多肽酶所水解转变成成熟蛋白质,同时失去继续跨膜能力。前导肽一般具有如下性质:①带正电荷的碱性氨基酸(特别是精氨酸)含量较丰富,它们分散于不带电荷的氨基酸序列中间;②缺失带负电荷的酸性

蛋白抗原表位预测及抗原多肽设计

蛋白抗原表位预测及抗原多肽设计 利用在线软件BepiPred Server()从蛋白序列直接预测抗原表位 还有其他在线预测网站 进Antigenic Peptide Prediction 用tools 把氨基酸序列粘贴进去,就可以直接得出预测结果 抗原多肽选择的基本原则 1、尽可能是在蛋白表面 2、保证该段序列不形成α-helix 3、N,C端的肽段比中间的肽段更好 4、避免蛋白内部重复或接近重复段的序列 5、避免同源性太强的肽段 6、交联可以交联在N,C两端,选择依据就是交联在对产生抗体不太重要的一端 7、序列中不能有太多的Pro,但有一两个Pro有好处,可以使肽链结构相对稳定一些,对产生特异性抗体有益。 抗原多肽设计的基本原则 ????? 为了使生产抗体获得最佳效果,仔细地设计抗原多肽是很有必要的,设计应满足一个基本条件:在免疫过程中,该抗原既不会产生过强的免疫反应,同时又能产生出对感兴趣的蛋白有结合能力的抗体。尽管抗原设计是一个很复杂的课题,有诸多需要注意的细节,已超过了我们所能提供的范围,根据我们所积累的经验,有几点关键的基本设计原则可以提供给大家参考:

1、确定抗体的用途(应用)新开展一个研究项目,弄清楚所感兴趣的蛋白的一些基本特性是很有必要的,特别是如果知道蛋白的结构会对选择抗体易于接触和识别的识别区域有很大的帮助。然而,在没有这样精确的结构信息(多数是这种情况)的情况下,了解研究的用途(应用)会影响多肽设计的策略。例如:如果研究重点是集中在蛋白的不同区域,如C端或N端,或在一种特定状态下的蛋白,如磷酸化等,那么按照所需序列设计的多肽和产生的相应的抗体在应用上应该没有太大的困难,然而,蛋白的构象将影响抗体与其识别区域之间的相互作用。这种情况下可能存在的问题是如果在折叠的蛋白中,该识别区域被藏在蛋白的内部,抗体将无法接触到该区域。(无法产生相互作用)。 2、识别区域的选择原则一般说来最理想的抗原性识别区域应具备亲水、位于蛋白表面和结构上易变形性等特点。因为在大多数的天然(自然)环境中,亲水区域倾向于集中在蛋白表面,而疏水区域常常被包裹在蛋白内部,同样道理,抗体只能与在蛋白表面发现的识别区域相互作用,而当这些识别区域有足够的结构易变形性而转移到抗体可接触的位置时,将会与抗体间有很高的亲和性。 3、连续的与不连续的识别区域连续的区域是指由连续的氨基酸序列(残基)构成的识别区域。大多数抗体是针对连续识别区域的,抗体能与这类区域以很高的亲和力相结合表明这段序列不在蛋白内部。不连续的识别区域是代表有一定折叠的一段多肽序列,或是将两段分离开的多肽连在一起的抗体的识别区域。在某些情况下,针对这样不连续识别区域的抗体也能产生,只是用来免疫的抗原多肽必须具备与该不连续识别区域相似的二级结构,而序列的长度需要符合相关的要求。 4、基本建议为了避免识别区域隐藏在蛋白内部的风险,我们通常建议选择蛋白的N,C两端来产生的相应的抗体。因为在完整的蛋白中,N,C两端通常是暴露在蛋白表面的。然而,一定要注意膜蛋白的C端疏水性太强,不适合作为抗原。 5、序列的长度通常我们建议抗原多肽的序列长度在8-20个氨基酸残基之间,如果太短,就有多肽太特殊、所产生的抗体与天然蛋白之间的亲和力(结合能力)不够强的风险,同样,

蛋白抗原表位预测算法及多肽抗原设计原则

https://www.360docs.net/doc/f36199530.html, 蛋白抗原表位预测算法 及多肽抗原设计原则 概述 为了获取识别天然蛋白的抗体,有两种方式可以选择。一种是利用重组蛋白的方式获取尽可能接近天然条件下的重组蛋白,然后刺激试验动物免疫系统,进而获取相应抗体。这种方式获取抗体的成功率较高且效价较好;另一种是预测天然蛋白的抗原决定簇,这种抗原决定簇最终体现为多肽形式,将其与相应的载体偶联后刺激试验动物免疫系统,也可以获取相应的抗体。这种方式的选择有其特殊需要。我们德泰生物科技南京有限公司提供这两种类型的抗体定制服务。 什么是抗原决定簇 蛋白质表面部分可以使免疫系统产生抗体的区域叫抗原决定簇。一般抗原决定簇是由6-12氨基酸或碳水基团组成,它可以是由连续序列(蛋白质一级结构)组成或由不连续的蛋白质三维结构组成。 蛋白抗原表位预测方法 目前蛋白质抗原表位预测的方法大致可以分为两类,一类是基于蛋白质高级结构预测,像beta-转角、膜蛋白跨膜区预测等;一种是基于氨基酸的统计学倾向性,像亲水性(hydrophilicity)、弹性(flexibility)、表面可接触性(surface accessibility)、抗原倾向性(antigenic propensity)。具体算法请参考相关文献,部分文献如下: 1)Chou,Fasman Adv Enzymol Relat Areas Mol Biol.1978;47:45-148. 2)Hopp,T.P.and Woods,K.R.(1981)https://www.360docs.net/doc/f36199530.html,A78,3824-3828. 3)Welling,G.W.,Weijer,W.J.,van der Zee,R.and Welling-Wester,S.(1985)FEBS Lett.188,215-218. 4)Karplus PA,Schulz GE.Naturwissenschafren1985;72:212-3. 5)Emini EA,Hughes JV,J Virol.1985Sep;55(3):836-9. 6)Parker,J.M.R.,Guo,D.and Hodges,R.S.(1986)Biochemistry25,5425-5432. 7)Schmidt,A.M.(1989)Biotect.Adv.7,187-213. 8) A.S.Kolaskar and Prasad C.Tongaonkar(1990)FEBS09210 9)K.Hofmann&W.Stoffel(1993) 10)Paul Horton,Keun-Joon Park,Takeshi Obayashi&Kenta Nakai,Proceedings of the4th Annual Asia Pacific Bioinformatics Conference,Taiwan.pp.39-48,2006. 11)Jens Erik Pontoppidan Larsen,Ole Lund and Morten Nielsen.Immunome Res.2006

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具 (南京农业大学生命科学学院生命基地111班) 摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。 关键词:蛋白质;结构预测;跨膜域;保守结构域 1 蛋白质相似性检测 蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。 表一常用蛋白质数据库 网址可能有更新 氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。 序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

MAGE_A家族抗原共同B细胞表位预测分析

?论 著? MAGE-A家族抗原共同B细胞表位预测分析 金劲激1,丁玉杰1,王冰冰2,侯柏龙2,张丽芳2,朱冠保1 (1.温州医科大学附属第一医院 胃肠外科,浙江 温州 325000;2.温州医科大学 分子病毒与免疫研究所,浙江 温州 325035) 收稿日期:基金项目:作者简介:通信作者:2013-05-17 浙江省自然科学基金资助项目(Y2100660)。金劲激(1988-),男,浙江瑞安人,硕士生。朱冠保,教授,硕士生导师,Email:zgbwmc@yahoo.com.cn。 黑色素瘤抗原A(MAGE-A)家族是一组在许多恶性肿瘤细胞如黑色素瘤、肺癌、胃癌等中高表达的 肿瘤抗原,而正常人体中仅在睾丸的生殖细胞、卵子和胎盘的滋养层细胞中表达。有研究表明,MAGE-A家族即MAGE-A1至MAGE-A12,其基因序列具有一定的同源性[1],在一种肿瘤组织或细胞中,可同时存在多种MAGE-A家族基因的表达[2]。因此,MAGE-A家族蛋白已成为肿瘤特异性抗原检测及免疫治疗的理想靶抗原[3-4]。而抗原表位,即抗原分子中决定抗原 [摘 要]目的:预测和筛选黑色素瘤抗原A(MAGE-A)家族抗原的共同B细胞表位。方法:以MAGE-A1的全长氨基酸序列为基础,利用生物信息学软件,采用Hopp&Woods的亲水性方案、Zimmerman极性参数和Jameson-Wolf抗原指数方案和Emini表面可及性方案等,结合MAGE-A1的二级结构与其柔性区域及跨膜区域对MAGE-A1的优势B表位区段进行综合分析,进一步运用抗原指数分析预测MAGE-A1的B细胞表位,并将其与MAGE-A家族中其他成员(MAGE-A2至A12)进行比对,以预测MAGE-A家族抗原的共同B细胞表位。结果:MAGE-A1的全长为309个氨基酸,相对分子质量为46 kDa,为可溶性蛋白。经综合分析,其B细胞优势表位可能存在于氨基酸序列N端的9~14,84~88,118~124,160~165,208~214,233~240区段;经与MAGE-A家族中其他成员的氨基酸序列比对,MAGE-A1的9~14,84~88,118~124及233~240区段,即HCKPEE,EEEGP,RAREPVTK,GEPRKLLT肽段可能为MAGE-A家族抗原共同B细胞优势表位。结论:利用生物信息学预测发现MAGE-A1的优势B细胞表位中,9~14,84~88,118~124及233~240区段可能为MAGE-A家族抗原的共同B细胞表位,可为表位疫苗的研制等提供理论依据。[关键词] 黑色素瘤抗原A家族;黑色素瘤抗原A1; B细胞表位;共同表位 [中图分类号] R730.2 [文献标志码] A [文章编号] 1000-2138(2013)11-0706-05 Comprehensive mapping of common immunodominant B-cell epitopes of MAGE-A subfamily JIN Jinji 1, DING Yujie 1, WANG Bingbing 2, HOU Bolong 2, ZHANG Lifang 2, ZHU Guanbao 1. 1.Department of Gastroenterological Surgery, the First Affiliated Hospital of Wenzhou Medical University, Wenzhou, 325000;2.Institute of Molecular Virology and Immunology, Wenzhou Medical University, Wenzhou, 325035 Abstract: Objective: To predict and screen the common B-cell epitopes of the melanoma antigen A (MAGE-A) subfamily. Methods: Base on the full-length amino acid sequence of the MAGE-A1, the B-cell epitopes of the MAGE-A1 protein was predicted by bioinformatics software, including the hydrophilic plot technique, polarity parameters, surface probability, antigenic index, and the secondary structure, along with its flexible regions and transmembrane region analysis, then antigenic index calculation was further taken as a standard to determine target epitopes. The amino acid sequence alignment of the predicting B epitopes of MAGE-A1 was blasted with the remain members of MAGE-A family (MAGE-A2 to A12) to predict the common B-cell epitope of MAGE-A subfamily.Results: The MAGE-A1 gene codes for a 46 kDa soluble protein consisted of 309 AA. The predicted B-cell epitopes of the MAGE-A1 might exist N-terminal of amino acid sequence: 9~14, 84~88, 118~124, 160~165, 208~214,233~240. Four of them, that is, the peptides about 9~14 (HCKPEE), 84~88 (EEEGP), 118~124(RAREPVTK)and 233~240 (GEPRKLLT) might be the common B cell epitopes of MAGE-A subfamily. Conclusion:Bioinformatics prediction provides a theoretical basis for the common B cell epitopes of MAGE-A subfamily. Key words: melanoma antigen A (MAGE-A) subfamily; melanoma antigen A1; B-cell epitope; common epitope

蛋白抗原表格模板位预测及抗原多肽设计

精心整理蛋白抗原表位预测及抗原多肽设计 利用在线软件BepiPred1.0Server()从蛋白序列直接预测抗原表位 还有其他在线预测网站 进AntigenicPeptidePrediction用tools 1 2 3、N,C 4 5 6 7、 ????? 程中,该抗原既不会产生过强的免疫反应,同时又能产生出对感兴趣的蛋白有结合能力的抗体。尽管抗原设计是一个很复杂的课题,有诸多需要注意的细节,已超过了我们所能提供的范围,根据我们所积累的经验,有几点关键的基本设计原则可以提供给大家参考: 1、确定抗体的用途(应用)新开展一个研究项目,弄清楚所感兴趣的蛋白的一些基本特性是很有必要的,特别是如果知道蛋白的结构会对选择抗体易于接触和识别的识别区域有很大的帮助。然而,在没有这样精确的结构信

息(多数是这种情况)的情况下,了解研究的用途(应用)会影响多肽设计的策略。例如:如果研究重点是集中在蛋白的不同区域,如C端或N端,或在一种特定状态下的蛋白,如磷酸化等,那么按照所需序列设计的多肽和产生的相应的抗体在应用上应该没有太大的困难,然而,蛋白的构象将影响抗体与其识别区域之间的相互作用。这种情况下可能存在的问题是如果在折叠的蛋白中,该识别区域被藏在蛋白的内部,抗体将无法接触到该区域。(无法产生相互作用)。 2、识别区域的选择原则一般说来最理想的抗原性识别区域应具备亲水、位于蛋白表面和结构上易变形性等特点。 样道理, 3 针对这 而4 5 二级结构,所产生的抗体失去特异性的可能,而且肽链越长,通常合成难度增大,不易获得高纯度的产品。6、载体蛋白交联的选择 基本原则:将载体蛋白加在远离抗体识别区域的一端,在序列中没有Cys的情况下在N或C端加上Cys为交联的首选方法。

高免疫原性T细胞抗原表位预测方法的研究

高免疫原性T细胞抗原表位预测方法的研究T细胞抗原表位是T细胞抗原上具有特殊功能的肽段,能够特异性地被T细胞识别,从而激起T细胞免疫应答。因此,研究T细胞抗原表位不仅有助于了解传染性疾病、自身免疫性疾病、过敏反应以及肿瘤等疾病的免疫应答机理,而且对计算机辅助疫苗设计起到推动作用。生物信息技术的迅猛发展为研究T细胞抗原表位提供了有效途径。针对目前T细胞抗原表位的研究现状,本文选择了其中的几个热点问题进行了研究。 主要工作如下:(1)结合序列信息和结构信息预测抗原表位是抗原表位预测工作的发展方向。HLA-A2分子是人群中普遍存在的一种MHCI类分子,选择HLA-A2结合的抗原肽作为研究对象,对抗原肽的氨基酸理化性质以及其与MHC结合时的能量项进行了挖掘。为了避免使用的特征存在冗余,影响到分类的效率和性能,利用最大相关最小冗余(MRMR)的方法对特征进行了筛选,最终筛选出了50个具有较高辨识能力的特征,构建了一个针对HLA-A2类分子抗原肽的预测方法。预测结果表明筛选出的特征能够有效地识别HLA-A2类分子结合的抗原肽。 (2)I-Ag7分子和HLA-DQ8分子是小鼠和人类体内与Ⅰ型糖尿病有关的MHC Ⅱ类分子。为预测这两类MHC分子限制性抗原表位,开发了GPS-MBA软件包。将吉布斯取样算法进行了改进,获得了抗原表位的核心序列,又使用GPS算法对这些核心序列进行打分,构建出预测模型。经过了全面的评测和比较,发现GPS-MBA 的性能要优于同类型软件。 使用此软件可以预测出大量潜在的Ⅰ-Ag7和HLA-DQ8抗原表位。另外,设计了Ⅰ型糖尿病的抗原表位数据库(TEDB),其中包含了所有的经过实验验证或预测出的与Ⅰ型糖尿病有关的抗原表位。(3)为了验证阴性选择假说、研究抗原表位的免疫原性,分别针对人类和小鼠两个宿主,分析了外源T细胞抗原表位和非抗原表位肽段与宿主蛋白质序列之间的相似性。利用序列比对的方法,发现仅仅有极少量抗原表位与宿主蛋白质序列相似,这个数量低于非抗原表位肽段与宿主蛋白质序列相似的数量。 这个结果表明,外源T细胞抗原表位与宿主蛋白质序列相似性低,提示了使用与宿主蛋白质序列相似性低的抗原表位做疫苗可以有助于降低交叉免疫反应的概率、增强疫苗免疫原性、触发抗原特异性免疫应答。(4)为了进一步开发蛋

蛋白质注释及功能分析

蛋白质注释及功能分析 利用基因本体GO (gene ontology )或者其它的功能注释系统(工具)来分析蛋白质的功能。然后提供蛋白质功能注释的统计分布情况。(如表1和图1 所示)该分析结果可以给出差异表达蛋白质总体的功能分布,从而使研究人员整体上把握疾病与分子功能之间的相关性。 Table 1 Protein functional distribution in XXX Figure 1 Protein functional distribution in XXX

以下,引用一些已在文章上发表的关于蛋白质功能分析方面例子: An outline of the functional classification of differentially expressed proteins.A, functional distribution of all 160 identities in different categories. (Dai S et al. Mol Cell Proteomics 2007;6:207-230) Distribution of our differentially expressed protein species with isoforms by function (A) and those identified from mature rice pollen grains (14) (B).(Dai S et al. Mol Cell Proteomics 2007;6:207-230)

GO analysis of the identified proteins and phosphoproteins. The identified rice proteins, rice phosphoproteins, Arabidopsis proteins, and Arabidopsis phosphoproteins are represented by blue, red, green, and purple bars, respectively. A,Cellular localization. B, Molecular function. C, Biological process.(Hirofumi Nakagami et.al. Plant Physiol. Vol. 153, 2010)

蛋白抗原表位预测及抗原多肽设计

蛋白抗原表位预测及抗 原多肽设计 公司标准化编码 [QQX96QT-XQQB89Q8-NQQJ6Q8-MQM9N]

蛋白抗原表位预测及抗原多肽设计 利用在线软件BepiPred Server()从蛋白序列直接预测抗原表位 还有其他在线预测网站 进Antigenic Peptide Prediction 用tools 把氨基酸序列粘贴进去,就可以直接得出预测结果 抗原多肽选择的基本原则 1、尽可能是在蛋白表面 2、保证该段序列不形成α-helix 3、N,C端的肽段比中间的肽段更好 4、避免蛋白内部重复或接近重复段的序列 5、避免同源性太强的肽段 6、交联可以交联在N,C两端,选择依据就是交联在对产生抗体不太重要的一端 7、序列中不能有太多的Pro,但有一两个Pro有好处,可以使肽链结构相对稳定一些,对产生特异性抗体有益。 抗原多肽设计的基本原则 ????? 为了使生产抗体获得最佳效果,仔细地设计抗原多肽是很有必要的,设计应满足一个基本条件:在免疫过程中,该抗原既不会产生过强的免疫反应,同时又能产生出对感兴趣的蛋白有结合能力的抗体。尽管抗原设计是一个很复杂的课题,有诸多需要注意的细节,已超过了我们所能提供的范围,根据我们所积累的经验,有几点关键的基本设计原则可以提供给大家参考:

1、确定抗体的用途(应用)新开展一个研究项目,弄清楚所感兴趣的蛋白的一些基本特性是很有必要的,特别是如果知道蛋白的结构会对选择抗体易于接触和识别的识别区域有很大的帮助。然而,在没有这样精确的结构信息(多数是这种情况)的情况下,了解研究的用途(应用)会影响多肽设计的策略。例如:如果研究重点是集中在蛋白的不同区域,如C端或N端,或在一种特定状态下的蛋白,如磷酸化等,那么按照所需序列设计的多肽和产生的相应的抗体在应用上应该没有太大的困难,然而,蛋白的构象将影响抗体与其识别区域之间的相互作用。这种情况下可能存在的问题是如果在折叠的蛋白中,该识别区域被藏在蛋白的内部,抗体将无法接触到该区域。(无法产生相互作用)。 2、识别区域的选择原则一般说来最理想的抗原性识别区域应具备亲水、位于蛋白表面和结构上易变形性等特点。因为在大多数的天然(自然)环境中,亲水区域倾向于集中在蛋白表面,而疏水区域常常被包裹在蛋白内部,同样道理,抗体只能与在蛋白表面发现的识别区域相互作用,而当这些识别区域有足够的结构易变形性而转移到抗体可接触的位置时,将会与抗体间有很高的亲和性。 3、连续的与不连续的识别区域连续的区域是指由连续的氨基酸序列(残基)构成的识别区域。大多数抗体是针对连续识别区域的,抗体能与这类区域以很高的亲和力相结合表明这段序列不在蛋白内部。不连续的识别区域是代表有一定折叠的一段多肽序列,或是将两段分离开的多肽连在一起的抗体的识别区域。在某些情况下,针对这样不连续识别区域的抗体也能产生,只是用来免疫的抗原多肽必须具备与该不连续识别区域相似的二级结构,而序列的长度需要符合相关的要求。 4、基本建议为了避免识别区域隐藏在蛋白内部的风险,我们通常建议选择蛋白的N,C两端来产生的相应的抗体。因为在完整的蛋白中,N,C两端通常是暴露在蛋白表面的。然而,一定要注意膜蛋白的C端疏水性太强,不适合作为抗

第三讲:Uniprot蛋白数据库及其他蛋白质分析工具

第三讲 Uniprot蛋白数据库及其他蛋白质 分析工具
2013/03/19

Uniprot数据库
? Uniprot(Universal?protein?resource)是蛋白 质序列的联合数据库。
– SIB:?Swiss?Institute?of?Bioinformatics – EBI:?European?Bioinformatics?Institute – PIR:?Protein?Information?Resource – 2002年三家联合形成了Uniprot

Swiss‐Prot
? 1986年建立 ? 低冗余度 ? 功能导向 ? 由Swiss?Institute?of?Bioinformatics?和EBI共同 建立并维护

TrEMBL
? TrEMBL=Translation?from?EMBL ? EBI建立并维护 ? 是一个自动数据库 ? 冗余度高,可信度低

UniprotKB
? 部分经过专家注释的数据库 ? 具有很高的可信度 ? 包括两部分UniprotKB/Swiss‐Prot和 UniprotKB/TrEMBL ? UniprotKB/Swiss‐Prot包括539,165条序列 ? UniprotKB/TrEMBL包括29,769,971?条序列 ? 具有非冗余性

Uniparc
? 非冗余性 ? 给予序列的特异性,非同一物种的相同序 列被认为是同一个蛋白质 ? 每一条序列被給予一个特异的编号

蛋白质功能预测方法概述

蛋白质功能预测方法概述 摘要: 蛋白质是生物体内最必需也是最通用的大分子,对它们功能的认识对于科学领域和农业领域的发展有着至关重要的作用。随着后基因组时代的发展,NCBI 数据库中迅速涌现出大量不明结构与功能的蛋白质序列,这些蛋白质序列甚至一跃成了研究的热点。近几十年来蛋白质功能预测的方法不断被完善。由最初的仅基于蛋白质序列或3D 结构信息的方法衍生出更多的基于序列相似性、基于结构基序、基于相互作用网络等新方法,这些新型方法采用新的算法、新的研究思路和技术手段,力求得到准确性与普遍性并存,能够被广泛应用的蛋白质功能预测方法。本文综述了近年来蛋白质功能预测的方法,并将这些研究方法分类归纳,各自阐明了每类方法的优缺点。 关键词: 蛋白质功能预测方法,结构基序,相互作用网络,ESG An Overview protein function prediction methods Abstract: Protein is the most necessary and versatile macromolecules in vivo,researches on their functions are very important to the fields of science and the development of the agriculture. With the development of the post - genomic era,the NCBI database quickly emerges a large number of protein sequences of unknown structure and functions, which even become hot research Points. In the recent decades,protein function prediction methods have been more and more improved and developed. This article reviews the protein function prediction methods occured in recent years,All these methods were inducted and classicicated,and their advantages and disadvantages of each methods were illustrates respectively. Keywords: Protein Function Prediction Methods,Structal Motif,Interaction Networks,ESG 1 引言 基因组学和蛋白质组学在过去十年的发展过程中产生了大规模的新的蛋白质序列和试 验数据,科学家为了确定这些新序列的功能借助计算机手段进行了大量的研究[1 - 2]。在过去的二十年里,人们利用计算机技术对蛋白质功能进行预测的文章发表了上千篇之多( http: / /www.ncbi.nlm.nih.gov /pubmed) ,大部分是基于序列相似性、基于结构域、基于相互作用网络等方法预测,再利用生物学知识来进行解析。本文综合阐述了迄今为止蛋白质功能预测的分类,大致可分为四类: ( 1) 基于序列相似性预测方法; ( 2) 基于蛋白质相互作用网络预测方法;( 3) 基于结构相似性预测方法; ( 4) 其他预测方法。 2 蛋白质功能 蛋白质功能对于客观环境很敏感: 给定的发挥作用的空间环境不同、规定的作用时间不同都可以使蛋白质所表现出来的功能是有差异性的。为了使功能预测的结果更加准确,Bork 等提出了一种蛋白质功能类型的分类[3],按蛋白质发挥作用的平台不同将蛋白质功能分为分子功能,细胞功能和生理功能。很明显,这三个类型不是独立存在的,而是如图2 那样等级相关的。现如今在蛋白质功能预测中最常用的是GO 分类,Gene Ontology 分类从细胞组

相关文档
最新文档