蛋白质结构预测网址
蛋白质结构预测

序列基序识别 二硫键识别 折叠子识别 残基接触预测 结构域预测
结构表面识别
预测蛋白质表面结构功能关键区域
5
PredictProtein Secondary Structure
PredictProtein Secondary Structure
H:螺旋 E:折叠 L:环 e:暴露表面﹥16%残基 b:其它残基
3
PredictProtein提交界面
序列提交窗口
分析方法程序详解
PROFsec(默认) PROFacc(默认) 序列预测
基于轮廓(profile)的神经网络算法预测蛋 白质二级结构 基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
PHDhtm(默认)
ASP(默认) COILS(默认) PROFtmb ProSite(默认) SEG(默认) PredictNLS(默认) DISULFIND(默认) AGAPE PROFcon ProDom(默认) CHOP ConSeq
22
SWISS-MODEL
• SWISS-MODEL是一个蛋白质3D结构数据库,库中收录的蛋白质结
构都是使用SWISS-MODEL同源建模方法得来的。
– /
• 基于同源建模法与PDB数据库已知结构的蛋白质序列比对 进行预测
23
SWISS-MODEL
蛋白质三维结构预测
方法 特点 工具
同源建模法 基于序列同源比对,对于序列相似度>30% SWISS-MODEL, CPHmodels ( Homology/Comparativ 的序列模拟比较有效,最常用的方法 e modelling ) 线串法/折叠识别法 (Threading/Fold recognition) 从头预测法 ( Ab initio/De novo methods ) “串”入已知的各种蛋白质折叠骨架内,适 于对蛋白质核心结构进行预测,计算量大 基于分子动力学,寻找能量最低的构象, 计算量大,只能做小分子预测
结构数据库

小蛋白
总和
90
1195
129
1962
219
3902
三、蛋白质分类数据库CATH
数据库的名称CATH分别是数据库中四种分类类 别的第一个字母,即: C:(class); A:(architecture); T:(topology); H:(homologous superfamily)。 CATH蛋白质分类数据库与另外一个蛋白质分类数据 库SCOP相比,后者更注重从蛋白质进化的角度来对 蛋白质进行分类,而CATH数据库偏重于从结构角度 对蛋白质分类。
Wang Y et al. Nucl. Acids Res. 2000;28:243-245
MMDB(molecular modeling database)
• MMDB 的 记 录 以 ASN.1 格 式 存 储 , 可 以 用 Cn3D, Rasmol, 或 Kinemage来显示。另外, 数据库中类似的结构已经被用 VAST 确认, 新的结构可以用VASTsearch来同数据库进行 比较。
CATH把蛋白质分为4类,即全 α、全β、α-β(α/β型和 α+β型)和低二级结构类。
以蛋白质1ucr为例的搜索结果
1ucr包括两个结构域,分别为 ‘1ucrA00’和‘1ucrB00’。这两个结 构域属于同一同源家族 1.10.10.10。 结果显示1ucr为二聚物,它的每 条链都有自己特异的链标识(如 1ucrA和1ucrB)。
第二节蛋白质结构数据库
Protein Structure Databases
一、蛋白质三维结构数据库PBD
/pdb
/pdbe/
/
Year 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 TOTAL
生物信息学网站网址(全)

生物信息学网站分子生物学数据库综合目录1. SRS序列查询系统(分子生物学数据库网络浏览器) http://www.embl-heidelberg.ed/srs5/2. 分子生物学数据库及服务器概览/people/pkarp/mimbd/rsmith.html3. BioMedNet图书馆4. DBGET数据库链接http://www.genome.ad.jp/dbget/dbget.links.html5. 哈佛基因组研究数据库与精选服务器6. 约翰. 霍普金斯大学(Johns Hopkins University) OWL网络服器/Dan/proteins/owl.html7. 生物网络服务器索引,USCS /network/science/biology/index.html8. 分子生物学数据库列表(LiMB) gopher:///11/molbio/other9. 病毒学的WWW服务器,UW-Madison /Welcome.html10. UK MRC 人类基组图谱计划研究中心/11. 生物学家和生物化学家的WWW资源http://www.yk.rim.pr.jp/~aisoai/index.html12. 其他生物网络服务器的链接/biolinks.html13. 分子模型服务器与数据库/lap/rsccom/dab/ind006links.html14. EMBO实际结构数据库http://xray.bmc.uu.se/embo/structdb/links.html15. 蛋白质科学家的网络资源/protein/ProSciDocs/WWWResources.html16. ExPASy分子生物学服务器http://expasy.hcuge.ch/cgi-bin/listdoc17. 抗体研究网页18. 生物信息网址http://biochem.kaist.ac.kr/bioinformatics.html19. 乔治.梅森大学(George Mason University)的生物信息学与计算分子生物学专业/~michaels/Bioinformatics/20. INFOBIOGEN数据库目录biogen.fr/services/dbcat/21. 国家生物技术信息研究室/data/data.html22. 人类基因组计划情报/TechResources/Human_Genome23. 生物学软件及数据库档案/Dan/software/biol-links.html24. 蛋白质组研究:功能基因组学的新前沿(著作目录) http://expasy.hcuge.ch/ch2d/LivreTOC.html序列与结构数据库一.主要的公共序列数据库1. EMBL WWW服务器http://www.EMBL-heidelberg.ed/Services/index.html2. Genbank 数据库查询形式(得到Genbank的一个记录) /genbank/query_form.html3. 蛋白质结构数据库WWW服务器(得到一PDB结构) 4. 欧洲生物信息学研究中心(EBI) /5. EBI产业支持/6. SWISS-PROT(蛋白质序列库) http://www.expasy.ch/sprot/sprot-top.html7. 大分子结构数据库/cgi-bin/membersl/shwtoc.pl?J:mms8. Molecules R Us(搜索及观察一蛋白质分子) /modeling/net_services.html9. PIR国际蛋白质序列数据库/Dan/proteins/pir.html10. SCOP(蛋白质的结构分类),MRC /scop/data/scop.l.html11. 洛斯阿拉莫斯的HIV分子免疫数据库/immuno/index.html12. TIGR数据库/tdb/tdb.html13. NCBI WWW Entrez浏览器/Entrez/index.html14. 剑桥结构数据库(小分子有机的及有机金属的结晶结构) 15. 基因本体论坛/GO/二. 专业数据库1. ANU生物信息学超媒体服务(病毒数据库、分类及病毒的命名法) .au/2. O-GL YCBASE(O联糖基化蛋白质的修订数据库) http://www.cbs.dtu.dk/OGLYCBASE/cbsoglycbase.html3. 基因组序列数据序(GSDB)(已注释的DNA序列的关系数据序) 4. EBI蛋白质拓扑图/tops/Serverintermed.html5. 酶及新陈代谢途径数据库(EMP) /6. 大肠杆菌数据库收集(ECDC)(大肠杆菌K12的DNA序列汇编) http://susi.bio.uni-giessen.de/ecdc.html7. EcoCyc(大肠杆菌基因及其新陈代谢的百科全书) /ecocyc/ecocyc.html8. Eddy实验室的snoRNA数据库/snoRNAdb/9. GenproEc(大肠杆菌基因及蛋白质) /html/ecoli.html10. NRSub(枯草芽胞杆菌的非冗余数据库) http://pbil.univ-lyonl.fr/nrsub/nrsub.html11. YPD(酿酒酵母蛋白质) /YPDhome.html12. 酵母基因组数据库/Saccharomyces/13. LISTA、LISTA-HOP及LISTA-HON(酵母同源数据库汇编) /14. MPDB(分子探针数据库) http://www.biotech.est.unige.it/interlab/mpdb.html15. tRNA序列及tRNA基因序列汇编http://www.uni-bayreuth.de/departments/biochemie/trna/index/html16. 贝勒医学院(Baylor College of Medicine)的小RNA数据库/dbs/SRPDB/SRPDB.html17. SRPDB(信号识别粒子数据库) /dbs/SRPDB/SRPDB.html18. RDP(核糖体数据库计划) /19. 小核糖体亚蛋白RNA结构http://rrna.uia.ac.be/ssu/index.html20. 大核糖体亚蛋白RNA结构http://rrna.uia.ac.be/lsu/index.html21. RNA修饰数据库/RNAmods/22. 16SMDB及23SMDB(16S和23S核糖体RNA突变数据库)/Departments/Biology/Databases/RNA.html23. SWISS-2DPAGE(二维凝胶电泳数据库) http://expasy.hcuge.ch/ch2d/ch2d-top.html24. PRINTS /bsm/dbbrowser/PRINTS/PRINTS.html25. KabatMan(抗体结构及序列信息数据库) /abs26. ALIGN(蛋白质序列比对一览) /bsm/dbbrowser/ALIGN/ALIGN.html27. CATH(蛋白质结构分类系统) /bsm/cath28. ProDom(蛋白质域数据库) http://protein.toulouse.inra.fr/29. Blocks数据库(蛋白质分类系统) /30. HSSP(按同源性导出的蛋白质二级结构数据库) http://www.sander.embl-heidelberg.de/hssp/31. FSSP(基于结构比对的蛋白质折叠分类) /dali/fssp/fssp.html32. SBASE蛋白质域(已注释的蛋白质序列片断) http://www.icgeb.trieste.it/~sbasessrv/33. TransTerm(翻译控制信号数据库) /Transterm.html34. GRBase(参与基因调控的蛋白质的相关信息数据库) /~regulate/trevgrb.html35. REBASE(限制性内切酶和甲基化酶数据库) /rebase/36. RNaseP数据库/RNaseP/home.html37. REGULONDB(大肠杆菌转录调控数据库) http://www.cifn.unam.mx/Computational_Biology/regulondb/38. TRANSFAC(转录因子及其DNA结合位点数据库) http://transfac.gbf.de/39. MHCPEP(MHC结合肽数据库) .au/mhcpep/40. ATCC(美国菌种保藏中心) /41. 高度保守的核蛋白序列的组蛋白序列数据库/Baxevani/HISTONES42. 3Dee(蛋白质结构域定义数据库) /servers/3Dee.html43. InterPro(蛋白质域以及功能位点的完整资源) /interpro/序列相似性搜索1. EBI序列相似性研究网页/searches/searches.html2. NCBI: BLAST注释/BLAST3. EMBL的BLITZ ULTRA快速搜索/searches/blitz_input.html4. EMBL WWW服务器http://www.embl-heidelberg.de/Services/index.html#55. 蛋白质或核苷酸的模式浏览/compbio/PatScan/HTML/patscan.html6. MEME(蛋白质超二级结构模体发现与研究) /meme/website7. CoreSearch(DNA序列保守元件的识别) http://www.gsf.de/biodv/coresearch.html8. PRINTS/PROSIT浏览(搜索motif数据库) /cgi-bin/attwood/SearchprintsForm.pl9. 苏黎世ETH服务器的DARWIN系统http://cbrg.inf.ethz.ch/10. 利用动态规划找出序列相似性的Pima IIhttp://bmerc-www.bu.ede/protein-seq/pimaII-new.html11. 利用与模式库进行哈希码(hashcode)比较找到序列相似性的DashPat /protein-seq/dashPat-new.html12. PROPSEARCH(基于氨基酸组成的搜索) http://www.embl-heidelberg.de/aaa.html13. 序列搜索协议(集成模式搜索) /bsm/dbbrowser/protocol.html14. ProtoMap(SEISS-PROT中所有蛋白质的自动层次分类) http://www.protomap.cs.huji.ac.il/15. GenQuest(利用Fasta、Blast、Smith-Waterman方法在任意数据库中搜索) http://www.gdb.rog/Dan/gq/gq.form.html16. SSearch(对特定数据库的搜索) http://watson.genes.nig.ac.jp/homology/ssearch-e_help.html17. Peer Bork搜索列表(motif/模式序列谱搜索) http://www.embl-heidelberg.de/~bork/pattern.html18. PROSITE数据库搜索(搜索序列的功能位点) /searches/prosite.html19. PROWL(Skirball研究中心的蛋白质信息检索) /index.html序列和结构的两两比对1. 蛋白质两两比对(SIM) http://expasy.hcuge.ch/sprot/sim-prot.html2. LALNVIEW比对可视化观察程序ftp://expasy.hcuge.ch/pub/lalnview3. BCM搜索装置(两两序列比对) /seq-search/alignment.html4. DALI蛋白质三维结构比较/dali/5. DIALIGN(无间隙罚分的比对程序) http://www.gsf.de/biodv/dialign/html多重序列比对及系统进行树1. ClustalW(BCM的多重序列比对) /multi-align/multi-align.html2. PHYLIP(推测系统进行树的程序) /phylip.html3. 其它系统进行树程序,PHYLIP文档的汇编http://expasy.hcuge.ch/info/phylogeny.html4. 系统进行树分析程序(生命树列表) /tree/programs/programs.html5. 遗传分类学软件(Willi hennig协会提供的列表) /education.html6. 用于多重序列比对的BCM搜索装置/multi-align/multi-align.html7. AMAS(分析多重序列比对中的序列) /servers/amas_server.html8. 维也纳RNA二级结构软件包http://www.tbi.univie.ac.at/~ivo/RNA/四. 有代表性的预测服务器1. PHD蛋白质预测服务器,用于二级结构、水溶性以及跨膜片断的预测http://www.embl-heidelberg.de/predictprotein/predictprotein.html2. PhdThreader(利用逆折叠方法预测、识别折叠类) http://www.embl-heidelberg.de/predictprotein/phd_help.html3. PSIpred(蛋白质结构预测服务器) /psipred4. THREADER(戴维. 琼斯) /~jones/threader.html5. TMHMM(跨膜螺旋蛋白的预测) http://www.cbs.dtu.dk/services/TMHMM/6. 蛋白质结构分析,BMERC /protein-seq/protein-struct.html7. 蛋白质域和折叠预测的提交表http://genome.dkfz-heidelberg.de/nnga/def-query.html8. NNSSP(利用最近相邻法预测蛋白质的二级结构) /pss/pss.html9. Swiss-Model(基于知识的蛋白质自动同源建模服务器) http://www.expasy.ch/swissmod/SWISS-MODEL.html10. SSPRED(用多重序列比对进行二级结构预测) /jong/predict/sspred.html11. 法国IBCP的SOPM(自寻优化预测方法、二级结构) http://pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopm.html12. TMAP(蛋白质跨膜片断的预测服务) http://www.embl-heidelberg.de/tmap/tmap_info.html13. TMpred(跨膜区域和方向的预测) /software/TMPRED_form.html14. MultPredict(多重序列比对的序列的二级结构) /zpred.html15. BCM搜索装置(蛋白质二级结构预测) /seq-search/struc-predict.html16. COILS(蛋白质的卷曲螺旋区域预测) /software/coils/COILS_doc.html17. Coiled Coils(卷曲螺旋) /depts/biol/units/coils/coilcoil.html18. Paircoil(氨基酸序列中的卷曲螺旋定位) /bab/webcoil.html19. PREDATOR(由单序列预测蛋白质二级结构) http://www.embl-heidelberg.de/argos/predator/predator_info.html20. EV A(蛋白质结构预测服务器的自动评估) /eva/五. 其他预测服务器1. SignalP (革兰氏阳性菌、革兰氏阴性菌和真核生物蛋白质的信号肽及剪切位点) http://www.cbs.dtu.dk/services/SignalP/2. PEDANT(蛋白质提取、描述及分析工具) http://pedant.mips.biochem.mpg.de/六. 分子生物学软件链接1. 生物信息学可视化工具/alan/VisSupp/2. EBI分子生物学软件档案/software/software.html3. BioCatalog /biocat/e-mail_Server_ANAL YSIS.html4. 生物学软件和数据库档案/Dan/softsearch/biol-links.html5. UC Santa Cruz的序列保守性HMM的SAM软件/research/compbio/sam.html七. 网上博士课程1. 生物计算课程资源列表:课程大纲http://www.techfak.uni-bielefeld.de/bcd/Curric/syllabi.html2. 生物序列分析和蛋白质建模的Ph.D课程http://www.cbs.dtu.dk/phdcourse/programme.html3. 分子科学虚拟学校/vsms/sbdd/4. EMBnet 生物计算指南http://biobase.dk/Embnetut/Universl/embnettu.html5. 蛋白质结构的合作课程/PPS/index.html6. 自然科学GNA虚拟学校http://www.techfak.uni-bielefeld.de/bcd/Vsns/index.html7. 分子生物学算法/education/courses/590bi。
蛋白质结构预测(PDF-37)

蛋白质结构预测Protein Structure PredictionHaibo SunDepartment of BioinformaticsMininGene BiotechnologyG h lMarch 22, 2007背景结构分类:z一级结构也就是组成蛋白质的氨基酸序列z二级结构即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等l h b t lz三级结构即二级结构在更大范围内的堆积形成的空间结构z四级结构主要描述不同亚基之间的相互作用。
结构测定的实验方法z核磁共振z X光晶体衍射两种。
一级结构级结构预测基础预测基础:z 实验:在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构z 物理学的角度讲,系统的稳定状态通常是能量最小的状态二级结构反向β-折叠α-螺旋β-转角三级结构Turn or coilAlpha-helix Beta-sheetLoop and Turn蛋白质结构预测•Sequence secondary structure 3D structure Sequence →secondary structure →3D structure →functionProtein Structure PredictionProtein Structure Prediction •Prediction is possible because–Sequence information uniquely determines 3D structure–Sequence similarity (>50%) tends to imply structuralsimilarity•Prediction is necessary because–DNA sequence data »protein sequence data »structuredata199419972002.102007.3 Sequence (Swiss Port)40,00068,000114,033261,513 Sequence(Swiss-Port)4000068000114033261513 Structure (PDB)4,0457,00018,83842,474Methods预测方法Comparative (homology) modeling (同源建模法) Construct 3D model from alignment to proteinithsequences withknown structureg(g)(折识别法)Threading (fold recognition) (折叠识别法Pick best fit to sequences of known 2D / 3D structures (folds)Ab initio / de novo methods (从头预测法)Ab initio/de novo methods(Methods(1)同源性(Homology)方法:理论依据:如果两个蛋白质的序列比较相似,则其结构理论依据如果两个蛋白质的序列比较相似则其结构也有很大可能比较相似。
蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址:/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址://uniprot/简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。
2.PIR(Protein Information Resource) 网址:/简介:致力于提供及时的、高质量、最广泛的注释,其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort,与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。
3.BRENDA(enzyme database) 网址:简介:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。
4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址:http://mips.gsf.de/genre/proj/corum/index.html简介:哺乳动物蛋白复合物数据库,提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址:.au/cybase简介:环状蛋白数据库,提供环状蛋白的序列、结构等数据,提供环化蛋白预测服务。
6.DB-PABP 网址:/DB_PABP/简介:聚阴离子结合蛋白数据库。
NCBI

NCBI(National Center for Biotechnology)是目前国际上几个重要分子生物信息网站之一(网址/),其成立的原因是为已故的参议院议员Claude Pepper发现计算信息处理方法对生物医学研究的重要,因此,在1988年11月4日成立National Center for Biotechnology Information(NCBI)。
NCBI是National Institutes of Health(NIH)底下的National Library of Medicine (NLM)的部门之一。
由于NLM具有建立与维护生物医学数据库经验,且因它是NIH的单位,因此可执行计算分子生物计划。
NIH目前是全世界最大的生物医学研究单位NCBI成立的主要任务为:(1)提供生物医学的分析与计算工具,协助研究人员了解生物的语言--DNA--在健康与疾病中所扮演的角色,并且(2)发展新技术协助了解调控健康与疾病的基本分子与遗传过程,包括建立储存与分析分子生物、生化与遗传学知识的自动系统;促进研究与医学社群使用数据库与软件;协调生物技术信息的传递与管理;执行以计算机为基础的进阶信息分析过程,用以分析生物重要分子的结构与功能。
为了让使用者更清楚NCBI对生物信息的贡献,以及更进一步了解目前NCBI提供的数据库与工具资源。
本文以下将从初学者的角度介绍NCBI网站,作为使用者入门NCBI的指南(本部份数据来源为NCBI, National Center for Biotechnology网站)。
一、NCBI的组织架构NCBI主要分为三个部门,分别为:Computational Biology Branch (CBB)、Information Engineering Branch(IEB)与Information Resources Branch(IRB),各部门分别具有不同的执掌,详如下:1. Computational Biology Branch(CBB)‧处理运算、数学及分子生物、生物与遗传学理论问题的基础与应用研究,包括基因体分析、序列比对、序列搜寻方法、巨分子结构、动力学与交互作用、结构/功能预测等。
蛋白质功能-结构-相互作用预测网站工具合集

蛋白质组学蛋白质是生物体的重要组成部分,参与几乎所有生理和细胞代谢过程。
此外,与基因组学和转录组学比较,对一个细胞或组织中表达的所有蛋白质,及其修饰和相互作用的大规模研究称为蛋白质组学。
蛋白质组学通常被认为是在基因组学和转录组学之后,生物系统研究的下一步。
然而,蛋白质组的研究远比基因组学复杂,这是由于蛋白质内在的复杂特点,如蛋白质各种各样的翻译后修饰所决定的。
并且,研究基因组学的技术要比研究蛋白质组学的技术强得多,虽然在蛋白质组学研究中,质谱技术的研究已取得了一些进展。
尽管存在方法上的挑战,蛋白质组学正在迅速发展,并且对癌症的临床诊断和疾病治疗做出了重要贡献。
几项研究鉴定出了一些蛋白质在乳腺癌、卵巢癌、前列腺癌和食道癌中表达变化。
例如,通过蛋白质组学技术,人们可以在患者血液中明确鉴定出肿瘤标志物。
表1列出了更多的蛋白质组学技术用于研究癌症的例子。
另外,高尔基体功能复杂。
最新研究表明,它除了参与蛋白加工外,还能参与细胞分化及细胞间信号传导的过程,并在凋亡中扮演重要角色,其功能障碍也许和肿瘤的发生、发展有某种联系。
根据人类基因组研究,约1000多种人类高尔基体蛋白质中仅有500~600种得到了鉴定,建立一条关于高尔基体蛋白质组成的技术路线将有助于其功能的深入研究。
蛋白质组学是一种有效的研究方法,特别是随着亚细胞器蛋白质组学技术的迅猛发展,使高尔基体的全面研究变为可能。
因此研究人员希望能以胃癌细胞中的高尔基体为研究对象,通过亚细胞器蛋白质组学方法,建立胃癌细胞中高尔基体的蛋白质组方法学。
研究人员采用蔗糖密度梯度的超速离心方法分离纯化高尔基体,双向凝胶电泳(2-DE)分离高尔基体蛋白质,用ImageMaster 2D软件分析所得图谱,基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF MS)鉴定蛋白质点等一系列亚细胞器蛋白质组学方法建立了胃癌细胞内高尔基体的蛋白图谱。
最后,人们根据分离出的纯度较高的高尔基体建立了分辨率和重复性均较好的双向电泳图谱,运用质谱技术鉴定出12个蛋白质,包括蛋白合成相关蛋白、膜融合蛋白、调节蛋白、凋亡相关蛋白、运输蛋白和细胞增殖分化相关蛋白。
蛋白质预测分析-网址集锦

蛋白质预测分析网址集锦2007/04/06 18:31物理性质预测:Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemass http://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp:///pub/fasta/ SAPShttp://ulrec3.unil.ch/software/SAPS_form.html基于组成的蛋白质识别预测AACompIdent http://expaxy.hcuge.ch/ch2d/aacompi.html AACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.embl-heidelberg.de/prs.html二级结构和折叠类预测nnpredict/~nomi/nnpredictPredictprotein http://www.embl-heidelberg.de/predictprotein/SOPMAhttp://www.ibcp.fr/predict.htmlSSPREDhttp://www.embl-heidelberg.de/sspred/ssprd_info.html特殊结构或结构预测COILS http://ulrec3.unil.ch/software/COILS_form.htmlMacStripe/matsudaira/macstripe.html与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。
由NCBI检索蛋白质序列可联网到:“:80/entrz/query.fcgi?db=protein”进行检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质结构预测网址物理性质预测:Compute PI/MWPeptidemass TGREASESAPS基于组成的蛋白质识别预测AACompIdent PROPSEARCH二级结构和折叠类预测nnpredictPredictproteinSSPRED特殊结构或结构预测COILSMacStripe与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。
由NCBI检索蛋白质序列可联网到:“”进行检索。
利用SRS系统从EMBL检索蛋白质序列联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。
通过EMAIL进行序列检索当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。
蛋白质基本性质分析蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。
蛋白质的很多功能特征可直接由分析其序列而获得。
例如,疏水性图谱可通知来预测跨膜螺旋。
同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。
WEB中有很多此类资源用于帮助预测蛋白质的功能。
疏水性分析位于ExPASy的ProtScale程序()可被用来计算蛋白质的疏水性图谱。
该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。
输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。
需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。
进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。
跨膜区分析有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。
这些技术主要是基于对已知跨膜螺旋的研究而得到的。
自然存在的跨膜螺旋Tmbase 数据库,可通过匿名FTP获得(),参见表一资源名称网址说明TMPRED基于对tmpred数据库的统计分析PHDhtm ...tprotein.html MEMSAT微机版本,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
“或“”前导肽与蛋白质定位在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。
合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。
一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。
在起始密码子之后,有一段编码疏水性氨基酸序列的RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。
含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
卷曲螺旋分析另一个能够直接从序列中预测的功能motif是α-螺旋的卷曲排列方式。
在这种结构中,两种螺旋通过其疏水性界面相互缠在一起形成一个十分稳定的结构。
蛋白质卷曲的相关资源资源网址coiled-coil蛋白质功能预测基于序列同源性分析的蛋白质功能预测到少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显著性意义。
最快的工具如BlastP能很容易地发现显著性片段,而无需使用十分耗时的BLITZ软件。
基于NCBI/BLAST软件的蛋白序列同源性分析类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(),选择程序BLASTP就可网上分析。
基于WU/BLAST2软件进行分析华盛顿大学的BLAST软件(dove.embl-heidelberg.dl/blast2)也可进行蛋白质序列的同源性分析。
基于motif、结构位点、结构功能域数据库的蛋白质功能预测蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。
同时,分子进化方面的研究表明,蛋白质的不同区域具有不同的进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质的功能。
在序列模式的鉴定方面有两类技术,第一类是依赖于和一致性序列(consensus sequence)或基序各残基的匹配模式,该技术可用于十分容易并快速搜索motif数据库。
Motif数据库-PROSITE最好的是PROSITE)蛋白质序列的(profile)分析InterProScan综合分析网站InterProScan 是EBI 开发的一个集成了蛋白质结构域和功能位点的数据库,其中把SWISS-PROT,TrEMBL.PROTSITE.PRINTS.PFAM.ProDom 等数据库提供的蛋白质序列中的各种局域模式,如结构域,motif等信息统一起来,提供了一个较为全央的分析工具。
蛋白质的结构功能域分析简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接蛋白质结构预测PDB数据库蛋白质基本立体结构数据库(PDB,)其中有大量工具用于查看PDB数据库中的结构,如rasmol,可用于显于出蛋白质的空间结构,下载地址:)PDBFinder 数据库是在PDB、DSSP、HSSP基础上建立的二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息随着PDB库每次发布新版,PDBFinder在EBI自动生成,网址为“.NRL-3D数据库是所有已知结构蛋白质的数据库,可用于查询蛋白序列时行相似性分析以确定其结构ISSD数据库蛋白质序列数据库,其每个条目包含一个基因的编码序列,同相应的氨基酸序列对比,并给出相应的多肽链结构数据。
HSSP数据库是根据同源性导出的蛋白质二级结构数据库,每一条PDB项目都有一个对应的HSSP文件,蛋白质结构分类数据库对已知蛋白质三维结构进行手工分类得到的数据库,位于剑桥的站点也提供BLAST检索服务MMDB蛋白质分子模型数据库是ENTREZ检索工具所使用的三维结构数据库,以ASN格式反蚋的PDB中的结构和序列数据。
NCBI同时提供一个配套的三维结构显示程序的Cn3D,Dali/FSSP数据库基于PDB数据库中现有的蛋白质三维结构,用自动结构对比程序Dali比较而形成的折叠单元和家庭分类库。
蛋白质二级结构预测基于序列进行蛋白质二级结构方面已有了大量文献描述,本质上,这些研究可被分为两大类:基于单一序列的分析和基于多重序列对齐的分析。
文献报道PHD程序是目前此方面的最好程序,提供了从二级结构到折叠方面分析的多种资源。
其网址为,也可通过email:predictprotein@embl-heidelberg.de进行数据分析。
蛋白质三级结构预测蛋白质同源家庭的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义,同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog),前者指不同物种中具有相同功能和共同起源的基因,后者则指在同一物种内具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌红蛋白。
蛋白质分类数据库(ProtoMap)是对SWISS-PROT数据库中的全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到的数据库。
蛋白质序列多重对齐分析及进化分析如果发现一个未知蛋白质序列和较多不同和种属或同一种属的蛋白质序列具有较高的同源性(大于30%)那么提示待分析的蛋白质序列可能是相应家族的成员,从而可从分子时化的角度对蛋白质序列进行综合分析。
常用在线蛋白工具BCM Search Launcher蛋白序列二级结构预测综合站点,从此出发,输入蛋白序列,可以根据需要,使用各种在线预测工具,包括Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMpred、SOUSI、Paircoil、Protein Hydrophilicity/Hydrophobicity Search、SOPM,使用十分方便。
DAS蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。
TopPred 2斯德哥尔摩大学理论化学蛋白预测服务器提供的膜蛋白拓扑学预测Topology prediction of membrane proteins在线工具SOSUI东京农业科技大学(Tokyo University of Agriculture and Technology)提供的膜蛋白分类和二级结构预测在线工具。
PSIpred - MEMSAT2本蛋白结构预测服务器允许你提交一个蛋白序列,进行二级结构预测与跨膜拓朴结构预测,并将结果用EMAIL提供给您。
HMMTOP预测蛋白序列的跨膜螺旋与拓扑结构服务器TMpred预测蛋白序列跨膜区TMHMM预测蛋白的跨膜螺旋The PredictProtein server提供蛋白数据库查询,预测蛋白各种结构的服务SMART提供蛋白序列,在结构域数据库中查询,显示出其结构域及跨膜区等SPLIT膜蛋白二级结构预测服务器PRED-TMR提供基于SwissProt数据库统计分析的预测蛋白跨膜片段的服务CoPreThi基于INTERNET的JAVA程序,预测蛋白的跨膜区TMAP提供预测蛋白跨膜片段的服务multalin蛋白序列对照服务器,比较几条蛋白序列的结构。
Protein Sequence Analysis巴斯德研究所提供的常用蛋白序列分析在线工具,绝对精选。
PSAProtein Sequence Analysis 服务器为美国波士顿大学生物分子工程研究中心(the BioMolecular Engineering Research Center )开发,提交氨基酸序列,预测二级结构及折叠区域。
PRSEMBL提供的以未知蛋白序列的氨基酸组成而非氨基酸序列顺序进行蛋白家族及各种特性预测的服务器,并将结果通过EMAIL发给您。
AAAEMBL氨基酸分析服务器,与上一个服务类似,以氨基酸残基组成为蛋白分析基础数据,结合蛋白数据库进行分析。
物理性质预测:Compute PI/MWPeptidemass TGREASESAPS基于组成的蛋白质识别预测AACompIdent PROPSEARCH二级结构和折叠类预测nnpredictPredictproteinSSPRED特殊结构或结构预测COILSMacStripe与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。