蛋白常用数据库

合集下载

蛋白质数据库介绍

SWISS-PROT或TrEMBL /sprotPIRMIPSJIPID已经和ExPASy 三、蛋白质二级结构预测网站（数据库）4始建于基于对蛋白质家族中同源序列多重序列比对得到的保守区域，这些区域通常与生物学功能相关。

数据库包括两个数据库文件：数据文件Prosite5蛋白质二级结构构象参数数据库DSSP6蛋白质家族数据库FSSP7同源蛋白质数据库HSSP在前面已经述说过了。

第二节、蛋白质序列分析方法一、多序列比对双序列比对是序列分析的基础。

序列之间的关系，生物学模式方面起着相当重要的作用。

多序列比对有时用来区分一组序列之间的差异，但其主要用于描述一组序列之间的相似性关系，法建立在某个数学或生物学模型之上。

因此，正如我们不能对双序列比对的结果得出果也没有绝对正确和绝对错误之分，相似性关系以及它们的生物学特征。

我们称比对前序列中残基的位置为绝对位置。

置Ⅰ相对位置。

显然，同一列中所有残基的相对位置相同，而每个残基的绝对位置不同，因为它们来自不同的序列。

绝对位置是序列本身固有的属性，也就比对过程赋予它的属性。

算法复杂性多序列比对的计算量相当可观，时间和内存空间与这两个序列的长度有关，或者说正比于这两个序列长度的乘积，用（的两维空间扩展到三维，即在原有二维平面上增加一条坐标轴。

这样算法复杂性就变成了（例如，如果用某种颜色表示一组高度保守的残基，则某个序列的某一位点发生突变时，则由于颜色不同，就可以很快找出。

颜色的选择可以根据主观愿望和喜好，但最好和常规方法一致。

用来构筑三维模型的按时氨基酸残基组件和三维分子图形软件所用的颜色分类方法，比较容易为大家接受（表2）。

多序列比对程序的另一个重要用途是定量估计序列间的关系，关系。

关系。

相似性值低于预料值，那么有可能是序列间亲缘关系较远，也可能是比对中有错误之处2同步法实质是把给定的所有序列同时进行比对，而不是两两比对或分组进行比对。

其基本思想是将一个二维的动态规划矩阵扩展到三维或多维。

蛋白质数据库

生物芯片北京国家工程研究中心湖南中药现代化药物筛选分中心暨湖南涵春生物有限公司常用数据库名录1、蛋白质数据库PPI - JCB 蛋白质与蛋白质相互作用网络•Swiss-Prot - 蛋白质序列注释数据库•Kabat - 免疫蛋白质序列数据库•PMD - 蛋白质突变数据库•InterPro - 蛋白质结构域和功能位点•PROSITE - 蛋白质位点和模型•BLOCKS - 生物序列分析数据库•Pfam - 蛋白质家族数据库 [镜像： St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] •PRINTS - 蛋白质 Motif 数据库•ProDom - 蛋白质结构域数据库 (自动产生)•PROTOMAP - Swiss-Prot蛋白质自动分类系统•SBASE - SBASE 结构域预测数据库•SMART - 模式结构研究工具•STRING - 相互作用的蛋白质和基因的研究工具•TIGRFAMs - TIGR 蛋白质家族数据库•BIND - 生物分子相互作用数据库•DIP - 蛋白质相互作用数据库•MINT - 分子相互作用数据库•HPRD - 人类蛋白质查询数据库•IntAct - EBI 蛋白质相互作用数据库•GRID - 相互作用综合数据库•PPI - JCB 蛋白质与蛋白质相互作用网络2、蛋白质三级结构数据库•PDB - 蛋白质数据银行•BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库•SWISS-MODEL Repository - 自动产生蛋白质模型的数据库•ModBase - 蛋白质结构模型数据库•CATH - 蛋白质结构分类数据库•SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia]•Molecules To Go - PDB数据库查询•BMM Domain Server - 生物分子模型数据库•ReLiBase - 受体/配体复合物数据库 [镜像： USA]•TOPS - 蛋白质拓扑图•CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))•HSSP - 蛋白质二级结构数据库•MutaProt - PDB数据库中点突变的比较•SWISS-3DIMAGE - 蛋白质和其他生物分子的三维图像•BioImage - 生物图像数据库 (包含生物大分子图像) 3、蛋白质组数据库和链接•2－D胶数据库以及与2－D胶相关的数据库•蛋白质组链接4、与核酸相关的数据库•EMBL - EMBL核酸序列数据库 (EBI)•Genbank - GenBank核酸序列数据库 (NCBI)•DDBJ - 日本DNA数据库•dbEST - dbEST(表达序列标签)数据库 (NCBI)•dbSTS - dbSTS(序列标签位点)数据库 (NCBI)•AsDb - 异常剪切数据库•ACUTS - DNA非转录保守序列数据库•密码子数据库•EPD - 真核生物启动子数据库•HOVERGEN - 颈椎动物同源基因数据库•IMGT - 免疫遗传学数据库 [镜像： EBI]•ISIS - 内含子序列信息•RDP - 核糖体数据库•gRNAs db - gRNA数据库•PLACE - 植物DNA顺势调控元件数据库•PlantCARE - 植物中DNA顺势调控组件数据库•ssu rRNA - 欧洲核糖体RNA数据库－小核糖体•lsu rRNA - 欧洲核糖体RNA数据库－大核糖体•5S rRNA - 5S核糖体RNA数据库•tmRNA Website - tmRNA站点•tmRDB - tmRNA数据库•tRNA - tRNA剪切（ Bayreuth大学）•uRNA db•RNA editing - RNA剪切位点•RNAmod db - RNA修饰数据库•TelDB - 多介质端粒数据库•MPDB - 分子探针数据库•VectorDB - 载体序列数据库5、糖类•FCCA - 糖类论坛•GlycoSuiteDB - 多聚糖数据库•Monosacharide browser - Space filling Fischer projection for monosaccharides•Thorkild's lectin page - 凝集素通道6、特殊物种数据库:人类：•OMIM - 孟德尔遗传在线－－人类•GENATLAS - 人类基因图集•GeneClinics - 医学基因学库•GDB - 基因组数据库•GeneCards - 人类基因整合信息数据库•UDB - 人类基因图谱数据库•Ensembl人类基因组浏览器•UCSC人类基因组工作草图•TIGR HGI - TIGR人类基因组索引•Hs UniGene - GenBank中的人类转录本•STACK - 序列标签比对• - 人类基因预测•GenLink - 人类基因组资源数据库•GeneLynx - 人类基因组•HUGE - 人类未知基因－大型蛋白质反转录得到的cDNA (KIAA...)•HUNT - 人类异常转录本•CGAP - 癌症基因组解剖学•MGC - 哺乳动物基因•SCDb - 干细胞数据库•Homophila - 人类疾病基因与果蝇基因对比数据库•Human Protein Atlas - 人类正常组织蛋白质与癌细胞蛋白质表达与位点的比较•Chr at Rutgers - Rutgers的人类染色体信息•Chr at Sanger - Sanger Center的人类染色体信息•Chr Swiss-Prot list - Swiss-Prot的染色体信息脊椎动物：•OMIA - 孟德尔遗传在线－－动物•MGI - 小鼠基因组学信息 [镜像： Australia]•Ensembl小鼠基因组浏览器•TIGR MGI - TIGR小鼠基因索引•Mm UniGene - GenBank 中的小鼠转录本(EST clusters) •MGC - 哺乳动物基因•Mouse gene knockouts db - 小鼠基因敲除数据库•RGD - 大鼠基因组数据库•RatMAP - 大鼠基因组数据库•TIGR RGI - TIGR大鼠基因组数据库•Rn Unigene - GenBank 中的大鼠转录本(EST clusters) •BOVMAP - 牛基因数据库 (法国)•DGP - 狗基因数据库•MIS - 孟德尔遗传－－羊•Ark-Cat - 猫基因组数据库•Ark-Chicken - 鸡基因组数据库•Ark-Cow - 奶牛基因组数据库•Ark-Deer - 鹿基因组数据库•Ark-Horse - 马基因组数据库•Ark-Pig - 猪基因组数据库•Ark-Sheep - 绵羊基因组数据库•Ark-Turkey - 火鸡基因组数据库•FishBase -鱼类综合信息系统•Fugu genome project - 河豚基因组•Fugu - HGMP 河豚数据•- Ensembl 河豚基因组浏览器•Medakafish - Mekada fish (Oryzias latipes) server •Ark-Tilapia - 罗飞鱼基因组数据库•Ark-Salmon - 大马哈鱼基因组数据库•The fish net - 斑马鱼基因组数据库•Ensembl斑马鱼基因组浏览器线粒体和叶绿体：•GOBASE - 细胞器基因组数据库•MitoDat - 孟德尔遗传和线粒体数据库• C.caldarium - 蓝藻纲PK1菌株叶绿体基因组昆虫•Drosophila Swiss-Prot list - Swiss-Prot中的果蝇链接•FlyBase - 果蝇遗传数据库和分子数据库•BDGP - Berkeley果蝇基因组项目•FlyView - 果蝇图像数据库•Homophila - 人类疾病与果蝇基因对照数据库•蚊子基因组学•AnoDB - 疟蚊数据库•Ensembl蚊子基因组浏览器7、人类突变数据库•HGMD - 人类基因突变数据库•SVD - EBI序列变异数据库•GeneDis - 人类遗传病数据库8、特殊基因和蛋白质数据库•Allergens in Swiss-Prot - Swiss-Prot中过敏反应的命名与索引•Allergome - 过敏症反应分子数据库•Aminoacyl-tRNA synthetases in Swiss-Prot - Swiss-Prot 中氨基化tRNA合成酶列表9、转录后修饰数据库•DSDBASE - 二硫化物数据库 (数据来源于三级结构数据库) •GlycoSuiteDB - 多聚糖结构数据库•LIPID MAPS - 脂类代谢及路径10、系统发生学数据库•COG - 全基因组中编码的蛋白质的系统发生学分类方法•EGO - 真核生物基因分类方法•InParanoid - 真核生物分类11、芯片数据库•ArrayExpress - EBI中芯片数据•ExpressDB - 酵母菌和大肠杆菌表达数据库•GeneX - 基因表达工程12、专利数据库•DPD - DNA专利数据库•Ag Patents - USDA收录的农业工艺专利•Esp@cenet - 欧洲专利事务所专利信息数据库 (世界范围内)13、参考文献(目录数据库)•PubMed Medline server - PubMed查询•AGRICOLA - NAL农业查询数据库•Article@INIST - 科技信息数据库•Korean Journals Abstract db - 韩国杂志摘要数据库•SeqAnalRef - 序列分析文献14、字典, 读物, 课程 ,命名法•BioABACUS - 缩写词•BioTech's life science dictionary生物科技及生命科学字典•DCB - 细胞生物学字典（Julian Dow编写）15、生物软件数据库及目录•CLC Free Workbench - 可在Linux, MacOS X and Windows操作系统上运行的，对DNA、RNA和蛋白质进行算法分析的软件•CLC Protein Workbench - 可在Linux, MacOS X and Windows 操作系统上运行的，对DNA、RNA和蛋白质进行算法分析的软件•BioCatalog - EBI的生物目录16、生命科学资源•Biofind - 生物科技工业信息、评论及新闻•Bioinformatik.de - 生物信息学网页目录17、生物杂志和发行人•生物杂志主页：Swiss-Prot journals list - Swiss-Prot杂志列表• - 电子出版物目录• - 电子期刊目录18、发行人•Allen Press, Inc. - Allen出版社•AMA - 美国医学联合出版物•ACS - 美国化工协会出版物19、生物信息学杂志和通讯•BioInformer - EBI通讯•NCBI Newsletter -NCBI通讯•PDB Quaterly Newsletter - PDB通讯20、基因组通讯•Human Genome Project Information - 人类基因组计划•FGN - 真菌遗传学•Rice Genome Newsletter - 水稻基因组21、其他•IJC - 化学杂志•Plant Gene Register - 植物基因注册22、生物商业杂志•BioCentury - 生物世纪•BioWorld Online - 生物世界•Drug Discovery and Development - 药物发现和发展•GEN - 基因工程新闻23、综合性科学杂志•Nature•New Scientist•La Recherche•Science•Scientific American24、生物学研究机构•APS - 美国缩氨酸社区•ASCB - 美国细胞生物学社区•ASHG - 美国人类遗传学社区25、计算生物学服务器主页欧洲：•EBI - 欧洲生物信息学协会•EMBnet - 欧洲分子生物信息学网•EMBL - EMBL计算生物学机构美国和加拿大：•NCBI - 美国生物学信息中心•ABCC - NCI高级生物医学计算中心•ACGT - Oklahoma大学基因组技术中心亚洲•APBioNet - 亚太生物信息网•BIC-JNU - Jawaharlal Nehru大学生物信息学中心•DIC - Pune (印度)大学生物信息澳洲•APBioNet - 亚太生物信息网•ANGIS - 澳大利亚国家遗传信息服务中心•ANU - 澳大利亚国大学生物信息学研究组•APAF - 澳大利亚蛋白质组分析工具26、其他•HUJI - 耶路撒冷Hebrew大学基因组学和生物信息学服务中心•Weizmann Bioinfo/BCU - Weizmann计算生物学和生物信息学研究协会•SANBI - 南非生物信息学研究协会27、生物公司和制药公司•美国药物研究和制造商目录•Bioportfolio - 生物技术企业•Affymetrix, Inc. - Affymetrix公司28、生物信息公司•Aborygen•Accelrys, Inc•AlgoNomics NV t29、其他链接其他医学查询•HON - 基于网络的健康服务• - 药物网络指南•MedWeb - 医学链接其他科学查询•GPSDB - 基因和蛋白质同义词数据库•Chemcyclopedia Online - 商业化学试剂数据库。

蛋白质数据库使用说明

引言：蛋白质数据是生物信息学领域中非常重要的资源之一，它提供了大量关于蛋白质序列、结构、功能以及相互作用等方面的信息。

本文旨在介绍如何使用蛋白质数据库，帮助用户更好地利用这一资源进行研究。

概述：蛋白质数据库是一个集成了许多蛋白质信息的在线资源，用户可以通过搜索、浏览、等方式获取所需的信息。

其中，常用的蛋白质数据库包括NCBI、UniProt、PDB等。

这些数据库提供了丰富的蛋白质数据，并且不断更新以满足用户需求。

正文内容：1.数据库搜索功能1.1.关键词搜索1.1.1.输入蛋白质名称1.1.2.输入序列片段1.1.3.输入关键词1.2.高级搜索选项1.2.1.提供更精确的搜索结果1.2.2.支持过滤和排序功能1.2.3.可以根据相关字段进行搜索2.数据库浏览功能2.1.蛋白质分类2.1.1.按物种分类2.1.2.按功能分类2.1.3.按家族分类2.2.数据表格浏览2.2.1.查看蛋白质基本信息2.2.2.查看蛋白质序列2.2.3.查看蛋白质结构2.3.数据图谱浏览2.3.1.查看蛋白质相互作用网络2.3.2.查看蛋白质结构域分布2.3.3.查看蛋白质功能注释3.数据库功能3.1.蛋白质序列数据3.1.1.全部序列3.1.2.特定物种的序列3.2.蛋白质结构数据3.2.1.已解析的蛋白质结构3.2.2.蛋白质结构预测结果3.3.蛋白质相互作用数据3.3.1.已验证的相互作用数据3.3.2.预测的相互作用数据4.数据库工具与资源4.1.序列比对工具4.1.1.BLAST4.1.2.PSIBLAST4.2.结构预测工具4.2.1.SWISSMODEL4.2.2.Phyre24.3.功能注释资源4.3.1.GeneOntology4.3.2.InterPro4.4.数据库交互接口4.4.1.提供API接口4.4.2.支持数据提交与5.数据库更新与维护5.1.数据更新频率5.2.数据质量保证5.3.用户反馈与支持5.4.数据库版本与历史记录总结：蛋白质数据库为研究人员提供了丰富的蛋白质信息资源，通过搜索、浏览、等功能，用户可以轻松地获取需要的数据。

蛋白质分析相关数据库及网站

表1蛋白质相互作用分析相关数据库及网站蛋白质序列分析和结构预测【实验目的】1、掌握蛋白质序列检索的操作方法；2、熟悉蛋白质基本性质分析；3、熟悉基于序列同源性分析的蛋白质功能预测，了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测；4、了解蛋白质结构预测。

【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素（adiponectin）蛋白质序列；2、使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析；3、对人脂联素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析；4、对人脂联素蛋白质序列进行motif结构分析；5、对人脂联素蛋白质序列进行二级结构和三维结构预测。

【实验方法】1、人脂联素蛋白质序列的检索：（1）调用Internet浏览器并在其地址栏输入Entrez网址（/Entrez）；（2）在Search后的选择栏中选择protein；（3）在输入栏输入homo sapiens adiponectin；（4）点击go后显示序列接受号及序列名称；（5）点击序列接受号NP_004788 （adiponectin precursor；adipose most abundant gene transcript 1 [Homo sapiens]）后显示序列详细信息；（6）将序列转为FASTA格式保存（参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列）；2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析：打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino Acid Composition→查看该蛋白质分子质量和氨基酸组成；或者选择protein后，点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平；3、人脂联素蛋白质序列的蛋白质同源性分析：（1）进入NCBI/Blast网页；（2）选择Protein-protein BLAST （blastp）；（3）将FASTA格式序列贴入输入栏；（4）点击BLAST；（5）查看与之同源的蛋白质；4、人脂联素蛋白质序列的motif结构分析：（1）进入http://hits.isb-sib.ch/cgi-bin/PFSCAN网页；（2）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏；（3）点击Scan；（4）查看分析结果（注意Prosite Profile中的motif information）；5、人脂联素蛋白质序列的二级结构预测：（1）进入下列蛋白结构预测服务器网址http://www.embl-heidelberg.de/predictprotein//predictprotein.html（The PredictProtein Server）；（2）在You can栏点击default；（3）填写email地址和序列名称；（4）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit；（5）从email信箱查看分析结果；6、人脂联素蛋白质序列的三维结构预测：（1）进入/swissmod/SWISS-MODEL.html （SwissModel First Approach Mode）网页；（2）填写email地址、姓名和序列名称；（3）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏；（4）点击Send Request；（5）从email信箱查看分析结果（注：需下载软件入rasmol查看三维图象）。

蛋白质数据库

蛋白质数据库1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库，可在这里下载。

这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，其中包括来自几十个完整基因组的蛋白质序列。

所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。

PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶－底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。

每季度都发行一次完整的数据库，每周可以得到更新部分。

PSD数据库有几个辅助数据库，如基于超家族的非冗余库等。

PIR提供三类序列搜索服务：基于文本的交互式检索；标准的序列相似性搜索，包括BLAST、FASTA等；结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索GeneFIND等。

2. SWISS-PROTSWISS-PROT是经过注释的蛋白质序列数据库，由欧洲生物信息学研究所(EBI)维护。

数据库由蛋白质序列条目构成，每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等，注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。

SWISS-PROT中尽可能减少了冗余序列，并与其它30多个数据建立了交叉引用，其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。

利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。

SWISS-PROT只接受直接测序获得的蛋白质序列，序列提交可以在其Web页面上完成。

3. PROSITEPROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式，并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。

分子生物学中常用数据库

分子生物学中常用数据库综合数据库：来源：/news/science/article/90048.html生物信息学网址链接：http://www.bioinformatics.ca/links_directory/Nucleic Acid Research Database Issue：/content/vol32/suppl_2/一、蛋白相关数据库蛋白质结构域预测工具Esignal：/esignal/信号传导系统蛋白的结构域预测工具，凡是涉及到信号传导系统的蛋白用这个预测效果最佳SignalP：http://www.cbs.dtu.dk/services/SignalP/信号肽预测工具，适合定位于非胞质位置的蛋白质Emotif：/emotif-search/结构域预测工具，由于其用motif电子学习的方法产生结构域模型，故预测效果比Prosite好Ematrix：/ematrix/是用Matrix的方法创建的结构域数据库，可与emotif互相印证。

其速度快，可快速搜索整个基因组InterPro：/InterProScan/EBI提供的服务，用图形的形式表示出搜索的结构域结果TRRD：http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/转录因子结构域预测的最好数据库。

但不会用Protscale：/cgi-bin/protscale.pl可分析该序列的各种性状如活动度、亲水性（Kyte&Doolittle）、抗原性（Hopp&Woods）等通过寻找MOTIF和Domain来分析蛋白质的功能A. MOTIF是蛋白中较小的保守序列片断，其概念比Domain小PROSITE：/tools/scanprosite/是专门搜索蛋白质Motif的数据库，其中signature seqs是最重要的motif信息B. Domain：若干motif可形成一个Domain，每个Domain形成一个球形结构，Domain与Domain之间通常像串珠一样相连Pfam：可以搜索某段序列中的Domain，并以图形化表示出来。

蛋白质数据库

蛋⽩质数据库
⼀、蛋⽩质数据库
》序列数据库：Uniprot (蛋⽩质序列和具有综合功能注释⽬录的中⼼资源库)
PIR （提供蛋⽩质序列数据和分析⼯具）
》结构数据库：PDB （实验测定的⽣物⼤分⼦三维结构）
MMDB
》模体及结构域数据库：PROSITE (蛋⽩质序列功能位点数据库)
Pfom (使⽤基于隐马模型的多序列⽐对对蛋⽩质进⾏家族分类) 》蛋⽩质分类数据库：SCOP （提供已知结构蛋⽩质间的结构和进化关系信息）
CAHT
HSSP
DSSP
⼆、蛋⽩质组数据库
》SWEISS PROT 2DE PAGE / neXtProt / PaxDb / PeptideAtlas / PRIDE
涉及不同⽣物、不同器官、组织、细胞的蛋⽩质图谱数据
三、蛋⽩质互作组数据库
》HPRD / DIP / INTERACT
四、综合型数据库
》ExPASy。

蛋白质组学常用的网站和数据库

蛋白质组学常用的网站和数据库蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址：一、蛋白质数据库1.UniProt (The Universal Protein Resource)网址：简介：由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成，提供详细的蛋白质序列、功能信息，如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等，同时提供其他数据库，包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

2.PIR(Protein Information Resource)网址：简介：致力于提供及时的、高质量、最广泛的注释，其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort，与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。

3.BRENDA(enzyme database)网址：简介：酶数据库，提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。

4.CORUM(collection of experimentally verified mammalian protein complexes)网址：简介：哺乳动物蛋白复合物数据库，提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database)网址：简介：环状蛋白数据库，提供环状蛋白的序列、结构等数据，提供环化蛋白预测服务。

6.DB-PABP网址：简介：聚阴离子结合蛋白数据库。

聚阴离子结合蛋白与聚阴离子的互作在胞内定位、运输、蛋白质折叠等生命过程中起重要作用，此外许多与神经衰退疾病相关的蛋白质均为聚阴离子结合蛋白。

该数据库提供已被鉴定的聚阴离子结合蛋白的数据，与NCBI蛋白数据库存在交叉应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

搞蛋白质的童鞋们，甭要只查NCBI了~蛋白质相关数据库启蒙~
★
小木虫(金币+1):奖励一下，谢谢提供资源
qinhy:恭喜，您的帖子被版主审核为资源贴了，别人回复您的帖子对资源进行评价后，您就可以获得金币了理由:资源贴2011-11-26 16:56
本来是带图的，可是弄过来就变成米图了，附件里面一个是PDF版、一个是WORD版均是带图的，童鞋们看带图的可能比较方便点哦~
基于蛋白质序列的蛋白质相互作用位点预测（闲谈版）
这个不是论文不是论文啊~~这个是应某某的要求帮他找的，所以都是用现成的免费的网站数据库做的预测分析。

无论文为依托，无原理为根据，纯粹就是流连各大网站作个的闲谈。

1、用这些网站先查查你要研究的蛋白质的底细。

这些网站的数据库大多数是实验或者一些相关文献报道的数据的组成。

★String http://string.embl.de/
输入你要搜寻的蛋白，它就把这个蛋白相关的数据反映给你，分confidence、evidence的数据可信度参考，同时还具有actions选项，反应它们之间可能是激活/抑制的关系。

按按+、-号可以扩大缩小关联蛋白的数量范围。

往下拉一点点就是数据,哈哈，我们都要看数据吃饭啊~~
分析的数据源自Neighborhood、Fusion、Occurrence、Coexpression、Experiments Database、Textminin及Homology，表示点得证明有数据，根据各项数据给出综合评分。

评分越高相互存在关系可能性越高。

点击下方各项图标等详细看到各项数据内容。

设条件确定筛选范围。

★DIP /dip/Main.cgi
跟上面的大同小异的功能，装上它附带的软件可能操作性会好一点，不过我米有试过哦。

倒是跟它有链接的几个数据库都很强大，大家可以点击看看。

★BIND http://www.bind.ca
文献有介绍的网站，不过我不能理解为什么我注册就注不了…….
2、继续查，用这些网站将要研究的蛋白质的家庭背景，月收入也大起底。

这里的网站可能跟相互作用方面的关系不大，但是如果知道这些，可以对研究的蛋白有更深的了解。

★PDB /pdb/home/home.do
要查3D结构就往这里查~通常说的PDB号为文献号末4位。

★PIR /pirwww/index.shtml
在蛋白质方面如NCBI般强大的网站，去上面晃荡下吧，会有收获滴。

★KEGG http://www.genome.jp/kegg/
粉强大的一个网站，我只说说它的KEGG PA THW AY子项，能迅速掌握一个蛋白质的功能通路，对于小白的偶们来说，很有用，有木有。

3、正题正题，做完上面那些后，接着就是纯预测的成分。

也因为如此，要找着这些网站是很悲催的一件事。

就算你找着了，你不懂语言，不懂算法，到底结果的可靠性怎样，见人见智。

需要PDB号作分析：
promate http://bioinfo.weizmann.ac.il/promate/
ppisp /ppisp.html
InterProSurf /prosurf.html
eF-site http://ef-site.hgc.jp/eF-site/index.jsp
蛋白质序列直接作分析：
sppider /
选择第3个基于序列的分析，它会将分析结果E-mail给你。

赠送两个网站……
http://smart.embl-heidelberg.de/
/
参考文献
艾观华等，基于蛋白质序列预测蛋白质-蛋白质相互作用位点研究进展，药物生物技术2011, 18( 2) : 165~ 169
任仙文等，蛋白质相互作用的生物信息学研究进展，生物技术通讯2006，17.6.11
朱新宇等，预测蛋白质间相互作用的生物信息学方法，生物技术通讯2004.15.1.1
/wiki/Pro ... ractions/Jena_Links。