6 蛋白组相关数据库及使用

合集下载

生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述内蒙古工业大学理学院呼和浩特孙利霞2010.1.5摘要：在后基因组时代生物信息学的研究当中，离不开各种生物信息学数据库。

尤其在蛋白质从序列到功能的研究当中，目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。

随着计算机技术及网络技术的发展，目前的蛋白质数据库不论是所包含数据量还是功能都日新月异，新的数据库层出不穷。

一个新手面对如此浩瀚的数据量往往无从下手。

本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓，作为自己蛋白质研究入门的一个引导。

关键词：蛋白质；数据库0 引言随着科技的发展，个人的知识往往赶不上快速膨胀的信息量，人们为了解决这个问题，便创建了形形色色的数据库。

蛋白质数据库是指：在蛋白质研究领域根据实际需要，对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释，构建出具有特殊生物学意义和专门用途的数据库。

蛋白质数据库总体上可分为两大类：蛋白质序列数据库和蛋白质结构数据库，蛋白质序列数据库来自序列测定，结构数据库来自X-衍射和核磁共振结构测定（详见图1）。

这些数据库是分子生物信息学的基本数据资源。

上世纪90年代，我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。

信息的传播储存甚为不便。

随着蛋白质研究的发展飞快，同时伴随着计算机和因特网发展，蛋白质数据库的储存传播方式也发生的巨大的变化。

进入21世纪后，我们所用的各种蛋白质数据库都发展成为存储在网络服务器上，基于“服务器—客户机”的访问查询方式。

伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。

但是面对如此浩瀚的数据，新手往往感到无从下手，在需要时找不到自己需要的合适数据库。

本文从目前蛋白质数据库建立的的逻辑层次出发，系统地简绍了常用蛋白质数据的概况，它们的查询方法以及它们相互之间的联系。

同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术，为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

rcsb pdb数据库使用方法与步骤

rcsb pdb数据库使用方法与步骤如何使用RCSB PDB数据库# 第一步：访问RCSB PDB网站首先，打开您的网络浏览器，并在地址栏中输入“PDB（Protein Data Bank）的官方网站。

# 第二步：浏览数据库一旦进入RCSB PDB官方网站，您将看到一个简洁且易于使用的界面。

该界面列出了各种与蛋白质结构相关的信息，其中包括蛋白质的序列、结构、功能以及相应的文献引用。

# 第三步：搜索蛋白质结构在RCSB PDB的主页上，您可以在顶部的搜索框中输入蛋白质的名称、PDB ID（四个字母的标识符）或其他相关信息。

按下回车键后，系统将为您提供满足您搜索条件的结果列表。

# 第四步：筛选搜索结果当您获得一系列搜索结果时，您可以使用不同的筛选器来缩小结果范围。

例如，您可以根据蛋白质的来源（如人类、大肠杆菌等）或发布日期进行筛选。

# 第五步：了解蛋白质结构选择一个感兴趣的蛋白质结构后，您将进入该蛋白质结构的详细页面。

这个页面将提供关于蛋白质的详细信息，包括它的PDB ID、生物学功能、相关文献以及其结构的三维可视化图像。

# 第六步：浏览蛋白质结构的细节在蛋白质的详细页面中，您可以浏览蛋白质结构的更多细节。

您可以选择查看蛋白质的原子坐标、氨基酸序列、二级结构信息以及其他与结构相关的数据。

# 第七步：下载蛋白质结构如果您对蛋白质结构感兴趣并希望将其保存到您的本地计算机上进行后续研究，您可以在详细页面上找到一个“Download Files”或类似的选项。

点击该选项后，您将有机会选择以PDB格式、FASTA格式或其他常见格式下载蛋白质结构数据。

# 第八步：使用高级搜索功能RCSB PDB还提供了强大的高级搜索功能，以帮助您更精确地查找特定的蛋白质结构。

您可以使用高级搜索功能来制定更复杂的搜索查询，例如根据蛋白质的拓扑结构、配体或与其相互作用的其他分子进行搜索。

# 第九步：利用工具和资源在RCSB PDB网站上，您还可以利用各种工具和资源来进一步研究蛋白质结构。

Uniprot数据库介绍及信息检索下载指南

UniProt数据库一、UniProt数据库简介蛋白质组常用数据库——UniProt数据库，是信息最丰富、资源最广的蛋白质数据库。

它由Swiss-Prot、TrEMBL 和PIR-PSD三大数据库的数据整合而成，数据主要来自于基因组测序项目完成后，后续获得的蛋白质序列，并包含了大量来自文献的蛋白质生物功能的信息。

一般蛋白质组搜库首选数据库也是UniProt，所以对于通过UniProt库搜库的组学数据，可以在此网站中进行蛋白功能查询。

UniProt数据库可以提供的信息包括蛋白功能描述、GO条目、细胞定位、组织特异性表达情况、生理病理情况描述、互作蛋白、Domain、翻译后修饰位点等信息。

蛋白的信息描述段落均会标出引用文章，并且可以跳转到PubMed界面进行浏览。

UniProt 数据库由UniProt 知识库（UniProtKB ）、UniProt 档案（UniParc ）、UniProt 参考资料库（UniRef）以及UniProt元基因组学与环境微生物序列数据库（UniMES）构成。

UniProtKB全称 UniProt Knowledgebase（UniProt知识库）它是经过专家校验的数据集，主要由两部分组成：UniProtKB/Swiss-Prot (包含检查过的、手工注释的条目) 和 UniProtKB/TrEMBL (包含未校验的、自动注释的条目)。

Swiss-Prot 数据库特点高质量的、手工注释的、非冗余的数据集；主要来自文献中的研究成果和E-value校验过计算分析结果。

有质量保证的数据才被加入该数据库！TrEMBL数据集包含高质量的计算分析结果，一般都在自动注释中富集，主要应对基因组项目获得的大量数据流以人工校验在时间上和人力上的不足。

它能注释所有可用的蛋白序列。

在三大核酸数据库（EMBL-Bank/GenBank/DDBJ）中注释的编码序列都被自动翻译并加入该数据库中。

它也有来自PDB数据库的序列，以及Ensembl、Refeq和CCDS基因预测的序列。

蛋白质数据库使用说明

引言：蛋白质数据是生物信息学领域中非常重要的资源之一，它提供了大量关于蛋白质序列、结构、功能以及相互作用等方面的信息。

本文旨在介绍如何使用蛋白质数据库，帮助用户更好地利用这一资源进行研究。

概述：蛋白质数据库是一个集成了许多蛋白质信息的在线资源，用户可以通过搜索、浏览、等方式获取所需的信息。

其中，常用的蛋白质数据库包括NCBI、UniProt、PDB等。

这些数据库提供了丰富的蛋白质数据，并且不断更新以满足用户需求。

正文内容：1.数据库搜索功能1.1.关键词搜索1.1.1.输入蛋白质名称1.1.2.输入序列片段1.1.3.输入关键词1.2.高级搜索选项1.2.1.提供更精确的搜索结果1.2.2.支持过滤和排序功能1.2.3.可以根据相关字段进行搜索2.数据库浏览功能2.1.蛋白质分类2.1.1.按物种分类2.1.2.按功能分类2.1.3.按家族分类2.2.数据表格浏览2.2.1.查看蛋白质基本信息2.2.2.查看蛋白质序列2.2.3.查看蛋白质结构2.3.数据图谱浏览2.3.1.查看蛋白质相互作用网络2.3.2.查看蛋白质结构域分布2.3.3.查看蛋白质功能注释3.数据库功能3.1.蛋白质序列数据3.1.1.全部序列3.1.2.特定物种的序列3.2.蛋白质结构数据3.2.1.已解析的蛋白质结构3.2.2.蛋白质结构预测结果3.3.蛋白质相互作用数据3.3.1.已验证的相互作用数据3.3.2.预测的相互作用数据4.数据库工具与资源4.1.序列比对工具4.1.1.BLAST4.1.2.PSIBLAST4.2.结构预测工具4.2.1.SWISSMODEL4.2.2.Phyre24.3.功能注释资源4.3.1.GeneOntology4.3.2.InterPro4.4.数据库交互接口4.4.1.提供API接口4.4.2.支持数据提交与5.数据库更新与维护5.1.数据更新频率5.2.数据质量保证5.3.用户反馈与支持5.4.数据库版本与历史记录总结：蛋白质数据库为研究人员提供了丰富的蛋白质信息资源，通过搜索、浏览、等功能，用户可以轻松地获取需要的数据。

基因及蛋白质数据库的构建与应用

基因及蛋白质数据库的构建与应用随着生命科学技术的不断发展和进步，基因及蛋白质数据库在科学研究和医学领域的作用愈发重要。

本文将从数据库的构建、分类和应用三个方面进行讲解。

一、基因及蛋白质数据库的构建构建基因及蛋白质数据库的过程主要包括以下几个步骤：1. 采集、整理数据。

对于已经发表的基因及蛋白质相关的论文、文献资料和相关数据库信息等进行采集和整理，从而建立一个完整的信息资源库。

2. 数据库建立和优化。

根据采集的数据和相关技术要求，选择合适的数据库软件，进行数据库建立和优化，使它能够方便有效地存储和检索数据。

3. 数据录入、整合。

将采集的数据进行规范化处理，并将其录入到数据库中，实现数据的整合和统一管理。

4. 数据质量检查和维护。

对于数据进行质量检查、修正和维护，确保数据的可靠性和准确性。

二、基因及蛋白质数据库的分类按照功能和数据类型的分类，基因及蛋白质数据库一般分为以下几种：1. 基因结构和序列数据库。

包括生物物种基因组的测序结果、基因和基因间的区域序列、基因的功能等。

2. 蛋白质序列和结构数据库。

包括蛋白质序列、二级结构、比较模型、同源模型等信息。

3. 基因表达数据库。

主要包括基因表达调控、启动子、编码和序列间调控因素等信息。

4. 基因特定数据库。

如免疫学数据库、药物基因相互作用数据库等，为特定研究领域的数据提供了支持。

三、基因及蛋白质数据库的应用基因及蛋白质数据库在许多领域中都有着重要的应用价值。

1. 科研领域。

利用基因及蛋白质数据库，研究人员可以快速获取和跟踪特定基因或蛋白质的信息，挖掘并分析相关信息，进一步研究其功能和调节机制，从而探索新的基因和蛋白质功能以及治疗某些疾病的方法。

2. 医学领域。

基因及蛋白质数据库是研究疾病发生发展机制的重要工具。

医学研究人员可以通过基因及蛋白质数据库对特定基因或蛋白质进行深入研究，了解其功能及其与疾病的关系，从而探索新的诊断、预防和治疗方法。

3. 生物制药领域。

蛋白质数据库

蛋⽩质数据库
⼀、蛋⽩质数据库
》序列数据库：Uniprot (蛋⽩质序列和具有综合功能注释⽬录的中⼼资源库)
PIR （提供蛋⽩质序列数据和分析⼯具）
》结构数据库：PDB （实验测定的⽣物⼤分⼦三维结构）
MMDB
》模体及结构域数据库：PROSITE (蛋⽩质序列功能位点数据库)
Pfom (使⽤基于隐马模型的多序列⽐对对蛋⽩质进⾏家族分类) 》蛋⽩质分类数据库：SCOP （提供已知结构蛋⽩质间的结构和进化关系信息）
CAHT
HSSP
DSSP
⼆、蛋⽩质组数据库
》SWEISS PROT 2DE PAGE / neXtProt / PaxDb / PeptideAtlas / PRIDE
涉及不同⽣物、不同器官、组织、细胞的蛋⽩质图谱数据
三、蛋⽩质互作组数据库
》HPRD / DIP / INTERACT
四、综合型数据库
》ExPASy。

蛋白质组科学数据库建设及应用

蛋白质组科学数据库建设及应用在科技的海洋中，蛋白质组科学数据库如同一艘巨轮，承载着人类对生命奥秘的探索。

它的建设与应用，不仅是科学研究的重要工具，更是推动生物医学发展的强大引擎。

首先，我们要明确蛋白质组科学数据库的重要性。

它就像是一座巨大的图书馆，里面收藏着关于蛋白质的各种信息。

这些信息包括蛋白质的结构、功能、相互作用等等，对于科学家来说，它们是研究生命现象的关键线索。

没有这些信息，科学家们就像是在黑暗中摸索，难以取得突破性的进展。

因此，建设一个全面、准确、易用的蛋白质组科学数据库，对于推动科学研究具有重要意义。

然而，建设这样一个数据库并非易事。

它需要大量的数据收集、整理和分析工作。

这就像是在一片茫茫大海中寻找宝藏，需要耐心和毅力。

同时，随着科学技术的发展，新的研究成果不断涌现，数据库也需要不断更新和维护。

这就像是一场永无止境的战斗，需要我们持续投入精力和资源。

那么，如何建设一个优秀的蛋白质组科学数据库呢？我认为可以从以下几个方面着手：首先，加强数据的收集和整理。

我们需要建立一个完善的数据收集体系，确保数据的全面性和准确性。

同时，我们还需要进行数据清洗和整理，去除重复和错误的信息，提高数据的质量。

其次，优化数据库的设计和结构。

一个好的数据库应该具有良好的用户体验，方便用户查询和使用。

我们可以借鉴其他优秀数据库的经验，结合蛋白质组科学的特点，设计出更加人性化的界面和功能。

再次，加强数据库的维护和更新。

随着研究的深入和技术的发展，新的数据会不断产生。

我们需要及时将这些新数据纳入数据库，保持数据的时效性。

同时，我们还需要注意数据库的安全性和稳定性，防止数据丢失或泄露。

最后，加强与其他数据库的合作与交流。

蛋白质组科学并不是孤立的研究领域，它与其他学科有着密切的联系。

通过与其他数据库的合作与交流，我们可以共享资源、互补优势，共同推动科学的进步。

当然，建设一个优秀的蛋白质组科学数据库只是第一步。

如何将其应用于实际研究中，发挥其最大的价值，才是我们更应该关注的问题。

蛋白质数据库使用说明

蛋白质数据库使用说明蛋白质数据库使用说明概述本文档提供了蛋白质数据库使用说明，包括数据库访问方式、数据搜索和分析方法等。

通过阅读本文档，用户将了解如何有效地利用蛋白质数据库进行蛋白质相关研究。

1. 数据库访问方式1.1 网站访问蛋白质数据库可以通过网站进行访问。

用户需要在浏览器中输入数据库的网址，并使用提供的用户名和密码进行登录。

一旦登录成功，用户将可以浏览数据库中的蛋白质信息。

1.2 API接口蛋白质数据库通常也提供了API接口，用户可以通过编程方式获取和操作数据库中的数据。

通过API接口，用户可以实现自动化的数据获取和分析。

2. 数据搜索2.1 关键词搜索用户可以通过关键词搜索来查找与特定蛋白质相关的信息。

在数据库的搜索框中输入关键词，数据库将返回与关键词相关的蛋白质条目。

2.2 高级搜索蛋白质数据库通常也提供了高级搜索功能，用户可以使用更复杂的搜索方式来满足特定需求。

高级搜索功能包括使用逻辑运算符、指定搜索范围等。

3. 数据分析3.1 蛋白质比对用户可以使用蛋白质数据库中的比对工具来进行蛋白质比对分析。

比对工具可以帮助用户找到在不同蛋白质序列之间的相似性和差异性。

3.2 功能注释蛋白质数据库还提供了功能注释工具，可以帮助用户预测蛋白质的功能。

用户可以根据数据库中的注释信息来了解蛋白质的功能和作用。

4. 数据蛋白质数据库通常也提供数据功能，用户可以将数据库中的数据到本地进行进一步的分析和处理。

功能可以提供多种格式的数据文件，如文本文件、Excel文件等。

附件本文档没有涉及附件。

法律名词及注释本文档没有涉及法律名词及注释。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Protein – 某一蛋白信息
Protein – 某一蛋白信息
Protein – 某一蛋白信息
Protein – 某一蛋白信息
Protein – 某一蛋白信息 – FASTA格式
CDD – Conserved Domain Database
transferrin
CDD – transferrin
PIR提供三种类型的检索服务: 一是基于文本的交互式查询，用户通过关键字进行数据查询。二是标准的序列相似性搜索，包括BLAST、FastA等。
三是结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索等。
2、SWISS-PROT
SWISS-PROT (http://www.expasy.ch/sprot/sprot-top.html) 是目前国际上比较权威的蛋白质序列数据库,其中的蛋白质序列是经过注释的
• 一种是隐式序列信息(implicit sequence)
PDB的隐式序列即为立体化学数据，包括每个原子的名称和原子的三维坐标。
GenBank - Structure
transferrin
GenBank – Structure - Transferrin
PDB文件示意
HEADER HYDROLASE 19-FEB-97 1ADZ TITLE THE SOLUTION STRUCTURE OF THE SECOND KUNITZ DOMAIN OF TITLE 2 TISSUE FACTOR PATHWAY INHIBITOR, NMR, 30 STRUCTURES COMPND MOL_ID: 1; COMPND 2 MOLECULE: TISSUE FACTOR PATHWAY INHIBITOR; 。。。。。。 COMPND 8 BIOLOGICAL_UNIT: MONOMER SOURCE MOL_ID: 1; 。。。。。。 SOURCE 7 EXPRESSION_SYSTEM_PLASMID: PFLAG KEYWDS HYDROLASE, INHIBITOR, COAGULATION EXPDTA NMR, 30 STRUCTURES AUTHOR M.J.M.BURGERING,L.P.M.ORBONS REVDAT 1 25-FEB-98 1ADZ 0 JRNL AUTH M.J.BURGERING,L.P.ORBONS,A.VAN DER DOELEN, 。。。。。。 REMARK 1 REFERENCE 1 REMARK 1 AUTH M.T.STUBBS II REMARK 1 TITL STRUCTURAL ASPECTS OF FACTOR XA INHIBITION 。。。。。。 REMARK 999 SEQUENCE REMARK 999 1ADZ SWS P10646 1 111 NOT IN ATOMS LIST REMARK 999 1ADZ SWS P10646 183 304 NOT IN ATOMS LIST REMARK 999 THE FIRST NINE RESIDUES ARE NOT PART OF THE TFPI DOMAIN II REMARK 999 SEQUENCE BUT ARE FROM THE PFLAG PEPTIDE CLONING VECTOR. DBREF 1ADZ 1 71 SWS P10646 TFPI_HUMAN 112 182 SEQADV 1ADZ ASP 1 SWS P10646 ILE 112 ENGINEERED SEQADV 1ADZ TYR 2 SWS P10646 ILE 113 ENGINEERED SEQRES 1 71 ASP TYR LYS ASP ASP ASP ASP LYS LEU LYS PRO ASP PHE SEQRES 2 71 CYS PHE LEU GLU GLU ASP PRO GLY ILE CYS ARG GLY TYR SEQRES 3 71 ILE THR ARG TYR PHE TYR ASN ASN GLN THR LYS GLN CYS SEQRES 4 71 GLU ARG PHE LYS TYR GLY GLY CYS LEU GLY ASN MET ASN SEQRES 5 71 ASN PHE GLU THR LEU GLU GLU CYS LYS ASN ILE CYS GLU SEQRES 6 71 ASP GLY PRO ASN GLY PHE HELIX 1 1 ASP 12 PHE 15 5 HELIX 2 2 ASN 34 THR 36 5 HELIX 3 3 LEU 57 ILE 63 1 SHEET 1 A 2 ARG 29 ASN 33 0 SHEET 2 A 2 GLN 38 PHE 42 -1 N PHE 42 O ARG 29 CRYST1 1.000 1.000 1.000 90.00 90.00 90.00 P 1 1
蛋白质组相关数据库
第一节蛋白质序列数据库
1、PIR（Protein Information Resource）
/pirwww/
• 目的：帮助研究者鉴别和解释蛋白质序列信息，研究分子进化、功能基因组。 • 它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。 • 所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。
How to search?
NCBI Homepage
选择某个子数据库 ↓ 空搜索 ↓ 直接进入该子库的主页
Genbank - Protein Homepage
AGGF1
某个蛋白
某个疾病
某个生物学过程
其他特别主题
Protein – AGGF1
Protein – development
development
除了蛋白质序列数据之外，PIR还包含以下信息：
(1)蛋白质名称、蛋白质的分类、蛋白质的来源； (2)关于原始数据的参考文献； (3)蛋白质功能和蛋白质的一般特征，包括基因表达、翻译后处理、活化等； (4)序列中相关的位点、功能区域。
蛋白质知识整合数据库蛋白质家族分类系统蛋白质序列数据库非冗余的参考性蛋白数据库通用蛋白质数据库
SWISS-PROT中的数据来源于不同源地：（1）从核酸数据库经过翻译推导而来；（2）从蛋白质数据库PIR挑选出合适的数据；（3）从科学文献中摘录；（4）研究人员直接提交的蛋白质序列数据
SWISS-PROT有三个明显的特点：
（1）注释
在SWISS-PROT中，数据分为核心数据和注释两大类。核心数据包括：序列数据、参考文献、分类信息（蛋白质生物来源的描述）注释包括：（A)蛋白质的功能描述； (B)翻译后修饰； (C)域和功能位点，如钙结合区域、ATP结合位点等； (D)蛋白质的二级结构； (E)蛋白质的四级结构，如同构二聚体、异构三聚体等； (F)与其它蛋白质的相似性； (G)由于缺乏该蛋白质而引起的疾病； (H)序列的矛盾、变化等。
• 提交序列数据
（a）编辑电子表格（b) 利用Authorin程序（c）WWW服务器
• 使用SWISS-PROT
（a）CD-ROM形式（b）ftp服务器（c）Gopher服务器（d）WWW服务器（SRS）
• 与序列相关的操作
（a）序列查询（b）搜索同源蛋白质序列
3. TrEMBL
TrEMBL (/trembl/index.html) 是与 SWISS-PROT相关的一个数据库。包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列，并且这些序列尚未集成到SWISSPROT数据库中。 TrEMBL有两个部分：（1）SP-TrEMBL(SWISS-PROT TrEMBL) 包含最终将要集成到SWISS-PROT的数据，所有的SPTrEMBL 序列都已被赋予SWISS-PROT的登录号。（2）REM-TrEMBL(REMaining TrEMBL) 包括所有不准备放入SWISS-PROT的数据，因此这部分数据都没有登录号。
（2）最小冗余
• 尽量将相关的数据归并，降低数据库的冗余程度。 • 如果不同来源的原始数据有矛盾，则在相应序列特征表中加以注释。
（3）与其它数据库的连接
对于每一个登录项，有许多指向其它数据库相关数据的指针，这便于用户迅速得到相关的信息。现有的交叉索引有：到EMBL核酸序列数据库的索引，到PROSITE模式数据库的索引，到生物大分子结构数据库PDB的索引等。
2、蛋白质结构分类数据库SCOP
• SCOP数据库 ( /scop/）的目标是提供关于已知结构的蛋白质之间结构和进化关系的详细描述，包括蛋白质结构数据库PDB中的所有条目。 SCOP数据库除了提供蛋白质结构和进化关系信息外，对于每一个蛋白质还包括下述信息：到PDB的连接，序列，参考文献，结构的图像等。可以按结构和进化关系对蛋白质分类，分类结果是一个具有层次结构的树，其主要的层次是家族、超家族和折叠:
• SRS有三种检索方式：快速检索、标准检索和批量检索。
SRS开始页面
SRS快速文本检索窗口
SRS检索结果页面显示的检索结果
SRS蛋白质记录详细内容页面
SRS蛋白质序列显示窗口
SRS标准检索页面
SRS标准检索页面检索基因名为“KRAS”蛋白序列输入示意图
SRS标准检索结果输出页面
蛋白质数据仓库UniProt 包括：
Swiss-Prot TrEMBL PIR
用户可以通过文本查询数据库，可以利用 Bபைடு நூலகம்AST程序搜索数据库，也可以直接通过FTP 下载数据。
UniProt包含3个部分：（1）UniProt Knowledgebase（UniProt）蛋白质序列、功能、分类、交叉引用等信息存取中心（2）UniProt Non-redundant Reference（UniRef）数据库将密切相关的蛋白质序列组合到一条记录中以便提高搜索速度；（3）UniProt Archive（UniParc）资源库，记录所有蛋白质序列的历史。