结构数据库

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Wang Y et al. Nucl. Acids Res. 2000;28:243-245
MMDB(molecular modeling database)
• MMDB 的 记 录 以 ASN.1 格 式 存 储 , 可 以 用 Cn3D, Rasmol, 或 Kinemage来显示。另外, 数据库中类似的结构已经被用 VAST 确认, 新的结构可以用VASTsearch来同数据库进行 比较。
文献数据库概要
• PubMed — 一个关于生物医药科学的检索系统, 包括引用,摘要,和杂志的索引术语。它包括直 接由出版商提供给 NCBI 的文献引用以及链接到在 出版商网址上的全文的URLs。 • PubMed包括MEDLINE和PREMEDLINE的完整内容。 它还包括一些被 MEDLINE 认为超出范围的文章和 杂志,(这些文章或杂志)由于内容或在某一时 期不在索引范围内。因此 PubMed 是比MEDLINE 的 更大的集合。 •
Processed By RCSB PDBj PDBe PDB 2297 158 528 2408 383 496 2401 657 507 3135 1026 669 3082 1614 812 3563 2110 1005 4252 1945 1085 4703 2299 1128 4106 1994 973 5069 2173 1058 5464 2041 1373 5942 1813 1496 1127 240 268 47549 18453 11398
VAST
• 矢量同源比较搜索工具 • 一个在 NCBI 开发的计算算法,用于确定相似的蛋 白三维结构。每一个结构的“结构邻居”都是预 先计算好的,而且可以通过 MMDB 的结构概要页 面的链接访问。这些邻居可以用来确认那些不能 被序列比较识别的远的同源性。 • VAST 搜索 — 结构—结构相似搜索服务。比较一 个新解出的蛋白结构和在 MMDB/PDB 数据库中的 结构的三维坐标。 VAST 搜索计算一系列可能会被 交互浏览的结构邻居,用分子图形来观察重叠和 同源相似。 •
以人类泪液载脂蛋白为例,具体介绍下其 在PDB数据库中结构检索和可视化过程
第一步: 输 入 关 键 字 “ HUMAN TEAR LIPOCALIN”
第二步: 选择人类泪液载脂 蛋白1XKI
第三步: 点击 Biology Assembly 面 板展示其结构图
第四步: 1XKI结构展示图
二、蛋白质结构分类数据库SCOP
Cn3D
• 与MMDB 配套的一个三维分子结构和 NMR 模型显 示程序“See in 3-D” 。 • Cn3D:一个用于 NCBI 数据库的结构和序列相似显 示工具,它允许观察 3-D 结构和序列 — 结构或结 构—结构同源比较。 • Cn3D用起来就象你浏览器上的一个帮助工具。可 在NCBI的网址直接使用或下载到PC机上执行。 • RasMol •
SCOP(structural classification of protein)数据库是 一个包含已有结构的蛋白质分类数据库,依据不同蛋白质的 氨基酸组成的相似性及三级结构,详细描述已知结构蛋白质 之间的功能及进化关系,SCOP数据库的构建除了使用计算机 程序外,主要依赖于人工验证。
http://scop.berkeley.edu/
小蛋白
总和
90
1195
129
1962
219
3902
三、蛋白质分类数据库CATH
数据库的名称CATH分别是数据库中四种分类类 别的第一个字母,即: C:(class); A:(architecture); T:(topology); H:(homologous superfamily)。 CATH蛋白质分类数据库与另外一个蛋白质分类数据 库SCOP相比,后者更注重从蛋白质进化的角度来对 蛋白质进行分类,而CATH数据库偏重于从结构角度 对蛋白质分类。
PDB数据库收录条目一览表
分子类型 蛋白/核 核酸 酸复合物 1168 869 16 5 2058 2216 150 65 5 2436
实验方法
X-射线衍 射 NMR 电镜 其他 总数
蛋白质
48 225 6993 171 130 55 519
其他
17 6 0 10 33
总数 51 626 8018 252 150 60 046
获得该查询1ucr的PDB code、 图像和功能信息。
点击上述查询结构页面domain ID为1ucrA00的超链接, CATH数据库将列出该结构域相关的序列家族、结构、序列 和数据更新历史记录等结果;并可进一步获得三维结构。
MMDB:分子模型数据库
• 一个关于三维生物分子结构的数据库,结构来 自于X-ray晶体衍射和核磁共振实验研究结果。 • MMDB 是来源于 Brookhaven 蛋白数据库( PDB ) 三维结构的一部分,排除了那些理论模型。 MMDB重新组织和验证了这些信息,从而保证 在化学和大分子三维结构之间的交叉参考。数 据的说明书包括生物多聚体的空间结构,这个 分子在化学上是如何组织的,以及联系两者的 一套指针。利用将化学、序列、和结构信息整 合在一起,MMDB计划成为基于结构的同源模 型化和蛋白结构预测的资源服务。 • http://www.ncbi.nlm.gov/structure/ • ftp://ncbi.nlm.nih.gov/mmdb
http://srs.ebi.ac.uk
斑头雁血红蛋白—标准检索
• 操作方法 – 选择UniProt/Swiss-Prot蛋白质序列数据库 – 点击Search Options栏中Standard Query Form按钮 – 将Fields you can search第一个下拉菜单中All Text改为 Species,在Your Search Term中输入bar-headed goose – 将Fields you can search第二个下拉菜单中All Text改为 Description,在Your Search Term中输入Hemoglobin – 点击Search按钮 • 返回结果 • 返回斑头雁血红蛋白序列HBAD_ANSIN、HBA_ANSIN和HBB_ANSIN 三个亚基。
分类学
• NCBI的分类数据库主页 — 关于分类计划的一般 信息,包括分类资源和同NCBI分类学家合作的 外部管理者的列表。 • 分类浏览器 — 搜索NCBI的分类数据库,包括 大于 70000 个物种的名字和种系,这些物种都 至少在遗传数据库中有一条核酸或蛋白序列。 可以检索一个特定种或者更高分类(如属,科) 的核酸,蛋白,和结构记录。如果有新物种的 序列数据被放到数据库中,这个物种就被加到 (分类)数据库中。NCBI的分类数据库的目的 是为序列数据库建立一个一致的种系发生分类 学。 • 分类学
杂志浏览器
• 允许你去查找收录到 PubMed 系统的杂志的名字, MEDLINE的缩写,或ISSN号码。 • PubRef(开发中)— 一个关于来自于广大范围的 科学杂志的数目记录,和链接到出版商网址的全 文。 • PubRef包含了PubMEd,加上了来自其它学科的杂 志出版商提供的引用和摘要。因此它是比PubMed 更大的集合。这个计划的启动是因为 NAS 要求为 科学领域的电子杂志提供一个“白皮书”服务。 •
SCOP数据库中1.75 版本中详细信息
蛋白质种类 (Class) 全螺旋蛋白 全折叠蛋白 螺旋和折叠 螺旋+折叠 复合结构域蛋白 膜蛋白 折叠子的数目 超家族的数目 家族的数目 (Folds) (Superfamilies) (Families) 284 174 147 376 66 58 507 354 244 552 66 110 871 742 803 1055 89 123
CATH把蛋白质分为4类,即全 α、全β、α-β(α/β型和 α+β型)和低二级结构类。
以蛋白质1ucr为例的搜索结果
1ucr包括两个结构域,分别为 ‘1ucrA00’和‘1ucrB00’。这两个结 构域属于同一同源家族 1.10.10.10。 结果显示1ucr为二聚物,它的每 条链都有自己特异的链标识(如 1ucrA和1ucrB)。
Biblioteka Baidu
Deposited To Total RCSB Depositions PDBj PDBe PDB 2983 2445 10 528 3287 2673 118 496 3565 2769 289 507 4830 3488 673 669 5508 3796 900 812 6678 4507 1166 1005 7282 5145 1052 1085 8130 5399 1603 1128 7073 5452 648 973 8300 6715 527 1058 8878 6912 593 1373 9251 7173 582 1496 1635 1285 82 268 77400 57759 8243 11398
第二节蛋白质结构数据库
Protein Structure Databases
一、蛋白质三维结构数据库PBD
http://www.rcsb.org/pdb
http://www.ebi.ac.uk/pdbe/
http://www.pdbj.org/
Year 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 TOTAL
SRS数据库查询的基本方法
SRS系统
SRS 是 Sequence Retrieval System 的缩写,由欧洲 分子生物学实验室开发,最初是为核酸序列数据库 EMBL和蛋白质序列数据库SwissProt的查询开发的。
SRS是一个开放的数据库查询系统,即不同的SRS查 询系统可以根据需要安装不同的数据库,目前共有300 多个数据库安装在世界各地的SRS服务器上。 可以直接从LION公司的网页上查到这些数据库的名 称,并知道它们分别安装在何处 (http://www.lionbio.co.uk/publicsrs.html)。
相关文档
最新文档