生物信息数据库1117

合集下载

生物信息学 第三章 生物信息数据库及其信息检索 ppt课件

生物信息学 第三章 生物信息数据库及其信息检索 ppt课件
因组数据。
核酸序列数据库 GenBank( ) EMBL( ) DDBJ ( ) 三个数据库每天互相交换数据 GenBank可通过NCBI的检索系统Entrez获取, Entrez集成来自主要DNA和蛋白
序列数据库的数据,包括物种、基因组、定位、蛋白结构和结构域等信息 其他各种专业核酸数据库 A.非冗余参考序列数据库RefSeq B.密码子使用数据库Codon Usage Database CUTG C.基因可变剪接数据库ASDB D.转录因子数据库TRANSFAC
生物信息学数 据库类型
序列数据库 结构数据库 功能数据库 其ws、Linux或 Mac等操作系统
肤浅的百姓工具
一、序列数据库
主要收录核酸和蛋白质序列的数据库,包括由基因组计划产生的基因组及其表达 序列,由基因组序列所推测的编码和非编码核酸和蛋白质序列,以及个别生物 学实验中测序获得的核酸和蛋白质序列。
生物信息学 第三章 生物信息数据库 及其信息检索
第三章 生物信息数据库及其信息检索
本章主要内容
▪ 生物信息学数据库类型 ▪ 序列数据库 ▪ 结构数据库 ▪ 功能数据库 ▪ 其它专业数据库
▪ 生物信息学数据库的检索 ▪ 检索方法概述 ▪ 检索实践和案例
生物信息学数据库的地位和作用
经典生物医学实验
elegans
Borrelia burgorferi
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
Neisseria meningitidis Z2491
Mycobacteriu m tuberculosis
Genome sizes in nucleotide pairs (base-pairs)

生物信息学数据库访问与操作作业指导书

生物信息学数据库访问与操作作业指导书

生物信息学数据库访问与操作作业指导书第一章生物信息学数据库概述 (2)1.1 数据库简介 (2)1.2 生物信息学数据库分类 (3)第二章数据库访问基础 (4)2.1 数据库访问方法 (4)2.1.1 网页访问 (4)2.1.2 命令行访问 (4)2.1.3 API访问 (4)2.1.4 与本地安装 (4)2.2 数据库访问工具 (4)2.2.1 浏览器 (4)2.2.2 命令行工具 (4)2.2.3 编程语言 (4)2.2.4 数据库管理软件 (5)2.3 数据库访问权限与安全 (5)2.3.1 权限控制 (5)2.3.2 用户认证 (5)2.3.3 数据加密 (5)2.3.4 安全审计 (5)2.3.5 安全策略 (5)第三章常用生物信息学数据库介绍 (5)3.1 核酸序列数据库 (5)3.1.1 GenBank (5)3.1.2 EMBL (6)3.1.3 DDBJ (6)3.2 蛋白质序列数据库 (6)3.2.1 SwissProt (6)3.2.2 TrEMBL (6)3.2.3 PIR (6)3.3 结构生物学数据库 (6)3.3.1 Protein Data Bank(PDB) (6)3.3.2 RCSB PDB (7)3.3.3 MMDB (7)第四章数据库检索与查询 (7)4.1 关键词检索 (7)4.2 高级检索策略 (7)4.3 检索结果处理 (8)第五章数据库数据与转换 (8)5.1 数据方法 (8)5.2 数据格式转换 (8)5.3 数据压缩与解压缩 (9)第六章数据库数据统计分析 (9)6.1 数据分布分析 (9)6.1.1 数据类型与分布特征 (9)6.1.2 数据分布分析方法 (9)6.2 数据相关性分析 (10)6.2.1 相关性指标 (10)6.2.2 相关系数计算方法 (10)6.2.3 相关系数的解释与检验 (10)6.3 数据可视化 (10)6.3.1 数据可视化工具 (10)6.3.2 数据可视化方法 (10)6.3.3 数据可视化技巧 (11)第七章数据库数据挖掘 (11)7.1 数据挖掘方法 (11)7.2 数据挖掘工具 (11)7.3 数据挖掘应用实例 (12)第八章数据库数据整合 (12)8.1 数据整合方法 (12)8.2 数据整合工具 (13)8.3 数据整合案例分析 (13)第九章数据库数据管理与维护 (13)9.1 数据库备份与恢复 (13)9.1.1 备份策略 (14)9.1.2 备份方法 (14)9.1.3 恢复操作 (14)9.2 数据库功能优化 (14)9.2.1 索引优化 (14)9.2.2 查询优化 (15)9.2.3 存储优化 (15)9.3 数据库安全与权限管理 (15)9.3.1 安全策略 (15)9.3.2 权限管理 (15)第十章生物信息学数据库应用实例 (15)10.1 基因序列分析 (15)10.2 蛋白质功能预测 (16)10.3 疾病相关基因研究 (16)、第一章生物信息学数据库概述1.1 数据库简介数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。

生物信息学数据库分类整理汇总

生物信息学数据库分类整理汇总

生物信息学数据库分类整理汇总生物信息学数据库是存储和管理生物学领域的大量数据的重要工具和资源,对于生物信息学研究、基因组学、蛋白质组学、转录组学等领域的研究具有重要的意义。

本文将对生物信息学数据库进行分类整理和汇总,方便生物信息学研究者更好地使用和了解这些数据库。

1.基因组数据库:- GenBank:美国国家生物技术信息中心(NCBI)维护的基因序列数据库,包含已知基因的核酸序列。

- Ensembl:英国恩格斯尔基因组项目维护的一个综合性基因组数据库,包含多种物种的基因组数据。

- UCSC Genome Browser:加利福尼亚大学圣克鲁兹分校开发的一个基因组浏览器,提供多种物种的基因组序列和注释信息。

2.蛋白质数据库:- UniProt:一个综合性的蛋白质数据库,集成了多个蛋白质序列和注释信息资源。

- Protein Data Bank (PDB):存储大量已解析的蛋白质结构数据的数据库,提供原子级别的结构信息。

- Protein Information Resource (PIR):收集和整理蛋白质序列、结构和功能信息的数据库。

3.转录组数据库:- NCBI Gene Expression Omnibus (GEO):存储和共享大量的高通量基因表达数据的数据库。

- ArrayExpress:欧洲生物信息学研究所(EBI)开发的一个基因表达数据库,包含多种生物组织和疾病的表达数据。

4.疾病数据库:- Online Mendelian Inheritance in Man (OMIM):记录人类遗传疾病和相关基因的数据库。

- Orphanet:收集和整理罕见疾病和相关基因的数据库。

5.代谢组数据库:- Human Metabolome Database (HMDB):一个综合性的人类代谢物数据库,包括代谢产物的结构和功能信息。

- Kyoto Encyclopedia of Genes and Genomes (KEGG):包含多种生物体代谢途径的数据库。

生物信息学常用数据库(已分类)

生物信息学常用数据库(已分类)
枯草芽胞杆菌(Bacillus subtilis)基因组 PlasmoDB /
疟原虫属(Plasmodium)基因组 酵母基因组数据库(SGD) /Saccharomyces 酿酒酵母基因组 TIGR微生物数据库 /tdb/mdb/mdbcomplete.html
COMPEL http://compel.bionet.nsc.ru/ 复合调控元件(Composite regulatory elements)
CUTG http://www.kazusa.or.jp/codon/ 遗传密码使用表
DBTBS http://dbtbs.hgc.jp/ 枯草杆菌反式作用因子和启动子
ArkDB /sites.html 农业相关和其他动物的基因组数据库
综合的微生物资源(CMR) /tigr-scripts/CMR2/CMRHomePage.spl 已完成测序的微生物基因组
CropNet / 农作物基因组图谱
CyanoBase http://www.kazusa.or.jp/cyano/
Synechocystis sp.基因组
EMGlib http://pbil.univ-lyon1.fr/emglib/emglib.html 已完成基因组测序的细菌、古细菌、酵母
EcoGene /EcoGene/EcoWeb/ 大肠杆菌(E.coli)K-12的序列
帖子
441
积分
20
金币
339
贡献值 3 点
最后登录 10-5-10
名称 地址 说明
AceDB /Software/Acedb/ 线虫(C.elegans),酵母(S.pombe)的序列和基因组信息
AmmtDB r.it/mitochondriome/ 寄生虫(Metazoan)线粒体DNA序列

【2019年整理】很好—生物信息相关数据库资源介绍

【2019年整理】很好—生物信息相关数据库资源介绍


2.蛋白质序列和相关数据库
蛋白质序列数据库

PIR-international -The Protein Information Resource (protein sequence) (国际蛋白质信息中心,
NBRF+JIPID+MIPs,PIR1\PIR2\PIR3\PIR4))
TelDB - Multimedia Telomere(端粒) Resource

TRADAT - TRAnscription Databases and Analysis Tools
Subviral RNA db - Small circular RNAs db (viroid and viroid-like) (类病毒)
tmRDB - tmRNA dB
tRNA - tRNA compilation(编辑) from the University of Bayreuth

uRNADB - uRNA db
5)其他核酸数据库

RNA editing - RNA editing site


RNAmod db - RNA modification db

3).核酸三维结构数据库

NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db

生物数据库及生物信息学技术发展研究

生物数据库及生物信息学技术发展研究

生物数据库及生物信息学技术发展研究一、引言随着计算机技术和数据存储技术的发展,生物数据库和生物信息学技术在生物科学研究中发挥着越来越重要的作用。

本文将从生物数据库的概念、类型及其应用,以及生物信息学技术的发展历程和应用领域等方面进行详细阐述。

二、生物数据库及其类型生物数据库是指存储生物学数据的计算机化系统,是生物信息学的基础。

生物数据库可以根据存储的内容和特点分为以下几种类型。

1. 基因组数据库基因组数据库存储各种生命体的基因组序列数据,包括人类基因组数据库、果蝇基因组数据库、小鼠基因组数据库、大熊猫基因组数据库等。

通过基因组数据库可以了解各种生命体的基因组信息,以及基因之间的相关性和作用。

2. 蛋白质数据库蛋白质数据库存储各种生命体的蛋白质序列和结构信息,包括蛋白质序列数据库、蛋白质结构数据库等。

通过蛋白质数据库可以了解各种生命体内蛋白质的数量、种类、结构和功能等。

3. 代谢组数据库代谢组数据库存储各种生命体的代谢产物数据,包括代谢物谱数据库和代谢通路数据库等。

通过代谢组数据库可以了解各种生命体的代谢通路和代谢产物的数量、种类以及相互作用关系等。

4. 病害数据库病害数据库存储各种病原体和疾病的相关信息,包括病毒数据库、细菌数据库、真菌数据库、疾病数据库和医药数据库等。

通过病害数据库可以了解各种疾病的发生和传播机制,以及相应的治疗措施。

三、生物数据库的应用生物数据库在生物科学研究中应用广泛,主要体现在以下几个方面。

1. 基因功能注释生物数据库可以帮助研究者对基因进行功能注释,即从基因序列中预测其编码的蛋白质的结构、功能和作用等,进而了解基因的生物学功能和相互作用关系。

2. 药物设计生物数据库可以帮助研究者开发新药物,通过比对不同生命体的基因组、蛋白质结构和代谢通路等信息,找到相应的药物靶点和药物分子,并在此基础上设计和优化新的药物分子。

3. 生物信息图谱绘制生物数据库可以帮助研究者绘制生物信息图谱,即将生物信息化为图形化和可视化的形式,使复杂的生物信息变得更加易于理解和解释。

生物分子数据库

生物信息学数据库 Bioinformatics database
一、概述
生物信息学的定义 生物信息学是一门交叉科学,它包含了生物信息
的获取、处理、存储、分发、分析和解释等在内的所 有方面,综合运用数学、计算机科学和生物学的各种 工具,来阐明和理解大量数据所包含的生物学意义。 (美国人类基因组计划实施五年后的总结报告)
踏实肯干,努力奋斗。2020年10月19 日下午8 时48分 20.10.1 920.10. 19
追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2 020年1 0月19 日星期 一下午8 时48分 50秒20 :48:502 0.10.19
严格把控质量关,让生产更加有保障 。2020 年10月 下午8时 48分20 .10.192 0:48October 19, 2020
Nucleic Acids Research 杂志
相关数据库及其主要分类
1. 核酸序列数据库 2. RNA 序列数据库 3. 蛋白质序列数据库 4. 结构数据库 5. 基因组数据库 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其数据和其他基因表达数据库 10. 蛋白组资源 11. 其他分子生物学数据库 12. 细胞器官数据库 13. 植物数据库 14. 免疫学数据库
二、生物信息学数据库种类
《Nucleic Acids Research》杂志每年的第一 期中详细介绍最新版本的各种数据库。
在2000年1月1日出版的28卷第一期115种通 用和专用数据库。
至2008年,生物信息学数据库总数已达1078 个。比2007年增加110个。
Nucleic Acids Research 杂志
这两个数据库让科学家检索和观看结构,从 结构上查找特定蛋白质的相似蛋白质,并且辨 认功能位点。

生物学数据库20180324


EBI

EBI的网站在数据规模与承担的任务方面都与NCBI相当,其 资源也分为数据库、工具、EBI研究小组、培训、帮助等几 个部分,而全部资源及工具则显示在其Site Index页面( /Information/sitemap.html)中。
DDBJ

DDBJ,全称是DNA Data Bank of Japan。
是日本国立遗传学研究所1986建造的DNA核酸序列 的序列数据库

CNGB

中国国家基因库(China National GeneBank,简称CNGB), 位于深圳大鹏新区,是中国国家级基因库。2016年9月22日, 中国国家基因库正式投入运营。
它是中国唯一获批筹建的国家基因库,是世界上继美国国家生 物技术信息中心(NCBI)、欧洲分子生物学实验室(EBI)、日本 DNA数据库(DDBJ) 之后第四个基因库.
NCBI的主要任务是创建公共可接入数据库,引导在 计算生物学以及在基因组数据分析方面的软件开发, 同时发布各类生物医学信息。

EBI

EBI(),全称是European Bioinformatics Institute,是隶属于欧洲分子生物学研究室 (EMBL)的一个非盈利性的学术机构,专门从事生物信息 学方面的研究与服务。

几大数据库的关系

这四大数据库各有分工,他们各自收录了世界上所 报道的所有序列数据的一部分。其中美国NCBI的应 用最广泛,国际影响业最大。
每天实时交换数据。 因此,四大国际数据库在任何 给定时间包含相同的数据。


三、重要的生物数据库站点
—美国国家生物技术信息中心 EBI —欧洲生物信息研究所 DDBJ — 日本DNA数据库 CNGB —中国国家基因库

生物信息数据库大全

生物信息(bioinformation)数据库大全摘要: [生物信息(bioinformation)数据库大全] http: smartli77 cctrblog netcmd html?do=blogs&id=548&uid=1511 生物信息(bioinformation)数据库一.数据库目录2000年,出版《核酸研究》的牛津大学出版社设立了一个数据库目录网页,这个网页把数据库分成18类在郝柏林、张淑誉编著的《生物信息(bioin……[关键词:数据库序列基因基因组蛋白质蛋白质序列基因图谱]……关键词:数据库序列基因基因组蛋白质蛋白质序列基因图谱/cmd.html?do=blogs&id=548&uid=1511生物信息(bioinformation)数据库一.数据库目录2000年,出版《核酸研究》的牛津大学出版社设立了一个数据库目录网页,这个网页把数据库分成18类在郝柏林、张淑誉编著的《生物信息(bioinformation)学手册》中,他们进行了合并,又把数据库目录、农林牧有关数据库、医学数据库和文献单独列出,分成以下16类:1.数据库目录2.综合数据库包括DNA序列阵:EMBL、GenBank、DDBJ、GSDB、TDB和UniGene3.DNA序列数据库主要是与基因结构和认定有关的数据库,如密码子使用频度表、真核生物启动子库、内含子和外显子库等4.RNA序列和核糖体数据库5.基因图谱数据库6.人类基因组数据库7.其他物种基因组数据库8.基因表达数据库9.基因突变、病理和免疫数据库10.蛋白质序列数据库11.蛋白质结构数据库12.比较基因组学(comparative genomics)和蛋白质组学(Proteomics)数据库13.代谢途径和细胞调控数据库14.与农林牧有关数据库15.医学数据库16.其他数据库二.综合数据库INSD,国际核酸序列数据库(International Nucleotide Sequence Databank)由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护EMBL库,欧洲分子生物学实验室的DNA和RNA 序列库/embl.htmlGenBank ,美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库/Web/Genbank/DNA Databank of Japan (DDBJ) ,日本核酸数据库http://www.ddbj.nig.ac.jp/GSDB是由美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)/gsdb/TIGR DATAbase,是世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)/tdb/hcd/overview.html三.DNA序列和结构数据库包括与DNA的复制、转录、修复等有密切关系的蛋白质因子BioSino是中国自主开发的核酸序列公共数据库/CUTG,密码子使用频度表http://www.dna.affrc.go.jp/~nakamura/CUTG.htmlhttp://www.kazusa.or.jp/codon/http://www.dna.affrc.go.jp/~nakamura/CUTG.html EPD,真核生物启动子数据库(Eukaryotic Promotor Database)http://www.epd.isb-sib.ch/TRANSFAC,真核生物基因表达调控因子的数据库http://transfac.gbf.de/TRANSFACTRRD.真核生物基因组转录调控区数据库http://www.mgs.bionet.nsc.ru/mgs/dbases/trrd4/ OOTFD,转录因子和基因表达数据库/RepBase,真核生物DNA中重复序列数据库/~server/repbase.html MicroSatellite,微卫星重复序列数据库/gopher-menus/MicroSatelliteDatabase.html ALU数据库是人及其他灵长类代表性的Alu重复片段(/pub/jmc/alu/)Simple Repeats,简单重复序列库/COMPEL,复合元件数据库ftp://ftp.gbf-braunschweig.de(/pub/compel/)MPDB,分子探针数据库http://www.biotech.ist.unige.it/interlab/mpdb.htmlHvrBase,灵长类mtDNA调控区序列库,主要是人的HVI和HVII两个高变异区的序列http://monolith.eva.mpg.de/hvrbase/PlantCARE,植物顺式作用(cis-acting)调控因子数据库.http://sphinx.rug.ac.be:8080/PlantCare/PLACE是从文献中搜集的植物顺式作用调控元件DNA模体的数据库,只涉及维管植物.http://www.dna.affrc.go.jp/htdocs/PLACE/ftp://ftp.dna.affrc.go.jp(/pub/dna_place/place.seq)Mendel数据库,搜集植物STS和EST序列./HOX Pro同源异型盒(homeobox)基因数据库.http://spirov.iephb.nw.ru/hox_pro/hox-pro00.htmlOPD,寡核苷酸探针数据库(Oligonucleotide Probe Database)./OPD/dbSTS,序列标记位点(Sequence Tagged Sites)数据库./dbSTS/ftp://(/repository/dbSTS)dbEST.这是GenBank的重要组成部分,它包含若干物种的已表达的序列标记信息. /dbEST/ftp://(/repository/dbEST)AmmtDB,后生动物线粒体DNA多序列联配数据库,搜集了脊椎动物(vertebrates)线粒体中编码蛋白质和tRNA的多DNA序列对比数据,以及哺乳动物(mammal;mammalian)mtDNA主调控区序列联配数据.r.it:8000/BioWWW/#AMMTDBHOVERGEN,脊椎动物(vertebrates)同源基因数据库(HOmologous VERtebrateGENes)http://acnuc.univ-lyon1.fr/ftp://biogen.fr(/pub/db/acnuc/hovergen)DNA结构参数库.ftp://transfac.gbf.de(/pub/structure_library)NUCLEOSOME数据库,收集实验测定的核小体数据,用于预测DNA中与组蛋白八聚体结合的位点.ftp:///pub/databases/nucleosomal_dna/SELEX_DB,随机化序列库.http://www.mgs.bionet.nsu.ru/mgs/systems/selex/ASDB,交替剪接基因的数据库.:8888/Intronerator,秀丽线虫内含子和交替剪接数据库/~kent/intronerator/IDB和IEDB前者是内含子序列数据库,后者是内含子演化数据库/intron/index.htmlEID,外显子、内含子数据库/gilbert/EID/ExInt,外显子、内含子数据库.sg/rint/exint.htmlNDB,核酸晶体结构数据库ftp:////NDB/ndb.htmlVectorDB,载体数据库/Vector和Vector-ig,包分子生物学常用的许多载体的注释和序列信息ftp://(/repository/vetcor-ig)ftp://(/repository/vector)四.RNA序列和核糖体数据库1993年成立的RNA学会,在出版RNA刊物同时,还维护着两个信息网页:/~rna1//Journals/JNLSCAT/rRNA/rna.htmlsnoRNA,小核仁RNA数据库/biochem... noRNA-DataBase.htmlSmall RNA数据库/smallRNA/smallrna.htmlRNAse P数据库,包含RNA水解酶P的RNA亚基序列、联配、二级结构和三维模型/RNAseP/home.htmltmRNA网点包含tmRNA序列、公认蛋白质水解标记、序列联配、确定新tmRNA 的导引,以及简要综述等/~tmrna/tmRDB.已经联配好的、加有注释的、按亲缘关系排列的tmRNA序列数据/dbs/tmRDB/tmRDB.htmlgRNA,导引RNA数据库http://www.biochem.mpg.de/~goeringe/SRPDB,信号识别粒子数据库/dbs/SRPDB/SRPDB.htmlTransTerm,信使RNA的组分和翻译控制信号数据库/Transterm/类病毒和类病毒样RNA数据库herb.ca/~jpperra/UTRdb和UTRsiteUTRdb是真核生物mRNA的5’端和3’端非翻译区序列的非冗余数据库,UTRsite搜集这些非翻译区序列中的功能片段r.it:8000/EmbIT/UTRHome/ncRNA,似mRNA的非编码RNA数据库http://www.man.poznan.pl/5Sdata/ncRNA/index.htmlRNAmods,RNA修饰数据库/RNAmods/RNAmods.htmlftp://(/library/RNAmods)AARSDB,酰氨基tRNA合成酶数据库http://rose.man.poznan.pl/aars/index.htmltRNA序列和基因、结构与功能数据库http://www.uni-bayreuth.de/departments/biochemie/trna/PLMItRNA基于FastA的绿色植物线粒体tRNA分子和tRNA基因的数据库r.it:8000/srs6//services/16SMDB、16S-likeMDB 、16SMDBexp 、23SMDB、23S-likeMDBexp数据库,是一批16S和23S核糖体RNA突变数据库/departments/biology/databasee/rna.htmlftp://(/nar/)RNA www,RNA二级结构网页,也有16S RNA和23S RNA的数据:8080/RNA/uRNADB,已经联配好的、加有注释的、按亲缘关系排列的uRNA序列数据/dbs/uRNADB/uRNADB.htmlU-insertion/deletion,编辑序列数据库,包含5个无脊椎动质体目物种的线粒体基因和编辑后的mRNA序列/RNA/trypanosome/database.html PseudoBase,假扭结数据库http://www.bio.leidenuniv.nl/~Batenburg/PKB.htmlRDP,核糖体数据库计划包含小亚基和大亚基的两部分rRNA,由已联配的RNA序列以及亲缘树组成/RDP//(/pub/)SSU rRNA欧洲核糖体小亚基RNA结构数据库http://rrna.uia.ac.be/ssu/LSU rRNA欧洲核糖体大亚基RNA结构数据库http://rrna.uia.ac.be/lsu/5S rRNA数据库http://rose.man.poznan.pl/5Sdata/index.htmlDRC,核糖体交链数据库http://www.mpimg-berlin-dahlem.mpg.de/~ag_ribo/ag_brimacombe/drc/ ACTIVITY,DNA和RNA中功能位点数据库http://www.mgs.bionet.nsu.ru/systems/Activity/RNA非正则配对数据库/bp_type/五.基因图谱数据库Rhdb,辐射杂交数据库/RHdb/Rhdb/species/HUMAN/gm99.htmlftp://(/pub/databases/RHdb)Mouse RH数据库/mouse_rh/GDB,人类基因组数据库/ftp:///GeneMap’99,人类基因图谱1999年版/genemap/HuGeMap,人类基因遗传图谱和物理图谱的分布式集成数据库ftp://(/pub/databases/RHdb/gm99.map) 六.人类基因组有关数据库人类染色体数据网址:http://linkage.rockefeller/chr1//HGP/chr1/HGP/chr2///HGP/chr4//HGP/chr6http://www.genet.sickkids.on..ca/chrdb:8080/chr8/home.html /chr9/HGP/chr9/htdocs/chr10-mapping/ /HGP/chr10///datapage//database.html /chr12/home.html /~genome/ /HGP/chr13//HGP/chr15//HGP/chr15///tdb/humgen/c16.htmlhttp://bioinformatics.weizmann.ac.il//HGP/chr18///bbrp/genome/genome.html http://www.expasy.ch/cgi-bin/lists?humchr20.txt /HGP/chr20/http://www.expasy.ch/cgi-bin/lists?humchr21.txt /chr21/welcome.html http://www.cephb.fr/chromosome21.html/HGC22.htmlhttp://www.expasy.ch/cgi-bin/lists?humchr22.txt /hum22/HGP/chr22//gifs/http://www.expasy.vh/cgi-bin/lists?humchrx..txt:8080/chrX/home.html/HGP/chrX/http://www.expasy.ch/cgi-bin/lists?humchry.txt/mitomap.html1.人类基因组测序中心HUGO是人类基因组组织的缩写/HUGO Pacific GENOME Newsletter 是HUGO在太平洋部分,其中反映中国情况的短文在:http://hugo-pacific.genome.ac.jp/3_2contents/china.html美国能源部支持的人类基因组计划(genome project)/production/ober/hug_top.html美国国家卫生署对人类基因组计划(genome project)的支持,通过NHGRI即国家人类基因组研究所(National Human Genome Research Institute)体现/英国Wellcome Trust是人类基因组计划(genome project)的另一个主要资助者/百慕大原则:测序的中间和最终结果都必须迅速的公开/hugo/bermuda.html世界上主要人类基因组测序中心的名单/inf/Hgcenters.html/hgmis/centers.htmlNCBI的GenBank数据库从1999年10月起,建立了智人基因组子目录,其下按染色体编号设子目录/genbank/genomes/H_sapiens/英国的Sanger中心的人类基因组计划(genome project)网页,不仅有它们负责测序的染色体数据,还有到其他染色体数据的链接/HGP/日本的DDBJ和信息生物学中心(CIB)联合建立了一个Human Genomics Studio,可以按染色体编号检索和查找基因序列http://studio.nig.ac.jp/Sanger 中心是世界上最大的DAN测序中心之一承担人类基因组计划(genomeproject)的三分之一,集中在1、6、9、10、13、20、22和X/HGP/stats.htmlLBNL,Lawrence Berkeley国家实验室/GenomeHome.htmlLLNL,Lawrence Livermore 国家实验室/bbrp/genome/genome.htmlLANL,美国洛斯阿拉莫斯国家实验室/index.htmlJGI,由美国能源部支持的,依托LBNL、LLNL和LANL三个国家实验室的人类基因组研究部门建的联合基因组研究所(Joint Genome Institute)/UWGC,华盛顿大学基因中心,是国际上最活跃的测序中心之一/ftp:///SHGC,斯坦福大学人类基因中心,主要做高分辨率辐射杂交图谱,以及人类第四号染色体BAC克隆的测序/美国哥伦比亚大学基因中心,主要研究和人类疾病有关的基因和第13号染色体图谱/~genome/http://genome3.cpmc//~legion/GENETHON,法国人类基因组研究中心http://www.genethon.fr/genethon_en.html2.人类基因组有关数据GenBank、EMBL 、GSDB 、GDB等综合数据库的主要内容都来自人UniGene,人类基因序列集合,搜集了GenBank中不同基因产物的序列/UniGene/HIB数据库,是德国人类基因组计划(genome project)中基因分析项目所建立的自动注释的基因集团数据库http://www.mips.biochem.mpg.de/proj/human/dbSNP,设在美国国家生物技术信息中心NCBI的单核苷酸多态性数据库,收录单核苷酸置换,以及短的删除和插入所导致的多态性/SNP/Whitehead的生物医学研究所的人类单核苷酸多态性(SNP)数据库/SNP/humanHGBASE是人类双等位基因序列(Human Genic Bi-Allelic Sequences)的缩写,这是人类基因从启动子到转录终点,即基因及其前后所发现的所有单核苷酸多态性和其他变化的数据库http://hgbase.interactiva.de/http://hgbase.cgr.ki.se/位于St.Louis的华盛顿大学的SNP数据库/SNP/I.M.A.G.E协作组,他们共享高质量的cDNA克隆库,并把有关序列、图谱和表达数据公开/bbrp/image/image/html美国菌种保藏中心(American Type Culture Collection)/GenMapDB,V.Cheung实验室维护的一个BAC图谱数据库/vcheung/BAC Ends,人类BAC末端数据库/tdb/humgen/bac_end_search/HUGE,人类未经实验证实的编码基因的数据库http://dazusa.or.jp/huge/IXDB,集成的人类X染色体物理图谱数据库http://ixdb.mpimp-berlin-dahlem.mpg.de/Genotype,法国人类多态性研究中心的基因型数据库http://www.cephb.fr/cephdb/VIRGIL,专门为GDB中的人类基因和GenBank中的DNA序列提供对应链接关系的数据库biogen.fr/services/birgil/Hpvirgil.htmlftp://biogen.fr(/pub/db/viogil/virgil.ffl)KinMutBase,人类致病蛋白质激酶突变数据库http://www.uta.fi/imt/bioinfo/KinMutBase/CpGIsle,人类基因中CpG岛数据库ftp://bioslave.uio.no(/cpgisle)ftp://biogen.fr(/pub/db/cpgisle/)ftp://(/pub/databases/cpgisle)p53数据库研究人类肿瘤及肿瘤细胞系p53基因突变的数据库,包括:p53库、体细胞突变库、种系突变库和细胞系突变库http://perso.curie.fr/tsoussi/IARC p53数据库法国国际癌症(cancer)研究会的肿瘤和细胞系P53基因突变数据库http://www.iarc.fr/p53/homepage.html/p53数据库具有癌症(cancer)倾向家族P53种系突变数据库http://www.lf2.cuni.cz/projicts/germline_mu_p53.htmlftp://ftp.lf2.cuni.cz(/pub/doc/medical/)人类P53基因突变及软件/dnam/des_p53.html人类hprt即次嘌呤磷酸核糖基转移酶基因突变数据库和在PC视窗下运行的分析软件/dnam/des_hprt.html转基因啮齿动物LacI数据库/dnam/des_laci.html转基因啮齿动物LacZ突变库基因突变数据库及分析软件/dnam/des_lacz.htmlWRN基因突变与遗传病Werner综合征有关/werner/ws-wrn.htmlOMIM,在线人类孟德尔遗传数据库/omim/STACK,南非国家信息中心SANBI维护的一个序列标记联配和代表序列知识库http://www.sanbi.ac.za/Dbases.htmlSANIGENE是与STACK密切相关的一个数据库它包含所有经过计算机处理联配过的人类基因EST的集团http://www.sanbi.ac.za/Dbases.html七.其他物种基因组数据库DOGS,基因组尺寸数据库http://www.cbs.dtu.dk/GenBank的/genomes/子目录:ftp://(/pub/databases/genband/genomes/) EuGenes,真核生物基因综合知识库,目前包括果蝇、人、小鼠、拟南芥(Arabidopsis thaliana)、线虫、酵母、和斑马鱼的数据/eugenes1.原核生物基因组细菌基因组计划(genome project)的进展情况,可从以下网站查询:/PMGifs/Genomes/bact.htmlMOT ,欧洲生物信息(bioinformation)研究所EBI的基因组测序进展表/~sterk/genome-MOT/GIB,日本DDBJ设立的Genome Information Broker for microbial genomes 的缩写http://mol.genes.nig.ac.jp/gib/MAGPIE测序计划清单也可以参考/~gaasterland/genomes.htmlEMGLib,增补微生物基因组库http://pbil.univ-lyon1.fr/emglib/emglib.html大肠杆菌(Escherichia coli)K12菌株的完全基因组序列,可由GenBank的子目录/genomes/获取,或从华盛顿大学大肠杆菌(Escherichia coli)基因组中心,即Blattner实验室的网页读取:/pub/sequence/ECDC,大肠杆菌(Escherichia coli)菌株K12的基因序列库,包括基因、读框、调控区、启动子、终止子、tRNA和rRNA等http://susi.bio.uni-giessen.de/ecdc/ecdc.htmlftp://)/pub/databases/ecdc)EcoGene和EcoWeb,大肠杆菌(Escherichia coli)K12菌株基因组数据库,包括基因、蛋白质、基因间蛋白质组信息/EcoGene/EcoWeb/RegulonDB,大肠杆菌(Escherichia coli)转录调控和操作子数据库http://www.cifn.unam.mx/Computational_Biology/regulondb/ NRSub,非冗余枯草芽孢杆菌DNA数据库,包括完全基因组、密码子使用表、基因图谱和基因家族http://acnuc.univ-lyon1.fr/nrsub/nrsub.htmlftp://ftplnig.ac.jp(/pub/db/nrsub)HIDB,流感嗜血菌完全基因组的原始数据库/tdb/mdb/hidb/hidb.htmlftp:///pub/data/h_influenzaeHIDC,流感署血菌基因序列库http://susi.bio.uni-giessen.de/ecdc/hidc.htmlCyanoBase,蓝细菌数据库,实际上是集胞蓝细菌的基因组数据库蓝细菌具有氧化和光合作用所需的全套基因http://www.kazusa.or.jp/cyano/cyano.htmlMJDB,詹氏甲烷球菌基因组数据库ftp://(/pub/data/m_jannaschii)/tdb/mdb/mjdb/mjdb.htmlMycDB,分枝杆菌数据库http://www.biochem.kth.se/MycDB.htmlRsGDB,类球红细菌基因组数据库第一作者联系:mailto:/madhu@PGI,疫霉属基因预研究计划的数据库/pgi/2.真菌基因组SGS,酿酒酵母基因组数据库/Saccharomyces/ftp://(/pub/yeast)LISTA,LISTA-HOP和LISTA-HON是酿酒酵母基因组中蛋白质编码序列及其同源性的数据库/ftp://bioftp.unibas.ch/MYGD,酵母基因组、蛋白质和同源关系的数据库http://www.mips.biochem.mpg.de/proj/yeast/YIDB,酵母内含子数据库http://www.EMBL-Heidelberg.DE/ExternalInfo/seraphin/yidb.html MNCDB,由德国MIPS所维护的粗糙链孢霉基因组数据库http://www.mips.biochem.mpg.de/desc/neurospora/真菌基因组资源的网址::5080/main.htmlFGSC,真菌遗传学信息中心/3.原生生物和线虫基因组欧洲生物信息(bioinformation)研究所EBI的原生生物网页:/Projects/Protozoa/AceDB,线虫综合数据库ftp://(/pub/acedb)ftp://(repository/acedb)ftp://lirmm.lirmm.fr(/pub/acedb)关于线虫发育特别是化学感觉神经的研究/4.昆虫基因组斯坦福大学的果蝇基因组中心/FlyBase,果蝇基因和分子数据库/ftp:///FlyNets,果蝇分子和遗传相互作用数据库http://gifts.univ-mrs.fr/FlyNets/GIF-DB,果蝇胚胎发育过程中基因相互作用的WWW数据库http://www-biol.univ-mrs.fr/~lgpd/GIFTS_home_page.html 哈佛大学的果蝇网页/MsqDB,蚊子基因数据库/acedb/MsqDB-acedb.html ftp:///5.鱼类数据库美国国家卫生署1997年建立的斑马鱼网页/science/models/zebrafish/ZFIN,斑马鱼基因组、发育突变和野生种系数据库/ZFIN/Fugu是河豚的数据库/6.啮齿动物基因组下面是有关家鼠的数据库M.Musculus基因组库ftp://(/genbank/genomes/M_muslulus)MGD,家鼠基因组库,现在又称MGI即家鼠基因组信息库/mgd.htmlftp:///Cre转基因家鼠系的数据库/periodical/yc/yc9903/990314html RatMap,大鼠基因图谱数据库http://ratmap.gen.gu.se/7.细胞器数据库主要是线粒体和叶绿体基因的数据MitoNuc和MitoAln是关于编码线粒体蛋白的细胞核基因的两个相互关联的数据库r.it:8000/srs6/GOBASE,细胞器基因组数据库http://megasun.bch.umontreal.ca/gobase/MitBASE,线粒体DNA数据库,集成所有已知线粒体基因信息/Research/Mitbase/mitbase.pl/人类线粒体数据库r.it8000/Tutorials/MitBASE/MitBASE Pilot,酵母线粒体中核基因数据库/Research/Mitbase/mitbase.pl/植物和藻类线粒体数据库:8889/mitb... .pla_show_qry_opts/原生生物线粒体数据库r.it:8000/Tu... /protist_table.html脊椎动物(vertebrates)线粒体数据库r.it:8000/Tutorials/MitBASE/vertebrate.html8.拟南芥(Arabidopsis thaliana)基因组MATDB,国际拟南芥(Arabidopsis thaliana)基因组计划(genome project)的数据汇总http://www.mips.biochem.mrg.de/desc/thal/AtDB,拟南芥(Arabidopsis thaliana)基因组数据库/Arabidopsis/ftp://(/pub/arabidopsis) DatA,拟南芥(Arabidopsis thaliana)基因组注释库/group/arabprotein/ TAIR,拟南芥(Arabidopsis thaliana)信息资源/AGR,拟南芥(Arabidopsis thaliana)基因组资源/agr/agr.htmlTIGR-AT,TIGR研究所的似南芥EST和基因序列数据库/tdb/at/at.html9.病毒数据库ICTVdB,病毒数据库.au/viruses/ICTVdB/ictvdb.html VIDEdB,病毒鉴定交换数据库.au/research-groups/MES/vide/RDV,水稻(Rice)矮缩病毒基因组数据库/rdv/八.蛋白质序列数据库SWISS-PROT是对数据人工审读很严格的库http://www.expasy.ch/sprot/TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,已经完成了自动注释:5000/PIR是蛋白质信息资源的缩写/pir/http://www.mips.biochem.mpg.de/proj/protseqdb/GenBank是由GenBank中的DNA序列翻译得到的蛋白质序列,与TrEMBL相似、但没有像后者那样经专家审读biogen.fr/srs/PROSITE,由专家根据生物知识审编的SWISS-PROT蛋白质序列中有生物意义的位点、模式和轮廓的数据库http://www.expasy.ch/prosite/PrositeScan服务器,根据用户填表提交的蛋白质序列搜索PROSITE模式http://www.isrec.isb-sib.ch/software/PSTSCAN_form.htmlPSD,蛋白质序列数据库,是PIR的主体/pirwww/dbinfo/texpsd.htmlPATCHX,PIR的子库之一,收入尚未纳入PIR库的蛋白质序列/pirwww/dbinfo/patchx.htmlARCHIVE,PIR的子库之一,保存PIR库中条目的原始文献或最初提交的序列/pirwww/dbinfo/achive.htmlProClass,蛋白质类数据库,是根据PROSITE库和PIR库中超家族的关系组织起来的非冗余蛋白质库/gsfserver/prolclass.html/proclass.htmlPIR-ASDB,PIR的注释和相似性数据库/por/KIND,瑞典斯德哥尔摩生物信息(bioinformation)中心维护的非冗余蛋白质序列库ftp://ftp.mbb.ki.se(/pub/KIND)ENZYME,基于命名系统的酶数据库http://www.expasy.ch/enzyme/BRENDA,这是一个内容广泛的酶的信息库http://www.brenda.uni-koeln.de/OWL,蛋白质序列库,是由SWISS-PROT,PIR,GenBank翻译序列和PDB等数据库产生的非冗余的蛋白质序列库/bmb5dp/owl.htmlGeneCards,由以色列魏茨曼科学研究所维护的关于基因及其产物,以及它们的生物医学应用的文献库http://bioinfo.weizmann.ac.il/cardsSWISS-2DPAGE,由二维聚丙烯酰胺凝胶电泳所确定的蛋白质的参考图谱数据库,包括文本和图象信息,通向其他2D-PAGE数据库的链接等http://www.expasy.ch/ch2d/HDB,组蛋白数据库,包括联配好的组蛋白序列以及已确认包含有组蛋白折叠模体的非蛋白序列,以及所有已知组蛋白和组蛋白质折叠的结构,同时指出不同数据库中类似序列的差异/histones/HOBACGEN数据库,包含按家族组织的所有细菌的蛋白质序列,有助于从各种细菌选取同源家族,作多序列联配和构建亲缘树http://www.mips.biochem.mpg.de/proj/medgen/mitop/MITOP,线粒体蛋白质组数据库,包括线粒体有关的基因、蛋白质和疾病信息/Research/Mitbase/mitbase.pl/MITOMAP,人类线粒体基因组数据库/mitomap.htmlREBASE,限制性内切酶和甲基化酶数据库/rebaseProtoMap,蛋白质分类数据库http://www.protomap.cs.huji.ac.il/ISSD蛋白质序列数据库http://www.protein.bio.msu.su/issd/PRF,日本蛋白质研究基金会维护着三个蛋白质和多肽数据库:PRF/LITDB文献库、PRF/SEQDB序列库及PRF/SYNDB合成产物库http://prfsun2.prf.or.jp/MEROPS,肽酶数据库/Merops/Merops.htmlPKR,蛋白激酶信息库/Kinases/pkr/pkk_catalytic/pk_cat_list.html Wnt基因网页/rnusse/wntwindow.html PhosphoBase,磷酸化位点数据库http://www.cbs.dtu.dk/databases/PhosphoBase/ SYSTERS,蛋白质集团数据库http://www.dkfz-heidelberg.de/tbi/services/cluster/DIP蛋白质相互作用数据库/DexH/D数据库/~ej67/dbhome.htm Homeodomain,同源异形结构域数据库/homeodomain/InBase,新英格兰生物实验公司的蛋白质剪接数据库/neb/inteins.htmlLGICdb,配体门控离子通道(ion channel)数据库http://www.pasteur.fr/recherche/banques/LGIC/LGIC.html SENTRA,信号传递蛋白质数据库/WIT2/Sentra/ICN,离子通道(ion channel)网络,是由美国神经科学数据库中心等单位联合建立的一个内容丰富的网页/csn/Aaindex,氨基酸索引数据库http://www.genome.ad.jp/aaindex/九、蛋白质结构和分类数据库PDB,蛋白质结构数据库/pdb/RCSB,结构生物信息(bioinformation)学信息学合作研究组织/PDBNEW,下一版PDB库正式发布前收到的全新或更新条目/PDBFinder,在PDB、DSSP、HSSP、基础上建立的二级库,包含PDB序列、作者、R因子、分辨率、二级结构等http://www.sander.embl-heidelberg.de/pdbfinder/ftp://swift/embl-heidelberg.de(/pdbfinder)PDB at a Glance清单/modeling/pdb_at_a_glance.html PDBselect数据库http://swift.embl-heidelberg.de/pdbsel/PDBsum是PDB库中数据的更便于阅读的总结和分析,以及一些衍生数据/bsm/pdbsum/index.html BioMagResBank简称BMRB,是关于多肽、蛋白质和核酸的核磁共振数据库/CSD,剑桥结构数据库/prods/csd.htmlNRL-3D,三维结构已经确定的蛋白质序列库/Dan/proteins/nr13d.htmlFAMBASE,,是每个蛋白质家族的代表序列的集合,它有助于加速同源性搜索/pirwww/dbinfo/fambase.html ProtFam,蛋白质超家族的序列联配数据库http://www.mips.biochem.mpg.de/proj/protfam/protfam/SCOP,蛋白质结构分类数据库/scop/CATH,蛋白质结构与功能关系分类数据库/bsm/cath/PIR-ALN,蛋白质序列联配数据库/pir/alndb.html3Dee,蛋白质结构域定义的数据库:8080/3Dee/ProTherm,蛋白质及其变异体热力学数据库http://www.rtc.riken.go.jp/protherm.htmlASTRAL是基于SCOP数据库的一组分析蛋白质结构和蛋白质序列的数据库和工具/RESID,蛋白质翻译后修饰情况的数据库/pirwww/search/textresid.htmlSMART是简单模块构架搜索工具的缩写http://SMART.embl-heidelberg.de/PROMISE数据库/bmbknd/promise/MAIN.htmlMMDB蛋白质分子模型数据库/Structure/VAST矢量联配搜索工具http://swift.embl-heidelberg.de/dssp/DSSP,PDB库中所有蛋白质条目的二级结构归属数据库http://swift.embl-heidelberg.de/dssp/HSSP,按同源性导出的蛋白质二级结构数据库http://www.sander.embl-heidelberg.de/hssp/Dali/FSSP,基于PDB数据库中现有蛋白质三维结构,用自动结构对比程序Dali逐一比较而形成的折叠单元和家族分类库http://www.embl-ebi.ac.ul/dali//dali/fssp/3d_ali数据库,搜集彼此相关的蛋白质序列和结构数据http://www.embl-heidelberg.de/argos/ali/ali.htmlDEF蛋白质折叠类的预测数据库http://zeus.cs.uoi.gr/neural/biocomputing/def.htmlINFOGENE,Sanger中心计算基因组学小组维护的、各基因组测序计划所提供的序列中已知的蛋白质和预测出的基因与蛋白质的数据库/inf/infodb.htmlTMBase,跨膜蛋白数据库ftp://ulrec3.unil.ch(/pub/tmbase)PRESAGE是关于结构基因组学(structural genomics)的一个数据库,它为库中每个蛋白质搜集了反映当前实验状况、结构、模型和研究建议的注释/SBASE,带有注释的蛋白质序列片、即蛋白质结构域的数据库,由ICGEB建立和维护http://www.icgeb.trieste.it/sbase/InterPro,集成的蛋白质结构域和功能位点数据库/interpro/HITS,瑞士新近建立的一个蛋白质结构域数据库http://www.isrec.isb-sib.ch/cgi-bin/hits/hits_indexBLOCKS,蛋白质分类与同源性数据库,包含蛋白质家族中保守区域的组块多序列联配的数据/BLOCKS+数据库/PFAM高质量的蛋白质结构域家族数据库/Sorfware/Wise2/PRINTS数据库最近改名为PRINTS-S,这是一个蛋白质家族的指纹和模体数据库/dbbrowser/PRINTS/ProDom自动产生的蛋白质结构域家族数据库http://www.toulouse.inra.fr/prodom.htmlDOMO,蛋白质结构域数据库biogen.fr/services/domo/GRBase,这是参与基因调控的蛋白质的数据库/~regulate/PMD,蛋白质突变体数据库http://pmd.ddbj.nig.ac.jp/GLYCBASE,蛋白质糖基化位点数据库http://www.cbs.dtu.dk/databases/OGLYCBASE/ORDB嗅觉受体蛋白质序列数据库/senselab/ordb/CarbBank亦称CCSD,复杂碳水化合物结构数据库,通常与蛋白质结构数据库归在一起/SWISS-3DIMAGE,蛋白质三维图象和PDB浏览器http://www.expasy.ch/sw3d/IMB,大分子三维图象库http://www.imb-jena.de/IMAGE.htmlBioImage,多维生物学数据库/MolMovDB,耶鲁大学的生物信息(bioinformation)学研究室维护的分子运动数据库/MolMovDB/ModBase,蛋白质结构模型比较数据库/modbase/十.比较基因组学(comparative genomics)和蛋白质组学(Proteomics)数据库COG直系同源聚类数据库/COG/GeneCensus,耶鲁大学生物信息(bioinformation)学研究室维护的各物种基因组的比较数据库,着重于折叠单元的结构对比/XREFdb/XREFdb,哺乳动物(mammal;mammalian)和模式生物(model organism)的基因和遗传学交叉引用数据库/YPDhome.htmlYPD,酿酒酵母蛋白质组数据库/YPDhome.htmlWormPD,线虫蛋白质组学(Proteomics)数据库/YPDhome.html十一.基因表达数据库Flyview,果蝇基因表达数据库http://flyview.uni-muenster.de/Flybrain,果蝇神经系统(Nervous System)图谱和数据库http://flybrain.uni-freiburg.de/NEXTDB,线虫基因表达模式数据库http://watsom.genes.nig.ac.jp:8080/db/MAGEST数据库,其名字来自Maboya Gene Expression patters and Sequence Tags 短语的缩写http://star.scl.kyoto-u.ac.jp/magest/BodyMap,人类和家鼠基因表达数据库http://bodymap.ims.u-tokyo.ac.jp/Axeldb,非洲爪蟾基因表达数据库http://www.dkfz-heidelberg.de/abt0135/axeldb.htmlXMMR,非洲爪分子标记资源/TRIPLES,酵母基因功能数据库,设在耶鲁大学医学院的基因组分析中心/triples/MGEIR,集成的家鼠基因表达信息资源/GXD,家鼠基因表达数据库/searches/gxdindex_form.html EpoDB,脊椎动物(vertebrates)红细胞生成基因表达分析数据库/epodb/KidneyDB,肾脏发育数据库/anatomy/kidbase/kidhome.html ToothExp,牙齿基因表达数据库http://honeybee.helsinki.fi/toothexp/toothexp.html十二.基因突变、病理和免疫数据库HGMD人类基因突变数据库,可用于预测基因疾病/uwcm/mg/hgmd0.htmlMarfan人类FBN1基因突变数据库及分析软件/uwcm/mg/hgmd0.html Collagen人类胶原数据库//genetics/collagen/人类PAX2等位基因变异数据库/Softdata/PAX2/。

非编码RNA组科学数据库:NONCODE

TECHNOLOGY非编码RNA组科学数据库:NONCODE任菲1,2 何顺民1 刘长宁1 赵屹11. 中国科学院计算技术研究所前瞻实验室,北京 1001902. 中南大学,湖南 410083NONCODE科学数据库是中国科学院计算技术研究所生物信息学研究组和中国科学院生物物理研究所生物信息学实验室共同开发和维护的一个提供给科学研究人员分析非编码RNA基因的综合数据平台。

自从其2005年发布以来,非编码RNA基因的数量飞速增长[1-3],而且人们也逐步认识到非编码RNA基因在大多数物种中都发挥着重要的调控作用[4]。

《Science》杂志在2005年1月的期刊中曾给予NONCODE数据库较高的评价和推荐。

2006年,ISI Web of Knowledge 邀请收录NONCODE科学数据库;2007年,中国国家医药卫生科学数据共享平台收录了NONCODE科学数据库。

目前在NONCODE 2.0数据库中,非编码RNA基因的数量大约为20多万条目,其中包括了microRNA,Piwi-interacting RNA和mRNA-like ncRNA等。

同时,在NONCODE中的非编码RNA基因数据分析平台中,还为研究人员提供了BLAST序列比对服务,非编码RNA基因在基因组中定位以及它们的上下游相关注释信息的浏览服务。

研究人员可以通过/ 或者 / 网站来访问该数据平台。

非编码RNA;科学数据库;RNA组学摘 要:关键词:本页已使用福昕阅读器进行编辑。

福昕软件(C)2005-2007,版权所有,仅供试用。

TECHNOLOGYN o n -c o d i n g R N A S c i e n t i f i c D a t a b a s e :NONCODERen Fei 1, He Shunmin 1,2, Liu Changning 1, Zhao Yi 11. Center for Advanced Computing Research, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190,China2. Central South University, Changsha, Hunan Province 410083, ChinaThe NONCODE database is an integrated knowledge database designed for theanalysis of noncoding RNAs (ncRNAs). Since NONCODE was firstly released in 2005, the number of known ncRNAs has grown rapidly, and there is a growing acknowledgement that ncRNAs play important regulatory roles in most organisms. In the NONCODE database, the number of collected ncRNAs has reached 206226, including a wide range of microRNAs, Piwi-interacting RNAs and mRNA-like ncRNAs. The improvements of the database include not only new and updated ncRNA data sets, but also an incorporation of BLAST alignment search service and access through our custom UCSC Genome Browser. NONCODE can be accessed through or .Non-coding RNA; Scientific database; Rnomics本页已使用福昕阅读器进行编辑。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Swiss-Prot
1986年,由瑞士日内瓦大学创建。 SIB(Swiss Institute of Bioinformatics) ExPASy(Expert Protein Analysis System) 所有序列条目均经过有经验的分子生物学 家和蛋白质化学家审核,因此又称为蛋白 质专家库
二级数据库简介
二级数据库的形式:大多以web界面为基础,具有文字信 息、表格、图形、图表等方式显示数据库内容; 一级数据库与二级数据库之间并无明确的界限。
(例如:GDB、AceDB、SCOP、CATH等都已经具有二级数据库的特 色)
A) 基因组信息二级数据库
E. coli基因组数据库Colibri 德国Pastear研究所建立。 除具有浏览、检索、搜寻功能外,还对环状基因组实现可 视化。
网址:/Colibri/
TransFac (真核生物基因转录调控因子数据库) 德国生物工程研究所开发维护,始建于1988年。 包括顺式调控位点、基因、转录因子、细胞来源、分类和 调控位点核苷酸分布6个子库。
TransFac的网址:
Prosite网址:/prosite
C) 蛋白质结构二级数据库
DSSP (Definition of Secondary Structure of Proteins) 蛋白质二级结构构象参数数据库
DSSP的网址:http://www.cmbi.kun.nl/gv/dssp/
http://www.rcsBiblioteka
由 Brookhaven National Laboratories 创办 57,706 个结构图(2009.5.20) 蛋白质 核酸 其它
PDB网址:/pdb(美国)
wwPDB
2003年,PDB(RCSB),MSD-EBI (EBI),PDBj(Japan)组建了全球范 围的PDB库(worldwide PDB,wwPDB) 数据共享,统一数据格式 数据集中存储,尚未提供数据检索服务 /
DDBJ
创建于1986年 NIG(National Institute of Genetics) 数据库查询工具:SAS 数据提交工具: Sequin http://www.ddbj.nig.ac.jp/index-e.html
INSDC
1998年,GenBank、EMBL和DDBJ共同 成立了国际核酸序列数据库协会 (International Nucleotide Sequence Database Collaboration,INSDC) 三大核酸数据库之间每天将新测定或更新 的数据进行交换共享,保证数据信息的完 整与同步,每两个月更新一次版本。 /
UniParc
UniProt Archive (UniParc) 存储所有公共数据库中有效的蛋白质序列 数据,包括序列的来源及来源数据库的链 接。 记录所有蛋白质的当前状态和历史信息 记录以UPI开头,例:UPI000005E9D0
三. 蛋白质结构数据库
(1)PDB (Protein Data Bank)
分子生物信息数据库简介
一级数据库 直接来源于实验获得的原始数据,只经过简单的归类、整理 和注释。 一级核酸数据库:GenBank数据库、EMBL数据库、DDBJ 数据库 一级蛋白质序列数据库:SWISS-PROT库、PIR库 一级蛋白质结构数据库:PDB数据库 二级数据库 在一级数据库、实验数据和理论分析的基础上,针对不同的 研究内容和需要,对生物学知识和信息的进一步整理得到的数 据库。 人类基因组图谱库GDB、转录因子和结合位点库TRANSFAC、 蛋白质序列功能位点数据库Prosite等。
TrEMBL
1996年创建,意为“Translation of EMBL” 从EMBL的cDNA序列翻译而来,包含 EMBL数据库中所有核酸编码序列信息
ExPASy
/
ExPASy Proteomics Tools
/tools/
EMBL(European Melecular Biology Laboratory)
/embl/
DDBJ(DNA Data Bank of Japan)
http://www.ddbj.nig.ac.jp/index-e.html
GenBank
1982.4 由Los Alamos National Lab创建 NCBI (National Center for Biotechnology Information) NIH (National Institute of Health) 数据库查询工具:Entrez 数据提交工具: Sequin Nucleic Acids Research, 2008 Jan;36(Database issue):D25-30

UniProtKB
UniProt Knowledgebase(UniProtKB): Release 15.4 , 16-Jun-2009 ,包括:
Swiss-Prot Release 57.4 : 497293 entries TrEMBL Release 40.4 : 9145906 entries
ColiBri网址:/Colibri
TransFac网址:
B) 蛋白质序列二级数据库
Prosite (蛋白质序列功能位点数据库) 始建于 1990 年代初,由瑞典生物信息学研究所 SIB 负责维 护。 基于对蛋白质家族中同源序列多重序列比对得到的保守区 域,这些区域通常与生物学功能相关。 数据库包括两个数据库文件:数据文件Prosite;说明文件 PrositeDoc。
GenBank中测序最多的20个物种
v173.0,2009.09
Refseq
1. 提供高质量的,无冗余的,完整的序列 信息; 2. 包括基因组的DNA,转录成的RNA以及蛋 白质序列信息。 3. 序列文件的标识符:
mRNA序列:NM_001158 非编码RNA:NR_002769 蛋白质序列: NP_001159 /RefSeq/
三大核酸数据库之间的联系
二. 蛋白质序列数据库
蛋白质序列数据库
PIR
/
SwissProt
http://www.expasy.ch/sprot/
TrEMBL
http://www.expasy.ch/sprot/
PIR
1984年,蛋白质信息资源(Protein Information Resource,PIR)计划由美国 国家医学研究基金会(NREF)正式启动 1988年,日本的国际蛋白质信息数据库 (JIPID)和德国慕尼黑蛋白质序列信息中 心(MIPS)加入PIR 非冗余、高质量注释、全面分类
包含蛋白质序列全面的信息,提供准确、 丰富的序列与功能注释。 记录以6位字母和数字组成,例:Q5K8D3
Swiss-Prot Release 57.4
TrEMBL Release 40.4
UniRef
UniProt Refefence Clusters (UniRef) 通过CD-HIT算法把非常相似的序列聚类 根据序列Identity=100%,Identity>90%, Identity>50%进行聚类合并,形成 UniRef100、UniRef90和UniRef50三个子 库,加速同源搜索。 记录以UniRefXX开头加UniProtKB的 Accession表示,例:UniRef90_O70405
GenBank VS. RefSeq
EMBL
1982.3 由德国科隆大学收集整理 EBI(European Bioinformatics Institute) 数据库查询工具:SAS (开源) 数据提交工具:WebIn, Sequin /embl/
从GenBank中选择同一物种的核酸信息组 成的二级库
部分生物基因组计划网址
老鼠(Mouse) /mgd.html 小鼠(Rat) http://ratmap.gen.gu.se 狗(Dog) /dog.html 牛(Cow) http://locus.jouy.inra.fr/cgi-bin/bovmap/intro2.pl 猪(Pig) /pigmap/pigbase/pigbase.html 羊(Sheep) 鸡(Chicken) /chickmap/chickbase/manager.html 斑马鱼(Zebra fish) 线虫(C. elegans) http://www.ddbj.nig.ac.jp/htmls/celegans/html/CE_INDEX.html 果蝇(Drosophila) 蚊子(Mosquito) 拟南芥(Arabidopsis) /Arabidopsis 棉花(Cotton) 玉米(Maize) 水稻(Rice) http://www.staff.or.jp 大豆(Soya) :8000/main.html 树(Trees)
显示分子结构(RasMol , ChemView )
四. 基因组数据库
基因组数据库
收集某些生物整个基因组序列的数据库 基因组计划
Human Genome Project
/HGP/
C. elegans Project
/Projects/C_elegans/
生物分子数据库几个明显的特征:
(1)数据库的更新速度不断加快
数据量呈指数增长趋势
(2)数据库使用频率增长更快 (3)数据库的复杂程度不断增加 (4)数据库网络化 (5)面向应用
(6)先进的软硬件配置
建立分子生物信息数据库的流程图
一. 核酸序列数据库
三大核酸序列数据库
GenBank
/Genbank/index.html
UniProt
2002年在NIH资助下将PIR、Swiss-Prot和 TrEMBL合并为UniProt(Universal Protein Resource) 具有全世界最全面的蛋白质分类信息 包含三个子库
相关文档
最新文档