常用生物信息学数据库和分析工具网址
生物信息学常用数据库(已分类)

疟原虫属(Plasmodium)基因组 酵母基因组数据库(SGD) /Saccharomyces 酿酒酵母基因组 TIGR微生物数据库 /tdb/mdb/mdbcomplete.html
COMPEL http://compel.bionet.nsc.ru/ 复合调控元件(Composite regulatory elements)
CUTG http://www.kazusa.or.jp/codon/ 遗传密码使用表
DBTBS http://dbtbs.hgc.jp/ 枯草杆菌反式作用因子和启动子
ArkDB /sites.html 农业相关和其他动物的基因组数据库
综合的微生物资源(CMR) /tigr-scripts/CMR2/CMRHomePage.spl 已完成测序的微生物基因组
CropNet / 农作物基因组图谱
CyanoBase http://www.kazusa.or.jp/cyano/
Synechocystis sp.基因组
EMGlib http://pbil.univ-lyon1.fr/emglib/emglib.html 已完成基因组测序的细菌、古细菌、酵母
EcoGene /EcoGene/EcoWeb/ 大肠杆菌(E.coli)K-12的序列
帖子
441
积分
20
金币
339
贡献值 3 点
最后登录 10-5-10
名称 地址 说明
AceDB /Software/Acedb/ 线虫(C.elegans),酵母(S.pombe)的序列和基因组信息
AmmtDB r.it/mitochondriome/ 寄生虫(Metazoan)线粒体DNA序列
生物信息学数据库

欧洲生物信息学研究所完整基因组数据库/genomes/
欧洲生物信息学研究所序列数据库研究组/seqdb/index.html
加拿大生物信息学资源http://cbr-rbc.nrc-cnrc.gc.ca/index_e.php
这是加拿大生物信息学资源(CBR)的网站。该网站由加拿大国家研究委员会(NRC)创建,旨在为国家研究委员会与其它**、学术部门的科学家提供广泛使用的生物信息学工具和共享数据。加拿大生物信息学资源部分由一个专门使用该资源的委员会管理,而且其资源在用于教育和非盈利研究时只需注册均可免费作用。网站还提供有关新闻、服务与下载等信息。
法;PSI- BLAST用迭代型的剖面打分算法,每次迭代所费时间与前者相同,它可
检索弱同源的目标;PHI-BLAST 98年刚出台,是模体(Motif )构造与搜索软件
,是更灵敏的同源搜索软件。例如线虫的CED4是apoptosis 的调控蛋白,含有涉
及磷酸结合的P 环模体,在各种ATP 酶和GTP 酶中可发现。在用gapped BLAST搜
相似的功能。另有,按PHI- BLAST搜索在MutL DNA修复蛋白中的ATP 酶域,II型
拓扑异构酶,组氨酸激酶和HS90家族蛋白,发现一个新的真核蛋白族,共有HS90
型ATP 酶域。再有在古核tRNA核苷酸转移酶中发现核苷酸转移酶域,在细菌DNA
引物酶的古核同源体中发现螺旋酶超家族II的模体VI。用以往的搜索法这些是得
,稍有变化。expect简称E-value ,已经考虑了数据库的因素。其意义是:当用
咨询序列搜索一个数据库(如非冗余的SwissProt ,现有77419 条序列,共27864727
常用生物信息学数据库和分析工具网址

http://www.genome.ad.jp/dbget-bin/show man?pdb
KEGG release notes
http://www.genome.ad.jp/dbget-bin/show man?pathway
核苷酸数据库
GenBank
/
ftp:///genbank/gbrel.txt
dbEST summary report
/dbEST/dbESTsummarv.html
EMBL release notes
http://www.genome.ad.jp/dbget-bin/show man?embl
PDBSTR
http://www.genome.ad.jp
Prosite
/prosite
结构数据库
PDB
/pdb
NDB
/NDB/ndb.html
生物信息学常问的问题
/faq/
生物信息学机构
NCBI
/
International Nucleotide Sequence Database Collaboration.
/collab/
Mouse Genome Informatics
/bin/query_accession?id=MGI:97555
Saccharomyces Genome Database
/cgi-bin/dbrun/SacchDB?find+Locus+%22PGK1%22
http://www.genome.ad.jp/dbget-bin/show man?prf
PDBSTR release notes
生物信息学分析方法

跨膜结构域预测 TMHMM
http://www.cbs.dtu.dk/services/TMHM M-2.0/
蛋白互作网络 STRING
http://string.embl.de
polymerase
DNA repair
helicase
双序列比对 序列分析 多序列比对(系统进化树、保守基序) ORF(Open Reading Frame)分析 基因结构分析(外显子、内含子)
节律基因Timeless
数据库 MGI
/
数据库 NCBI
https:///Blast.cgi
数据库 TAIR
/
多序列比对 MEGA
/
LTR
MSA-like TGA-element
414
568 289
CCGAAA
CCCAACGGT AACGAC
low-temperature responsiveness
cell cycle regulation auxin-responsive element
转录因子结合位点分析 JASPAR
/
系统发育树 MEGA
/
保守基序分析 MEME
/tools/meme
基因结构 GSDS
http://gsds.cLeabharlann /
启动子分析 PlantCARE
基序名称 位置 序列特征 功能
常用的生物信息学 分析方法
第十组
生物信息学Bioinformatics
生物信息学是一门在生命科学的研究中,以计算机为工具 对生物信息进行储存、检索和分析的科学。 生物信息学基本上是分子生物 学与信息技术的结合体。
研究材料和结果是各种各样
的生物学数据 研究工具是计算机 研究方法包括对生物学数据的 搜索(收集和筛选)、处理 (编辑、整理、管理和显示) 及利用(计算、模拟)
常用生物信息学数据库(第一讲)

常用生物信息学数据库生物信息学基础入门第一讲常用生物信息学数据库(1学时)•生物信息学的简介、发展和应用•常用生物信息学数据库的概况•NCBI、UCSC数据库的介绍和使用第二讲癌症相关数据库(1学时)•癌症相关数据库的概况•TCGA数据库的介绍和使用•TCGA数据的下载和解读•TCGA数据的在线分析工具第三讲基因功能富集分析(1学时)•基因本体数据库GO及注释•生物学通路KEGG及注释•基因功能富集分析第四讲基因调节网络分析(1学时)•蛋白互作、转录因子调节关系数据库的介绍和使用•非编码RNA调节网络数据库的介绍和使用•基因网络图的展示、Cytoscape软件的介绍和使用第五讲基于公共数据库进行课题研究的案例分析(1.5学时)•实例讲解GEO数据的下载、处理和分析•实例讲解TCGA数据的下载、处理和分析这节课的主要内容•生物信息学的概念•生物信息学发展的背景•生物信息学的发展阶段•生物信息学的研究领域•常用生物医学数据库•NCBI: Gene、GEO•UCSC: Genome Browser、Table Browser生物信息学的概念生物信息学(bioinformatics),是在生命科学的研究中,利用计算机科学、信息技术、应用数学以及统计学方法对生物信息进行采集、处理、存储、传播、分析和解释的学科。
生物信息学发展的背景•人类基因组计划( human genome project, HGP)是由美国科学家Robert Sinsheimer 于1985年5月率先提出(但是当时美国NIH不感兴趣)。
•经过多位科学家的努力,终于将HGP提上美国政府预算,并于1990年正式启动。
•预计2005年(15年的时间),将人类基因组的DNA序列全部测定,把人体内约2.5万个基因的密码全部解开,同时绘制出人类基因的图谱。
•美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。
•我国于1999年7月加入人类基因组计划,得到完成人类3号染色体短臂上一个约30Mb区域(约3000万个碱基对)的测序任务,该区域约占人类整个基因组的1%,称之为“1%计划”。
常用生物信息学网址

常用生物信息学网址NCBI 生物信息学研究工具:/Tools/NCBI 生物信息学研究工具网站由美国国家生物技术信息中心支持。
该网站提供了许多程序的链接,内容包括数据挖掘、核酸和蛋白质组分析等。
同时,网站还提供了许多相关链接和资源。
欧洲生物信息学研究所:/欧洲生物信息学研究所是一个非盈利学术机构,是欧洲分子生物学实验室的一部分。
它是生物信息学研究和服务的中心。
它所管理生物数据的数据库包括核酸,蛋白质序列和大分子结构。
它的使命是保证从分子生物学和基因组研究的日益增长的信息向公众公开,并且对科学研究团体提供任何方面的免费使用,以促进科学发展。
欧洲生物信息学研究所Ensembl 基因组浏览器:ttp:///ensembl/index.html欧洲生物信息学研究所Thornton 研究组:/Thornton/index.html欧洲生物信息学研究所多序列联配数据库:/embl/Submission/alignment.html欧洲生物信息学研究所工具箱:/Tools/欧洲生物信息学研究所核酸数据库:/Databases/nucleotide.html欧洲生物信息学研究所计算基因组研究组:/research/CGG/index.html欧洲生物信息学研究所完整基因组数据库:/genomes/欧洲生物信息学研究所序列数据库研究组:/seqdb/index.htmlBrutlag 生物信息学研究组:/Brutlag 生物信息学研究组是斯坦福大学的一个研究团体,主要研究从蛋白质一级结构预测蛋白质结构和功能,其开发了EMOTIF 、EMATRIX 和3MOTIF 软件应用于非鉴定的基因组序列的功能确定,另外还开发了LOCK 和3DSEARCH 软件用于比较蛋白质结构和蛋白质结构数据库的搜索。
生物GBF 信息学小组主页:http://transfac.gbf.de/生物信息学小组主页是德国生物技术研究中心的生物信息组的主页。
生物信息学及常用工具简介

中心研究方向
基因组注释 芯片数据分析
与实验室密切相关 的研究和支持
为蛋白质组学研究提供 生物信息学支持
应用医学生物 信息学
基于本体论的数据仓库系统 基因组 转录组 蛋白质组 代谢组
主要内容
多序列联配(Alignment)和进化树分析 PCR引物及芯片探针的设计 使用软件在数据库中检索、收集、整理文献 BLAST应用简介 序列片段的拼接 基因注释:编码蛋白区域的预测 NCBI的数据库 代谢途径分析数据库(KEGG) 蛋白质分析数据库(uniprot) 比较基因组的方法 目标基因的分析流程
/outorder=order /tree /newtree=tree
♦ 蛋白质结构与功能预测
序列数据选取
1. 生物实验中获取或收集的相关基因或蛋白序列 2. 利用NCBI Entrez,SRS(Sequence Retrieve System)获 取序列 3. 利用同源搜索工具BLAST,从公共数据库中搜索与自身 相关序列
▼ Jackknife
不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。
▼ Permute
其目的与Bootstrap和Jackknife法不同,不常用。
为什么树不一致?
1、 数据选取不充分 2、基因或蛋白质序列选择 3、测序中序列错误 4、分析方法的选择
PHYLIP
PHYLIP ( Phylogeny Inference Package )(Joseph Felsenstein等,1986-1995)由华盛顿大学遗传系开发,1980 年首次公布,免费共享,包括35个独立程序,目前的版本是3.6。 下载地址: ftp:///pub/phylip/ 标准C语言开发,有Windows、 Macintosh,Linux/UNIX等版 本。 Windows: phylipw3.6source.exe、 phylipwx3.6executables.exe,
生物信息学二级数据库及数据库的格式

..125
Homo. Sapiens Medline4,. gluco- transcriptional TGT..
......
Corticoid regulator, ..
receptor
Fig 2.7 GenBank数据库的组织. 常被计算机检索程序ENTREZ利用。
2 EMBL序列格式
• The European Molecular Biology Laboratory(EMBL)序列 条目与GenBank类似,通过大量信息来描述每个序列。该 信息组织成一个个字段,每个字段有一个标识符。这些标 识符缩写成两个字母,某些字段还有次级字段。每行序列 后面的数字显示片断的位置。
BASE COUNT count of A, C, G, T and other symbols
ORIGIN
text indicating start of sequence
1 gaattcgata aatctctggt ttattgtgca gtttatggtt ccaaaatcgc
51 atatactcac agcataactg tatatacacc cagggggcgg aatgaaagcg
Prosite的网址:
/prosite/
3、蛋白质结构二级数据库
DSSP (Definition of Secondary Structure of Proteins) 蛋白质二级结构构象参数数据库 DSSP的网址:
http://www.cmbi.kun.nl/gv/dssp/
source range of sequence, source organism
misc_signal range of sequence, type of function or signal
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Eukaryotic promoter database
转录因子数据库
FRANSFAC
ooTFD
基因注释数据库
RAP-DB
基因分类数据库
Gene Ontology (GO)
蛋白质数据库
SWISS-PROT或TrEMBL
PIR
PRF
PDBSTR
Prosite
结构数据库
PDB
NDB
DNA-Binding Protein Database
EcoCyc
UM-BBD
多种代谢路径数据库
基因调控路径数据库(TRANSPATH)
基因组数据库
禾本科比较基因组
GrainGene
Botanical Data
日本水稻基因组(RGP)
水稻物理图谱
华大水稻基因组框架图
欧洲水稻测序(第12染色体)
OryGenesDB(水稻插入突变体)
Maize genome
常用生物信息学数据库和分析工具网址
数据库
因特网网址
网上生物信息学教程
EBI自修课程
NCBI自修课程
自修课程
生物信息学常问的问题
生物信息学机构
NCBI
International Nucleotide Sequence Database Collaboration.
EBI
USDA
Sanger Centre
粘菌(Dictyostelium)基因组
Animal genomes (ArkDB)
FlyBase
Mouse Genome Informatics
Saccharomyces Genome Database
多种基因组数据库
Rice Mutant Database
文献数据库
PubMed
OMIM
Agricola
BCM
EBI ClustalW
Clustal multiple sequence alignment
修饰对序列对位排列结果的格式(Boxshade)
系谱分析
PAUP
EBI ClustalW analysis
GCG package
PHYLIP
MEGA/METREE
Hennig86
GAMBIT
MacClade
Rice Genetics Newsletter
Proceedings of the NationalAcademy of SciencesUSA(PNAS)
关键词为基础的数据库检索
Entrez
Entrez Nucleotide Sequence Search
Entrez Protein Sequence Search
Batch Entrez
SequenceRetrieval System,India
SequenceRetrieval System,Singapore
SequenceRetrieval System,US
SequenceRetrieval System,UK
GetEntry Nucleotide & Protein Sequence Search
Predicting protein structures
其它分析工具和软件
BioEdit
Primer3(PCR引物设计)
Putative DNA Sequencing Errors Check
MatInspector
FastM
Web Signal Scan
BCM Search Launcher
Barley genome
Forage grasses genomes
Triticum genomes
Arabidopsis genome
SoyBase
Alfalfa genome
Cotton genome
Glycine max genome
C. elegans genome
藻类(Chlamydomonas)基因组
Glimmer
MZEF
Procrustes
Tandem Repeats Finder
Repeats
基因分类
GO Annotator
蛋白质结构预测分析
Expasy
CBS
Predicting protein secondary structure
Predicting protein 3D Structures
Phylogenetic analysis
ClustalX
MEGA
TreeView
基因结构预测分析
GENSCAN
GeneFinder
Gene Finding
Gene Feature Searches
Grail
GrailEXP
GeneMark
Veil
AAT
GENEID
Genlang
GeneParser
man?pdb
KEGG release notes
man?pathway
核苷酸数据库
GenBank
dbEST
dbSTS
dbGSS
Genome (NCBI)
dbSNP
HTGS
UniGene
EMBL核苷酸数据库
Genome (EBI)
向EMBL数据库提交序列
DDBJ
Plant R gene database
北京大学生物信息学中心
数据库信息发布及其它
GenBank Release Notes
dbEST summary report
EMBL release notes
man?embl
DDBJ release notes
relnote.html
Eukaryotic promoter database release notes
Database Search with Key Words
DBGET/LinkDB
序列为基础的数据库检索
BLAST
FASTA
BLITZ
SSearch
Electronic PCR
Proteome analysis
Global alignmce alignment
NMR Nucleic Acids Database
Protein Plus Database
Swiss 3Dimage
SCOP
CATH
酶、代谢和调控路径数据库
KEGG
Enzyme Nomenclature Database
Protein Kinase Resource (PKR)
LIGAND
WIT
SwissProt releasenotes
man?swissprot
PIR release notes
man?pir
PRF release notes
man?prf
PDBSTR release notes
man?pdbstr
Prosite release notes
man?prosite
PDB release notes