NCBI数据库及其资源的获取

【摘要】NCBI是美国的一个大型生物信息学系统，它主要通过NCBI网站为全世界的科学家服务，它拥有多种数据库查询工具，以及多种数据库分析资源，对于我们查询文献、人类基因组信息、基因表达、蛋白质结构、肿瘤遗传信息，以及不同种属遗传信息等等有非常大的帮助，是一个非常重要的生物医学资源。

【关键词】NCBI；数据库；检索

目前，有一些大型生物学数据库包含了众多的生物学资源，我们可以方便地从国际互联网上查询，不仅方便了思想和资料的交流，减少了许多重复性的工作，也提供了一种新的工作方式和思维方式，其中最常用的是美国的National Center forBiotechnology Information（NCBI）[1]。美国国家生物技术信息中心（NCBI）是美国国立卫生研究院（NIH）的国立医学图书馆（NLM）的一个分支。NLM 于1988年11月4日建立国家生物技术信息中心，简称NCBI。除了维护GenBank 数据库外，它还提供基于Gen-Bank和多种生物学数据库的检索和分析服务[2]。

1 NCBI的主要任务

NCBI为储存和分析分子生物学、生物化学、遗传学知识创建自动化系统；从事研究基于计算机的信息处理过程的高级方法，用于分析生物学上重要的分子和化合物的结构与功能；促进生物学研究人员和医护人员应用数据库和软件；努力协作以获取世界范围内的生物技术信息。

2 NCBI的计划

NCBI有一个多学科的研究小组包括计算机科学家，分子生物学家，数学家，生物化学家，实验物理学家，和结构生物学家，集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献，而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织，序列的分析，和结构的预测。目前研究计划的一些代表是：检测和分析基因组织，重复序列形式，蛋白domain 和结构单元，建立人类基因组的基因图谱，HIV感染的动力学数学模型，数据库搜索中的序列错误影响的分析，开发新的数据库搜索和多重序列对齐算法，建立非冗余序列数据库，序列相似性的统计显著性评估的数学模型和文本检索的矢量模型。另外，NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。

3 NCBI提供检索的服务

NCBI数据库的检索方法很简单，在检索框中输入检索词，检索词间默认逻辑关系为AND，通过下拉菜单选择记录的显示格式，通常选择GenBank Report

NCBI分子数据库介绍

NCBI分子数据库介绍信息来源：中国生命科学论坛更新时间：2003-10-12 2:33:00 核酸序列(nucleotides) ·Entrez核酸- 用accession number,作者姓名，物种，基因/蛋白名字，以及很多其它的文本术语来搜索核酸序列记录（在GenBank + PDB中）。更多的关于Entrez的信息见下。如果要检索大量数据，也可使用Batch Entrez （批量Entrez）。 ·RefSeq - NCBI数据库的参考序列。校正的，非冗余集合，包括基因组DNA contigs，已知基因的mRNAs和蛋白，在将来，整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 ·dbEST - 表达序列标签数据库，短的、单次（测序）阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 ·dbGSS -基因组调查序列的数据库，短的、单次（测序）阅读的cDNA序列，exon trap获得的序列，cosmid/BAC/YAC 末端，及其他。 ·dbSTS -序列标签位点的数据库，短的在基因组上可以被唯一操作的序列，用于产生作图位点。 ·dbSNP - 单核苷酸多态性数据库，包括SNPs，小范围的插入/缺失，多态重复单元，和微卫星变异。完整的基因组 ·参见Genome 和Maps 部分，包括各种物种资源，人，小鼠，大鼠，酵母，线虫，疟原虫，细菌，病毒，viroids，质粒。 ·UniGene - 被整理成簇的EST和全长mRNA 序列，每一个代表一种特定已知的或假设的人类基因，有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster 形式在Unigene 网页下载，完整的数据可以从FTP站点repository/UniGene 目录下下载。 1.奶牛UniGene 2.人类UniGene 3.小鼠UniGene 4.大鼠UniGene 5.斑马鱼UniGene ·BLAST - 将你的序列同核酸库中的的序列比较，检索相似的序列。（更详细的信息见下面Tools/Sequence 相似搜索部分）蛋白序列(proteins) · Entrez蛋白-用accession number,作者姓名，物种，基因/蛋白名字，以及很多其它的文本术语来搜索蛋白序列记录（在GenPept + Swiss-Prot + PIR + RPF + PDB中）。更多的关于Entrez的信息见下。如果要检索大量数据，也可使用Batch Entrez（批量Entrez）。

一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源随着ncbi数据库各种资源的涌现，NCBI已经成为科研工作者必不可少的资料查找，数据分析的工具。那么NCBI 数据如何使用，新手入门一步一步教你认识和使用NCBI数据库。一综合数据库 NCBI数据库集美国国立生物技术信息中心(National Center for Biotechnology Information)，即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI 的初衷是为了给分子生物学家提供一个信息储存和处理的系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库，其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外，NCBI还可以提供众多功能强大的数据检索与分析工具。目前，NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能，而且都可以在NCBI的主页https://www.360docs.net/doc/a71978142.html,上找到相应链接，其中多

半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强去年，NCBI对PubMed进行了几项改进工作，改动最大的是搜索界面和摘要浏览界面。其中，搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合)，并且增加了一个新的窗口，用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且，“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在，在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析，然后将符合条件的搜索结果排列到结果列表的顶端。另一个“内容传感器”是根据文章是否与用户给出的条件，例如是否与某种药物相关，在NCBI的新增数据库PubMed Clinical Q&A 中进行搜索，然后给出搜索结果。

NCBI_功能详细介绍[1]

GenBank Overview 基本信息 ?什么是GenBank？GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区（CDS）特征的注释，还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织，包括EMBL和DDBJ。 ?纪录样本- 关于GenBank的各个字段的详细描述，以及同Entrez搜索字段的交叉索引。 ?访问GenBank - 通过Entrez Nucleotides来查询。用accession number，作者姓名，物种，基因/蛋白名字，还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query 和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 ?增长统计- 参见公布通知的2.2.6（每个分类的统计），2.2.7（每个物种的统计），2.2.8（GenBank 增长）小节。 ?公布通知，最新- 最近和即将有的变化，GenBank的分类，数据增长统计，GenBank的引用。 ?公布通知，旧- 同上相同，是过去公布的统计。 ?遗传密码- 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。（向）GenBank提交（数据） ?关于提交序列数据，收到accession number，和对纪录作更新的一般信息。 ?BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。（请在提交前用VecScreen去除载体） ?Sequin - 提交软件程序，用于一条或者很多条的提交，长序列，完整基因组，alignments，人群/种系/突变研究的提交。可以独立使用，或者用基于TCP/IP的“network aware”模式，可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。（请在提交前用VecScreen去除载体）?ESTs - 表达序列标签，短的、单次（测序）阅读的cDNA序列。也包括来自于差异显示和RACE 实验的cDNA序列。 ?GSSs - 基因组调查序列，短的、单次（测序）阅读的cDNA序列，exon trap获得的序列，cosmid/BAC/YAC末端，及其他。 ?HTGs - 来自于大规模测序中心的高通量基因组序列，未完成的（阶段0，1，2）和完成的（阶段3）序列。（注意：完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。） ?STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列，用于产生作图位点。 ?注：SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中（dbSNP）。国际核苷酸序列数据库合作组织 ?GenBank，DDBJ，EMBL - 合作计划的概述，并链接到相应的主页。GenBank，DDBJ（DNA Data Bank of Japan），and EMBL （European Molecular Biology Laboratory）数据库共享的数据是每天都交换的，因此他们是相等的。数据纪录的格式和搜索方式可能会不一样，但是accession number，序列数据和注解都是一模一样的。即，你可以用accession number U12345在GenBank，DDBJ或EMBL中查找相应纪录，得到的结果是完全一样的序列数据，参考内容等等。 ?DDBJ/EMBJ/GenBank特性表—特性表格式和标准被合作数据库用在序列记录的注释上，使得数据共享成为可能，包括详细的描述生物特性和特性限定语的附录，以及IUPAC规定的核苷酸和氨基酸的代号。

教你如何使用NCBI

一步一步教你使用NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等作者：urbest 2007-8-1 苏州大学生命科学学院

最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST进行序列比对……，这些问题在NCBI上都可以方便的找到答案。现在我就结合我自己使用NCBI的一些经历（经验）跟大家交流一下BCBI的使用。希望大家都能发表自己的使用心得，让我们共同进步！我分以下几个部分说一下NCBI的使用： Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS查找已经公布的引物序列 Part four 如何运用BLAST进行序列比对、检验引物特异性特别感谢本版版主，将这个帖子置顶！从发帖到现在，很多战友对该帖给与了积极的关注，在此向给我投票的（以及想给我投票却暂时不能投票的）各位战友表示真诚的感谢，谢谢各位战友！请大家对以下我发表的内容提出自己的意见。关于NCBI其他方面的使用也请水平较高的战友给予补充 First of all，还是让我们从查找基因序列开始。第一部分利用Map viewer查找基因序列、mRNA序列、启动子（Promoter）下面以人的IL6（白细胞介素6）为例讲述一下具体的操作步骤 1．打开Map viewer页面，网址为：https://www.360docs.net/doc/a71978142.html,/mapview/index.html 在search的下拉菜单里选择物种，for后面填写你的目的基因。操作完毕如图所示： 2．点击“GO”出现如下页面：

怎么使用NCBI[1]

怎么使用NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心 [url]https://www.360docs.net/doc/a71978142.html,/[/url] NCBI是NIH的国立医学图书馆（NLM）的一个分支。 NCBI提供检索的服务包括： 1．GenBank（NIH遗传序列数据库）：一个可以公开获得所有的DNA序列的注释过的收集。GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库（EMBL和DDBJ）交换数据建立起数据库的。它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。其中的数据以指数形式增长，最近的数据为它已经有来自47000个物种的30亿个碱基。 2．Molecular Databases（分子数据库）： Nucleotide Sequence（核酸序列库）：从NCBI其他如Genbank数据库中收集整理核酸序列，提供直接的检索。 Protein Sequence （蛋白质序列库）：与核酸类似，也是从NCBI多个不同资源中编译整理的，方便研究者的直接查询。 Structure（结构）-——关于NCBI结构小组的一般信息和他们的研究计划，另外也可以访问三维蛋白质结构的分子模型数据库（MMDB）和用来搜索和显示结构的相关工具。MMDB：分子模型数据库—一个关于三维生物分子结构的数据库，结构来自于X-ray晶体衍射和NMR色谱分析。 Taxonomy（分类学）——NCBI的分类数据库，包括大于7万余个物种的名字和种系，这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学。 3．Literature Databases（文献数据库）（1）PubMed是NLM提供的一项服务，能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问，并可以连接到参与的出版商网络站点的全文文章和其他相关资源。（2）PMC/PubMed Center：也是NLM的生命科学期刊文献的数字化存储数据库，用户可以免费获取PMC的文章全文，除了部分期刊要求对近期的文章付费。（3）OMIM（孟德尔人类遗传）：有关人类基因和无序基因的目录数据库由Victor A.McKusick 和他的同事共同创造和编辑的，由NCBI网站负责开发，其中也包括对MEDINE众多资源和Entrez系统的序列记录，以及NCBI中其他有关资源的链接。

NCBI数据库集

NCBI数据库集生物信息学 2010-08-20 16:08:59 阅读202 评论0字号：大中小订阅 NCBI数据库集 https://www.360docs.net/doc/a71978142.html,/?p=20049 一综合数据库 NCBI数据库集美国国立生物技术信息中心（National Center for Biotechnology Information），即我们所熟知的NCBI是由美国国立卫生研究院（NIH）于1988年创办。创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统。除了建有GenBank核酸序列数据库（该数据库的数据资源来自全球几大DNA数据库，其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构）之外，NCBI还可以提供众多功能强大的数据检索与分析工具。目前，NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能，而且都可以在NCBI的主页https://www.360docs.net/doc/a71978142.html,上找到相应链接，其中多半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强去年，NCBI对PubMed进行了几项改进工作，改动最大的是搜索界面和摘要浏览界面。其中，搜索界面中新增了“Advanced Search”选项（这实际上是对以往“Limits”和“Preview/Index”功能的整合），并且增加了一个新的窗口，用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且，“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在，在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器（content sensors）”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析，

NCBI所有数据库简介

美国国家生物技术信息中心 (National Center of Biotechnology Information) 唐志立它的使命包括四项任务： 1. 建立关于分子生物学，生物化学，和遗传学知识的存储和分析的自动系统 2. 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的，先进方法的研究 3. 加速生物技术研究者和医药治疗人员对数据库和软件的使用。

山东师范大学 2016年4月10日星期日30则留学生经典笑话，英语不好伤不起！凭你在国内口语练得多么娴熟，去了国外，照样有犯痴呆傻的时候！ 1、有次房东问我：did u eat anyting yet? 我说：no. 她听后重复了一遍：so u didn‘t eat anyting. 我说：yes. 房东老太太犹豫了下又问：did u eat? 我说：no. 她接着说：so u didn‘t eat. 我说：yes. 估计她当时要崩溃了…… 2、刚上班不久，有个公司的A/R打电话来催支票，我循例问了一下他是哪间公司打来的，那男的很有礼貌的说：This is xxx calling from Beach Brother.

听懂了很开心，不过由于对公司名字还不熟，心想先用笔记下来公司名，省得等下忘记了，正得意忘形之间，顺嘴开始拼写人家公司的名字，还说得一本正经：b.i.t.c.h.bitch, correct? 那男的终于还是没能忍住怒火，近似于怒吼似的对我喊道：NO! B.E.A. C.H.BEACH! 接下来的一年里，没再跟这间公司有过任何生意往来…… 3、我男朋友以前在温哥华乘skytrain 的时候，一个白人女人说：I am sorry. 他直接说：you are welcome. 对方都呆了。 4、第一次跟老外去打painball，玩的是抢旗的那种。由于第一次玩，一直跟着个看起来很专业的队友跑，一路上躲着子弹跑到对方的base. 我们人都挂了，对方就剩一个人在看老家，就听那老外跟我说了一大堆术语，我

如何在ncbi上检索

如何在ncbi上检索NCBI包括五个部分，第一部分是欢迎进入NCBI，包括NCBI的最新信息、计划与活动、读者来信、服务地址和用户评论等。第二部分是基因序列数据库(GenBank)，包括基因库概述、检索与投稿。第三部分是数据库服务，包括免费的PubMed检索、Entrez 检索、BLAST序列族性检索、电子邮件服务(详见本章第四节)、匿名FTP服务。第四部分是NCBI的其它资源。GenBank的检索在NCBI主页的第二部分点击"Searching GenBank"，即可进入GenBank的检索屏幕。NCBI?提供了五种检索，即Entrez浏览检索、BLAST序列类似性检索、dbEST检索、dbSTS?检索和文本检索(Text Searching)。一、Entrez浏览检索1.Entrez检索的数据库及其检索信息Entrez浏览器(Entrez Browser)可以检索以下与NCBI?链接的基因序列数据库的分子生物数据和书目文献资料。???? (1) GenBank、EMBL、DDBJ中的DNA序列; ???? (2) SWISS-PROT、PIR、PRF、PDB中的蛋白质序列以及DNA序列数据库中翻译的蛋白质序列; ???? (3) 基因和染色体图像数据; ???? (4) PDB以及收入NCBI分子模型数据库(MMDB)的蛋白质三维结构; ???? (5) 通过PubMed检索Medline和PreMedline数据库。???? 2.Entrez检索功能???? Entrez提供了以下三种检索功能。 ?? (1)自由词检索功能??? 用户可以通过文本词、关键词、截词、期刊名或文献的作者检索Entrez数据库。截词用*号，期刊名必须用Medline刊名缩写，作者姓名必须是姓在前，名在后，用首字母缩写。????(2)索引词表(List Terms)检索功能 ????索引词表检索是当你键入检索词，Entrez?在你选定的字段中显示从该检索词开始的一个索引词表窗口，这时，你可以选择一个或几个词进行检索，这对单词拼写不准确时非常有用。?例如:在输入框中键入"P53"，选择文本字段(Text Words)和索引词表(List Terms)?检索功能，再点击"Search"，这时返回一个以"P53"开始的索引词表窗口，浏览选择一个或几个索引词，点击"Search"，Entrez将返回检索结果。 ????(3)自动检索功能 ????自动检索功能就是Entrez浏览器根据用户输入的检索式自动进行检索，返回当前检索式检出的文献数，如满意，可进一步取得检索结果，如不满意，则可对当前检索式进行修改，直到用户满意为此。例如在输入框键入"P53"，?选择所有字段和自动检索功能，?点击"?Search?"，?Entrez返回一个Web页，包括当前检出文献数、加词检索和修改当前检索三个部分。如果你对检出文献数不满意(过多或过少)，可以在加词检索部分增加更专指的检索词，以提高查准率，也可以在修改当前检索部分选择某一布尔算符(AND、OR、NOT、ANDNOT)，对当前的检索策略进行修改，直到你满意为止。 ????对于检出文献，用户可以选择浏览格式进行浏览，也可以打印或存盘。 ????3 Entrez检索规则 (1)Entrez支持"*"号截词检索; ? (2)Entrez对你键入的词可以进行逻辑识别。例如:键入"Lipman DJ Genomics"，Entrez将它识别为作者的姓名Lipman DJ和自由词?Genomics?，?并将提问式转换为"?Lipman ?DJ?"?AND Genomics。对于Entrez不能识别的提问式，如bac 1，必须加双引号，?系统就会将它们作为一个词进行检索; (3)Entrez支持复杂的布尔逻辑检索; (4)Entrez支持限定字段检索; 字段标识符的全称如下: WORD=Text Word, TITL=Title Word,