Gene Ontology(GO)简介与使用介绍

合集下载

gene ontology(GO基因注释)

gene ontology(GO基因注释)

GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,堆积因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准.GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能.基因本体论(gene ontology)的建立现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。

这种情况归结为生物学上定义混乱的原因:不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。

举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人中蛋白质合成组分显著不同的。

但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为“蛋白质合成类”,那么这无疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。

Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。

这个项目最初是由1988年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库Drosophila),t Saccharomyces Genome Database (酵母基因组数据库SGD) and the Mouse Genome Database(小鼠基因组数据库MGD)。

从那开始,GO不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。

GO的定义法则已经在多个合作的数据库中使用,这使在这些数据库中的查询具有极高的一致性。

这种定义语言具有多重结构,因此在各种程度上都能进行查询。

举例来说,GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物地受体酪氨酸激酶。

这种结构允许在各种水平添加对此基因产物特性的认识。

基因本体论(go)功能注释 gene ontology annotation

基因本体论(go)功能注释 gene ontology annotation

基因本体论(go)功能注释 gene ontologyannotation基因本体论(Gene Ontology,简称GO)是一种用来描述基因功能的标准化系统。

GO的功能注释则是使用GO术语为基因或蛋白质序列进行注释,帮助科学家理解生物体内基因的功能和相互关系。

本文将介绍基因本体论(GO)的概念和作用,以及基因本体论功能注释的流程和应用。

一、基因本体论(GO)的概念和作用基因本体论(GO)是一种标准化的词汇系统,用于描述基因和蛋白质的功能、过程和组件。

GO包含三个主要的本体:分子功能(Molecular Function)、生物过程(Biological Process)和细胞组件(Cellular Component)。

每个本体都包含一系列术语和相应的定义,科学家可以根据这些术语和定义来描述基因的功能。

基因本体论的作用是帮助科学家对基因和蛋白质进行分类和理解。

通过将基因和蛋白质注释到GO术语上,科学家可以更准确地了解它们的功能、参与的生物过程以及位于细胞的哪个组件。

这对于研究基因的功能以及疾病的发生和发展有着至关重要的意义。

二、基因本体论功能注释的流程基因本体论功能注释是指将基因或蛋白质序列与基因本体论术语进行关联的过程。

下面是一般的基因本体论功能注释流程:1.数据预处理:获取待注释基因或蛋白质的序列数据,排除冗余数据和噪音数据。

2.基因本体论术语获取:从基因本体论数据库中获取相应的术语,包括分子功能、生物过程和细胞组件。

3.序列比对:将待注释的基因或蛋白质序列与已知序列进行比对,找出相似序列。

4.注释:根据序列比对的结果,将相似序列的注释信息转移到待注释序列上。

5.术语关联:根据注释信息,将待注释基因或蛋白质与相应的基因本体论术语进行关联。

6.结果验证:对注释结果进行验证和统计分析,评估注释的准确性和可靠性。

三、基因本体论功能注释的应用基因本体论功能注释在生命科学研究中有着广泛的应用。

以下是一些常见的应用领域:1.基因功能研究:通过注释基因的功能,科学家可以更好地理解基因在细胞中的作用,从而揭示生物体内复杂的生物过程。

GO功能注释

GO功能注释

GO功能注释⽂章转载于 Original 2017-06-12 liuhui ⽣信百科相似的基因在不同物种中,其功能往往保守的。

显然,需要⼀个统⼀的术语⽤于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极⼤限制学术的交流。

⽽ Gene Ontology (GO) 项⽬正是为了能够使对各种数据库中基因获基因产物功能描述相⼀致的努⼒结果。

所谓的 GO,是⽣物学功能注释的⼀个标准词汇表术语(GO term),将基因的功能分为三部分:基因执⾏的分⼦功能(Molecular Function)基因所处的细胞组分(Cellular Component)基因以及参与的⽣物学过程(Biological Process)不同的 GO term 通过有向⽆环图关联起来,如下图所⽰:可以看出,不同的 GO term 间的关系由三类:is_a、part_of和regulates。

如regulation of cell projection assembly是⼀种⽣物学过程,是regulation of cell projection organization中的⼀类(is_a),还调节(regulates)cell projection assembly;⼜如cellular component assembly是celluar component biogenesis的⼀部分(part_of)。

值得注意的是,这些关系都是有⽅向的,即反过来不成⽴,因⽽叫做有向⽆环图。

⽬前,GO 注释主要有两种⽅法:(1)序列相似性⽐对(BLAST)(2)结构域相似性⽐对(InterProScan)这⾥以序列相似性⽐对为例,简单介绍 GO 注释的步骤:将基因序列与 swiss-prot 蛋⽩质数据库进⾏ BLAST (blastp 或者 blastx,这篇⽂章介绍了如何做 BLAST 分析:)⽐对,得到如下结果:c49_g1_i1 RNF13_MOUSE 52.00 50 23 1 17 166 240 288 2e-11 65.5c72_g1_i1 RS25_NEUCR 78.72 94 20 0 375 94 1 94 1e-32 116c75_g1_i1 POLX_TOBAC 45.28 53 29 0 162 4 457 509 1e-08 55.1c86_g2_i1 POLX_TOBAC 46.43 112 60 0 339 4 879 990 2e-30 120c91_g1_i1 BUB1_ARATH 55.71 70 28 2 61 264 289 357 1e-14 73.6c143_g1_i1 STL1_YEAST 31.98 172 85 4 6 518 407 547 6e-17 82.8c150_g1_i1 CST26_YEAST 37.63 93 38 3 223 5 142 234 6e-10 58.2c150_g2_i1 YHOE_SCHPO 42.67 75 41 1 227 3 54 126 5e-16 74.7c156_g2_i1 EXOL2_ARATH 47.17 53 28 0 299 141 229 281 6e-06 47.0c169_g1_i1 SPT5_ASPFU 60.98 82 31 1 20 262 725 806 2e-18 84.0其中,第⼆列 swiss-prot 蛋⽩质数据库序列的 ID(UniProtKB ID)。

gene?Ontology?(基因本体论)

gene?Ontology?(基因本体论)

gene Ontology (基因本体论)gene ontology为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,更糟糕的是,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样,这让信息查找更加麻烦,尤其是使得机器查找无章可循。

Gene Ontology就是为了解决这种问题而发起的一个项目。

Gene Ontology中最基本的概念是term。

GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term 名,比如"cell", "fibroblast growth factor receptor binding",或者"signal transduction"。

每个term都属于一个ontology,总共有三个ontology,它们分别是molecular function, cellular component 和biological process。

一个基因product可能会出现在不止一个cellular component里面,也可能会在很多biological process里面起作用,并且在其中发挥不同的molecular function。

比如,基因product "cytochrome c" 用molecular function term描述是"oxidoreductase activity",而用biological process term描述就是"oxidative phosphorylation"和"induction of cell death",最后,它的celluar component term是"mitochondrial matrix"和"mitochondrial inner membrane"。

表达谱数据的 GO分析和聚类分析

表达谱数据的 GO分析和聚类分析

表达谱数据的 GO分析和聚类分析王琼萍上海交通大学GO(gene ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库。

GO 是多种生物本体语言中的一种,旨在建立一个能阐释各种物种的基因以及基因产物。

这个数据库最开始起源于三个模式生物的数据库:果蝇基因组数据库(Drosophila)、酵母基因组数据库(Saccharomyces Genome Database,SGD)、小鼠基因组数据库(Mouse GenomeDatabase,MGD)。

在这之后,在基因本体联合会成员的努力下,将GO 数据库扩展到了植物、动物、微生物等世界范围内各个主要的数据库。

GO 数据库建立了具有三层结构的定义方式来描述基因及其产物的生物学过程、细胞组分及分子功能,对不同信息源的信息进行整合,以DAG(有向无环图)结构组织起来作为多个分支,节点的高低也代表了每个节点的意义的广泛程度。

每个父项(parent terms)下包含若干子项(children terms),分支越远,匹配的GO 条目就越具体。

在这个层级结构中,一个生物学注释可以由一个基因集表示。

这个数据库的建立为基因功能数据挖掘提供了新的思路。

一套基因本体,其实也就是一套基因的树状结构。

GO 数据库及其序列分析程序的问世,使得差异基因的功能分析变得更加高效、准确。

目前,已经有很多可以供畜牧研究者免费使用的GO资源,如AmiGo,它可以分析一个基因的GO 术语,也可以分析多个基因。

另外,还有Onto express、DAVID、Gostat 等。

差异基因的GO 分析关键在于利用统计学方法进行基因富集,常用的方法是Fisher 的精确概率法或卡方检验。

Fisher 的精确概率法利用超几何分布(hypergeometric distribution)的原理推断每个基因集中差异表达基因的比例是否与整个基因芯片上差异表达基因的比例相同。

差异基因go注释

差异基因go注释

差异基因go注释差异基因是指在不同生物体或者同一生物体不同组织、不同发育时期以及在不同条件下表达水平发生明显变化的基因。

这些差异基因的研究对于深入理解生物体的发生发展、适应环境变化以及疾病的发生机制具有重要意义。

为了更好地理解差异基因的功能,科研人员常常对差异基因进行GO(Gene Ontology)注释。

GO注释是一种常见的功能注释方法,它根据基因的功能特征将其分类并进行注释。

GO注释基于GO数据库,该数据库将基因功能划分为三个主要方面:生物学过程(Biological Process)、分子功能(Molecular Function)和细胞组分(Cellular Component)。

通过GO注释,可以为差异基因的功能特征提供详细的描述和分类,从而为后续的生物信息分析和研究提供基础。

在进行差异基因GO注释之前,首先需要进行差异分析。

差异分析是通过比较不同样本间基因表达水平的差异,筛选出差异显著的基因。

差异分析常用的方法包括t检验、方差分析和基因表达差异倍数筛选等。

这些方法可以帮助我们确定哪些基因是差异表达的,为后续的功能注释提供基础。

差异基因GO注释的流程通常包括以下几个步骤:1. 数据准备:准备进行差异基因GO注释所需的数据,包括差异基因表达矩阵和差异基因列表。

2. GO数据库下载:从相应的数据库中下载最新的GO注释文件,常用的数据库包括Gene Ontology Consortium、UniProt和NCBI等。

3. 数据筛选和预处理:根据差异基因列表,筛选出在GO数据库中存在注释信息的基因。

4. GO注释:将差异基因与GO数据库中的功能项进行匹配,得到差异基因的功能注释信息。

5. GO富集分析:对差异基因的功能注释信息进行统计分析,找出在某个功能项上显著富集的基因集合。

6. 结果展示:将GO注释和GO富集分析的结果进行整理和可视化展示,方便研究人员进行进一步的分析和解读。

当然,差异基因GO注释的具体方法和流程还需要根据实际研究的需求和数据情况进行调整和优化。

go基因注释与功能分类

go基因注释与功能分类
第一节 引 言
背景
随着后基因组 (post-genomics) 时代的来临,基因组学的研究 重心开始从阐明所有遗传信息转移到在整体分子水平对功能进行 研究。这种转变的一个重要标志是产生了功能基因组学 (functional genomics)。
任务
功能基因组学的主要任务之一是进行基因组功能注释 (genome annotation),了解基因的功能,认识基因与疾病的关 系,掌握基因的产物及其在生命活动中的作用等。
举例

这里以检索神经源性分化因子6(NEUROD6)为例。在检索框 中输入“NEUROD6”并勾选“gene and proteins”和“exact match”,运行后所得基因产物检索结果如图所示。
此图显示了该基因产物的基本信息,包括类型、物种、 别名来源和序列
人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》
KEGG数据库的改进与更新

KEGG PATHWAY 还存储了一些人类疾病通路数据,这些 疾病通路被分为六个子类:癌症、免疫系统疾病、神经退行 性疾病、循环系统疾病、代谢障碍、传染病循环系统疾病。 KEGG DRUG数据库也在不断地完善,其中的药物数据几乎 涵盖了日本的所有非处方药和美国的大部分处方药品 。 DRUG 是一个以存储结构为基础的数据库,每条记录都包含 唯一的化学结构以及该药物的标准名称,以及药物的药效、 靶点信息、类别信息等。药物的靶点通过KEGG PATHWAY 查询,药物的分类信息是KEGG BRITE数据库的一部分,通 过药物的标准名称可以找到该药物的商品名,还可以找到药 物销售的标签信息。此外,DRUG还包括一些天然的药物和 中药的信息,有些药物被日本药典所收录。

富集分析中常用的统计方法有累计超几何 分布、Fisher精确检验等。

go通路基因提取

go通路基因提取

Go通路基因提取1. 简介Go通路(Gene Ontology)是一种用于描述基因功能、组成和定位的标准化词汇表。

它由三个主要部分组成:分子功能(Molecular Function)、生物过程(Biological Process)和细胞组分(Cellular Component)。

通过对基因进行Go通路注释,可以帮助研究人员理解基因在细胞中的功能以及其在生物过程中的作用。

本文将介绍如何从已有的基因表达数据中提取与Go通路相关的基因,并进行进一步分析和解释。

2. 数据准备在进行Go通路基因提取之前,我们需要准备以下数据:•基因表达数据:可以是RNA-seq或microarray等技术得到的表达矩阵,其中每行代表一个基因,每列代表一个样本。

•Go通路注释文件:包含了每个基因对应的Go通路信息。

3. 提取Go通路相关基因3.1 数据预处理我们需要对基因表达数据进行预处理。

常见的预处理步骤包括去除低表达基因、归一化、批次效应校正等。

这些步骤可以根据具体需求选择性地进行。

3.2 基因筛选根据Go通路注释文件,我们可以筛选出与特定Go通路相关的基因。

一种常见的方法是使用基因集富集分析工具,如GSEA(Gene Set Enrichment Analysis)或DAVID(Database for Annotation, Visualization and Integrated Discovery)。

这些工具可以根据统计学方法判断哪些基因集在给定的样本中显著富集。

3.3 结果解释通过基因筛选后,我们可以得到与特定Go通路相关的基因列表。

这些基因可能在某种生物过程中起着重要的作用。

进一步分析这些基因的功能和相互关系,可以帮助我们理解该生物过程的机制。

4. 结果可视化为了更好地理解和展示提取到的Go通路相关基因,我们可以使用各种可视化工具。

以下是一些常用的可视化方法:•热图:用于显示不同样本中基因表达水平的差异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

AmiGO from BDGP 在 AmiGO 中,可以通过查询一个 GO 术语而得到所有具有这个注释的基因产物,或查询一 个基因产物而得到它所有的注释关系。还可以浏览本体论,得到术语之间的关系和术语对应的基因产物数目。AmiGO 直接连接 GO 下的 MySQL。
MGI GO Browser MGI GO 的功能类似于 AmiGO,所不同的在于它所得到的基因为小鼠基因。MGI GO 浏览器直 接连接 GO 下的 MGI 数据库。
2.GO 的发展和组织形式
GO 发展了具有三级结构的标准语言(ontologies),根据基因产物的相关分子功能,生物学途径,细胞学组件而 给予定义,无物种相关性。三种本体论的内容如下:
1)分子功能本体论 基因产物个体的功能,如与碳水化合物结合或 ATP 水解酶活性等
2)生物学途径本体论 分子功能的有序组合,达成更广的生物功能,如有丝分裂或嘌呤代谢等
2)修改器
GO 术语和本体论结构可以由任何可以读入 GO 平板文件的文本修改器进行编辑,但是这需要对平板文件非常熟 悉。因此,DAG-Edit 是被推荐使用的,它是为 GO 特别设计的,能够保证文件的句法正确。GO 注释可以被多种数据 库特异性的工具所编辑,如 TIGR 的 Manatee 和 EBI 的 Talisman tool。但是 GO 数据库中写入新的注释是需要通过 GO 认证的管理员方可进行的,如果想提出新的注释或对本体论的建议,可以联系 GO。 主要修改器为 DAG-Edit 和 COBrA。DAG-Edit 基于 Java 语言,提供了能浏览、查询、编辑具有 DAG 数据格式 的 GO 数据界面。在 SourceForge 可以免费下载,伴随着帮助文件。COBrA 能够编辑和定位 GO 和 OBO 本体论。它 一次显示两个本体论,因此可以在不同的水平相应定位。(如组织和细胞类型水平)优点在于可以综合几种本体论,支 持的文件格式多,包括 GO 平板文件、GO RDF 和 OWL 格式等。
5.GO 文件格式
GO 的所有数据都是免费获得的。GO 数据有三种格式:flat(每日更新)、XML(每月更新)和 MySQL(每月更 新)。 这些数据格式都可以在 GO ftp 的站点上下载。XML 和 MySQL 文件是被储存于独立的 GO 数据库中。
如果需要找到与某一个 GO 术语相关的基因或基因产物,可以找到一个相应表格,搜寻到这种注解的编号,并且 可以链接到与之对应的位于不同数据库的基因相关文件。
4)如何得到由 GO 术语注解的蛋白序列?
在 GO 网页上选择能查询到所有数据库的 Amigo 浏览器,键入 GO 术语(如“线粒体”),在结果中显示了被注 释的基因。然后选择你所需基因,在网页的最低端把选项拖至“get fasta sequence”区域,再确定即可。 5)如何能够找到所有和一个特定的 GO 术语相关的人类基因呢?
Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。这个项目最初是 由 1988 年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库 Drosophila),t Saccharomyces Genome Database (酵母基因组数据库 SGD) and the Mouse Genome Database (小鼠基因组数据库 MGD)。从那开始,GO 不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。 GO 的定义法则已经在多个合作的数据库中使用,这使在这些数据库中的查询具有极高的一致性。这种定义语言具 有多重结构,因此在各种程度上都能进行查询。举 例来说,GO 可以被用来在小鼠基因组中查询和信号转导相关的基因 产物,也可以进一步找到各种生物地受体酪氨酸激酶。这种结构允许在各种水平添加对此基因产 物特性的认识。
GO 对基因和蛋白的注释阐明了基因产物和用于定义他们的 GO 术语之间的关系。基因产物指一个基因编码的 RNA 或蛋白产物。因为一个基因可能编码多个具有很不相同性质的产物,所以 GO 推荐的注释是针对基因产物的而不 是基因的。一个基因是和所有适用于它的术语联系在一起的。
一个基因产物可以被一种本体论定义的多种分支或多种水平注释。注释需要反映在正常情况下此基因产物的功 能,生物途径,定位等,而并不包括其在突变或病理状 态下的情况。GO 联合会的各个数据库成员采用手动或自动的方 式生成注释,这两种方式共有的原理是:一.所有的注释都需要有来源,可以是文字、另一个数据库 或是计算机分析结 果;二.注释必须提供支持这种基因产物和 GO 术语之间联系的证据。
3)细胞组件本体论 亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等
基本来说,GO 工作可分为三个不同的部分:第一,给予和维持定义;第二,将位于不同数据库中的本体论语言、 基因和基因产物进行联系,形成网络;第三,发展相关工具,使本体论的标准语言的产生和维持更为便捷。
3.GO 的形式
GO 定义的术语有着直接非循环式(directed acyclic graphs (DAGs)的特点,而并非是传统的等级制定义方式 (随着代数增加,下一级比上一级更为具体)。举个例子来说,生物学途径中有一个定义是己糖合成,它的上 一级为 己糖代谢和单糖合成。当某个基因被注解为“己糖合成活性”后,它自动地获得了己糖代谢和单糖合成地注解。因为在 GO 中,每个术语必须遵循“真途径 “法则,即如果下一代的术语可以用于描述此基因产物,其上一代术语也可以适 用。
Gene Ontology(GO)简介与使用介绍
1.GO 怎么就出现了?
现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。这种情况归结为生物学上定义混乱的原因:不光 是精确的计算机难以搜寻到这些随时间和人为多重因 素而随机改变的定义,即使是完全由人手动处理也无法完成。举 个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相 关的基因产物, 特别是那些和人中蛋白质合成组分显著不同的。但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为 “蛋白质合成类”,那么这无 疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。
6.GO 浏览器和修改器(browser and editor)
GO 术语和注释使用了多种不同的工具软件,它们都可以在 web 方式的“GO 浏览器”下“GO software page”中找到。大多数 GO 浏览器都是 web 模式的,允许你直观的看到术语和其相关信息,如定义、同义词和数据库 参考等。有些 GO 浏览器如 AmiGO 和 QuickGO,可以看到每个术语的注释。而可下载的 DAG-Edit 编辑器,一样可以 离线地显示注释和所有本体论定义的信息。对于每一个浏览器来说,都可以选择最适用于你要求的工具软件。 1)常见的三种浏览器
3) DAG 浏览器
DAG 浏览器是一个插件,能够以图形的方式展示具有复杂的从属关系的术语。
4) 搜寻/屏蔽面板
可搜寻术语、术语类型和术语间关系。可自定义屏蔽条件,限制得出的搜寻结果。
7.GO 数据库的查找和浏览 FAQ
1)如何搜寻注释?
使用 AmiGO 浏览器,可以在所有参与的数据库中搜寻一个特定的注解。AmiGO 允许使用 GO 术语或基因产物的 搜寻。搜寻结果包括 GO 对这个术语的等级分级情况,定义和近义结构,外部链接,所有相联系的基因产物和它的下一 级术语。 2)如何得到全部的 GO 注释?
EP GO Browser(EBI,基因表达情况),、GoFish (Harvard,Boolean 查询、GenNav(NLM, 图像化展示)、 GeneOntology@RZPD (RZPD,UniGene)、ProToGO (Hebrew University,GO 的亚图像化)、CGAP GO Browser (癌症基因组解剖工程,癌症)、GOBrowser (Illuminae,perl.、TAIR Keyword Browser (TAIR,拟南 芥)、PANDORA (Hebrew University,非一致化蛋白)。
GO 术语是和 SWISS-PROT/TrEMBL/InterPro and Ensembl 中的蛋白序列无赘余地对应的。这些注释在 EBI 上 的 GOA-Human 文件中,GO 的 FTP 站点上,Ensembl,EMBL-Bank 上都可找到。
6)可以直接使用 GenBank 的 gi 获取码在 GO 数据库中进行查询吗? GO 数据库中除了 Compugen 所提供的 GenBank 获取码之外,没有包含其他 GenBank 获取码的信息,但是在 EBI 的 GOA(GO Annotation)中,有一个综合的对 GenBank/EMBL/DDBJ 进行查询的方式,详细请见:ftp: ///pub/databases/GO/goa/HUMAN/xrefs.goa. 7)GO 与其他分类系统的定位关系(Mapping to GO)
在 GO 网站上,基因产物与 GO 联系的组信息都有提供。这些文件储存了基因/基因产物的 ID 和引用文献等支持 证据(如 FlyBase 基因 ID, SWISS-PROT 蛋白 ID),在 ftp 站点上都可以获得。
3)在一些模式生物中,一个基因通常有多个与之相关的核苷酸序列,如 EST、蛋白序列等。要查询到这些序列,可 以从该模式生物数据库中通过基因联系(gene association)查询到基因获得 ID(gene accession ID),或是分别在 Compugen 中查询大的转录产物(transcipt)和 SWISS-PROT/TrEMBL 中查询蛋白。
如图为 DAG-Edit 的界面,可以分为四个部分:
1) 定义编辑面板(term editor panel)
显示当下的本体论。也是主要的编辑本体论结构的工具,可以通过点击和拖动术语来修改本体论的从属关系。
2) 文本编辑面板(text editor panel)
相关文档
最新文档