基因注释与功能分类

合集下载

云南牛蛭部分基因注释及功能分类

云南牛蛭部分基因注释及功能分类
o dcl c ne, u nnK n ig6 0 1 C ia3 F rsSai u nnPoic hnin oa , u nnZ exog6 70 C ia f Meia Si csY n a u m n 5 18,hn ;. o t ttni Y n a rv eZ ex gR k n Y n a hnin 5 20,hn ) e e o n n o
An o a i n a d F n t n lCl si c t n o a t lGe e r m n t t n u c i a a sf a i fP r i n s f o o o i o a
yu an n i. s nn e ss p.No n nn o i c v i Yu an Pr v n e
昆 顷 学 院 学 报
2 1 , 3 3 :6— 9 0 1 3 ( )8 8
CN 5 —1 1 / 1 ;N 1 7 3 2 1 G4 8S 6 4-5 3 69
J u n lo n n ie st o r a fKu ml gUnv riy
云 南 牛 蛭 部 分 基 因 注 释 及 功 能 分 类
WANG B n ’ T i‘ ONG Xi n —o g , a g t n HU n — a 3 W A Yo g h n , NG . i De b n

( . eatet f i c neadT cnl y K n n nvrt, u nnKumig 5 2 4 C i ;.ntu f dcl i oy C ieeA ae 1 D pr n o f Si c n eh o g , umigU i sy Y n a n n 0 1 , hn 2 Istt o ia Bo g ,hns cdmy m Le e o ei 6 a i e Me l

基因本体论(go)功能注释 gene ontology annotation

基因本体论(go)功能注释 gene ontology annotation

基因本体论(Gene Ontology,简称GO)是一个标准化的功能分类体系,用于描述基因和基因产物的属性。

GO注释是将基因或基因产物的功能与GO术语相关联的过程。

在GO注释中,基因或基因产物的功能被归类到三个主要的本体论分支中:生物过程(Biological Process)、细胞组分(Cellular Component)和分子功能(Molecular Function)。

每个分支都包含一系列定义明确的术语,这些术语描述了基因或基因产物在细胞中的不同角色和活动。

生物过程分支涵盖了基因或基因产物参与的生物学过程,例如代谢、细胞周期、信号传导等。

细胞组分分支描述了基因或基因产物在细胞内的位置,如细胞核、细胞膜、细胞器等。

分子功能分支则描述了基因或基因产物在分子水平上的活动,如催化活性、结合活性等。

GO注释是基于实验证据和计算预测进行的。

实验方法包括基因突变分析、基因表达研究、蛋白质互作分析等,而计算预测则利用生物信息学工具和算法对基因或基因产物的功能进行预测。

通过GO注释,我们可以更深入地理解基因和基因产物的功能,以及它们在生物体中的相互作用和调控机制。

这些信息对于研究疾病的发病机理、药物设计和基因治疗等领域具有重要意义。

基因注释与功能分类

基因注释与功能分类

举例
这里以检索神经源性分化因子 (NEUROD6)为例。在检索框 神经源性分化因子6( ) 中输入“NEUROD6”并勾选“gene and proteins”和“exact ”,运行后所得基因产物检索结果如图所示。 match”,运行后所得基因产物检索结果如图所示。
此图显示了该基因产物的基本信息,包括类型、物种、 此图显示了该基因产物的基本信息,包括类型、物种、 别名来源和序列
任务
功能基因组学的主要任务之一是进行基因组功能注释 (genome annotation),了解基因的功能,认识基因与疾病的关 系,掌握基因的产物及其在生命活动中的作用等。
意义
快速有效的基因注释对进一步识别基因,研究基因的表达调 控机制,研究基因在生物体代谢途径中的地位,分析基因、基因 产物之间的相互作用关系,预测和发现蛋白质功能,揭示生命的 起源和进化等具有重要的意义。
此图上部先对神经源 性分化因子6的相关 性分化因子 的相关 信息做简单描述, 信息做简单描述,中 术语系谱( 间术语系谱(term lineage)成阶梯状分 ) 记录了GO数据 布,记录了 数据 库中全部分子功能所 处的位置和关系。 处的位置和关系。下 方“External Reference”提供了与 提供了与 外部相关数据的链接。 外部相关数据的链接。
GO数据库收录的基因组数据列表 数据库收录的基因组数据列表 GO数据库最初收录的基因信息来源于3个模式生 物数据库:果蝇 、 酵母和小鼠 果蝇、 果蝇 酵母和小鼠,随后相继收录了 更多数据,其中包括国际上主要的植物,动物和 微生物基因组数据库。 GO术语在多个合作数据库中的统一使用,促进了 各类数据库对基因描述的一致性。
其中排在第一位的是人类 基因“PGM1”的相关信息, 基因“PGM1”的相关信息, 点击该条目进入到详细信 息页面。 该页面以表格的形式列出 了该基因有关的详细信息, 包括基因编号,基因的详 细定义,所编码的酶的编 号,基因所在通路,以及 序列的编码信息。同时, 在页面的右侧还提供了该 基因在其他分子生物学数 据库的链接,如OMIM、 据库的链接,如OMIM、 NCBI、GenBank等。 NCBI、GenBank等。

生物信息学中的基因功能注释技术

生物信息学中的基因功能注释技术

生物信息学中的基因功能注释技术生物信息学是一门快速发展的交叉科学,它综合了计算机科学、统计学、电子工程学、生物学等多个学科的知识,被广泛应用于生物组学、基因组学研究等领域。

基因功能注释是生物信息学中一个重要的领域,它可以帮助科学家破解基因的功能以及影响机制,对于解决生命科学中的一系列问题起到了至关重要的作用。

一、基因功能注释技术概述基因功能注释是对基因和蛋白质的功能进行解读和注释的过程。

通过解读和注释基因和蛋白质的功能,人们可以研究它们在生物发育、疾病发生和进化等方面的作用,进而促进生命科学的相关研究。

基因注释通常包括DNA序列注释、RNA序列注释和蛋白质注释三类内容。

DNA序列注释指的是对DNA序列进行注释,包括基因的组成结构、转录因子结合位点、启动子等信息的鉴定;RNA序列注释是通过解读RNA序列,分析RNA的结构和功能,推断RNA在细胞内的功能和调控机制;蛋白质注释是通过预测、比对、结构和功能预测等手段对蛋白质进行注释,以揭示其功能、特征和调控机制。

基因注释技术的发展使得人们能够更好地理解生物分子和生物系统的复杂性。

二、基因注释技术的主要方法1. 基于比对的注释方法比对是最常见的基因功能注释方法之一。

比对方法主要是将待注释的序列与已知注释的序列进行比对,比对的基础中包括蛋白质序列、ncRNA序列、基因组序列等,通过比对可以快速、准确地找到相似的序列及其相应的注释信息。

常用的基于比对的注释方法包括BLAST、BLAT、BWA、Bowtie等。

这些方法都是自动化的,具有高效、快速、准确等特点,但也存在一定的局限性,如无法对全长RNA序列进行注释等。

2. 基于预测的注释方法基于预测的注释方法依赖于生物信息学的算法和技术,主要是通过预测和推理来预测生物分子的功能和特征。

常用的基于预测的注释方法有GeneMark、GENSCAN、Glimmer等。

这些方法通常需要训练大量数据,然后通过特定的算法和计算模型精确地预测基因和转录本的位置和结构。

基因注释与功能分类

基因注释与功能分类

基因注释与功能分类基因注释是对生物基因组序列中的基因进行研究和分析,目的是确定基因的技术特征和确定基因的功能。

它是遗传学、基因组学和蛋白质组学等领域的热门研究课题。

基因功能分类是根据基因所编码的蛋白质功能来对基因进行分类。

基因功能分类的目的是帮助研究人员更好地理解和研究基因的功能,为生物学、医学等领域的研究提供支持。

基因注释的方法和技术非常多样,包括基因定位、基因表达分析、功能预测、突变分析等。

下面将详细介绍一些常用的基因注释和功能分类的方法。

第一,基因定位。

基因定位是将已知的基因位置与新的基因组序列进行比对,从而确定新的基因在基因组中的准确位置。

这种方法是通过计算机程序对基因序列进行比对,根据一系列的比对算法和标准确定基因的位置。

基因定位的目的是确定基因的位置,为后续的基因表达分析和功能预测提供基础。

第二,基因表达分析。

基因表达分析是研究基因在不同组织和细胞类型中的表达水平和模式。

通过比较基因在不同组织和细胞类型中的表达差异,可以了解到基因的功能和调控机制。

常用的基因表达分析方法包括:Northern blot、RT-PCR、Microarray、RNA-Seq等。

这些方法可以分析基因在不同组织和细胞中的表达变化,推测基因的功能和参与的生物过程。

第三,功能预测。

功能预测是根据已知的基因序列和结构特征推测基因可能的功能。

根据基因序列中的启动子序列、转录因子结合位点、启动子甲基化和组蛋白修饰等特征,结合生物信息学的分析方法,可以预测基因可能的功能。

常用的功能预测方法包括:序列比对、蛋白结构模拟、进化比较等。

这些方法可以根据不同的特征对基因进行功能预测,并通过实验验证进一步确定基因的功能。

第四,突变分析。

突变分析是研究基因突变与疾病相关性的一种方法。

通过对已知的疾病相关基因进行突变分析,可以确定基因突变与疾病的相关性。

突变分析常用的方法包括:点突变分析、插入突变分析、删除突变分析等。

这些方法可以帮助研究人员理解基因突变对疾病发展的影响,为疾病的治疗和预防提供指导。

基因功能注释及其在疾病研究中的应用研究

基因功能注释及其在疾病研究中的应用研究

基因功能注释及其在疾病研究中的应用研究人类基因组计划(Genome Project)的完成让我们对基因组的认识更全面,也为后续的基因功能研究开展提供了良好的平台。

对于基因功能的注释也成为了研究的重点。

基因功能注释是指对基因物质相关信息的解读和理解,其中包括基因序列、编码蛋白、表达调控及其在生物过程中的作用等多方面内容。

本文主要围绕基因功能注释的概念、方法及其在疾病研究中的应用研究展开讨论。

一、基因功能注释的概念基因功能注释是指根据基因序列信息,分析其编码蛋白质的功能和其在生物学过程中的作用,或者是基于基因组数据的研究发掘过程,提供了对基因功能探索的重要手段。

基因功能注释不仅仅是对基因功能的简单解释,它还涉及了对基因组数据的处理、生物学方法和技术的运用等多方面的问题。

基因功能注释是基础研究和应用研究中的核心问题之一,其对于认识和解析基因组数据的生物学意义具有重要的影响。

二、基因功能注释的方法基因功能注释方法种类繁多,一般分为以下几类:1. 基于生物实验方法:该方法通过对生物实验数据的分析,揭示基因的功能。

例如:RNA干扰技术、蛋白质质谱分析等。

2. 基于基因表达数据的分析:对基因表达进行大规模的分析,辨别基因功能的“热点区”,进而发现相关的通路、信号和生命过程,从而得出基因的功能信息。

例如:微阵列技术 (microarray)。

3. 基于生信方法:采用生物信息学方法来进行大规模的分析,可以对基因可变剪切、启动子元件、转录调控和序列保守性进行分析。

例如:基因注释数据库的建设、基因序列比对等。

三、基因功能注释在疾病研究中的应用基因功能注释在人类疾病研究中的应用,是一个十分重要的研究方向。

研究者们秉承着从基因中解析疾病的理念,利用多种生物学手段,寻求可能导致疾病发生的基因因素,探索疾病的遗传机制,从而发现和诊断疾病。

例如,基因功能注释方法可以用于梅毒的研究。

研究人员利用基因数据的注释和相关通路分析,研究了梅毒感染过程,发现部分基因能够干预梅毒的病理进程,揭示了梅毒感染和病理进程中的关键蛋白质。

cog基因注释 功能分类 中文含义

cog基因注释 功能分类 中文含义

cog基因注释功能分类中文含义Cognate基因注释是指通过对比分析,对已知的基因组序列与未知的基因组序列进行相似性搜索,从而推断未知基因的可能功能与结构的一种方法。

在生物信息学领域,cognate基因注释是非常常见且重要的工作,对于理解生物学系统的功能和进化有着重要的意义。

功能分类是指将相似的生物学实体进行分类,以便于理解和研究。

在生物信息学中,常用的功能分类有基于序列相似性的GO(基因本体)分类、基于结构和功能的EC(酶联分类)等。

cog基因注释和功能分类在生物信息学中占据了重要的地位,通过对基因进行注释和分类,可以更好地理解基因的功能和参与的生物学过程。

而这些对于生物学研究和应用有着重要的意义。

在对cog基因注释和功能分类进行深入探讨时,首先从基本概念进行解释。

cog基因注释是通过比对已知基因组序列和未知基因组序列的相似性来预测未知基因功能的方法。

而功能分类则是将相似生物学实体进行分类,以帮助理解和研究。

然后可以进一步探讨两者在生物信息学中的应用和意义,例如在基因功能预测、新基因发现和基因组学研究中的重要性。

对于cog基因注释和功能分类的个人理解和观点,我认为它们在生物信息学领域扮演了非常重要的角色。

通过对基因进行注释和功能分类,我们可以更好地理解基因的功能和相互关系,进而推动生物学研究的发展。

随着技术的发展和数据的积累,cog基因注释和功能分类的方法也在不断完善和拓展,为生物信息学研究提供了更多可能性。

cog基因注释和功能分类在生物信息学领域有着重要的意义,通过对基因进行注释和分类,我们可以更好地理解生物学系统的功能和进化。

我对于这两个方法的个人观点是非常看重的,相信它们会在未来的生物学研究中继续发挥重要作用。

通过本文的深入讨论和总结,相信读者已经对cog基因注释和功能分类有了更加全面、深刻和灵活的理解。

希望本文能够对读者在生物信息学领域的学习和研究有所帮助。

Cognate gene annotation and functional classification are essential components of bioinformatics, playing a crucial role in understanding genetic function, biological processes, and evolutionary relationships. These methods involve comparing known genomic sequences with unknown genomic sequences to predict the function and structure of unknown genes, as well as categorizing similar biological entities for easier understanding and research purposes.The concept of cognate gene annotation involves predicting the function of unknown genes by comparing them with known genomic sequences. This process allows researchers to infer the potential function and structure of genes based on their similarities to already annotated genes. It is an important tool in bioinformatics that helps in understanding the function of genes and their involvement in biological processes, ultimately contributing to the advancement of biological research and applications.On the other hand, functional classification is essential for categorizing similar biological entities to aid in their understanding and research. It provides a systematic way to organize and group genes based on their functions, structures, and other characteristics. Widely used functional classifications in bioinformatics include Gene Ontology (GO) classification, which is based on sequence similarity, and the Enzyme Commission (EC) classification, which is based on structure and function.The application and significance of cog gene annotation and functional classification in bioinformatics are vast. These methods are crucial for predicting gene functions, identifyingnew genes, and conducting genomics research. By annotating and classifying genes, researchers can gain a better understanding of their functions and their roles in biological processes, contributing to the overall advancement of biological research and applications.In my personal understanding and viewpoint, cog gene annotation and functional classification play a vital role in bioinformatics. They are essential for understanding the intricate functions of genes and their relationships within biological systems. Moreover, with the continual improvement and expansion of these methods, there are even more possibilities for bioinformatics research and applications.In conclusion, cog gene annotation and functional classification are crucial components of bioinformatics that have a profound impact on understanding genetic function and biological processes. My personal viewpoint is that these methods are highly valuable and will continue to play a significant role in future biological research. I believe that this comprehensive discussion has provided readers with a deeper understanding of cog gene annotation and functional classification, and I hopethat it will be beneficial for those studying and researching in the field of bioinformatics.。

生物信息学中的基因注释和功能预测

生物信息学中的基因注释和功能预测

生物信息学中的基因注释和功能预测生物信息学是生物学、计算机科学和统计学的交叉学科。

它应用计算机技术和数学统计工具,对生物系统中的大量数据进行分析和解释。

其中,基因注释和基因功能预测是生物信息学中的重要内容。

一、基因注释基因注释是指对基因组序列中的基因和非编码区域进行描述和解释的过程。

它能够为生物学研究提供重要的基础数据,如基因定位、基因识别、组合规律的发现等。

基因注释的方法可以分为结构注释和功能注释两类。

结构注释是指通过一些基本的生物信息学算法,如基于比对的方法、基于RNA-Seq的方法等,对基因组序列中的基因和非编码区域进行基本结构的预测和揭示。

功能注释是指通过一些软件工具,如Gene Ontology、KEGG、Reactome等,对基因组序列中的基因和非编码区域进行其功能的预测和解释。

结构注释和功能注释是互补的、相辅相成的。

在结构注释方面,目前比较常用的方法包括基于比对的注释和基于RNA-Seq的注释。

基于比对的注释是指将已知的基因组序列(参考基因组)与待注释的基因组序列进行比对,从而推断出待注释基因组序列的基因位置和结构信息。

基于RNA-Seq的注释是指利用高通量测序技术获得一系列RNA序列,从而推断出待注释基因组序列中未知的基因位置和结构信息。

相对而言,基于RNA-Seq的注释有更高的精度和灵敏度。

在功能注释方面,目前比较流行的软件工具包括Gene Ontology、KEGG和Reactome等。

Gene Ontology(GO)是一个标准化的基因功能分类体系,它将基因功能分为“细胞组成”、“生物过程”和“分子功能”三个方面进行描述。

KEGG是一个关于代谢通路、信号通路和疾病等相关信息的数据库,它为非模式生物基因组注释提供了重要的信息来源。

Reactome是一个针对代谢和信号通路的数据库,它能够对基因序列进行功能注释和生物过程解释。

二、基因功能预测基因功能预测是指对未知功能基因进行预测和解释的过程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

miRanda算法的基本步骤
➢ 对miRNA和mRNA的3′UTR序列进行碱基互补分析; ➢ miRanda采用一种类似于Smith-Waterman的算法来构建
打分矩阵; ➢ miRNA与靶基因形成二聚体的热力学稳定性, miRanda
利 用 Vienna 软 件 包 中 的 RNAlib 计 算 miRNA 与 mRNA 3′UTR结合的自由能; ➢ miRanda要求靶点在多物种间保守,即靶点在多物种 3′UTR序列比对中相同位置具有相同的碱基。
microRNA数据库
➢ MicroRNA(miRNA)是一类内生的、长度约2024个核苷酸的小RNA,是发夹结构的约70-90个碱 基大小的单链RNA前体经过Dicer酶加工后生成。 其在细胞内具有多种重要的调节作用。
microRNA 特点
• 序列特点
– miRNA本身不具有开放阅读框ORF,不编码蛋白质 – 成熟的miRNA 5′ 端为单一磷酸基团,3′端为羟基
涵盖了基因的细胞组分(cellular component)、分子功能 (molecular function)、生物学过程(biological process)。
GO数据库最初收录的基因信息来源于3个模式生物数据库: 果蝇、酵母和小鼠,随后相继收录了更多的数据,其中包 括国际上主要的植物、动物和微生物基因组数据库。
• 保守型特点
– 在物种间高度
miRNA的作用机制
• 抑制或降解 – 取决于miRNA与靶mRNA种子区域的互补程度 • 种子区域 – 通常指miRNA 5′端第二位到第八位的核苷酸序列 – 两者完全互补 • 降解 – 两者不完全互补 • 抑制翻译
miRNA靶基因预测遵循的原则和基本步骤
遵循的原则 • miRNA的“种子区”与mRNA的3′UTR序列碱基互补 • 靶点在多物种间的序列保守性 • miRNA与mRNA形成双链结构的热力学稳定性 • 靶基因二级结构和靶点外的序列对靶基因预测的影响
注释系统中每个结点 (node)都是基因或 蛋白的一种功能描述, 结点之间保持严格的 关系,即“is a”或 “part of”。
练习操作:
➢ 浏览GO网站,了解该数据库的功能模块。 ➢ 利用GO,从分子功能、生物学功能和亚细胞位置三
个方面对KCNA5进行功能注释。
京都基因与基因组百科全书
如果有miRNA基因 簇,这里会给出簇 成员与基因组位置 及编码链的方向
其他数据库中的这 个基因
所属的基因家族
对5’成熟序列的描述 深度测序证据与其 他实验证据
几种靶位点预测软 件预测结果
对3’成熟序列的描述
参考文献
miRTarBase数据库
– 目前使用广泛的存储真实miRNA与靶基因间关 系的数据库
基因注释与功能分类
Gene Annotation And Functional Classification
基因本体(gene ontology, GO)数据库
GO(gene ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库。
目的是建立一个适用于各种物种的,利用标准化的词汇对基 因和蛋白质功能进行限定和描述。
➢ RNAhybrid没有考虑靶基因的物种间保守性,允许用户自 己定义自由能的阈值、P 值,也允许用户自己设置 miRNA“种子区”的位置和长度以及是否允许出现G-U错 配等。
选miRNA来源物种
针对不同
物种基因 的3 ‘UTR进
行预测
只要输入了mRNA,就只显 示mRNA预测结果;若仅输 入miRNA,则给出所有可 能被该miRNA靶向的mRNA
人, 果蝇, 斑马鱼
序列匹配, 双链结合自由能, 物种间保 守性
/mmu_6 0/
人, 小鼠, 大鼠, 狗, 鸡 黑猩猩,恒 河猴,牛,负鼠 蛙
提出“miRNA种子区”的概念
http://pictar.mdc-berlin.de/
脊椎动物
区分“完全匹配种子区”与“不完全匹 配种子区”
➢ 京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)是系统分析基因功能、基因组信息的 数据库,它整合了基因组学、生物化学等信息,有助于研 究者把基因及表达信息作为一个整体网络进行研究。
➢ KEGG提供的整合代谢途径查询十分出色,包含全部完整的 基因组序列和部分测序的基因组序列,并伴有实时更新的 基因相关功能注释。
➢ KEGG DISEASE是一个存储疾病基因、通路、药物、以及疾病诊断标 记等信息的新型数据库。
www.genome.jp/kegg/
kcnq1 hsa
练习操作:
➢ 浏览KEGG网站,了解KEGG各模块功能。 ➢ 利用KEGG,查看P53参与的代谢通路。
批量的注释?
• DAVID (/) • DAVID 2008 Functional Annotation
– 网址: .tw/ – 数据库以Excel文件形式存储,可供用户下载本
地化使用。
microRNA 靶位点预测方法原理
miRNA靶基因预测方 法
网址
检索范围
算法特点
miRanda TargetScan
PicTar
/microrn a/home.do
基本步骤
在3′UTR上探寻和miRNA“种子区”完全互补的序列; 计算miRNA和这些序列结合产生的自由能下降值,对靶点进
行筛选; 对靶点进行物种间序列比对,利用物种保守性进一步筛选。
帮助
提交
版本号及 更新时间
命名规则 参考文献
根据序列相 似性命名
根据时间 先后命名
根据成熟序列在前体序列上的 位置与生物体中的稳定存在量
命名 例外
参考文献
开始检索
输入关键词进行快速检索,如miR-302、302、 mmu-mir-302,注意这里的检索词必须是整个 名字的一部分,如果检索mmu-302,是无法找
到任何结果的
通过miRNA名称 进行检索
通过miRNA基因组 定位进行检索
检索特定物种中 的miRNA基因簇
检索特定物种中特定组织 细胞中表达的miRNA
GO术语在多个合作数据库中的统一使用,促进了各类数据库 对基因功能描述的一致性。
➢ GO 通过控制注释词汇的层次 结构使得研究人员能够从不 同层面查询和使用基因注释 信息。
➢ 从整体上来看GO注释系统是 一个有向无环图(Directed Acyclic Graphs),包含三个分 支,即:生物学过程,分子 功能和细胞组分。
RNAhybrid算法
➢ RNAhybrid考虑了靶基因结合自由能对预测结果的影响。 该算法利用动态规划算法寻找一条短链RNA(miRNA) 和一条长链RNA(mRNA 3′UTR)杂交时的最优自由能鉴 别miRNA的靶点。
➢ 与其他的RNA二级结构预测软件mfold、RNAfold等相比, RNAhybrid除了具有明显的速度优势外,RNAhybrid算法 还禁止miRNA 分子间和靶基因间杂交产生二聚体。
• 表达特点
– miRNA具有时序性以及组织特异性 • 在特定的时间,组织中才会表达
• 调控特点
– miRNA与其靶基因间是多对多的关系 • 一个miRNA可能调控多个靶基因 • 一个基因也可能受多个miRNA调控
• 物理位置特点
– miRNA倾向于成簇出现在染色体上 – 通常定义50kb的距离为一簇
KEGG存储内容
• KEGG目前共包含了19个子数据库,它们被分类成系统信 息、基因组信息和化学信息四个类别 。
➢ 基因组信息存储在GENES数据库里,包括全部完整的基因组序列和部 分测序的基因组序列,并伴有实时更新的基因相关功能的注释。
➢ KEGG中化学信息数据库被称为KEGG LIGAND数据库,包含化学物 质、酶分子、酶化反应等信息。
➢ KEGG BRITE数据库是一个包含多个生物学对象的基于功能进行等级 划分的本体论数据库,它包括分子、细胞、物种、疾病、药物、以及 它们之间的关系。
➢ 一些小的通路模块被存储在MODULE数据库中,该数据库还存储了其 他的一些相关功能的模块以及化合物信息。
➢ KEGG DRUG数据库存储了目前在日本所有非处方药和美国的大部分 处方药品。
miRDB
/miRDB/
人,小鼠,大鼠,狗, 鸡
利用支持向量机分析已证实的 miRNA:mRNA相互作用而预测新的 靶位点
miRanda
• 第一个利用生物信息学方法开发的基于序列的 miRNA靶基因预测算法
/microrna/home.do
通过输入序 列进行blast 比对,检索
miRNA
有4个茎环结构和 8个成熟序列的名
字符合检索词
茎环结构 前体序列
成熟序列
题名表示这是一条前 体序列的记录
miRBase序列号与名字
茎环结构 序列
点此获得茎环结构的 FASTA格式序列
基因组上的位置
高通量测序结果 揭示成熟序列位
置与丰度
与其他基因的关系
输入靶基因
输入想要研究的 miRNA,例如let-7a
几个不同的 isoforms

3‘UTR
下 拉
一个保守的miR家族在 这个位置靶向这个 mRNA
不同物 种中该 靶位点 的保守

各项分值可点击观看解释 该家族各成员与mRNA配对情况及分值
所有可能的靶基因
点击看详情
ቤተ መጻሕፍቲ ባይዱ
Let-7的靶位点
练习操作:
• 利用Targetscan方法预测调控KCNA5的 microRNAs。
• 利用miRBase查看microRNA-26b的信息。
相关文档
最新文档