生物信息学在植物miRNA研究中的应用_吕德康
生物信息学的研究进展及其在生物学中的应用

生物信息学的研究进展及其在生物学中的应用随着生物学的深入研究,人们对生物信息学的应用也越来越关注。
生物信息学作为一门新兴交叉学科,应用于各个领域,使得科学家们能够更高效地挖掘生物学数据中蕴含的信息。
本文将简要介绍生物信息学的研究进展及其在生物学中的应用。
一、生物信息学的研究进展生物信息学作为一门交叉性学科,涉及到生物学、计算机科学、统计学和物理学等多个学科。
近年来,生物信息学研究的重点越来越倾向于应用性和综合性。
以下分别从基因组学、蛋白质组学、结构生物学和系统生物学几个方面阐述生物信息学的研究进展。
1、基因组学基因组学是研究基因组结构、功能、演化和调控的学科。
以人类基因组计划和癌症基因组图谱等为代表的一系列基因组计划的推出,使得我们对基因组的认识愈发深入。
生物信息学在基因组学的研究中发挥了重要的作用。
由于基因组学数据的存储和分析需要大量的计算机技术支持,生物信息学中的许多软件和算法得以应用。
例如,常用的序列比对工具 BLAST 和 ClustalW 在基因组学研究中被广泛应用。
2、蛋白质组学蛋白质组学是研究蛋白质组成和功能的学科。
相比基因组学,蛋白质组学研究涉及到大量的分子生物学和化学实验,所需花费的时间和资源更多。
生物信息学在蛋白质组学研究中的应用主要是在蛋白质序列分析和结构预测方面。
目前,生物信息学尤其是机器学习在蛋白质结构预测中的应用已经取得了一定的成果。
3、结构生物学结构生物学是研究蛋白质、核酸和细胞器等生物大分子的结构和功能的学科。
生物信息学在结构生物学中的应用尤为重要,其主要用于蛋白质的结构预测、构象分析、分子对接等方面。
例如,人们可以通过生物信息学工具预测出某个蛋白质的二级结构和三级结构,这极大地促进了分子生物学和疾病治疗的研究。
4、系统生物学系统生物学是全面认识生物体的组成、结构和功能的学科。
它综合了生物化学、分子生物学和基因组学等各种技术手段,以更加系统和全面的方式来探索生物体的复杂机理。
生物信息学技术在新药研发中的应用及其前景

生物信息学技术在新药研发中的应用及其前景引言生物信息学技术的快速发展为药物研发提供了独特的机会和挑战。
本文将探讨生物信息学技术在新药研发中的应用,重点讨论其在基于大数据的药物发现、药物靶标预测和药理学研究等方面的应用,并展望其在新药研发中的前景。
一、基于大数据的药物发现1.1 基因组学数据在药物发现中的应用生物信息学技术通过对基因组学数据的分析,可以揭示疾病发生和发展的分子机制,并提供潜在的药物靶点。
基因组学数据分析可以通过对大量基因组序列的比较、在基因间网络的分析及功能注释的预测,来识别潜在的治疗靶点。
1.2 转录组学数据在药物发现中的应用转录组学数据分析可以揭示与疾病相关的基因表达变化,为药物发现提供线索。
生物信息学技术可以对转录组学数据进行差异表达基因的筛选和功能分析,从而确定潜在的药物靶标,并加速药物研发过程。
1.3 蛋白质组学数据在药物发现中的应用蛋白质组学数据的分析可以揭示疾病相关的蛋白质变化和信号通路,为药物发现提供依据。
生物信息学技术可以通过对蛋白质组学数据的分析,帮助识别潜在的药物靶标和开发新的抗癌药物等。
二、药物靶标预测2.1 药物与靶标的相互作用预测生物信息学技术可以通过利用已知药物与靶标的关联信息,预测新药物与靶标的相互作用,从而快速筛选出具有潜在药效的化合物。
这种方法可以大大加速药物研发的过程,并降低药物研发的成本。
2.2 基于结构生物学的药物靶标预测结构生物学在药物靶标预测中有着重要的地位,生物信息学技术可以通过分析已知结构的蛋白质和化合物的结合模式,预测未知结构蛋白质与化合物的结合模式,从而揭示药物与靶标之间的相互作用。
三、药理学研究3.1 基于系统生物学的药效预测生物信息学技术在药理学研究中可以帮助预测药物的药效,通过整合多种实验数据,包括基因表达、代谢产物、蛋白质互作网络等,构建药物作用的整体模型,为药物的治疗效果预测提供依据。
3.2 副作用预测生物信息学技术可以通过整合多种数据,包括生物样本数据、药物数据库和疾病数据库等,预测药物的副作用,并对药物的副作用进行评估,从而有助于在药物研发过程中及时发现和解决不良反应问题。
生物信息学技术在分子生物学领域中的应用研究

生物信息学技术在分子生物学领域中的应用研究随着科技的不断发展,生物信息学领域也在不断壮大。
生物信息学是一门集计算机科学、统计学、生物学等多学科于一体的学科,是通过大数据分析和计算机模拟等方式来研究生物系统和生命现象的学科。
生物信息学技术在分子生物学领域中的应用研究,已经成为生命科学领域中的一个热点。
一、生物信息学技术的意义在传统的分子生物学研究中,研究者需要进行试管实验,通过不断的摸索和试错才能够了解生物体系的运作方式。
而生物信息学技术的出现,则为传统分子生物学的研究方法注入了新的动力。
基因、蛋白质、RNA等生物分子普遍具有高度的复杂性和互相联系的性质,而这些分子的相互作用和调节关系又影响整个生物系统的生存和发展。
如何揭示这些复杂的关系,揭示潜在的生命机制?这就是生物信息学技术的发挥所在。
基于生物信息学技术,研究者可以通过建立生物系统的计算模型并模拟其运作过程,以此来揭示分子间的相互作用和调节关系。
这种新的研究方法,已经成为生物信息学和分子生物学领域的一项主要研究内容。
二、生物信息学技术的研究方法其中,生物信息学技术在分子生物学领域的应用研究主要有三个方面。
1. 基因组学研究:基因组学是一门研究生命体系基因组与功能之间关系的学科。
基因组学的主要目的是研究不同物种的基因组结构、组成、表达和调控等方面的问题,进而揭示生物分子间的相互作用和控制机制。
传统的基因组学方法需要进行大量的实验操作和数据收集,而应用生物信息学技术,则可以通过计算模拟等方法来研究不同基因在生物体系中的作用,并通过基因库和数据库等手段收集分析数据。
2.蛋白质组学研究:蛋白质组学是一门研究生物体系蛋白质结构和功能的学科。
蛋白质组学的主要目标是研究不同物种的蛋白质组结构和相互作用规律,进而寻找生物分子内部的调控与协调关系。
在蛋白质组学研究中,生物信息学技术主要包括质谱分析、蛋白质定量和识别方法等方面。
质谱分析可以通过分辨蛋白质的化学性质来判断不同生物分子的差异;而蛋白质定量和识别方法则可以通过计算机模型来预测分子间的相互作用,进而寻找生物分子内部的调控与协调关系。
生物信息学在生物学中的应用

生物信息学在生物学中的应用生物信息学是将计算机科学、数学和统计学等多个学科应用于生物学的交叉学科,该领域的出现和发展可以极大地改善我们对生命的理解和治疗方法的改良。
本文将讨论生物信息学在生物学中的应用及其未来的潜力。
一、序列数据分析序列数据分析是生物信息学中最重要的应用之一,它用于从DNA、RNA和蛋白质序列中获取基因组和蛋白质的结构和功能信息。
序列数据分析的一个重要方面是序列比对。
基于序列比对,可以建立基因家族、进化关系等信息,并预测新基因的功能、生物进化过程等。
生物信息学工具已经广泛应用于人类基因组计划、花粉图谱计划以及各种微生物基因组计划中。
例如,在人类基因组计划中,已经识别出了数万个基因并确定了它们的序列。
此外,研究人员还可以在全球范围内比较这些序列,以识别共享高度保守的区域和突变位点。
这种分析不仅使我们更好地了解人类进化历史,而且还帮助发现在不同疾病中的遗传基础。
二、分子模拟分子模拟是生物信息学的另一个重要方面,它用于预测蛋白质、DNA或RNA分子的结构和稳定性。
在分子模拟中,研究人员利用大量计算机资源模拟分子运动和相互作用,并预测最稳定的分子结构。
通过分子模拟,我们可以根据已知的结构域分析分子的稳定性和函数,并预测未知结构的分子的稳定性和函数。
此外,分子模拟还可以帮助发现有潜力治疗癌症、糖尿病和其他疾病的化合物和蛋白质。
例如,研究人员利用抑制剂对HIV病毒进行了分子模拟,从而成功预测了具有对病毒活性的靶标化合物。
三、系统发育学生物信息学还可以应用于系统发育学,即基于物种生物大分子序列的进化关系研究。
在系统发育学中,一组序列的分析可以揭示生物进化过程的相对方向和时间尺度,进而更好地理解物种之间的关系。
通过对各种代表物种基因组序列的比较,可以直接推断出这些物种之间的进化关系。
形成这些进化关系的多项事件中最重要的是突变和基因组重构。
此外,研究人员还可以通过与化石记录的突变事件的结合来了解物种在演化过程中的特定历史,从而建立进化树和物种分类。
生物信息学在基因组学研究中的应用

生物信息学在基因组学研究中的应用随着高通量测序技术的快速发展,基因组学研究已成为现代生物学领域的关键。
生物信息学的发展和广泛应用,为基因组学的研究提供了强大的支持和推动。
生物信息学通过整合、存储、分析和解释海量的基因组数据,提供了深入探索基因组功能、结构和进化的方法和工具。
下面将从基因组测序、基因组注释、基因表达谱和基因组功能预测四个方面介绍生物信息学在基因组学研究中的应用。
基因组测序是基因组学研究的基础。
生物信息学在测序技术中的应用主要包括测序质量控制、序列比对和变异鉴定。
测序质量控制是通过生物信息学方法对产生的测序数据进行质量过滤和修剪,删除低质量的序列,提高数据质量。
序列比对是将测序数据与已有的参考基因组进行比对,确定序列的来源和位置。
变异鉴定是通过比对结果,识别出患者或物种个体与参考基因组的差异,发现并分析其与表型相关的位点,从而揭示个体或物种的遗传变异信息。
基因组注释是对基因组进行功能解析和标注的过程。
生物信息学在基因组注释中的应用主要包括基因预测、基因结构注释和功能注释。
基因预测是通过生物信息学工具和算法预测基因组中的基因编码区域,并对其进行注释。
基因结构注释是对基因的外显子、内含子、启动子、终止子等结构特征进行注释,确定基因的结构。
功能注释是通过比对基因序列与已知基因数据和功能数据库,对基因的功能进行注释,包括基因的功能分类、蛋白质结构域和功能模体等的预测。
基因表达谱是研究基因在不同组织、不同时期以及不同环境条件下的表达水平和模式的方法。
生物信息学在基因表达谱研究中的应用主要包括RNA测序数据的处理与分析、差异表达基因的筛选与注释、基因调控网络的构建和功能模块的识别。
通过生物信息学方法,可以对大量的RNA测序数据进行数据清洗、表达水平计算、差异表达分析等,揭示基因在不同条件下的表达变化和调控机制。
基因组功能预测是基因组学研究中的一个重要方向。
生物信息学在基因组功能预测中的应用主要包括蛋白质功能预测和非编码RNA功能预测。
生物信息学技术在新药开发中的应用

生物信息学技术在新药开发中的应用附:生物信息学技术简介生物信息学技术是利用计算机科学和数学等方法分析生物学数据,从而解决生物学问题的学科。
随着生物学领域数据的快速增长,生物信息学技术应运而生。
生物信息学技术已经成为现代生物学发展的重要驱动力之一,并在新药开发中发挥着重要的作用。
一、生物信息学技术在药物设计中的应用生物信息学技术可以从多个角度对药物进行设计和筛选。
例如,可以使用分子对接模拟技术预测药物和靶点之间的相互作用方式,进而设计出更加精准的药物。
同时,生物信息学技术还可以对化合物进行虚拟筛选,快速识别有潜力的药物候选物。
生物信息学技术可以帮助药物研发的每个环节都更加精准和高效。
比如,结构基于药物设计(Computer-Aided Drug Design, CADD)技术可以在分子层面为药物提供结构基础,并指导小分子药物设计。
此外,系统药理学(Systems Pharmacology)技术可以建立复杂的网络模型,揭示药物和靶点之间的基本作用方式,指导药物研发路径的选择。
二、生物信息学技术在新药研发中的应用生物信息学技术可以为新药的研发提供全方位的支持。
近年来,人体基因组计划的实施以及大规模转录和蛋白质测序项目的完成,大量的生物学数据已经被积累。
这些数据可以通过生物信息学技术进行整合和分析,加速新药的研发过程。
其中,基因组学和转录组学技术可以揭示疾病发病机制的分子基础。
此外,蛋白质组学技术可以提供疾病标记物,指导药物研发过程。
此外,元转录组学技术可以通过分析微生物的繁殖方式和代谢次级代谢物来评估新药的效力和安全性。
三、生物信息学技术在药物安全性评估中的应用生物信息学技术可以帮助中药或天然药物化合物的安全性评估。
因为这些原材料的成分比较复杂,传统的实验方法非常耗时、耗力。
而利用基于人工智能的各种算法对于药理性试验模型进行建模,辅助中药的质量控制和研发是非常有效的。
总之,借助大量的生物数据和先进的生物信息技术,生物信息学技术已经成为新药研究开发过程中不可或缺的一部分,为药物的设计、研发、评估等提供了重要技术支持。
生物信息学及其在生命科学中的应用
生物信息学及其在生命科学中的应用生物信息学是一门综合性学科,主要涉及生物分子数据的采集、分析和应用。
随着分子生物学和基因工程技术的飞速发展,生物信息学在现代生命科学中的应用趋于广泛,并成为生命科学研究中的重要组成部分。
一、生物信息学的发展历程20世纪50年代,DNA结构的发现标志着分子生物学的诞生。
20世纪80年代末至90年代初,分子生物学领域涌现出一大批高通量实验技术,例如基因芯片技术、下一代测序技术等,这些高通量技术创造了海量的生物分子数据,推进了生物信息学的发展。
二、生物信息学在生命科学中的应用1. 基因组学基因组学是生物信息学研究的核心领域之一。
随着下一代测序和单细胞测序技术的发展,基因组学研究变得更加深入和详细。
基因组学涉及到的内容非常广泛,从基因鉴定和突变检测到基因表达和调控都有着重要的应用。
以人类基因组计划(HGP)为例,人类基因组的测序是基因组学领域的一个里程碑,也是推动生物信息学迅速发展的关键因素之一。
2. 蛋白质组学蛋白质组学是一种定性和定量研究蛋白质组的科学,主要包括:蛋白质鉴定、蛋白质定量、蛋白质表达、蛋白质质量分析和蛋白质相互作用研究等方面。
蛋白质组学已经被广泛应用于生命科学领域中的许多方面,如疾病诊断、新药研发、生物制药等。
3. 变异组学变异组学是指研究基因突变和基因组变异对个体或种群遗传多样性、基因调控、蛋白质功能、疾病等方面的影响。
它在遗传性疾病诊断、癌症早期预测、遗传咨询等方面具有广泛的应用前景。
变异组学需要大量的生物分子数据作为参考,因此生物信息学的应用非常重要。
三、生物信息学面临的挑战1. 数据存储和分析与分子生物学和基因工程技术的飞速发展相比,生物信息学领域中数据存储和分析技术的发展相对滞后,海量的数据需求对存储和计算能力提出了新的挑战。
2. 数据标准化和共享生物信息学领域的标准化和共享也是一个巨大的挑战。
生物数据中的方法学、实验、分析等要素都不可避免地与数据本身紧密联系在一起,建立统一的标准和协议,以保持数据质量和可行性,是生物信息学领域的一项重要工作。
植物 miRNA 的生物功能与研究方法
植物 miRNA 的生物功能与研究方法伊六喜;苏少锋;刘红葵;斯钦巴特尔∗【摘要】植物 microRNA(miRNA)是近年来发现的一类在植物体内普遍存在的内源非编码小 RNA,与植物基因表达调控相关。
本文综述了植物 miRNA 的特点、miRNA 与植物发育的关系及调控机制、植物 miRNA 研究方法等,对植物生长发育以及抗性的调控机制提供了研究方向,同时对于一些基因家族研究提供了理论基础。
% MicroRNAs (miRNAs) are a kind of endogenous small non-coding RNAs commonly found in plants in recent years, and are involved in gene expression in plants. This paper reviews the characteristics of the plant miRNA, the relationship between miRNA and plant development, as well as regulatory mechanism, and research methods in plants, so as to make a direction to do research on regulatory mechanism of plant growth and development as well as plant resistance, at the same time to provide a theoretical basis for some gene family research.【期刊名称】《生物技术进展》【年(卷),期】2013(000)003【总页数】5页(P166-170)【关键词】microRNA;植物;基因调控【作者】伊六喜;苏少锋;刘红葵;斯钦巴特尔∗【作者单位】内蒙古农牧业科学院,呼和浩特 010031;内蒙古农牧业科学院,呼和浩特 010031;内蒙古农牧业科学院,呼和浩特 010031;内蒙古农牧业科学院,呼和浩特 010031【正文语种】中文长期以来,多数研究者认为除了成熟snRNA、tRNA和rRNA外,大部分RNA仅仅在DNA和蛋白质之间起桥梁作用,但随后发现RNA也可能参与真核细胞中基因表达的调控[1]。
医学研究领域生物信息学在疾病研究中的应用
医学研究领域生物信息学在疾病研究中的应用生物信息学是一门利用计算机科学和统计学方法研究生物学问题的学科。
在医学研究领域,生物信息学起着至关重要的作用,特别是在疾病研究中。
本文将探讨生物信息学在医学研究领域的应用,并介绍一些相关的研究成果。
一、基因组学与生物信息学基因组学是研究生物体基因组的学科,而生物信息学通过对基因组数据的处理和分析来推动基因组学的发展。
生物信息学在疾病研究中的应用主要体现在以下几个方面:1. 基因组测序与变异检测高通量测序技术的快速发展使得基因组测序成为可能。
生物信息学通过对测序数据的处理和分析,可以揭示基因组中的变异信息,包括单核苷酸多态性(SNP)和结构变异等。
这些变异信息对于疾病的诊断和治疗具有重要的意义。
2. 基因表达谱分析基因表达谱是某个生物体在不同状态下基因表达的整体情况。
通过对基因表达谱的分析,可以揭示某个疾病发生发展过程中基因表达的变化规律,进一步了解疾病的机制。
生物信息学通过对基因表达谱数据的分析,可以识别出与疾病相关的基因或信号通路,为疾病的诊断和治疗提供理论依据。
3. 蛋白质组学研究蛋白质组学是研究生物体内蛋白质组成和功能的学科。
生物信息学在蛋白质组学研究中,通过对蛋白质序列、结构和功能的预测与分析,可以揭示蛋白质与疾病的相关性。
这对于疾病的诊断和治疗提供了重要的信息。
二、生物信息学在疾病研究中的应用案例以下是一些生物信息学在疾病研究中的应用案例:1. 癌症研究生物信息学在癌症研究中扮演着重要的角色。
通过对癌症基因组数据的分析,可以鉴定癌症相关基因和变异信息。
生物信息学还可以通过研究癌症基因表达谱的变化,揭示癌细胞的生长机制以及癌细胞与正常细胞的差异。
这些研究成果为癌症的早期诊断和精准治疗提供了理论基础。
2. 遗传性疾病研究生物信息学可以通过分析患者基因组数据,找出与遗传性疾病相关的基因变异。
这种方法被称为遗传关联研究(GWAS)。
通过对大规模样本的基因组数据进行GWAS分析,可以找出与遗传性疾病相关的基因座位,进一步了解疾病的遗传机制。
生物信息学的应用及其在科学研究中的贡献
生物信息学的应用及其在科学研究中的贡献生物信息学是生物科学与信息科学交叉融合的产物,它把计算机与生物学结合起来,通过数据分析、信息挖掘等手段,从海量生物数据中探索生物规律和生命现象,为生物医学领域提供了巨大的帮助。
1.基因组学在基因组学领域中,生物信息学的应用尤为广泛。
以人类基因组计划为例,人类基因组计划是人类谱系起源计划的一个重要分支,它的目标是确定人类的基因组序列。
在这个计划中,生物信息学扮演了至关重要的角色。
通过计算机技术,将大量生物数据进行处理和分析,找出基因序列中所含的基因和物种分化的规律,使我们能够更好地理解人类基因组。
同时,通过生物信息学手段可以较为精确地分析基因测序的结果,帮助科学家发现基因变异等信息,更好地了解遗传病的发生机制。
2.药物研发生物信息学在药物研发过程中的应用也越来越受到重视。
利用生物信息学手段,我们可以更加准确地预测药物在人体内的作用机制及药效,加速药物研发过程。
生物信息学的应用使得公司能够大大减少新药开发周期,节省研发费用,这对新药研发企业无疑是一大优势。
3.癌症研究生物信息学在癌症研究中的应用也越来越受到重视。
癌症研究是生物信息学在医学领域应用最为广泛、最具影响力的研究领域之一。
生物信息学技术通过对癌症基因组学和转录组学分析,可以为癌症基础研究和个性化治疗提供重要的信息。
例如,利用生物信息学工具挖掘肿瘤组织中癌基因、肿瘤抑制基因的变异情况以及癌症特异性信号通路等,分析癌细胞的代谢途径,预测化疗药物敏感性等,从而帮助科学家更深入地了解癌症。
此外,通过肿瘤组织中的基因测序和分析,可以为癌症临床治疗提供个性化药物治疗方案,为临床癌症治疗提供更为精细的指导。
4.生物多样性研究生物信息学在生物多样性领域中也有广泛的应用,它可以通过DNA测序,并配合相应的数据分析软件,深入研究种群的构成和遗传变异模型。
同时,生物信息学也可以用来分析物种数量、分布范围、物种在地球上的分布规律等重要信息,为生物多样性研究提供信息和数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学在植物miRNA研究中的应用吕德康,葛瑛,柏锡,李勇,朱延明*(东北农业大学生命科学学院,哈尔滨,150030)
摘要:植物miRNA的研究已经从小规模实验向大规模计算分析方向发展,生物信息学的应用成为当前植物miRNA研究的热点问题。本文回顾了最近几年生物信息学在植物miRNA研究中取得的最新进展,简要介绍了植物miRNA的形成及其作用方式,重点对植物miRNA的计算识别、靶基因预测、启动子分析方法进行了讨论,并对相关的数据库资源进行了总结,最后展望了该领域研究的发展方向,将为植物miRNA的计算研究提供理论指导。关键词:microRNA;生物信息学;计算识别;靶基因;启动子中图分类号:Q74 文献标识码:A 文章编号:1672-5565(2009)-02-113-05
收稿日期:2008-12-22;修回日期:2009-03-22.基金项目:国家“863”计划专题项目(2008AA10Z153)、黑龙江省科技厅重大攻关项目(GA06B103-3)、黑龙江省自然科学基金项目(C2005-25)。作者简介:吕德康,硕士。主要研究方向:植物分子生物学与生物信息学。E-mail:dekanglv@gmail.com.*通讯作者:朱延明,教授,博士生导师。研究方向:植物分子生物学与基因工程。E-mail:ymzhu2001@yahoo.com.cn.
BioinformaticsinplantmiRNAresearchLǜDe-kang,GEYing,BAIXi,LIYong,ZHUYan-ming*(CollegeofLifeScience,NortheastAgriculturalUniversity,Harbin150030,China)
Abstract:High-throughputapproachesinsilicohavebeenusedwidelyinplantmiRNAreasearchwhichismoreefficientthanexperimentalmeansonasmallscale.BioinformaticinmiRNAresearchhavehencegainedwideattention.Inthisreview,progressofBioinformaticinmiR-NAresearchwassummarized.AfterbrieflyintroductionofbiogenesisandactionmannerofmiRNAinplant,computationaltoolsanddatabasesavailabletopredictmiRNAs,miRNAtargetsandtheirpromoterswerediscussed.Finally,thefuturedirectionofthefieldwaspointedoutinordertoassistthebiologistandothermiRNAresearchers.KeyWords:microRNA;Bioinformatics;computationalidentification;miRNAtarget;promoter
微小RNA(microRNA,简称miRNA)是一类长约21bp的非编码单链RNA,由Lee等1993年在秀丽隐杆线虫(Caenorhabditiselegans)中发现[1],作为一种新型的非编码RNA,miRNA能够在转录后水平高效的调控多个靶基因的表达,展示出很好的研究和应用价值,miRNA的研究已成为生命科学领域的一个焦点。在植物中,直到2002年才在拟南芥中克隆到miRNA[2],随后植物miRNA的研究在世界植物学家的推动下十分迅速地展开。迄今已发现了植物24个物种中的1700多个miRNA,植物miRNA已经被证实广泛参与调控发育、代谢、信号转导、抗逆,siR-NA的生物发生等生物过程[3]。生物信息学以核酸、蛋白质等生物大分子作为主要研究对象,用数学、计算机科学等为主要研究手段,对海量生物学原始实验数据进行存储、管理、加工,以挖掘出具有明确生物学意义的生物信息。目前,生物信息学已经成功地应用到植物miRNA的研究的诸多方面。以下将从植物miRNA的形成和作用方式、miRNA计算识别、靶基因预测、启动子分析、数据库资源等方面加以综述。
1 植物miRNA的形成及其作用方式在植物中,miRNA基因首先由RNA聚合酶II转录产生长度约几百个核苷酸的初级转录物(primarytranscript,pri-miRNA),pri-miRNA折叠成具有二级茎环(Stem-loop)结构的miRNA前体(miRNApre-cursor,pre-miRNA),pre-miRNA在HYL1(HYPO-NASTICLEAVES1)、SE(SERRATE)等蛋白的辅助作用下,由类似于Dicer的酶(DCL1)等通过两步酶切加工出成熟的miRNA。成熟的单链miRNA与Argo-naute(AGO)蛋白作用形成RNA诱导沉默复合体(RNA-inducedsilencingcomplex,RISC),识别mRNA
第7卷第2期2009年06月 生物信息学ChinaJournalofBioinformatics Vol.7No.2June,2009上的靶位点并引导RISC沉默复合体切割mRNA或抑制其翻译,从而起到转录后负调节的作用[4](如图1所示)。图1 植物miRNA形成过程及作用方式Fig.1miRNAbiogenesisandfunctioninplants2 植物miRNA计算识别早期miRNA的识别主要依赖于cDNA克隆的方法,这种方法简单可靠,但因实验周期长,费用高,而且一些表达量低,时空特异表达的miRNA很难被检出。生物信息学方法不但可以克服这些缺点,而且能高通量的识别新的miRNA,目前已公布的miRNA中很大一部分都来源于预测结果。近几年高通量小分子RNA测序手段454和Solexa的出现为miRNA的高通量识别提供了极大便利,但依然离不开生物信息学方法的指导。植物miRNA的计算识别方法主要分为同源搜索的方法、结合靶基因预测的方法和模式学习的方法。2.1 同源搜索的方法同源搜索的方法出现较早,较为简单,主要根据miRNA序列以及pre-miRNA结构的保守性,利用序列比对的方法来发现与已知miRNA同源的miRNA。这种方法的依据是:(1)很多miRNA及pre-miRNA在物种之间存在序列保守性;(2)pre-miRNA可以折叠成颈环结构,这种机构在序列组成、结构等方面有别于rRNA、tRNA等非编码RNA,包括:匹配数量、GC含量、折叠最小自由能等。Li等[5]使用BLAST在拟南芥和水稻中搜索已知成熟miRNA的同源片段,然后以该同源片段为中心提取合适大小的侧翼序列,再根据同源片段侧翼序列的二级结构预测及与已知pre-miRNA的同源性进行筛选,识别出20条拟南芥miRNA和40条水稻miRNA。Zhang等[6]和Ramanjulu等[7]的方法也很类似,他们从植物EST、GSS等片段中搜索与已知miRNA同源的新miRNA,可用于搜索基因组尚未测序的物种中的同源miRNA。Wang等[8]采用的方法不再依赖已知miRNA,首先在拟南芥基因组基因间区中寻找可能的pre-miRNA,然后从水稻基因组中寻找高度同源片段,得到95个可能的miRNA,其中包括12个已知的miRNA,并通过实验验证了新发现的miRNA中的25个。植物miRNA识别在线软件MicroHARVESTOR利用blast寻找物种间保守miR-NA,并使用RNAfold来预测pre-miRNA二级结构筛选新的同源miRNA,预测准确性达到90%以上[9]。
与上述方法不同,Bonnet等[10]利用比较基因组学手段,首先将拟南芥基因间区序列与水稻基因组进行序列比对获得保守短片段,然后从中寻找可能的pre-miRNA,最后得到91个可能的miRNA。显然,同源搜索的方法只能识别物种间保守miRNA,对一些没有近缘物种的物种无能为力,且无法识别非保守miRNA。2.2 结合靶基因预测的方法植物中miRNA主要通过与靶基因的互补配对识别并直接切割靶基因mRNA行使功能,很多miR-NA与其靶序列的碱基互补配对模式具有保守性,一些方法利用靶基因预测作为筛选候选miRNA的条件,提高了预测的准确性。Rhoades等[11]利用成熟体和pre-miRNA结构的保守性在拟南芥和水稻基因组中寻找可能的同源miRNA,并以预测的靶基因及结合区在两物种间保守作为筛选条件,最终预测获得了拟南芥中的24个miRNA家族,敏感性达到85%。Adai等[12]在拟南芥基因间区搜索与已知mRNA匹配的短片段,并以其为中心寻找可能的pre-miRNA,然后在水稻基因组中有预测的同源miRNA,最后得到236个miRNA靶基因簇。Rhoadesd等和Adai等的方法同样无法识别非保守miRNA。Lindow和Kroghp[13]的方法实现了非保守miRNA的识别,他们在拟南芥基因间中搜索与mRNA长度在20-27nt的片段,然后通过miRNA与mRNA双链的自由能、pre-miRNA序列等特征进行筛选。识别出592个候选miRNA,其中大部分为非保守miRNA。
114 生 物 信 息 学第7卷2.3 模式学习的方法模式学习的预测方法通过miRNA(阳性)和非miR-NA(阴性)数据集来训练分类器,而后对未知序列进行预测。模式学习的方法所利用的样本特征必须很好地反映两类样本的差异,以高效地预测miRNA。很多这类方法使用pre-miRNA茎环结构的各种特征构建分类器,识别miRNA。Xue等[14]将163个已知人pre-miRNA作为阳性集,以168个从蛋白编码区中提取的可折叠成茎环结构的片段为阴性集,用32个三联体结构-序列特征描述样本、构建了分类器3SVM,该分类器对植物测试集的准确性超过90%。金伟波等[15]的方法也很相似,以水稻137条已知Pre-miRNA为阳性集,以从pre-miRNA的另一个茎(不保含miRNA)上截取25bp序列为阴性集,构建了分类器mature-SVM,敏感性和特异性分别为86.7%和100%;然后,用这个模型对从水稻基因组中筛选出的46501条pre-miRNA进行成熟链预测,最终得到了127条pre-miRNA,其中21条为已知miRNA。模式学习的方法需要更多的阳性和阴性数据,过少的数据往往导致过度训练的问题,此外,寻找能够区分miRNA和非miRNA的高效特征,也是植物模式学习方法在miRNA计算识别上应用的难题。3 植物MiRNA靶基因预测发现miRNA的靶基因是研究miRNA作用机理的重要步骤,靶基因筛选的传统方法主要有基因筛选(genescreen)与定位克隆,由于目标不明确导致筛选效率很低。相比动物,植物miRNA及其靶标mR-NA之间的高度序列互补性增加了利用生物信息学方法预测靶基因的可行性。利用生物信息学代替传统方法,不但可以获得大量的候选靶基因,而且有很好的目的性。因此,生物信息学方法在植物miRNA靶基因的研究中成为首选。3.1 基于同源比对的方法与动物miRNA相比,植物中miRNA与其靶基因比较完美的结合,识别并切割靶基因,抑制靶基因的表达。因此可结合miRNA与其靶基因匹配程度高的特征,使用比对方法如PatcScan等筛选miRNA的靶基因。Rhoades等[16]使用PatScan来预测与miRNA错配小于3个碱基的靶基因,发现其中多数靶基因在两物种中是保守的。Sunil等[17]使用miRanda对水稻所有miRNA进行了靶基因预测,得到684个非冗余靶基因,其中41%为转录因子基因,55%在拟南芥中有同源基因。很多miRNA、靶基因mRNA及它们的结合部位在同源物种之间是保守的,这些特征可以用来识别miRNA的靶基因。Bartel等[11]和Wang等[8]在同源物种间靶向关系的保守性来搜索靶基因,放宽了匹配数量要求,提高了预测的敏感性。MiRU(http: bioinfo3.noble.org miRU.htm)是目前最常用的植物miRNA在线预测软件,miRU可以根据用户提供的错配数搜索靶基因,并通过物种间的保守性来提高准确性和敏感性[18]。