生物信息学在基因组学中的应用_沈春修

合集下载

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用随着科技的发展和生物学研究的深入,人们对于生物信息学的重视也越来越高。

生物信息学是一门基于计算机科学、统计学和生物学的交叉学科,旨在研究生物信息的获取、存储、分析和解释。

其中,生物信息学在基因组学中的应用尤为重要。

基因组学是研究基因组的科学,它包括对基因和其它遗传因素在细胞和生物体中结构、功能和进化等方面的研究。

基因组学的发展使得我们能够更好地理解基因组结构和功能,并且在医学、农业、环境等领域都有着广泛的应用。

生物信息学在基因组学中的应用通过处理和分析基因组信息,可以帮助我们更深入地了解基因组的结构和功能。

以下是生物信息学在基因组学研究中的常见应用:1.基因组测序与注释基因组测序是指对一个生物体的全部 DNA 序列进行测定和分析。

随着测序技术的不断进步,现在人们可以快速地测序出不同物种的基因组序列,并从中发现新的基因和调控元件等重要信息,有利于对基因进行更深入的研究。

基因组注释则是指对基因组序列中的基因、基因家族、调控元件、重复序列等进行鉴定和解释,从而揭示基因组结构和功能的规律。

注释的结果不仅能为基因组进化、比较基因组学等研究提供有力的支持,还可以作为基因组数据分析的重要依据。

2.基因组数据管理与挖掘基因组数据管理和挖掘是指通过建立数据库、开发算法等手段对基因组数据进行有效地存储和分析,挖掘其中有价值的信息。

生物信息学家通过拟定数据标准和制定数据处理流程等策略,来确保基因组数据的质量和一致性,为后续数据分析提供了可靠的基础。

基因组数据挖掘则可以从基因组序列、表达水平、蛋白质互作等多个层面进行,发掘基因组中的关键基因、重要信号通路以及与疾病相关的因素等,有助于揭示基因的功能及其在健康和疾病状态下的调控机制。

3.基因组变异分析基因组变异分析是指对不同物种的基因组序列进行比较,推断基因组变异的类型和频率。

基因组变异分析主要涉及单核苷酸多态性 (SNP)、结构变异和基因组重排等,有助于了解基因的进化历程、种群的遗传结构以及与疾病相关的基因变异。

生物信息学技术在基因组学研究中的应用

生物信息学技术在基因组学研究中的应用

生物信息学技术在基因组学研究中的应用近年来,随着生物技术的迅猛发展,生物信息学作为一门交叉学科,逐渐发展成为基因组学研究的重要工具之一。

生物信息学技术以计算机科学和生物学为基础,将大量的生物学数据进行整理、分析和解释,从而有助于揭示生物体复杂的基因组结构和功能。

本文将从基因组测序、蛋白质结构预测和基因组功能注释三个方面,探讨生物信息学技术在基因组学研究中的应用。

首先,基因组测序是生物信息学技术在基因组学研究中的核心内容。

随着第一代、第二代和第三代测序技术的相继问世,基因组测序已经从过去耗时耗力且昂贵的过程变得更加快速和经济。

通过测序,我们可以了解一个生物体的基因组组成,进而揭示其基因结构和功能。

生物信息学技术在基因组测序中发挥巨大作用。

它可以通过将海量的测序数据进行处理和识别,准确地拼接成完整的基因组序列。

此外,生物信息学技术还可以进行基因组比对和定位,帮助研究人员找到与特定生理过程相关的基因变异。

其次,蛋白质结构预测是生物信息学技术在基因组学研究中的另一个重要方面。

蛋白质是生物体内最基本的功能分子,其结构与功能紧密相关。

然而,实验测定蛋白质结构是一项复杂而费时的过程。

生物信息学技术可以通过计算方法,根据蛋白质的氨基酸序列预测出其空间结构,从而帮助我们深入了解蛋白质的功能。

蛋白质结构预测不仅可以预测蛋白质的三维结构,还可以预测蛋白质的二级结构、域结构、功能位点等。

这为进一步研究蛋白质的功能和相互作用提供了重要线索。

最后,基因组功能注释是生物信息学技术在基因组学研究中的另一个核心内容。

基因组大小越来越大,其中只有一小部分序列是编码蛋白质的基因。

大量的非编码序列虽然不直接编码蛋白质,但在调控基因表达和基因功能中发挥着重要作用。

生物信息学技术可以通过比对已知的基因组数据库、功能数据库和非编码RNA数据库等,对基因组进行功能注释。

这有助于我们揭示基因组中的潜在功能元件,研究基因表达调控网络,探索生物体的复杂生命过程。

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用随着科技的不断进步,生物信息学在基因组学中的应用越来越受到关注。

生物信息学是一门研究如何利用计算机和数学方法来解决生物学问题的学科,在基因组学研究中具有重要意义。

本文将探讨生物信息学在基因组学中的应用,并深入了解它对基因组学研究的影响。

生物信息学方面的研究,可帮助科学家在基因组学中进行大规模的基因序列分析。

基因序列包含了一个生物个体的所有遗传信息,是进行基因组学研究的基础。

通过生物信息学方法,科学家能够对大量基因序列进行快速而高效的分析,这有助于发现与特定疾病相关的基因变异,或者揭示基因在各种生物过程中的功能。

生物信息学在基因组学中的应用还包括基因组测序技术的分析与改进。

基因组测序是指确定一个生物个体基因组的DNA序列。

由于基因组大小巨大且复杂,传统的测序方法需要花费大量时间和金钱。

生物信息学的发展为基因组测序技术提供了快速、精确和经济的选择。

通过分析测序数据中的序列重叠,生物信息学可以重建基因组序列,并帮助科学家识别出重要的基因和功能元件。

此外,生物信息学在基因组学中还扮演着基因表达调控的重要角色。

基因表达是指基因信息的转化过程,即DNA转录成RNA,然后翻译成蛋白质。

生物信息学方法可用于解析基因表达调控网络的结构和功能。

通过分析基因表达谱数据,可以研究基因在不同组织或特定条件下的表达模式,并找到关键的调控因子。

这有助于科学家深入理解基因调控的机制,从而提供新的治疗策略和预防方法。

此外,生物信息学在基因组学中的应用还包括对遗传多样性和进化的研究。

基因组在不同个体之间存在着变异,这种变异使人类和其他物种之间的遗传差异产生。

通过分析基因组数据,科学家能够研究个体之间的遗传多样性,并研究这些多样性如何影响特定性状的表达。

另外,通过比较不同物种的基因组序列,可以揭示进化过程中的基因变化和适应性选择。

总之,生物信息学在基因组学中的应用广泛而深远。

它不仅可以帮助科学家进行基因序列分析,还可以改进基因组测序技术,并揭示基因调控网络的机制。

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用1. 前言随着科学技术的不断进步,生物信息学作为一门新兴的交叉学科,逐渐走进人们的视野。

生物信息学通过运用数学、统计学、计算机科学等方法,对生物学数据进行分析和解释,为基因组学领域的研究提供了新的思路和手段。

本文将探讨生物信息学在基因组学中的重要应用。

2. 基因组序列分析基因组是一个生物体细胞中包含的全部遗传信息的总和,而基因组序列则是基因组的碱基序列。

生物信息学在基因组学中最常见的应用之一就是基因组序列的分析。

通过对基因组序列进行比对、寻找基因、预测蛋白质编码区域等分析,科研人员可以更好地理解基因组的结构和功能。

3. 基因表达调控研究除了基因组序列分析,生物信息学还在基因表达调控方面发挥着关键作用。

通过RNA测序技术和生物信息学分析方法,科研人员可以揭示不同条件下基因的表达水平及调控机制,进而研究基因在生物体内的功能和作用。

4. 基因突变与遗传疾病生物信息学在基因组学中还可以帮助科研人员研究基因突变与遗传疾病之间的关系。

通过对患者基因组数据的分析,可以发现与某些遗传疾病相关的突变位点,为遗传疾病的诊断、治疗提供重要依据。

5. 进化生物学研究生物信息学也为进化生物学领域提供了强大支持。

通过对不同物种的基因组数据进行比较和分析,可以揭示不同物种之间的遗传关系和演化历史,揭示生命起源和演化过程中的奥秘。

6. 蛋白质结构预测与功能注释除了基因组水平的研究外,生物信息学还在蛋白质层面上发挥着重要作用。

通过蛋白质序列和结构预测工具,科研人员可以预测蛋白质的空间结构和功能域,为药物设计和蛋白质工程提供指导。

7. 大数据时代下的挑战与机遇随着高通量测序技术不断发展,产生的生物数据呈指数级增长。

如何有效地存储、管理和分析如此海量的数据成为当前面临的重要挑战之一。

但同时也为生物信息学领域带来了巨大机遇,推动了生命科学研究向着全面深入发展。

结语综上所述,生物信息学在基因组学中扮演着至关重要的角色,推动了基因组学领域的快速发展。

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用生物信息学是一门综合性学科,它将生物学、数学、计算机科学和统计学等多个领域的知识相结合,旨在研究和应用计算机算法和统计方法解决生物学问题。

随着测序技术的飞速发展,基因组学成为生物信息学领域的重要分支之一。

本文将探讨生物信息学在基因组学中的应用,以及它对现代生物研究的意义。

基因组学简介基因组学是研究生物体全部基因组的科学,它主要关注基因的序列和结构、功能、调控以及基因之间的相互作用等方面的研究。

基因组学是了解生物体内遗传信息和基因调控机制的重要工具,也是现代生物医学研究和药物开发的基础。

生物信息学在基因组学中的角色基因组测序生物信息学在基因组测序中起到了关键作用。

通过高通量测序技术,可以迅速获取大量的DNA或RNA序列数据。

然而,这些原始测序数据需要进行质控和处理,并将其转化为可供进一步分析的数据格式。

生物信息学家利用算法和工具进行序列质控、去除污染和真实碱基识别等处理。

基因组组装基因组组装是将测序得到的短读序列按照正确的顺序拼接成完整的基因组序列。

由于测序技术限制和基因组结构复杂性,基因组组装是一项挑战性任务。

生物信息学家通过算法和统计方法,将碎片化的DNA或RNA序列拼接成连续和可靠的基因组序列。

基因注释基因注释是将基因组序列与已知功能相关信息进行比对,从而确定其中含有哪些基因以及它们可能的功能。

生物信息学家可以通过比对已知蛋白质或核酸数据库,预测基因所编码蛋白质的功能、相关途径以及可能受到调控。

基因表达分析基因表达是指基因转录为mRNA并被翻译成蛋白质过程。

通过RNA 测序技术,可以获取不同条件下细胞或组织中mRNA的表达水平。

生物信息学家使用不同算法和软件分析这些高通量表达数据,寻找不同条件下表达差异显著的基因,并进一步挖掘其潜在功能。

基因变异分析生物种群中存在着丰富的遗传变异,包括单核苷酸多态性(SNP)和结构变异等。

这些遗传变异对个体特征、疾病易感性以及药物反应性等具有重要影响。

生物信息学在基因组学研究中的应用与分析

生物信息学在基因组学研究中的应用与分析

生物信息学在基因组学研究中的应用与分析生物信息学是将计算机科学技术和数学方法应用于生物学领域的交叉学科。

在近几十年的发展中,生物信息学逐渐成为基因组学研究中的重要工具。

生物信息学的应用和分析能够加速分析大规模基因组数据,揭示基因功能、基因调控、基因组组装和比较等生物学过程,对疾病的诊断和治疗等方面有着深远的影响。

首先,生物信息学在基因组学中的应用之一是基因功能注释。

通过生物信息学方法,我们可以对基因的功能进行预测和注释。

例如,通过比对已知蛋白质序列数据库,可以预测新发现基因的蛋白质编码区域。

此外,通过分析启动子、剪接位点和转录因子结合位点等序列特征,可以预测基因的调控元件。

这些注释信息可以为后续研究提供有价值的线索,加快对基因功能的理解。

其次,生物信息学在基因组学中的另一个应用是基因组测序数据的处理和分析。

高通量测序技术的快速发展使得产生大规模的基因组数据成为可能。

而处理和分析如此庞大的数据需要高效的算法和工具。

生物信息学方法可以帮助处理测序数据,进行测序质量评估,进行序列比对和组装。

此外,生物信息学还可以对测序数据进行变异检测和基因表达分析,以揭示基因组中的关键变化和调控机制。

此外,生物信息学在基因组学研究中还有许多其他应用。

例如,生物信息学可以进行基因组比较分析,揭示相关物种的基因组演化和功能保守性。

通过建立基因调控网络,生物信息学可以对基因调控的复杂关系进行建模和预测。

此外,生物信息学还可以进行表观遗传学和转录组学的研究,从而深入研究基因组的调控机制和表达模式。

然而,生物信息学在基因组学研究中也面临一些挑战。

首先,生物信息学的方法和算法需要不断发展和改进,以应对不断增长的基因组数据量和复杂性。

其次,生物信息学研究需要跨学科的合作,需要生物学家和计算机科学家之间的密切合作。

此外,生物信息学研究还涉及数据处理和存储的问题,需要高性能计算设备和可靠的数据存储系统。

综上所述,生物信息学在基因组学研究中的应用和分析能够加速对基因功能、基因组组装和比较、基因调控机制等生物学过程的理解。

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用

生物信息学在基因组学中的应用一、引言生物信息学是生物学、计算机科学与数学相结合形成的一门跨学科科学,生物信息学的发展与应用为基因组学领域的研究与发展提供了诸多便利和创新。

本文将探讨生物信息学在基因组学中的应用。

二、基因组学介绍基因组学研究的是一个生物体基因组的结构、功能与演化等方面,是生物学的重要分支之一。

基因组学主要分为三个阶段,分别是:基因定位、扫描细胞遗传变异的频谱、了解遗传变异背后的分子、细胞和组织机制。

基因组学研究的基本任务就是从大量基因序列中找出与特定生理、病理等性质相关的基因,以便对指定目标采取有效的治疗、预测和预防措施。

三、生物信息学的应用1. 基因解密基因解密是基于生物信息学技术实现精确的、系统的、高效的基因解密工作。

生物信息学技术有效地解决了寻找基因的难题,通过自动化和高通量的方式揭示基因的结构与功能,如基因注释、基因识别、开放阅读框分析、基因家族分类分析、RNA分子分析、基因演化分析等。

2. 基因组学与疾病关联研究基因组学与疾病关联研究是通过生物信息学技术对与特定疾病相关的基因进行研究,如肿瘤、心血管疾病、精神疾病等。

通过对比病人基因组和正常人的基因组,发现与疾病相关的基因序列的变异,从而开展相应的疾病基因组学研究工作。

3. 基因组学与药物研发基因组学与药物研发是通过生物信息学技术寻找与疾病相关的基因并筛选出潜在的药物靶点,从而研制出更加精确、个体化的治疗方案。

在药物研发环节中,生物信息学技术可以帮助科学家更快速地找出靶点并设计药物分子,降低新药开发成本。

4. 基因组学与生命起源基因组学与生命起源研究是对生物系统起源的精炼化研究,可以探讨早期生命产生,复杂生命体生命活动的协调性。

通过对基因组和表现组的分析比较,可以探究生命的基础单位,从而更加深刻地了解生命的本质。

四、结论生物信息学因其高级的数据分析和数据挖掘能力,在基因组学领域应用广阔,可以快速地通过基因序列信息挖掘出与疾病相关的基因信息,为新药研发提供强有力的基础与支持。

生物信息学在基因组学研究中的应用

生物信息学在基因组学研究中的应用

生物信息学在基因组学研究中的应用生物信息学是一门将计算机科学与生物学相结合的学科,它的出现极大地推动了基因组学研究的发展。

基因组学是研究生物体基因组的结构、功能和演化等方面的学科。

本文将介绍生物信息学在基因组学研究中的应用。

一、基因组测序基因组测序是获取生物体全部基因组信息的过程。

生物信息学在基因组测序中发挥了重要的作用。

通过生物信息学的方法,可以对大量的序列数据进行自动化分析,大大加快了测序的速度和效率。

1.1 第一代测序技术第一代测序技术是指早期的测序方法,如Sanger测序技术。

这种技术需要将DNA片段在PCR扩增后进行序列化,生成一系列的片段,然后通过电泳分离这些片段,并根据色谱图确定其序列。

由于第一代测序技术的优点在于准确性高,但存在测序速度慢、测序长度受限等问题。

生物信息学通过开发相应的软件工具,实现了对大量序列数据的高效处理和分析,辅助了测序结果的解读。

1.2 第二代测序技术第二代测序技术具有高通量、高效率和低成本等特点,如454测序、Illumina测序和Ion Torrent测序等。

这些新的测序技术产生了大量的序列数据,但其数据分析也面临巨大的挑战。

生物信息学通过开发基于高性能计算和大数据处理的方法,解决了大规模测序数据的存储、分析和比对等问题,为基因组学研究提供了强大的支持。

二、基因功能预测基因功能预测是基因组学研究中的重要任务之一。

通过生物信息学的方法,可以对基因的结构和功能进行准确的预测,为基因的研究提供有力的理论依据。

2.1 基于序列比对的功能预测生物信息学通过比对新的基因序列和已知的基因数据库,寻找相似性序列和保守性区域,从而推断新的基因的功能。

这种方法基于假设,即具有相似序列的基因可能具有相似的功能。

通过比对和分析序列数据,可以预测基因的编码蛋白质的结构、功能和亚细胞定位等信息。

2.2 基于结构预测的功能预测生物信息学还可以通过基于结构的方法预测基因的结构和功能。

这种方法基于蛋白质结构与功能之间的关系,通过计算和模拟等手段,预测蛋白质的二级结构、三级结构和功能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作者简介沈春修(1979-),男,湖南溆浦人,硕士,助教,从事水稻遗传育种与抗病分子机制方面的研究。

收稿日期2007!04!01基因的研究是指在许多基因同时存在的基础上对多个基因同时进行研究,分析各自与它们之间的结构与功能的相互关系。

因而它至少涉及3个相关领域:结构基因组———主要关心DNA碱基序列水平上的基因结构;比较基因组———寻找种内、种属间产生基因结构差异的分子基础,以期获取与目的性状相关的基因;功能基因组———着重研究基因与其表达产物及功能活性的调控关系。

结构基因组是其他领域的基础,比较基因组为功能基因组研究提供等位基因,蛋白质组则是在蛋白质水平上分析基因表达的功能基因组研究的派生分枝。

生物信息学是在前面三者研究的基础上,获取、整理、综合分析提取大量已有复杂生物数据的新学科,对相关学科的研究有很大的推动作用。

1生物信息学在结构基因组中的应用随着化学分析方法的改进,DNA测序水平的提高,科研成本的降低,已开始对多种模式生物进行基因组全序列的测序。

如拟南芥和水稻的全基因组测序,将来会有越来越多的重要作物基因组被全测序。

因而,今后的工作重点将是基因组中信息的分析与鉴定,对植物抗性基因来说,是分析鉴定其组织结构及其相关调控序列的鉴定。

结构基因组的研究对抗性基因的研究有许多指导意义。

在现在已知的许多种已克隆的抗性基因(不含Hm1和Hm2)中,分析其序列结构,都含有或部分含有核苷酸结合位点(NBS),富含亮氨酸重复(LRR),跨膜结构域(TM)以及丝氨酸-苏氨酸激酶(STK)保守序列。

根据已知抗性基因都含有NBS序列的特征,从测序结果中可预测某一生物中含有与抗性基因有关的基因数目有多少[1]。

在拟南芥与水稻测序的过程中,发现许多与抗性有关的NBS序列。

在已测序的拟南芥67Mb中(相当于大于50%的拟南芥基因组序列),有120个可预见的基因产物与植物抗性基因的NBS结构相似[2]。

假设剩余的另外50%未知基因也按这样的比例分布,那么拟南芥中将有200个左右的基因与抗性有关。

在这些与抗性有关的200个基因中,它们要么是编码信号传导的组分,要么是编码抗微生物的蛋白,这些基因序列的总长度大约占拟南芥总基因数的1%。

而在水稻中,通过对重叠的BAC克隆末端序列分析(占全部水稻基因的5%)来看,大约有750 ̄1500个基因具有编码NBS的能力[3-5]。

从已知抗性基因的定位结果来看,NBS序列在拟南芥基因组中倾向于成簇排列。

测序结果也表明,植物中的抗性基因一般与抗性基因的多种同源共生序列在一起,共同组成高度重复区域,这种区域统称为基因簇。

Rpp5基因簇包含8 ̄10个同源序列,散布在90kb的区域上,并且被蛋白激酶的假基因与反向转座子等隔开。

Cf!4/9基因簇由5个抗性基因同源序列组成,散布在36kb的区域内,Cf!4/9的同源序列被Lox基因隔开,成为高度重复区域。

Pto基因簇包含5个同源序列,分布在60kb的区域内,这其中的Prf基因编码NBS!LRR,对Pto基因的功能是必需的。

Dm3基因是目前已知的最大的抗性基因,至少由24个抗性基因同源序列组成,横跨3.5Mb。

因而,随着更多模式植物的全基因组测序的完成,人们可以从基因组测序信息中直接读出有用数据,分析寻找抗性基因的组织结构特征与分布规律。

2生物信息学在比较基因组学中的应用随着多种生物的全基因组测序完成,有越来越多的数据可以直接利用。

首先,通过比较多种属植物抗性基因的定位特点,发现抗性基因大多定位在较不稳定的区域,其区域的结构不很保守,如拟南芥的抗性基因RPM1的同源序列在感病表型的植株上丢失[6]。

进一步研究发现,抗性基因的位置要么是端粒区域,要么是接近着丝粒区域。

例如,通过原位荧光杂交分析得知:莴苣的两抗性基因分别定位在端粒区域与接近着丝粒区域,高粱Rpg1基因位于端粒区域,番茄的Mi基因位于异染色质的着丝粒边缘[7]。

第2,通过测序分析,可以确定基因成簇的模式与范围,通过比较种属间亲缘关系,来预测某一功能相似的基因在其他物种中的位置。

进而根据已克隆的抗性基因间的相似性,可以采用适当的引物进行PCR扩增获得抗性基因的候选序列,而且这些候选序列的片段均可定位到已知的抗性基因的位置上[8]。

从现在公开的数据中,比较多种NBS基因的相似性,用PCR获得了130个候选抗性基因,此数据将继续增长。

第3,比较基因组的另一作用在于可以区分同源区域与同源共生区域。

这对本身就位于同源共生区域的抗性基因家族可能困难,但是抗性基因相关序列的种间比较结果显示:同源区域比同源共生区域更加相似。

这提示:物种为了赶上病原菌的变化步伐而采取快速进化来抵抗随时间而变化的病原群体。

通过分析拟南芥的RPm1基因侧翼序列也得到这样的结论。

第4,比较基因组学也可对某特定等位基因的变化的分子基础进行研究[9]。

至今,只有极少数通过同源重组,实现蛋白质结构域的域置换试验成功。

这些结果显示NBS!LRR编码基因的LRR区域是非常重要的,但它不是专一性的唯一决定簇。

随着测序效率的提高,将建立抗性基因相关序列的数据库,这些序列信息可作为基因步行试验的模板,为克隆新的抗性基因提供极大的帮助。

第5,比较基因组作图表明,染色体上的DNA标记排列具有共线性[10]。

如小麦的基生物信息学在基因组学中的应用沈春修(宜春学院,江西宜春336000)摘要随着计算机科学、物理学、数学等与生命科学的相互渗透和交叉,生物信息学愈来愈显示出其重要性,尤其是在抗病基因的研究中。

笔者从结构基因组、比较基因组、功能基因组与生物信息学等方面论述了生物信息学在基因组学中的应用。

关键词抗性基因;结构基因组;比较基因组;功能基因组;生物信息学中图分类号Q78文献标识码A文章编号0517-6611(2007)20-06054-02安徽农业科学,JournalofAnhuiAgri.Sci.2007,35(20):6054-6055,6057责任编辑王淼责任校对王淼因组很大,并且含有大量的高度重复序列,利用图位克隆分离基因很困难。

根据水稻与小麦的共线性可从水稻分离相关基因。

另外,比较基因组学将对研究抗性基因的进化、亲缘关系远近等提供分子水平的证据,并为模式生物的基因组测序后的序列拼接提供很大参考,为功能基因组研究提供等位基因系。

3生物信息学在功能基因组中的应用目前,通过分析大量的DNA测序数据和基因表达产物,更加深入地解析了基因与蛋白质的功能关系。

广泛的基因组水平上的蛋白质构象分析及蛋白质-蛋白质相互作用的研究在动物、微生物上已较深入,应用于植物也是不久的事情。

对于模式植物如拟南芥,每个潜在基因的插入或缺失均可通过突变体找到,目前突变体的数目仍在增多。

通过近几年的研究发现,同一个基因可在不同条件下、不同器官、不同个体中获得表达,这将为解开基因的调控模式发挥重要作用。

尽管目前植物表达基因的分析仍处于初级阶段,但它的潜力正在被大家所认识。

首先,DNA芯片技术的应用可获得大量表达信息[11-12]。

当病原植物相互作用时,相容的与不相容的差异表达基因可通过DNA芯片技术捕捉到。

对那些植物与病原相互作用时表达的基因和过去未知的在抗病与感病植株中参与表达的基因,通过DNA芯片技术将获得综合的表达水平的数据。

如第一代含有1500ESTs/基因的特有玉米DNA芯片鉴定了被真菌Cochlioboluscarbonum感染6h后诱导表达的117个基因[13]。

比较共同被调控的基因的调控区域将揭示潜在的调控序列与控制表达的调节模式。

其次,由表达水平获得的数据可能包含某一特定基因的功能,但此功能仍需从基因对基因水平上确证,这种确证需借助多个基因共存的条件下植物-病原物相容或不相容时诱导表达的蛋白情况来确定[14-15]。

当病原植物相互作用时,许多蛋白可被诱导表达,但只有很少数在抗病时及时表达。

目前常用的方法是通过表型鉴定,再到测序区域候选基因的筛选,只可补充上述相关数据的不足,候选基因法不能准确鉴定某个基因。

因而需要一些新的方法,如反义RNA抑制或有义RNA竞争抑制被用来鉴定多基因家族中某个成员是否编码某一个特定蛋白;反向遗传分析法对检测基因功能也是必需的。

第3,在植物基因组中,编码NBS!LRR蛋白的基因是最为广泛存在的基因之一,但其功能未知[3,5]。

他们的序列结构域与已知的蛋白质数据库中数据比较显示,他们可能参与信号通路的开始,揭示的NBS!LRR编码基因证明参与了抗病与抗虫。

然而不能排除他们参与植物生物学其他方面如发育、对不良环境的应答等的可能性。

从现在已知的很少数据可以得出,绝大多数具有NBS!LRR编码基因似乎都是低水平组成型表达,因而不能直接通过广泛的表达产物来分析他们的功能。

然而通过诱导NBS!LRR编码基因的下游基因的表达作为特征,来直接区分抗性基因的不同层次,并提供被NBS!LRR基因调控的调控表达的线索。

总之,功能基因组的研究为研究基因的功能及研究该基因的调控模式提供工具,尤其是对抗性基因的研究,将会使人们弄清抗性基因成簇的原因,成簇基因又是如何选择性专一表达等问题。

4生物信息学的展望生物信息学作为一门新兴学科正在迅速发展。

在已公开的或私人数据库中可得到大量的DNA基因组信息和EST序列数据,现在仍然以指数级的速度递增。

目前对这些表达序列数据的分类和利用更为重要,需要全球性的广泛的合作与交流,采用更加先进的技术和智能机器人对获取、整理与提取这些数据将大有帮助[18]。

为此,美国专门成立一个关于植物NBS编码序列的系统数据库的国家基因研究中心,通过因特网可直接查询到原始数据记录和相关的数据库。

任何科研人员通过现有的高效计算机软件如PSI!BLAST(positionspecificinteratedBLAST)均可获得远距离的同源序列鉴定分析[7,19]。

目前已开始从单个抗性基因的鉴定克隆转移到抗性基因表型的全面分析[21]。

可以预测,在不久的将来,不用通过实验鉴定,在计算机上通过序列比较和功能模拟分析,就能预测新克隆的抗性基因的功能。

大规模的新方法、新技术的应用,将为获取新抗性基因并使之变成可操作利用提供机会。

而事实上抗性基因仅在那些受到病原攻击而引起反应的部分细胞中低水平表达。

因而在将来人们可以专门设计那些能识别病原体的基本成分,并能诱导启动适当应答途径产生抗性的抗性基因。

参考文献[1]DEVOSK,BEALESJ,NAGAMURAY,etal.Arabidopsisrice:willcolinearityallowgenepredictionacrosstheeudicotmonocotdivide[J].GenomeRes,1999,9:825-829.[2]MEYERSBC,DICKERMANAM,MICHELMORERW,etal.Plantdiseaseresistancegenesencodemembersofanancientanddiverseproteinfamilywithinthenucleotide!bindingsuperfamily[J].PlantJ,1999,20:317-332.[3]LIESTERD,KURTHJ,LAURIEDA,etal.Rapidreorganizationofresistancegenehomologuesincerealgenomes[J].ProcNatlAcdSciUSA,1998,95:370-375.[4]MICHELMORERW,MEYERSBC.Clustersofresistancegenesinplantsevolvebydivergentselectionandabirth!and!deathprocess[J].GenomeRes,1998,8:1113-1130.[5]BEVANM,BANCROFTI,BENTE,etal.Analysisof1.9Mbofcontiguoussequencefromchromosome4ofArabidopsisthaliana[J].Nature,1998,391:485-488.[6]STAHLlEA,DWYERG,MAURICIOR,etal.DynamicsofdiseaseresistancepolymorphismattheRpmllocusofArabidopsis[J].Nature,1999,400:667-671.[7]ZHONGXB,BODEAUJ,FRANSZPF,etal.NovelDNAsequenceorganizationinricegenome[J].TheorApplGenet,1999,98:365-370.[8]SHENKA,MEYERSBC,ISLAMFAIDI,etal.ResistancegenecandidatesidentifiedbyPCRwithdegenerateoligonucleotideprimersmaptoclustersofresistancegenesinlettuce[J].MPMI,1998,11:815-823.[9]ELLISJG,LAWRENCEGJ,LUCKJE,etal.IdentificationofregionsinallelesoftheflaxrustresistancegeneLthatdeterminedifferencesingene!for!fenespecificity[J].PlantCell,1999,11:495-506.[10]LLQI,GILLBS.Plantdiseasegenes:Functionmeetsstructure[J].TheorApplGenet,1996,103:998-1006.[11]LEMIEUXB,AHARONLA,SCHENAM.Structuraldiversityofleucine-richrepeatproteins[J].MolBreeding,1998,4:277-289.[12]BSLOWIND,CRANEV,RICED.Acomparisonofgelbased,nylonfilterandmicroarraytechniquestodetectdifferentialRNAexpressioninplants[J].CurrOpinPlantBiol,1999,2:96-103.[13]MORRISSW,VERNOOIJB,TITATARNS,etal.Inducedresistanceresponsesinmaize[J].MPMI,1998,11:643-658.[14]BRAZMAA,JONASSENI,VILOJ,etal.Predictinggeneregulatoryelementsinsilicoonagenomicscale[J].GenomeRes,1998,8:1202-1215.[15]KITAJIMAS,SATOJ.Plantpathogenesisrelatedproteins:molecularmechanismsofgeneexpressionandproteinfunction[J].JBiochem,1999,125:1-8.(下转第6057页)沈春修生物信息学在基因组学中的应用35卷20期6055(上接第6055页)[16]TANGX,XIEM,KIMYJ,etal.OverexpressionofPtoactivatesdefenseresponsesandconfersbroadresistance[J].PlantCell,1999,11:15-30.[17]BAULCOMBEDC.Fastforwardgeneticsbasedonvirusinducedgenesilencing[J].CurrOpinPlantBiol,1999,2:109-113.[18]RICHARDMICHELMORE.Theevolutionofdiseaseresistancegenes[J].PlantBiotechnology,2000,29:125-131.[19]THIEFFRYD.Fromglobalexpressiondatatogenenetworks[J].BioEssays,1999,21:895-899.[20]VANDERBIEZENEA,JONESJDG.TheNB-ARCdomain:anovelsignallingmotifsharedbyplantresistancegeneproductsandregulatorsofcelldeathinanimals[J].CurrBiol,1998,8:226-227.[21]LEOS,MELCHERSANDMARTENH,STUIVER.FactorsinfluencingAgrobacteriummediatedtransientexpressionofGusAinrice[J].Plantbiotechnology,2000,7:147-152.乙酰转移酶和脱乙酰酶的化学修饰;另一类是依赖ATP的物理修饰,利用ATP水解释放的能量解开组蛋白和DNA的结合,使转录得以进行。

相关文档
最新文档