热带植物基因组研究进展
拟南芥的基因组学与分子遗传学研究

拟南芥的基因组学与分子遗传学研究拟南芥(Arabidopsis thaliana)是一种常见的小型植物,其研究价值(特别是基因组学和分子遗传学)已经得到了广泛认可。
拟南芥是一种被广泛研究的模式植物之一,因为其小型、短生命周期和基因组的简单性使其成为研究生物学的理想对象。
对拟南芥的基因组学研究的进展,主要是由于人类基因组计划的启示: 用高通量技术破解拟南芥基因组,将有助于我们更好地理解人类基因组的特性。
基因组学是研究基因组结构和功能的学科,通过对基因组的系统分析和比较来揭示生物的进化、基因调节和表达的机制。
拟南芥的基因组总长度约为125 Mb,包含五条染色体。
其中第一条染色体长度最长,为30 Mb左右,其他染色体长度约为20-25 Mb。
目前,拟南芥的基因组序列已经完整解析,并且经过基因标记的定位已经进行了详细的物理图谱和逻辑图谱的绘制。
随着基因组学技术的发展,研究人员能够通过利用高通量方法(例如高通量测序)来测定拟南芥基因组中的基因和其他序列。
这些数据可用于推断基因的结构、功能和演化,并且可与其他生物的基因组信息进行比较。
此外,可以通过引入外源DNA来进行功能分析。
拟南芥基因组学研究的妙处在于,即使其基因数量相对较少,拟南芥的基因编码了与人们更为熟悉的模式植物共同的细胞生物学和生物化学特性,如激素信号传导、细胞周期调控、光信号传导以及植物对环境压力的响应机制。
分子遗传学是研究基因传递和表达的学科。
在拟南芥中,研究人员可以通过各种技术手段解析基因表达和调控的机制。
一些方法如: RNA干扰、突变筛选和基因调控的功能研究,均已被广泛应用于拟南芥中。
一种运用于拟南芥的方法是基因组编辑技术——基因编辑可以帮助研究人员更有效地了解基因的结构和功能、研究种子发育、光调节等生物过程。
总之,拟南芥的基因组学和分子遗传学研究具有丰富的应用前景,可应用于潜在的科学研究和农业生产。
因此,我们可以预测它将在未来继续成为许多研究中的热点,并为理解植物的基本生物学过程做出更大的贡献。
“热带植物基因组学与基因编辑”专题序言

热带作物学报2019, 40(10): 1873 1874Chinese Journal of Tropical Crops“热带植物基因组学与基因编辑”专题序言赖钟雄1,徐涵1,21. 福建农林大学园艺生物工程研究所,福建福州35002;2. 法国图卢兹综合科学研究所,图卢兹31300动植物全基因组测序在过去20年快速发展。
1990年人类基因组计划开启了基因组DNA测序的大门,2000年基本完成人类基因组草图绘制,标志着大规模DNA测序成为一种切实可行的研究手段。
植物基因组通常是多倍体,基因组大,杂合度高,具有高度重复序列和全部(或部分)的基因组重复片段,因此,对植物基因组的研究远比动物困难。
一些复杂的植物基因组测序在传统的Sanger法和二代测序初期几乎不可能完成。
随着测序技术的发展和测序成本的降低,越来越多的植物基因组测序逐渐启动并获得许多成果,特别是二代、三代测序技术和Hi-C技术的出现和应用,使许多复杂的植物基因组测序成为现实。
第一个模式高等植物拟南芥的全基因组序列于2000年公布,从此揭开了植物全基因组研究的序幕,随后水稻、杨树、葡萄等代表性作物的全基因组测序也相继完成,为探究其他植物注释基因和直系同源基因提供了重要基础,并在基因组水平对物种的生长、发育、进化、起源等重大问题进行分析,不仅加深了对物种的认识,加快了基因挖掘和物种改良进度,同时也为其他类型植物的基因组测序铺平了道路。
截至2018年底,包括高粱、玉米、黄瓜、大豆、蓖麻、苹果、梨、草莓、可可树、白菜、土豆、白菜、西瓜、大麻、梅花、谷子、小麦、大麦、印度大麻等在内的360余种植物全基因组测序的文章陆续发表。
在热带植物中,2008年采用传统的Sanger测序技术完成了番木瓜的全基因组测序,随后,采用Roche 454结合Sanger、Illumina、Hi-C测序技术,完成了可可、香蕉等植物基因组的测序。
伴随测序技术的快速更新迭代,多种热带植物的全基因组测序工作相继完成并公布,获得了高质量的全基因组数据,包括龙眼、番木瓜、菠萝、椰子、榴莲、橡胶、木薯、枣椰、可可、油棕、咖啡、甘蔗等热带作物以及铁皮石斛、蝴蝶兰、深圳拟兰、香荚兰等多种兰科植物。
植物基因组解析及其应用前景

植物基因组解析及其应用前景植物是地球上最为重要的生物类群之一,它们拥有丰富的生物多样性,对维持生态平衡和人类生存发挥着至关重要的作用。
同时,在农业、药物研发和环境修复等领域也有广泛应用。
然而,长期以来,我们对植物基因组的认识还非常有限,这限制了我们对植物生命机制的深入理解和利用。
随着新技术的不断涌现,植物基因组解析正在逐渐成为研究的热点,其应用前景也越来越广泛。
一、植物基因组解析的意义植物基因组是植物生命机制的重要基础,其中包含着植物的遗传信息、基因结构和组织结构等关键信息。
植物基因组的解析有助于深入研究植物的生物学特性和生命机制,在此基础上,我们可以更好地理解和利用植物的种质资源,推进植物育种和农业生产等领域的发展。
同时,植物基因组解析还有助于发现新的植物资源,开发有益的植物产物,并为生态保护和环境修复等问题提供新的思路和解决途径。
二、基因组解析技术的发展在过去的几十年中,基因组解析技术得到了快速的发展,特别是DNA测序技术的出现,让我们可以更深入地探究植物的基因组。
DNA测序技术的发展经历了从Sanger测序到下一代测序的转变,分别代表了不同的测序效率、精度和成本投入。
最新的第三代测序技术更是将DNA测序的精度和量产率推向了一个新的高度,使得植物基因组解析更加精细和准确。
在植物基因组解析的过程中,还需要依靠生物信息学分析和建模等辅助技术,解析出植物基因组的各种信息,如基因结构、调控网路、代谢途径等。
这些信息的解析和分析需要依托于高性能计算和人工智能等技术手段,才能大幅提高数据分析、挖掘和解释的效率和效果。
三、应用前景展望随着植物基因组解析技术的不断发展,其应用前景也越来越广泛和深远。
首先,基于植物基因组解析的种质资源挖掘、育种和改良等技术将进一步加快植物育种进程,增强农业生产的效益和可持续性。
其次,基于植物基因组信息的新药物和精细农业技术的开发也将进行突飞猛进的探索和应用,为人类的健康和粮食安全做出新的贡献。
植物基因组学的最新研究进展

植物基因组学的最新研究进展随着科技的不断发展,植物基因组学研究也在不断取得成果。
基因组是生命科学研究中的重要方向,而植物基因组学则是基因组研究的重要分支之一。
本文将介绍植物基因组学的最新研究进展。
1. 基因编辑技术基因编辑技术是一种改变生物体遗传信息的技术。
近年来,CRISPR/Cas9技术被广泛应用于植物基因编辑方面。
CRISPR/Cas9技术以其高效、精准和经济的优点,使植物基因组学研究更加深入。
除此之外,还有TAL Effector Nucleases (TALENs) 和 Zinc Finger Nucleases (ZFNs) 等其他基因编辑技术也被应用到植物基因组学研究中。
2. RNA测序技术RNA序列研究是植物基因组学研究的重要方向之一。
RNA测序技术是指通过高通量测序技术研究RNA的序列,以研究基因的表达情况和功能。
这项技术已经在多个植物物种中得到了应用,例如水稻、玉米等作物。
通过RNA测序技术,可以了解基因的表达情况,这对于研究植物基因组学十分重要。
例如,在水稻研究中,就有利用RNA测序技术确定基因表达差异和基因调控网络。
3. 基因组重测序技术基因组重测序是通过高通量测序技术对植物基因组进行再次测序。
这项技术可以帮助植物基因组学研究人员更准确地确定基因组的序列,在不同植物之间比较,并帮助找到特定基因群的共同点。
基因组重测序也可用于环境位点分析、群体遗传学研究和种系分析等方面。
4. 高光谱成像技术高光谱成像技术是一种非破坏性光谱分析手段,在植物基因组学中也得到了广泛应用。
这种技术可以帮助植物基因组学研究人员获得植物的光谱信息,以实现对植物生长状态、生物多样性和环境适应性等问题的研究。
高光谱成像技术不仅能够对植物进行材料检测,而且还在农田监测和作物遥感方面发挥着重要的作用。
通过这项技术,可以评估农业系统的生态效益,预测植物影响环境的方式以及在全球气候变化的背景下监测植物物种代际变化等。
植原体基因组学研究进展

犚 犲 狊 犲 犪 狉 犮 犺狆 狉 狅 狉 犲 狊 狊 犻 狀狆 犺 狋 狅 犾 犪 狊 犿 犪犵 犲 狀 狅 犿 犲 狊 犵 狔 狆
, , , 犢 犪 狀 犻 犺 犲犎 犪 犻 犪 狀 犪 狅犡 狌 犲 狉 犲 狀 狌 狅犇 犪 狌 犪 狀 犆 犆 犔 犵犢 狔 狇 ( 犐 狀 狊 狋 犻 狋 狌 狋 犲狅 狀 狏 犻 狉 狅 狀 犿 犲 狀 狋 犪 犾 犪 狀 犱犘 犾 犪 狀 狋犘 狉 狅 狋 犲 犮 狋 犻 狅 狀, 犆 犺 犻 狀 犲 狊 犲犃 犮 犪 犱 犲 犿 狉 狅 犻 犮 犪 犾犃 狉 犻 犮 狌 犾 狋 狌 狉 犪 犾 犛 犮 犻 犲 狀 犮 犲 狊; 犓 犲 犪 犫 狅 狉 犪 狋 狅 狉 犳犈 狔狅 犳犜 狆 犵 狔犔 狔
·2· 组的 G+C 含量和染色体的大小, 并构建了植原体 染色体的物理图谱。 具有种属 G+C 含量是基因组的一个重要特征, 特异性, 也是柔膜菌纲细菌鉴定和分类的重要参数。 柔膜菌纲细菌的 G+C 含量大多在 2 4 % ~3 5 %之 。 1 9 8 9年, K o l l a r等用氯化铯密度梯度离心结 合高效液相色谱 ( 方法研究发现, 苹果簇生 H P L C) 间
体染色体物理图谱的获得, 进一步明确了植原体染 色体的大小、 结构和r 、 R N A 操纵子、 狋 狌 狌 狊 犻 犱等 犳、 犳 犵 基因在植原体染色体上的排列和位置, 以及植原体 基因组之间的差异和遗传结构的多样性。
] 1 环[ 。 植原体病害在世界各地广泛分布 , 对粮食作
经济作物 、 林业及果树生产带来巨大的危害 , 我 物、 国发生的泡桐丛枝病 、 枣疯病 、 小麦蓝矮病 、 槟榔黄 苹果簇生病 、 椰 化病以及国外发生的葡萄黄化病 、 子致死黄化病等都是由植原体引起 。 植原体只能寄生在植物或昆虫的活细胞内, 迄 今为止无法在人工培养基上进行培养, 很难进行生 理生化特性、 代谢需求、 致病机理以及与寄主互作等 方面的研究。获得植原体的全基因组序列, 是研究 植原体这种难培养细菌的重要基础, 也一直是植原 体研究的热点与难点。
香蕉基因组学研究20年:成就与挑战

香蕉基因组学研究20年:成就与挑战作者:金志强来源:《热带作物学报》2020年第10期摘要:香蕉基因组学研究已逾20年,取得了一些进展。
本文从全基因组测序、亚基因组分化、基因水平上的染色体结构变异、多倍体背景下的染色体交换及基因组扩张与功能等5个方面,论述了香蕉基因组学研究取得的进展,并对未来基因组学研究的重点方向进行了展望。
关键词:香蕉;基因组学;A基因组;B基因组中图分类号:S668.1 文献标识码:AAbstract: Banana genome has been studied for more than 20 years, and some progress has been made. In this paper, the achievements of banana genomics research were reviewed from five aspects: whole genome sequencing, subgenome differentiation, chromosomal structural variation at genome level, chromosome exchange under polyploid background, genome expansion and function.Keywords: banana (Musa L.); genomics; A genome; B genomeDOI: 10.3969/j.issn.1000-2561.2020.10.007基因组学(genomics)是研究基因组(genome)的科学。
从分子遗传学的角度,基因组是指一个生物体或一个细胞器所有DNA分子的总和[1]。
基因组学的发展是以1990年10月1日启动人类基因组计划(Human Genome Project, HGP)作为起点的,至2000年在全世界科学家的共同努力下,覆盖大部分基因组的基因组序列草图绘制完成[2]。
植物基因组研究中的挑战与解决方案
植物基因组研究中的挑战与解决方案近年来,随着生物技术的快速发展,植物基因组研究取得了巨大的进展。
然而,要完整揭示植物基因组中的每一个细节仍然面临着许多挑战。
本文将探讨植物基因组研究中的主要挑战,并介绍一些已经或正在被采用的解决方案。
一.挑战一:植物基因组的复杂性植物基因组通常比动物基因组更为复杂。
植物基因组中存在的染色体数量和大小相对较大,这使得测序和分析变得非常困难。
此外,植物基因组中普遍存在丰富的重复序列,这进一步增加了后续的分析和注释的复杂性。
解决方案:针对植物基因组的复杂性,研究人员开发了一系列高通量测序技术和数据分析方法。
通过使用新一代测序技术如Illumina和PacBio,可以更快更准确地测序整个植物基因组。
此外,利用比对算法和特定工具进行序列比对和重复序列的分析,可以帮助研究人员更好地理解植物基因组的结构和功能。
二.挑战二:植物基因组的高度变异性植物基因组中的高度变异性是另一个挑战。
不同植物种类之间的基因组序列有很大的差异,不同基因组之间往往存在大量的重复序列和单核苷酸多态性(SNP)等变异。
解决方案:为了克服植物基因组的高度变异性,研究人员开发了一系列的基因组编辑技术,如CRISPR-Cas9。
通过利用这些技术,研究人员可以针对植物基因组中特定基因的序列进行精确编辑,从而实现对特定性状的改良和基因功能研究。
三.挑战三:植物基因组的大规模数据分析植物基因组研究产生的大规模数据对数据分析的要求非常高。
处理这些数据不仅需要高性能的计算资源,还需要有效的分析工具和算法。
解决方案:为了应对植物基因组研究中的大规模数据分析,研究人员正在开发和使用各种基于云计算和并行计算的高效分析方法。
利用这些方法,研究人员可以更好地处理和分析植物基因组研究中的大数据,从而对植物基因组中的重要基因和功能进行更全面的研究。
总结:植物基因组研究中的挑战众多,但通过不断的技术创新和方法改进,研究人员已经取得了显著的进展。
植物基因组学的研究进展与应用
植物基因组学的研究进展与应用近年来,随着生物技术的迅猛发展,植物基因组学已经成为了现代生物学领域中不可或缺的部分,也成为了现代农业、生态研究、生物医药学等多个领域的重要基础。
在全球范围内,植物基因组学的研究和应用也已经取得了许多重要进展,为人类的生存和发展提供了巨大的帮助。
一、手段技术的迅速提高植物基因组学的研究需要精细的实验手段和技术支持。
近几年来,高通量测序技术持续的快速发展和不断降低的成本,让更多的科研工作者可以掌握这一技术并进行高效的基因组学研究。
在植物基因组学领域,“基因组广度测序”、“转录组测序”、“CHiP测序”、“基因识别”与“基因组注释”等方法被广泛运用,从基因组层面精细地分析不同植物品种的遗传差异,解析该物种是否存在相关基因的组合变化等信息,对植物的性状、适应、进化等方面提供了深入探究的手段。
二、植物抗病基因的挖掘随着全球化的不断加速,病虫害的威胁日益严峻。
植物病害抗性作为植物生长发育及特异功能的关键,一直是植物基因组学研究的热点问题。
基于“去捕食者假说”,研究人员最初提出了植物共同存在着抗病基因的理论。
随着技术的提高,科研人员不断发现新的植物抗病基因,并根据基因特点进行定位,从而掌握了一些重要的抗病农作物转基因技术。
例如利用叶点菌毒毒素所激活的基因抵抗青枯病菌。
三、作物栽培及育种作为人们食物中重要来源的植物,栽培、育种一直是植物基因组学关注的主要问题。
通过基因组学研究,研究人员首先可以发现、确定以往未知的作物特征,然后可以利用植物基因工程技术对基因进行优化、设计、重建等操作。
例如,在水稻的育种中,科研人员通过人工控制分子水平增强谷氨酸的转运,从而可以增加碳水化合物的合成,进而改善水稻的产量和生长状态。
这样的技术革新大大提高了作物的产量、品质和抗病性,为人类食物安全和环境改善提供了不可或缺的支持。
四、生态系统保护在人类面临的全球气候变化和环境破坏问题中,植物基因组学也作出了不可忽视的贡献。
植物基因组学的新进展与前景展望
植物基因组学的新进展与前景展望随着科技的不断进步和应用,植物基因组学作为研究植物基因组信息的重要分支学科,受到了越来越多的关注。
基因组学研究为人们提供了一个独特的视角来探究植物生长发育、环境适应和进化过程中的各种机制。
本文将分析植物基因组学的一些新进展,探讨它的研究前景。
一、植物基因组学的新进展(一)单细胞测序技术在植物基因组研究中的应用单细胞测序技术,通过采用微流控技术,可以将单个细胞分选出来进行测序,得到其基因组信息。
这一技术已经在人类和动物的研究中被广泛应用,而在植物研究中的应用也越来越广泛。
利用单细胞测序技术,人们可以更精细地理解不同组织和器官中不同类型的细胞的基因表达和组成,进一步揭示植物发育和演化的机制。
(二)功能基因组学的进展随着全基因组测序技术的不断升级,人们可以更快速地鉴定出植物基因组中的新基因并分析其功能。
同时,通过与已知基因组的比较,人们还可以推测出某些基因的潜在功能和互作关系。
在此基础上,利用功能基因组学的方法,人们可以更准确地预测基因功能,加速植物功能和进化机制的解析。
(三)CRISPR-Cas9基因编辑技术的应用CRISPR-Cas9基因编辑技术,是一种基因组编辑工具,可以通过直接切除或修复某一个基因,来验证基因的功能。
这种技术已经在许多动物和细菌中被广泛应用,而在植物研究中,也正在逐渐应用。
通过CRISPR-Cas9基因编辑技术,人们可以更精确地验证植物基因的功能,揭示植物发育和适应机制中的重要基因和途径。
二、植物基因组学的研究前景(一)优化植物栽培品种植物基因组学的研究为优化植物栽培品种提供了新的可能。
通过解析植物基因组中与生长发育、环境适应和抗病能力相关的基因,人们可以设计出更适应特定环境的新品种,提高农业生产效益。
(二)改进植物体细胞胚胎发生技术植物基因组学的研究还有助于改进植物体细胞胚胎发生技术。
通过揭示控制胚胎发生相关的重要基因和调控机制,人们可以通过转基因技术,改善植物体细胞胚胎发生,加速育种和优化遗传改良。
拟南芥基因组学的新进展与生物学研究
拟南芥基因组学的新进展与生物学研究拟南芥(Arabidopsis thaliana)是一种小型、快速生长的模式植物,具有高度的遗传和生物学研究价值。
其全基因组大小为约1.35亿个碱基对,包含大约2万个编码基因。
近年来,随着技术的发展和升级,拟南芥基因组学研究得到了快速发展,为生物学领域提供了丰富的信息和研究手段。
本文将从新进展、细胞开发与互作网络等三个方面探讨拟南芥基因组学在生物学研究中的应用价值。
一、新进展近年来,随着高通量测序技术的普及和应用,拟南芥全基因组重测序快速推进。
2015年,新编码基因的鉴定方法得到了大力推广,基于RNA测序和蛋白质组分析的高通量筛选平台得以建立,研究者能够在高效率下完成大规模基因组学分析。
这一方法也为拟南芥基因组学开辟了新的研究领域。
同时,单细胞RNA测序技术的发展和应用使得拟南芥生长发育等各个领域的单细胞表达谱图谱研究成为可能。
随着越来越多高通量测序数据的产生,数据集成和共享问题也逐渐成为研究热点,多中心合作是共同推动基因组学研究的关键。
二、细胞开发拟南芥是一种模式植物,其在植物生长和发育方面的研究具有代表性和优势性。
在细胞层面,拟南芥胚胎发育的早期阶段是一种十分适合研究的细胞发育模型。
在此模型的基础上,研究者能够探究细胞的分化方向和过程,并对有关基因启动因子、转录因子等进行大量分析。
例如,在细胞极性的研究中,研究者通过全基因组测序分析植物中许多参与细胞不对称分布的基因,这一分析结果对于相关基因在胚胎发育以及生长发育等方面具有重要意义。
三、互作网络拟南芥基因组测序数据的日益增多给互作网络分析提供了更多来源,从而揭示了许多与植物发育及其进化过程相关的调控机制。
目前,已有多个拟南芥互作网络数据库建立,包括去年发布的TAIR14网络数据库。
这些数据库为研究者提供了对拟南芥基因组信息的完整理解和挖掘。
在互作网络中,基于关联分析和网络图谱的方法,研究者能够进一步探究基因编码和调控蛋白之间复杂而又精密的化学反应、相互作用及其动态变化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
热带作物学报2019, 40(10): 1875 1888 Chinese Journal of Tropical Crops收稿日期 2019-07-30;修回日期 2019-08-16基金项目 国家现代农业产业技术体系专项资金(No. CARS-31-15);福建农林大学科技创新专项基金(No. CXZX2017189,No. CXZX2016119)。
作者简介 李 丹(1993—),女,博士研究生,研究方向:果树生物技术。
*同等贡献作者:陈晓慧(1991—),女,博士研究生,研究方向:果树生物技术。
**通信作者(Corresponding author ):赖钟雄(LAI Zhongxiong ),E-mail :laizx01@ 。
热带植物基因组研究进展李 丹,陈晓慧*,赖钟雄**福建农林大学园艺植物生物工程研究所,福建福州 350002摘 要 基于全基因组测序结果,探讨了包括热带水果香蕉(Musa spp.)、龙眼(Dimocarpus longan )、番木瓜(Carica papaya )、菠萝(Ananas comosus )、椰子(Cocos nucifera )、榴莲(Durio zibethinus ),经济作物橡胶(Hevea brasiliensis )、木薯(Manihot esculenta )、枣椰(Phoenix dactylifera )、可可(Theobroma cacao )、油棕(Elaeis guineensis )、咖啡(Coffea canephora )以及药用植物铁皮石斛(Dendrobium officinale )在内的13种热带植物的全基因组测序的发展历程,并对热带植物基因组研究进行了概述。
关键词 热带植物;全基因组;第二代测序;遗传育种;功能基因 中图分类号 Q943.2 文献标识码 AResearch Progresses of Tropical Plant GenomeLI Dan, CHEN Xiaohui *, LAI Zhongxiong **Institute of Horticultural Biotechnology, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, ChinaAbstract Based on genome-wide sequencing results, the development of genome-wide sequencing of 13 tropical plants including banana (Musa spp.), longan (Dimocarpus longan ), papaya (Carica papaya ), pineapple (Ananas comosus ), coconut (Cocos nucifera ), durian (Durio zibethinus ), rubber (Hevea brasiliensis ), cassava (Manihot esculenta ), date palm (Phoenix dactylifera ), cocoa (Theobroma cacao ), oil palm(Elaeis guineensis ), coffee (Coffea canephra ) Tiepi-shihu (Dendrobium officinale ) was discussed, and the tropical plant genome research was summarized. Keywords tropical plants; whole genome; next generation sequencing; genetic breeding; functional genes DOI 10.3969/j.issn.1000-2561.2019.10.00120世纪末,以Sanger 技术为核心的第一代测序技术诞生,单链DNA 噬菌体φX174全基因组序列的测定标志着人类正式步入基因组学时代[1]。
第一代测序技术准确性高、序列读长可达1 kb ,但其测序技术复杂、成本高、通量低,无法满足大规模应用。
2000年首个植物基因图谱拟南芥基因组通过一代测序技术破译完成,取得了植物科学研究领域里程碑式突破[2]。
2005年之后,测序技术发生革命性进步,通过边合成边测序的方法,以Roche 454、Illumina Solexa/HiSeq 和ABI SOLiD 技术为代表的第二代测序技术(又称高通量测序)兴起,虽然第二代测序的序列存在读长较短的不足,但也难以掩盖其与第一代相比的显著优势,尤以高通量、高速率、低成本的Illumina HiSeq 为代表的测序技术为代表,极大推动了基因组和转录组测序的应用与发展,成为大规模全基因组测序技术的主导。
与前两代相比,Helicos Heliscope 单分子测序仪和PacBio SMRT 、Oxford Nanopore Technologies 的GridION 等纳米孔单分子第三代测序技术,超长读长、测序速率更高、测序过程无需进行PCR 扩增,但配套软件平台和技术算法的商业化应用尚未成熟,测序错误率明1876 热带作物学报第40卷显高于第二代。
随着多种测序技术的开发和应用,加速并扩大了研究人员对植物演化及性状的认识,大量植物基因组序列被测定并取得里程碑式的研究成果。
以Sanger测序技术组装的葡萄(Vitis vinif-era)基因组测序工作于2007年完成[3-4],为果树基因组测序建立了良好开端,随后Sanger测序又运用到番木瓜(Carica papaya)基因组测序中[5],Roche 454结合Sanger、Illumina测序技术代替了单一Sanger组装完成了可可(Theobroma cacao)[6]、香蕉(Musa acuminata)[7]等复杂的基因组测序,之后多种热带植物的全基因组测序工作在测序技术大发展的背景下相继完成并公布,获得了高质量的全基因组数据,为热带植物分子育种提供了优良的数据基础。
本文以plaBiPD在线网站(https://www.plabipd.de/index.ep)为查询数据库,回顾并分析了包括热带水果、热带经济作物和药用植物在内的13种具代表性的热带植物的全基因组测序研究结果,探讨了各植物间全基因组测序历程和面临的难题,以及基于基因组关联转录组学挖掘的重要研究。
1主要热带植物全基因组测序研究概况通过比较香蕉(Musa spp.)、龙眼(Dimocarpus longan)、番木瓜(Carica papaya)、菠萝(Ananas comosus)、椰子(Cocos nucifera)、榴莲(Durio zibethinus)、橡胶(Hevea brasiliensis)、木薯(Manihot esculenta)、枣椰(Phoenix dactylifera)、可可(Theobroma cacao)、油棕(Elaeis guine-ensis)、咖啡(Coffea canephora)、铁皮石斛(Dendr-obium officinale)等在内的13种热带植物的基因组信息(表1),发现最先测序组装的番木瓜基因组大小在13种植物中最小,且采用第一代Sanger测序技术。
香蕉和龙眼基因组大小相当,多以第二代测序技术为主要测序方式。
而较为复杂的大型乔木椰子、橡胶和菠萝基因组数据较大,均采用了第二代测序技术与第三代测序技术相结合的方法。
在起步较晚的香蕉B基因组、矮种椰Catigan Green Dwarf以及云南普洱F3代GREEN 均启用了第三代测序PacBio SMRT或Hi-C技术。
从测序技术来看,热带植物多采用主流的第二代Illumina Hiseq 2000。
从基因数目来看,番木瓜基因组注释的数量最少,咖啡(阿拉比卡)基因组注释的数量最多,达99 829。
但是基因最大的椰树基因组上注释的基因数目远小于咖啡(阿拉比卡),可见基因组大小和基因数目之间并没有直接关系。
多数植物基因组由于远缘杂交、自交不亲和及基因组较大且基因组杂合度、倍性高等原因,导致基因组组装难度加大。
N50指的是将所有组装的基因组序列从长到短依次排列,从最长的序列开始叠加,当叠加总长达到所有序列总长的50%时,被叠加的那条序列即为N50长度,N50越大代表序列组装质量越好。
在具有高度相似序列重复和高杂合度的植物中,基因组序列分布分散且重复出现导致Scaffold N50相对较短,这使得即使对于长插入片段精准度下降,因此可能导致Scaffold 延伸的破坏,N50指标下降。
香蕉B基因组PKW、橡胶RRIM 600、木薯KU50、铁皮石斛云南普洱F3代GREEN和枣椰(Khalas(雌)、Deglet Noor & Medjool)的测序组装Scaffold N50和Contig N50指标均较低,其主要原因在香蕉PKW基因组上,主要是由于测序采用基因组读数映射导致组装质量欠佳,而在橡胶RRIM 600、木薯KU50和铁皮石斛云南普洱F3代GREEN则由于基因组测序覆盖度较低、测序材料不理想而致使组装难度加大。
可见,为确保高质量的基因组测序,应特别注意测序材料的选择。
1.1 热带水果1.1.1 香蕉香蕉是芭蕉科大型单子叶植物,是重要热带水果,同时也是世界第四大粮食作物。
香蕉存在4种基因组,A基因组(Musa acuminata)[7]、B基因组(M. balbisiana)[8]、S基因组(M. schizo-carpa)[29]和T基因组(Australimusa)。
自然演化和种间杂交导致A和B基因组产生多种基因型(二倍体:AA、BB、AB;三倍体:AAA、AAB、ABB;四倍体:AAAB、AABB、ABBB),大多数可食用栽培品种是三倍体。
在人为驯化过程中培育出野生二倍体杂交的三倍体单性结实杂种,通过营养繁殖进行扩繁。
杂交基因组含有不确定数量的A和B基因组等位基因,使香蕉遗传性状的研究复杂化。
香蕉在生产过程中面临的毁灭性威胁是来自于由尖孢镰刀菌古巴专化型(Fusar-ium oxysporum f. sp. cubense,Foc)引起的枯萎病,又称巴拿马病,且该病原菌热带型4号小种(TR4)危害最为严重,尚无有效的根治方法。
因此,选第10期李丹等: 热带植物基因组研究进展18771878 热带作物学报第40卷育抗生物和非生物胁迫的优良香蕉品系迫在眉睫,而基因组测序为挖掘优良基因信息提供了重要的参考依据。