宏基因组学时代的病毒分类学

宏基因组学时代的病毒分类学
宏基因组学时代的病毒分类学

宏基因组学时代的病毒分类学

Simmonds P, Adams MJ,...et al.(2017)Consensus statement:virus taxonomy in the age of metagenomics.Nat Rev Microbiol 15⑶:161-168.doi:10.1038/nrmicro.2016.177

何庆兰译

摘要宏基因组数据中鉴定的病毒序列数量和多样性,已远远超过实验鉴定的病毒分离株。最近举行的研讨会上,专家团队讨论了一项提议,对只有通过了宏数据才知道的病毒,经过适当的质量控制,是应该可以整合进国际病毒分类委员会(ICTV)官方分类方案的。尽管单独基于宏基因组序列数据的分类法明显背离了依赖表型特征的传统分类法,然而基于病毒序列分类的强劲框架的开发,对全球病毒组学全面特征的描述是必不可少的。我们在这篇共识声明文章中,论述了为什么宏基因组学数据应该和如何能整合到ICTV分类法中去的理论依据,并介绍了得到ICTV执行委员会(EC)批准的提案。

病毒是专性细胞内寄生物,它可能感染所有细胞形式的生命。虽然,病毒学家传统地专注于引发人类、家养动物和农作物疾病的病毒,然而近年来在宏基因组测序,特别是环境样本的高通量测序的进展,揭示了生物圈到处存在惊人的大量病毒组。全球的大多数环境中,任何时候均存在着至少1031病毒粒子,包括海洋和淡水的生活环境和多细胞的胃肠道中可检出的病毒粒子数要超过细胞数量的10-100倍[1-5]。为了帮助理解存在病毒绝对数量的概念,比喻地说,它们目前的生物量估计相当于7500万头蓝鲸的重量(约2万亿吨),如果将它们互相贴着地摆放起来,其长度可跨越65个银河系[6]。除了它们惊人的数量,病毒在其性质、遗传物质的组成、基因序列和编码的蛋白质、复制机制、与它细胞宿主的相互作用、无论它们之间是敌对的共生的还是互惠的等方面,具有令人惊叹的多样性[7]。水生环境尤其是包含多样化的病毒形态,包括单链(ss)和双链(ds)的DNA和RNA病毒,它们的基因组大小从不足2000个碱基至超过200万个碱基[4]。尽管到目前为止,对感染细菌的dsDNA病毒(噬菌体)研究得最为深入,但最近的研究表明约50%的海洋病毒却是ssDNA和RNA基因组[8]。

宏基因组数据正改变着我们关于病毒多样性的观念,并因此挑战我们认识和分类病毒的方法[9]。历史上,ICTV对新发现病毒的描述和分类,需要关于病毒粒子的宿主范围、复制周期、结构和性状等实质性的信息,然而,高通量测序和宏基因组方法已从根本上改变了病毒学,现已知仅从序列数据获得的病毒数量要比实验鉴定的多许多。例如,类双生病毒科(Genomoviridae)目前只包括一单个分类的病毒,然而却已对不同环境中120多种可能的成员进行了测序。虽然,这些经序列测定的病毒,缺乏有关引导它们分类到科中的属和种的宿主和其他生物学特性[10]。事实上,来自基因组数据小[11-14]、中[15-18]和大[19-20]基因组的大量完整的或近乎完整基因组序列已被组装。完全由这种分析鉴定的新病毒群,着重地证明了宏基因组方法在发现病毒中的能力,所发现新病毒中的一些在调节生态系统、而其他一些可以与宿主共存却不引起明显的疾病或甚至是互惠中具有关键的功能[7]。然而,实际情况是,往往可能很少的病毒会是有引发人类疾病或影响全球经济的病原体那样水平的实验特性。

病毒是否可由宏基因组学鉴定和应将其纳入单独以序列为基础的ICTV官方分类方案,是急需解决的问题。针对这一问题,2016年6月举行了由病毒发现和环境监测领域的特邀专家以及ICTV执行委员会成员参加的研讨会,讨论了这种可能性,并开发了一个适宜的病毒分类法框架。我们在这篇共识文章中发布了这些提议,并同时对此研究成果的基本原理作出了

解释。我们的提案随即得到了ICTV执行委员会的认可。

病毒的多样性

环境病毒样本中潜在分类单元的数量,与现已由ICTV分类的数量之间的差异是惊人的大。作为塔拉海洋探险(Tara Oceans expedition)项目的一部分,最近对世界范围内43个洋面位点的dsDNA病毒序列的分析,鉴定区分出5476个dsDNA病毒群[21],但是至今由ICTV分类的相应病毒群则只有39个。这些病毒群中的大多数,既是数量丰沛却又地理分布广泛,但是,几乎所有这些病毒都未被纳入已经确立的病毒分类单元[图1]。早期的不同海洋生境病毒组研究,提示了病毒的巨大多样性[22,23],虽然那时的测序技术尚不能直接地进行全基因组鉴定,只是用数学模型预测了几十万个DNA病毒基因型。最近对不同的数千个样本进行的全面宏基因组分析,发现了大约125000个新的病毒基因组,已鉴定的病毒基因组数量增加了16倍[24]。同样地,随着研究技术的进展,海洋和其他生态系统中的ssDNA和RNA病毒越来越明显地比当前已鉴定的病毒具有远远更高的多样性;然而,尽管这些新病毒具有生态重要性,但仍然还是一类候补性的成员[11,25-31]。宏基因组数据中鉴定的ssDNA病毒编码一种进化保守的复制相关蛋白(Rep),然而其其他基因的数量、定向和进化起源,在这些循环的编码Rep ssDNA病毒(CRESS-DNA病毒)中是高度易变的[32]。系统发育提示,除了落在4个簇集外围的大量病毒以外,这些病毒中的一部分明显的地簇集在已经鉴定的4个科中[图2]。除海洋环境外,通过宏基因组在野生植物中发现的大多数病毒似乎是持续存在的,但这些病毒中只有很小的一部分由ICTV分类为种[33]。已在陆地环境样本中[24,36]鉴定的数个真核生物的和原核生物的病毒,和由类似报告报道的来自昆虫[34,35]的一些新病毒,是高度多样性的。

人类胃肠道中,尽管先前经过几十年的研究没有检测到病毒,现宏基因组研究已发现存在着惊人的大量新颖病毒。例如,一种名为crAss噬菌体的dsDNA噬菌体的~97kb基因组,它在来自污水或废水样本的公开可用的宏基因组数据集中,具有比其他已知全部噬菌体合起来数量的6倍还要多。宏基因组中,病毒样颗粒产生的全部阅读序列中多达90%是由crAss噬菌体提供的,并占到公共数据库中全部人粪便宏基因组阅读序列的1.7%[17]。

最近开发的VirSorter工具[37,38],从多达15000种细菌和古细菌的基因组[37]中鉴定出了12498种细菌和古细菌的基因组,这些鉴定的新病毒使已知原核生物病毒的数量增加达10倍,却所感染的原核生物达13个门[37,38]。这些进展是在病毒发现中发生根本变化的突出证据:现在的新病毒基因组的绝大多数来源于宏基因组数据,并一直未与生物学因子直接相关。病毒学家尤其是病毒分类学家,别无选择地只有在这种新现实中进行研究工作。

目前的病毒分类法

分类法提供的框架,增强了我们对病毒的理解。它有助于病毒学家之间以及病毒学家与其他利益相关方如农民、种植公司、监管部门和潜在资助者之间的交流。然而,病毒的分类在一些基本是不同于细胞生物分类的。尤其是病毒缺乏普遍都有的基因,如此,可利用这一特性构建一个所有病毒都可安置的一体化系统发育[39-42]。因此,病毒没有相等于细胞生物的生命树,细胞生物的细菌、古细菌及真核生物(尽管由于水平基因的传播引发并发症),通过核糖体RNA和近乎通用的蛋白质编码基因的比较构建了生命树[43-45]。

ICTV只负责把病毒归类到分类单元,并给它们命名。目前,病毒的分类是把病毒归类到科、属和种的层级里,并给每个分类单元下了定义,确定了独特并受监管的名字。一些科还分出亚科,每个亚科再包含独立的属,少数科则被升级到更高的分类单元目。ICTV通过原种表(MSL)发布病毒分类信息。目前,该表包括7目、112科、610属和3704个种[46](见病毒分类:2015发布),并定期出版包括附加描述资料的ICTV报告[47]。这种MSL,通常根据专门研究团队(见ICTV研究团队)对每年呈报给ICTV执行委员会(EC)的分类提案(见当前ICTV EC网页)的研究结果进行更新。然后,这些提案经ICTV EC根据《国际病毒分类和命名准则》(ICVCN;见国际病毒分类和命名准则网页)制定的一套最低限度规则和所提供的强有力支持证据,进行详细的审查,以备可供公众使用。然后,这种新的分类再由ICTV成员投票批准,并纳入每年一份的MSL。

最低的分类层级是种,在ICVCN中的种定义为“一个单源(系)的病毒群,其特性可由多个标准与其他病毒种相区别。”历史上,术语“多重标准”被解释为有关特性如在细胞中的复制性能、病毒粒子形态、血清学、核苷酸序列、宿主范围和流行病学或动物流行病学。然而,由各个研究团队详细研究和由ICTV批准时,这些标准在应用于不同科病毒的分类中,存在着相当大的差异。

ICVCN对更高分类层级的明确规定给予了较大的自由度,给属定义为“具有一些确定共有特征的一群种组成为属”,科的定义为“具有一些确定共有特征的一群属(这些属无论是否组成亚科)组成为科”和目的定义为“具有一些确定特征的一群科组成为目”。这些较宽松的标准包容了在更高层级分类中应用方式的实质性变化。作为一个对脊椎动物和植物的病毒近似指南的分类标准,一个科中的不同属成员典型地具有同源结构和复制相关基因的类似基因组组织,不过,也通常具有非同源的辅助基因,例如那些参与逃避宿主防卫机制和植物中病毒移动的辅助基因。相比之下,不同科之间的病毒,通常具有完全不同的基因组组织和可能缺乏任何可检测的基因关联性。这种同源性的存在,即使不是非常相似,RNA病毒中的RNA依赖RNA聚合酶(RdRp)、RNA病毒中的蛋白酶和解旋酶、和小ssDNA病毒中的Rep编码基因,可能在任何情况下,均可使不同科之间的遥远进化关系得到鉴定;这种关系可能会形成创建一个目的基础。这种遥远关系鉴定的过程和对更高层级分类群分类适合性的评估,决不是小事,因此对目的创建需要特别仔细地考虑。例如,在差异巨大或真核生物的巨型dsRNA病毒中存在着一组实质性的共有基因,已促使形成了一个创建“巨病毒目”(参考文献48)的提案,迄今为止,在这个领域中还没有缺乏共识的提案被ICTV所接受过。类似地,对CRESS-DNA 病毒创建一个目的提案,正在被相关的ICTV团队仔细地考虑。

宏基因组学时代的病毒分类

过去ICTV批准一个病毒新种,通常取决于各个病毒所具有独特生物学特性的可用证据。此要求限制了已分类并归入MSL的病毒数量。由于现在大多数新病毒是由基因组学发现的,但缺乏直接相关的生物学因子,所以在此宏基因组学时代召开了一个开发病毒分类新框架的研讨会议(框1;补充信息S1(框))。研讨会上的讨论,反映出由宏基因组数据所引起挑战的事实,并不是病毒所特有的(框2)。

源自环境样本组装的序列,通常包含新病毒完整而经过验证的基因组,但是没有直接提供它们的生物学特性。单独根据序列信息的病毒分类可能会导致是序列而不是病毒的分类,这种已觉察到的限制性,升高了人们对此问题的关注度[49]。然而,我们认为在采取适当预防措

施(见下文)的情况下,样本中病毒序列的检测是能提供充分证据以推断相关病毒的存在。事实上,病毒完全可被检测、鉴定和分类的概念,得到了在数量激增的病毒发现领域中它们序列分析的有力支撑。考虑到病毒的特性,大部分或全部是由基因组编码的,单独根据病毒序列信息分类之后,基本不会受到缺乏生物特性的限制,但是我们无能正确地阅读这种信息和坚定地推断酶功能、病毒粒子结构和其他的表型特征。

序列数据提供的丰富信息,可用于分类的目的,例如进化关系、整个基因组组织(基因含量和排序、编码蛋白的预测和特征性重复序列的存在)、基因组表达的特征、基因组复制策略、各种独特基序(例如例如聚合蛋白裂解位点、内部的核糖体进入位点、末端序列、结构皱褶和宿主范围决定因子[50])的存在或缺乏,总体和局部基因组成分的特征(GC含量、双核苷酸频率[51]和编码使用)。因此,序列分析可提供分类到种所需要的多重标准。实际上,病毒分类中序列信息的成功应用已预示了前宏基因组学时代。例如,克隆序列的生物信息学特征促成了丙型肝炎病毒的发现,预测了该病毒的特性和复制策略、黄病毒科类似成员的特征,以及开发出有效的诊断和筛查试验[52,53];这些进展要依靠于病毒粒子的可视化、体内病毒蛋白的检测和细胞培养中病毒生长的成功达许多年。

然而,重要的是要认识到应用宏基因组数据集中,序列组装的病毒基因组对病毒的分类需要解决的几个技术问题。这种序列通常源自混合的病毒群体,因此存在着装配成人工嵌合基因组的风险。此外,目前的方法不适合组装分节的或多部分基因组病毒的完整基因组。另一个出现的实际问题,病毒衍生序列被整合进了宿主基因组(例如内源性病毒样元件和前噬菌体),其中的许多被转录而存在于RNA库。为了使宏基因组序列用于分类,这些问题需要通过强有力的计算和实验方法来解决。然而,这些告诫并不代表病毒分类的根本性障碍,随着用于创建宏基因组序列的技术不断地改进,其中的许多问题尤其是那些与重新组装相关的问题将会得到解决。这些改进,包括生成更长的阅读序列和应用模板循环化,以降低错误率等方法[54]。

方案

研讨会就完全在宏基因组序列数据基础上进行病毒分类达成了共识,由此制定了一套方案(框1;补充信息S1(框))。这些方案概要地介绍于图3。

分类的基础。完全根据宏基因组数据的鉴定,依靠对数据完整性的检查和执行标准的分类程序,来进行病毒的分类,将是病毒分类学的进步。预期,这将涉及到全部由宏基因组序列数据鉴定病毒组成的更高层级分类单元的创建。

创定新种。当前ICTV的种定义,可满足完全根据序列信息的病毒分类要求。病毒特征可从序列数据推断获得,包括基因组组织、复制策略、同源基因的存在和潜在的宿主范围或载体类型,可作为附加的生物学特性。缺乏表型数据的情况下,通常可依赖现有种定义来用以描述那些种。这样的信息是由基因组序列的最优推断而来的,包含了各个病毒的完整编码潜能,以及应是单独基于序列分类的最低需求。

为现有科中病毒分类新的种和属。病毒群之间的界定程序差别很大,通常是根据包括系统

发育的序列和不同的生物学特性等参数来进行界定。尽管识别直接的生物学信息可能构成现有分类单元定义的一部分,不过如果它们的序列关系可与那些该科中现存分类单元中的病毒进行比较时,就可由宏基因组鉴定把病毒分类到增加的分类单元(种和属)。

描述新的科和目。有基因组序列但其与现有分类单元中的病毒没有紧密关系的病毒,因为没有源于表型衍生的标准可以用于分类,所以就产生了一个特殊的问题。在这种情况下,可能在基于与该科中已识别病毒相比较,只有有限的或缺乏基因的同源性,而其在基因组组织或推断的复制策略中则存在着重大差异,则可以将此病毒分类到一新科中去。具有更紧密相关的宏基因组序列中存在变异簇集和模式的病毒群,可以将其分类到病毒谱系中较低的层级。然而,一个新科的创建和把属和种归纳到其中,将需要相当大数量序列信息和一个能容纳它的可靠分类框架的开发。定型的簇集和网络分析方法,用来创建基于同源基因检测和它们基因多样性的相似性度量标准[55-57],并应严格地评估它们在强有力分类方法开发中的有效性。这种框架,可能必须按病毒群量身定制。例如,噬菌体分类通常基于病毒粒子的序列和结构[58],但这些特征可能不适于动植物RNA病毒的分类,其中更深层次的关系在RNA聚合酶和其他保守的复制相关蛋白序列中往往最明显[59]。

仅自序列数据鉴定的分类群的命名。目前由ICTV应用的分类单元命名系统,可容易地扩展应用于是由宏基因组序列数据创建所增加的种、属和科。此外,分类群可能包含了由不同方法鉴定的病毒。因此,最初所包含的那些病毒种,仅从可能评估的序列数据鉴定而来,甚至所包括的病毒种是由分离鉴定和直接地由其生物学特性所定义。于是,宏基因组状态属于并可自一特定病毒和及已分类的不完整分类单元的记录序列中重新获得。虽然,一些病毒学家采用了“相关”一词作为那些在宏基因组数据集中鉴定病毒命名的一个部分(例如人粪便相关环形病毒(GQ404856(REF.60);其他例子见REF.12、13、26、61),而没有必要把这种或其他等效的细菌术语“暂定种”整合到病毒分类单元名称中去。

病毒分类程序的改进。现在向ICTV报关病毒分类提案的程序中,原则上,仅提供将定分类病毒的已知序列就足够了。不过,这一程序仍可通过对数据的准确性和完整性适当的质量检查的电子提交方法的开发,而得到实质性的改进和使得效率更高。尤其是可以改进提案的格式,使众多的病毒种(可能多达数百或数千)能在同一提案中呈报,而无不必要的重复信息。此外,还可以开发缩短处理提案和更新MSL所需时间的程序

ICTV的认可。作为采用基于宏基因组的病毒分类法的第一步,ICTV EC于2016年8月22-24日举行的研讨会期间,对呈报的提案进行了讨论,并开发了基于宏基因组的病毒分类法。呈交的提案得到了执行委员会全体成员的支持(其中一位无法出席会议的成员此后即表示支持),ICTV并将该提案的实际执行视作为一项高度优先的事。这个规程将包括积极地邀请病毒学界提交基于宏基因组序列的分类提案、提供关于数据标准的指南(包括序列的质量和完整性)和为大序列数据集开发更有效的数据呈递工具。ICTV EC计划在一篇独立的文章中解释和发展这些步骤。

结论

我们认为现在是通过仅从宏基因组数据鉴定并承认其是真正的病毒,而这取决于对数据完整性的适当检查及遵循分类方法的标准程序。我们期望这个流程将导致更高层级分类单元的创建,这种分类单元由宏基因组学鉴定的完整病毒所组成。

我们认为本文概述提案的实施,将使极大扩展的合规病毒分类法会对未来病毒多样性的研究作出重大的贡献。只有接受宏基因组学方法所获得的序列,才真正地代表了把它们包括在分

类方案中的现存病毒,我们期望能更好地了解它对全球病毒组学的生态、历史和影响。

图1.海洋病毒的广泛性、丰度和从属关系。全球海洋病毒组(GOV)数据集鉴定了15222个病毒群[69],本图显示了它们的流行情况(x轴,采样站数中检测到的病毒群体)、平均丰度(y 轴,标度log10,覆盖所有样本中检测到的病毒群的标准化平均值),按病毒群宿主归属分类标以不同颜色(从属关系是基于最佳基本局部比对搜索工具(BLAST)找准预测的基因;一个病毒种群与一个分离的病毒相关联,而宿主中的病毒有≥50%预测基因与其相关时,该病毒就归属于此宿主;15222个病毒群可归属于512个宿主)。此图由美国俄亥俄州立大学的S.Roux和M.B.S.提供。

图2.CRESS-DNA病毒的遗传多样性。695个CRESS-DNA病毒的复制相关蛋白序列与来自双生病毒科(Geminiviridae)、矮缩病毒科(Nanoviridae)、圆环病毒科(Circoviridae)、类双生病毒科(Genomoviridae)、和一组与双生病毒或矮缩病毒相关的阿尔法卫星(alpha satellites)的10个代表性Rep序列进行了比较。氨基酸序列用快速傅立叶转换进行多重比对(MAFFT;G-INS-i选项)[70],并应用Fasttree[71]构建了一株最大似然系统发育树。SH(Shimodaira-Hasegawa)-类支持少于50%的分枝就断落。

框1.一个促进病毒分类的研讨会

维康(Wellcome)信托基金资助了促进宏基因组时代病毒分类框架的研讨会。研讨会由P.S.组织和主持并由本地的M.L.N.管理,于2016年6月9-11日在美国马萨诸塞州波士顿召开。参会人员在病毒基因组学、宏基因组环境研究和病毒分类(26名参会人员中的13名是ICTV EC的成员)等方面具有广泛范围的专长,他们在展示资料的基础上,进行了广泛范围的讨论,与会人员着手制定了一系列的专家建议,供ICTV EC进一步地审议。

研讨会的理解是,宏基因组学术语适用于任何缺乏生物学的或其他特性的病毒序列,尽管在

实践中“缺乏”的定义与在文献中的有所不同。现在的序列数据在病毒分类中是至关重要的,因为目前只有它们提供了分类必需尺度上表达进化关系的可靠资源;然而,研讨会也认识到由高通量测序从环境样本中获得的数据构成了重大的挑战,特别是因为越来越强力的方法产生了如此大量的数据,却它们很少或根本没有与生物学信息相关联。

研讨会参与人员得出结论,在病毒分类中缺乏病毒分离株或直接的生物学数据,如可视的病毒粒子或疾病的征兆或症状情况下,应用宏基因组的序列分类是完全可以的。本共识声明文章中讨论并开发了一系列提案(另见补充信息S1(框))。这些提案,随后得到了ICTV EC的认可。

框2.根据宏基因组数据进行细菌、古细菌和真菌的分类

用于病毒分类及分类群命名的程序,与用于细菌和古细菌的程序有很大的差异。《国际细菌命名法》,只规定了新提种的名称,而没有把这些细菌种正式分类到更高分类层级中去。共有2053种细菌和古细菌被批准列入1980年的《国际原核生物系统学委员会细菌名称表》。从那时起,另外的13434种有效的名称已在批准的刊物中作了描述[62]。然而,普遍地认为这个总数与通过环境筛查已发现的数百万种新细菌和古细菌的保守估计是不一致的[63,64]。给细菌和古细菌种命名,需要定义生物学特性例如形态学、代谢和生态学的信息来区分新种与先前分类的细菌的不同。另外的要求是这个有机体必须培养,并至少在2个国际资源库中储存1个分离株。为了克服这种限制,许多作者提倡应用序列数据推断的表型特征作为细菌种分类所需要的标准[63]。此外,相对较少数量(约350种)的非培养物,虽然没有获得分离株,但可清楚区分的细菌和古细菌,则用限定词“暂定种”命名这些种[65]。历史上,虽然大多数原核生物种成员现在有可用的16S核糖体RNA基因序列,但序列信息未曾用于细菌和古细菌的分类,这就导致确定了许多同义名(同一菌种具有不同的好几个名字)。尽管在病毒与细菌、古细菌之间的两种进化路线和分类方法上存在着重大差异,目前在这两个领域的分类中则具有相同的挑战:事实证明代表不同分类群的惊人数量的不同基因组,正在持续地从宏基因组学研究中积累起来。

关于其他微生物也有类似的评论。例如,真菌的分类相似于细菌和古细菌,《国际藻类、真菌和植物命名法》规定,对在四个国际资源库之一中储存典型样品,具有类似的要求。种的分类,仍然是主要基于生物学特性。事实上,同一真菌在有性和无性阶段具有不同的形态类型,因而往往分类为不同的种甚至属,不过近年来,为纠正这一问题已进行了认真的尝试[66]。同样地,以前没有进行类似性的比较,只到最近序列数据可用时,才鉴定和删除同义名。可以预期,宏基因组学能使真菌分类产生重大的变化,因为只有一小部分真菌被认为是可以培养的,却环境中不同真菌的数量可能达数百万之多[68]。基因组标志物的利用,例如内部转录间隔(ITS)区,被认为可用作真菌基因组分类的生物条形码[67]。

图3.所提分类方法的概要。所提分类方法(红色箭头),可使宏基因组学序列数据和传统由

病毒衍生的序列用于病毒的分类。通过病毒序列的生物信息学分析,推断的生物学特性与序列相关性及基因含量信息、和可选的任何观察到的生物学特性(虚线)一起,都可用作ICTV 分类办法中的种和更高层级分类的定义标准。本程序(红色箭头)不同于当前(绿色箭头)和先前实行的(蓝色箭头),其中生物学数据和/或宿主信息和序列数据(当前分类法),单独的生物学数据(1970s-1990s)是分类所需要的。

宏基因组学的研究进展

宏基因组学的研究状况及其发展 摘要:宏基因组学是近年来发展起来的一门新兴学科,主要技术包括从环境样品中提取微生物混合基因组DNA、利用可培养的宿主菌建立宏基因组文库及筛 选目的基因。该技术可以克服传统培养技术的不足,是研究未培养微生物、寻找新功能基因和开发获得新资源的重要新途径。目前宏基因组学已广泛应用于各个领域,并在医药、农业、能源开发、环境修复、生物技术、生物防御等方面有了较深入的研究。 关键词:宏基因组学、宏基因组、基因组文库构建、文库筛选、未培养微生物、研究进展 随着微生物学的发展,微生物基因组全序列测定计划正在全球被快速地推行,但现有技术条件下,自然界存在的可培养微生物不到总数的1%,阻碍了该计划 的发展,使得绝大多数的微生物资源不能被开发和利用。21世纪初,随着测序能力的提高和基因组学的发展,科学家提出了一种研究不可培养微生物基因组的新思路——直接对含有各种不可培养的微生物的群体进行基因组序列的测定。这类研究称为Metagenomics,前缀“Meta”源于希腊语。意思是“超越”。科学家选择它来表示这种基因组研究超越了传统意义上分析单一物种的基因组学,将研究对象定为由种类众多的微生物组成的整个菌落。国内的研究者也据此将该术语翻译为“宏基因组学”。 1 宏基因组的概念 宏基因组 (也称微生物环境基因组、宏基因组学、元基因组学、生态基因组学) 是由Handelsman等1998年提出的新名词, 其定义为“the genomes of the total microbiota found in nature”,即生境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因, 目前主要指环境样品中的细菌 和真菌的基因组总和。而所谓宏基因组学就是一种以环境样品中的微生物群体基因组为研究对象, 以功能基因筛选和测序分析为研究手段, 以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组 DNA, 克隆DNA到合适 的载体,导入宿主菌体,筛选目的转化子等工作。宏基因组文库既包含了可培养的又包含了不能培养的微生物基因,避开了微生物分离培养的问题,极大地扩展了微生物资源的利用空间,增加了获得新的生物活性物质的机会,为新的医药产业和发现新的生物技术提供丰富的基因文库,并利于环境微生物有机群体的分布和功能的研究。 2 宏基因组学的研究过程 2.1 宏基因组文库的构建 宏基因组文库的构建沿用了分子克隆的基本原理和技术方法,并根据具体环境样品的特点和建库目的采用了一些特殊的步骤和策略。一般包括样品总DNA的 提取、与载体连接和克隆到宿主中。 2.1.1样品总DNA的提取 宏基因组文库构建的关键之一是获得高质量的目的样品的总DNA。目的样品 的采集是第一步,除了需严格遵循取样规则外,取样中应尽量避免对样品的干扰,缩短保存和运输的时间,使样品能更好地代表自然状态下的微生物原貌。 根据提取样品总DNA前是否分离细胞,提取方法可以分为原位裂解法和异位 裂解法。原位裂解法主要是通过去污剂处理(如SDS)、酶解法(如蛋白酶K)、机械

宏基因组学概述

宏基因组学概述

————————————————————————————————作者: ————————————————————————————————日期: ?

宏基因组学概述 王莹,马伊鸣 (北京交通大学土木建筑工程学院环境1402班) 摘要:随着分子生物学技术的快速发展及其在微生物生态学和环境微生物学研究中的广泛应用,促进了以环境中未培养微生物为研究对象的新兴学科——微生物环境基因组学(又叫宏基因组学、元基因组学,英文名Metagenomics)的产生和快速发展。宏基因组学通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能.在短短几年内,宏基因组学研究已渗透到各个领域,包括海洋、土壤、热液口、热泉、人体口腔及胃肠道等,并在医药、替代能源、环境修复、生物技术,农业、生物防御及伦理学等各方面显示了重要的价值。本文对宏基因组学的主要研究方法、热点内容及发展趋势进行了综述 关键词:宏基因组宏基因组学环境基因组学基因文库的构建 Macro summary of Metagenomics WangYing,Ma Yi-Ming (BeijingJiaotongUniversity, Institute of civil engineering,)Key words:Metagenome; Metagenomics;The environmental genomics 宏基因组学(Metagenomics)又叫微生物环境基因组学、元基因组学。它通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。其主要含义是:对特定环境中全部微生物的总DNA(也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库和筛选等手段获得新的生理活性物质;或者根据rDNA数据库设计引物,通过系统学分析获得该环境中微生物的遗传多样性和分子生态学信息。 1.起源 宏基因组学这一概念最早是在1998年由威斯康辛大学植物病理学部门的Jo Handelsman等提出的,是源于将来自环境中基因集可以在某种程度上当成一个单个基因组研究分析的想法,而宏的英文是"meta-",具有更高层组织结构和动态变化的含义。后来伯克利分校的研究人员Kevin Chen和LiorPachter将宏基因组定义为"应用现代基因组学的技术直接研究自然状态下的微生物的有机群落,而不需要在实验室中分离单一的菌株"的科学。 2 研究对象 宏基因组学(Metagenomics)是将环境中全部微生物的遗传信息看作一个整体自上而下地研究微生物与自然环境或生物体之间的关系。宏基因组学不仅克服了微生物难以培养的困难, 而且还可以结合生物信息学的方法, 揭示微生物之间、微生物与环境之间相互作用的规律, 大大拓展了微生物学的研究思路与方法, 为从群落结构水平上全面认识微生物的生态特征和功能开辟了新的途径。目前, 微生物宏基因组学已经成为微生物研究的热点和前沿, 广泛应用于气候变化、水处理工程系统、极端环境、人体肠道、石油污染、生物冶金等领域, 取得了一系列引人瞩目的重要成果。 3 研究方法

宏基因组分析和诊断技术在急危重症感染应用的专家共识

宏基因组分析和诊断技术在急危重症感染应用的专家共识 感染是急危重症患者死亡的主要原因之一。近年来,随着新发病原微生物的出现、耐药病原微生物的增多以及免疫抑制宿主的增加,感染的发病率和死亡率仍居高不下,脓毒症(严重感染)患者病死率高达50%[1-3]。最新调查研究发现,中国脓毒症相关性标化死亡率为66.7例/10万人口,全国每年共有脓毒症相关性死亡病例近103万例[3]。重症感染起病急、进展快、病原体复杂,短时间内能否明确致病病原微生物至关重要。 传统的病原微生物检测方法主要包括形态学检测、培养分离、生化检测、免疫学和核酸检测。因操作简单、快速、技术要求不高,同时具有一定的诊断敏感性和特异性,目前仍在临床上广泛使用。但传统的检测方法在敏感性、特异性、时效性、信息量等方面存在局限,而且对于未知或者罕见的病原微生物,无法快速识别。 基于宏基因组新一代测序技术(metagenomics next-generation sequencing,mNGS)不依赖于传统的微生物培养,直接对临床样本中的核酸进行高通量测序,然后与数据库进行比对分析,根据比对到的序列信息来判断样本包含的病原微生物种类,能够快速、客观地检测临床样本中的较多病原微生物(包括病毒、细菌、真菌、寄生虫),且无需特异性扩增[4-8],尤其适用于急危重症和疑难感染的诊断。 为了规范运用mNGS进行病原微生物的诊断、正确解读检测结果和指导治疗,我们组织了急危重病、感染病学和病原微生物学相关领域的专家,制定了本共识。 1 mNGS分析和诊断技术是急危重症感染快速、精准诊疗的发展方向 新一代测序技术是一个开放的分析和诊断系统,目前已经纳入的病原体有8000多种,其中包括3000余种细菌、4000余种病毒、200余种真菌和140种寄生虫,为疑难危重症及罕见病原微生物感染的诊断提供了有效的技术手段。 自2008年成功应用于临床诊断新发病原体感染以来[9-10],目前mNGS技术已经逐步用于临床疑难感染诊断,如华山医院张文宏团队[11]用mNGS协助确诊猪疱疹病毒的跨物种传播,并给予针对性治疗使患者痊愈,深圳市第三人民医院用mNGS确诊了一例罕见阿米巴脑炎[11-12]。 mNGS对脓毒症、免疫抑制宿主并发严重感染、重症肺部感染等疾病具有较高的临床应用价值,能够快速、精准地找到病原体;另外对于抗菌药物治疗方案的制定和治疗效果的评估具有一定的指导作用[9-16]。Long等[17]研究发现血培养联合mNGS诊断细菌或真菌感染,阳性率较单用血培养显著升高。以健康人群为基线,建立每种微生物在正常人群中的分布情况模型,进而计算脓毒症指数来评估检出微生物的核酸数量,Crumaz等[18]发现在脓毒症患者血液标本中病原菌的脓毒症指数绝对值、丰度显著升高,而且其变化与临床治疗效

宏基因组测序在感染性疾病病原学诊断中的应用

宏基因组测序在感染性疾病病原学诊断中的应用 感染性疾病一直是世界范围内疾病主要致死原因之一。WHO监测统计数据显示,在2016年全球约5690万例死亡患者中,有3项感染性疾病(下呼吸道感染、腹泻病、结核病)位列前10大死因,共造成的死亡数约占总死亡数的10%,其中下呼吸道感染造成约300万例患者死亡,腹泻病造成约140万例患者死亡,结核病造成约130万例患者死亡。感染性疾病的病原体十分复杂,包括细菌、病毒、真菌及寄生虫等,而在目前的临床微生物检测工作中,微生物实验室对病原体的诊断主要还是依赖自19世纪即开展的培养、染色镜检等传统检测方法,以及后续发展的核酸扩增检测(例如PCR)、分子免疫学检查(例如ELISA)等检测手段,这使得临床医生对感染性疾病的病原学诊断、病情评估及治疗方案制定等存在许多困难。目前仍有约60%的感染性疾病病例的病原体是诊断不明的。由于宏基因组测序(mNGS)对病原学诊断具有无偏移、全覆盖、高效率等优势,越来越多的学者尝试将其应用于临床病原学诊断之中。在此,我们回顾了近些年宏基因组测序在病原学诊断中的临床应用进展情况。 1.临床宏基因组学 宏基因组的概念最早在1998年被学者提出,指在一份独立的土壤标本中,所有微生物的基因组信息的总和,包括那些无法培养的生物体的基因组信息。后来,宏基因组的概念不仅仅局限于描述环境来源的标本,还被逐渐沿用于描述临床来源标本中的生物遗传信息特征。临床宏基因组学指为获取临床相关的微生物信息而对临床来源的标本中所有的核酸序列进行测序分析的一门学科间。宏基因组测序主要是通过以新一代测序为代表的高通量测序技术,对临床来源的标本进行宏基因组学分析,以获取病原体的物种分类、血清型、耐药性、毒力等一系列生物信息。由于宏基因组测序不依赖病原体培养结果且可以不对可疑病原体的标志核酸序列进行靶向扩增,这使得检测结果更具客观性和全面性,且更迅捷,这是对传统实验室检测手段的有效补充。《中国成人医院获得性肺炎与呼吸机相关性肺炎诊断和治疗指南(2018年版)》也指出临床宏基因组学能明显提高病原体诊断的敏感性,部分病原体检测花费的时间更短,尤其对罕见病原体的诊断具有优势,可审慎地应用于临床实践之中。正是得益于测序技术的不断进步与发展,

宏基因组学的一般研究策略

宏基因组学的一般研究策略 摘要: 宏基因组学是目前微生物基因工程的一个重要方向与热点。它把微生物的总群体特性与基因组学实验手段结合了起来,包括从环境样品中提取总DNA、再用可培养的宿主微生物建立文库及筛选目的克隆和基因。该法是研究不可培养微生物、寻找新的基因和开发新活性产物的重要新途径。它避开了微生物分离、纯化和培养的步骤,大大扩展了微生物资源的利用范围。本文旨在介绍宏基因组学的一般研究方法并结合我们的实验情况,对这一崭新领域中的最新研究策略进行了简要综述。 关键词: 宏基因组学, 不可培养微生物, 文库构建, 文库筛选,研究策略 Strategies for accessing metagenomics for desired applications Abstract: Metagenomics is a new field of microbial genetic engineering. It has the characteristics of microbial ecology and the methodology of genomics. Metagenomics includes genomic DNA isolation, library construction and screening strategies, and can be used in the discovery of new gene and biocatalysts and in the study of uncultured microorganism. Metagenomics can overcome the advantages of isolation and cultivation procedures in traditional microbial method, and thus greatly broaden the space of microbial resource utilization. In this paper, we mainly reviewed the metagenomic methodology, together with the latest advances and novel strategy in this research field. Keywords:Metagenomics; Uncultured microorganism;Library construction;Library screening Research strategies 大自然中蕴藏着无数具有重要价值的微生物及其活性产物,也是新基因及生物学资源的重要源泉,对其进行研究成为微生物学和分子生物学研究的一个重要方向。然而人们现在能够培养与利用的不到环境中总微生物的1%[1]。宏基因组学(metagenomics)是直接从环境样品中提取全部微生物的总DNA, 避开了分离、纯化和培养微生物的过程来构建宏基因组文库,用基因组学的研究策略来研究环境样品中的总微生物的组成及其在群落中的功能等。现在,宏基因组学技术方法已在微生物多样性,微生物细胞间的相互作用,新基因和新型生物催化剂的开发,新的抗生素的开发及环境生态等方面得到了广泛应用[2]。本文旨在介绍宏基因组学的一般实验方法并结合我们的研究情况,对这一崭新领域中的最新研究策略进行了简要综述。深化了我们对这一学科的认识,促进了该学科的进步。 1 宏基因组学研究策略 1.1宏基因组学概要 宏基因组学是Handelsman等于1998年提出的[3], 可见是一门很新的学科,其随着基因组实验手段,生物信息学和测序技术等的日新月异也迅猛发展了起来,这个新学科是以环境样品的总微生物基因组为实验对象,通过测序分析、文库评价、产活性物质及其基因的克隆的获取和基因功能的鉴别,对微生物种群组成与生物量、生态学关系、生物化学关系与环境关系以及功能活性进行研究[4]。其主要过程包括样品和基因的富集和提取; 宏基因组文库的构建; 目的基因的筛选; 目的基因活性产物的表达(图1)。 1.2 微生物及其基因的富集 在文库筛选过程中由于目的基因比例较小, 对环境中微生物的富集不但可提高基因总量,有利于基因的提取,还可增加目的基因的比例,如Kouker 等用橄榄油富集产脂肪酶的微生物收到了很好的效果[5 ],橄榄油不仅可作为底物,还可诱导脂肪酶的合成。目前富集技术主要分为细胞水平和基因水平。其中细胞水平主要是用选择培养基来富集某些微生物, 常

宏基因组测序技术检测方法

宏基因组测序技术检测标准 简介: 宏基因组测序介绍 宏基因组学是以环境样品中的微生物群体基因组为研究对象,通过现代基因组技术手段包括功能基因的筛选和测序分析,对环境中微生物多样性、种群结构、进化关系、功能活性、相互协作关系以及环境之间的关系进行研究的新的微生物研究方法。随着高通量测序技术的发展,为宏基因组学研究提供了新的理想研究方法。高通量测序的方法无需分离环境中各种微生物,也无需构建克隆文库就可以直接对环境中所有微生物进行测序。可以真实客观的反映环境中微生物的多样性、种群结构、进化关系等。目前又可以分为针对16s DNA/18sDNA/ITS测序和针对宏基因组全序列的测序研究。下面就是对这两者的具体介绍。 一、16s DNA/18s DNA/ITS测序 16sDNA是最常用的微生物物种分子鉴定的标签,,通过对样品中16sDNA测序可以鉴定其中微生物物种的丰度和分布情况。目前,普遍使用Roche 454平台来对环境样品进行16s DNA测序。因为16s DNA序列比较相似,读长短的话,难以进行有效的比对,而454平台的平均读长在400bp左右,可以很好的避免此类问题。 二、宏基因组全测序 在这种测序方式中,我们可以假定一个环境中的所有微生物就是一个整体,然后对其中所有的微生物进行测序。这样我们就可以研究样品中的功能基因以及其在环境中所起的作用而不用关心其来自哪个微生物。可以发现新的基因,可以进行基因的预测,甚至有可能得到某个细菌基因组的全序列。此外,该项测序不单可以针对DNA水平,也可以针对全RNA进行基因表达水平的研究。 样品处理:

宏基因组样品收集主要有口腔,下呼吸道痰液,下呼吸道灌洗液,皮肤和粪便。样品采集遵照样品采集规范(人)所规定的操作来进行。尽量留足备份样品。核酸提取: 宏基因组核酸提取主要有两种方法:膜过滤法和直接裂解提取。对于液体样品如痰液,灌洗液两种方法都适用,对于固体样品如粪便宜采用直接裂解的方法。核酸提取后用NanoDrop ND-1000测定,260/280 = , 260/230 = ,电泳检测DNA 应是完整的一条带。 测序Sequencing 1)16S/18S测序: Sanger测序: 用于低通量的16S/18S DNA测序,提取宏基因组后,首先通过PCR将16S/18S 序列扩增出来,再将其连接到克隆载体上,导入感受态细胞,涂平板做蓝白斑筛选,选出阳性克隆提质粒,对质粒进行测序反应,测序反应后纯化后用ABI 3130或ABI 3730进行毛细管电泳测序。 由于其测序准确率比较高,而通量非常低,现通常用做二代测序结果的验证。454 Platform: 454平台主要包括两种测序系统:454 GS FLX+ System和454 GS Junior System。454 GS FLX+ System测序读长可以达到600-1000bp,通量450-700M,GS Junior System测序读长在400bp左右,通量在35M。

利用病毒宏基因组学寻找在瓜德罗普不同蚊种中稳定独特的核心真核病毒

利用病毒宏基因组学寻找在瓜德罗普不同蚊种中稳定独特的核心真核病毒 Stable distinct core eukaryotic viromes in different mosquito species from Guadeloupe, using single mosquito viral metagenomics 利用病毒宏基因组学寻找在瓜德罗普不同蚊种中稳定独特的核心真核病毒 作者:Chenyan Shi 等 期刊:Microbiome 时间:2019.8 影响因子: 10.465 DOI:10.1186/s40168-019-0734-2 一、研究背景 对人类来说,蚊子这种无脊椎动物是一种非常重要的病毒载体,近年来的研究证明其身上携带着大量未被研究的病毒。以往的研究通常对大量的蚊子进行宏基因组测序,而不评估单个蚊子的病毒多样性。为了解决这个问题,作者使用优化的病毒宏基因组学实验操作流程(NetoVIR)来比较2016年和2017年从瓜德罗普岛不同地点收集的埃及伊蚊和埃及库蚊的病毒量。(注:瓜德罗普是法国的海外省,位于加勒比海小安的列斯群岛中部。属热带雨林气候,平均气温26℃。) 二、实验结果 1.利用单只蚊子进行病毒宏基因组的可行性 作者将单只蚊子和混合蚊(5只蚊子)分别测序组装成contigs,然后比对注释分类为真核生物,细菌,古生菌,真核病毒,噬菌体,待确认噬菌体(噬菌体TBC),未归类病毒和暗物质(未被比对软件识别的contigs)共8个分类。通过比较单只蚊子与混合蚊在每个分类下reads数量占比、映射到nr contigs 数目、病毒读数比例(真核病毒、噬菌体和未分配病毒),发现单只蚊子样本的总读数和病毒读数比例与混合蚊样本相比无显著差异,证明了单只蚊子进行病毒宏基因组学研究的可行性。

病毒宏基因组学方法优缺点及意义

病毒宏基因组学方法优缺点及意义 病毒宏基因组学方法优缺点及意义 随着时代的发展和生物科学技术的进步,新兴的病毒宏基因组学为解决这些问题提供了契机,以下是一篇关于病毒宏基因组学探究的论文范文,供大家阅读参考。 病毒个体微小,多数病毒直径在100nm(20~200nm),较大的病毒直径300~450nm,较小仅为18~22nm,结构简单,不能独立复制需要依赖于宿主细胞复制繁殖,被许多生物学家认为是处于生命和非生命交叉区域的存在物。据估计目前对病毒的发掘还不到1%[1],对病毒的研究具有广阔的前景和现实意义。病毒独特的结构和特性给病毒的研究和鉴别带来许多困难,主要体现在两个方面:第一,病毒没有专门的宿主细胞系,60%以上的病毒无法成功的进行离体培养[2]或在培养中不能表达致病性;第二,病毒基因本身变异率高,通过与宿主间的相互作用进化,增加核酸多样性,产生新病毒,导致宿主范围扩大、跨物种传播[3].对细菌的研究可以通过保守的16sRNA的分析来定位分类信息、进化关系和种群多样性等。对于真菌有18sRNA及ITS序列。然而病毒不像细菌真菌,没有固定保守的进化标记基因。 所以一些传统研究方法的应用受到限制,不能完全满足病毒研究的需要。如电镜观察病毒的灵敏性不高,细胞培养病毒可能观察不到细胞病变,血清学反应中不但难以获得高价抗体而且容易出现交叉反应导致错误结果,传统PCR方法对未知序列及高变异的病毒研究难以发挥作用。加之近年来病毒流行病的频繁发生及其可怕的传染性,对人类及动植物的健康产生严重威胁,如HIV病毒、SARS病毒、禽流感病毒和在西非等地肆虐的埃博拉病毒[4]等,给人们造成了巨大的恐慌和经济损失。因此,对病毒基因组的研究、致病源的探索、病毒在生物体和环境中如何存在及传播、病毒病防治的研究已迫在眉睫。 随着时代的发展和生物科学技术的进步,新兴的病毒宏基因组学为解决这些问题提供了契机,宏基因组学(Metagenomics)的概念是1998年由Handelsman[5]首次提出,对特定环境中基因组的总和进行研究,包括培养的和未培养的.微生物。病毒宏基因组学(Viral metagenomics)就是宏基因组学在病毒领域的应用,即从环境或生物组织中浓缩病毒粒子的遗传物质进行生物学信息分析的技术。它的应用需要一些交叉学科的创新技术的支持,随机

宏基因组测序技术检测方法模板

宏基因组测序技术 检测方法

宏基因组测序技术检测标准 简介: 宏基因组测序介绍 宏基因组学是以环境样品中的微生物群体基因组为研究对象,经过现代基因组技术手段包括功能基因的筛选和测序分析,对环境中微生物多样性、种群结构、进化关系、功能活性、相互协作关系以及环境之间的关系进行研究的新的微生物研究方法。随着高通量测序技术的发展,为宏基因组学研究提供了新的理想研究方法。高通量测序的方法无需分离环境中各种微生物,也无需构建克隆文库就能够直接对环境中所有微生物进行测序。能够真实客观的反映环境中微生物的多样性、种群结构、进化关系等。当前又能够分为针对16s DNA/18sDNA/ITS测序和针对宏基因组全序列的测序研究。下面就是对这两者的具体介绍。 一、16s DNA/18s DNA/ITS测序 16sDNA是最常见的微生物物种分子鉴定的标签,,经过对样品中16sDNA测序能够鉴定其中微生物物种的丰度和分布情况。当前,普遍使用Roche 454平台来对环境样品进行16s DNA测序。因为16s DNA序列比较相似,读长短的话,难以进行有效的比对,而454平台的平均读长在400bp左右,能够很好的避免此类问题。 二、宏基因组全测序

在这种测序方式中,我们能够假定一个环境中的所有微生物就是一个整体,然后对其中所有的微生物进行测序。这样我们就能够研究样品中的功能基因以及其在环境中所起的作用而不用关心其来自哪个微生物。能够发现新的基因,能够进行基因的预测,甚至有可能得到某个细菌基因组的全序列。另外,该项测序不单能够针对DNA水平,也能够针对全RNA进行基因表示水平的研究。 样品处理: 宏基因组样品收集主要有口腔,下呼吸道痰液,下呼吸道灌洗液,皮肤和粪便。样品采集遵照样品采集规范(人)所规定的操作来进行。尽量留足备份样品。 核酸提取: 宏基因组核酸提取主要有两种方法:膜过滤法和直接裂解提取。对于液体样品如痰液,灌洗液两种方法都适用,对于固体样品如粪便宜采用直接裂解的方法。核酸提取后用NanoDrop ND-1000测定,260/280 = 1.8-2.0, 260/230 = 1.8-2.0,电泳检测DNA应是完整的一条带。 测序Sequencing 1)16S/18S测序: Sanger测序: 用于低通量的16S/18S DNA测序,提取宏基因组后,首先经过PCR将16S/18S序列扩增出来,再将其连接到克隆载体上,导

病毒宏基因组学方法优缺点及意义【可编辑版】

病毒宏基因组学方法优缺点及意义【可编辑版】病毒宏基因组学方法优缺点及意义病毒宏基因组学方法优缺点及意义 病毒个体微小,多数病毒直径在100nm,较大的病毒直径300~450nm,较小仅为18~22nm,结构简单,不能独立复制需要依赖于宿主细胞复制繁殖,被许多生物学家认为是处于生命和非生命交叉区域的存在物。据估计目前对病毒的发掘还不到1%,对病毒的研究具有广阔的前景和现实意义。病毒独特的结构和特性给病毒的研究和鉴别带来许多困难,主要体现在两个方面: 第一,病毒没有专门的宿主细胞系,60%以上的病毒无法成功的进行离体培养或在培养中不能表达致病性;第 二,病毒基因本身变异率高,通过与宿主间的相互作用进化,增加核酸多样性,产生新病毒,导致宿主范围扩大、跨物种传播.对细菌的研究可以通过保守的16sRNA的分析来定位分类信息、进化关系和种群多样性等。对于真菌有18sRNA及ITS序列。然而病毒不像细菌真菌,没有固定保守的进化标记基因。 所以一些传统研究方法的应用受到限制,不能完全满足病毒研究的需要。如电镜观察病毒的灵敏性不高,细胞培养病毒可能观察不到细胞病变,血清学反应中不但难以获得高价抗体而且容易出现交叉反应 导致错误结果,传统PCR方法对未知序列及高变异的病毒研究难以发挥作用。加之近年来病毒流行病的频繁发生及其可怕的传染性,对人类及动植物的健康产生严重威胁,如HIV病毒、SARS病毒、禽流感病毒和在西非等地肆虐的埃博拉病毒等,给人们造成了巨大的恐慌和经济损失。因此,对病毒基因组的研究、致病源的探索、病毒在生物体和环境中如何存在及传播、病毒病防治的研究已迫在眉睫。 随着时代的发展和生物科学技术的进步,新兴的病毒宏基因组学为解决这些问题提供了契机,宏基因组学的概念是1998年由Handelsman首次提出,对特定环境

宏基因组学研究方法及应用概述

宏基因组学研究方法及应用概述彭昌文 (山东省济宁学院生物学系 273155) 颜 梅 (山东省曲阜师范大学生命科学学院 273165) 摘 要 本文简要介绍了宏基因组的概念,概述了其原理及应用。 关键词 宏基因组 宏基因组学 环境基因组学 基因文库的构建 迄今,人们对微生物世界的认识基本都来源于对占细菌总种数不到1%的微生物的单个种群的孤立研究结果。然而微生物是通过其群落而非单一种群来执行在自然界物质与能量循环中的作用的,对微生物群落作为整体的功能认识远远落后于对其个体的认识。这种状况不利于全面认识微生物在自然界所扮演的重要角色。为了获得完整的环境微生物基因表达产物,早在1978年许多学者就提出了直接从环境中提取微生物DNA的思路,1998年,AR I A D phar maceutical公司的科学家Handels man等首次提出宏基因组的概念[1]。宏基因组(the genomes of the total m icrobi ota found in nature)是指生境中全部微生物基因的总和[2]。它包含了可培养的和未培养的微生物的基因总和,微生物主要包括环境样品中的细菌和真菌。而宏基因组学就是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系等为研究目的的新的微生物研究方法,也称为微生物环境基因组学、元基因组学或生态基因组学。它主要研究从环境样品获得的基因组中所包含的微生物的遗传组成及其群落功能,为充分认识和开发利用非培养微生物,并从完整的群落水平上认识微生物的活动、最大限度地挖掘微生物资源,提供了可能,已成为国际生命科学技术研究的热点和前沿。 1 宏基因组学的研究方法 宏基因组学的研究过程一般包括从环境样品中提取基因组DNA,克隆DNA到合适的载体,导入宿主菌体,筛选目的转化子等工作,可分为三个步骤。 1.1 宏基因组的提取 在宏基因组筛选过程中,目的基因是整个核苷酸链中的一部分,因此样品前期的富集能够提高筛选命中率。DNA的提取是宏基因文库构建的关键步骤。提取步骤通常需要满足两个条件:既要尽可能提取样品所有微生物的基因,又要保持片段的完整和纯度。目前所开发的DNA提取方法有两种:细胞提取法和直接裂解法。直接裂解法包括物理法(冻融法、超声法、玻璃球珠击打法、液氮碾磨法)、化学法(常用化学试剂有表面活性剂、盐类、有机溶剂等)及酶裂解法。另外,依据提取样品总DNA前是否分离细胞,可以分为原位裂解法和异位裂解法。原位裂解法可以直接破碎样品中的微生物细胞而使DNA 得以释放,由于无需对样品微生物进行复苏,且黏附颗粒上的微生物细胞亦能被裂解,所得DNA能更好地代表样品微生物的多样性。此法操作容易、成本低,DNA 提取率高,但由于机械剪切作用较强,所提取的DNA 片段小(1~50kb),通常适用于构建小片段插入文库(以质粒和λ噬菌体为载体)的DNA提取。异位裂解法则先采用物理方法将微生物从样品中分离出来,然后采用较温和的方法抽提DNA。此法条件温和,可获得大片段DNA(20~500kb),纯度高,但操作繁琐、成本高、得率低,通常适用于构建大片段插入文库(以柯斯质粒或者细菌人工染色体为载体)的DNA提取。1.2 宏基因组文库的构建 宏基因组文库的构建需适宜的克隆载体。通常用于DNA克隆的载体主要包括质粒、黏粒和细菌人工染色体等。质粒一般用于克隆小于10kb的DNA片段,适用于单基因的克隆与表达。黏粒的插入片段可达40kb左右,细菌人工染色体插入片段可达350kb,可用来制备由多基因簇调控的微生物活性物质的完整代谢途径的相关片段文库。1.3 目的基因的筛选 目的基因的筛选方法包括序列分析和功能分析两种。序列分析适用于小片段DNA文库的基因筛选;而功能分析通常适用于大片段DNA文库的筛选。序列分析筛选不依赖于重组基因在外源宿主中的表达,因为所使用的寡聚核苷酸引物是直接通过DNA序列中的保守区域设计的,反映了氨基酸序列的保守性,可获得未知序列的目的基因。该方法对DNA量的要求不高,筛选到新活性物质的可能性较大。序列分析的另一个手段是对宏基因组克隆测序,无论是全部或随机测序都是发现新基因的有效手段。 对于功能分析而言,首先需获得目的克隆,然后通过序列和生化分析对其进行表征。此法能快速鉴定出全新且有开发价值的活性物质,可用于医药、工农业等行业。由于此法检出率较低,工作量较大,且受检测手段的限制,所以常要借助于高通量筛选。 2 宏基因组学的应用 2.1 在生态学方面的应用 当今微生物生态学研究的主要目的之一是将微生物与其所在环境中的代谢过程相联系。应用16s r DNA作为系统发育锚去鉴定属于某种微生物的克隆,然后对基因进行测序,从而获得

最新 病毒宏基因组学方法优缺点及意义-精品

病毒宏基因组学方法优缺点及意义 随着时代的发展和生物科学技术的进步,新兴的病毒宏基因组学为解决这些问题提供了契机,以下是一篇关于病毒宏基因组学探究的,供大家阅读参考。 病毒个体微小,多数病毒直径在100nm(20~200nm),较大的病毒直径 300~450nm,较小仅为18~22nm,结构简单,不能独立复制需要依赖于宿主细胞复制繁殖,被许多生物学家认为是处于生命和非生命交叉区域的存在物。据估计目前对病毒的发掘还不到1%[1],对病毒的研究具有广阔的前景和现实意义。病毒独特的结构和特性给病毒的研究和鉴别带来许多困难,主要体现在两个方面:第一,病毒没有专门的宿主细胞系,60%以上的病毒无法成功的进行离体培养[2]或在培养中不能表达致病性;第二,病毒基因本身变异率高,通过与宿主间的相互作用进化,增加核酸多样性,产生新病毒,导致宿主范围扩大、跨物种传播[3].对细菌的研究可以通过保守的16sRNA的分析来定位分类信息、进化关系和种群多样性等。对于真菌有18sRNA及ITS序列。然而病毒不像细菌真菌,没有固定保守的进化标记基因。 所以一些传统研究方法的应用受到限制,不能完全满足病毒研究的需要。如电镜观察病毒的灵敏性不高,细胞培养病毒可能观察不到细胞病变,血清学反应中不但难以获得高价抗体而且容易出现交叉反应导致错误结果,传统PCR 方法对未知序列及高变异的病毒研究难以发挥作用。加之近年来病毒流行病的频繁发生及其可怕的传染性,对人类及动植物的健康产生严重威胁,如HIV病毒、SARS病毒、禽流感病毒和在西非等地肆虐的埃博拉病毒[4]等,给人们造成了巨大的恐慌和经济损失。因此,对病毒基因组的研究、致病源的探索、病毒在生物体和环境中如何存在及传播、病毒病防治的研究已迫在眉睫。 随着时代的发展和生物科学技术的进步,新兴的病毒宏基因组学为解决这些问题提供了契机,宏基因组学(Metagenomics)的概念是1998年由Handelsman[5]首次提出,对特定环境中基因组的总和进行研究,包括培养的和未培养的微生物。病毒宏基因组学(Viral metagenomics)就是宏基因组学在病毒领域的应用,即从环境或生物组织中浓缩病毒粒子的遗传物质进行生物学信息分析的技术。它的应用需要一些交叉学科的创新技术的支持,随机引物PCR 和新一代测序技术---高通量测序的应用大大提高了研究的效率和获取信息的丰度,克服大环境中病毒浓度低、易受干扰的不足,拓展了病毒宏基因组学的应用范围和现实作用,为探索未知病毒提供广阔的前景和应用空间。在人类预防疾病、开发疫苗方面具有重大贡献。 1病毒宏基因组学的研究过程 对于未知病毒的研究过程如下:SISPA方法是1991年Gregory和Jung在随机引物PCR方法的基础上创造的[6],SISPA-PCR使用含有已知片段的随机引物进行逆转录,这个已知片段在接下来的PCR反应中将作为引物[7],此方法先后经Breitbart[8]和Djikeng[9]等人的改进,在SISPA的基础上建立了

宏基因组学概述

宏基因组学概述 王莹,马伊鸣 (北京交通大学土木建筑工程学院环境1402班) 摘要:随着分子生物学技术的快速发展及其在微生物生态学和环境微生物学研究中的广泛应用,促进了以环境中未培养微生物为研究对象的新兴学科——微生物环境基因组学(又叫宏基因组学、元基因组学,英文名Metagenomics)的产生和快速发展。宏基因组学通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能.在短短几年内,宏基因组学研究已渗透到各个领域,包括海洋、土壤、热液口、热泉、人体口腔及胃肠道等,并在医药、替代能源、环境修复、生物技术,农业、生物防御及伦理学等各方面显示了重要的价值。本文对宏基因组学的主要研究方法、热点内容及发展趋势进行了综述 关键词:宏基因组宏基因组学环境基因组学基因文库的构建 Macro summary of Metagenomics Wang Ying, Ma Yi-Ming (BeijingJiaotongUniversity, Institute of civil engineering,) Key words: Metagenome; Metagenomics; The environmental genomics 宏基因组学(Metagenomics)又叫微生物环境基因组学、元基因组学。它通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。其主要含义是:对特定环境中全部微生物的总DNA (也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库和筛选等手段获得新的生理活性物质;或者根据rDNA数据库设计引物,通过系统学分析获得该环境中微生物的遗传多样性和分子生态学信息。 1.起源 宏基因组学这一概念最早是在1998年由威斯康辛大学植物病理学部门的Jo Handelsman等提出的,是源于将来自环境中基因集可以在某种程度上当成一个单个基因组研究分析的想法,而宏的英文是"met a-",具有更高层组织结构和动态变化的含义。后来伯克利分校的研究人员Kevin Chen和Lior Pachter 将宏基因组定义为"应用现代基因组学的技术直接研究自然状态下的微生物的有机群落,而不需要在实验室中分离单一的菌株"的科学。 2 研究对象 宏基因组学(Metagenomics)是将环境中全部微生物的遗传信息看作一个整体自上而下地研究微生 物与自然环境或生物体之间的关系。宏基因组学不仅克服了微生物难以培养的困难, 而且还可以结合生物信息学的方法, 揭示微生物之间、微生物与环境之间相互作用的规律, 大大拓展了微生物学的研究思路与方法, 为从群落结构水平上全面认识微生物的生态特征和功能开辟了新的途径。目前, 微生物宏基因组学已经成为微生物研究的热点和前沿, 广泛应用于气候变化、水处理工程系统、极端环境、人体肠道、石油污染、生物冶金等领域, 取得了一系列引人瞩目的重要成果。 3 研究方法 宏基因组学的研究过程一般包括样品和基因(组)的富集;提取特定环境中的基因组 DNA;构建宏基因组 DNA 文库;筛选目的基因;目的基因活性产物表达(图 1)五个步骤。

宏基因组测序讲解

宏基因组测序讲解

宏基因组测序 目的 研究藻类物种的分类,研究与特定环境与相关的代谢通路,以及通过不同样品的比较研究微生物内部,微生物与环境,与宿主的关系。技术简介 宏基因组( Metagenome)(也称微生物环境基因组Microbial Environmental Genome, 或元基因组) 。是由 Handelsman 等 1998 年提出的新名词,其定义为"the genomes of the total microbiota found in nature" , 即生境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。而所谓宏基因组学 (或元基因组学, metagenomics) 就是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组 DNA, 进行高通量测序分析,或克隆DNA到合适的载体,导入宿主菌体,筛选目的转化子等工作。 宏基因组( Metagenome)(也称微生物环境基因组Microbial Environmental Genome, 或元基因组) 。是由 Handelsman 等 1998 年提出的新名词,其定义为"the genomes of the total microbiota found in nature" , 即生境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。而所谓宏基因组学 (或元基因组学, metagenomics) 就是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样

宏基因组学的研究

因组学研究进展及其应用 摘要: 本文先简要介绍了当前生物化学的一些研究热点,再针对因组学展开论述,介绍了因组学的产生背景和概念,当前的研究进展及应用。 因组学尝试通过免培方法获得微生物的纯培养,主要技术包括DNA的提取、文库的构建和目标基因克隆的筛选,可用于开发新型酶、发现新基因、筛选医药等方面。 关键字:因组学;因组学基本策略;文库构建与筛选;因组学研究进展及其应用引言: 微生物是地球上种类最多、数量最大、分布最广的生物群。仅原核生物(细菌和古细菌)即构成地球生物总量的的25~50 %[1]。自然条件下,包括病毒在的微生物,通过群落广泛参与C、N、O 和S等重要元素的循环转化,在人体的食物消化、毒素降解及机体免疫反应,环境污染物降解等方面发挥着重要作用[2]。人们对于微生物的研究主要是建立在纯培养基础上,后来人们发现通过纯培养方法估计的环境微生物多样性只占总量的0.1%~1%[3],多达99%以上的微生物是不可培养的, 其中蕴含着巨大的应用潜能——其代产物中可能有众多具有应用开发价值的化合物[4]。为了研究不能培养的微生物,一个全新的理念——因组学应运而生,该技术不需预先培养就能开发这些微生物基因组,目前已广泛应用于微生物活性物质的开发与利用、环境微生物种群分布及动态变化分析等方面的研究[5]。 因组学的提出为解决上述问题提供了一个可行途径。因组学以生境中全部

DNA作为研究对象,通过克隆、异源表达来筛选有用基因及其产物。由于突破了传统研究领域无法涵盖不可培养微生物的瓶颈,因组学概念及研究方法一经提出,就被广泛接受。尽管在方法上还存在一定缺陷,但并不妨碍不同领域学者利用该方法来研究各种生境中微生物生态以及筛选功能基因的热情,有关因组学研究的文章逐年增多[4]。 1.因组学的概念 因组( metagenome) 的概念是指从生境样本中取得全部微生物的基因组, 而不是采用传统的培养微生物的基因组。因组的样本既包括可培养的微生物,也包括更大量的传统方法无法研究的不可培养微生物[6]。而所谓因组学 (也称元基因组学Metagenomics 、微生物环境基因组学Microbial Environmental Genomics、生态基因组学Ecogenomics ) 就是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法,一般包括克隆、构建文库和功能分析筛选等工作[7]。 2.因组学的基本策略及方法 2.1因组学的基本策略 因组学的研究还处于初期发展阶段,但其研究的基本过程和基本策略已基本清楚。在此要强调的是,因组学研究有着明确的指导思想,它是在反向生物学原则指导下,基于特定生态环境基础上,依据整体、系统、动态变化和相互作用的观点,运用特殊的技术路线和方法,对研究围中所有基因组展开研究的学科。 因组学是一种整体性的研究策略,它建立在微生物基因组学的迅速发展和聚

相关文档
最新文档