诺禾致源高分文章集锦-植物基因组
denovo-技术支持类-基因组denovo组装新技术

图1 10X Genomic linked-reads辅助基因组组装流程图表1 不同组装策略组装人的基因组大小和ScaffoldN50长度[1]随着技术的发展,越来越多的物种完成了基因组的测序工作。
但基于二代测序短读长的限制,制约了参考基因组的组装质量,从而影响了后续研究工作的开展。
如今,我们可以利用更多的新技术,如10X Genomics,BioNano,ChiCago等,将基因组组装结果进行完善,进一步构建出高质量的参考基因组。
10X Genomics linked-reads10X Genomics公司通过在序列中引入barcode序列,能够得到跨度在50-100Kb的linked reads信息,与二代测序数据相结合,在Scaffold 的组装上能够得到媲美三代测序的组装结果(表1)。
展开阅读10X Genomic linked-reads辅助基因组组装流程如下图所示:图2 光学图谱工作流程图表3 利用Chicago技术提升相应的指标图3 Chicago文库构建流程图[6]Chicago文库构建流程如下:基因组 de novo 组装新技术助力文章冲刺新高度[1] Mostovoy Y, Levy-Sakin M, Lam J, et al. A hybrid approach for de novo human genome sequence assembly and phasing[J]. Nature methods, 2016. 阅读原文>>/nmeth/journal/v13/n7/abs/nmeth.3865.html[2] Pendleton M, Sebra R, Pang A W C, et al. Assembly and diploid architecture of an individual human genome via single-molecule tech-nologies[J]. Nature methods, 2015. 阅读原文>>/s?wd=paperuri:(ac8d0768*******de9b67e959e5d924b)&filter=sc_long_sign&sc_ks_para=q%3DAssembly+and+diploid+architecture+of+an+individual +human+genome+via+single-molecule+technologies.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=14004045691020250024[3] VanBuren R, Bryant D, Edger P P , et al. Single-molecule sequencing of the desiccation-tolerant grass Oropetium thomaeum[J]. Nature, 2015. 阅读原文>>/s?wd=paperuri:(4f4baa5f458c3598ebfa32b1017a4569)&filter=sc_long_sign&sc_ks_para=q%3DSingle-molecule+sequencing+of+the+desiccation-tolera nt+grass+Oropetium+thomaeum.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=3671601047694710580[4] Dong Y, Xie M, Jiang Y, et al.Sequencing and automated whole-genome optical mapping of the genome of adomestic goat (Capra hircus). Nature biotechnology, 2013, 31(2): 135-141. 阅读原文>>/nbt/journal/v31/n2/full/nbt.2478.html [5] Zhang Q, Chen W, Sun L, et al. The genome of Prunus mume. Nature communications, 2012, 3: 1318. 阅读原文>>http://pubmedcentralcanada.ca/pmcc/articles/PMC3535359/[6] Bredeson J V, Lyons J B, Prochnik S E, et al. Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity[J]. Nature biotechnology, 2016, 34(5): 562-570. 阅读原文>>/s?wd=paperuri:(030555bb483ea9f72bf308bf22787f02)&filter=sc_long_sign&sc_ks_para=q%3DSequencing+wild+and+cultivated+cassava+and+related +species+reveals+extensive+interspecific+hybridization+and+genetic+diversity.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=13838504648880517513[7] Putnam N H, O'Connell B L, Stites J C,et al. Chromosome-scale shotgun assembly using an in vitro method forlong-range linkage[J]. Genome research, 2016, 26(3): 342-350. 阅读原文>>/s?wd=paperuri:(4c8ec46542c7e21bfa15ae10f7a9f8bf)&filter=sc_long_sign&sc_ks_para=q%3DChromosome-scale+shotgun+assembly+using+an+in+vit ro+method+for+long-range+linkage.&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=36575566455777547参考文献Chicago技术(体外Hi-C 技术)作为提供长距离连接数据的组装提升方法,Chicago技术不仅能够获得长序列连接信息,还能帮助组装提升到染色体水平,该技术使用效率高、操作简便、经济性强,并且产生的高质量文库能够更好地应用于后期组装或研究。
诺禾致源高分文章集锦-植物转录组

温带和热带莲根状茎形成过程中的转录组分析Transcriptomic Analysis of the Regulation of Rhizome Formation in Temperate andTropical Lotus (Nelumbo nucifera )研究对象:莲根状茎期刊:Scientific Reports影响因子:5.578合作单位:中国科学院武汉植物园发表时间:2015年7月摘 要Rhizome is the storage organ of lotus derived from modified stems. The development of rhizome is a complex process and depends on the balanced expression of the genes that is controlled by environmental and endogenous factors. However, little is known about the mechanism that regulates rhizome girth enlargement. In this study, using RNA-seq, transcriptomic analyses were performed at three rhizome developmental stages—the stolon, middle swelling and later swelling stage —in the cultivars ‘ZO’ (temperate lotus with enlarged rhizome) and ‘RL’ (tropical lotus with stolon). About 348 million high-quality reads were generated, and 88.5% of the data were mapped to the reference genome. Of 26783 genes identified, 24069 genes were previously predicted in the reference, and 2714 genes were novel transcripts. Moreover, 8821 genes were differentially expressed between the cultivars at the three stages. Functional analysis identified that these genes were significantly enriched in pathways carbohydrate metabolism and plant hormone signal transduction. Twenty-two genes involved in photoperiod pathway, starch metabolism and hormone signal transduction were candidate genes inducing rhizome girth enlargement. Comparative transcriptomic analysis detected several differentially expressed genes and potential candidate genes required for rhizome girth enlargement, which lay a foundation for future studies on molecular mechanisms underlying rhizome Formation.关键词根状茎;变态发育; DGE 研究背景莲根状茎,即莲藕,作为一种变态茎,是莲的贮藏器官。
诺禾致源2014产品手册

CONTENTS
建库测序
06 建库测序服务
基因组测序
08 动植物基因组测序 10 基因组特征评估 11 基因组de novo测序 14 泛基因组测序(pan-genome) 16 动植物重测序 17 变异检测(基于全基因组重测序) 19 变异检测(基于简化基因组测序) 21 单个性状定位 24 遗传图谱(基于全基因组重测序) 26 遗传图谱(基于简化基因组测序) 28 群体进化(基于全基因组重测序) 30 群体进化(基于简化基因组测序)
[2] Zhi X Y, Yao J C, Li H W, et al. Genome-wide identification, domain architectures and phylogenetic analysis provide new insights into the early evolution of shikimate pathway in prokaryotes[J]. Molecular phylogenetics and evolution, 2014, 75: 154-164.
[8] Xu X, Dong G X, Hu X S, et al. The genetic basis of white tigers[J]. Current Biology, 2013, 23(11): 1031-1035. [9] Jiang W, Liu Y, Xia E, et al. Prevalent role of gene features in determining evolutionary fates of whole-genome duplication duplicated genes in flowering plants[J]. Plant physiology, 2013, 161(4): 1844-1861. [10] Zhang G, Cowled C, Shi Z, et al. Comparative analysis of bat genomes provides insight into the evolution of flight and immunity[J]. Science, 2013, 339(6118): 456-460. [11] Fan Y, Huang Z Y, Cao C C, et al. Genome of the Chinese tree shrew[J]. Nature communications, 2013, 4: 1426. [12] Wang M Y, Zhao P M, Cheng H Q, et al. The Cotton transcription factor TCP14 functions in auxin-mediated epidermal cell differentiation and elongation[J]. Plant physiology, 2013, 162(3): 1669-1680. [13] Lu S, Zong C, Fan W, et al. Probing meiotic recombination and aneuploidy of single sperm cells by wholegenome sequencing[J]. Science, 2012, 338(6114): 1627-1630. [14] Guo S, Zhang J, Sun H, et al. The draft genome of watermelon (Citrullus lanatus) and resequencing of 20 diverse accessions[J]. Nature genetics, 2013, 45(1): 51-58. [15] Li S, Li R, Li H, et al. SOAPindel: Efficient identification of indels from short paired reads[J]. Genome research, 2013, 23(1): 195-200. [16] Li M, Wu H, Luo Z, et al. An atlas of DNA methylomes in porcine adipose and muscle tissues[J]. Nature communications, 2012, 3: 850. [17] Fan W, Li R. Test driving genome assemblers[J]. Nature biotechnology, 2012, 30(4): 330. [18] Liu C M, Wong T, Wu E, et al. SOAP3: ultra-fast GPU-based parallel alignment tool for short reads[J]. Bioinformatics, 2012, 28(6): 878-879. [19] Hvilsom C, Qian Y, Bataillon T, et al. Extensive X-linked adaptive evolution in central chimpanzees[J]. Proceedings of the National Academy of Sciences, 2012, 109(6): 2054-2059. [20] Zhang G, Fang X, Guo X, et al. The oyster genome reveals stress adaptation and complexity of shell formation[J]. Nature, 2012, 490(7418): 49-54.
复杂基因组组装软件——NOVOheter系列(高杂合基因组、高重复基因组、超大基因组)

图1 NOVOheter1.0 组装流程图图2 NOVOheter2.0 组装流程图表1 诺禾致源部分高复杂基因组项目组装结果表4 BUSCO 评估结果统计首页 科技服务 医学检测 科学与技术 市场与支持 加入我们 关于我们提供领先的基因组学解决方案Providing Advanced Genomic Solutions随着高通量测序技术的发展,越来越多的物种被测序,组装质量也因组装技术水平的提高而不断攀升,但复杂基因组组装仍像一道高耸入云的峻岭横亘在科研工作者面前。
为了支持物种复杂基因组的组装,挑战学术研究和产业发展的最前沿,诺禾致源开发出 NOVOheter 系列软件,并基于 NOVOheter 建立起一整套针对复杂基因组组装的解决方案,解决了以往复杂基因组项目周期长、费用高的问题,组装指标及质量均获国际学术界高度认可。
Species某植物Genome size4.25 GbBUSCO notation assessment resultsC:95%[D:16%],F:1.8%,M:2.1%,n:956高杂合基因组组装——NOVOheter1.0杂合率大于0.5%的二倍体或多倍体属于复杂基因组,涵盖大部分林木类植物、水产类动物以及昆虫等,部分物种杂合率高达1%,甚至2%~3%,高杂合的基因组组装给基因组测序研究带来了较大挑战。
诺禾致源团队开发的 NOVOheter1.0 软件,专门针对高杂合基因组组装,让高杂合不再成为组装难题(具体流程如图1所示)。
表1是使用 NOVOheter1.0 软件完成的高杂合基因组组装结果。
项目经验结果 2 BUSCO 评估BUSCO(Benchmarking Universal Single-Copy Orthologs)评估,利用单拷贝直系同源基因,评估基因组完整性。
[2]由结果可知,956个直系同源单拷贝基因,组装出来了95%的完整单拷贝基因,说明组装结果完整。
nature plants 基因组文章

nature plants 基因组文章近年来,越来越多的研究证明植物基因组的基本结构受到环境因素的影响。
由于植物在多种非常不同的生态系统中生长,他们的基因组结构也会做出相应的变化。
相比于动物基因组,植物基因组具有更多的复杂性,并且这些复杂性对于科学家和分子生物学家来说是一个挑战。
目前的技术手段也仅仅能够解释和利用植物基因组的基本框架,但是我们如何充分利用这些基因组活动结构仍然不得而知。
Nature Plants志一直在提供有价值的文章来帮助科学家更好地理解植物基因组的复杂性。
近年来,Nature Plants志发表了一系列重要的文章,深入探讨了植物基因组的进化、结构和功能。
比如,《Nature Plants》杂志曾发表了一篇重要的文章,利用测序技术来研究来自不同植物物种的基因组,该文章表明了植物的基因组结构多样性和其在不同环境中的适应性。
此外,这篇文章还提出了一种可将基因组活动与植物性状相关联的新技术,以实现植物基因组进化及其相关特性的定量分析。
另一篇《Nature Plants》杂志发表的文章,聚焦于利用基因组数据来探究植物物种之间的分子进化关系以及它们在不同环境中表现出的多样性。
该文章提出了一系列有用的结论,例如有关植物基因组的不同演化模式,以及植物基因组如何受到环境的影响。
此外,该文章也发现,重要的植物基因组区域,如细胞膜和其他蛋白质,也可能随着植物物种的演变而改变。
此外,《Nature Plants》杂志还发表了一篇有关植物基因组可塑性的文章。
该文章研究了影响植物基因组可塑性的关键因素,比如环境、营养和遗传多样性。
文章还分析了这些因素如何影响植物的基因组结构、表达和功能,以及如何影响植物的性状和开花时期等特性。
自从Nature Plants志发表的各种文章后,科学家们更好地理解了植物基因组的复杂性及其可塑性,以及如何利用这些信息来改良植物特性。
同时,这些文章也为更加深入地研究植物基因组提供了一个坚实的基础。
诺禾致源高分文章集锦-动物基因组

川金丝猴全基因组测序解析其植食性机制与进化史Whole-genome sequencing of the snub-nosed monkey provides insights into folivory and evolutionary history研究对象:川金丝猴期刊:Nature Genetics 影响因子:29.352合作单位:中国科学院动物研究所发表时间:2014年11月摘 要Colobines are a unique group of Old World monkeys that principally eat leaves and seeds rather than fruits and insects. We report the sequencing at 146× coverage, de novo assembly and analyses of the genome of a male golden snub-nosed monkey (Rhinopithecus roxellana ) and resequencing at 30× coverage of three related species (Rhinopithecus bieti , Rhinopithecus brelichi andRhinopithecus strykeri ). Comparative analyses showed that Asian colobines have an enhanced ability to derive energy from fatty acids and to degrade xenobiotics. We found evidence for functional evolution in the colobine RNASE1 gene, encoding a key secretory RNase that digests the high concentrations of bacterial RNA derived from symbiotic microflora. Demographic reconstructions indicated that the profile of ancient effective population sizes for R. roxellana more closely resembles that of giant panda rather than its congeners. These findings offer new insights into the dietary adaptations and evolutionary history of colobine primates.关键词金丝猴;重测序;植食性;进化研究背景金丝猴(Rhinopithecu spp.)隶属于灵长目(Primates)、疣猴亚科(Colobinae)、仰鼻猴属(Rhinopithecus ),目前共有5个种,即川、滇、黔、缅甸和越南金丝猴。
诺禾致源高分文章集锦-植物基因组

陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement研究对象:陆地棉遗传标准系TM-1期刊:Nature Biotechnology影响因子:41.514合作单位:南京农业大学发表时间:2015年4月摘 要Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词陆地棉;de novo;四倍体研究背景陆地棉(Gossypium hirsutum L.)隶属锦葵目(Malvales),锦葵科(Malvaceae),棉属(Gossypium),因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,占全球棉花种植面积的90%以上。
诺禾致源资料

CONTENTS
目录
建库测序
06 建库测序服务
基因组测序
08 动植物基因组测序 10 基因组特征评估 11 基因组de novo测序 14 泛基因组测序(pan-genome) 17 动植物重测序 18 变异检测(基于全基因组重测序) 20 变异检测(基于简化基因组测序) 22 单个性状定位 25 遗传图谱(基于全基因组重测序) 27 遗传图谱(基于RAD-seq简化基因组技术) 29 遗传图谱(基于GBS简化基因组技术) 31 群体进化(基于全基因组重测序) 33 群体进化(基于简化基因组测序)
测序策略
每台仪器数据产出
最低测序量
Q30
项目周期
建
PE300
13Gb data / 1 Run 13Gb data (1 Run)
微生物
55 16S/18S/ITS等扩增子测序 58 宏基因组测序 61 细菌基因组测序 64 真菌基因组测序 67 小基因组测序
1
诺禾致源 北京诺禾致源生物信息科技有限公司于2011年3月15日在北京中关村生命科学 园注册成立,以基因组学研究与应用开发为发展方向,致力于成为全球领先的基因组学研究解决方案提供者。专 注于开拓生物学、计算机科学和信息技术在动植物研究以及人类健康领域的应用。
[4] Li M, Tian S, Jin L, et al. Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars[J]. Nature genetics, 2013, 45(12): 1431-1438.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement研究对象:陆地棉遗传标准系TM-1期刊:Nature Biotechnology影响因子:41.514合作单位:南京农业大学发表时间:2015年4月摘 要Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词陆地棉;de novo;四倍体研究背景陆地棉(Gossypium hirsutum L.)隶属锦葵目(Malvales),锦葵科(Malvaceae),棉属(Gossypium),因最早在美洲大陆种植而得名,是世界上最重要的棉花栽培品种,占全球棉花种植面积的90%以上。
尽管陆地棉在棉花产业中占据核心地位,但由于其为异源四倍体,相关的全基因组测序工作一直难以开展。
来自南京农业大学、北京诺禾致源、美国德克斯大学的国际团队,利用最新测序技术,成功构建了高质量的陆地棉全基因组图谱,为进一步改良棉花的农艺性状提供了基础,同时也为多倍体植物的形成和演化机制提供了新的启示。
植物研究结果1、陆地棉基因图谱绘制陆地棉基因组大小为2.5 Gb,组装结果contig N50达到34 Kb,scaffold N50达到1.6 Mb,其中92%的scaffold 可定位到染色体上。
组装结果优于目前已测序的多倍体植物油菜(N50=764 Kb)、烟草(N50=345-386 Kb)等。
2、A 亚组和D 亚组非对称进化通过比较陆地棉(AADD)、雷蒙德氏棉(DD)和亚洲棉(AA)的基因组序列,估算出陆地棉形成于一百万至一百五十万年前。
在陆地棉形成后的一百多万年内,A 亚组不仅有更高的蛋白质进化速率,其染色体重排发生频率与及基因丢失和失活的频率均显著高于D 亚组(图1)。
3、A 亚组和D 亚组对陆地棉性状的互补性贡献分析发现811个正选择基因(470个在A 亚组,341个在D 亚组),在A 亚组中,正选择基因与纤维长度的发育有重要关系;而在D 亚组中,正选择基因多与抗性有关。
该结果表明陆地棉继承了两个祖先种中各自的优良性状,因此具有良好的纤维品质及广泛的适应性。
4、棉纤维关键基因的表达及进化分析对MYB 、CESA 等纤维发育相关的重要基因开展了表达及进化分析。
MYB 基因家族中的一个分支在纤维发育中起重要的作用;陆地棉中多个CESA 基因在驯化过程中受到了显著的正选择作用,可能与棉纤维品质的改良有直接关系(图2)。
图1 异源多倍体棉花基因组共线性分析与非对称进化分析参考文献Zhang T, Hu Y, Jiang W, et al . Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement [J]. Nature biotechnology, 2015, 33(5): 531-537.图2 MYB 基因家族表达模式分析野生大豆泛基因组阐明遗传多样性与重要农艺性状De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits 研究对象:大豆期刊:Nature Biotechnology影响因子:41.514合作单位:中国农业科学院作物科学研究所发表时间:2014年9月摘 要Wild relatives of crops are an important source of genetic diversity for agriculture, but their gene repertoire remains largely unexplored. We report the establishment and analysis of a pan-genome of Glycine soja, the wild relative of cultivated soybean Glycine max , by sequencing and de novo assembly of seven phylogenetically and geographically representative accessions. Intergenomic comparisons identified lineage-specific genes and genes with copy number variation or large-effect mutations, some of which show evidence of positive selection and may contribute to variation of agronomic traits such as biotic resistance, seed composition, flowering and maturity time, organ size and final biomass. Approximately 80% of the pan-genome was present in all seven accessions (core), whereas the rest was dispensable and exhibited greater variation than the core genome, perhaps reflecting a role in adaptation to diverse environments. This work will facilitate the harnessing of untapped genetic diversity from wild soybean for enhancement of elite cultivars.关键词大豆;泛基因组;SOAPdenovo;农艺性状研究背景大豆是重要的油料和高蛋白粮饲兼用作物,近年来,我国乃至世界大豆育种难以取得突破性进展,单产停滞不前,其主要原因是目前大豆品种的遗传基础狭窄,匮乏的基因源成为制约栽培大豆育种研究的关键。
野生大豆具有较强的抗逆性和繁殖能力,是栽培大豆重要的基因资源。
方法流程植物图1 7株野生大豆共有和特有基因集参考文献Li Y, Zhou G, Ma J, et al . De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits [J]. Nature biotechnology, 2014, 32(10): 1045-1052.3、变异检测及注释以栽培大豆基因组为参考,7株野生大豆分别鉴定出SNP 3.6-4.7百万个,其中0.12-0.15百万个位于编码区;InDel 0.50-0.77百万个,2,989-4,181个导致了移码;大量的变异位点(44-53%)为重测序手段未能识别出的新位点(图2)。
4、进化分析野生大豆与栽培大豆的祖先约在80万年前即发生了分化(图3);正选择分析发现栽培大豆受选择的基因多与抗旱有关,而野生大豆中受选择基因非常多样化。
5、农艺性状基因定位鉴定出大量与抗逆、抗病、花期、产油量和高度等重要农艺性状相关基因和变异,例如14号染色体上一段8 Kb 的片段与野生大豆抗逆和植物发育相关,野生大豆和栽培大豆开花时间的差异与开花时间调控基因SNP 和InDel 变异有关(图4)。
研究结果1、组装和注释7株野生大豆基因组最小为889.33 Mb。
最大为1118.34 Mb,7株野生大豆基因组组装结果contig N50约7.7-26.6 Kb,scaffold N50约16.3-62.7 Kb,平均每个基因组注释出55,570个基因,其中85-90%的基因为全长基因。
2、泛基因组构建对7个野生大豆基因组进行比较,发现它们共有59,080个基因家族(pan-genome),48.6%为7个野生大豆共享(core-genome),51.4%则仅存在于个别样本中(dispensable-genome)(图1)。