烟草基因组知识篇_2_基因组测序

合集下载

烟草细胞色素P450的基因组学分析

烟草细胞色素P450的基因组学分析
瞳 H E R E D I T A S( B e i j i n g )2 0 1 3 年3 , E l , 3 5 ( 3 ) : 3 7 9 —3 8 7
I S S N 0 2 5 3 - 9 7 7 2 W W W . c h i n a g e n e . c a
DoI :1 0 . 3 7 2 4 / S P . J . 1 0 0 5 . 2 0 1 3 . 0 0 3 7 9
据烟草基因芯片数据和部分基 因的 R T — P C R结果,发现 7 3个烟草 P 4 5 0基 因能够在不同的生长发育时期表达, 其中部分基因具有组织特异性。这些研究结果为烟草 P 4 5 0 基 因功能的深入分析奠定 了 基础。 关 键词 : 烟草; 细胞色素 P 4 5 0 ;基因芯片; 表达序列标签( E s T )
Ge n o me — wi d e a n a l y s i s o f c y t o c h r o me P4 5 0 mo no o x y g e n a s e g e n e s i n
t he t o ba c c o
XI E Mi n - Mi n, G0N G Da — Pi ng , LI Fe n g — Xi a , LI U Gua n— S ha n, S UN Yu— He
烟 草 中的 P 4 5 0的种 类和 数量,文章 将植 物代表 性 P 4 5 0蛋 白质 序 列与烟 草基 因组序 列 比对,在烟 草基 因组 中鉴 定 了4 4 个P 4 5 0家族共 2 6 3个成 员。将这 些烟 草 P 4 5 0 基 因与烟草表 达序 列标 签( E S T ) 比对,发现 1 7 3 个 成 员有 E S T证据 。通 过与 拟南芥 中 已知 的 P 4 5 0蛋 白序 列 比较,分析 了部分 烟草 P 4 5 0 蛋 白序列 的特征 和 二级结 构 。 根

基因组学复习资料整理

基因组学复习资料整理

基因组学1. 简述基因组的概念和其对生命科学的影响。

基因组:指一个物种的全套染色体和基因。

广义的基因组:核基因组,线粒体基因组,叶绿体基因组等。

基因组计划对生命科学的影响:①研究策略的高通量,彻底认识生命规律:基因组研究高通量,研究手段和研究策略的更新,加强了生命科学研究的分工与协作,从不同层次深入研究生命现象。

②促进了相关学科的发展:分子生物学遗传学生物信息学生物化学细胞生物学生理学表观遗传学等③物种的起源与进化:Ⅰ.重要基因的发掘、分离和利用:遗传疾病相关基因,控制衰老的基因,工业价值的细菌基因,重要农艺性状基因等。

Ⅱ.充分认识生命现象:基因的表达、调控,基因间的相互作用,不同物种基因组的比较研究,揭示基因组序列的共性,探讨物种的起源和进化。

④伦理学法律问题:伦理问题,知识产权问题,法律问题,社会保险问题。

2. Ac/Ds转座因子Ac因子有4563bp,它的大部分序列编码了一个由5个外显子组成的转座酶基因,成熟的mRNA有3500bp。

该因子本身的两边为11bp的反向重复末端(IR),发生错位酶切的靶序列长度8bp。

Ds因子较Ac因子短,它是由Ac因子转座酶基因发生缺失而形成的。

不同的Ds因子的长度差异由Ac因子发生不同缺失所致。

Ac/Ds因子转座引起的插入突变方式:玉米Bz基因是使糊粉层表现古铜色的基因,当Ac/Ds转座插入到Bz基因座后,糊粉层无色。

当Ac/Ds因子在籽粒发育过程,部分细胞发生转座,使Bz靶基因发生回复突变,从而形成斑点。

Ac/Ds两因子系统遗传特点:1)Ac具有活化周期效应,有活性的Ac+因子被甲基化修饰后会形成无活性的ac-因子,反之无活性的ac-因子去甲基化成有活性的Ac+因子。

2)Ac与Ds因子有时表现连锁遗传但更多表现独立遗传。

3)Ac对Ds的控制具有负剂量效应。

4)Ac/Ds可引发靶基因表现为插入钝化、活性改变、表达水平改变和缺失突变等。

5)Ds的结构不同,插入同一靶基因的位点可能不同,形成的易变基因的表型也不同。

利用基因组简约法开发烟草SNP标记及遗传作图

利用基因组简约法开发烟草SNP标记及遗传作图
关键 词 :烤 烟; S NP标记 ;基 因组简 约法 ;限制性 内切酶 ;遗传 图谱
De v e l o pm e nt a nd Ge ne t i c M a ppi ng o f SNP M a r ke r s vi a Ge no me Com pl e x i t y
Lo ng . J i a ng Y u n n a n A c a d e my o f T o b a c c o Ag r i c u l t u r a l S c i e n c e s , Ku n mi n g 6 5 0 0 2 1 , C h i n a ; D e p a r t me n t o f Ag r o n o my , Z h e j i a n g Un i v e r s i t y , Ha n g z h o u 3 1 0 0 5 8
肖炳 光 , 邱 杰 曹培健 。 桂 毅 杰 卢秀萍 李 永平 樊龙 江 2
云南省 烟草农业 科学 研究 院,云南 昆明 6 5 0 0 2 1 ; 浙 江大学农 学 系, 浙 江杭州 3 1 0 0 5 8 ; 国家烟 草基 因研究 中心,河南郑 州 4 5 0 0 0 1

E — ma i l : x b z w @c h i n a j o u r n a 1 . n e t . c a
DoI :1 0 . 3 7 2 4 / S P . J . 1 0 0 6 . 2 01 4 . 0 0 3 9 7
利用基 因组简 约法开发烟草 S NP标记及 遗传作 图
Re duc t i o n i n To ba c c o
XI AO Bi n g . G u a n g ' ,QI U J i e ,C AO P e i — J i a n ,GUI Y i — J i e ,L U Xi u . P i n g ,L I Y o n g P i n g ,a n d F AN

烟草DUF538基因家族鉴定及根结线虫胁迫下表达分析

烟草DUF538基因家族鉴定及根结线虫胁迫下表达分析

櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄[20]WangB,YuanJ,LiuJ,etal.Codonusagebiasanddeterminingforcesingreenplantmitochondrialgenomes[J].JournalofIntegrativePlantBiology,2011,53(4):324-334.[21]SongYF,YangQH,YiXG,etal.ComparativeanalysisofCodonusagepatternsinchloroplastgenomesofcherries[J].Forests,2022,13(11):1891.[22]MortonBR,WrightSI.SelectiveconstraintsonCodonusageofnucleargenesfromArabidopsisthaliana[J].MolecularBiologyandEvolution,2007,24(1):122-129.[23]LiuQP,XueQZ.Comparativestudiesoncodonusagepatternofchloroplastsandtheirhostnucleargenesinfourplantspecies[J].JournalofGenetics,2005,84(1):55-62.[24]陆奇丰,黄至欢,骆文华.番茄WRKY转录因子密码子偏性分析[J].分子植物育种,2020,18(18):5908-5916.[25]段淋渊,戴国礼,焦恩宁,等.枸杞自交不亲和基因S-RNase密码子偏性分析[J].西南林业大学学报(自然科学),2020,40(2):44-52.[26]赵 森,邓力华,陈 芬.秋茄叶绿体基因组密码子使用偏好性分析[J].森林与环境学报,2020,40(5):534-541.[27]叶 琦,宋炎峰,李 蒙,等.迎春樱桃叶绿体基因组特征及其密码子使用偏好性分析[J].分子植物育种,2022,20(14):4576-4585.[28]胡晓艳,许艳秋,韩有志,等.酸枣叶绿体基因组密码子使用偏性分析[J].森林与环境学报,2019,39(6):621-628.[29]喻 凤,韩 明.紫花苜蓿叶绿体基因组密码子偏好性分析[J].广西植物,2021,41(12):2069-2076.[30]唐玉娟,赵 英,黄国弟,等.芒果叶绿体基因组密码子使用偏好性分析[J].热带作物学报,2021,42(8):2143-2150.[31]杨祥燕,蔡元保,谭秦亮,等.菠萝叶绿体基因组密码子偏好性分析[J].热带作物学报,2022,43(3):439-446.[32]耿晓姗,贾 魏,陈佳宁,等.金花茶叶绿体基因组密码子偏好性分析[J].分子植物育种,2022,20(7):2196-2203.张路阳,张有建,饶聪颖,等.烟草DUF538基因家族鉴定及根结线虫胁迫下表达分析[J].江苏农业科学,2023,51(20):34-42.doi:10.15889/j.issn.1002-1302.2023.20.006烟草DUF538基因家族鉴定及根结线虫胁迫下表达分析张路阳1,张有建2,饶聪颖2,许燕彪2,谢 可2,李 伟2,郑 聪2(1.河南农业大学烟草学院,河南郑州450002;2.福建省南平市烟草公司,福建南平353000) 摘要:DUF538基因是没有功能注释的蛋白,在根结线虫胁迫的响应过程中,含有DUF538结构域的蛋白质的基因表达发生变化。

利用GBS技术开发烟草SNP标记及遗传多样性分析

利用GBS技术开发烟草SNP标记及遗传多样性分析

利用GBS技术开发烟草SNP标记及遗传多样性分析作者:蔡露杨欢王勇李廷轩陈光登来源:《中国烟草科学》2018年第05期摘要:研究烟草种质资源的遗传背景,为烟草种质资源的高效利用提供依据。

采用GBS (genotyping-by-sequencing)技术,挖掘92份烟草种质资源的SNP位点,并进行遗传多样性和遗传结构分析。

结果表明,测序共获得了147.165 Gb数据,平均每个样本1.599 Gb,筛选后共获得93 685个高质量的SNP位点;不同地理来源烟草群体等位基因数(Na)为1.27~1.93,观测杂合度(Ho)变化范围为0.22~0.76,期望杂合度(He)为0.32~0.59,多态性位点数(PLN)范围为15 877~44 249,多态性位点比率(PPL)为26.61%~74.17%,遗传多样性指数(H)为0.19~0.52,遗传距离(GD)为−0.0148~0.3849。

基于遗传距离的NJ聚类将材料划分为两个类群;群体遗传结构分析表明,本研究所用材料基于模型可划分为4个亚群。

通过GBS技术得到的测序数据量较大且质量较高,群体多态性较高,整体遗传多样性偏低,群体结构划分与种质来源不完全相关。

关键词:烟草;GBS;SNP;遗传多样性;遗传结构中图分类号:S572.03 文章编号:1007-5119(2018)05-0017-08 DOI:10.13496/j.issn.1007-5119.2018.05.003Abstract: To understand the diversity and genetic structure of tobacco germplasm resources and provide an important theoretical foundation for resource use, GBS (genotyping-by-sequencing)technology was used to discover SNP loci for 92 tobacco germplasm resources. With the SNPs genotyping data, the genetic diversity and genetic structure were analyzed. By using GBS, a total of 147.165 Gb of sequences was generated from the 92 tobacco germplasms, and each sample produced 1.599 622 Gb in average. After being screened, a total of 93 685 of high-quality SNP sites was retained. The range of number of alleles (Na) for different geographic sources of tobacco population was 1.27-1.93. The observed heterozygosity (Ho) was 0.22~0.76. The expected heterozygosity (He) was 0.32-0.59. The number of polymorphic loci was 15 877-44 249. The percentage of polymorphic loci (PPL) was 26.61%-74.17%. The genetic diversity index (H)was 0.19-0.52. The genetic distance (GD)was −0.0148-0.3849. The genetic distance-based NJ clustering was used to classify the materials into two groups. The results of the population structure based on a model-based method indicated that these materials could be divided into four subgroups. In summary, the sequencing data obtained by GBS technology provide an effective and high feasible approach to assist the genotyping of 92 tobacco accessions with high population polymorphism and low genetic diversity abundance. The division of population structure was not completely related to the geographic origin of the germplasm.Keywords: tobacco; GBS; SNP; genetic diversity; population structure烟草(Nicotiana tabacum L.)是我国重要的经济作物之一,作为世界上最大的烟草生产国,我国烟草育种面临亲本匮乏、品种遗传背景狭窄、盲目性、重复性大等问题[1]。

烟草突变体筛选与鉴定方法篇:3.烟草突变体的TILLING筛选与功能鉴定

烟草突变体筛选与鉴定方法篇:3.烟草突变体的TILLING筛选与功能鉴定
以及 高通量 测序 技术 ( et eeai q ec g nx— nrt ns uni )等方 法将 点 突变筛 选 出来 ,具 有 高通量 、低成 本 的技术 g o e n
特点。随着烟草全基 因组测序的完成 ,TL I G在烟草功能基 因组学中的重要价值也越发体现 出来 。 IL N
选 技术 如 毛细管 电泳( aia et p oei, E)聚丙 烯酰 胺凝 胶 电泳( oycya d eeet p oei cplr e c oh rssC 、 ly l r p larlmiegll r hrs , co s
P G 、琼脂糖 电泳 ( grs gll t p o s , G 、高分辨熔解 曲线 ( i rsl i e i , R ) A E) aa e ee c oh r i A E) o e r es h - o t n l gH M e uo m t n
链核酸分子 ;( )电泳检测 ,检测手段可通过产生真实 电泳图谱 的 LC R 30遗传分析工作站进行 ,也 4 IO 40
可通过 自动 化程 度较 高 的毛细管 电泳 系统 进行 ;( 5)采取 相 同 的方 法从 突变 池 中筛选 突变 个体 ;( )突变 6
个体 P R产物的测序验证。 C
高水平 的突变剂量 ,多倍体的突变频率要显著高于二倍体 ,如二倍体植物拟南芥、水稻 、玉米的突变频率
分别为 1 7 、1 0 b / 5 b 而多倍体植物普通小麦突变频率 1 4 b 普通烟草约为 1 6 b 因 / 0 b / 0 、1 8 , 1 k 5 k 4 k / , 2k / , 6k
此要使基因组中 9%以上 的基 因都有突变信息 ,多倍体植物如普通小麦 TL I G检测群体很少超过 50 5 IL N 00

普通烟草β-胡萝卜素羟化酶2基因克隆与生物信息学分析

普通烟草β-胡萝卜素羟化酶2基因克隆与生物信息学分析

普通烟草β-胡萝卜素羟化酶2基因克隆与生物信息学分析雷波;丁福章;赵会纳;卢坤;蔡凯;潘文杰【摘要】β-胡萝卜素羟化酶(beta-carotene hydroxylase,BCH)是植物类胡萝卜素合成代谢中的关键限速酶,为获得烟草β-胡萝卜素羟化酶2(NtBCH 2)基因序列,采用同源克隆法从烟草中分离 NtBCH 2的基因组 DNA 序列,基因登录号为 JX101477。

结果表明:1)同源克隆法从烟草中克隆出 NtBCH 2基因,Nt-BCH 2基因组 DNA 全长2131bp,cDNA 为1083 bp,含7个外显子和6个内含子。

2)NtBCH2蛋白有309个氨基酸,分子量为34.79 kD,具有7个糖基化位点,11个磷酸化位点,4个跨膜域。

3)系统发育树与BLAST 分析表明,NtBCH 2是番茄的 SlBCH 和辣椒 CaBCH 2的同源基因;GENEVESTIGATOR 数据库芯片结果表明,NtBCH 2在幼嫩的茎和子叶中表达量最高。

%Beta-carotene hydroxylase is a key rate-limiting enzyme in plant metabolism of carotenoid biosynthesis.By using homologus cloning method, a BCH (NtBCH 2)gene was isolated from common tobacco K326,and the gene accession number is JX101477.Full-length of genomic DNA and cDNA is 2131 bp and 1 083 bp with 7 exons and 6 introns.The encoded NtBCH2 protein is a 309-aa polypeptide with a calculated molecular weight (Mw)of 34.79 kDa.Bioinfomatic analysis results showed that NtBCH2 possessed four transmembrane domains, seven potential glycosylation and 11 phosphorylation sites. Phylogenetic and BLAST analysis indicated that NtBCH 2 is the orthologous gene of SlBCH and CaBCH. Microarray results in GENEVESTIGATOR database revealed that NtBCH2 was expressed at the highest level in stem andcotyledon.【期刊名称】《贵州农业科学》【年(卷),期】2015(000)002【总页数】5页(P24-28)【关键词】烟草;β-胡萝卜素羟化酶2基因;香气;克隆【作者】雷波;丁福章;赵会纳;卢坤;蔡凯;潘文杰【作者单位】贵州省烟草科学研究院,贵州贵阳,550081;贵州省烟草科学研究院,贵州贵阳,550081;贵州省烟草科学研究院,贵州贵阳,550081;西南大学农学与生物科技学院,重庆北碚 400715;贵州省烟草科学研究院,贵州贵阳,550081;贵州省烟草科学研究院,贵州贵阳,550081【正文语种】中文【中图分类】S572类胡萝卜素(carotenoids)是指胡萝卜素和叶黄素两大类色素的总称,能保护叶绿素免受强光导致的光氧化破坏,是光合作用和反应中心复合体不可缺少的结构成分。

烟草生物技术试卷

烟草生物技术试卷

烟草生物技术试卷考生姓名:__________答题日期:__________得分:__________判卷人:__________一、单项选择题(本题共20小题,每小题1分,共20分)1. 烟草种植中应用生物技术的首要目的是:A. 提高产量B. 改善品质C. 增强抗病性D. 降低成本2. 以下哪种生物技术不属于烟草种植中的应用?A. 组织培养B. 分子标记C. 转基因技术D. 太阳能技术3. 烟草组织培养过程中常用的启动子是:A. CaMV 35S启动子B. UBQ10启动子C. RUBISCO小亚基启动子D. 所有以上选项4. 烟草基因转化中,最常用的农杆菌菌株是:A. Agrobacterium tumefaciensB. Agrobacterium rhizogenesC. Agrobacterium rubiD. Agrobacterium vitis5. 下列哪种方法不是用于检测转基因烟草中目的基因的表达?A. Northern blotB. Western blotC. PCRD. Southern blot6. 烟草抗病毒转基因植株培育中,常用于抗病毒目的基因的是:A. 烟草花叶病毒外壳蛋白基因B. 烟草花叶病毒复制酶基因C. 烟草花叶病毒移动蛋白基因D. 所有以上选项7. 烟草种植中,利用生物技术培育抗虫植株的方法有:A. 转基因技术B. 组织培养C. 离子束注入D. 染色体重排8. 以下哪种生物技术可用于快速繁殖烟草优良品种?A. 分子标记辅助选择B. 植物组织培养C. 分子育种D. 基因编辑9. 烟草种植中,利用生物技术进行抗逆性育种的主要目标是:A. 提高抗寒性B. 提高抗旱性C. 提高抗盐性D. 所有以上选项10. 以下哪种生物技术在烟草种植中应用较少?A. 植物组织培养B. 转基因技术C. 分子标记D. 细胞融合11. 烟草种植中,利用生物技术进行品质改良的主要目标是:A. 提高烟碱含量B. 降低烟碱含量C. 改善烟草燃烧性D. 所有以上选项12. 以下哪种方法可用于检测转基因烟草中外源基因的插入拷贝数?A. Northern blotB. PCRC. Southern blotD. Western blot13. 烟草种植中,利用生物技术培育抗除草剂植株的方法有:A. 基因突变B. 组织培养C. 转基因技术D. 染色体重排14. 以下哪种生物技术可用于研究烟草基因的家族进化关系?A. 分子标记B. 比较基因组学C. 基因编辑D. 实时荧光定量PCR15. 烟草种植中,利用生物技术培育低焦油含量烟草的方法是:A. 组织培养B. 分子标记辅助选择C. 转基因技术D. 离子束注入16. 以下哪种生物技术可用于研究烟草基因表达谱的变化?A. Northern blotB. 微阵列技术C. Southern blotD. Western blot17. 烟草种植中,利用生物技术培育抗真菌病植株的方法有:A. 基因突变B. 转基因技术C. 组织培养D. 染色体重排18. 以下哪种方法可用于研究烟草基因组中的SNP位点?A. PCRB. DNA测序C. 比较基因组学D. 实时荧光定量PCR19. 烟草种植中,利用生物技术培育抗细菌病植株的方法有:A. 组织培养B. 转基因技术C. 基因突变D. 染色体重排20. 以下哪种生物技术不属于基因编辑技术?A. CRISPR/Cas9B. TALENC. ZFND. RNA干扰二、多项选择题(本题共20小题,每小题1.5分,共30分)1. 烟草种植中应用生物技术可以带来以下哪些好处?A. 提高烟草产量B. 改善烟草品质C. 降低种植成本D. 减少化学农药的使用2. 常见的生物技术在烟草种植中的应用包括以下哪些?A. 组织培养B. 分子标记辅助选择C. 转基因技术D. 染色体重排3. 以下哪些是植物组织培养技术的应用?A. 快速繁殖B. 保存遗传资源C. 育种D. 植株再生4. 转基因技术在烟草种植中可以用于以下哪些方面?A. 抗病毒B. 抗虫C. 抗除草剂D. 改善烟草燃烧性5. 以下哪些方法可以用于检测转基因烟草中目的基因的表达?A. Northern blotB. Western blotC. PCRD. Southern blot6. 以下哪些因素会影响农杆菌介导的烟草基因转化效率?A. 农杆菌菌株B. 转化载体C. 烟草品种D. 培养条件7. 烟草基因编辑技术主要包括以下哪些?A. CRISPR/Cas9B. TALENC. ZFND. RNA干扰8. 以下哪些生物技术可以用于研究烟草基因功能?A. 基因敲除B. 基因过表达C. RNA干扰D. 染色体重排9. 烟草抗逆性育种中,以下哪些是研究重点?A. 抗旱性B. 抗寒性C. 抗盐性D. 抗重金属污染10. 以下哪些方法可以用于烟草基因组分析?A. 微阵列技术B. DNA测序C. 比较基因组学D. 实时荧光定量PCR11. 烟草生物技术育种中,以下哪些方法可以用于提高选择效率?A. 分子标记辅助选择B. 组织培养C. 基因编辑D. 基因转化12. 以下哪些是烟草种植中可能存在的生物安全问题?A. 转基因植株的基因扩散B. 对非靶标生物的影响C. 食品安全D. 环境影响13. 烟草基因工程中,以下哪些是常用的启动子?A. CaMV 35S启动子B. UBQ10启动子C. RUBISCO小亚基启动子D. 烟草花叶病毒外壳蛋白基因启动子14. 以下哪些生物技术可以用于烟草遗传资源的保存?A. 组织培养B. 冷冻保存C. DNA库D. 活体保存15. 烟草育种中,以下哪些方法可以用于提高烟草的烟碱含量?A. 分子标记辅助选择B. 转基因技术D. 选择性杂交16. 以下哪些因素会影响烟草组织培养的成功率?A. 培养基成分B. 外植体类型C. 消毒处理D. 光照条件17. 烟草生物技术研究中,以下哪些技术可以用于基因表达调控?A. 基因沉默B. 基因过表达C. miRNA干扰D. 基因编辑18. 以下哪些方法可以用于检测烟草基因组中的结构变异?A. PCRB. DNA测序C. 比较基因组学D. 基因芯片19. 烟草生物技术育种中,以下哪些方法可以用于培育抗病植株?B. 组织培养C. 基因突变D. 分子标记辅助选择20. 以下哪些生物技术可以用于研究烟草生长发育过程中的基因表达变化?A. Northern blotB. 微阵列技术C. 实时荧光定量PCRD. 基因测序三、填空题(本题共10小题,每小题2分,共20分)1. 在烟草组织培养中,外植体经过______和______后,可形成愈伤组织。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

76 中国烟草科学 2010,31(2):76-77
烟草基因组知识篇:2. 基因组测序
孙玉合
(中国农业科学院烟草研究所,青岛 266101)
基因组计划的最终目标是获取所研究生物体的全部DNA序列,一般包括三个图谱,即遗传图谱、物理图谱和基因组全序列图谱,并将基因以及其他有意义的特征定位于DNA序列中。

人以及模式生物的染色体都不能直接进行DNA测序,因此首先必须将它们随机地“敲碎”(通过限制性内切酶酶切或超声波处理或DNA酶Ⅰ降解)变成成千上万的小片段,构建成不同水平和类型的基因组文库,例如YAC(yeast artificial chromosome,酵母人工染色体)文库、BAC(bacterial artificial chromosome,细菌人工染色体)文库和cDNA文库等。

然后对文库中的每个克隆片段进行DNA测序,再对所有测定的每条序列经过计算机程序处理装配成染色体上完整的DNA序列。

1 DNA测序方法
两种不同的快速有效的传统DNA测序方法于上世纪70年代中期几乎同时发表。

链终止法(chain termination method)指单链DNA分子的序列由互补的多核苷酸链的酶促合成来决定,互补链在特定的核苷酸位置终止[1]。

化学降解法(chemical degradation method)指双链DNA分子用化学物质处理后,在特定核苷酸位置被切开,从而确定DNA分子的序列[2]。

链终止法是基因组测序的主要方法,一方面因为化学降解法中的化学试剂有毒,对测序人员的健康有害,另一方面主要因为链终止法更易自动化[3]。

基因组计划包括大量的测序反应,手工测序将花费很多年时间,因此要在可接受的时间内完成测序计划,就必须采用自动测序方法。

自上世纪90年代初,所有的DNA测序操作几乎无一例外地全部采用半自动化毛细管电泳链终止测序法。

为了提高测序速度,人们尝试设计新的测序方法,其中一种就是焦磷酸测序(pyrosequencing),它不需要电泳或其他方法分离不同长度片段,因此比链终止法测序速度快[4]。

最近,许多新一代测序仪(例如美国Roche Applied Science公司的454基因组测序仪、美国Illumina公司和英国Solexa technology公司合作开发的Illumina测序仪又称作Solexa测序仪、美国Applied Biosystems公司的SOLiD测序仪等)都使用了一种称之为循环芯片测序法(cyclic-array sequencing)的新方法,也可将其称为“新一代测序技术或者第二代测序技术”[5]。

所谓循环芯片测序法,简言之就是对布满DNA样品的芯片重复进行基于DNA的聚合酶反应以及荧光序列读取反应。

新型纳米孔测序法(nanopore sequencing)是采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔来实现测序的,它可以价廉、快速地进行DNA测序,它有望成为第三代测序技术(也可称为下下一代测序技术)[6-7]。

2 DNA测序的策略
基因组测序工作量浩大,选择适当的测序策略很重要。

测序策略主要有两种:第一种是克隆重叠群作图(clone contig mapping),也称“自上而下”作图(top-down mapping)或由长到短作图策略;第二种是“全基因组鸟枪法”(whole-genome shotgun method)作图,也称“自下而上”作图(bottom-up approach/mapping)或由短到长作图策略[8]。

这两种测序策略也称作完全测序和草图型测序策略[9]。

在第一种测序策略中,首先建立连续克隆重叠群,再对单个重叠群采用鸟枪法进行逐个测序,最后在重叠群内进行拼接,获得全长序列。

而在第二种测序策略中,直接将基因组DNA随机切成2 kb(kilobase,
中国烟草科学77 千碱基)左右的小片段,然后进行随机末端测序,再以基因组的分子标记为起点进行DNA片段拼接,计算机分析串联得到全序列。

序列拼接的最初结果是一系列的骨架序列(scaffold),每条骨架序列包括一系列被序列缺口分开的连续序列,不同的骨架序列之间被物理缺口分开;通过封闭序列缺口和物理缺口,可将不同的骨架序列拼接起来。

3 DNA序列的装配
无论是采用哪种策略进行测序,得到的都是成百上千万的小片段DNA序列,最后必须要将它们装配成基因组每条染色体上真实的排列顺序,这是手工操作无法完成的,需要借助计算机和数据库以及相关的软件系统。

因此,DNA序列的装配是一项浩繁、技术要求高而又精细的工作。

首先需要通过计算机软件对测定的DNA序列的数据质量和准确性进行评估,包括给出每个碱基的可信度;确定所测每个样品的高质量部分;在序列拼接完成后对拼接成的重叠群整体的可信度进行评估,给出可能的错误率[8]。

其次,进行序列装配。

一般采用的是Phil Green实验室建立和发展的Phred-Phrap-Consed 软件系统。

不过,随着基因组计划的不断进行,各国各实验室都开发和建立了自己的基因组测序装配的相关软件。

基因组测序的最后一步是基因组注释(genome annotation),即利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,包括基因识别和基因功能注释(这将在下期中介绍)。

人类基因组计划(HGP)于1990年正式启动。

2001年,“国际人类基因组测序联合体”(International Human Genome Sequencing Consortium, IHGSC)和美国Celera Genomics公司几乎同时在《自然》和《科学》杂志上刊文发表了两个人类基因组序列的“工作框架图”,它们覆盖了97%的基因组,组装了85%的基因组序列[10-11]。

在对人类基因组的测序与序列装配过程中,IHGSC和Celera Genomics公司采用了不同的方法。

IHGSC采用的是克隆重叠群法,也称为层次鸟枪测序法(hierarchical shotgun sequencing),而Celera Genomics公司采用的则是全基因组鸟枪测序法,也称为随机全基因组测序法(random whole-genome sequencing)。

2004年,IHGSC在《自然》上发表了人类基因组全序列的测定结果[12],人类基因组接近完整的序列图包含28亿5千万个碱基对,覆盖了常染色质99%的序列,在10万个碱基中误差率只有一个碱基,特别值得注意的是人类基因组仅有2~2.5万个编码蛋白质的基因。

参考文献
[1] Sanger F, Nicklen S, Coulson A R. DNA sequencing with chain terminating inhibitors[J]. Proc Natl Acad Sci USA, 1977, 74:
5463-5467.
[2] Maxam A M, Gilbert W. A new method for sequencing DNA[J]. Proc Natl Acad Sci USA, 1977, 74: 560-564.
[3] 布朗T A. 基因组2[M]. 袁建刚,等译. 北京:科学出版社,2002:192-218.
[4] Ronaghi M, Ehleen M, Nyrn P. A sequencing method based on real-time pyrophosphate[J]. Science, 1998, 281: 363-365.
[5] Shendure J, Ji H. Next-generation DNA sequencing[J]. Nat Biotechnol, 2008, 26: 1135-1145.
[6] Branton D, Deamer D W, Marziali A, et al. The potential and challenges of nanopore sequencing[J]. Nat Biotechnol, 2009, 26:
1146-1153.
[7] Rusk N. Cheap third-generation sequencing[J]. Nat Methods, 2009, 6: 244-245.
[8] 路铁刚, 丁毅. 分子遗传学[M]. 北京: 高等教育出版社,2008:406-409.
[9] Morot-Gaudry J –F, Lea P, Briat J –F. 植物功能基因组学[M]. 王元英, 时焦,等译. 北京:中国农业科学技术出版社,
2009:17-23.
[10] International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome[J]. Nature, 2001,
409: 860-945.
[11] Venter J C, Adams M D, Myers E W, et al. The sequence of the human genome[J]. Science, 2001, 291: 1304-1351.
[12] International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome[J]. Nature,
2004, 431: 931-945.。

相关文档
最新文档