基因组测序的原理与方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在含有氯霉素 的固体培养基 中培养 电转化,将连接 产物导入大肠杆 菌感受态细胞
插有外源DNA片段的BAC载体
BAC克隆的筛选
每一个菌落为带有相同 外源DNA片段的单克隆
Contig
“STS-PCR反 应池”方案筛 选种子克隆
特定的STS标 记
相互间具有重叠片段的 BAC克隆根据STS信息组装 成contig,并定位于基因组上
Whole Genome Shotgun
工作草稿(框架图)与完成图
Chromosome
“Working Draft” (90%; 4X)
Gap1 Gap2
Finished Genome (99.99%; 8X)
BAC by BAC
The sequence of the human genome C. Venter et al. Science 16 Feb. 291: 1304 – 1351, 2001
随机基因组序列
STS的来源 表达基因序列,如EST 遗传标记序列,如微卫星标记
有关STS的信息可在基因组数据库GDB中找到 http://gdbwww. gdb. org
物 理 图 谱 构 建 的 步 骤
确定各STS序列及其 在基因组中的位置
基因组数据库(GDB)中至少含有 24568 个STS路标信息
• • • • •
测序设备的 垄断和高速度换代
Less Than 5 yrs
ABI3730xl ABI3130xl ABI3730 ABI3700xl 5500xl SOLiD 5500 SOLiD SOLiD3
ABI3700 ABI3130 ABI377 ABI373 Mb4500 Mb4000 Mb1000
基因组学的基础理论研究
基因组学是要揭示下述四种整合体系的相互关系:
• 基因组作为信息载体 (碱基对、重复序列的整 体守恒与局部不平衡的关系) • 基因组作为遗传物质的整合体 (基因作为功能和 结构单位与遗传学机制的关系) • 基因组作为生物化学分子的整合体 (基因产物作 为功能分子与分子、细胞机制的关系) • 物种进化的整合体 (物种在地理与大气环境中的 自然选择)
… the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the methods described in this issue.
Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001)

大插入片段基因组文 库的构建(BAC文库)

以特定STS为标记筛 选并定位克隆

含有STS的克隆在基 因组中排序
关 于 文 库
文库的概念
含有某种生物体全部基因的随机片段的重组DNA克隆群体
宿主:能容纳外源DNA片段的生物体,
常用的有大肠杆菌、酵母等
载体:能携带外源DNA进入宿主细胞
的工具,常用的载体有质粒载体、噬 菌体载体、细菌人工染色体等
Regional mapping
Regional mapping
Regional mapping
Minimal tiling path selected for sequencing.
Beijing
Map
DM1-2b11s C HLC .G A TA 44a05 D3S1304 sts-T58150 SG C -82964 W I-1341 D3S3591
基因组学是一个大学科
• “界门纲目科属种”,地球上现存物种近亿,所有生生灭
• •
• • • •
灭的生物,无一例外,都有个基因组。 基因组作为信息载体,它所储存的信息是最基本的生物 学信息之一;既是生命本质研究的出发点之一,又是生 物信息的归宿。 基因组学研究包括对基因产物(转录子组和蛋白质组) 的系统生物学研究。 基因多态性的规模化研究就是基因组多态性的研究。 基因组学的研究必然要上升到细胞机制、分子机制和系 统生物学的水平。 基因组的起源与进化和物种的起源与进化一样是一个新 的科学领域。 基因组信息正在以天文数字计算,规模化地积累,它的 深入研究必将形成一个崭新的学科。
Sanger 双脱氧末端终止法测序原理
大 规 模基因组 测 序 的 两种策略
• 逐步克隆法
(Clone by Clone)
• 全基因组霰弹法
(Whole Genome Shot-gun)
逐步克隆法(Clone by Clone)
完整的基因 组序列 基因组DNA
BAC文库 根据物理图谱 正确定位的 BAC 或contig
Helicos Genetic Analysis System
DanaherMotion
Polonator G.007
Complete Genomics 无锡艾吉因生物信息技术有限公司
AG-100
Pacific Biosciencesห้องสมุดไป่ตู้
RSSystem
深圳华因康基因科技有限公司
中科院北京基因组所/半导体所
3pter
sts-N95054 SG C -10790 D3S3691A 002R42
SG C -82788 A 004Q43 W I-10858 SG C -15279
sts-N30615 stSG 3143 W I-8499
stSG 50796 W I-21858 W I-20982 SG C -34652 EST325005 Bda37h09 sts-N34454 stSG -22642 stSG 22463 IB262 SG C -100057 SG C -11218 SG C -77734 SG C -12613 SG C -79997 D3S4170 W I-13469 SG C -104744 W I-7400 SG C -106678 W I-3006 D3S4125 stSG 31571 SG C -86097 SG C -104738 sts-T03421 stSG 81116 D3S3525 D3S3630 SG C -11976 W I-6116 W I-2053 SG C -84074 SG C -77858 D3S3706 SG C -102094 W I-13611NRU18-13s W I-21921
1990 1995 2000 GA-I
SOLiD2
SOLiD
GA-II HiSeq1000/2000 GA-IIx
Year
2005 2010 2015 2020
8
测序设备发展现状
第一代(稳定需求) ABi
3130xL 3730xL 3500xL
第二代(高速发展) Roche
Genome Sequencer FLX System GS Junior System
测序并进行 全基因组序 列组装
霰弹法克隆 用于霰弹法测 序的候选克隆
用于霰弹法测序 的亚克隆
测序并组装 ………ATGCCGTAGGCCTAGC TAGGCCTAGCTCGGA…… 完整的基因 ………ATGCCGTAGGCCTAGCTCGGA… 组序列 …
基因组DNA
全基因组霰弹法 (Whole Genome Shot-gun)
…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA
TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…
逐步克隆法(Clone by Clone)
物理图谱的构建
大片段克隆的筛选 霰弹法测序与“工作框架图”的构建 序列的全组装与“完成图”构建
物理图谱的制作
物理图谱的制作——序列标签位点(STS)作 图
物理图谱是以特异的DNA序列为标志所展示的染色体图。 标志之间的距离或图距以物理距离如碱基对(base pair;bp, Kb , Mb)表示。最精细的物理图是核苷酸顺序图,最粗略的物 理图是染色体组型图。 STS图谱是最基本和最为有用的染色体物理图谱之一,STS (Sequence Tagged Site)本身是随机地从人类基因组上选择 出来的长度在200~300bp左右的特异性短序列(每个STS在基 因组中是唯一的,STS图谱就是以STS为路标(平均每100Kb一 个),将DNA克隆片段有序地定位到基因组上。

• • •
基因组与生命之谜
• • • •
基因组的产生与进化。 基因组DNA组分的变化、GC百分比、嘌呤:嘧啶守恒。 遗传密码的发生、发展和进化。 内含子(尤其是大于100,000 核苷酸的大内含子)剪 出后的运输和降解。 最小内含子的生物学意义。 动物基因组与植物基因组在基因分布上的共性和个性。 物种衍变过程中基因组水平的变化。 基因组大小变化与遗传、分子、细胞机制的关系。 “JUNK DNA”的发生、分类、进化与功能。
大规模基因组测序的 原理与方法
胡松年 husn@big.ac.cn
―基因组”----生命科学的“元素周期表 ”
元素周期表
元素周期表的发现奠定了二 十世纪物理、化学研究和发展的 基础
人体解剖图奠定了现 代医学发展的基础
―基因组序列图”将奠定二十一世纪生 命科学研究和生物产业发展的基础!
生命的奥秘蕴藏于 “四字天书”之 中
两种大规模基因组测序策略的比较
策 项 目
遗传背景 速度 费用 计算机性能 适用范围 代表测序物种
略 逐步克隆法
需要(需构建精确的 物理图谱) 慢 高 低(以BAC为单位进 行拼接) 精细图 人、线虫
全基因组霰弹法
不需要 快 低 高(以全基因组为单 位进行拼接) 工作框架图 果蝇、水稻
BAC by BAC
人类基因组计划研究的主要成果和进展表现在这“四张图”上
• 遗传图谱 又称为连锁图谱(linkage map),指 基因或DNA标志在染色体上的相对位置 与遗传距离 • 物理图谱 以定位的DNA标记序列如STS作为路标, 以DNA实际长度即bp、kb、Mb为图距的 基因组图谱。 • 转录图谱 利用EST(expressed sequence tags 表达 序列标签)作为标记所构建的分子遗传 图谱 • 序列图谱 通过基因组测序得到的,以A、T、G、C 为标记单位的基因组DNA序列
作为载体的基本要求
能在宿主细胞中进行独立的复制
具有多克隆位点,可插入外源
DNA片段 有合适的筛选标记,如抗药性
大小合适,易于分离纯化
拷贝数多
BAC文库的构建
每一个菌落为带有相同 外源DNA片段的单克隆 脉冲场凝胶电 泳得200Kb左 右的大片段 DNA
NotI、SacI
纯化后与载体 连接
Illumina
Genome Analyzer IIx MiSeq HiSeq 1000 HiSeq 2000
Life Technologies (ABi)
5500 SOLiD™ System 5500xL SOLiD™ System Ion Torrent PGM™
第三代(即将面市) Helicos Biosciences
基因组学是一门大科学
• 基因组的信息是用来发现和解释具有普遍意义的生命 •
现象和它们的变化、内在规律、和相互关系。 基因组的信息含量高。基因组学的研究又在于基因组 间的比较。 基因组学的复杂性必然导致多学科的引进和介入(各 生物学科、医学、药学、计算机科学、化学、数学、 物理学、电子工程学、考古学等)。 基因组学研究的手段和技术已经走在生命科学研究的 最前沿。 基因组信息来自于高效率和规模化所产生的实验数据。 人类基因组计划证明了基因组研究的迫切性和可行性。
BIGIS-1 BIGIS-4
9
Pstar-1
大规模基因组测序的几个支撑技术

Sanger双脱氧末端终止法 PCR 技术 DNA 自动测序仪的发展 生物信息学分析软硬件设施
“双脱氧末端终止”的含 义
PCR(聚合酶链式反应)原理
反应所需物质:DNA模板、引物、DNA聚合 酶、dNTP、缓冲液 每个循环包括:变性(90℃)、退火(54 ℃)、延伸(72 ℃)
相关文档
最新文档