第11章 基因组学与比较基因组学

合集下载

分子生物学 第11章

分子生物学 第11章

反式作用因子从功能上分析,其结构可包含不同区 域:DNA结合域、转录激活域、连接区
(一)蛋白质直接和DNA结合
在DNA结合结构域中具有一些特殊结构基序: 1. 螺旋-转角-螺旋结构基序
2. 锌指结构基序
3. 螺旋-突环-螺旋结构基序
4. 亮氨基拉链结构基序
5. 碱性结构域 6. Β折叠
•基元,基序或模序(motifs or modules) •在许多蛋白质中,有两个或三个具有二级结构的肽 段在空间上相互接近,形成一个特殊的空间构象, 称为基序。有的将这种规则的二级结构的聚集体称 为超二级结构,它们可直接作为三级结构的“建筑 块”或域结构的组成单位,是蛋白质发挥特定功能 的基础。 •类型:αα、ββ、αβα、锌指结构、亮氨酸拉链…
第11章 真核生物的基因表达调控
真核生物基因表达与调控与原核生物有很大不同
•原核生物同一群体的每个细胞都和外界环境直接接 触,它们主要通过转录调控,以开启或关闭某些基 因的表达来适应环境条件(主要是营养水平的变 化),故环境因子往往是调控的诱导物。 •而大多数真核生物,基因表达调控最明显的特征时 能在特定时间和特定的细胞中激活特定的基因,从 而实现“预定”的,有序的,不可逆的分化和发育 过程,并使生物的组织和器官在一定的环境条件范 围内保持正常的生理功能。
1. 螺旋-转角-螺旋(Helix-turn-helix, HTH)
•HTH是第一个被确立的DNA结合结构。 很多细菌的调节蛋白是以螺旋-转角-螺旋这种基序 存在,如Lac阻遏蛋白,Trp阻遏蛋白、分解代谢激 活蛋白(CAP),λ噬菌体阻遏蛋白(Cro),噬菌 体434阻遏蛋白。在酵母中涉及交配型的a1和a2蛋 白以及在高等真核生物中的Oct-1和Oct-2也属于此 类型。

第11章-基因组学与比较基因组学

第11章-基因组学与比较基因组学

PE Applied Biosystems
DNA模板 ATTGCAGTCGAC 生成的新链 TAACGTCAGCTG
T管: TAACGTCAGCT TAACGT T
C管: TAACGTCAGC TAACGTC TAAC
G管: TAACGTCAGCTG TAACGTCAG TAACG
A管: TAACGTCA TAA TA
遗传图谱的标记是什么呢?
标记1 标记2
标记3
染色体上的基因和DNA序列均 可作为路标, 他们由特定的DNA 顺序组成.
路标位于染色体上的位置是固 定的,不会更改的,从而而提 供了作图的依据。
遗传标记
最早的遗传标记——基因 第一代遗传标记——限制性片段长度多态性 第二代遗传标记——简单序列长度多态性 第三代遗传标记——单核苷酸多态性
根据染色体上已知基因或遗传标签的位置来确定 部分DNA片段的排列顺序,再逐步确定各片段在 染色体上的相对位置,是建立在基因组图谱基础 上的”鸟枪法” 。
教学内容
一、高通量DNA序列分析技术 二、人类基因组计划 三、比较基因组学
二、人类基因组计划
人类基因组计划 ( Human genome project ) 于 1990 年 启 动 , 我 国 于 1999 年 加 入 该 计 划,承担其中1%的任务, 即人类3号染色体短臂上 约30Mb的测序任务。
(4)研究空间结构对基因调节的作用。 (5)发现与DNA复制、重组等有关的序列。 (6)研究DNA突变、重排和染色体断裂等,了解
疾病的分子机制,为疾病的诊断、预防和治疗提供 理论依据。 (7)确定人类基因组中转座子、逆转座子和病毒 残余序列,研究其周围序列的性质。
遗传图谱
(二)人类基因组计

生物化学课后习题答案-第十一章xt11

生物化学课后习题答案-第十一章xt11

第十一章 DNA的生物合成一、课后习题1.怎样确定DNA复制的主要方式是双向复制,以及一些生物的DNA采取单向复制?2.假定在D环式的复制叉上,螺旋的解开会引起未复制部分的缠绕,当缠绕继续到不可能再进一步缠绕时,主链的增长便停止,然后随从链的延长才会被引发。

那么,在什么条件下更可能观察到大小与前体片段相似的D环?3.试述滚动机制有哪些主要特征?怎样鉴别环状与线状DNA?4.已知大肠杆菌DNA的长度为1100μm,其复制叉式在一个世代大约40min内通过一个复制叉完成的,试求其复制体的链增长速度、正在复制的DNA分子的转速。

参考答案:1.原核生物的染色体和质粒,真核生物的细胞器DNA都是环状双链分子。

实验表明,它们都在一个固定的起点开始复制,复制方向大多是双向的,即形成两个复制叉或生长点,分别向两侧进行复制;也有一个是单向的,只形成一个复制叉或生长点。

2.叶绿体和线粒体DNA(除纤毛虫的线粒体线性DNA分子外)的复制方式。

双链环在固定点解开进行复制,但两条链的合成是高度不对称的,一条链先复制,另一条链保持单链而被取代,在电镜下看到呈(取代环,D环)形状。

待一条链复制到一定程度,露出另一链的复制起点并开始复制。

两条多核苷酸链的起点不在同一点上,当两条链的起点分开一定距离时就产生D环(如线粒体DNA的复制)。

双链环两条链的起点不在同一位置,但同时在起点处解开双链,进行D环复制,称为2D环复制(如叶绿体DNA的复制)。

这时,更可能观察到大小与前体片段相似的D环。

3. Walter Gilbert(1968)提出滚环模型来解释φX174DNA的复制:首先由特异核酸内切酶在环状双链DNA(称为RF型、增值型,即单链DNA已复制一次成双链)的一条链上切开切口产生5′—P末端和3′—OH末端。

5′—P末端与细胞质膜连接,被固定在膜上,然后环形的双链通过滚动而进行复制。

以完整链(正链)为模板进行的DNA合成是在DNA 聚合酶参与下,在切口的3′—OH末端按5′—3′的方向逐个添加核苷酸;以5′—P 末端结合在细胞膜上的链(被切断的负链)作模板所进行的DNA合成也是由DNA聚合酶催化,先按5′—3′方向形成短链(冈崎片断),然后再通过DNA连接酶连接起来。

第十一章 真核基因与基因组

第十一章  真核基因与基因组


3. 单拷贝序列(低度重复序列)
单拷贝序列在单倍体基因组中只出现一次或数次,大多数编码蛋
白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为
散在分布的重复序列。单拷贝序列编码的蛋白质在很大程度上体
现了生物的各种功能。
三、真核基因组中存在大量的多基因家族和假基因
1. 多基因家族(multigene family)
• 在单倍体人基因组中重复达30~50万次,约占人基因组
的3%~6%
• 每个单位长度中有一个限制性内切酶Alu的切点
(AG↓CT),将其切成长130bp和170bp的两段
② KpnⅠ家族 • 中度重复序列中仅次于Alu 家族的第二大家族 • 重复序列中含有限制性内切酶KpnⅠ的位点 • 呈散在分布,拷贝数约为3000~4800个 ③ Hinf 家族 • 以319bp长度的串联重复存在于人基因组中 • 重复序列中含有限制性内切酶Hinf Ⅰ的位点
三、调控序列参与真核基因表达调控
位于基因转录区前后并与其紧邻的DNA序列通常是基因的调控
区,又称为旁侧序列(flanking sequence)。这些调控序列又
被称为

(cis-acting element),包括
、 、

和一些细胞信号反应元
件等。
真核基因及调控序列的一般结构
1. 启动子提供转录起始信号 启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体
能,使它们不能再编码RNA和蛋白质产物;经过加工的假基因通常缺少 正常基因表达所需的调节序列、没有内含子、可能有poly(A)尾。
(2)未经过加工的假基因:来源于多拷贝或单拷贝基因的突变
(2)增强子序列距离所调控基因距离近者几十个碱基对,远 的可达几千个碱基对。 (3)通常数个增强子序列形成一簇,

第十一章-表观遗传学

第十一章-表观遗传学
印迹基因DNA复制的不同步性。
雄性生殖系 雌性生殖系
父系染色体
母系染色体
合子
父系配子
母系配子
亲代基因组印迹在生殖系的重新编程
Key features of genomic imprinting in mammals
cis-Acting mechanism A consequence of inheritance Imprints are epigenetic modification acquired by one
Both syndromes can be caused by genetic or epigenetic defects
基因组改变:
微缺失的关键区域有成簇排列的,富含CpG岛的基因表 达调控元件——
印迹中心(imprinting centers, ICs)
父源 母源
染色体上的ICs呈现差异甲基化
parental gamete Imprinted genes are mostly clustered together with a
noncoding RNA Imprints can modify long-range regulatory elements that
act on multiple genes Imprinted genes play a role in mammalian development
组蛋白的化学修饰:乙酰化、甲基化 (1)组蛋白中不同氨基酸残基的乙酰化一般与活化的 染色质构型和有表达活性的基因相关联; (2)组蛋白中氨基酸残基的甲基化与浓缩的异染色质 核基因表达受抑有关。
也有例外: 组蛋白甲基化抑制或激活基因表达取决于 被修饰的赖氨酸的位置,

11第十一章 转座因子的遗传分析iverson

11第十一章 转座因子的遗传分析iverson

(一)插入序列IS;
一、原核生物转座子
(二)转座子;
(三)转座噬菌体
(一)酵母菌转座子;
二、真核生物转座子
(二)果蝇中的P因子; (三)玉米转座子
三、转座机制及遗传学效应 (一)转座机制;
(二)转座遗传学效应
一、原核生物中的转座子
• 类型 按分子结构及遗传性质分类:

插入序列(inserted sequence, IS):序列较小,含有转座酶等相关
如下图:
转座机制
(二)转座的遗传学效应
1、引起插入突变(引起基因失活)或切离引起回复突变等。从而对基因表达进行调节。 2、给靶位点带来新的基因,如转座子上的抗药性基因等 3、引起序列重复:如转座子复制重复,靶位点同向重复序列。 4、引起染色体结构变异:如处在不同位点(甚至不同染色体上)的同源转座子间可相
的反向重复序列类似)。
每个单倍体酵母基因组有30-35个 TY,及至少100个单一的δ因子 酵母Ty1转座子的结构( a) 与Solo δ的形成( b)
(solo δ elements)。
Ty1因子转座
Ty1因子转座是通过一种RNA
中间产物进行的。
首先以其DNA 为模板合成一 个拷贝的RNA;
然后再通过反转录合成一条
被Ac因子激活。尤其是两端重复序列与Ac同源。
• Ac也是一个转座子,由4563 bp组 成(其中间区编码转座酶),两端有 11 bp的反向重复序列,可转座到 基因组的任何位臵,其靶位点有两 个8 bp的同向重复序列。其中间编 码区不同程度缺失,形成不同的 Ds。 • 当Ac开始转座活动时,Ds被激活 也进行转座,移动到新位点,使靶 位点附近基因失活或改变表达活性。
在体细胞中,内含子1、2被剪 接掉,所形成的mRNA翻译成一个转 座阻遏蛋白,抑制P因子转座。 在生殖细胞中,内含子1、2、3 都被剪接掉,所形成的mRNA翻译成 转座酶,导致P因子转座,插入W位点 引起配子劣育。

第11章转座子的遗传分析

第11章转座子的遗传分析

总长度 768bp
5bp
41bp
1327bp
11~13bp 18bp
1428bp
4bp
16bp
1195bp
9bp
22bp
1329bp
9bp
9bp
1531bp
插入位点 随机 热点 AAAN20TTT 热点 NGCTNAGCN 热点
含有IS序列的质粒经变性复性后形成茎环结构。
2. 转座子(transposon, Tn)
pol LTR, 340bp
2. 果蝇的P因子
• 1977年,Kidwell报道黑腹果蝇的特定品系间 杂交后会导致杂种劣育(hybrid dysgenesis)
P雌×M雄
M雌×P雄
F1正常
F1不育
• 研究表明,P品系果蝇细胞中含有导致杂种劣 育的转座子,称为P因子。
3.0 kb
内含子3的剪接是转座
A1a1 Dtdt
A1- Dt- 9/16 a1a1 Dt- 3/16
A1- dtdt 3/16 a1a1 dtdt 1/16
转座子的发现: 遗传学史上的又一里程碑
"for her discovery of mobile genetic elements"
1983
玉米籽粒的颜色
• A:花色素基因,突变后籽粒没有颜色; • C:颜色基因,决定红色和紫色的发生; • R:控制红色性状,但要求A、C基因的表达; • Pr:控制紫色性状,要求A、C、R均显性; • I:抑制基因,可抑制C基因的表达,即Ds基因,
• DNA转座子 • 反转录转座子(retrotransposon)
按照物种进行划分:
• 原核生物转座子: – 插入序列(insertion sequence) – 转座因子(transposon) – 转座噬菌体(mutator phage)

第十一章 DNA文库的构建和目的基因的筛选

第十一章 DNA文库的构建和目的基因的筛选
和仅为4.6%,低丰度 的比例高达95.4% 基因组DNA饱和杂交法&基于复性,使筛选差异 表达基因的可能性大大提高 原理:将含目的基因的组织或器官的mRNA群体作为 待测样本(tester),将基因表达谱相似或相近但不 含目的基因的组织或器官的mRNA群体作为对照样本 (driver),使tester和driver的cDNA进行多次杂交, 去掉在二者之间都表达的基因,而保留二者之间差 异表达的基因。
(3) 引导合成法
Okayama-Berg方法
(4)引物-衔接头合成法
4、双链 cDNA连接到质粒或噬菌体载体并导入 大肠杆菌中繁殖的分子克隆
1.同聚100dA/dT, 20dG/dC) • 同聚尾结合的质粒: cDNA杂合分子转化 E.coli的效率随宿主不 同而不同。
该法聪明地利用了反转录过程中用接头锚定的方法, 与传统法相比,全长cDNA的比例得到大幅提高
2. G
1. 抑制性扣除杂交 suppression subtractive hybridization, SSH
含目的基因的cDNA:供体 tester 不含目的基因的cDNA:驱动 driver
• RsaI消化tester和driver • 将tester一分为二,分别加上接头1和接头2R • 第一轮杂交中,用过量的driver cDNA分别与带两种 接头的tester cDNA杂交 • 第二轮杂交中,将第一轮杂交的两个体系混合,再 加入过量的driver cDNA • 补平第二轮杂交产物的末端,进行两轮PCR扩增 • 巢式引物进行第二轮PCR扩增,富集差异表达基因 • T/A克length cDN因: • cDNA第二链合成工程中聚合酶的外切酶活性; • mRNA降解; • 反转录酶合成特性,从转录复合体上anism at 5' end of RNA • 指导合成高分子量蛋白质的能力 无细胞翻译体系(源于网织红细胞) 哺乳动物总mRNA可编码 10~100kDa蛋白
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

dNTP (其中一种为 α-32P 标记),将此反应物分
为 4 等份,每份内加入一定比例的一种 ddNTP , 如此形成 A、 T、 C 、 G四个反应体系,最后在各 反应体系中加入DNA聚合酶催化DNA片段合成。 这样各反应体系中即可形成以一种 ddNTP残基为
3’端结尾的一系列长短不一片段。
Template
dATP
dNTP
Primer
Polymerase
Terminator
A
G
C
T
PE Applied Biosystems
THE PROCESS
A C T G G C C TAAT C G A G T C A G T TGACCGGA T
C
T C C A A C
G
G T G G T
A T
G
C
A
G
T
A
C
人类基因组计划的科学意义

(1)确定人类基因组中约数万个编码基因的序列 及其在基因组中的物理位置,研究基因的产物及 其功能。 (2)了解转录和剪接调控元件的结构与位置,从 整个基因组结构的宏观水平上理解基因转录与转 录后调节。 (3)从整体上了解染色体结构,包括各种重复序 列以及非转录“框架序列”的大小和组织,了解 各种不同序列在形成染色体结构、DNA复制、基 因转录及表达调控中的影响与作用。
以荧光化合物标记双脱氧核苷酸的自动测序
(二)鸟枪法测序技术及其改良

基因组的每条染色体长度可达数百万碱基对以上,
将链终止法测定的小片段 DNA组装成真实的排列
顺序是一项浩繁而精细的工作。

DNA顺序的组装主要方法: 全基因组鸟枪法测序 改良鸟枪法:大片段克隆法、靶标鸟枪法
1、全基因组鸟枪法测序
DNA序列 分析技术
鸟枪法测 序技术及 其改良
(一)DNA序列分析技术

DNA序列测定: 是指 DNA 一级结构的测定,是在核酸酶学和 生物化学的基础上,创立并发展起来的一门重 要的DNA技术学。
DNA序列测定的技术
经典方法:
双脱氧链末端终止法(Sanger,1977) DNA化学降解法(Maxam&Gilbert,1977)
DNA测序自动化步骤:
4种带有不同荧光染料标记的终止物ddNTPs Sanger测序反应 反应产物电泳分离 激光激发不同大小DNA片段上的荧光分子,发射出
四种不同波长的荧光
荧光信号采集、计算机分析与DNA自动排序
Template
dNTP
Polymerase
Primer
Terminator
A C G T
新技术方法:
杂交测序法
质谱法 单分子测序法 原子探针显微镜测序法
DNA芯片法
1、双脱氧链末端终止法
•是 由 英 国 剑 桥 分 子 生物学实验室的生物 化学家F. Sanger等人 于1977年发明的。
•利 用 双 脱 氧 核 苷 酸 作为链终止物测定 DNA 核 苷 酸 顺 序 的 方法。
PE Applied Biosystems
THE PROCESS
A C T G G C C TAAT C G A G T C A G T TGACCGGA T
G C
T T G T G G C C T T
C C A A
A
C
A
G
A
C
G
PE Applied Biosystems
PE Applied Biosystems
特 性 , 在 DNA 合 成 反 应 中 , 加 入 ddNTP ,
ddNTP不存在 3′-OH末端,故不能与下一个核 苷酸的 5′-P 端形成 3′ 、 5′- 磷酸二酯键,导致 DNA新链的延伸提前终止于ddNTP 。
ATP、dATP和ddATP的结构
ATP dATP
ddATP

这样以待测序列的 DNA 为模板,加入引物和 4 种
第11章
基因组与比较基因组学
什么是基因组,基因组学?

基因组(Genome):是指生物体的单倍体细胞
中所有的 DNA ,包括细胞核内的 DNA 和各种细 胞器中的DNA,是生物体内遗传信息的集合。

基因组学(genomics):是研究并解析生物体整 个基因组所有遗传信息的一门学科。
基因组学的发展:从序列到功能
基因组计划的主要任务是获得全基因组序 列; 现在的测序方法每次只能测800-1000bp, 大量的测序片段要拼接; 要知道序列在染色体上的位置才能正确拼 接,因此需构建基因组图谱。
教学内容


一、高通量DNA序列分析技术
二、人类基因组计划 三、比较基因组学
一、高通量DNA序列分析技术 DNA 序列分析
即人类 3号染色体短臂上
约30Mb的测序任务。
(一)人类基因组计划概述
1986 年 诺 贝 尔 奖 获 得 者
R.Dulbecco ( 杜 尔 贝 科 ) 提
出人类基因组计划——
测出人类全套基因组的 DNA
碱基序列( 3 X 109 bp )

1988 年美国能源部和国家卫生研究院率先在美国 开展人类基因组计划,并经国会批准由政府给予 资助。此后,成立了一个国际间的合作机构 —— 人类基因组织 (Human Genome Organization),由 多个国家筹集资金和科研力量,积极参加这一国 际性研究计划。
根据染色体上已知基因或遗传标签的位置来确定
部分DNA片段的排列顺序,再逐步确定各片段在
染色体上的相对位置,是建立在基因组图谱基础
上的”鸟枪法” 。
教学内容


一、高通量DNA序列分析技术
二、人类基因组计划 三、比较基因组学
二、人类基因组计划
人 类 基 因 组 计 划
( Human genome project ) 于 1990 年 启 动 , 我 国 于 1999 年 加 入 该 计 划,承担其中 1%的任务,
2、高等生物基因组中存在大量的基因间隔区, 遗传图中留下大片的无标记区段。 3. 只有部分基因其等位基因成员可以通过常规 实验予以区分,因而产生的遗传图是不完整的。
(2)限制性片段长度多态性 (restriction fragment length polymorphisms, RFLP)



(4)研究空间结构对基因调节的作用。 (5)发现与DNA复制、重组等有关的序列。 (6)研究DNA突变、重排和染色体断裂等,了解 疾病的分子机制,为疾病的诊断、预防和治疗提供 理论依据。

(7)确定人类基因组中转座子、逆转座子和病毒 残余序列,研究其周围序列的性质。
遗传图谱
转录图谱
遗传图谱的标记是什么呢?
标记1
标记2
染色体上的基因和DNA序列均 可作为路标, 他们由特定的DNA 顺序组成. 路标位于染色体上的位置是固 定的,不会更改的,从而而提 供了作图的依据。
标记3
遗传标记


最早的遗传标记——基因
第一代遗传标记——限制性片段长度多态性
第二代遗传标记——简单序列长度多态性


延伸-终止反应
变性聚丙烯酰胺凝胶电泳


放射性自显影
阅读测序结果
双脱氧链末端终止法要求单链作为模板
如何得到单链DNA ?

将DNA克隆到质粒载体
将DNA克隆到M13噬菌体载体
将DNA克隆到酵母测序自动化

DNA 测序的自动化是在 Sanger 的双脱氧链末 端终止法的基础上在1987年由美国应用生物系 统公司进一步发展起来的激光测序法,其基本 原理与末端终止法一样,都是通过ddNTP竞争 性的终止新合成的DNA链。
人类和水稻的第一张基因组草图完成; 2001 人类基因组测序(精细图)完成; 水稻(籼稻和粳稻)基因组草图完成。 2003年4月,人类基因组序列图(完成图)完成。
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成

2000年6月26日,美国总统克林顿(中)、塞莱拉公司 董事长兼首席科学家克雷格· 文特尔(左)和人类基因 组计划首席科学家弗胡西斯· 柯林斯(右)在华盛顿白 宫参加庆祝人类基因组草图绘制成功。
1980年诺贝尔奖金获得者F. Sanger
(1)Sanger 双脱氧链末端终止法测定DNA 序列的基本原理:

以DNA合成反应为基础,加入ddNTP生成特定
末端不同长短的DNA片段;

聚丙烯酰胺凝胶电泳可以区分长度只差一个核
苷酸的DNA分子。
DNA合成反应
利用DNA聚合酶不能够区分dNTP和ddNTP的
第三代遗传标记——单核苷酸多态性
(1)基因是首先被使用的标记
孟德尔 → 豌豆植株高矮、豌豆的形状等
摩尔根 — 显微镜、肉眼→ 果蝇躯体颜色、翅膀 形状等
生化表型→细菌、酵母遗传学研究;人类中如血 型系列(ABO)分析、血清蛋白和免疫蛋白
基因是非常有用的标记,但并不是理想的,基 因标记的缺点:
1、可用作标记的基因十分有限,许多性状都涉 及多基因。
鸟枪法的局限:
拼接组装困难:对于结构复杂的大基因组而言,
鸟枪法的序列组装的起始阶段工作量非常大。。 重复序列的存在:在序列组装时可能出现错误连 接,使某些片段从原位置跳到另一无关位置。因 此,对于缺少重复顺序的小基因组( <5Mb )而 言,鸟枪法仍为最佳的选择,但对于大基因组而 言,还需要更加有效的策略。
鸟枪法的顺序组装是直接从已测序的小片段中寻 找彼此重叠,然后依次向两侧邻接的序列延伸。
DNA的鸟枪法测序的主要步骤

第一,建立高度随机、的末端测序。
相关文档
最新文档