真核细胞基因组结构与功能
第五章真核生物基因组结构

外显子:具有编码意义
结
转录单位
内含子:无编码意义( 5′GT、
构
基 因
非编码区
3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
00:28
21
Interrupted gene
00:28
43
核小体的结构组成
每个核小体含有约200bp的DNA,核心
组蛋白H2A、H2B、H3和H4各2份拷贝, 1份拷贝的H1组蛋白位于核小体外侧。
微球菌核酸酶(micrococcal nuclease) 处理染色体可得到单个核小体。
00:28 44
八聚体 染色质小体 (~166bp) 核小体 (~200bp) DNA 连接区 (常为 32~34bp) 图 10-10 核小体的组成 DNA H1
28
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA。
00:28
29
PS DNA
外显子 S
PL外显子 L来自外显子 2外显子 3
50b
2800bp
161bp
4500bp
205bp 327bp
初始转录本: 在唾腺中转录 成熟 mRNA: 1663nt 初始转录本: 在肝中转录 成熟 mRNA: 1773nt 图 18-57 小鼠淀粉酶(amy) 基因利用不同启动子产生两个不同的 mRNA
00:28
染色体( 1400nm,2个染色单体, 每个染 色体单体含10个螺旋圈)
51
染色质和染色体的概念
染色质(chromatin):是指细胞周期间期细胞核内由 因其易被碱性染料染色而得名。
真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
真核原核细胞基因结构示意图

基因结构
真核细胞的基因结构通常包括编码区和非编码区,其中编 码区被内含子和外显子分隔;而原核细胞的基因结构相对 简单,没有内含子和外显子的区分。
染色体结构
真核细胞的染色体由DNA和蛋白质组成,呈现高度折叠的 结构;原核细胞的染色体则是由环状DNA分子组成,结构 相对简单。
复制方式
真核细胞的基因复制需要多种蛋白质的参与,复制过程复 杂;而原核细胞的基因复制则相对简单,不需要太多蛋白 质的参与。
遗传信息的储存和复制
遗传信息的储存
基因是遗传信息的载体,通过DNA双螺旋结构,将遗传信息稳定 地储存于细胞核或细胞质中。
复制机制
原核细胞通过半保留复制方式,真核细胞通过半不连续复制方式 ,确保遗传信息的准确传递。
基因表达与调控
转录过程
在RNA聚合酶的作用下,DNA的 遗传信息被转录为mRNA,为蛋
染色体数目与形态
80%
染色体数目
原核细胞通常只有一条染色体, 但在某些情况下可能存在多条染 色体。
100%
染色体形态
原核细胞的染色体呈环状或线性 ,没有真核细胞的染色体结构复 杂。
80%
复制与分离
原核细胞的染色体复制和分离机 制相对简单,通常只有一个复制 起点。
03
真核原核细胞基因结构的比较
结构差异
真核原核细胞基因结构示意图
目
CONTENCT
录
• 真核细胞基因结构 • 原核细胞基因结构 • 真核原核细胞基因结构的比较 • 真核原核细胞基因结构的功能 • 真核原核细胞基因结构的研究意义
01
真核细胞基因结构
结构特点
真核细胞基因结构包括 编码区和非编码区,其 中编码区又分为内含子 和外显子。
真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106bp硷基组成,但人细胞中所含基因总数大概会超过3万个。
这就说明在人细胞基因组中有许多DN A序列并不转录成mR NA用于指导蛋白质的合成。
研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。
在基因内部也有许多能转录但不翻译的间隔序列(内含子)。
因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA序列用以编码蛋白质。
真核生物基因组有以下特点。
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploi d),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种(1)反向重复序列这种重复顺序约占人基因组的5%。
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。
反向重复间可有一到几个核苷酸的间隔,也可以没有间隔。
没有间隔的又称回文结构,这种结构约占所有反向重复的三分之一。
第十一章 真核基因与基因组

3. 单拷贝序列(低度重复序列)
单拷贝序列在单倍体基因组中只出现一次或数次,大多数编码蛋
白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为
散在分布的重复序列。单拷贝序列编码的蛋白质在很大程度上体
现了生物的各种功能。
三、真核基因组中存在大量的多基因家族和假基因
1. 多基因家族(multigene family)
• 在单倍体人基因组中重复达30~50万次,约占人基因组
的3%~6%
• 每个单位长度中有一个限制性内切酶Alu的切点
(AG↓CT),将其切成长130bp和170bp的两段
② KpnⅠ家族 • 中度重复序列中仅次于Alu 家族的第二大家族 • 重复序列中含有限制性内切酶KpnⅠ的位点 • 呈散在分布,拷贝数约为3000~4800个 ③ Hinf 家族 • 以319bp长度的串联重复存在于人基因组中 • 重复序列中含有限制性内切酶Hinf Ⅰ的位点
三、调控序列参与真核基因表达调控
位于基因转录区前后并与其紧邻的DNA序列通常是基因的调控
区,又称为旁侧序列(flanking sequence)。这些调控序列又
被称为
、
(cis-acting element),包括
、 、
、
和一些细胞信号反应元
件等。
真核基因及调控序列的一般结构
1. 启动子提供转录起始信号 启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体
能,使它们不能再编码RNA和蛋白质产物;经过加工的假基因通常缺少 正常基因表达所需的调节序列、没有内含子、可能有poly(A)尾。
(2)未经过加工的假基因:来源于多拷贝或单拷贝基因的突变
(2)增强子序列距离所调控基因距离近者几十个碱基对,远 的可达几千个碱基对。 (3)通常数个增强子序列形成一簇,
3 基因组的结构与功能

目录
质粒对宿主的适应性
➢窄宿主谱质粒 仅能存在于一种或数种密切相关的宿主
➢广宿主谱质粒 可以在不同科、属、种的细菌之间传递
目录
➢ 卫星DNA 这类序列的碱基组成不同于基因组的其他部份, 可用等密度梯度离心法将其与主体DNA分开
➢反向重复序列(inverted repeats)
AGCTAGTACATGCATGCGTACTAGCT TCGATCATGTACGTACGCATGATCGA
➢总长度约占人基因组的5%。 ➢反向重复的单位长度约为300bp或略短。 ➢散在分布于基因组中
目录
➢ 假基因是由于在进化过程中,某些DNA片段发生 了缺失、倒位或点突变,导致调控基因丢失;或 无剪接加工信号;或编码区出现终止信号;或编 码无功能或不完整的基因。
➢ 与正常基因相比,缺少内含子,两侧有顺向重复 序列。
目录
四、线粒体DNA的结构
➢ 线粒体DNA(mitochondrial DNA, mtDNA) 属于真核细胞核外遗传物质,可独立编码存在 于线粒体中的多肽链、rRNA或tRNA。
① 大卫星DNA(macrosatellite DNA): ➢ 其重复单位为5~171 bp,主要分布于染色体 的着丝粒区。
② 小卫星DNA(minisatellite DNA): ➢ 其重复单位为15~70 bp,存在于常染色体。
③ 微卫星DNA(microsatellite DNA): ➢ 其重复单位为2~5 bp,存在于常染色体。
➢ mtDNA为双链环状DNA,其分子结构特点与 原核生物DNA相同。
目录
➢ 人类的mtDNA长16,569
真核生物基因组结构

三、真核生物基因组的非重复序列和重复序列
1.DNA复性动力学 2.DNA的复性过程遵循二级反响动力学。
DNA复性过程中复性的速度用公式表示:
dC/dt= -kC02
其中,C是单链DNA在t时刻的浓度。
k=复性速度常数
对上式积分后重排,得出复性动力学方程: C/C0=1/〔1+ k C0t〕
C0为单链DNA的起始浓度,C为单链DNA在t时刻的浓 度,单位mol/L。 t为复性时间,单位为s〔秒〕。重组速率常 数k的单位为L/mol,取决于阳离子的浓度、温度、片段大小 和DNA序列的复杂性。
植物 鸟类 哺乳动物 爬行动物 两栖动物 硬骨鱼 软骨鱼 棘皮动物 甲壳动物 昆虫 软体动物 蠕虫 霉菌 藻类 真菌 格兰氏阳性菌 格兰氏阴性菌 支原体
阴影局部为一个门内C-值的范围
二、真核生物基因组的基因数量
不同物种编码基因差异很大,从500个到50000 个,有100倍的差距。
真核生物的基因数量通常在6000到50000之间。 人的基因组的全长为大约3 X 109对碱基,编码 3-4万个基因; 但某些寄生的真核生物,如脑微孢子虫,基因数 量可能不超过3000个,比很多细菌的基因数量还少。
当 C/ C0 = 1/2 时的C0t值定义为C0t1即/2复性反响 完成一半时
C / C0 = 1/2 = 1 / (1+ k
C0t(1/2))
Cot(1/2) = 1/k (mol. Sec / L)
DNA复性的影响因素:
DNA序列的复杂性、初始浓度、片段大小、温度、离子强度
在控制反响条件〔初始浓度、温度、离子强度、片段大 小〕一样的前提下,DNA分子的C0t (1/2)值,取决于 核苷酸的排列复杂性。
原核生物和真核生物基因表达调控特点的比较

亚基首先与mRNA模板相结合, 与Met-tRNA相结合,再与模板mRNA结
再与fMet-tRNA结合,最后与 合,最后与60s大亚基结合生成起始复
50s大亚基结合
合物
肽链的终止
三种释放因子RF1,RF2,RF3
eRF1和eRF3
真核生物和原核生物复制的不同点:
1. 真核生物DNA的合成只是在细胞周期的S期进行,而原核生物则 在整个细胞生长过程中都可进行DNA合成
真核生物
DNA与蛋白质结合形成, 储存于细胞核内,除配子细胞外,体 细胞内的基因组是双份的(即双倍体)
复制子 基因组较小,只有一个复制子
基因组较大,具有许多复制起点,而 每个复制子的长度较小。
顺反子
多顺反子,功能上相关的几个基因 单顺反子,一个结构基因经过转录和
往往在一起组成操纵子结构。
翻译生成一个mRNA分子和一条肽链。
2. 基因组远远大于原核生物的基因组,具有许多复制起点,而每 个复制子的长度较小。
3. 真核细胞基因转录产物为单顺反子。一个结构基因经过转录和 翻译生成一个mRNA分子和一条肽链。原核生物基因转录产物为 多顺反子,功能上相关的几个基因往往在一起组成操纵子结构。
4. 真核基因组大部分基因含有内含子,因此,基因是不连续的, 称为断裂基因,需要进行转录后加工;原核基因组没有内含子 结构,不需进行转录后剪接加工。
一个mRNA分子通常含多个基因
一种
三种
可以直接起始转录合成RNA 不能独立转录RNA,三种聚合酶都必须
在蛋白质转录因子的协助下才能进行
翻译
原核生物
RNA的转录
真核生物
氨基酸的活化 起始氨基酸是甲酰甲硫氨酸
从生成甲硫氨酰-tRNAi开始
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非组蛋白功能
1. 参与并调控基因表达
参与基因复制、转录及核酸修饰的酶类(如各种 DNA 和 RNA聚合酶等) 参与转录调控的蛋白质
2. 维持染色体的高级结构
非组蛋白中的核基质蛋白对于维持染色体的高级结构 是必不可少的
21
从DNA到染色体的四级结构模型
一级结构:核小体串珠结构 二级结构:螺线管
30
核小体串珠状模型
31
染色体的包装 ——超螺旋结构
螺线管纤维(solenoidal fiber) ——染色体DNA二级包装 由6个核小体盘绕形成一种中空螺线管,其外 径为30 nm,因此,螺线管的形成使DNA一级 包装又压缩小6倍 若以充分伸展的DNA双螺旋论,每个螺线管包 含了408 nm(6×68 nm)长度的DNA链,而 每圈螺线管的长度几乎等于核小体直径,即 11nm,故染色体的二级包装相当于将DNA长 32 度压缩了近40倍
氨基酸 残基数
215 129
分子量 23,000 13,960
H1
H 2A
H 2B
H3 H4
16 10
11
6 13
14
13 13
10
1.7 1.8
2.5
125 135
102
13,774 15,342
11,282
16
富 Arg
组蛋白
组蛋白的等电点(pI)在7.5-10.5之间,所含的强极性 氨基酸使组蛋白带上大量电荷,成为组蛋白与DNA结合 及蛋白质之间的相互作用的主要化学力之一
34
染色体的包装——超螺旋结构
三级包装后,DNA链被压缩的程度仍远远不足 以形成能被细胞核容纳的染色体,因此,环状 螺线管纤维需进一步包装
经各级包装后染色体DNA总共被压缩了数千倍 (8100多倍)
35
36
真核生物基因组特点
1.基因组远远大于原核生物的基因组,具有许多复制起始点, 而每个复制子的长度较小 2.真核生物基因组DNA与蛋白质结合形成染色体,储存于 细胞核内, 除配子细胞外, 体细胞内的基因的基因组是 双份的(即双倍体,diploid),即有两份同源的基因组 3.真核细胞基因转录产物为单顺反子。一个结构基因经过转 录生成一个mRNA分子,再翻译生成一条多肽链 4.大部分基因含有内含子,因此,基因是不连续的(断裂基 因,split gene) 5.基因组中不编码的区域多于编码的区域,存在大量重复序 列,重复次数可达百万次以上 37
核小体:染色体DNA的一级包装 由直径2nm的DNA双螺旋链绕组蛋白形成直 径11nm 的核小体 “串珠” 结构,若以每碱 基对沿螺旋中轴上升距离为 0.34 nm计, 200bp DNA(一个核小体的DNA片段)的 伸展长度为 68 nm,形成核小体后仅为11 nm(核小体直径),其长度压缩了6-7倍
11
基因连锁和交换规律
Morgan:发现了伴性基因,总结出了遗传学上著名的 基因连锁(linkage)和交换(crossing-over)规律 通过测定连锁的回交试验,证实了基因在染色体上呈 线性排列的事实 产生了遗传学上最早的基因定位线性遗传图
12
染色体的主要化学成分
DNA 蛋白质 RNA
二者均成对存在,且其中的每个成员分别来自父、母 亲代 产生配子时,配子只含“遗传因子”(等位基因)中 的一个或染色体对中的一条 非等位基因及非同源染色体均可自由组合到配子中 在上述基础上,Sutton和Boveri(1902-1903)提出 了染色体遗传学 认为:染色体是“遗传因子”的携带者
24
核小体的研究(二)
用小球菌核酸酶处理提取的染色质,可得到单个 的核小体颗粒 对染色质进行酶解处理,通过凝胶电泳鉴定,发现:产 物是一系列不同长度的DNA片段,且这些片段之间有一 个200 bp左右的“阶差” 对核小体多聚体的研究,获得的结果是:相邻多聚体之 间的DNA“阶差”等于核小体单体中的DNA长度(200 bp 左右),且多聚体分子量总是单体分子量的整倍数 以密度梯度离心法制备核小体单体,对其中的蛋白质进 行化学分析得知,每一个单体中含有H2A、H2B、H3和H 254 各二分子(它们构成一个八聚体),H1一分子
40
中度重复顺序
中度重复序列:在基因组中重复数十至数
万(<105)次的重复顺序中度重复顺序。
在基因组中所占比例在不同种属之间差异很大, 一般约占10-40%,在人约为12% 大多不编码蛋白质。其功能可能类似于高度重复 顺序。但有些中度重复顺序则是编码蛋白质或 rRNA的结构基因,如HLA基因,rRNA基因, tRNA基因,组蛋白基因,免疫球蛋白基因 41
是非组蛋白中一群较丰富而不均一的蛋白,富含Asp、 Glu等酸性氨基酸,为酸性蛋白质 分子量一般≤3.0×104,在聚丙烯酰胺凝胶电泳中迁移 率很高
在高等真核生物中,HMG可以分为3大类,即HMG1/2、HMG-I(Y)和HMG-14/17
已经明确其中的一些蛋白质(如HMG14/17)在转录 活性区含量丰富,可以认为是参与转录调控的蛋白质
大肠杆菌约 每 30 分 钟 分 裂 一次,其中大 约 29 分 钟 花 在 复 制 DNA 果蝇的胚胎 细 胞 周 期 只 有8 分钟 大部分成长 中的动植物细 胞 要 花 10 - 20 个小时才分裂 完毕
6
染色体是遗传的物质基础
体细胞增殖
有丝分裂(mitosis)方式
染色体对自身复制 姐妹染色体(sister chromatid) 姐妹染色体一分为二进入子细胞
44
中度重复顺序——Alu家族
是哺乳动物基因组中含量最丰富的一种中度重复顺序 家族,平均每5kb就有这样的结构 每个单位长度中有一个限制性内切酶Alu的切点 (AG↓CT)
中度重复序列 middle repeated sequence
Alu家族 KpnⅠ家族 Hinf家族 rRNA基因 多聚dT-dG家族 组蛋白基因
42
中度重复顺序
短分散片段(short
interspersed repeated segments, SINES)
• 重复顺序的平均长度:约为300bp • 在基因组中排列方式:与平均长度约为1000 bp 的单拷贝顺序间隔排列 • 拷贝数:10万左右 – Alu家族 – Hinf家族,等
组蛋白对染色体中DNA的包装有十分重要的作用
18
非组蛋白 (non-histone protein,NHP)
染色体中组蛋白以外的其它蛋白质 是一大类种类繁杂的各种蛋白质的总称 估计总数在
300-600 之间
分子量范围为7-80kD 等电点为3.9-9.2
19
高迁移率蛋白群 (high mobility group, HMG)
核小体的组成
八聚体
核心颗粒
(组蛋白H2A、H2B、H3、H4各2分子)
140bp DNA,缠绕1.75圈
连接区
60bp左右DNA片段+H1组蛋白
28
染色体的形成——超螺旋结构
染色体的形成实际上是细胞核DNA在核
小体的基础上经多层次的进一步结构变 化, 形成更高层次的超螺旋结构
29
染色体的包装——超螺旋结构
7
细胞分裂
8
染色体是遗传的物质基础
生殖细胞增殖
减数分裂(meiosis)方式 同源染色体分别进入新的子代细胞而产生生殖细胞─配 子(精子或卵子),配子只含有体细胞一半的染色体数 配子结合成合子后又恢复到体细胞的染色体数,一个来 自父本,一个来自母本
9
减数分裂
10
染色体与“遗传因子”极其相 似
根据所含碱性氨基酸的相对比例划分为三种类型:富精 氨酸组蛋白(H3和H4),稍富赖氨酸组蛋白(H2A和H2B) 及极富赖氨酸组蛋白(H1)
17
组蛋白
五种组蛋白的氨基酸全顺序均已确定。 H3 和 H4 的 序列在各种属之间极少有差异,这种生物进化上的高 度保守性预示着其功能的重要性。其它三种组蛋白在 不同种属之间存在着较大的差异
核小体结构
核酸酶酶解实验结果:
核小体由核心颗粒(core particle)和连接 区DNA(linker DNA)二部分组成
核小体单体被小球菌核酸酶处理后,随着时间延长, 其降解产物(DNA片段)会逐渐缩短,从 200 bp降 至 146 bp至此变为很难进一步降解的稳定状态
26
核小体结构
染色体的包装——超螺旋结构
环状螺线管:染色体DNA的三级的包装 电镜显示,由螺线管纤维缠绕在一个由某
些非组蛋白构成的中心轴(central axis) 骨架上形成的。这显然使螺线管纤维得到 了较大程度的压缩
33
Chromosome
solenoidal loops
Central axis
真核细胞基因组 结构与功能
染色体的结构
染色体研究的历史背景 染色体的化学组成 核小体的结构
2
染色体研究的历史背景:
1865年,Mendel(奥地利)历时八年,完成 了植株(豌豆)杂交试验,在此基础上总结出 二个著名遗传学定律: 分离定律 独立分配定律 “遗传因子”(genetic factor)是 Mendel 定律的基本思路,每一植株的各种相对性状都 来源两个相同的“遗传因子”,它们有显性和 隐性之分, “遗传因子”含义是指决定遗传 性状的基本遗传单位
14
组蛋白(histones) ——染色体中的碱性蛋白质