真核生物基因组结构

合集下载

第五章真核生物基因组结构

第五章真核生物基因组结构
00:28 20
外显子:具有编码意义

转录单位
内含子:无编码意义( 5′GT、

基 因
非编码区
3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
00:28
21
Interrupted gene
00:28
43
核小体的结构组成

每个核小体含有约200bp的DNA,核心
组蛋白H2A、H2B、H3和H4各2份拷贝, 1份拷贝的H1组蛋白位于核小体外侧。

微球菌核酸酶(micrococcal nuclease) 处理染色体可得到单个核小体。
00:28 44
八聚体 染色质小体 (~166bp) 核小体 (~200bp) DNA 连接区 (常为 32~34bp) 图 10-10 核小体的组成 DNA H1
28
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA。
00:28
29
PS DNA
外显子 S
PL外显子 L来自外显子 2外显子 3
50b
2800bp
161bp
4500bp
205bp 327bp
初始转录本: 在唾腺中转录 成熟 mRNA: 1663nt 初始转录本: 在肝中转录 成熟 mRNA: 1773nt 图 18-57 小鼠淀粉酶(amy) 基因利用不同启动子产生两个不同的 mRNA
00:28
染色体( 1400nm,2个染色单体, 每个染 色体单体含10个螺旋圈)
51
染色质和染色体的概念

染色质(chromatin):是指细胞周期间期细胞核内由 因其易被碱性染料染色而得名。

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。

真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。

对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。

一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。

基因组大小与细胞大小和复杂度之间存在着类似关联性。

人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。

真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。

1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。

在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。

2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。

与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。

3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。

真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。

二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。

1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。

目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。

2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。

真核原核细胞基因结构示意图

真核原核细胞基因结构示意图

基因结构
真核细胞的基因结构通常包括编码区和非编码区,其中编 码区被内含子和外显子分隔;而原核细胞的基因结构相对 简单,没有内含子和外显子的区分。
染色体结构
真核细胞的染色体由DNA和蛋白质组成,呈现高度折叠的 结构;原核细胞的染色体则是由环状DNA分子组成,结构 相对简单。
复制方式
真核细胞的基因复制需要多种蛋白质的参与,复制过程复 杂;而原核细胞的基因复制则相对简单,不需要太多蛋白 质的参与。
遗传信息的储存和复制
遗传信息的储存
基因是遗传信息的载体,通过DNA双螺旋结构,将遗传信息稳定 地储存于细胞核或细胞质中。
复制机制
原核细胞通过半保留复制方式,真核细胞通过半不连续复制方式 ,确保遗传信息的准确传递。
基因表达与调控
转录过程
在RNA聚合酶的作用下,DNA的 遗传信息被转录为mRNA,为蛋
染色体数目与形态
80%
染色体数目
原核细胞通常只有一条染色体, 但在某些情况下可能存在多条染 色体。
100%
染色体形态
原核细胞的染色体呈环状或线性 ,没有真核细胞的染色体结构复 杂。
80%
复制与分离
原核细胞的染色体复制和分离机 制相对简单,通常只有一个复制 起点。
03
真核原核细胞基因结构的比较
结构差异
真核原核细胞基因结构示意图

CONTENCT

• 真核细胞基因结构 • 原核细胞基因结构 • 真核原核细胞基因结构的比较 • 真核原核细胞基因结构的功能 • 真核原核细胞基因结构的研究意义
01
真核细胞基因结构
结构特点
真核细胞基因结构包括 编码区和非编码区,其 中编码区又分为内含子 和外显子。

真核生物基因组

真核生物基因组

微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同

真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能

真核生物染‎色体基因组的结构和功‎能真核生物的‎基因组一般比较庞‎大,例如人的单‎倍体基因组由3×106bp‎硷基组成,但人细胞中‎所含基因总‎数大概会超‎过3万个。

这就说明在‎人细胞基因组中有许多D‎N A序列并‎不转录成m‎R NA用于‎指导蛋白质‎的合成。

研究发现这‎些非编码区‎往往都是一‎些大量的重‎复序列,这些重复序‎列或集中成‎簇,或分散在基‎因之间。

在基因内部‎也有许多能‎转录但不翻‎译的间隔序‎列(内含子)。

因此,在人细胞的‎整个基因组当中只有很‎少一部份(约占2-3%)的DNA序‎列用以编码‎蛋白质。

真核生物基因组有以下特点‎。

1.真核生物基因组DNA与蛋‎白质结合形‎成染色体,储存于细胞‎核内,除配子细胞‎外,体细胞内的‎基因的基因组是双份的(即双倍体,diplo‎i d),即有两份同‎源的基因组。

2.真核细胞基‎因转录产物‎为单顺反子‎。

一个结构基‎因经过转录‎和翻译生成‎一个mRN‎A分子和一‎条多肽链。

3.存在重复序‎列,重复次数可‎达百万次以‎上。

4.基因组中不编码的‎区域多于编‎码区域。

5.大部分基因‎含有内含子‎,因此,基因是不连‎续的。

6.基因组远远大于原‎核生物的基因组,具有许多复‎制起点,而每个复制‎子的长度较‎小。

高度重复序‎列:高度重复序‎列在基因组中重复频率‎高,可达百万(106)以上。

在基因组中所占比例‎随种属而异‎,约占10-60%,在人基因组中约占20‎%。

高度重复顺‎序又按其结‎构特点分为‎三种(1)反向重复序‎列这种重复顺‎序约占人基因组的5%。

反向重复序‎列由两个相‎同顺序的互‎补拷贝在同‎一DNA链‎上反向排列‎而成。

变性后再复‎性时,同一条链内‎的互补的拷‎贝可以形成‎链内碱基配‎对,形成发夹式‎或“+”字形结构。

反向重复间‎可有一到几‎个核苷酸的‎间隔,也可以没有‎间隔。

没有间隔的‎又称回文结‎构,这种结构约‎占所有反向‎重复的三分‎之一。

原核、真核生物基因及表达调控

原核、真核生物基因及表达调控

原核、真核生物基因及表达调控引言现代生物学中“基因”一词甚为流行,细胞学、遗传学、生物化学等,以及各种生物学课本中,都涉及到“基因”一词。

甚至象典型的宏观生物学科——生态学,也把一片森林称为一个“基因库”[1]。

现代生物学已经完全证明,DNA 分子是由称为核普酸的有机分子线性聚合而成。

基因就是核普酸按一定顺序排列而成的DNA分子片段,它携带着遗传信息。

基因表达(gene expression)是指细胞在生命过程中,把储存在DNA顺序中遗传信息经过转录和翻译,转变成具有生物活性的蛋白质分子。

其实质就是遗传信息的转录和翻译。

在个体生长发育过程中,生物遗传信息的表达按一定的时序发生变化(时序调节),并随着内外环境的变化而不断加以修正(环境调控)[2]。

原核生物和真核生物的基因及表达过程有着差异。

随着世界分子生物学研究不断深入,基因表达技术有了很大的提高。

迄今为止,人们已经研究开发出多种原核和真核表达系统用以生产重组蛋白[3]。

一.原核、真核生物基因结构原核生物基因分为编码区与非编码区,所谓的编码区就是能转录为相应的信使RNA,进而指导蛋白质的合成,非编码区位于编码区的上游及下游。

[4]在调控遗传信息表达的核苷酸序列中最重要的是位于编码区上游的RNA聚合酶结合位点。

RNA聚合酶是催化DNA转录为RNA,能识别调控序列中的结合位点,并与其结合。

真核生物基因结构见图1:图1 真核生物基因结构二.原核、真核生物基因结构的区别最主要的在于真核基因是不连续的,而原核基因是连续的。

所谓真核基因的不连续,即一个基因的编码序列也叫外显子,被一个或多个非编码序列,又叫内含子所间隔。

[5]这些内含子和外显子同属一个转录单位,转录形成前体。

经过转录的加工,即切去内含子,重新连按外显子,从而得到成熟。

而绝大多数的原核基因是连续的,没有内含子的间隔,转录产生成熟。

不仅如此,而且凡在代谢途径上功能有关的多个基因可能紧密相联,与它们的调控基因一起组成一个操纵子,转录到一条链。

真核生物的基因结构

真核生物的基因结构

真核生物的基因结构
真核生物的基因结构包括编码区和非编码区。

编码区其实是断裂基因结构,也就是不连续基因。

具有蛋白编码功能的不连续DNA 序列称为外显子,
外显子之间的非编码序列为内含子。

每个外显子和内含子接头区都有一段高度保守的一致序列,即内含子5’末端大多数是GT 开始,3’末端大多是AG 结束,称为GT-AG 法则,是普遍存在于真核基因中RNA 剪接的识别信号。

第一个外显子首端和最后一个外显子末端,分别为翻译蛋白的起始密码子和终止密码子。

====================================================== =======
首位和末位外显子两侧的区域为非编码区,也可以叫做侧翼序列,侧翼序列中包含一些调控元件,比如启动子、终止子,还可能有增强子。

上游侧翼序列包含启动子区域,启动子区域包含:
列为TATAATAAT,是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录
止密码子之间区域,不编码蛋白质。

miRNA 经常结合于3‘UTR,从而引起mRNA。

原核生物与真核生物的遗传物质与基因组织结构的差异

原核生物与真核生物的遗传物质与基因组织结构的差异

原核生物与真核生物的遗传物质与基因组织结构的差异按照细胞的结构和遗传物质在细胞内的分布可将生命有机体划分为原核生物和真核生物两大类。

噬菌体和病毒既不是原核生物也不是真核生物它们是一种超分子的亚细胞生命形式它们的遗传物质是DNA或RNA。

特征原核生物真核生物核膜无有不同染色体数目11核小体结构无有核仁无有遗传交换质粒介导单向配子融合DNA是原核生物染色体的主要组成成分含量占染色体的80以上其余为RNA和蛋白质。

原核生物的遗传物质一般为环状DNADNA存在于细胞内相对集中的区域一般称为拟核nucleoid但并无核膜包裹。

拟核当中的DNA只以裸露的核酸分子存在虽与少量蛋白质结合但不形成染色体结构。

当然它还有一些位于拟核之外的遗传物质——质粒和转座因子。

真核生物中也含有转座因子原核生物一般只有一条染色体即一个核酸分子DNA或RNA而且染色体DNA大多数以双链、共价闭和、环状的形式存在。

多少年来一直以为原核生物的单一环状染色体是区别于真核生物中的多条线状染色体的最好标志。

然而越来越多的研究证明除单一环状的染色体外有些细菌具有多条环状染色体还有些细菌具有线状染色体。

如根癌土壤杆菌含有2条染色体其中一条是长度为3.0Mb的环状染色体另一条是长度为2.1Mb的线状染色体原核细胞中含有一些DNA结合蛋白它们与DNA结合后帮助DNA进行高度折叠。

这些参与DNA折叠的蛋白质称为类组蛋白histone-like protein。

除类蛋白外DNA还与其他蛋白质相结合如与复制、转录和加工有关的蛋白质结合在一起这样其环状染色体DNA以紧密缠绕的、致密的、不规则小体形式存在该小体即是拟核。

真核生物基因组与原核生物基因组有很大的差异真核生物基因的结构、基因表达的过程、表达调控等方面都远比原核生物复杂。

真核生物和原核生物的最大差异之一是遗传物质的分布和存在状态。

原核细胞的遗传物质是以裸露DNA或RNA的形式位于拟核之中而真核细胞的遗传物质是以与组蛋白和非组蛋白相结合缠绕成多条染色体的形式集中于细胞核中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不同原核生教物学p的pt Cot曲线
Cot
15
真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
教学ppt
16
根据复性动力学特征的不同,将真核生 物DNA序列分为4类:
零时复性序列
快速复性序列
中速复性序列
慢速复性序列
教学ppt
17
1)零时复性序列:
具有反向重复结构(也称回文结构),可在 同一条链内形成双链区,变性后再复性时,在链 间复性之前就已发生链内复性,因此不遵循二级 反应动力学方程。由于这种序列的复性速度非常 快,在动力学上称为零时(或瞬时)复性序列。
DNA复性后可出现发卡形结构。这种序列常
常是DNA复制酶、转录酶以及特异蛋白质的结合
部位。
阴影部分为一个门内C-值的范围
教学ppt
6
二、真核生物基因组的基因数量
不同物种编码基因差别很大,从500个到50000个, 有100倍的差距。
真核生物的基因数量通常在6000到50000之间。
人的基因组的全长为大约3 X 109对碱基,编码 3-4 万个基因;
但某些寄生的真核生物,如脑微孢子虫,基因数量
可能不超过3000个,比很多细菌的基因数量还少。
教学ppt
7
三、真核生物基因组的非重复序列和重复序列
1. DNA复性动力学
2. DNA的复性过程遵循二级反应动力学。
DNA复性过程中复性的速度用公式表示: dC/dt= -kC02
其中,C是单链DNA在t时刻的浓度。
k=复性速度常数
教学ppt
8
对上式积分后重排,得出复性动力学方程: C/C0=1/(1+ k C0t)
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
教学ppt
20
3)中速复性序列:
也叫中度重复序列(moderate repetitive sequences)
基因组中重复次数<105的重复顺序,重复单位平均长 度约300bp;
复性速度快于单拷贝顺序,慢于高度重复顺序。
多与单拷贝基因间隔排列。
第四章 真核生 物基因组结构
教学ppt
1
第一节 真核生物基因组的组成
教学ppt
2
一、真核生物基因组的大小
C值(C-value):一个物种单倍体基因组的DNA含量, 通常称为该物种的C值。
每个物种的C值是相对恒定的,不同物种的C值差 异极大。
一般随着生物结构和功能复杂程度的增加而C值增
大,即:生物细胞中的C值具有从低等生物到高等生物
教学ppt
22
Байду номын сангаас
4)慢速复性序列:
C0t1/2一般在103mol.s/L以上,复性速度极慢, 在一个基因组中只有一个拷贝或2~3个拷贝,也 称非重复序列(单一序列、单拷贝序列)。 结构基因 (蛋白质基因)大多是单拷贝序列。
教学ppt
23
真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
Cot曲线:表示复性速度与DNA顺序复杂性的关系。
教学ppt
11
Cot曲线
教学ppt
12
2.利用复性动力学鉴定基因组序列
教学ppt
13
原核生物Cot曲线的特点:
➢形状相似(跨越2-3个数量级),Cot(1/2)不相同 --单一序列,只是复杂性不同。
教学ppt
14
1-c/c0
复杂性X 1
复 性 分 数 (
逐渐增加的趋势。
教学ppt
3
1010 109 108 107 106




蠕昆鸟
两哺




虫虫类
栖乳

类类
教学ppt
4
☆ C值悖理理论(C-value paradox)
指 C值与生物进化复杂性之间不相对应的现象,也 叫 C值反常理论。
表现:
•低等动物的C值大于高等动物 如:两栖类的C值大于哺乳类 肺鱼的C值比哺乳动物大10-15倍
C0为单链DNA的起始浓度,C为单链DNA在t时刻的浓度, 单位mol/L。 t为复性时间,单位为s(秒)。重组速率常数k的 单位为L/mol,取决于阳离子的浓度、温度、片段大小和DNA 序列的复杂性。
当 C/ C0 = 1/2 时的C0t值定义为C0t1/2 即复性反应 完成一半时
C / C0 = 1/2 = 1 / (1+ k C0t(1/2))
Cot(1/2) = 1/k (mol. Sec教学/pLpt )
9
DNA复性的影响因素:
DNA序列的复杂性、初始浓度、片段大小、温度、离子强度
在控制反应条件(初始浓度、温度、离子强度、片段大
小)相同的前提下,DNA分子的C0t (1/2)值,取决于核苷 酸的排列复杂性。
DNA序列的复杂度(complexity) X:最长的没有重复序列 的核苷酸对的数值。
AAAAAAAA
X=1
ATCGATCGATCG X = 4
N= 105
X = 105
X= k Cot1/2 教学ppt
10
Cot(1/2) = 1/k (mol. Sec / L)
相同核苷酸数量的DNA,复杂性小的DNA分子复性快 ,Cot (1/2)值小;复杂性大的DNA分子复性慢,Cot (1/2) 大。
教学ppt
24
大部分结构基因 位于非重复的 DNA序列内
教学ppt
多为非编码序列,如Alu序列
也有编码基因产物的,如rDNA、tDNA、组蛋白基
因家族, 一般往往以基因家族的形式存在。
教学ppt
21
Alu family(Alu 家族):
•长约300bp的片段,大多数片段含有一个限制性内切 酶AluⅠ的酶切位点(AGCT); • 均匀分散在整个基因组中的非重复序列间; • 在人类基因组中占1% ~ 3%;
•同一门中的动物C值变化很大 如:两栖类中的C值变化很大,可相差100倍 家蝇的比果蝇的大6倍
说明真核生物基因组中许多教学的ppt DNA序列不编码蛋白质。5
植物 鸟类 哺乳动物 爬行动物 两栖动物 硬骨鱼 软骨鱼 棘皮动物 甲壳动物 昆虫 软体动物 蠕虫 霉菌 藻类 真菌 格兰氏阳性菌 格兰氏阴性菌 支原体
教学ppt
18
2)快速复性序列:
也叫高度重复序列(Highly repetitive sequence)
• 占基因组的10-60%,长度6~ 200bp ,重复次数在 105以上。
• 大部分集中于异染色质区 ,特别是在着丝粒和 端粒区,往往没有转录功能 。
教学ppt
19
真核生物DNA 复性曲线的模 式图
相关文档
最新文档