真核生物基因结构
第五章真核生物基因组结构

外显子:具有编码意义
结
转录单位
内含子:无编码意义( 5′GT、
构
基 因
非编码区
3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
00:28
21
Interrupted gene
00:28
43
核小体的结构组成
每个核小体含有约200bp的DNA,核心
组蛋白H2A、H2B、H3和H4各2份拷贝, 1份拷贝的H1组蛋白位于核小体外侧。
微球菌核酸酶(micrococcal nuclease) 处理染色体可得到单个核小体。
00:28 44
八聚体 染色质小体 (~166bp) 核小体 (~200bp) DNA 连接区 (常为 32~34bp) 图 10-10 核小体的组成 DNA H1
28
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA。
00:28
29
PS DNA
外显子 S
PL外显子 L来自外显子 2外显子 3
50b
2800bp
161bp
4500bp
205bp 327bp
初始转录本: 在唾腺中转录 成熟 mRNA: 1663nt 初始转录本: 在肝中转录 成熟 mRNA: 1773nt 图 18-57 小鼠淀粉酶(amy) 基因利用不同启动子产生两个不同的 mRNA
00:28
染色体( 1400nm,2个染色单体, 每个染 色体单体含10个螺旋圈)
51
染色质和染色体的概念
染色质(chromatin):是指细胞周期间期细胞核内由 因其易被碱性染料染色而得名。
真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
真核原核细胞基因结构示意图

基因结构
真核细胞的基因结构通常包括编码区和非编码区,其中编 码区被内含子和外显子分隔;而原核细胞的基因结构相对 简单,没有内含子和外显子的区分。
染色体结构
真核细胞的染色体由DNA和蛋白质组成,呈现高度折叠的 结构;原核细胞的染色体则是由环状DNA分子组成,结构 相对简单。
复制方式
真核细胞的基因复制需要多种蛋白质的参与,复制过程复 杂;而原核细胞的基因复制则相对简单,不需要太多蛋白 质的参与。
遗传信息的储存和复制
遗传信息的储存
基因是遗传信息的载体,通过DNA双螺旋结构,将遗传信息稳定 地储存于细胞核或细胞质中。
复制机制
原核细胞通过半保留复制方式,真核细胞通过半不连续复制方式 ,确保遗传信息的准确传递。
基因表达与调控
转录过程
在RNA聚合酶的作用下,DNA的 遗传信息被转录为mRNA,为蛋
染色体数目与形态
80%
染色体数目
原核细胞通常只有一条染色体, 但在某些情况下可能存在多条染 色体。
100%
染色体形态
原核细胞的染色体呈环状或线性 ,没有真核细胞的染色体结构复 杂。
80%
复制与分离
原核细胞的染色体复制和分离机 制相对简单,通常只有一个复制 起点。
03
真核原核细胞基因结构的比较
结构差异
真核原核细胞基因结构示意图
目
CONTENCT
录
• 真核细胞基因结构 • 原核细胞基因结构 • 真核原核细胞基因结构的比较 • 真核原核细胞基因结构的功能 • 真核原核细胞基因结构的研究意义
01
真核细胞基因结构
结构特点
真核细胞基因结构包括 编码区和非编码区,其 中编码区又分为内含子 和外显子。
真核生物基因组

微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同
真核生物结构基因

真核生物结构基因真核生物是指细胞核内含有真正的染色体,其中包含着基因,这些基因是决定生物遗传性状的基本单位。
基因是由DNA序列编码的,它们携带着生命信息。
基因的结构和组成对于生命的运作和表达起着至关重要的作用。
基因的结构基因通常由三个部分组成:启动子、编码区和终止子。
启动子位于基因的起始位置,是一段DNA序列,它可以激活基因的转录,从而将基因转录成mRNA。
编码区位于启动子的下游区域,它是一个由多个外显子和内含子组成的序列,编码区的序列决定了基因所编码的蛋白质的氨基酸序列。
终止子位于编码区的下游,它是基因转录终止的信号,从而完成mRNA的合成。
基因的组成基因由DNA序列编码,DNA序列是由四种不同的核苷酸组成的碱基序列,即腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。
这四种碱基按照一定的顺序组成了DNA序列,而DNA序列又组成了基因序列。
基因序列是一段由多个碱基组成的DNA序列,这些碱基按照一定的顺序编码了蛋白质的氨基酸序列,从而决定了蛋白质的形状和功能。
基因的表达基因的表达是指基因信息从DNA转化为蛋白质的过程。
基因的表达受到多种因素的调控,其中包括启动子、转录因子和表观遗传学等。
启动子可以激活基因的转录,从而将基因转录成mRNA。
转录因子是一种特殊的蛋白质,它能够结合到启动子上,从而调控基因的转录。
表观遗传学是指与DNA序列无关的遗传学变化,如DNA 甲基化和组蛋白修饰等,这些变化会影响基因的表达。
总结基因作为生命的基本单位,决定了生物的遗传性状。
基因的结构和组成对于生命的运作和表达起着至关重要的作用。
基因由DNA序列编码,DNA序列是由四种不同的核苷酸组成的碱基序列组成的,而DNA序列又组成了基因序列。
基因的表达是指基因信息从DNA 转化为蛋白质的过程,受到多种因素的调控。
深入理解基因的结构和组成以及基因的表达,对于生命科学的研究和应用具有重要意义。
原核生物与真核生物的基因结构

①使目的基因在受体细胞中稳定存在并
遗传给子代。
②同时使目的基因能表达和发挥作用。
IMN
2. 一个表达载体组成:
复制原点+目的基因+启动子+终止子+标记基因
(1)启动子:是一段有特殊结构的______,位于基因的_____,是 ________识别和结合的部位,能驱动基因转录出____,最终获得所 需的______。 (2)终止子:也是一段有特殊结构的_____ ,位于基因的______。 (3)标记基因的作用:是为了鉴定受体细胞中________,从而将 含有_______的细胞筛选出来。常用的标记基因是___________。 (4)复制原点:复制的起点
相同 点
原则 条件
碱基互补配对 模板、原料(dCTP、dATP、dGTP、dTTP)、能量、酶、引物等
解旋方 式
氢键在高温下断 裂,双链全部解
开
解旋酶催化氢键逐步断裂
场所
体外
主要在细胞核中
不同 点
引物 酶
DNA
热稳定DNA聚合酶
(Taq酶)
RNA 解旋酶、DNA聚合酶、DNA连接酶等
结果
在短时间内形成 大量的DNA片段
一、原核生物与真核生物的基因结构
1、原核生物基因结构
非编码区
编码区
非编码区
…A‥………ATGTGCACGTAGTTA………‥G… …T‥启…动…子 …TACACGTGCATCAAT……终…止子‥C…
编码区上游
编码蛋白质
编码区下游
调控遗传信息的表达 (调控程序)
(1)编码区和非编码区
能编码蛋白质的区段叫做编码区; 不能编码蛋白质的区段叫做非编码区, 在非编码区上有调控遗传信息表达的核苷酸序列
真核生物的基因结构

真核生物的基因结构
真核生物的基因结构包括编码区和非编码区。
编码区其实是断裂基因结构,也就是不连续基因。
具有蛋白编码功能的不连续DNA 序列称为外显子,
外显子之间的非编码序列为内含子。
每个外显子和内含子接头区都有一段高度保守的一致序列,即内含子5’末端大多数是GT 开始,3’末端大多是AG 结束,称为GT-AG 法则,是普遍存在于真核基因中RNA 剪接的识别信号。
第一个外显子首端和最后一个外显子末端,分别为翻译蛋白的起始密码子和终止密码子。
====================================================== =======
首位和末位外显子两侧的区域为非编码区,也可以叫做侧翼序列,侧翼序列中包含一些调控元件,比如启动子、终止子,还可能有增强子。
上游侧翼序列包含启动子区域,启动子区域包含:
列为TATAATAAT,是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录
止密码子之间区域,不编码蛋白质。
miRNA 经常结合于3‘UTR,从而引起mRNA。
真核基因的基本结构

真核基因的基本结构
真核基因的基本结构通常由以下几个部分组成:
1. 启动子:启动子是基因的一个序列,可以与RNA聚合酶结合,启动转录过程。
启动子通常位于基因的5'端。
2. 编码区:编码区是基因的编码序列,包括外显子和内含子。
外显子是编码蛋白质的序列,内含子则是位于编码区内的非编码序列。
3. 终止子:终止子是基因的一个序列,可以与转录因子结合,终止转录过程。
终止子通常位于基因的3'端。
4. 调控序列:调控序列是基因内的一些序列,可以与转录因子结合,调控基因的转录活性。
常见的调控序列包括增强子和反应元件等。
真核基因的编码区通常由多个外显子和内含子组成,外显子和内含子交替排列。
在转录过程中,内含子会被剪切掉,只保留外显子部分的序列,然后经过拼接形成成熟的mRNA。
这个过程被称为RNA剪接。
真核基因的结构是复杂的,其表达受到多个层次的调控。
通过对真核基因结构的分析,可以深入了解基因的表达调控机制,为研究基因功能和疾病发生提供重要信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
CAAT框(CAAT Box):是一段保守序列, 9bp,GGGC/TCAATAC, 位于转录起始点上游70~-80bp,转录因子CTF识别位点并与之结合, 激活转录。 GC框(GC Box):顺序为GGCGGG,有两个 拷贝,位于CAAT Box两侧,与转录因子SP1 结合。(SP1有锌指区可以与DNA结合,在N 端有激活转录的作用)GC框有激活转录的功 能。
6
外显子和内含子
真核生物内含子和外显子 不是完全固定不变的, 有时同一DNA 链上的某一段DNA序列,当它 作为编码某一多肽链的基因时是外显子,而作 为编码另一多肽链时,则是内含子。这样,同 一基因却可以转录两种或两种以上的mRNA。 真核生物某些结构Gene没有内含子,如组蛋 白Gene,干扰素Gene等。它们多以基因簇形 式存在,大多数的酵母结构Gene也没有内含 子。
7
5`GT——AG3`法则
在每个外显子和内含子的接头区都是一段 高度保守的共有序列,内含子的5`端是GT,3 端是AG,这种接头方式称为GT-AG法则,普 遍存在于真核生物中,是RNA剪接的识别信号, 转录后的前体RAN中的内含子剪接位点。
8
2、侧翼序列与调控序列
每个结构基因的第一个和最后一个外显 子的外侧,都有一段不被转录的非编码区, 称为侧翼序列(Flanking sequence)。 它是基因的调控序列,对基因的有效表达 起调控作用,包括:启动子、增强子、终止 子等。
11
2.2
增强子
增强子(Enhancer)包括启动子上游或下游的一 段DNA序列,可以增强启动子发动转录,提高转录效率。 特点: 在任意位置都有效 无方向性 有组织特异性 例如:Beta珠蛋白Gene增强子是由串联重复的两 个72bp长的相同序列组成,位于转录起点上游-1400bp 或下游3300bp处,均可增强转录效率(活性)200倍。 增强子在转录起始点的上下游一定范围内增强转录效率。 作用可以是5’~3’,也可以是3’~5’方向。
9
2.1 启动子
启动子( Promoter)是一段特定的核苷酸序列,位于Gene 转录起始点上游的100bp 范围内,是RNA聚合酶的结合部位, 能促进转录过程。Promoter决定DNA中的转录链。 TATA框(TATA Box)是一段高度保守序列,7个bp, TATAA/ TAA/T,位于转录起始点上游25~30 bp(-30~50)。 TATA框与转录因子TFII结合,再与RNA 聚合酶II形成复合物, 从而准确地识别转录起始位置,对转录水平有定量效应。
3
三)原核与真核生物基因比较
原核生物Gene:无核膜,散在细胞质。 一般只有一个DNA或RNA分子,Gene 是连续的。 大多数是双链环状,少数为单链、线状; 如:大肠杆菌,双链环状DNA分子,3000~4000个 基因,4.2x106 bp,已经定位900多个基因 真核生物Gene:有核膜,在核中和C质的线粒体中。 Gene结构复杂,断裂基因,3~4万个Gene; Gene大小差别很大。 β珠蛋白 基因(1700bp)=3个外显子+2个内含子。 DMD基因(2300kb) 79个外显子 , 78个内含子。 (迄今认识的最大的基因)
4
二、真核生物基因结构
真核生物的结构基因的DNA序列由编码序列和非编 码序列两部分组成,编码序列是不连续的,被非编码序 列分割开来,称为断裂基因(split gene)。
1、外显子和内含子 2、侧翼序列与调控序列 2.1 启动子 2.2 增强子 2.3 终止子
5
1、外显子和内含子
在结构基因中,编码序列称为外显子(exon),表达多 肽链部分。非编码序列称为内含子(Intron),又称插入 序列。 β珠蛋白 基因(1700bp)=3个外显子+2个内含子。 DMD基因(2300kb)=79个外显子+ 78 个内含子。 (迄今认识的最大的基因)
12
2.3 终止子
终止子(Terminator)由一段 回文序列以及特定的序列 (PolyA)5’--AATAAA--3’组成。 回文序列为转录终止号。PolyA 为附加信号。终止子为反向重复 序列,是RNA聚合酶停止工作 的信号,反向重复序列转录后, 可以形成发夹式结构,并且形成 一串U。发夹式结构阻碍了RNA 聚合酶的移动。一串U的U与 DNA模板中的A的结合不稳定, 从模板上脱落下来,终止转录。
1
一)基因的一般特性
从分子水平看,基因有以下基本特性: 1、Gene自我复制------半保留复制 2、基因决定性状: Protein Gene→mRNA → enzyme 淘汰 3、Gene突变 生物进化 保留 遗传病
2
二)Gene类别
依其功能分为: 1、结构Gene---编码蛋白和酶分子结构; 2、调控Gene---调节结构基因表达; 3、转录而不翻译的Gene: rDNA Gene→rRNA→核仁形成区, 核糖体组成。 tRNA Gene→tRNA→转运氨基酸。
第二节、真核生物基因结构及功能
一、基因的概念
基因的概念随着分子遗传学、分子生物学、 生物化学领域的进展而不断完善。 从遗传学角度看: 基因是生物的遗传物质,是遗传的基本单 位----突变单位、重组单位和功能单位。 从分子生物学角度看: 基因是负载着特定遗传信息的DNA分子片段, 在一定条件下能够表达这种遗传信息,执行特 定的生理功能。
13
2.4
调控序列
调控序列(Regulator Sequence)包括 启动子,增强子和终止子均属于基因的 顺式调控因子(顺式作用元件),是人 类Gene组中的一些特殊序列,起调控基 因表达的作用。 反式作用元件:TFII、CTF、SP1。
ห้องสมุดไป่ตู้
14