真核生物基因染色体分布的非随机性

合集下载

真核生物基因组

真核生物基因组

第二讲真核生物基因组真核生物的基因组比较庞大,并且不同生物种间差异很大,例如人的单倍体基因组由3.16×109 bp组成。

在人细胞的整个基因组中实际上只有很少一部份(约占2%~3%)的DNA序列用以编码蛋白质。

第一节真核生物基因组特点真核生物体细胞内的基因组分细胞核基因组与细胞质基因组,细胞核基因组是双份的(二倍体,diploid),即有两份同源的基因组;细胞质基因组可有许多拷贝。

真核细胞基因转录产物为单顺反子,一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。

细胞核基因组存在重复序列,重复次数可达百万次以上,大多为非编码序列;因此,基因组中不编码的区域多于编码区域。

大部分基因含有内含子,因此,基因是不连续的。

真核生物基因组远远大于原核生物的基因组,具有许多复制起点,但每个复制子的长度较小。

一、细胞核基因组与细胞质基因组(一)细胞核基因组细胞核基因组的DNA与蛋白质结合形成染色体(chromosome)。

除配子细胞外,体细胞有两个同源染色体,因此基因组有两份同源的基因组。

染色体储存于细胞核内,是基因组遗传信息的载体。

(二)线粒体基因组线粒体基因组DNA(mitochondrial DNA,mtDNA)为双链环状超螺旋分子,类似于质粒DNA,分子量小,大多在1~200×106之间,如人类mtDNA仅由16569bp组成。

mtDNA的复制属于半保留复制,可以是θ型复制,或滚环复制,或D环复制,由线粒体DNA聚合酶催化完成。

线粒体基因组主要编码与生物氧化有关的一些蛋白质和酶,如:呼吸链中的细胞色素氧化酶有七个亚基,其中三个亚基由mtDNA编码,其余四个亚基由细胞核DNA编码;细胞色素还原酶有七个亚基,基中的一个亚基由mtDNA编码;ATP酶含有十个亚基,其中四个亚基由mtDNA编码。

线粒体基因组可能还包括一些抗药性基因。

此外,线粒体基因组有自己的rRNA,tRNA,核糖体等系统,因此线粒体本身的一些蛋白质基因也可以在线粒体内独立地进行表达。

遗传学课后思考题

遗传学课后思考题

遗传学课后思考题1.遗传病(genetic disease):指遗传物质改变(基因突变或染色体畸变)引起的疾病。

2. 先天性疾病:指个体出生后即表现出的疾病。

3. 家族性疾病:指某些表现出家族性聚集现象的疾病,即在一个家族中有多人患同一种疾病。

4. 遗传病的特征以及分类:特征:(1)垂直传递(2)基因突变或着染色体畸变是遗传病发生的根本原因,也是遗传病不同于其他疾病的的主要特征(3)生殖细胞或受精卵发生的遗传物质改变才能遗传,体细胞发生的遗传物质的改变不能向后代遗传(4)遗传病常有家族聚集的现象分类:(根据遗传物质改变的不同和遗传特点) (1)单基因遗传病:1) 常染色体显性遗传病2)常染色体隐性遗传病3)X连锁隐性遗传病4)X连锁显性遗传病5)Y连锁遗传病6)线粒体遗传病(2)多基因遗传病(3)染色体病(4)体细胞遗传病1. 基因(gene):基因是合成一种有功能的多肽链或者RNA分子所必需的一段完整的DNA序列。

特点:(1)基因可以复制(2)基因决定性状(3)基因可以发生突变2. 断裂基因(slpit gene):真核生物结构基因的DNA顺序包括编码顺序和非编码顺序两部分,编码顺序在DNA中的顺序是不可连续的,被非编码顺序隔开,形成镶嵌排列的断裂形式,因此成为断裂基因。

外显子(exon):编码顺序称为外显子;内含子(intron)非编码顺序称为内含子。

3.侧翼顺序(flanking sequnence):每个断裂基因中第一个外显子上游和最末一个外显子的下游都有一段不被转录的非编码区,包括启动子、增强子、终止子。

4.多基因家族(multigene family):多基因家族是真核基因组中最重要的特点之一,是指由某一共同祖先基因经过重复和变异产生的一组新基因。

5.假基因(pseudo gene):基因序列与具有编码功能的类α和类β珠蛋白的基因序列相似,但不能编码蛋白质。

6.基因突变(gene mutation):DNA分子中的核苷酸顺序发生改变,使遗传密码产生相应的改变,导致基因表达产物蛋白质的氨基酸发生变化,以致引起表现的改变。

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。

真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。

对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。

一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。

基因组大小与细胞大小和复杂度之间存在着类似关联性。

人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。

真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。

1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。

在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。

2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。

与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。

3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。

真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。

二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。

1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。

目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。

2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。

现代分子生物学作业

现代分子生物学作业

现代分子生物学与基因工程作业姓名________________班级_____________学号________________1、绝大多数的真核生物染色体中均含有HI、H2A、H2B、H3和H4五种组蛋白,在不同物种之间它们的保守性表现在(A )A.H3和H4具有较高的保守性,而H2A和H2B的保守性比较低B. H2A和H2B具有较高的保守性,而H3和H4的保守性比较低C. H1和H4具有较高的保守性,而H3和H2B的保守性比较低D. H1和H3具有较高的保守性,而H4和H2B的保守性比较低解析:真核细胞染色体中组蛋白在进化上极端保守性。

其中H3、H4最保守,H2A、H2B比较保守,H1较不保守。

2、下列叙述哪个是正确的(C )A. C值与生物体的形态学复杂性成正相关B. C值与生物体的形态学复杂性成负相关C. 每个门的最小C值与生物体的形态学复杂性是大致相关的C值指一种生物单倍体基因组DNA的总量。

不同物种的C值差异很大,随着生物体的进化,解析:物种的结构和功能越复杂,其C值就越大。

但是,在结构和功能相似的同一类生物中,甚至在亲缘关系分接近的物种之间,它们的C值可以相差10倍乃至上百倍。

基因组大小与遗传复杂性并非线性相关,为C值矛盾。

C值矛盾描述了真核基因组中编码潜力和DNA含量并非一致。

涉及到真核基因组绝对和相对的DNA数量。

3、真核DNA存在于(C )A. 线粒体与微粒体内B. 线粒体与高尔基体内C. 线粒体与细胞核内D.细胞核与高尔基体内E. 细胞核与溶酶体内解析:DNA作为遗传物质主要存在于细胞核内,真核生物的线粒体和叶绿体中也有存在。

4、在核酸分子中核苷酸之间的连接方式是(C )A. 2‵-3‵磷酸二酯键B. 2‵-5‵磷酸二酯键C. 3解析:核酸是由核苷酸聚合而成的生物大分子,无分支结构,核酸的共价结构也就是其一级结构,这种一级结构5、所有生物基因组DNA复制的相同之处是(A )A. 半保留复制B. 全保留复制C. 嵌合型复制D. 偶联型复制解析:生命遗传实际上是染色体DNA自我复制的结果。

北京化工大学分子生物学期末考试总结

北京化工大学分子生物学期末考试总结

简答题第一章染色体与DNA:一、真核生物基因组特征1.真核基因组庞大,一般远大于原核生物的基因组。

2.真核基因组存在大量的重复序列。

3.真核基因组大部分为非编码序列,占整个基因组序列的90%以上,这是真核生物与原核生物的重要区别。

4.真核基因组的转录产物为单顺反子。

5.真核基因是断裂基因,有内含子结构。

6.真核基因组存在大量的顺式作用元件。

7.真核基因组中存在大量的DNA多态性。

8.真核基因组具有端粒结构。

二、原核生物基因组特征1结构简练:DNA中的大部分结构是用来编码蛋白质2存在转录单元:在原核生物中功能相关的蛋白的基因往往集中在基因组的一个或几个特定部位如大肠杆菌乳糖操纵子3有重叠基因:两种或两种以上的基因公用部分DNA序列,则这些基因互称重叠基因三、真核生物DNA复制特点1、真核生物每条染色体上有多个复制起点,多复制子(约150bp左右);2、复制叉移动的速度较慢(约50bp/秒),仅为原核生物的1/10。

3、真核生物染色体在全部复制完之前,各个起始点不再重新开始DNA复制;真核生物快速生长时,往往采用更多的复制起点。

4、真核生物有多种DNA聚合酶。

5、真核生物DNA复制过程中的引物及冈崎片段的长度均小于原核生物。

(真核冈崎片段长约100-200bp,原核冈崎片段长约1000-2000bp。

)6、真核生物线性DNA末端具有端粒结构四、原核和真核生物DNA的复制特点比较①复制起点(ori):原核一个,真核多个;②复制子:原核一个,真核多个;③复制子长度:原核长;真核短;④复制叉:原核多个;真核多个;⑤复制移动速度:原核较快;真核较慢;⑥真核生物染色体在全部完成复制前,各起始点的DNA复制不能再开始。

而在快速生长的原核生物中,复制起点上可以连续开始新的DNA复制。

⑦原核生物染色体的复制与细胞分裂同步,可以多次复制;真核生物染色体的复制发生在S期,是细胞分类的特定时期,而且仅此一次。

五、大肠杆菌复制体完成复制的过程1双链的解开2 RNA引物的合成3 DNA链的延伸4切除RNA引物,填补缺口,连接相邻的DNA片段六、P-转座子特征1.当p转座子在转座酶的催化下,会导致不育。

翟中和细胞生物学第十章总结2(名词解释)

翟中和细胞生物学第十章总结2(名词解释)

第十章细胞核与染色体1.细胞核:真核细胞中由双层膜所包被的,包含由DNA、组蛋白等组织而成的染色质的细胞器,是细胞内储存遗传物质的场所,也是基因组复制、RNA合成和加工、核糖体组装的场所。

它是细胞内最大的细胞器,真核生物的细胞都有细胞核,只有成熟的红细胞和植物成熟的筛管没有细胞核。

核膜上有核孔及其环状结构形成核孔复合体,它与大分子物质的运输有关。

2.核被膜:真核细胞内细胞质与细胞核之间由双层膜构成,分别称为外核膜与内核膜。

双层核膜上镶嵌有核孔复合体,能选择性地运输核内外物质。

内膜面向核质,内、外膜间有20~40nm的透明空隙,称为核周间隙,膜上有核孔。

3.核被膜的功能:一方面,核被膜构成了核、质之间的天然选择性屏障,将细胞分成核与质两大结构与功能区域,使得DNA复制、RNA转录与加工在核内进行,而蛋白质翻译则局限在细胞质中。

这样既避免了核质间彼此相互干扰,使细胞的生命活动秩序更加井然,同时还能保护核内的DNA分子免受损伤。

另一方面,核被膜调控细胞核内外的物质交换和信息交流。

核被膜并不是完全封闭的,核质之间进行着频繁的物质交换与信息交流。

这些物质交换与信息交流主要是通过核被膜上的核孔复合体进行的。

4.内、外核膜各有特点:①外核膜表面常附有核糖体颗粒,且常常与糙面内质网相连续,使核周间隙与内质网腔彼此相通、从这种结构上的联系出发,外核膜可以被看作是糙面内质网的一个特化区域。

②内核膜表面光滑,无核糖体颗粒附着,但紧贴其内表面有一层致密的纤维网络结构,即核纤层。

内核膜上有一些特有的蛋白成分,如核纤层蛋白B受体(lamin B receptor,LBR)。

5.核纤层:位于核膜内侧,由核纤层蛋白组成的纤维状网络结构。

在与核质相邻的核膜内表面有一层厚30~160nm的网络状蛋白质,叫核纤层,对核被膜起支撑作用。

核纤层由3种分子量为6~7万道尔顿的多肽亚单位α、β、γ所组成,核纤层纤维的直径约10 nm,属于中间纤维的一种,其中β亚基与内核膜的特异受体蛋白相结合,α、γ亚单位与β相连接,而α、γ又同染色质的特定部分相结合。

2023年高考生物三轮复习:必修2基础知识背诵

2023年高考生物三轮复习:必修2基础知识背诵

高中生物必修二《遗传与进化》基础知识背诵第1章遗传因子的发现1.孟德尔把F1中显现出来的性状,叫作显性性状,如高茎;未显现出来的性状,叫作隐性性状,如矮茎。

后来,人们将杂种后代中同时出现显性性状和隐性性状的现象,叫作性状分离。

(P4)2.孟德尔发现遗传定律用的研究方法是假说—演绎法,两大定律的适用范围:真核生物、有性生殖、细胞核遗传。

3.判断一对相对性状的显隐性方法是杂交;不断提高纯合度的方法是连续自交;判断纯合子和杂合子方法是自交(植物常用)、测交(动物常用)。

4.孟德尔对分离现象提出的假说内容:(1)生物性状是由遗传因子决定的。

(2)在体细胞中,遗传因子是成对存在的。

(3)形成生殖细胞时,成对的遗传因子彼此分离,进入不同的配子。

(4)受精时,雌雄配子的结合是随机的。

(P5)5.孟德尔针对豌豆的两对相对性状杂交实验提出的“自由组合假设”:F1(YyRr)在产生配子时,每对遗传因子彼此分离,不同对的遗传因子可以自由组合。

这样F1产生的雌配子和雄配子各有4种:YR、Yr、yR、yr,它们之间的数量比为1∶1∶1∶1。

(P10)6.孟德尔用测交实验验证了其“自由组合假设”是正确的。

(P11)7.自由组合定律:控制不同性状的遗传因子的分离和组合是互不干扰的;在形成配子时,决定同一性状的成对的遗传因子彼此分离,决定不同性状的遗传因子自由组合。

8.自由组合定律实质:同源染色体上的等位基因彼此分离的同时,非同源染色体上的非等位基因自由组合。

一对同源染色体上有很多个基因,一对同源染色体的相同位点的基因可能是等位基因或者相同基因。

9.孟德尔用豌豆做遗传实验取得成功的原因:①选用了正确的实验材料:豌豆;②用统计学方法对结果进行分析;③科学地设计了实验的程序:试验→分析→假说→验证→结论,即假说—演绎法。

④由一对到多对的研究思路;⑤用不同的字母代表不同的遗传因子,有利于逻辑分析遗传的本质。

10.两对相对性状杂交实验中的有关结论(1)两对相对性状由两对等位基因控制,且两对等位基因分别位于两对同源染色体上。

大学细胞生物学考试(试卷编号1151)

大学细胞生物学考试(试卷编号1151)

大学细胞生物学考试(试卷编号1151)1.[单选题]丙酮酸→二氧化碳+水的过程发生在:A)细胞质基质B)内质网C)溶酶体D)线粒体E.核糖体答案:D解析:2.[单选题]下列与微管的功能无关的是( )A)细胞内物质运输B)支持功能C)细胞运动D)胞质分裂答案:D解析:3.[单选题]下列过程中未体现生物膜信息传递功能的是 ( )A)蔗糖溶液使洋葱表皮细胞发生质壁分离B)抗原刺激引发记忆细胞增殖分化C)胰岛素调节靶细胞对葡萄糖的摄取D)传出神经细胞兴奋引起肌肉收缩答案:A解析:4.[单选题]中间纤维中的结蛋白主要存在于( )A)肌细胞B)上皮细胞C)神经细胞D)间质细胞答案:A解析:5.[单选题]间隙连接的基本单位是连接子,每个连接子由 ( ) 个相同或相似的跨膜蛋白亚单位环绕。

A)4B)6C)8解析:6.[单选题]关于核孔的描述不正确的是( )A)核孔的数目在代谢旺盛的细胞中较多B)核孔复合体是不对称结构C)核孔复合体是可以用“捕鱼笼”模型来解释D)在高等真核生物的细胞核上均匀分布有核孔答案:D解析:7.[单选题]一根完整的中间纤维,其横切面上有( )个蛋白分子。

A)4B)8C)16D)32答案:D解析:8.[单选题]电子显微镜使用( )替代光学显微镜的聚光镜、目镜和物镜A)电极B)滤色片C)气压D)液压答案:A解析:9.[单选题]有关细胞骨架下列哪个选项不正确?A)细胞骨架是指存在于整合细胞中的蛋白质网架系统。

B)广义的概念包括细胞质骨架和细胞核骨架。

C)细胞质骨架主要由微管、微丝和中间纤维组成。

D)核纤层属于细胞核骨架答案:D解析:10.[单选题]HPLC需要一个特殊的( )系统,因此能迫使溶液快速地通过柱子A)孔径B)电荷C)配体D)高压泵答案:D11.[单选题]由细胞外信号转换为细胞内信使,从而使细胞对外界信号做出相应的反应,这是通过下列哪种机制完成的( )A)信号转导B)cAMPC)第二信使D)信号分子答案:A解析:12.[单选题]能抑制CDK活性的酶是( )A)WellB)CAKC)CDC25D)p21答案:D解析:13.[单选题]下列哪种分子不是细胞的第二信使( )A)cAMPB)cGMPC)DAGD)GTP答案:D解析:14.[单选题]在细胞培养基中加入H-胸腺嘧啶核苷,培养30min,随后取样进行固定及放射自显影,结果发现( )A)所有进行有丝分裂的细胞的染色体中都掺入了标记的胸腺嘧啶核苷B)所有进行有丝分裂的细胞的染色体中都没有掺入标记的胸腺嘧啶核苷C)有的细胞,不论是否进行有丝分裂,其染色体中均掺入标记的胸腺嘧啶核苷D)所有的细胞,不论是否进行有丝分裂,其染色体中均没有掺入标记的胸腺嘧啶核苷答案:B解析:15.[单选题]下列连接方式中,除了( )外,都有通讯的作用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

真核生物基因在染色体上分布的非随机性(综述)于鹏 2003级博士生专业:免疫学导师:马大龙教授近年来随着基因组数据的积累,越来越多的证据表明真核生物的基因在染色体上不是随机分布的,至少一部分基因倾向于以簇(cluster)的形式分布于染色体上。

下文就这个领域的研究进展加以介绍。

一、真核基因非随机分布的证据1.全基因组研究开展之前的零星证据在基因组序列大规模获取之前,在真核生物中已经发现了一些基因簇的例子,如Hox 与globin 基因家族,通常认为这是基因组局部复制的结果,即串联重复(tandem duplicate)。

另外一个典型的例子是印迹基因(imprinted gene)的成簇存在[1]。

2.全基因组研究提供的证据1)共表达(co-expression)基因的成簇现象全基因组水平的转录研究尤其是采用microarray技术研究发现,在真核生物中广泛存在共表达(co-expression)现象,而且共表达的基因有成簇存在的趋势。

共表达最早的例子出现在对酵母细胞有丝分裂的研究过程中。

Cho et al 发现在酵母细胞中,具有细胞周期依赖性表达模式(cell-cycle-dependent expression)的基因中有25%的基因位于在同一细胞周期中表达基因的附近区域,这些共表达基因形成的簇很少超过10个基因,总长约几个kb [2]。

随后在线虫中也发现了类似的共表达现象,不过成因有所不同,是通过多个基因形成操纵子(operon)来实现的。

线虫是目前发现的极少数具有操纵子结构的真核生物之一。

与原核的操纵子不同,线虫的操纵子基因转录形成一条长的多顺反子(polycistronic)mRNA前体, 而后被降解成单个小mRNA再转入翻译阶段。

约15%的线虫基因是位于操纵子中, 每个操纵子大小与酵母中的共表达基因簇类似,一般不超过10个基因[3,4]。

多细胞真核生物中也发现存在共表达的基因簇。

与前两者相比,基因簇的大小显著增加。

例如在果蝇中,45%睾丸组织特异性表达的基因可以形成无间断的基因簇,每个簇最少包括4个基因[5]。

如果将限制条件放松,允许共表达的基因间有其它基因的插入,则簇的大小可以显著增加。

Spellman 与Rubin [6] 采用10kb的滑动窗口考察果蝇染色体的转录情况,发现20%的基因落在共表达基因簇中,每个基因簇包括约10-30个基因,大小约为125kb。

拟南芥中发现的基因簇跨越大约20个基因 [7,8,9]。

在哺乳动物中,共表达的基因簇大小甚至可以达到1M 的水平[10]。

Yutaka et al [11] 对酵母、线虫、果蝇、小鼠、大鼠、人类的mRNA 表达数据做了比较分析,证实共表达现象在真核生物中是普遍存在的,在10kb 范围内的基因尤其可能发生共表达。

发现共表达基因的成簇现象后,人们自然会问是否共表达的基因具有功能相关性。

通常考察的方法是看共表达的基因是否位于同一代谢途径,编码蛋白是否存在相互作用,或是否位于基因标准注释体系GO (gene ontology )的同一分类下。

在酵母中,许多共表达基因簇中的成员在功能上具有相关性[11,12],而在其它高等生物中如人中,这种相关性不明显[11]。

这可能是由于两方面的原因造成的,一方面可能这些共表达基因真的不存在功能关联,而另一方面也可能是由于目前对基因功能注释数据不足。

Homin K. Lee [13] 对人类的基因芯片数据做了大规模的比较研究,他们的结果表明,两个基因在越多的样本中存在共表达,则越可能存在功能上的关联性。

虽然共表达与功能相关性之间还不能建立必然的联系,但至少可以为基因功能注释提供一定的线索。

2)功能相关基因的成簇趋势Lee 与 Sonnhammer [14] 利用代谢途径数据库KEGG ( KYOTO ENCYCLOPAEDIA OF GENES AND GENOMES) 的数据,考察了人、线虫、果蝇、拟南芥基因组中功能相关基因的分布情况。

他们的方法是首先定义一个聚类得分(clustering score )的计算公式。

对一条代谢途径计算对应的聚类得分。

随后在基因组内随机取200组基因,每组基因数与该代谢途径包含的基因数相等,而且每组中基因两两不重复。

计算200组数据的聚类得分,作为随机情况下聚类得分的分布。

以该分布中3/4分位数(third quartile )到中位数的距离作为阈值,如果考察代谢途径的聚类得分显著高于此阈值,则表示该途径包含的基因不是随机分布。

基因间距离打分公式:基因位于同一染色体上pair score= 基因组内染色体平均长度/两基因间距离基因位于不同染色体上pair score=基因组内染色体平均长度/两基因所在染色体长度的平均值总聚类得分 clustering score =genenumberpairscore结果表明在所有考察的代谢途径中,酵母中有98%的代谢途径包括的基因有聚集的趋势,果蝇中最低占30%,人类中比例为65%,随机抽取基因构成的代谢途径中仅有11%有成簇趋势。

凡是有成簇趋势的代谢途径的聚类得分都远远高于规定的阈值(15倍左右)。

文章中还对基因组中任意两基因间的距离做了计算,人类任意两基因的距离为62.79MB, 标准差为14.1M, 以20M (62.79-3×14.1 P<0.01)距离作为基因间距离的阈值,同一代谢途径内的基因也比随机情况更加靠近。

3)基因的规则分布(regular spacing )Képès [15] 研究发现在酵母中,受同一转录因子调控的基因在染色体上呈规律的分布,很可能与染色体的高级结构的规律性对应。

二、基因非随机分布的机制从上面的证据可以看出,真核生物基因组内的基因分布不是随机的,存在很多共表达的基因簇。

在不同生物中这类基因簇的大小不尽相同,从几kb到1Mb 都有存在。

对不同尺度的基因簇,有不同的机制来实现同一簇中基因的共表达。

1.一级结构调控早期的转录研究认为基因的转录仅仅是由其上游启动子序列控制的,即’promoter-drives-expression’模型。

这一模型过于简单,现在的研究已远远突破这种认识。

该模型可以对一些小范围内的共表达情况做出解释。

例如串联重复基因(tandem duplicate gene)因为具有类似的启动子,所以表达情况类似。

另外在酵母[2,16,17]和人类[18,19]中存在一定数目的双向启动子(bidirectional promoter),可以引起两侧基因的共表达。

符合这一模型的极端例子是共表达的多个基因发生融合用以合成一种蛋白产物。

2.染色体高级结构的调控最近的研究表明基因的转录直接受染色体高级结构的影响,其中主要的两个因素是基因所处染色体区域的状态和该区域在核内的位置。

1)染色体状态(chromosome state)染色体处于凝集状态即异染色质(heterochromatin)状态时,转录因子不能结合,不能引发转录。

只有当染色体处于松弛状态,才可能发生转录。

目前认为染色体状态的改变是通过对构成染色体骨架的核心组蛋白(core histone)的修饰完成的[20]。

特异的组蛋白修饰蛋白控制着染色体的打开或是关闭,而且这种控制可以在染色体上延伸相当长的距离,直到遇到边界元件(boundary element)为止[21,22](见图1)。

组蛋白的修饰由多种类型,主要的有甲基化/去甲基化,乙酰化/去乙酰化等等。

组蛋白的甲基化或是去乙酰化可以使组蛋白与染色体紧密结合,使转录因子无法结合而无法起始转录,反向修饰则激活转录。

有些修饰是可以长期保持,比如对组蛋白上的赖氨酸的甲基化修饰,需要缓慢地替换组蛋白或是DNA复制来消除。

而通过对组蛋白乙酰化酶(histone acetylase)和去乙酰化酶(histone deacetylase)活性的调节,可以实现对组蛋白状态的迅速调节,而且可以组织特异性地发挥作用[23,24]。

例如在人类中,锌指蛋白基因的特异性阻遏元件RE-1 转录沉默因子(REST , silencing transcription factor)通过招募组蛋白去乙酰化酶,可以特异性地抑制非神经组织中锌指蛋白基因的转录。

但是染色体区域处于打开状态只是满足转录起始的基本条件,打开区域的基因是否转录还依赖于其它因素,比如启动子的甲基化状态、是否有合适的转录因子,以及其它顺式作用元件(cis-element)的影响。

2)染色体的三维结构与核内位置前文提到Képès [15] 发现在酵母中受同一转录因子调控的基因在染色体上规则分布,这与描述染色体高级结构影响基因转录的“active chromoatin hub”模型[26]符合。

该模型认为染色体上相隔一定距离的的同一类顺式作用元件通过与共同的反式作用因子结合而将染色体分隔成一系列规则大小的拓扑环结构(见图1),只有在靠近这些顺式元件附近的基因才能表达,而远端的基因不表达。

Akashi et al [25]对造血干细胞的研究了表明干细胞中大部分的染色体区域是处于打开的状态,对应分化的全能性。

而随着分化过程的进行,特定的染色体区域被关闭,细胞也就分化成不同类型,为上述的模型提供了支持。

另外染色体在核内所处的位置也影响着基因的转录。

在酵母中将基因移至核的边缘会导致基因沉默[27]。

许多物种中分裂间期的染色体都处于特异的、相对紧凑的核内位置,而且基因含量高的染色体更倾向于分布于核的中央[28,29]。

所有这些都暗示核内的三维位置与基因表达之间存在关联关系。

有观点认为核内定位对共表达基因的进化可能存在选择作用,可能产生两种影响:一种是使共表达基因在一条染色体上形成基因簇,rRNA基因被认为是这方面的代表;另一种影响是使不同染色体上的相关基因在空间上定位于相近的区域从而具有共同表达的潜力,tRNA 基因在染色体上不形成基因簇,但在核内相关,属于此种情况[30]。

真核生物核内具有10-30个主要的结构区域,在这些区域mRNA代谢因子高度聚集,染色体的基因高密度区段与这些结构区域有密切的联系[31,32]。

这些区域可能与共表达基因形成的基因簇相对应。

SC35 结构域被认为是核内结构域的代表,Shopland et al[31] 认为它是许多基因簇的功能中心,如果染色体只是打开而没有与SC35结构域结合,则转录会受到限制。

三、基因非随机分布的成因与维持共表达甚至功能相关基因的成簇化,在进化中有一定的选择(selection)优势。

在原核生物中,功能相关的基因形成operon, 有利于编码的蛋白产物迅速形成复合物,从而更加稳定、毒性更小,或是利于蛋白相互作用[33]。

相关文档
最新文档