第三章 真核生物基因组

合集下载

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。

真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。

对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。

一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。

基因组大小与细胞大小和复杂度之间存在着类似关联性。

人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。

真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。

1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。

在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。

2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。

与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。

3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。

真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。

二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。

1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。

目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。

2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。

真核生物基因组

真核生物基因组

微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同

真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能

真核生物染‎色体基因组的结构和功‎能真核生物的‎基因组一般比较庞‎大,例如人的单‎倍体基因组由3×106bp‎硷基组成,但人细胞中‎所含基因总‎数大概会超‎过3万个。

这就说明在‎人细胞基因组中有许多D‎N A序列并‎不转录成m‎R NA用于‎指导蛋白质‎的合成。

研究发现这‎些非编码区‎往往都是一‎些大量的重‎复序列,这些重复序‎列或集中成‎簇,或分散在基‎因之间。

在基因内部‎也有许多能‎转录但不翻‎译的间隔序‎列(内含子)。

因此,在人细胞的‎整个基因组当中只有很‎少一部份(约占2-3%)的DNA序‎列用以编码‎蛋白质。

真核生物基因组有以下特点‎。

1.真核生物基因组DNA与蛋‎白质结合形‎成染色体,储存于细胞‎核内,除配子细胞‎外,体细胞内的‎基因的基因组是双份的(即双倍体,diplo‎i d),即有两份同‎源的基因组。

2.真核细胞基‎因转录产物‎为单顺反子‎。

一个结构基‎因经过转录‎和翻译生成‎一个mRN‎A分子和一‎条多肽链。

3.存在重复序‎列,重复次数可‎达百万次以‎上。

4.基因组中不编码的‎区域多于编‎码区域。

5.大部分基因‎含有内含子‎,因此,基因是不连‎续的。

6.基因组远远大于原‎核生物的基因组,具有许多复‎制起点,而每个复制‎子的长度较‎小。

高度重复序‎列:高度重复序‎列在基因组中重复频率‎高,可达百万(106)以上。

在基因组中所占比例‎随种属而异‎,约占10-60%,在人基因组中约占20‎%。

高度重复顺‎序又按其结‎构特点分为‎三种(1)反向重复序‎列这种重复顺‎序约占人基因组的5%。

反向重复序‎列由两个相‎同顺序的互‎补拷贝在同‎一DNA链‎上反向排列‎而成。

变性后再复‎性时,同一条链内‎的互补的拷‎贝可以形成‎链内碱基配‎对,形成发夹式‎或“+”字形结构。

反向重复间‎可有一到几‎个核苷酸的‎间隔,也可以没有‎间隔。

没有间隔的‎又称回文结‎构,这种结构约‎占所有反向‎重复的三分‎之一。

第3章 生物体中究竟有多少基因?

第3章 生物体中究竟有多少基因?

第三章生物体中究竟有多少基因?与原核基因组(Genome)相比,真核基因组有一些不同的特点。

一个基因的完整性可以被打断,会有多个相同的重复序列,并且有大量的DNA并不编码蛋白。

由于核与胞质的分离,真核中基因的表达也必然和原核生物不同。

但是“真核基因组”并没有明确的界限,其必要条件是基因组大部分位于核内。

核DNA的数量变化很大,它所形成的染色体数量各不相同,序列类型也有很大区别,而细胞器含有相对较少的基因组,其大小也表现出广泛差异。

在分析真核基因组,特别是高等真核生物基因组的主要困难是编码区只代表总DNA 的很小一部分。

由于基因可能是割裂的,其大部分可能并非与编码的蛋白质相关。

基因之间也可能存在很长的DNA。

因此我们不可能从基因组总大小上推测出基因的大小。

可以通过鉴定拥有开放读框的区域直接推知基因组的编码潜力。

但是割裂基因可能含有很多分离的开放读框,从而混淆大规模基因组作图。

由于我们不知道蛋白产物的功能,或者没有确实证据说明它们表达,这种方法仅局限于确定基因组的潜力(但也有假设认为保守的开放读框会被表达,见第二章)。

另一种确认基因数量的途径是通过它们表达的蛋白或者mRNA。

这对处理已知条件下表达的基因非常可靠。

可了解在特定组织或者细胞中有多少基因表达,在相关表达水平上存在哪些差别,并且在一个细胞中表达的基因有多少与其它细胞不同,或者有多少也在其他细胞表达。

关于细胞类型,我们可能会问一个特定基因是否是必要的,当该基因突变时会发生什么情况呢?如果这种突变是致死的,或者生物表现出可见的缺陷,我们可能推测这个基因是必须的,或者至少表现出选择优势。

但有些基因的缺失对表型没有明显的影响,这些基因真是不需要的吗?在其他情况下或者经过长期的进化,它们的缺失意味着选择的劣势吗?3.1 基因组为何如此之大?基因组中DNA的总量是物种所特有的,称为C值(C-value)。

C值的范围变化很大,从微生物中的<106到一些植物和两栖类的>1011。

(整理)第三章基因与基因组

(整理)第三章基因与基因组

第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。

广义地说,基因是有功能的DNA片段。

第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。

Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。

3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。

3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。

有些病毒只含有RNA。

1953年沃森和克里克建立DNA分子的双螺旋结构模型。

3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。

基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。

一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。

第3章 微生物细胞的形态结构-真核微生物

第3章 微生物细胞的形态结构-真核微生物

内质网
蛋白合成示意图
第一节 概述
五、细胞质和细胞器--高尔基体(Golgi body)
1898年意大利学者C Golgi在神经细胞发现,4~8个平 行的扁平膜囊和囊泡组成,无核糖体附着。
作用:RER合成Pr运到Golgi与脂、糖形成糖蛋白或 脂蛋白,外排到细胞外。合成糖蛋白、脂蛋白及对 某些蛋白质原酶切加工,合成新CW和CM提供原材 料的重要场所
吸取养料:假根、吸器 特化营养菌丝 附着:附着枝 休眠:菌核、菌索 菌丝体 延伸:匍匐枝 捕食线虫:菌环、菌网 简单:孢子囊、担子 特化气生菌丝(子实体)复杂:分生孢子器 子囊果
直径是细菌的10倍。球状、卵圆状、椭圆状、香肠状等
典型酿酒酵母(Saccharomyces cerevisiae)2.5~10×4.5~21um 有的成链状,叫假丝酵母。
1)CW
25nm,外层甘露聚糖,中间蛋白,
里层葡聚糖(使cell抗机械强度)
2)CM
蛋白+类脂+少量糖 含丰富麦角甾醇,uv转化为VD2
第一节 概述
五、细胞质和细胞器--细胞基质和细胞骨架
细胞基质(cytometrix):除可分辩细胞器之外的胶状 溶液,细胞代谢重要场所。 微管:微管蛋白组成中空管 细胞骨架(cytoskeleton) 肌动蛋白丝(微丝):肌动Pr 中间丝:中间纤维
微管功能:支持和运输,细胞分裂时的纺锤体、鞭毛和纤毛。 微丝功能:提供ATP,发生收缩 中间丝:支持和运动
叶绿体
类囊体摞在一起为基粒
第一节 概述
五、细胞质和细胞器--其他细胞器
液泡(vacuole)
单位膜分隔的细胞器,老龄细胞大而明显。 含糖原、脂肪、多磷酸盐等贮藏物,各种酶类。 功能:维持渗透压、贮藏营养物、溶酶体的作用 (将各种蛋白酶与CP隔离,防止细胞损伤)。

分子生物学基础第三章遗传与变异 第三节基因、基因组与基因突变

分子生物学基础第三章遗传与变异 第三节基因、基因组与基因突变

第三节 基因、基因组与基因突变
2.基因的命名 (1)用三个小写英文斜体字母表示基因的名称 (2)在三个小写英文斜体字母后面加上一个大写英文 斜体字母表示其不同的基因座,全部用正体时表示其相应 的蛋白产物和表型。 (3)对于质粒和其他染色体外成分,如果是自然产生 的质粒,用三个英文正体字母表示,第一个字母大写;但 如果是重组质粒,则在两个大写字母之前加一个p,大写 字母表示构建该质粒的研究者或单位。 (4)对果蝇基因命名的例子最繁多,特别是在发育生 物学中。对突变表型的表示用1-4个字母代表。
第三节 基因、基因组与基因突变
图3-23 化学修饰剂改变碱基的配对性质
第三节 基因、基因组与基因突变
3.诱变剂和致癌剂的检测 许多化合物需在体内经过代谢活化才有诱变作用,在 测试时可将待测物与肝提取物一起保温,使其转化,这样 可使潜在的诱变剂也能被检测出来。大肠杆菌的SOS反应 可以使处于溶源状态的λ噬菌体激活,从而裂解宿主细胞 产生噬菌斑。通常引起细菌SOS反应的化合物对高等动物 都是致癌的。Devoret根据此原理,利用溶源菌被诱导产
第三节 基因、基因组与基因突变
三、基因突变
1.基因突变的类型
基因突变有以下多种类型:碱基对置换指DNA错配碱 基在复制后被固定下来,由原来的一个碱基对被另一个碱 基对所取代,又称为点突变。碱基对置换有两种类型:即 转换是在两种嘧啶或两种嘌呤之间的互换;颠换发生在嘧 啶与嘌呤或嘌呤与嘧啶之间的互换。碱基替换通常仅发生 在一个碱基上,偶尔也有几个碱基同时被替换。转换发生 的频率一般比颠换高1倍左右。插入突变指在基因的序列 中插入了一个碱基或一段外来DNA导致的突变。例如,大 肠杆菌的噬菌体Mu-1、插入序列(IS)或转座子都可能诱 发插入突变。插入突变有两种方式:①拷贝或复制移动, 指一个位点上的序列被复制后插入到另一位点。②非拷贝 移换,DNA序列从一个位点直接移动到另一位点。

基因组

基因组

(1)几个结构基因的编码区无间隔:几个基因 几个结构基因的编码区无间隔: 的编码区是连续的、不间断的, 的编码区是连续的、不间断的,即编码一条多 肽链,翻译后切割成几个蛋白质。 肽链,翻译后切割成几个蛋白质。 mRNA没有 ′端帽子结构 没有5 (2)mRNA没有5 ′端帽子结构 5 ′ 端非编码区 RNA形成特殊的空间结构称翻译增强子 形成特殊的空间结构称翻译增强子。 的RNA形成特殊的空间结构称翻译增强子。 (3)结构基因本身没有翻译起始序列,必须在 结构基因本身没有翻译起始序列, 转录后进行加工、剪接,与病毒RNA5 ′端的帽 转录后进行加工、剪接,与病毒RNA5 ′端的帽 结构相连,或与其它基因的起始密码子连接, 结构相连,或与其它基因的起始密码子连接, 成为有翻译功能的完整mRNA。 成为有翻译功能的完整mRNA。
细菌多数基因按功能相关成串排列,组成操纵元的基因 细菌多数基因按功能相关成串排列, 表达调控的单元,共同开启或关闭, 表达调控的单元,共同开启或关闭,转录出多顺反子的 mRNA; mRNA;真核生物则是一个结构基因转录生成一条 mRNA, mRNA是单顺反子 mRNA,即mRNA是单顺反子,基本上没有操纵元的结 是单顺反子, 构,而真核细胞的许多活性蛋白是由相同和不同的多肽 形成的亚基构成的, 形成的亚基构成的,这就涉及到多个基因协调表达的问 真核生物基因协调表达要比原核生物复杂得多。 题,真核生物基因协调表达要比原核生物复杂得多。 原核基因组的大部分序列都为基因编码, 基因组的大部分序列都为基因编码 原核基因组的大部分序列都为基因编码,而核酸杂交等 实验表明:哺乳类基因组中仅约10%的序列为蛋白质 基因组中仅约 的序列为蛋白质、 实验表明:哺乳类基因组中仅约10%的序列为蛋白质、 rRNA、tRNA等编码 其余约90%的序列功能至今还不 rRNA、tRNA等编码,其余约90%的序列功能至今还不 等编码, 清楚。 清楚。 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 即有外显子(exon)和内含子 和内含子(intron), 即有外显子(exon)和内含子(intron),转录后需经剪接 (splicing)去除内含子 才能翻译获得完整的蛋白质, (splicing)去除内含子,才能翻译获得完整的蛋白质,这 去除内含子, 就增加了基因表达调控的环节。 就增加了基因表达调控的环节。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 第一节 真核生物染色体基因组 • 第二节 染色体外的基因组- 线粒体 • 第三节 人类基因组
第一节 真核生物染色体基因组
• 一、真核生物染色体基因组的一般特征 • 二、单拷贝基因 • 三、重复序列 • 四、基因家族 • 五、端粒和端粒酶 • 六、基因移动
一、真核生物基因组的一般特征
(一)基因组庞大 :基因可达109bp (二)线状双链DNA和二倍体:染色体都是成对出现。 (三)非编码区远多于编码区:仅1.5%的序列被转录
特点:
• 种类多、分布广,在人群中世代相传。在 基因组中平均50kb就有一个重复序列,突 变率低(< 0.04%)。
• 在人群中高度多态,其多态信息含量容量 超过70%。其多态性表现为正常人群的不 同个体某一基因位点重复序列的重复次数 可不一样,同一个体的两个同源染色体上 重复次数也可以不一样,即微卫星DNA拷 贝数在人群中是可变的。
线粒体DNA
二、线粒体DNA的遗传特性
(一)线粒体DNA(mtDNA) :母性遗传的核外遗传物质 (二)与核DNA区别:
1、非孟德尔的母系遗传 2、高突变率 3、异质性和复制分离 4、阈值效应 5、半自主复制与协同作用
第三节 人类基因组
一、人类基因组概貌 二、人类基因组的多态性及在分子诊断中的应用 三、人类基因组研究
真核生物rRNA基因的加工
四、基因家族(gene family)
• (一)基因家族:一组功能相似且核苷酸 序列具有同源性的基因,在进化过程中从 一个祖先基因经重复和突变演变而来的。
• (二)假基因(pseudogene):与具正 常功能的基因序列相似,但无转录功能或 转录产物无功能的基因。
组蛋白基因家族
• 在人细胞组中卫星DNA约 占5-6%。
卫星DNA分类:
1.卫星DNA(satellite DNA) 2.小卫星DNA(mini-satellite
DNA) 3.微卫星DNA(micro-satellite
DNA)
高度重复序列比较
重复长度 总长度
定位
卫星DNA 5~100bp 小卫星DNA 15~70bp
• 具有遗传连锁不平衡现象。
• 均可被转录,有些编码蛋白质,而另一些 则位于非转译区的5′端和3′端不编码蛋白质。
• 属于不稳定的DNA序列,其数目在某些遗 传病中有扩大现象,而这种扩增并非是减 数分裂的重组造成,扩大可发生在减数分 裂过程中,由一代传递给另一代,也可发 生在有丝分裂中,导致嵌合体形成。与成 熟人体细胞比较,微卫星DNA在胚胎时期 有丝分裂很不稳定。
(二)单核苷酸的多态性( single nucleotide polymorphism, SNP)
主要用途: ①疾病的连锁分析与基因的定位 ②指导用药和药物设计
③用于进化和种群多样性的研究
三、人类基因组研究
(一)1990年,“人类基因组计划(human genome project,HGP)”启动。
• α卫星DNA成簇的分布在染色体着丝粒 附近,可能与染色体减数分裂时染色 体配对有关,即同源染色体之间的联 会可能依赖于具有染色体专一性的特 定卫星DNA顺序。
(二)中度重复序列 主要由较大的片段(100-几千个bp )串联重复组 成,分散在整个基因组中,少数在基因中成串排列 在一个区域,大多数与单拷贝基因间隔排列 分为短分散片段和长分散片段: 短分散片段:300bp 拷贝数10万 长分散片段:1000bp 拷贝数1万 其表达产物常是细胞大量需要的,如rRNA、tRNA 等。
• 不同基因内含子长度和数目不等 • 人胰岛素:1个内含子 • 人胶原基因:52个内含子 • 外显子与所编码的蛋白质功能结构
域一致
• 内含子有共同特征:GT/AG规则
三、重复序列
• 定义:指多拷贝的相同或近似序列 的DNA片段。
• 分类: 高度重复序列、中度重复序列
(一)高度重复序列 :
• 一般由较短的序列(10-300bp) 组成,常集中在一起串联排列,重 复频度>105 ,占基因组10~60%。
端粒酶的催 化延长作用
爬 行 模 型
DNA聚合酶复制子链 进一步加工
六、基因移动
基因在染色体上不是固定不变的,可以从 某一处转移到另一处,称为基因移动。
发生移动的基因称为可移动基因。
以转座子形式运动
第二节 染色体外的基因组-线粒体
线粒体DNA(mitochondria,mtDNA)全长为 16.5kb,环状双链分子,不含内含子。共有37个编 码 基 因 , 2 个 rRNA ( 12sRNA 和 16sRNA ) 和 22 个 tRNA(tRNAser和tRNAleu各2个基因),另有13个 为多肽编码基因。
表达。 (四)断裂基因(split gene):基因不连续,外显子
和内含子并存。 (五)大量重复序列存在 :具有高度,中度重复序列
(一)基因组庞大 :
• 真核生生物的基因组一般比较庞大。 • 大肠杆菌:4.6 ×106bp碱基 • 酵 母:1.2 ×107bp碱基 • 人 类:3×109bp碱基组成
5’ GGAATCGATCTTAAGATCGATTCC 3’ 3’ CCTTAGCTAGAATTCTAGCTAAGG 5’
2、卫星DNA
• 卫星DNA(satelliteDNA)是 另一类高度重复序列,这 类重复顺序的重复单位一 般由2-100bp组成,成串排 列。
• 由于这类序列的碱基组成 不同于其他部份,可用等 密度梯度离心法将其与主 体DNA分开,因而称为卫 星DNA或随体DNA。
第三章 真核生物基因组
临床生化教研室
• 真核生物由真核细胞构成的生物。 包括原生生物界、真菌界、植物界 和动物界。
• 定义 :真核生物是所有单细胞或 多细胞的、其细胞具有细胞核的生 物的总称,它包括所有动物、植物、 真菌和其他具有由膜包裹着的复杂 亚细胞结构的生物。
• 真核生物与原核生物的根本性 区别是前者的细胞内含有细胞 核,因此以真核来命名这一类 细胞。许多真核细胞中还含有 其它细胞器,如线粒体、叶绿 体、高尔基体等。
(二)线状双链DNA和二倍体:
• 线状双链DNA • 与蛋白结合形成染色体 • 染色体:数量,多条 基本都是成对出现。 • 特定的一组基因
(三)非编码区远多于编码区:
• 人 类:3×109bp碱基组成
• 按1000个碱基编码一种蛋白质计,理论上可有 300万个基因。
• 但实际上,人细胞中所含基因总数大概是?万个。 • 说明在人细胞基因组中有许多DNA序列并不转录
❖物理图谱(physical map) 指标明一些界标(已定位的DNA序列,如限制 酶的切点、CpG序列、基因等)在DNA上的位 置,确定遗传标志之间物理距离的图谱。
转录图谱(transcriptional map) 是具有表达能力,利用EST作为标记所构建的分子 遗传图谱。
分类:
• 按其结构特点分为三类: • 1、反向重复序列 • 2、卫星DNA • 3、较复杂的重复单位组成的重复顺序
1、反向重复序列
• 这种重复顺序复性速度极快,即使在极稀 的DNA浓度下,也能很快复性
• 约占人基因组的5%。 • 反向重复序列由两个相同顺序的互补拷贝
在同一DNA链上反向排列而成。变性后再 复性时,同一条链内的互补的拷贝可以形 成链内碱基配对,形成发夹式或“+”字形结 构。 • 它们多数散布,非群集于基因组中。
(二)1994年,我国HGP启动,参与1%工作。 (三)2001年2月12日,美国Celera公司与人类基因组计划分别
在《科学》和《自然》杂志上公布了人类基因组精细图谱及 其初步分析结果。 (四)2003年4月14日中、美、日、德、法、英等6国科学家宣 布人类基因组序列图绘制成功。
人类基因组作图
❖遗传图谱(genetic map) 指通过计算连锁遗传标志之间的重组频率,得 到基因线性排列从而确定相对距离的图谱,又 称连锁图(linkage map)。
1.rRNA基因 :rRNA常集中成簇存在基因组中, 28s、18s和5.8s串联排列,300个拷贝,5s单独存 在,有2000个拷贝。
2.tRNA基因 :每种氨基酸都有一种或多种tRNA, 而每一种tRNA基因也有几十~几百个拷贝。同一 种基因常串联在一起,排列成基因簇。
3.Alu家族 :长度约300bp,富含GC。具有一个 Alu I酶切位点(AGCT),因而得名。分布非常广, 重复次数100万,约10%基因组。
一、人类基因组概貌
基 因 甲 基 化 : DNA 甲 基 化是甲基转移酶将胞嘧啶转变 为5-甲基胞嘧啶,DNA甲基化 后表达下调。
二、人类基因组的多态性及在分子诊断 中的应用
(一)短串联重复序列 ( short tandem repeat , STR) 主要用途: ①人类基因遗传图谱的制作。 ②目的基因筛选和基因诊断。 ③法医学个体识别和亲权鉴定。
原核生物的多顺反子
5 PPP
3
真核生物的单顺反子
5 mG - PPP
蛋白质
3
蛋白质
非编码序列
核蛋白体结合位点
编码序列
起始密码子
终止密码子
(二)断裂基因
细胞内的结构基因并非全由编码序列 组成,而是在编码序列中插入了非编 码序列。
外显子(exon):断裂基因中的编码序列。 列的功能
• 参与复制水平的调节反向序列常存在于DNA复制 起点区的附近。另外,许多反向重复序列是一些 蛋白质(包括酶)和DNA的结合位点。
• 参与基因表达的调控DNA的重复顺序可以转录到 核内不均一RNA分子中,而有些反向重复顺序可 以形成发夹结构,这对稳定RNA分子,免遭分解 有重要作用。
• 在不同基因位点上的微卫星DNA的重复序 列可以不同,也可以相同。
3、较复杂的重复单位组成的重复顺序
相关文档
最新文档