第2章 基因和基因组
分子生物学 第二章 有机体、基因和染色体

②蛋白质基因通常以单拷贝的形式存在。多拷贝 基因或多拷贝序列存在于染色体上常引起非均 等交换 , 结果导致了相同序列之间的基因的缺 失或倒位。 基因序列的倍增虽是经常发生的 (10-4), 可是绝大 多数的倍增并没有给细菌带来选择上的优势 , 因而很快又被淘汰。这样 , 使绝大多数的蛋白 质基因保持单拷贝形式。
类核的结构
E.coli: 4.2×106bp ( 1300 微米), 闭合环状,约 编 码 3000~4000 个 基因。
生物在进化中选择了经济而又有效的结构形式:
①功能上相关的几个结构基因前后相连,再加上一 个共同的调节基因和一组共同的控制位点,即启 动子和操作子在基因转录时协同动作。细菌基因 表达调控的这样一个完整的单元,称为操纵元。 例:大肠杆菌中半乳糖代谢的 β- 半乳糖苷酶,半乳 糖苷透性酶,半乳糖苷乙酰化酶三个酶的基因z、 y 、 a 与控制位点 o 、 p 以及它们的调不需要转录后加工;而真 核生物基因转录后的绝大部分前提RNA必须经过剪接 过程才能形成成熟的RNA。 原核生物细胞内缺少分隔的功能区域,所有生理生化 反应都在同一细胞质中进行,因而原核生物的基因转 录和翻译是偶联的,边转录边翻译;真核生物细胞的 转录和翻译在时间和空间上都是分离的。
推理过程:
φ×174的DNA数量有限,其基因在排列上更加 体现了经济原则:
(1) φ×174 有11蛋白质基因,但是只转录成3个 mRNA,其中一个从A基因开始,一个从B基因开始, 另一个从D基因开始. (2) φ×174的DNA分子绝大部分用来编码蛋白质, 不翻译出来的部分只占4%(217/5386),其中包括 基因之间的间隔区和一些控制基因表达的序列. (3) φ×174 的基因排列上最显著的特点是有重叠 基因和基因内基因.
基因和基因组及基因工程的概念

圆形种子+皱形种子 杂交第一代(均为圆形) 回交 圆形豆 皱形豆 5474粒 1850粒 3 : 1
摩尔根果蝇杂交试验
有4对染色体,一对小粒状,2对V形,一对呈棒状XX或XY(性染色体) X1X2(红眼)+XWY(白眼) (野生型) (突变型) 杂交子一代(雌雄均为红眼) X1XW, X1Y , X2XW,X2Y X1X1,X1Y,XWX1,XWY,X2X1,X2Y,XWX2,XWY ¼为红眼雄性及白眼雄性
5、重复序列及重复基因
几乎所有的真核细胞(酵母除外)的基因组DNA中都具有重复序列(repeated sequence),它无转位移动能力,因此它区别于转位作用的IR(inverted repeat)。IR是指序列的重复性。但无基因序列的交叉重叠性,故不同于重叠基因序列。重复序列可分为四种类型: 不重复序列,是唯一的序列,只有一个拷贝。 低度重复序列,一般有1-10个拷贝。 中度重复序列,有数十至数万(105)拷贝。如图2-9、2-10 高度重复序列 拷贝数可达106以上,包括卫星DNA、高丰度SINE家族的Alu序列 。
第二章 基因和基因组及基因工程的概念
添加标题
第一节 基因的概念
01
添加标题
第二节 基因组
02
添加标题
第三节 基因工程的定义和研究内容
03
添加标题
第四节 基因工程的发展史
04
第一节 基因的概念
01.
2第二章 基因、基因组与基因组学

2019/9/26
8
1、结构基因
① 原核生物的结构基因是连续的,RNA合成后不需 要剪接加工。
z
y
非结构基因 a
非结构基因
结构基因
2019/9/26
9
② 真核生物结构基因 由外显子(编码序列)和内
含子(非编码序列)两部分组成,编码序列不连续, 称为断裂基因(split gene / interrupted gene)。
医学分子生物学
第二章 基因、基因组与基因组学
南华大学生物化学与分子生物学教研室
目录 CONTENT
• 基因的结构与功能 • 基因组的结构和功能 • 基因组学 • 基因组复制 • 本章小结
PPAARRTT1 1
第一节
基因的结构与功能
基因的生物学概念 基因的现代概念
2019/9/26
3
一、基因的生物学概念
1909, W. L. Johannsen 将遗传因子改称为基因(gene),提出 基因型和表型的概念
1910,T. H. Morgan 证实基因在染色体上
2019/9/26
4
1944, M. McCarty & O. Avery 肺炎球菌转化实验
1952,A. Hershey & . Chase T4噬菌体感染细菌实验
25
3. 结构基因没有内含子,多为单拷贝,结构基 因无重叠现象;
4. 基因密度非常高,基因组中编码区大于非编 码区;
5. 重复序列很少,重复片段为转座子; 6. 有编码同工酶的等基因(isogene);
2019/9/26
26
7、存在可移动的DNA序列
转 座 因 子 ( transposable element ) : 能 够 在 一 个 DNA分子内部或两个DNA分子之间移动的DNA片段。
第2章 细胞器基因组

第2章细胞器基因组基本概念和定义·在有性繁殖的真核生物中,父系和母系对子代核基因组的贡献都是均等的,产生典型孟德尔遗传模式(参见亲本印记和性连锁遗传)。
所以核遗传(nuclear inheritance)被称为双亲融合(b iparental)。
然而细胞中除了细胞核还有其他细胞器有自身的基因组(最主要的例子是线粒体和叶绿体),同时细胞质中还有可能含有寄生虫,病毒或内共生体等有机体。
·细胞质内遗传信息与细胞核内基因的遗传方式是不同的。
细胞质遗传(cytoplastic inheritance,核外遗传或基因组外遗传)通常是单亲遗传(uniparental),即仅由单亲提供到合子中。
在动物中,细胞质遗传与母系遗传(matemal inheritance)是同义的,因为只有母系配子对合子提供细胞质。
在植物中,母系遗传占主导地位,但某些物种是父系遗传(patennal inhentance),还有的双亲都有细胞质传递的能力(不是同时起作用)。
在植物和低等的真核生物中,双亲的配子都能为合子提供等量的细胞质,但是双亲之一细胞质的基因经常被选择性的破坏或失活,所以遗传方式还是功能性单亲遗传。
后代的基因型只决定于双亲之一,与另一个的基因型无关。
·细胞器基因组在结构和功能上和某些真细菌的基因组的性质相似。
因此一般认为它们是由寄居在早期真核细胞中的内共生生物演化而来的。
细胞器基因组和核基因组在功能上的高度整合是细胞器功能所必须的,这也暗示着在细胞器进化的过程中,大量细胞器的基因都被转移到核基因组中去。
内共生理论和混栖DNA细胞器有可能是由与原始的真核细胞形成内共生体原核生物演化而来的。
这个模型的证据包括,细胞器与现有的细菌在基因组结构,基因表达的机制和对抗生素敏感性等方面的相似性,以及它们的基因和多肤序列的相似性。
经历了一个进化时期,线粒体和叶绿体的部分基因丢失进入核内,从而对宿主依赖。
第2章从基因到基因组

第二章从基因到基因组我们可以从几个水平上解决基因和基因组的作图问题。
遗传(或者连锁)图谱(Genetic map )以重组率来确定突变之间的距离,其局限性在于它依赖于影响表型的突变。
由于重组率与位点的物理距离并不一致,因此不能准确的代表遗传物质。
连锁图谱(Linkage map)也可以通过测定基因组DNA位点的重组率获得。
这些位点有序列的改变,从而改变了被特定限制性酶切割的适应性。
这种变化非常普遍,因此无论突变是否发生,任何生物都可以获得连锁图谱。
连锁图谱的不足之处与遗传图谱相似,即相对距离依赖于重组。
限制性图谱(Restriction map)是用限制性内切酶将DNA切割成片段,然后测定片段之间的距离建立的。
它以DNA的长度来代表距离,因此为遗传物质提供了物理图谱。
限制性图谱未能确定遗传性取得独特位点,要使其与遗传图谱相联系,必须选择能影响酶切位点的突变。
基因组上较大的改变能影响限制性片段的大小和数量,易于识别。
点突变则很难被发现。
终极图谱(ultimate map)是确定DNA的序列,从序列中可以确定基因和它们间的距离。
通过分析一个DNA序列的阅读框架,可以推测它是否编码蛋白质。
这里基本的推测是自然选择阻止了编码蛋白质序列中破坏性突变的聚集。
与此相反,可以假定整个编码序列实际上很可能用来产生蛋白质。
通过比较野生型DNA和其突变型等位基因,可以确定突变的实质和它确切的位点,从而定义遗传图谱(完全依赖于突变的位点)和物理图谱(取决于DNA序列组成)的关系。
相似的技术也用于确认DNA和测序,以及基因组作图,尽管存在一定程度上的不同。
其原理是获得一系列重叠的DNA片段,能组成一个连续的图谱。
通过片之间的重叠,使每一个片段都是与另一个片段相联系,确保没有片段丢失。
这个原理也用于限制性片段排序作图以及连接片段间的序列。
遗传图谱对分析基因组和单个基因都很重要,因此我们在研究基因结构之前先简单回顾一下该原理的应用。
分子遗传学-第2章-基因组

第三节
真核生物基因组
福建农林大学 2012
3.1 概况
• 除非特别说明,真核生物基因组一般是指其核基 因组 • 真核生物基因组由多个 DNA 分子组成,每个皆 为双链线形分子 • 每个 DNA 分子皆与蛋白质结合,构成染色体, 染色体上有着丝粒结构,可以进行有丝分裂
福建农林大学 2012
福建农林大学 2012
细菌染色体与蛋白质结合形成环状结构域及超螺旋化
福建农林大学 2012
病毒的一 般结构
蛋白质壳体
双层酯被膜
蛋白质刺突
(2130个) 蛋白质亚基
福建农林大学 2012
烟草花叶 病毒(TMV)
福建农林大学 2012
2.2 组织结构
• 基因簇
指功能相关的一组基因按一定顺序成串排列的现象
• 断裂基因
指一个基因的编码序 列在 DNA 上是不连续 的,被一些插入序列 (一般无编码功能) 所隔开。其中编码序 列称为外显子,插入 序列称为内含子。 DNA 转录为 RNA 后, 内含子序列必须切除。
福建农林大学 2012
福建农林大学 2012
福建农林大学 2012
编码 RNA 的基因和编码蛋白质的基因皆可能有内含子 高等真核生物中大多数基因有内含子,但低等真核生物 中有内含子的基因较少 已发现在原核生物和细胞器基因组中也存在内含子 关于内含子的起源,主要有两种观点:
fungi
protists
福建农林大学 2012
monera
protozoa
•生物进化从低等到高等,从简单到复杂,遗传信 息量不断增加。 •推论:基因组(C 值) 与遗传信息量应该是平行 的,也应该相应不断增大,二者是成正比的。 •从大的进化尺度看,这个规律是成立的;从小的 进化尺度看,在进化早期(低等生物进化阶段) 也是成立的,但在高等生物进化阶段显然不成立。
第2章 原核生物基因组与病毒基因

3. Col质粒(也称大肠杆菌素生长因子):是可以产生大 肠杆菌素(colicin)的大肠秆杆菌质粒。大肠杆菌素能 阻止不含这种质粒的大肠杆菌生长。
三、质粒的一般性质
1、质粒的主要成分:
ΦX174噬菌体的基因结构
Ala Glu Gly Val Met 终止
- GCGˊG AAˊG GAˊG TGˊATGˊTAAˊTG TˊCT-
Arg Lys Glu 终止
起始 Ser
二、大肠杆菌基因组特征
〈一〉大肠杆菌基因组: 1、分子量:2.64 x109Da,4 639 221 bp。 2、染色体DNA总长度:1100-1400um。 3、基因组:约有3500个基因。
是指携带有效接触基因的质粒,只能使细菌接合, 本身不能被传递。
2. 可移动型质粒(mobilizable plasmid):
可以被传递,但不能使细菌Байду номын сангаас合。
3.自传递型质粒(self transmissible plasmid):
是兼具上述两种功能的质粒,如F质粒兼有接合和 可移动的双重性质。
二、质粒的类型 (3)
DNA或RNA;单链或双链;闭合环状或是线性分子。 3.基因组中有重叠基因现象。
使较小的基因组能携带较多的遗传信息。 4.基因组中具有操纵子结构。 5.病毒基因可连续(噬菌体)也可间断(真核细胞病毒)。 6. 重复序列少,不像真核生物基因组。 7.非编码区少,编码序列大于90%。 8.基因组是单倍体(逆转录病毒有两个拷贝)。 9.相关基因丛集 形成一个功能单位或转录单元。
二、DNA病毒:基因组的一般特点
第二章人类基因组计划

2019/1/8
2
遗传图谱
转录图谱
0.7 cM 或 kb
人类基因组 计划的核心 内容: 四张图: 物理图 转录图
物理图谱
序列图谱
遗传图 序列图
100 kb STS map
2019/1/8
3
四、HGP核心内容
1、遗传图谱 (连锁图谱)
(1)概念:遗传图谱(genetic map)又称连锁图 谱(linkage map),它是以具有遗传多态性的遗传 标记为“路标”,以遗传学距离为图距的基因组 图基因组计划启动时人类学研究已将1.6万个基因 确定了相对位置。 ( 2 )图距单位: cM ,在减数分裂事件中两个位点 之间进行交换重组的百分率, 1% 的重组率称为 1cM。 ( 3 )图谱意义:育种的字典、基因组测序的路标。
2019/1/8
12
(5)意义 可以了解基因的精确位置和功能;了解不 同时间不同基因的表达情况;了解不同组 织中基因的表达情况;了解正常情况与不 正常情况下基因的表达情况; 与遗传图谱、物理图谱、序列图谱一起成为 破译基因这部天书,了解生命的真谛的基 石。
2019/1/8
13
4、序列图谱(人类基因组计划的核心) 人类基因组的核苷酸序列图是分子水 平上最高层次,最详尽的物理图。测定总 长1m,由30亿个核苷酸组成的全序列。现 在的人类基因组来自一个“代表性人类个 体”(其所有权在法律上不属于任何供 体)。
>90%
20~30% 中度至高度重复序列
Coding DNA
Non-coding DNA
约60% 约40% 分散重复序列
16
2019/1/8
假基因
基因片段
内含子
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 对于质粒和其他染色体外成分,如果是自 然产生的质粒,用三个正体字母表示,第 一个字母大写,例如:ColeI;但如果是重 组质粒,则在两个大写字母之前加一个p,
大写字母表示构建该质粒的研究者或单位。 例如:pSCl01, (SC代表StanleyCohen), 及pM丁555(MT代表 ManchesterTechnology)。
(二)各物种基因组大小比较
开花植物 鸟类 哺乳动物 爬行动物 两栖类 硬骨鱼 软骨鱼 棘皮动物 甲壳类 昆虫 软体动物
线虫 霉菌 藻类 真菌 革兰氏阳性菌 革兰氏阴性菌 支原体
一个物种单倍体染色体数 目称为该物种的基因组。
一个单倍体基因组的 DNA含量是恒定的,称 为 C-值(C-value)
各门类物种的C-值
• 对果蝇基因命名的例子最繁多,特别是在 发育生物学中。对突变表型的表示用1—4 个字母代表。例如,基因v.fiite(w), tailless(c/J),hedgehog (AA);而蛋白质 则为White,Tailess,Hedgehog。
• 对于酵母,一般用三个大写斜体字母表示 基因的功能,后面的数字表示不同的基因 座。例如,啤酒酵母基因GAL4,CDC28; 其表达的蛋白质则是: GAlA,C13~8。但 也有例外,例如非洲粟酒酵母基因是gal4, cdc2;蛋白质为:GaB,Cdc2。
包括转录的启动子、上游的其他调控区域、 基因本身、转录的终止序列
狭义
• 能产生一个特定蛋白质的DNA序列
染色体外遗传物质
• 质粒 • 叶绿体 • 线粒体
二、基因的命名
原则:
• 用三个小写英文斜体字母表示基因的名称, 例如涉及乳糖代谢相关的酶基因:lac;涉 及亮氨酸代谢相关的酶基因:leu。
4.大部分DNA序列用于编码,只有很少序列 不编码(非编码序列较少);
5. 基因组中功能基因丛集成一个或几个特定 区域,构成多顺反子结构;
6. 除反转录病毒外,病毒基因组只有一个拷 贝;
7.有的病毒基因组中具有宿主细胞基因组的 结构特点;
病毒基因组特点
经济原则
1、共11个蛋白质 基因,但只转录3 个mRNA 2、其DNA分子绝 大多数用于编码蛋 白质,不翻译的序 列只占4%; 3、最显著的特点 是有重叠基因和基 因内基因。
• 外元(exon):基因中编码的序列,是对 应于信使RNA序列的区域;
• 内元(intron):不编码的间隔序列,是在 信使RNA被转录后的加工中去除的区域;
• 如果一个基因有n个内元,则相应地含有 n+1个外元
1
3
2
DNA
mRNA
1
3
2
电镜观察
S1酶处理外切酶 VII Nhomakorabea碱
碱
处
处
理
理
1+2+3
1+2 1 2
第二章 基因和基因组
主要内容
• 基因的概念 • 基因的命名 • 基因组大小和C-值矛盾 • 重叠基因 • 基因组 • 真核生物的DNA序列 • 基因家族
一、基因的概念
广义
• 是原核生物、真核生物以及病毒的DNA和 RNA分子中具有遗传效应的核苷酸序列, 是遗传的基本单位。
• 包括结构基因和调控基因 • 遗传单位的概念从基因扩展为转录单位,
• 在三个小写英文斜体字母后面加上一个斜 体大写字母表示其不同的基因座,全部用 正体时表示蛋白产物和表型;例如,对于 大肠杆菌和其他细菌,用三个小写字母表 示一个操纵子,接着的大写字母表示不同 基因座,lac操纵子的基因座:lacZ,lacY, lacA;其表达产物蛋白质则是lacZ,lacY, lacA。
• 亲源关系密切的生物C值相差甚大,如豌豆 为14,蚕豆为2;
• 高等真核生物具有比用于遗传高得多的C值, 如人染色体组DNA含量在理论上包含300万 个基因,但有实际用途的基因只有5-10万 个左右。
四、重叠基因
• 定义:核苷酸序列彼此重叠的2个基因为重 叠基因overlapping genes,或称嵌套基因 nested genes。
各个种类生物的最小 基因组与其复杂性正 相关
两哺
支
栖乳
原细酵霉线昆鸟动动
体菌母菌虫虫类物物
(三)C-值矛盾(C-value paradox): 基因组大小与机体的遗传复杂性缺乏相关性。 即真核生物中DNA含量反常的现象。
几种常用实验动物的基因组大小
C值矛盾的表现:
• C值不随生物的进化程度和复杂性而增加, 如肺鱼的C值为112.2,而人的为3.2;与牛 相近;
五、基因组
• 原核生物基因组 • 病毒基因组 • 真核生物基因组
一、原核生物基因组
• 染色体基因组:环状或线状的双链DNA分 子所含有的全部基因。
• 染色体外基因组:质粒基因组。
细菌的基因组和染色体
1、细菌细胞
大小:直径,0.1~5.0μm, 长度,2~8μm; 形状:球菌,杆菌,螺旋菌
• 种类: a.一个基因核甘酸序列完全包含在另一个 基因中; b.两个基因的核苷酸序列部分重叠; c.两个基因的核苷酸序列的末端密码子相 互重叠
• 实质:两个基因虽共用一段核苷酸序列, 但其读码结构互不相同,编码不同的蛋白 质。
• 意义:使DNA的利用率提高,是基因表达 调控的方式之一。
• 目前,在少数原核生物(大肠杆菌、病毒) 中发现,在少数真核生物中也发现了类似 的基因重叠现象(果蝇)。
sey,myc,蛋白Sey,Myc。
• 人类基因的命名方法与脊椎动物相似,但
需大写。例如基因是MYC、EN01,蛋白质
则为MYC、EN01。
三、基因组大小和C-值矛盾
(一)断裂基因 • 定义:断裂基因(split gene):不连续的
基因称为断裂基因,指基因的编码序列在 DNA上不连续排列而被不编码的序列所隔 开。 • 构成:断裂基因由一系列交替存在的外元 和内元构成,基因的两端起始和结束于外 元,对应于其转录产物的5`和3`末端;
• 线虫用三个小写斜体字母表示突变表型, 如存在不只一个基因座,则在连字符后用 数字表示,如基因unc-86,ced-9;蛋白 UNC-86;CED-9。
• 目前还没有适用于所有植物的惯用命名法, 但大多数也用1—3个小写字母表示。
• 脊椎动物一般用描述基因功能的1--4个小写 字母和数字表示其基因功能。例如,基因