第四章基因组文库

合集下载

基因组文库构建

基因组文库构建

SI 酶 降 解 发 夹 结 构 末 端 转 移 酶 dGTP 末 端 转 移 酶 加 寡 聚 C CCC CCC GGG GGG 连 接
转 化 E .c o li 扩 增 以 质 粒 为 载 体 构 建 cD N A 文 库
四.大容量克隆载体
基因组作图中使用的高容量人工染色体克隆载体的比较。
载体 YAC( 酵母人工染色体 ) 系统 酵母着丝粒 , 复制起始 点和端粒 克隆容量 200kb ~2Mbp 评价 嵌合 发生 率高 ( 在 基因 组 中不相连的连续片段) ; 不稳定 (自发缺失 ); 很难与酵母染色体分离; 稳定,但在细菌外难以维 持
TTTTTT
TTTTTT AAAAAA
通 过 以 下 途 径 将 cDNA 插 入 载 体 a. 平 端 克 隆 b. 加 接 头 c. 进 一 步 进 行 同 聚:裸露的噬菌体重组DNA转化宿主细胞或 包装后转染宿主细胞。 载体筛选:在细菌菌苔中形成噬菌斑。 重组筛选: 插入载体—通过可见标记的插入失活(cI基 因的打断阻止溶源性,产生的噬菌体更清澈; 现代的载体携带lacZ基因,以兰-白筛选)。
(a) 随 机 六 碱 基 NNNNNN (c)发 夹 引 物
AAAAAAA mRNA (b)寡 聚 (dT)引 物 第 一 条 cDNA 的 合 成 An An Tn (d)同 聚 物 加 尾 反 应
第 二 条 cDNA 的 合 成 TTTTTT GGGGGG CCCCCC 加接头 1 TTTTTT GGGGGG AAAAAA CCCCCC 切除发夹 TTTTTT AAAAAA 加接头 2 TTTTTT AAAAAA 经酶切进行定向克隆 cDNA 克 隆
PAC(P1 人工染色体 ) BAC( 细菌人工染色体 ) MACs( 哺乳类人工染色 体)

基因组结构与功能

基因组结构与功能

基因组结构与功能基因组是指一个生物体所拥有的所有基因的总称。

基因组的结构和功能对于生物体的发育和特征具有重要的影响。

本文将探讨基因组的结构和功能以及它们之间的关系。

一、基因组的结构基因组可以分为两种类型:核基因组和线粒体基因组。

1. 核基因组核基因组是指存在于细胞核中的DNA序列的组合。

核基因组由多个染色体组成,染色体又由一个个DNA分子构成。

每个DNA分子上都含有许多基因,基因编码着生物体的遗传信息。

2. 线粒体基因组线粒体基因组是细胞线粒体中的DNA序列的组合。

线粒体是细胞中的一个细胞器,它在能量代谢过程中起着重要的作用。

线粒体基因组较小,相对简单。

二、基因组的功能基因组的功能主要体现在DNA序列上的编码和调控。

1. 基因编码基因组中的基因通过特定的DNA序列编码了生物体的遗传信息。

这些遗传信息决定了生物体的形态特征、生理功能、行为习惯等。

基因组的不同部分编码了不同的蛋白质,蛋白质是生物体构造和调控的关键分子。

2. 基因调控基因组中的DNA序列不仅仅编码了基因,还包含了一些调控元件和调控基因。

这些调控元件和基因可以起到打开或关闭基因表达的作用,控制基因的表达时机、量级和位置。

基因调控是维持生物体稳态的重要机制。

三、基因组结构与功能的关系基因组的结构和功能密切相关,相互作用。

1. 结构决定功能基因组的结构决定了其中的基因和调控元件的组织方式和排列方式。

不同的结构会影响基因和调控元件之间的相互作用,从而影响基因组的功能。

2. 功能反作用结构基因组的功能需要依赖于合适的结构来进行实现。

例如,基因组中的调控元件需要正确地定位在合适的位置和距离上,才能准确地调控基因的表达。

功能的变化也可能导致基因组结构的调整和改变。

结论:基因组的结构和功能是相互关联的,彼此影响。

了解基因组的结构和功能对于理解生物体的遗传特征和生物过程具有重要意义。

进一步的研究将揭示更多关于基因组的奥秘,为人类的健康和生命的进化提供更多的启示。

基因组结构

基因组结构
几乎没有间隔;
• 低等真核生物和开花植物的线粒体基因组较大且较松散,
大量基因具有内含子;
• 叶绿体基因组大小变化较小,且大多数具有相似的结构
37
人类线粒体基因组:人类 线粒体基因组小而紧密, 极少有浪费的空间,主要 为编码呼吸复合物基因、 编码rRNA和tRNA基因。
38
酵母线粒体基因组中基因之间有较大的空间,有的基因有内含子。 39
恶性疟原虫 莱茵衣藻 小鼠 人
高令细指海葵 黑腹果蝇 皱波角叉菜 构巢曲霉菌 异养鞭毛虫 酿酒酵母 牛肝菌 羽衣甘蓝 拟南芥 玉米 甜瓜
豌豆 地钱 水稻 烟草 莱茵衣藻
线粒体和叶绿体基因组大小
40
细胞器基因组的遗传组成
恶性疟原虫 莱茵衣藻

酿酒酵母 拟南芥 异养鞭毛虫
41
• 线粒体基因组中基因数目表现出很大的可变性;
真核生物基因组大小
13
不同真核生物基因组大小和基因数目
• C值悖论——
• C值:单倍体基因组中DNA的总量; • C值悖论:一个有机体的C值与它的编码能力缺乏相关性称
为 C值悖论;
14
人类、酵母、果蝇和玉米的基因组比较
15
• 相比于人类基因组,酵母基因组的特点:
• 酵母基因组中不连续的基因数目相对较少。
拟南芥染色体上的基因密度
8
• 人类基因组12号染色体上一个50 kb片段
9
• 4个基因。
这4个基因都是不连续的,所包含内含子的数目从SYB1的2个到PKP2的8
个不等。
• 88个全基因组范围重复序列。
(genome-wide repeat)
基因组中主要存在4种类型的基因组范围重复序列: 长散布核元件 (long interspersed nuclear element, LINE); 短散布核元件 (short interspersed nuclear element, LINE); 长末端重复元件 (long terminal repeat, LTR element); DNA转座子 (DNA transposon)

生物化学 4-基因和基因组的结构与功能

生物化学 4-基因和基因组的结构与功能
式组织在一起。1个转录单位通常含3个rDNA,以16S-23S-5S的顺序串联 排列,有的转录单位中间还插有tRNA基因,每个转录单位的长度大于 5Kb。转录后先得到rRNA前体,再剪切成16S、23S和5SrRNA
4. 结构基因中无内含子,边转录边翻译。
5. 无基因重叠结构。
6. DNA分子中有多种功能区。这些区域往往具有特殊的结构,并且含 有反向重复序列。
8、基因组中也存在一些可移动的遗传因素,这些DNA顺 序并无明显生物学功能,似乎为自己的目的而组织, 故有自私DNA之称,其移动多被RNA介导(如在哺乳 动物及人类基因组中发现的逆转座子),也有被DNA 介导的(如在果蝇及谷类中发现的DNA转座子)
单一序列 中度重复序列
高度重复序列
重复序列
将真核生物基因组的DNA进行复性动力学测 定,显示3个不同的时相。
• 一个假基因常常有多个有害的突变,可能因为作为一种活 性基因一旦停止,就再没有适当机制阻止进一步突变的聚 积。假基因数目一般较少,往往只占基因总数的一小部分。
假基因主要有两种类型
• (1)由于一种基因的加倍而失活。这种类型假基因保留原 来亲本基因的外显子及内含子组织并常与亲本基因密切联 系,如α、β球蛋白基因簇的假基因。它们可能是由于失去 起始转录信号,或外显子—内含子连接处不能剪接或翻译 不能终止。
蛋白D 蛋白E
E.coli
细菌基因组
1. 一条双链DNA ,具有类核结构。
2. 具有操纵子结构。几个功能相关的结构基因串联在一起受同一个调控区调 节。 E.coli基因组含3500个基因,有260个已查明具有操纵子结构,定位于75个 操纵子中。
3. 蛋白质基因单拷贝,rRNA基因多拷贝,这可能有利于核糖体的组装。 E.coli中rRNA基因(rDNA)具有多拷贝,而且都以转录单位的形

第4章基因组、转录组和蛋白组

第4章基因组、转录组和蛋白组

编码和非编码RNA
• 细胞的RNA含量可以分为两类
– 编码RNA
– 非编码RNA
编码和非编码RNA
– 编码RNA
• mRNA • 4% • 寿命短
– 细菌的mRNA半衰期几分钟,
– 真核细胞大部分mRNA的半衰期也只有几小时 – 转录组的成分不是固定的,可以通过快速的改变 mRNA的合成来改变
编码和非编码RNA
• 生物芯片技术:高通量的杂交技术。
• 生物芯片分类
– 根据芯片上的固定的探针不同,
• 基因芯片、蛋白质芯片、细胞芯片、组织芯片,
– 根据原理
• 元件型微阵列芯片、通道型微阵列芯片、生物传感 芯片等新型生物芯片
基因芯片(genecБайду номын сангаасip)
/degree.html
• 肿瘤组织与正常组织之间蛋白质谱差异, 找到肿瘤特异性的蛋白分子,可能会对揭 示肿瘤发生的机制有帮助,目前已应用于 肝癌、膀胱癌、前列腺癌等研究中。
• 开发新蛋白质、获得新基因
Figure 3.1. The genome, transcriptome and proteome.
• 基因组的表达不仅仅是一个遗传信息由 DNA-RNA-蛋白质的一个过程,这个法则忽 略了信息流由基因组到蛋白质组传递过程 是被调控的,这个过程每一步都是受到调 控,从而使得转录组和蛋白组的成分能够 做出迅速和准确的改变,并能使细胞调整 自己的生化状态能对外界的刺激做出反应,
– 鉴定新的基因
• 利用13bp寡核苷酸(9bp标签加上4bp有3个标签对应的克隆代表了 两个已知的基因,其中一个可能代表新的基因
(三)生物芯片技术
• 生物芯片技术是20世纪90年代生命科学领域中迅 速发展起来的一项新技术,是综合运用生物、微 电子、微加工和计算机等知识制作的高科技杰作。 其本质是固定在玻片等载体上的微型生物化学分 析系统,芯片上每平方厘米可密集排列成千上万 个生物分子,能快速准确地检测细胞、蛋白质、 DNA及其他生物组分,并获得样品的有关信息, 其效率是传统方法的成百上千倍,被美国科学促 进会评为1998年的世界十大科技突破成果之一。

第四章 人类基因组变异数据库

第四章 人类基因组变异数据库

基因组浏览器同样是检索和观察多态性的最好
工具。
人类基因组浏览器有三个;EnsemblUCSC人类
基因组浏览器(UCSC-HGB)和NCBI Map Viewer,他们都保持着对人类基因组SNP不同 水平的注解,但三者都没有保留突变的资料。
三个浏览器中大部分信息是重叠的,但它们
各自含有一部分独特的信息和资料,所以至少
GDB数据库还包括了与核酸数据库
GenBank和EMBL、遗传疾病数据库OMIM、文献 摘要数据库Medline等其他网络信息资源的超 文本链接。 GDB数据库是国际合作的成果,其宗旨是 为从事基因组研究的生物学家和医护人员提 供人类基因组信息。
第四节 观察SNP和突变的工具
一、在基因组水平上观察SNP和突变的工具 人类基因组是SNP和变异资料的最终框架,
库。 与dbSNP不同的是,HGVbase试图将所有已知
SNP概括为一组精简的记录,HGVdase是被严格筛选和 注释的。
HGVbase是一个可被广泛应用的数据库,还
提供一些对实验设计很有帮助的工具,包括
一个特定单元型的标记工具——Tag’nTell。
该工具能够找出可以特异描绘所选择单元型 所需的、根据用户说明最少的一组标记物。 HGVbase搜索界面比较简单,提供的工具 可以促进对数据库进行的BLAST搜索和关键 词查询。
第二节 突变数据库
突变数据库是根据功能定义的,并且和 疾病性质与流行以及疾病传播渠道都有密切 的联系。本节介绍几个目前能够检索和提供 更大资源的链接的中央资源,而其他集中的
数据库可以通过公共网查询。
一、人类基因变异数据库
人类基因变异数据库(HGMD)收集公开 发表引起人类遗传疾病的胚系突变信息。其 范围限定在导致明确遗传表现型的突变,体 细胞突变和线粒体突变也列入其中。 HGMD接受来自于研究者提交的资料。但 大多记录直接来自超过250种期刊中的突变 报道和有广泛链接的LSDB(链路状态数据 库 )。

基因组学_课件_4基因组测序与序列组装

基因组学_课件_4基因组测序与序列组装

• 重要区域的优先测序
– 人类疾病相关基因,功能相关的基因常常聚集 在染色体的特定区域,优先选择基因富集区测 序。
–人类主要组织相容性复合区(human major histocompatibility complex, hMHC ),与 人类免疫系统有关,6号染色体,3.6Mb,平均 每16kb 1个基因,多态性最丰富的区域,有些 座位等位基因成员超过200个
• 基因组计划的最终目标是获得所研究的生物的完 整的DNA顺序。最佳状况是将物理图谱和遗传图谱 进行有机整合,以确定基因以及其他重要的序列 在DNA顺序中的位置。
• 主要内容: • 1.DNA测序的方法 • 2.DNA序列的组装 • 3.基因组测序的其他路线 • 4.人类基因组的测序和组装

• DNA测序技术主要有两种方法,都是在20 世纪70年代中期发明的。
• 首先在整个水稻基因组上生成许多已知长度的DNA切片, 然后使它们按DNA序列的重合区域进行排列。这些切片数 量足以覆盖水稻基因组4次。接着,确定每个切片的碱基 对序列,并用计算机程序将其组装成更长的片段,然后将 这些片段排序、装配成10万多个被称为支架的更大组件。
• 设计出的软件重点是通过支架水平上的接近来进行组装, 并采取了独特的重复序列处理算法,可识别并暂时屏蔽占 水稻基因组约40%的重复序列。这样做的好处是既能减少 计算量,又最大限度降低了错误拼接的可能性。
• 根据克隆插入子两端的DNA序列查找与之连接的克 隆建立重叠群,直到覆盖整个DNA片段,甚至染色 体
• 拟南芥基因组的测序完全依据克隆重叠群,先进 行各个BAC克隆的随机测序,再进行序列组装
• 引导鸟枪法
–构建插入片段为2kb的人类基因组质粒, 每个克隆经双向测序可读500bp

04--第四章人类基因组结构概述

04--第四章人类基因组结构概述
201103 青岛农业大学
(2)中度重复序列:占20-30%,拷贝数 为104-105 , 包括组蛋白基因、免疫球蛋白 基因及RNA基因,绝大多数中度重复序列 为不编码序列,成为间隔区,如人类Alu序 列家族由300bp的短序列构成,重复达30万 -50万拷贝,占基因组3-6%。 (3)高度重复序列:又称为卫星DNA 通常是小于10bp的短小序列组成基本单 元,重复达105以上,占基因组的10%,不 能转录,组成异染色质。
201103 青岛农业大学
每个区中包含几十个rRNA基因单位,大量转 录18S rRNA、 28S rRNA、 5.8S rRNA。 假基因:是基因组中因突变而失活的基因, 它和同一家族中的活跃基因在结构上和DNA 序列上有相似性,但是没有蛋白质产物。 (在多基因家族中,有少数成员不产生有功 能的蛋白质,这样的基因叫—。假基因与正 常基因从序列上看是同源的,但是在进化过 程中发生突变丧失了功能活性。)
201103 青岛农业大学
201103
青岛农业大学
如血红蛋白基因家族。(指进化过程中由某一 个祖先基因经过多次重复和变异所产生的一大 类群序列相似、功能相似的基因群。) a、有的集中在一条染色体上共同发挥作用, 合成某些蛋白质,如组蛋白基因家族中的5种组 蛋白基因集中在7号染色体的长臂上的。 b、有的多基因家族成员是分散存在于几条染 色体上,如人的rRNA基因家族成员分别位于13、 14、15、21、22,5条染色体的短臂的核仁组织 区中。
201103 青岛农业大学
(2)部位:结构基因的两侧、结构基因 内部的内含子之中。
201103 青岛农业大学
(3)种类:很多,一小部分基因在表达,绝大 部分基因保持沉默,基因组的基因是受高度有 序而精确的四维时空表达程序严格调控,进一 步依靠那些众多的调节基因、调控序列、调控 因子组成的多层次的调控系统来协调实现的。 (4)常见的调控基因、调控序列 ①同源异形盒基因 a、1995年,美国加洲理工学院诺贝尔奖得主 B.Lewis在果蝇中发现一组同源异形基因,来自 于同一基因的转化,都含有一段同源的保守序 列,这些基因的功能是各管果蝇幼虫体节发育 的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

组织
载体 ( 选择一种)
mRNA cDNA
DNA
部分或完全 消化的 DNA
甲基化,加接头 的双链 DNA
大小分级
可供克隆的 DNA 片段 连接 DNA 片段和载体 重组载体 DNA 导入 E.coli (体外包装或转化) 基-不需要表达 高度度 mRNA 已知部分序列 有部分克隆或同源序列 已知部分多肽序列 两种组织中表达差异 cDNA 表达的功能克隆 提供突变 提供抗体 特异性的产物 定位克隆 提供结构突变 由转座子插入引起的突 变 基因在染色体上的探针筛选 a 在低严格条件下用克隆的片段或同源基因筛选 用简并性寡核eatern 杂 交,相互作用蛋白的酵母双杂交体系,酶对底物的染色体断点相连接的染色体步移(chromosome walking,)定位克隆,标记可能是增强子包载载体的转座因子
(3)酵母人工染色体(yeast artificial chromsomes, YACs) 基础:酿酒酵母中心粒、端粒和ARS 导入宿主:转化酵母原生质体 载体筛选:显性筛选标记(营养缺陷型的恢复) 重组筛选:插入片段大小 供体DNA大小:>2000kbp 主要应用:大基因组分析,YAC转基因小鼠 评论:YAC的缺点是高频率的自发缺失,和克隆 的嵌合化。重组载体的大小,需要电泳分析, 有时难以区分内源性染色体。YAC维持低拷贝。
CEN4 ARSI TRPI Amp ori TEL
EcoRI
SUP4
URA3 TEL BamHI BamHI BamHI 和 Ecoli 双酶切
DNA EcoRI 部分酶切
PFEG(pulsed field gel electrophorcsis ) 脉冲电泳 变角电场电用的方法; 在成千上万的克隆中仅极少数含目的基因,且 大多数基因的产物不具有可选择的表型特征, 因此可采用以下策略来进行筛选:
2.随机片段化: 超声波:可产生300bp的短片段。 高速搅拌:1500转/分×30分 可切 平均 长度8kb的分子群体。 3.双酶消化 单酶消化的产物一般分子较大,选择时要考 虑到载体容量,如噬菌体插入片段不超过 25kb,为此可选用识别4bp的限制酶(切割平 均长度为256bp) ,识别6bp的限制酶切割平 均长度4096 bp.
置换载体—Spi-表型(对P2感染敏感性消失)是 中心“ 填充片段”gam和red基因座丢失引起 的。 供体DNA的大小: 插入载体:0-10kbp; 置换载体:9-23kbp。 插入大小范围被有效形成噬菌斑的野生型基 因组 75-105%所限制。 交; (2)用免疫和生化方法来检测基因产物; (3)用特异性引物进行PCR扩增。
二.cD(2)有的目的mRNA的丰度极低,3)细胞中某种蛋白质的表达量常常是表明 mRNA丰度的敏感指标。
PAC(P1 人工染色体) BAC(细菌人工染色体) MACs( 哺乳类人工染色 体)
细菌噬菌体 P1 F 质粒 基于 Epstein-Barr 病 毒的游离载体
100~300kb 300kb >300kb
人类人工游离染色体(human artificial episomal chromosome,HAEC)是一类发展 中的 MACs,它来自于 Eps重 组cDNA的总和,通常是在细菌或酵母中。 这些克隆代表从某个特定物种或器官的所 有mRNA制备得到的cDNA。 cDNA分子克隆(cDNA clone) :将 cDNA片段装在载体上转化细菌,组中分离单拷贝的基因;: 如何产生足够数量的重组DNA 建库应注意: 1.保证载体DNA和靶DNA均不被外源DNA 序列污染; 2.尽可能用“ 电话克隆”。
HindIII Cos NotI Z T7 ParC SP6 NotI
CM
r
HindIII 部分酶切
ParB ParA
BAC oriS PFGL repE HindIII CIP
Pulsed-field gel electrophoresis
连接
(2) P1载体和P1人工染色体(P1 artificial chromosomes, PACs) 基础:噬菌体P1 导入宿主:体外包装和转导 载体筛选:显性选择标记 重组筛选:应用对致死标记的打断进行阳性 筛选 供体DNA大小:约100kbp 主要应用:大基因组分析 评论:重排和嵌合分子少。载体维持低拷贝, 但可以通过诱导噬菌体P1溶菌循环扩增。
TTTTTT AAAAAA
通过以下途径将 cDNA 插入载体 a. 平端克隆 b. 加接头 c. 进一体筛选:在细菌菌苔中形成噬菌斑。 重组筛选: 插入载体—通过可见标记的插入失活(cI基 因的打断阻止溶源性,产生的噬菌体更清澈; 现代的载体携带lacZ基因,以兰-白筛选)。
二. 粘粒(cosmid)载体 基础:包含λ 噬菌体cos位点的质粒; 导入宿主:经体外包装,再转染宿主细胞; 载体筛选:类似于质粒 重组筛选:可见标记插入失活和小片段插入 的阳性筛选; 供体DNA大小:30-45kbp。插入大小范围被有 效形成噬菌斑的野生型基因组 75λ 取代型λ 噬菌体载体
COS Charon 4A 机械剪切 EcoRI EcoRI 酶切 加人工接头 酶切
连接
cos
体外包装
cos
转染 E.22 5’ 3’ RT 酶 限制酶 用 NaOH 降解 mRNA 用 Klenow 酶合成第二链 3’ AAAAAAn 加锚定引物(寡聚 T) 3’ AAAAAn 5’ TTTT
ln(1 0.99 ) N ln(1 17 kb / 30 Mb)
= 8.1×105 N的含义是克隆大小99%过反转录 mRNA,并制备双链 cDNA(double strande对丰度; (2)筛选方法: 除简单的分子杂交法外还可对表达产物用各 种方法进行鉴定。
N ln(1 I / G )
N:该序列待克隆DNA片段的长度,假定为17kb; G: 基因组DNA的总长度,如人类为3×109bp
将数据代入上式
双酶切产生的DNA片段平均大小不超过1kb, 但如采用双酶部分消化,产物的分子量 可达10~30kb,它们存在着随机序重叠, 用蔗糖梯度离心或凝胶电泳可将这些片 段群体按大小分开,可得到的分子量大 小约为20kb的随机DNA片段群体。 二. DNA片断大小的分部 如已知含目的基因克隆片段的大小范围, 可在克隆前用蔗糖梯度离心或琼脂糖凝 胶电泳将DNA群体按大小分部分离。 三.目的基因克隆片段的富集。
SI 酶降解发夹结构 末端转移酶 dGTP 末端转移酶加寡聚 C CCC CCC GGG GGG 连接
转化 E.co作图中使用的高容量人工染色体克隆载体的比较。
载体 YAC(酵母人工染色体) 系统 酵母着丝粒 ,复制起始 点和端粒 克隆容量 200kb~2Mbp 评价 嵌合发生率高 ( 在基因组 中不相连的连续片段); 不稳定(自发缺失); 很难与酵母染色体分离; 稳易于 筛库时已排除了其它的RNA
(1)细菌人工染色体(bacterial artificial chromosomes, BACs, fosmids) 基础:大肠杆菌F质粒 导入宿主:电转化 载体筛选:显性选择标记重组筛选:插入片段 大小供体DNA大小:>300kbp主要应用:大基因 组分析评论:低频率的重排和嵌合分子。载体 在每个细胞中维持一个或两个拷贝,产生少量 供体DNA。
AAAAAAA mRNA (a) 随机六碱基 (b)寡聚(dT)引物 第一条 cDNA 的合成 An An NNNNNN Tn (c)发夹引物 第二条 cDNA 的合成 TTTTTT GGGGGG CCCCCC 加接头 1 TTTTTT GGGGGG AAAAAA CCCCCC 切除发夹 TTTTTT AAAAAA 加接头 2 TTTTTT AAAAAA 经酶切进行定向克隆 cDNA 克隆 (d)同聚物加尾全部基因的随酶切使其成为一定大小的片段,连 接到适当载体(常为噬菌体)上,经体外包装 转染细菌,得到一群含不同DNA片段的重组 噬菌体颗粒。此即是基因。这群DNA片 段含盖基因组全部基因。
第一节 DNA克隆片段的产生与分离
一.基因组DNA的片段化 1.用限制酶片段化:
用限制酶消化DNA,不经凝胶电泳分部离,直接和载体 连接的克隆方法叫鸟枪法(shot-gan approach) 存在的问题: ①所形成的重组体分子是一群带有大小不同插入片段 的混合群体。以每个载体可插入1~3kbDNA计算, 基因库至少含10~30万个重组质粒。从中筛出目的基 因工作量是很大的。 ②目的基因内部可能有一个以上的酶切位点,即一个 基因分载在 几个重组质粒上,完rRNA和tRNA因其丰 富和大小的一致性,可以通过分级直接分离)。 mRNA 的提取可以通过多胸腺嘧啶的柱子分离。 然后被反转录。cDNA第一链的合成用 oligo(dT) 引物,因为长的mRNA没有被完全反转录,因此 中部可加另一引物。第二链 cDNA 的合成是用 自身引物的,一个更有效的方法是在cDNA第 一链加尾(如多聚胞嘧啶 ),然后用oligo(G)为 引物起始第二链的合成。这样产生的双链 cDNA可以通过加接头或同聚尾巴插入载体。
但应注意: (1) 细胞中不同mRNA的丰度不同,低丰度的 mRNA要求很高的克隆数(要用公式来计算)。 (2)有的基因表达具有严格的时空性,要获得 其mRNA并非易事。用不同发育阶段,或DNA。不能用于基因结构和调节的研 究。一个基因经不同的剪接可产生不同的部 分重叠的cDNA克隆。
相关文档
最新文档