遗传图谱构建时标记的选择与表达序列标签

合集下载

一种基于表达序列标签(EST)的新型目标分子标记技术——保守区域扩增多态性(CoRAP)

一种基于表达序列标签(EST)的新型目标分子标记技术——保守区域扩增多态性(CoRAP)

Bo cnlg a o tr, a nn 3 0 7 C ia 4C l g f rpSi c , uinA r ut eadF rs i eh o yLb r o N nig50 0 , h ; oeeo o c n e Fj g cl r n oet t o a y n l C e a i u y r
t r e e o e u a a k r t c n q e b s d o x r se a g t d m lc l r m r e e h i u a e n e p e s d
s q n et g e ue c s a
X O G F — in, 3 A G R n — u , HU N i in J N ig, I N a qa T N o g h a, Z A G We- a , I G J 2 j A n
50 0 ;3广西作物遗传改良生物 30 7
3 00 ) 5 02
( 1福建农林大学生命科学学院, 福州 3 00 ;2广西农 业科 学院经济作物研 究所 , 南宁 50 2
技 术 重点 开 放 实验 室 , 南 宁
5 00 3 07;4福 建 农 林 大 学作 物 科 学 学 院 , 福 州
摘要 : o A 子标记技术是一种基于表达序列标签的 目标分子标记新技术 , CR 吩 具有操作简单 、 重复性 高和特异性 强等优点 。该分子标记的原理是 : 根据表达序列标签来设计 1 固定引物 , 个 根据大多数内含子 内部的一段保守序列设 计另1 随机引物 , 个 在退火温度为5 的常规3 2c 步法P R C 程序下 , 扩增产生偏 向表达序列标签附近区域的显性或共显性
中图分 类 号 : 5 3 Q 0 文 献标 识 码 : A 文章 编 号 :0— 112 1 )2 00 一 4

植物生理学名词解释

植物生理学名词解释

名词解释:林木遗传育种:指在遗传学理论的指导下,根据林木的特性及其遗传变异规律,进而研究如何有效地控制和利用这种遗传和变异,为人类的需要服务。

基因:是含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。

等位基因:在同源染色体上占据同座位的基因称为等位基因。

突变子:它是性状突变时,产生突变的最小单位。

即一个基因内部能造成可遗传的表型变化的最小的结构单位。

重组子:在发生性状的重组时,可交换的最小单位。

一个交换子只包含一对核苷酸。

连锁不平衡:指在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象。

周期蛋白:指是一类呈细胞周期特异性或时相性表达、累积与分解的蛋白质,它与周期素依赖性激酶共同影响细胞周期的运行。

转座子:是一类在细菌的染色体,质粒或噬菌体之间自行移动的遗传成分,是基因组中一段特异的具有转位特性的独立的DNA序列。

转座(因)子是基因组中一段可移动的DNA序列,可以通过切割、重新整合等一系列过程从基因组的一个位置“跳跃”到另一个位置。

非编码RNA:指的是不被翻译成蛋白质的RNA,如tRNA, rRNA等,这些RNA不被翻译成蛋白质,但是参与蛋白质翻译过程。

RNAi:(RNA interference) 即RNA干涉,是近年来发现的在生物体内普遍存在的一种古老的生物学现象,是由双链RNA(dsRNA)介导的、由特定酶参与的特异性基因沉默现象,它在转录水平、转录后水平和翻译水平上阻断基因的表达。

染色体:是细胞内具有遗传性质的物体,易被碱性染料染成深色,所以叫染色体(染色质);其本质是脱氧核甘酸,是细胞核内由核蛋白组成、能用碱性染料染色、有结构的线状体,是遗传物质基因的载体。

染色质:是染色体在细胞分裂的间期所表现的形态,呈纤细的丝状结构,由核内的DNA与组蛋白、RNA、非组蛋白蛋白质等结合形成。

广义遗传力:基因型方差与表现型方差之比。

狭义遗传力:加性效应方差与表现型方差之比。

作物育种学总论第十四章分子标记辅助选择育种

作物育种学总论第十四章分子标记辅助选择育种

PCR-based markers
PCR: polymerase chain reaction(多聚酶链式反应)
amplification of tracts of DNA defined by border sequences that hybridize to selected DNA polymerase primers
How to use a genetic marker for marker-assisted selection
Weaver Carrier Sire
M1
M2
W
+
M1
M3 M2
M3
W
++
+
W=Weaver +=Normal
目标基因的标记筛选(gene tagging)是 进行分子标记辅助选择(MAS)育种的基 础。用于MAS育种的分子标记须具备三个 条件:
生化标记
主要包括同工酶和等位酶标记。同工酶是:指结构 不同、功能相似的酶,也即具有同一底物专一性的 不同分子形式的酶。属于一个以上基因座位编码的 酶的不同形式;而等位酶是指由一个基因座位的不 同等位基因编码的酶的不同分子形式。分析方法是 从植物组织的蛋白粗提物中通过电泳和组织化学染 色法将酶的多种形式转变成肉眼可辩的酶谱带型。
供体
M
R
受体
m
r
M
m
R
r
RR Rr rr
(1-r)2 2r(1-r) r2
目标基因与DNA标记间的遗传距离位p
亲本中DNA标记的带型
M—抗性标记 R—抗性基因 m—感病标记 r—感病基因
F1杂种中DNA标记的带型
在F2分离群体中分子标记类型 即MM,Mm,mm

分子标记与遗传图谱

分子标记与遗传图谱

分子标记与遗传图谱AFLP的原理是基于PCR技术扩增基因组DNA限制性片段,基因组DNA先用限制性内切酶切割,然后将双链接头连接到DNA片段的末端,接头序列和相邻的限制性位点序列作为引物结合位点。

限制性片段用二种酶切割产生,一种是罕见切割酶,一种是常用切割酶。

选择特定的片段进行PCR扩增,由于在所有的限制性片段两端加上带有特定序列的“接头”,用与接头互补的但3’端有几个随机选择的核苷酸的引物进行特异PCR扩增,只有那些与3’端严格配对的片段才能得到扩增。

再在有高分辨力的测序胶上分开这些扩增产物,用放射性法、荧光法或银染染色法均可检测之。

该技术包括三个步骤: DNA被限制性内切酶切割,然后与AFLP聚核苷酸接头 adapter 连接;利用PCR方法,通过变性、退火、延伸循环,选择性扩增成套的限制性片段,经过多次循环,可使目的序列扩增到0.5~1μg;利用聚丙烯酰胺凝胶电泳分离扩增的DNA片段。

利用一套特别的引物在不需要知道DNA序列的情况下,可在一次单个反应中检测到大量的片段。

由于AFLP扩增可使某一品种出现特定的DNA 谱带,而在另一品种中可能无此谱带产生;这种通过引物诱导及DNA扩增后得到的DNA多态性可作为一种分子标记;所以说AFLP技术是一种新的而且有很大功能的DNA指纹技术。

简单序列长度多态性 Simple Sequence Length Polymorphisms,SSLP 限制性片断长度或PCR产物长度因为小卫星或微卫星随机重复数量的变化形成的差异。

SSLP具有多等位性,有两种SSLP常用于作图:小卫星序列:又称可变串联重复,其重复单位为数十个核苷酸。

微卫星序列:或简单重复序列,其重复单位为1-6个核苷酸,由10-50个重复单位串联组成。

微卫星序列的应用比小卫星序列的应用普遍的多,原因有二:小卫星序列大多集中在染色体的端部;而微卫星序列在整个基因组中分布广密度高;微卫星序列PCR分析:PCR扩增的DNA长度少于300bp时,反应既快速又精确。

EST介绍

EST介绍

表达序列标签(expressed sequence tags,ESTs)是指从不同组织来源的cDNA序列。

这一概念首次由Adams等于1991年提出。

近年来由此形成的技术路线被广泛应用于基因识别、绘制基因表达图谱、寻找新基因等研究领域,并且取得了显著成效。

在通过mRNA差异显示、代表性差异分析等方法获得未知基因的cDNA部分序列后,研究者都迫切希望克隆到其全长cDNA序列,以便对该基因的功能进行研究。

克隆全长cDNA序列的传统途径是采用噬斑原位杂交的方法筛选cDNA文库,或采用PCR的方法,这些方法由于工作量大、耗时、耗材等缺点已满足不了人类基因组时代迅猛发展的要求。

而随着人类基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速人类基因克隆研究,同时避免重复工作,节省开支,已成为一个急迫而富有挑战性的课题摆在我们面前,采用生物信息学方法延伸表达序列标签(ESTs)序列,获得基因部分乃至全长cDNAycg,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。

文本将就EST技术的应用并就其在基因全长cDNA克隆上的应用作一较为详细的介绍。

1、ESTs与基因识别EST技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得即昂贵又费时。

因为基因组中只有2%的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的mRNA出发,构建各种cDNA文库,并对库中的克隆进行大规模测序。

Adams等提出的表达序列标签的概念标志着大规模cDNA测序时代的到来。

虽然ESTs序列数据对不精确,精确度最高为97%,但实践证明EST技术可大大加速新基因的发现与研究。

Medzhitov等通过果蝇黑胃TOLL蛋白进行dbEST数据库检索,该蛋白已证实在成熟果蝇抗真菌反应中发挥重要作用,通过同源分析的方法,找到相应的人类同源EST(登录号为H48602),这为接下来研究人类TOLL同源蛋白的功能提供了很好的条件。

分子标记介绍

分子标记介绍

分⼦标记介绍分⼦标记是指可遗传的并可检测的DNA序列或蛋⽩质。

即DNA⽚段即能反映⽣物个体或种群间基因组中某种差异特征的DNA ⽚段;能受基因控制并且能够稳定遗传的,能代表个体或群体的遗传特征,并可被⽤作遗传分析的物质。

它能够直接反映基因组间DNA间的差异。

常⽤的分⼦标记有RFLP、RAPD、AFLP、SSR、ISSR、EST等。

RAPD、AFLP属于以PCR为基础的分⼦标记;RFLP属于以Southern为基础的分⼦标记;SSR、ISSR属于以重复序列为基础的分⼦标记;EST以mRNA为基础的分⼦标记。

1 主要的分⼦标记介绍1.1 限制性⽚段长度多态性(RFLP)RFLP是应⽤Southern杂交技术检测DNA在限制性内切酶酶切后形成的特定DNA⽚段的⼤⼩。

所以对于引起酶切位点变异的突变如点突变或部分DNA⽚段的缺失、插⼊、倒位⽽引起酶切位点缺失或获得等均可应⽤。

此⽅法的基本步骤包括:DNA的提取、⽤限制性内切酶酶切DNA、凝胶电泳分开DNA⽚段、把DNA⽚段转移到滤膜上、利⽤放射性标记的探针显⽰特定的DNA⽚段、分析结果。

探针⼀般选择单拷贝的。

其优点为共显性标记,稳定且可重复但耗时,昂贵且需应⽤同位素。

⽤该技术可作出植物的RFLP图谱,并应⽤于植物遗传和育种研究。

杨长红等采⽤PCR-RFLP技术,对库尔勒⾹梨等19个主要梨品种的cpDNA遗传多态性进⾏研究,其利⽤10对通⽤引物对总DNA进⾏扩增,并且采⽤7种限制性内切酶对PCR产物进⾏酶切,通过软件分析得出:7对引物(cp01、cp02、cp03、cp04、cp06、cp09、cp10)能在梨属植物上扩增出1条特异性谱带,cp09/MvaI,cp03/Hin6I的酶切位点有显著差异。

根据结果分析,库尔勒⾹梨与鸭梨、砀⼭梨、苹果梨、早酥、慈梨、⾦川雪梨、锦丰、新疆句句梨的平均距离系数较⼩,与其他梨的平均距离系数较⼤。

1.2 随机扩增多态性DNA(RAPD)RAPD是以8-10个碱基的随机寡聚核苷酸序列为引物,利⽤PCR技术⾮特异性扩增DNA⽚段,然后⽤凝胶电泳分开扩增⽚段,即得到⼀系列多态性DNA⽚段.染⾊后即可进⾏多态性分析。

EST (Expressed Sequence Tag)表达序列标签

EST (Expressed Sequence Tag)表达序列标签

EST (Expressed Sequence Tag)表达序列标签EST (Expressed Sequence Tag)表达序列标签—是从一个随机选择的cDNA 克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。

由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST 簇(EST cluster)原理:EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。

EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。

技术路线:首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo (dT) 作为引物进行RT-PCR合成cDNA,再选择合适的载体构建cDNA 文库,对各菌株加以整理,将每一个菌株的插入片段根据载体多克隆位点设计引物进行两端一次性自动化测序,这就是EST 序列的产生过程。

应用:EST作为表达基因所在区域的分子标签因编码DNA 序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR等)相比更可能穿越家系与种的限制,因此EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息是特别有用。

同样,对于一个DNA 序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的遗传作图,加速物种间相关信息的迅速转化。

具体说,EST的作用表现在:⑴用于构建基因组的遗传图谱与物理图谱;⑵作为探针用于放射性杂交; ⑶用于定位克隆;⑷借以寻找新的基因; ⑸作为分子标记;⑹用于研究生物群体多态性;⑺用于研究基因的功能;⑻有助于药物的开发、品种的改良;⑼促进基因芯片的发展等方面。

基因组学考试资料 整理版

基因组学考试资料 整理版

基因组学考试资料整理版第一章一、基因组1、基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。

2、基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。

基因组学包括3个不同的亚领域结构基因组学(structural genomics) :以全基因组测序为目标功能基因组学(functional genomics):以基因功能鉴定为目标比较基因组学(xxparative genomics)二、基因组序列复杂性1、C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。

每个细胞中以皮克(pg,10-12g)水平表示。

C 值悖理:指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。

3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。

基因内基因:一个基因的内含子中包含其他基因。

反义基因: 与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。

4、假基因:功能基因但已失去活性或者改变原来活性功能的DNA序列. 四、基因组特征比较真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组范围内分布大量重复顺序;含有大量数目不等的线性DNA分子,并且,每个长链DNA都与蛋白质组成染色体结构;含有细胞器基因组原核生物基因组的特征 :原核生物基因数目比真核生物少,大小在5 Mb以下; 原核生物基因组结构更紧凑;第二章一、为何要绘制遗传图与物理图?1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。

2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图。

3)遗传图和物理图各有优缺点,必须相互整合校正。

二、基因组测序方法、原理及特点:1. 克隆重叠群法:先构建遗传图,再利用几套高度覆盖的大片段基因组文库获得精细的物理图,选择合适的BAC 或PAC克隆测序,利用计算机拼装。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

农业生物技术学报Journal of Agricultural Biotechnology 2005,13(1):114~118*基金项目:国家基础研究重点发展规划(973)项目(No.G2*******)和国家高技术研究与发展计划(863)项目(No.2002AA211042)资助。

赵志辉:男,1965出生,中国农业大学农业生物技术国家重点实验室博士后。

**通讯作者。

Author for correspondence.Email:<ninglbau@>.收稿日期:2004-02-16接受日期:2004-03-08·综述·遗传图谱构建时标记的选择与表达序列标签*赵志辉李宁**(中国农业大学农业生物技术国家重点实验室,北京100094)摘要:表达序列标签(EST )是一种快速有效揭示基因组容量的方法。

ESTs 在新基因的发现、基因作图和基因组序列编码区域的确定等方面起到重要作用。

综述了遗传图谱构建时标记选择及EST 的应用。

关键词:表达序列标签;标记;遗传图谱Marker Selection on Genetic Map Construction and Its Expressed Sequence TagsZHAO Zhi-Hui LI Ning**()The expressed sequence tags (ESTs)have been described as a rapid and efficient method to reveal the informationcontent of genomes and have successfully applicated to discover new genes,finish genetic map and identify the coding regions in genomic sequences.This article reviews the marker selection on map construction and the ESTapplication.expressed sequence tags(ESTs);marker;genetic map自1991年表达序列标签(EST )战略实施以来,有关EST 研究方向主要集中在物理图谱的构建、新基因的发现和特异组织的表达图谱研究(Wilcox .,1991;Hudsom .,1995;Khan .,1997;Durkin .,1992;Adams .,1991)。

随着EST 研究的不断深入,EST 在不同领域的应用也日趋广泛。

目前EST 技术已经广泛地应用于比较基因组学、功能基因组学和疾病基因组学等研究领域,并且已经成为基因组学与后基因组学的桥梁和工具(O'Brien .,1993;Hieter .,Boguski .,1997;Mao .,1998)。

遗传图谱(genetic map )又称连锁图谱(linkage map )或遗传连锁图谱(genetic linkage map ),是指人类基因组内基因以及专一的多态性DNA 标记相对位置的图谱,其研究经过了经典基因连锁图谱到现代DNA 标记连锁图谱的过程。

经典遗传图谱主要是研究多态性基因的相互关系、这些基因所构成的连锁群(linkage group )以及连锁群中各多态性基因的线性关系。

经典遗传图谱不能告诉人们某个基因的具体位置,而只能以标记与性状的连锁关系来推测。

1遗传图谱构建的传统标记类型构建遗传图谱的DNA 标记主要经过了以下几个演变过程:第1代标记:是指一类经典的遗传标记。

最初主要是利用蛋白质或免疫学多态性位点作为标记来研究这些标记位点与所研究性状之间的相关关系,从而建立标记系统与性状之间的连锁关系,如ABO 血型位点标记、HLA 位点标记等。

但由于已知多态性蛋白位点很少,等位基因的数目有限,无法获得足够的信息量,准确性差和检测技术的繁琐等因素,限制了人类基因组的遗传分析工作,这也促使人们设法从DNA 上寻找可靠的标记系统。

20世纪70年代中后期建立起来的限制性片段长度多态性(RFLP )是第一种DNA 标记,通常也把这种标记方法归为第一代标记(Gusella .,1987)。

RFLP 主要研究对象是各种形式序列水平的DNA 限第1期赵志辉等:遗传图谱构建时标记的选择与表达序列标签制性酶切多态性,包括单碱基改变、插入/缺失突变、长度重复多态等所引起的酶切位点的获得或丢失。

检测手段主要为酶切和Southern杂交。

与蛋白及免疫等标记位点相同,RFLP主要是通过凝胶电泳和Southern杂交所获得的酶切片段长度多态性与表型性状之间进行连锁分析,来获得多态性与性状之间的相关关系。

这类标记在整个基因组中位点数目可达105个以上。

该系统一经建立就被应用于基因组研究中。

这一方法的研究的确使人类遗传学的研究进入分子水平成为可能。

而且由于这一策略的推动,引导人们定位克隆了近100个重要的孟德尔方式遗传疾病(/OMI M/)。

第2代标记1985年英国Leicester大学的Jeffreys及其同事在人的肌球蛋白基因中发现了一些短的简单重复单位,称之为小卫星中心(minisatellite core)。

随后的许多研究逐渐证明(Jeffrey.,1985),在人类基因组中分布有大量的此类长度的多态性标记,它们可能以正向或反向串联成簇,并分布于基因组的各个部位。

随后其它标记系统如数目可变的串联重复(variable number of tandem repeats,VNTR)、短串联重复(short tandem repeats,STR,short sequence length polymorphism,SSLP)、扩增片段长度多态性(amplified fragment length polymorphism,AFLP)等也相继建立(Waye and Fourney,1990;Vos.,1995;Cho.,1996; Grasemann.,1999)。

这些微卫星位点在基因组内不但含量丰富,其多态性较好,且符合孟德尔遗传规律,因而可以为连锁分析提供足够多的遗传信息。

加之由于PCR等实验技术的应用,大大降低了检测成本并提高了检测过程的自动化程度。

目前,高密度的微卫星遗传图谱已经构建完毕,并可以供研究者自由使用。

这一策略的发展大大加快了孟德尔方式遗传病的基因定位和克隆工作的速度,并在一定程度上推动了许多复杂的多基因遗传病的研究。

在目前的基因定位研究中,这一系统是应用最广的标记系统,也是大规模基因组扫描(gene scanning)的基础。

其缺点主要是:对位点的分型需要凝胶电泳,从而使之较难达到完全的自动化,但各种荧光标记测序仪的使用使得这种状况得到了改善。

第3代标记随着基因组研究的发展,1996年美国麻省理工学院的人类基因组研究中心负责人Lander提出了一类新的标记方法-单核苷酸多态性(single nucleotide polymorphism,SNP)(Garg.,1999)。

人类群体有很大的遗传多样性,而在大多数基因位点上都会有若干等位基因(alleles);对每一个核苷酸来说,其突变率大约为10-9左右,这就意味着每一个核苷酸在任何一代人群中大约每1伊109个个体就会发生一次变异。

由这种方式产生的单碱基变异就形成许多双等位型标记(biallelic marker),这种标记在人类基因组中可达到300万个,平均约每1000个碱基对就会有1个。

因此,3~4个相邻的这种标记构成的单倍型(haplotype)就可以有8~16种,相当于1个微卫星标记所形成的多态性。

但是由于这种标记数目多,覆盖密度大,且目前各种新技术的开发和检测手段的进步可以允许人们迅速地检测大数量的SNP来弥补起多态性的不足,因而在基因定位的研究中就有着其它标记系统不可比拟的优越性和潜力。

这种标记的开发和应用摈弃了遗传标记分析技术的“瓶颈”凝胶电泳,为DNA芯片技术应用于遗传作图提供了基础。

综上所述,作为遗传连锁图谱的DNA标记至少应具备以下几个条件:(1)任何一种构建遗传图谱时所使用的标记,一个重要的属性就是多态性的存在。

遗传连锁图谱主要是用来确定基因在染色体上的线性排列方式。

基因之间在染色体上的遗传距离是以交换值来衡量的(cetiMorgan)。

(2)信息量大,基因组内密度大。

(3)遗传共显性,即可以在群体中区分3种基因型。

(4)成本低,操作简便,适合作大规模的基因型分析,特别适合于自动化分析。

2EST的概念及在遗传图谱构建时的应用EST作为遗传标记应用与连锁分析是近年来刚刚发展起来的一项新的标记方法。

EST是从已构建好的cDNA文库中随机取出一个克隆,从5'末端或3'末端对所插入的cDNA片段进行一轮(single pass,single run)单向自动测序,所获得的约60~500 bp的一段cDNA序列就称为1个EST。

由于EST 是短的核苷酸序列,而且根据构建文库时所采用引物的差异,所测定的序列可以是cDNA的各个区段,包括5'末端和3'末端、5'上游非翻译区(UTR)和3'UTR,也可以是cDNA的任何内部序列。

由于所测定的cDNA来源于mRNA,因此每一个EST均代表了文库构建原组织的基因组DNA中一个表达基因的部分转录片段。

EST的长度直接决定了信息含量的大小。

Adams(1995)认为,片段长度在150bp以上的EST115农业生物技术学报2005年序列所含的信息量最高,而且非常适合于同源产物的寻找和遗传图谱的构建。

遗传标记方法的最终目的是将基因定位于并将之按一定顺序线性排列于染色体上。

EST是来源于cDNA的表达序列片段,其本身即是表达序列,作为遗传标记,EST比其它标记更能代表表达序列在染色体上的存在。

而且由于EST的测定是基于cDNA 的5'或3'端序列,尤其是3'端的序列,其选择压力比编码区要小,因此存在着同一基因的3'端序列在不同物种或不同品种之间的不同类型的多态性分布,而且由于多拷贝基因的存在,可以通过FISH及其它方法将这些EST片段或部分cDNA序列定位于染色体的某一区段,并应用于遗传图谱的构建。

利用来源于cDNA片段的EST作为遗传标记,可以真实并直接的反映基因在染色体上的位置,因此有着其它标记方法无法比拟的优越性。

在人类基因组中存在着约35000个基因(Vos.,1995),而由其产生的EST更是成千上万,因此用EST作为遗传标记所含有的信息量大,在基因组内存在的密度也很大。

相关文档
最新文档