EST 表达序列标签
最新十级伤残鉴定标准[一个鼻咽癌相关EST的鉴定及其全长cDNA序列分析]
![最新十级伤残鉴定标准[一个鼻咽癌相关EST的鉴定及其全长cDNA序列分析]](https://img.taocdn.com/s3/m/096f5c75376baf1ffc4fadf4.png)
最新十级伤残鉴定标准[一个鼻咽癌相关EST的鉴定及其全长cDNA序列分析]摘要:鼻咽癌是我国南方及东南亚地区常见的恶性肿瘤之一。
通过对鼻咽癌染色体高频率杂合性丢失区域3p21的表达序列标签(expressed sequencetag,EST)进行同源性比较分析,运用逆转录聚合酶链式反应的方法,筛选到一个在41.18%(14/34)的鼻咽癌活检组织及20.0%(1/5)的鼻咽癌细胞系中表达下调的ESTBC772301;并用Northern杂交方法,检测了该EST在多种正常成人组织中的表达状况及其所代表基因的转录本大小。
在此基础上,对该EST的cDNA 克隆(1MACE:4839190)进行直接测序,获得了一个全长为2377bp的新cDNA序列;经生物信息学分析,发现它与已知基因序列无明显同源性,属于一个新基因,定位于染色体3p21.3,被命名为鼻咽癌表达下调基因(NPCEDRC,GenBank登录号:AF538150)。
其编码的蛋白质含169个氨基酸,与一个已报道的在进化上相对保守、功能的人类蛋白Nicolinl(简称NIl)N端170个氨基酸残基的序列同源性为97%,但缺少NIl蛋白C端43个氨基酸残基,可能是nicoUnl基因不同剪接本的编码产物。
关键词:鼻咽癌;表达序列标签:全长cDNA;序列分析中圈分类号:R730:A:1007-7847(xx)02―0172-06鼻咽癌(Nasopharyngeal carcinoma,NPC)是我国南方常见的一种恶性肿瘤。
目前认为:NPC具有遗传易感性背景和复杂的遗传学改变,且与EB病毒感染和环境化学致癌因素相关,其发病遵循典型的多基因一环境交互作用模式。
细胞及分子遗传学研究表明,NPC存在多个染色体部位如:3p、3q、9p、11q、12q、13q、14q和16q等非随机性的缺失或扩增,尤其是3p的缺失或称之为杂合性丢失(loss of heterozygosity,LOH)在NPC发病过程中出现最早、发生频率最高。
EST-SNP开发软件特性分析及比较

文章编号: 1000-1336(2011)06-0906-06EST-SNP 开发软件特性分析及比较李 猛1 郭大龙1 刘崇怀2 张国海11河南科技大学林学院,洛阳 4710032中国农业科学院郑州果树研究所,郑州 450009摘要:利用生物信息学软件,对表达序列标签(EST)序列进行单核苷酸多态性(SNP)开发目前已较为普遍,其方法简单实用,且软件数量较多,可分为需要测序峰图的SNP 开发软件和不需要测序峰图的SNP 开发软件。
对有测序峰图的序列进行SNP 开发,操作步骤较少且结果较为精确;对无测序峰图的序列进行SNP 开发可大批量操作且成本较低。
本文针对这两类软件进行分析比较,阐述EST-SNP 开发流程,重点分析以公共数据库中EST 序列为基础的SNP 开发过程,并对其各种使用参数加以说明,旨在为EST-SNP 开发提供参考,提高效率。
关键词:SNP ;软件分析;测序峰图;EST 序列中图分类号:Q81收稿日期:2011-04-25国家自然科学基金项目(30800742);国家葡萄产业技术体系(nycytx-30-zy-01);河南省高等学校青年骨干教师资助计划(2010GGJS- 072)资助作者简介:李猛(1987-),男,硕士生, E-mail :limengak47@ ;郭大龙(1978-),男,博士,副教授,通讯作者,E-mail :guodalong@ ;刘崇怀(1965-),男,博士,研究员,通讯作者,E-mail :liuchonghuai@ ;张国海(1962-),男,博士,教授,E-mail :zgh_ly@单核苷酸多态性(single nucleotide polymorphism, SNP)是指基因组内DNA 某一特定核苷酸位置上的转换、颠换、插入、缺失等变化。
一般情况下,我们所指的SNP 不包括碱基的插入与缺失[1]。
SNP 作为近年来出现的第三代遗传标记,目前已广泛应用于遗传连锁图谱构建[2]、多样性分析[3]、品种鉴定[4]和重要性状的基因定位[5]等相关研究中,具有密度高、遗传稳定性强、易于实现自动化分析等特点,比以简单序列重复(simple sequence repeat, SSR)为代表的第2代分子标记效率更高,更适用于高通量的检测分析。
基于est-ssr标记鉴定枇杷品种的方法

一、引言枇杷是一种常见的中药材和水果,其品种繁多,形态特征变异较大。
鉴别枇杷品种对种植、销售及科研具有重要意义。
传统的鉴定方法主要依靠形态学特征和生物学特性,但存在主管专家有限、耗时、费力、受环境和经验等因素影响的缺点。
近年来,基于现代分子生物学方法的est-ssr标记技术已经被广泛应用于枇杷品种的鉴定,具有高效、快速、准确的优势。
二、est-ssr标记技术的原理est-ssr(expressed sequence tag-derived simple sequence repeat)标记是利用EST数据(表达序列标签)进行简单重复序列的分析,并进行标记。
est-ssr标记是一种分子标记技术,利用基因组中的微卫星序列进行检测,并通过PCR扩增技术进行鉴定。
由于EST数据是从不同组织、不同生长阶段的cDNA样本中获得的,因此est-ssr 标记具有较强的系统进化、物种特异性和表达特异性。
三、est-ssr标记技术在枇杷品种鉴定中的应用1. 枇杷品种鉴定样本的准备在进行枇杷品种鉴定之前,首先需要收集不同品种的叶片或幼芽作为样本。
为了保证est-ssr标记技术的高效性和准确性,样本的选择和处理非常重要。
样本应选择来自不同地区或不同时间的品种,避免同一地区、同一种植基地或同一批次的样本。
样本的保存和处理过程中需要注意避免DNA的污染和降解。
2. est-ssr标记技术的实验步骤est-ssr标记技术主要包括DNA提取、PCR扩增、电泳分析等步骤。
首先需要从样本中提取DNA,可以采用CTAB法或商用DNA提取试剂盒进行提取。
提取的DNA需要经过质量检测,确保其完整性和纯度。
接下来是PCR扩增反应,选择合适的est-ssr引物进行扩增,PCR扩增条件需要进行优化,以获得清晰、特异的条带。
最后进行聚丙烯酰胺凝胶电泳分析,根据PCR扩增产物大小和样品条带图谱的差异,进行品种鉴定和分析。
3. est-ssr标记技术的数据分析和结果解读通过PCR扩增和电泳分析得到样品的est-ssr标记图谱,根据条带长度和数量对不同品种进行鉴别。
EST之详细介绍

Expressed Sequence Tags(ESTs)何谓Expressed Sequence Tags(ESTs)?从一特定细胞族群之mRNA转录而成的一群cDNA,经过single-pass的定序过程,而得到的一组序列。
此一细胞族群可以是特定的组织、器官,或是处于某特定发育状态或环境的细胞。
--- A set of single-pass sequenced cDNAs from an mRNA population derived from a specified cell population (e.g. a specific tissue, organ, developmental state or environmental condition).〈2〉ESTs之发展演进快速产生大量低质量的cDNA之概念在1980年代晚期被提出,此方法所能带来的利益,在当时并未能被普遍地认同。
提倡者认为这些cDNA序列能让很多新的protein-coding gene很快地被发现。
批评者则提出反驳,认为这些cDNA 序列将会遗漏掉许多原本能在genimic DNA中被找到的重要调控要素(regulatory elements)。
最后,还是由提倡cDNA定序的人赢得了胜利。
1991年时,有609个Expressed Sequence Tags(ESTs)首度被描述,而公用数据库(public databases)中ESTs的数量,更是呈现戏剧性的成长,到了1995年中,GenBank里ESTs records 的数量已超过非ESTs records的数量;2000年六月,四百六十万的ESTs records 已占了GenBank里所有序列的百分之六十二。
一开始,ESTs的来源只有人类;现在NCBI的EST database(dbEST)已包含了超过250种生物来源的ESTs,包括小鼠(mouse)、大鼠(rat)、Caenorhabditis elegans和黄果蝇(Drosophila melanogaster)等。
EST介绍

表达序列标签(expressed sequence tags,ESTs)是指从不同组织来源的cDNA序列。
这一概念首次由Adams等于1991年提出。
近年来由此形成的技术路线被广泛应用于基因识别、绘制基因表达图谱、寻找新基因等研究领域,并且取得了显著成效。
在通过mRNA差异显示、代表性差异分析等方法获得未知基因的cDNA部分序列后,研究者都迫切希望克隆到其全长cDNA序列,以便对该基因的功能进行研究。
克隆全长cDNA序列的传统途径是采用噬斑原位杂交的方法筛选cDNA文库,或采用PCR的方法,这些方法由于工作量大、耗时、耗材等缺点已满足不了人类基因组时代迅猛发展的要求。
而随着人类基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速人类基因克隆研究,同时避免重复工作,节省开支,已成为一个急迫而富有挑战性的课题摆在我们面前,采用生物信息学方法延伸表达序列标签(ESTs)序列,获得基因部分乃至全长cDNAycg,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。
文本将就EST技术的应用并就其在基因全长cDNA克隆上的应用作一较为详细的介绍。
1、ESTs与基因识别EST技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得即昂贵又费时。
因为基因组中只有2%的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的mRNA出发,构建各种cDNA文库,并对库中的克隆进行大规模测序。
Adams等提出的表达序列标签的概念标志着大规模cDNA测序时代的到来。
虽然ESTs序列数据对不精确,精确度最高为97%,但实践证明EST技术可大大加速新基因的发现与研究。
Medzhitov等通过果蝇黑胃TOLL蛋白进行dbEST数据库检索,该蛋白已证实在成熟果蝇抗真菌反应中发挥重要作用,通过同源分析的方法,找到相应的人类同源EST(登录号为H48602),这为接下来研究人类TOLL同源蛋白的功能提供了很好的条件。
生物信息分析经常使用名词说明

生物信息分析经常使用名词说明生物信息学(bioinformatics):综合运算机科学、信息技术和数学的理论和方式来研究生物信息的交叉学科。
包括生物学数据的研究、存档、显示、处置和模拟,基因遗传和物理图谱的处置,核苷酸和氨基酸序列分析,新基因的发觉和蛋白质结构的预测等。
基因组(genome):是指一个物种的单倍体的染色体数量,又称染色体组。
它包括了该物种自身的所有基因。
基因(gene):是遗传信息的物理和功能单位,包括产生一条多肽链或功能RNA所必需的全数核苷酸序列。
基因组学:(genomics)是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱)、核酸序列测定、基因定位和基因功能分析的科学。
基因组学包括结构基因组学(structural genomics)、功能基因组学(functional genomics)、比较基因组学(Comparative genomics)宏基因组学:宏基因组是基因组学一个新兴的科学研究方向。
宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。
传统的微生物研究依托于实验室培育,元基因组的兴起填补了无法在传统实验室中培育的微生物研究的空白。
蛋白质组学(proteomics):说明生物体各类生物基因组在细胞中表达的全数蛋白质的表达模式及功能模式的学科。
包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和彼此作用等。
遗传图谱:指通过遗传重组所取得的基因线性排列图。
物理图谱:是利用限制性内切酶将染色体切成片段,再依照重叠序列把片段连接称染色体,确信遗传标记之间的物理距离的图谱。
转录图谱:是利用EST作为标记所构建的分子遗传图谱。
基因文库:用重组DNA技术将某种生物细胞的总DNA 或染色体DNA的所有片断随机地连接到基因载体上,然后转移到适当的宿主细胞中,通过细胞增殖而组成各个片段的无性繁衍系(克隆),在制备的克隆数量多到能够把某种生物的全数基因都包括在内的情形下,这一组克隆的整体就被称为某种生物的基因文库。
分子标记介绍

分⼦标记介绍分⼦标记是指可遗传的并可检测的DNA序列或蛋⽩质。
即DNA⽚段即能反映⽣物个体或种群间基因组中某种差异特征的DNA ⽚段;能受基因控制并且能够稳定遗传的,能代表个体或群体的遗传特征,并可被⽤作遗传分析的物质。
它能够直接反映基因组间DNA间的差异。
常⽤的分⼦标记有RFLP、RAPD、AFLP、SSR、ISSR、EST等。
RAPD、AFLP属于以PCR为基础的分⼦标记;RFLP属于以Southern为基础的分⼦标记;SSR、ISSR属于以重复序列为基础的分⼦标记;EST以mRNA为基础的分⼦标记。
1 主要的分⼦标记介绍1.1 限制性⽚段长度多态性(RFLP)RFLP是应⽤Southern杂交技术检测DNA在限制性内切酶酶切后形成的特定DNA⽚段的⼤⼩。
所以对于引起酶切位点变异的突变如点突变或部分DNA⽚段的缺失、插⼊、倒位⽽引起酶切位点缺失或获得等均可应⽤。
此⽅法的基本步骤包括:DNA的提取、⽤限制性内切酶酶切DNA、凝胶电泳分开DNA⽚段、把DNA⽚段转移到滤膜上、利⽤放射性标记的探针显⽰特定的DNA⽚段、分析结果。
探针⼀般选择单拷贝的。
其优点为共显性标记,稳定且可重复但耗时,昂贵且需应⽤同位素。
⽤该技术可作出植物的RFLP图谱,并应⽤于植物遗传和育种研究。
杨长红等采⽤PCR-RFLP技术,对库尔勒⾹梨等19个主要梨品种的cpDNA遗传多态性进⾏研究,其利⽤10对通⽤引物对总DNA进⾏扩增,并且采⽤7种限制性内切酶对PCR产物进⾏酶切,通过软件分析得出:7对引物(cp01、cp02、cp03、cp04、cp06、cp09、cp10)能在梨属植物上扩增出1条特异性谱带,cp09/MvaI,cp03/Hin6I的酶切位点有显著差异。
根据结果分析,库尔勒⾹梨与鸭梨、砀⼭梨、苹果梨、早酥、慈梨、⾦川雪梨、锦丰、新疆句句梨的平均距离系数较⼩,与其他梨的平均距离系数较⼤。
1.2 随机扩增多态性DNA(RAPD)RAPD是以8-10个碱基的随机寡聚核苷酸序列为引物,利⽤PCR技术⾮特异性扩增DNA⽚段,然后⽤凝胶电泳分开扩增⽚段,即得到⼀系列多态性DNA⽚段.染⾊后即可进⾏多态性分析。
EST (Expressed Sequence Tag)表达序列标签

EST (Expressed Sequence Tag)表达序列标签EST (Expressed Sequence Tag)表达序列标签—是从一个随机选择的cDNA 克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。
由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST 簇(EST cluster)原理:EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。
EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
技术路线:首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo (dT) 作为引物进行RT-PCR合成cDNA,再选择合适的载体构建cDNA 文库,对各菌株加以整理,将每一个菌株的插入片段根据载体多克隆位点设计引物进行两端一次性自动化测序,这就是EST 序列的产生过程。
应用:EST作为表达基因所在区域的分子标签因编码DNA 序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR等)相比更可能穿越家系与种的限制,因此EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息是特别有用。
同样,对于一个DNA 序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的遗传作图,加速物种间相关信息的迅速转化。
具体说,EST的作用表现在:⑴用于构建基因组的遗传图谱与物理图谱;⑵作为探针用于放射性杂交; ⑶用于定位克隆;⑷借以寻找新的基因; ⑸作为分子标记;⑹用于研究生物群体多态性;⑺用于研究基因的功能;⑻有助于药物的开发、品种的改良;⑼促进基因芯片的发展等方面。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ESTs的聚类和拼接
聚类的目的就是将来自同一个基因或同一个转录本的具有重 叠部分(over-lapping)的ESTs整合至单一的簇(cluster)中。 聚类作用: 产生较长的一致性序列(consensus sequence) ,用于注释。 降低数据的冗余,纠正错误数据。 可以用于检测选择性剪切。 ESTs聚类的数据库主要有三个: UniGene (/UniGene) TIGR Gene Indices (/tdb/tgi/) STACK (http://www.sanbi.ac.za/)
◆ 基因表达系列分析(SAGE) 基因表达系列分析是一种用于定量,高通量基因表达分
析的实验方法(Velculescu et al., 1995)。SAGE的原理就是分 离每个转录本的特定位置的较短的单一的序列标签(约9-14 个碱基对),这些短的序列被连接、克隆和测序,特定的序 列标签的出现次数就反应了对应的基因的表达丰度。 ◆ DNA微阵列或基因芯片的研究 高密度寡核苷酸cDNA 芯片或cDNA微阵列是一种新的大 规模检测基因表达的技术,具有高通量分析的优点。在许多 情况下,cDNA芯片的探针来源于3'EST (Duggan et al., 1999),所以EST序列的分析有助于芯片探针的设计。
GeneMap 98’ 定位了30,000个基于基因的STS(Deloukas et al., 1998),而且基因图谱随着STS的定位正在不断的更新中。
ESTs应用3:
ESTs与基因预测
由于EST来源于cDNA,因此每一条EST均代表了 建立时所采样品特定发育时期和生理状态下
的一个基因的部分序列。使用合适的比对参数,
不严格的和严格的聚类 (loose and stringent clustering)
◆
loose clustering ● 产生的一致性序列比较长 ● 表达基因ESTs数据的覆盖率高 ● 含有同一基因不同的转录形式,如各种选择性剪接体 ● 每一类中可能包含旁系同源基因(paralogous expressed gene)的转 录本 ● 序列的保真度低
ESTs数据的不达序列;
低丰度表达基因不易获得。 由于只是一轮测序结果,出错率达2%-5%;
有时有载体序列和核外mRNA来源的cDNA污染或是基因组 DNA的污染;
◆
◆ ◆
有时出现镶嵌克隆; 序列的冗余,导致所需20世纪80年代初,当时的目22, 135–139】和制备差异表达基因的特 异探针【PNAS. 81, 2194–2198】。差异表达的基因通过检测样本cDNA(tester)和 过量的对照样本mRNA (driver)的相互杂交而得到。在检测样本cDNA (tester)和对 照样本mRNA (driver)同时表达的基因会形成mRNA/cDNA 杂交分子,而检测样本 特异表达的基因则保持单链状态。单链分子和双链分子通过羟磷灰石层析而分离, 分离得到的单链分子是检测样本特异表达的基因。差异表达,包括用生物素标记【Nucl. Acids 14, 10027–10044】 和oligo(dT)30-latex标记cDNA,以增加单双链分子的分离效率。后来,通过PCR 选择性cDNA扩增技术被应用到扣除杂交中,以克服以往扣除杂交中需要大量起始 mRNA的缺点,并可以同时提高基因克隆地效率【Nucl. Acids Res. 19, 70977104】 。 ◆ 扣除技术的进一步成熟是在1996年,Gurskaya 等(1996) 和Diatchenko 等 (1996) 同时发表了关于扣除杂交的改进方法,其主要的技术方法类似,这个技术叫 抑制性扣除杂交技术(Suppression Subtractive Hybridization,SSH) 【Anal. Biochem. 240, 90–97; PNAS. 93, 6025-6230】 。成
详见《分子克隆》p. 873
详见《分子克隆》p. 872
cDNA扣除杂交
开始 (Adams et al., 1991)。
ESTs应用1:
ESTs与基因识别
ESTs已经被广泛的应用于基因识别,因为ESTs的数目比
GenBank中其它的核苷酸序列多,研究人员更容易在EST库
中搜寻到新的基因(Boguski et al., 1994). ● 在同一物种中搜寻基因家族的新成员(paralogs)。 ● 在不同物种间搜寻功能相同的基因(orthologs)。 ● 已知基因的不同剪切模式的搜寻。【注:不过很难确 定一个新的序列是由于交替剪切产生的或是由于cDNA文 库中污染了基因组DNA序列(Wolfsberg et al., 1997)】
● 污染序列 (如核糖体RNA、细菌或其它物种的基因 组DNA等)
3. 去除其中的镶嵌克隆。
4. 最后去除长度小于100bp的序列。
镶嵌克隆的识别
► Back-to-back ► ►
poly(A)+ tails.
Linker-to-linker in middle of the sequence. Blastn/Blastx search.
1. 去除低质量的序列(Phred) 2. 应用BLAST、RepeatMasker或Crossmatch遮蔽数据组 中不属于表达的基因的赝象序列(artifactual sequences)。 ●载体序列(ftp:///repository/vector) ●重复序列(RepBase,)
◆
3 ’端
3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性 的非编码区,所以从3’端测得EST含有编码的信息较少.但研究也 表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码 区有品种的特异性,可以作为STS标记.
◆
两端测序 获得更全面的信息。
序列前处理 (pre-processing)
基本过程:分别抽提待测样本(tester)和 对照样本(driver)的mRNA,反转录成
cDNA,用RsaI或HaeIII酶切,以产生大小适当的平头末端cDNA片段,将tester cDNA分 成均等的两份,各自接上两种接头,与过量的driver cDNA变性后退火杂交,第一次杂 交后有4种产物:a是单链tester cDNA,b是自身退火的tester cDNA双链,c是tester 和 diver的异源双链,d是driver cDNA。第一次杂交的目的是实现tester单链 cDNA均一化 (normalization),即使原来有丰度差别的单链cDNA的相对含量达到基本一致,由于tester cDNA中与driver cDNA序列相似的片段大都 和driver形成异源双链分子c,使tester cDNA 中的差异表达基因的目标cDNA得到大量富集,第一次杂交后,合并两份杂交产物,再 加上新的变性driver单链,再次退火杂交,此时,只有第一次杂交后经均等化和扣除的 单链tester cDNA和driver cDNA一起形成各种双链分子,这次杂交进一步富集了差异表 达基因的cDNA,产生了一种新的双链分子e,它的两个5’端有两个不同的接头,正由于 这两上不同的接头,使其在以后的PCR中被有效地扩增。
SSH的原理与基本过程
原理:SSH的基本原理是以抑制PCR为基础的DNA扣除杂交方法。所谓抑制PCR,是
利用链内退火优于链间退火,比链间退火更稳定,从而使非目的系列片段两端反向重复 系列在退火时产生类似于“锅柄”的结构,无法与引物配对,选择性地抑制了非目的基 因片段的扩增。同时,该方法运用了杂交二级动力学原理,即丰度高的单链cDNA在退 火时产生同源杂交的速度要快于丰度低的单链cDNA,从而使原来在丰度上有差别的单 链cDNA相对含量达到基本一致。
大于90%的已经注释的基因都能在EST库中检测 到(Bailey et al., 1998)。ESTs可以做为其它基因预 测算法的补充,因为它们对预测基因的交替剪切 和3‘ 非翻译区很有效。
ESTs应用4:
ESTs与SNPs
来自不同个体的冗余的ESTs可用于发现基因组中转录区域
存在的SNPs。最近的许多研究都证明对ESTs数据的分析 可以发现基因相关的SNPs (Buetow et al., 1999;Garg et al., 1999; Marth et al., 1999; Picoult-Newberg et al., 1999) 。 应注意区别真正的SNPs和由于测序错误( ESTs为单向 测序得来,错误率可达2%)而引起的本身不存在的SNPs。 解决这一问题可以通过: ● 提高ESTs分析的准确性。 ● 对所发现的SNPs进行实验验证。
表达序列标签(EST)测定 及分析
• 什么是EST?
• EST的应用
• EST序列测定及分析过程
ESTs的来源
上世纪80年代,对cDNA序列进行大规模测序的想法
就曾提出,但对此一直存在争论,有人认为这种方
法能发现成千上万的新基因;而反对者则认为cDNA 序列缺少重要的基因调控区域的信息。90年代初 Graig Venter 提出了EST的概念,并测定了609条 人脑组织的EST,宣布了cDNA大规模测序的时代的
SSH 技 术 流 程
二、序列测定及数据分析
随机挑取克隆进行5’或3’端测序
序列前处理
聚类和拼接
基因注释及功能分类
后续分析
测序方向的选择
根据不同的实验目的选择不同的测序方向:
◆
5 ’端
5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基 因或研究基因差异表达时用5’端EST较好,大部分EST计划都是选 用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基 因序列。
ESTs应用5:
ESTs与大规模分析基因表达水平
因P 为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析 计划(Cancer Genome Anatomy Project , CGAP)构建了很多正常的或al Gene Expression Displayer (DGED) ● cDNA xProfiler