EST电子延伸克隆专题讨论总结
EST序列

EST序列表达序列标签(expressed sequence tags,ESTs)是指从不同组织来源的cDNA序列。
这一概念首次由Adams等于1991年提出。
近年来由此形成的技术路线被广泛应用于基因识别、绘制基因表达图谱、寻找新基因等研究领域,并且取得了显著成效。
在通过mRNA差异显示、代表性差异分析等方法获得未知基因的cDNA部分序列后,研究者都迫切希望克隆到其全长cDNA序列,以便对该基因的功能进行研究。
克隆全长cDNA序列的传统途径是采用噬斑原位杂交的方法筛选cDNA文库,或采用PCR的方法,这些方法由于工作量大、耗时、耗材等缺点已满足不了人类基因组时代迅猛发展的要求。
而随着人类基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速人类基因克隆研究,同时避免重复工作,节省开支,已成为一个急迫而富有挑战性的课题摆在我们面前,采用生物信息学方法延伸表达序列标签(ESTs)序列,获得基因部分乃至全长cDNAycg,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。
文本将就EST 技术的应用并就其在基因全长cDNA克隆上的应用作一较为详细的介绍。
1、ESTs与基因识别EST技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得即昂贵又费时。
因为基因组中只有2%的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的mRNA出发,构建各种cDNA文库,并对库中的克隆进行大规模测序。
Adams等提出的表达序列标签的概念标志着大规模cDNA测序时代的到来。
虽然ESTs序列数据对不精确,精确度最高为97%,但实践证明EST技术可大大加速新基因的发现与研究。
Medzhitov等通过果蝇黑胃TOLL蛋白进行dbEST数据库检索,该蛋白已证实在成熟果蝇抗真菌反应中发挥重要作用,通过同源分析的方法,找到相应的人类同源EST(登录号为H48602),这为接下来研究人类TOLL同源蛋白的功能提供了很好的条件。
EST的研究进展

EST的研究进展钱学磊;闫海芳;李玉花【期刊名称】《生命科学研究》【年(卷),期】2012(16)5【摘要】Expressed sequence tags (ESTs) are the 3' or 5' sequences obtained from large scale single-pass sequencing of cDNA libraries. An expressed sequence tag is usually from 150 to 500 bp nucleotides long. EST provides fast and ef-ficient tools to reveal genome information method to look for new genes, and genetic mapping, and research genes differentially expressed and comparative genomics and preparation of DNA chips provided a lot of sequence information. The development of four EST markers (EST-SSR, EST-SNP, EST-RFLP and EST-AFLP) and their application on comparative genomics, phylogeny and function studies of gene are summarized.%EST(expressed sequence tags)是指从cDNA文库中随机挑取克隆并对其3′或5 ′端进行单轮自动测序所获得的短cDNA库列,一般长度为150~500 bp.EST作为一种快捷、高效的揭示基因组信息的方法,为寻找新基因、绘制遗传图谱、研究基因差异表达和比较基因组学及DNA芯片的制备等提供了大量的序列信息.总结了EST标记开发存在的一些问题及解决方法和主要EST标记(EST-SSR、EST-SNP、EST-RFLP、EST-AFLP)的开发策略.【总页数】5页(P446-450)【作者】钱学磊;闫海芳;李玉花【作者单位】东北林业大学生命科学学院,中国黑龙江哈尔滨 150040;东北林业大学生命科学学院,中国黑龙江哈尔滨 150040;东北林业大学生命科学学院,中国黑龙江哈尔滨 150040【正文语种】中文【中图分类】Q-31【相关文献】1.大豆表达序列标签(ESTs)研究进展 [J], 崔佳欣;孟军;朱荣胜2.表达序列标签(EST)分析及藻类EST文库的研究进展 [J], 陈卓;刘杰;钱万强;孙杰;沈继红;林学政;王能飞3.Essex-Lopresti损伤的研究进展 [J], 亓玉彬;韩钦一;刘守东;左贵来;王文4.REST及其剪切变体REST4在肿瘤中的研究进展 [J], 曾柳;任欢;徐娇;唐新月;黎翠林;李智5.Sestrin 2在糖脂代谢相关疾病中的研究进展 [J], 田雪;高宇因版权原因,仅展示原文概要,查看原文内容请购买。
克隆载体构建实验报告(3篇)

第1篇一、实验目的1. 学习克隆载体的构建方法,掌握分子克隆的基本原理和操作步骤。
2. 掌握利用限制性内切酶和DNA连接酶进行DNA片段的插入和连接。
3. 熟悉重组质粒的鉴定和扩增方法。
二、实验原理克隆载体是分子生物学研究中常用的工具,它可以将目的基因插入其中,并在宿主细胞中进行扩增。
克隆载体的构建主要包括以下步骤:1. 设计引物:根据目的基因序列设计特异性引物,用于PCR扩增目的基因片段。
2. PCR扩增:利用引物扩增目的基因片段。
3. 载体线性化:利用限制性内切酶将载体线性化,使其具有末端粘性。
4. DNA片段连接:将目的基因片段与载体进行连接。
5. 转化宿主细胞:将连接后的重组质粒转化至宿主细胞。
6. 鉴定和扩增:通过PCR、酶切等方法对转化后的细胞进行鉴定和扩增。
三、实验材料1. 试剂:PCR引物、限制性内切酶、DNA连接酶、DNA分子量标准、Taq酶、pUC19载体、感受态细胞等。
2. 仪器:PCR仪、电泳仪、凝胶成像系统、移液器、DNA纯化柱等。
四、实验步骤1. 设计引物:根据目的基因序列设计特异性引物,引物长度一般为20-30个碱基,其中包含酶切位点。
2. PCR扩增:利用引物扩增目的基因片段,PCR反应体系如下:- 10×PCR缓冲液5μl- dNTPs(每种2.5μmol/L)4μl- 引物(上下游引物各1μmol/L)2μl- DNA模板1μl- Taq酶0.5μl- ddH2O补充至50μl3. 载体线性化:利用限制性内切酶将载体线性化,反应体系如下:- 载体DNA 5μl- 10×酶切缓冲液5μl- 限制性内切酶1μl- ddH2O补充至20μl4. DNA片段连接:将PCR产物与载体进行连接,反应体系如下:- 线性化载体DNA 5μl- PCR产物5μl- 10×连接缓冲液5μl- DNA连接酶1μl- ddH2O补充至20μl5. 转化宿主细胞:将连接后的重组质粒转化至感受态细胞,具体操作方法如下:- 将感受态细胞铺板于含有适当抗生素的培养基上,37℃培养过夜。
核酸序列分析

调节按钮
4. 测序中载体序列的识别与去除
许多数据库中收集了常用的测序载体序列,使用Blast程序对 此类数据库进行相似性分析即可得知目的序列中是否含有载 体序列。如果是,在对测序数据进行进一步分析之前必须将 载体序列去除。此过程虽然很简单,在核酸序列数据库中仍 然有一些序列含有载体序列污染。 NCBI的载体识别程序 /VecScreen/VecScreen.html
复杂的基因结构
外显子 外显子 启动区 5’UTR 内含子 内含子 5’ 转录位点 起始密码子 剪切受体位点 终止密码子 外显子 内含子 3’UTR终止区 3’
剪切给体位点
复杂的基因转录调控方式 内含子 GT----AC规则 CpG岛
真核生物基因组GC含量没有原核生 物差异那么明显.但在人基因5‘端 有CpG岛,大约有45,000这 样的岛,有一半和持家基因有关。
得到的结果
显示转换后的不同序列
序列基本信息 具 体 序 列
2. 限制性酶切分析
限制型酶切分析是分子生物学实验中日常工作之一。
限制酶数据库提供了较全面的限制酶相关信息
地址为:/rebase/rebase.html
大多数分子生物学软件都具有限制性酶切分析功能,
• 非翻译区域(untranslated regions, UTR) –编码区域两端的DNA,有一部分被 转录,但是不被翻译,这一部分称为 非翻译区域
• 5’UTR---基因上游区域的非翻译区域 • 3’UTR---基因下游区域的非翻译区域
• 对于任何给定的核酸序列(单链DNA 或mRNA),根据密码子的起始位置, 可以按照三种方式进行解释。 • 例如,序列ATTCGATCGCAA (1) ATTCGATCGCAA (2) ATTC GATCGCAA (3) ATTCGATCGCAA
运用基因组和EST数据库进行电子克隆分离杨树功能基因的策略

新 思 路 、 技 术 、 方 法 新 新
No e i k n v lTh n i g& Te h l g c no o y
运 用 基 因组 和 E T数 据 库 进行 电子 克 隆分 离 杨树 功 能基 因 的策 略 S
林元 震 1 张 志毅 , 2
l 0 8 0 03
林 善枝 张 谦 刘 纯鑫 郭 海
Ln a z e Z a gZ ii LnS az i Z a gQ a LuC u xn Gu a i n hn。 h n hy i h n h h n i Yu ’ n i h n i oH i
1 e a oa r r e e c n reigi oet re dO nmetl l t MOE B i gF rs yUnv rt, e ig 10 8 ; olg f yL b rt yf nt s dB edn F rsT es ra na a s K o oG i a n n a Pn , , e i oet ies y B i , 0 0 3 2C l eo j n r i j n e
B i g 10 3 ei ,008 j n Corso d g uh r ̄ agy j . uc r p n i to, n z @bf e . e n a ud a
Absr c Po a sa et e i p ra e pe i sf o e t to d vie c n e a l a rt e p pe - k n ta t plr h m o tntt e s c e orf r sa i n a r s e c , swe l s f h a rma i g r r n o a i b r o u t, t ul c e e samod lte n t e d o e ce c t hed v l p e to a t nd t m e d c s i pr wo d bea c pt da e ei hef l ft e s i n ewih t e e o m n fpl r i r n g no e e c n r c n e a . s lton a d de tfc to ft e f n to a e s fo p plr sbe o n g e me r s a h i e e td c de I o ai n i n i a i n o h u c i n lg ne m o a s i c mi r i r
电子克隆

OsG6PDH 的克隆
以小麦G6PDH蛋白( 以小麦G6PDH蛋白(BAA97662 )搜索水稻nr数据库结果 G6PDH蛋白 搜索水稻nr nr数据库结果
OsG6PDH 的克隆
上机操作1 利用基因组资料和NR 上机操作1:利用基因组资料和NR数据库 NR数据库
步骤 1:利用小麦G6PDH序列(BAA97662)检索NR数据库 利用小麦G6PDH序列(BAA97662)检索NR G6PDH序列(BAA97662)检索NR数据库
步骤4 去除序列中的数字(可以粘贴进入bioxm中 步骤4:去除序列中的数字(可以粘贴进入bioxm中,再复 制出来) 制出来)
步骤5 将复制的序列输入Softberry 步骤5:将复制的序列输入Softberry )网站的FGENESH程序进行 ()网站的FGENESH程序进行 基因结构(外显子大小和位置) 基因结构(外显子大小和位置)的预测
步骤3:利用 或者DNAssist程序进行 程序进行EST序列拼接 步骤 :利用BioXM或者 或者 程序进行 序列拼接
Os6PGDH 的克隆: 的克隆:
步骤3:利用 或者DNAssist程序进行 程序进行EST序列拼接 步骤 :利用BioXM或者 或者 程序进行 序列拼接
选择部分第2条序列的头部序列搜索第1条序列
种子氨基酸序列 tBLASTn 水稻基因组contig 水稻基因组contig或BAC/PAC contig或 人工 外显子预测 RT-PCR,克隆, RT-PCR,克隆,测序
利用基因组资料
EST拼接 拼接 计算机
利用EST资料 资料 利用
种子核苷酸序列 BLASTn 水稻EST 水稻EST数据库 EST数据库 人工 序列拼接 计算机
上机操作2 利用EST数据: 上机操作2:利用EST数据: Os6PGDH 的克隆 EST数据
利用表达序列标签电子克隆cDNA全序列的策略

利用表达序列标签电子克隆cDNA全序列的策略孙淼;赵茂林【摘要】基因组计划的进展及表达序列标签数据的迅速扩增使得电子克隆方法孕育而生,为进行基因克隆开辟了一条新的路径.介绍了表达序列标签和电子克隆的原理及过程,重点分析电子克隆过程中遇到的问题及解决方法,展望其在新基因功能研究中的作用.【期刊名称】《生物技术通报》【年(卷),期】2010(000)001【总页数】4页(P49-52)【关键词】表达序列标签;电子克隆;聚类;叠连群【作者】孙淼;赵茂林【作者单位】首都师范大学生命科学学院,北京,100048;北京市农林科学院农业生物技术研究中心,北京,100097【正文语种】中文Abstract: The progress of genome project and the rapid expansion of expressed sequence tags(ESTs),make in silico cloning brought on,which for us has opened a new path to gene cloning.In this article,an overview of EST,the principle andmethod of in silico cloningwere discussed,focusing on analysis of problems and solutions during in silico cloning process,also,it prospected the roles in the study of the new gene function.Key words: Expressed sequence tags In silico cloning Clustering Contig随着基因组计划的深入进行,很多实验室采用cDNA文库大规模测序、差异显示PCR(different display PCR,DDRT-PCR)、代表性差异分析 (representation difference analysis,RDA)及抑制性消减杂交(suppression subtractive hybridization,SSH)等技术发现了大量具有潜在应用价值的新基因片段。
【国家自然科学基金】_est数据库_基金支持热词逐年推荐_【万方软件创新助手】_20140801

53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
功能分析 信息利用 人胎肝 乙醛脱氢酶 xcl1 sam合成酶 s-腺苷蛋氨酸脱羧酶 rapd标记 patgl基因 mrna差异显示技术 mirnas microrna est标记 cons 4 3 3 3 3 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2010年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
2009年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
科研热词 推荐指数 表达序列标签 7 生物信息学 3 est-ssr 3 es频率 1 预测 1 长的基因表达序列标签 1 长牡蛎 1 铝诱导 1 野生大豆 1 重复基元 1 遗传图谱 1 通用性 1 转录组 1 豌豆蚜 1 褐飞虱 1 表达谱 1 表达序列标签-简单重复序列 1 表达 1 茄子 1 花青素 1 膜联蛋白 1 肝脏 1 结合标签的基因序列延伸 1 细胞质雄性不育 1 细胞色素p450 1 类淋巴细胞 1 盐胁迫 1 白菜 1 电子克隆 1 甜瓜属野生种 1 甘蓝 1 玉米 1 特性 1 片段长度差异等位基因特异性pcr 1 热胁迫 1 火炬松 1 油脂代谢 1 油料作物 1 正选择 1 栗属 1 标记开发 1 标签 1 查找标准 1 日本七鳃鳗 1 指纹图谱 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【EST电子延伸/克隆】专题讨论总结目的:方便后来战友的参考,积累资源。
原因:1。
最近求助较多;2。
是一种较常用的生物信息学手段。
形式:1。
可以为原创总结2。
可以为本版关于EST电子延伸讨论的总结(需要有连接)3。
以上二者结合(推荐)内容:1。
在线/离线的工具,并简单介绍优缺点。
2。
推荐优秀的工具。
3。
可能存在的问题以及解决方法的探讨。
4。
以上3点并不强求全部都有,能就一点深入即可。
5。
也可提供线索。
奖励:1。
积分奖励:根据总结的情况,奖励底线:3分,最高奖励:20分或更高,不设上线(适用于自编软件)。
2。
提供线索视情况加1-2分。
2。
战友的点击、浏览、学习、肯定、收获、回报其实才是最大的奖励衷心感谢参与讨论的诸位战友:starrweb;wxbing; tussah ;yinhp01 ;crickfrancis; hxygz ;sunxjk ;fxd ;楚布衣;ke nmed ;稀糊醋鱼;tonyybn ;yxiangmind; huazii_2003 ;Gmail ;newdragon; xiaoxiao ;ttdcs ;magicwang; tussah ;jef。
你们的参与促成了讨论的成功。
感谢magicwang;yinhp01;crickfrancis的精心总结,你们的工作使得大家的讨论更有意义。
--------imsupergene电子克隆简介新基因搜寻和蛋白质功能分析是人类基因组图谱公诸于世后的研究热点,电子克隆技术以数学为核心,以计算机和互联网为工具,利用现有的表达序列标签(EST)和生物信息数据库,可以加速对人类基因组未知功能新基因的发掘,为人类功能基因组学与蛋白质组学研究提供新的线索和基础。
利用电子克隆并结合实验验证可以纠正或避免现有的人类基因组编码序列错误。
电子克隆定义:依托现有的网络资源等,用同源性检索、聚类、序列拼装等获得部分乃至全长cDNA序列的一种方法。
其方法是以目的EST作为种子序列,对选定的dbEST进行同源性搜索,将所选高度同源的ESTs归类,作为种子序列库,进行序列拼装,构建序列重叠群,再以此重叠群为种子序列重复进行同源性搜索、聚类、拼接直至无法进行,已达到最有效延伸。
电子克隆意义:获得整个编码区或者可变剪接体,寻找全长基因并发现新基因,加速基因结构、功能研究的进程,推动比较基因组学的发展和基因的进化的研究。
(以前我以为是设计好的引物做BLAST,观察引物的好坏,哈哈)具体步骤:获得了感兴趣的并可能有潜在功能位点的EST,以此EST为种子序列采用dbEST进行同源性搜索,以期获得有片段重叠、同源性高的ESTs。
经聚类分析,尽量避免含有旁系同源基因,拼接后产生的序列重叠群,这相当于实验中的一部分cDNA步移工作。
以新获得的为种子序列重复进行上述两步骤,至不能获得延伸为止。
进行实验,PCR反应获得拼接片段,继续步移,最终获得全长cDNA序列。
将新基因对非冗余库进行搜索,以证明这是个全新基因。
将新基因注册,获取注册号。
普适性:这得取决EST数目大小,能否覆盖基因组的转炉产物。
大规模EST克隆新基因方法:大概思路可否如下:组织文库基因获取---模拟消减杂交(类似试验中的SSH)---克隆全长cDNA---电子拼接、RACE----基因全长--功能域、功能基序分析--染色体定位--功能预测---推断新基因的功能----最终可获得一到几条序列即可。
如果能从现有的EST库中寻找差别:如正常组织和肿瘤组织的EST差别。
甚至自己仅仅构建一些膜蛋白的文库,利用跨膜蛋白的保守区域克隆所有的细胞表面蛋白,分析表达差异,看看能否和理论预测达到比较好的吻合。
------yxiangmind 电子序列延伸的生物信息学策略:1.利用序列同源性比较软件将待进行电子延伸的序列的序列(以下简称种子序列)对库检索。
2.从数据库中挑选出全部相关序列。
3.对所有序列进行片段整合分析(即CONTIG分析),形成延伸后的序列。
4.将新生序列作为种子序列重复进行上述三步过程,直至新生序列不能被进一步延伸为止。
--------tussah 序列分析,电子克隆等初探生物信息学可指利用信息技术管理和分析生物学数据。
这就意味着生物信息学所涉及的范围相当广泛,从人工智能、机器人一直到基因组(genome)分析。
就基因组分析这一角度来看,生物信息学主要是指核酸和蛋白质序列数据的计算机处理和分析。
近年来,蛋白质结构数据的快速增长,使蛋白质三维结构的处理分析也归入到生物信息学的范畴。
近年来,三大国际一级生物信息数据库,即美国国家信息中心(National Center of Biot- echnology Information, NCBI)的Gen Bank /web/GenBank/index.html、欧洲分子生物学室验室(European Molecular Biology L aboratory-Euro-pean Bioinformatics Institute, EMBL-EBI)的 EM-BL (http:// /databases/index.html)和日本 DNA数据库(DNA Data Bank of Japan, DDBJ) (http:/ / www.ddbj.nig.ac.jp/ )新收录的核酸序列数据中,EST占65%以上。
随着生物信息学 (Bioinformatics)的发展,通过检索数据库进行核酸序列同源性检索,电子基因定位、电子延伸、电子克隆和电子表达以及蛋白质功能分析、基因鉴定等方面起到了重要作用,已成为人们认识生物个体生长发育、繁殖分化、遗传变异、疾病发生、衰老死亡等生命过程的有力工具。
1核酸序列的同源性检索目前,通过数据库查询、cDNA文库直接测序、mRNA差别显示 (DDRT-PCR)、代表性差示分析(RDA-PCR)和抑制差减杂交(SSH)等方法获得的EST数据越来越庞大。
GenBank数据库中收录的EST序列有数百万个之多。
由于 EST代表着一段表达基因序列,这样就可用其与公共数据库进行同源性检索,检索与其同源的核酸序列。
典型分析是采取NCBI的Blast 软件对GenBank 中的非冗余数据库(non-redundant database,nr)进行查询。
该数据库是对GenBank EMBL 和DDBJ中去除所有相同核酸序列进行整合后所得的最为全面的已知基因数据库,其中包括部分基因组序列。
联网至“/blast/blast.cgi选择数据库“Nucleotide”,利用blastn程序进行同源性检索。
”, 按照提示进行查询。
2 比较基因组分析达尔文的进化论给比较基因组学提供了理论依据。
动物进化从低等到高等,动物与动物之间存在着亲缘关系。
这种关系可以从基因序列上反映出来。
亲缘关系越近,其基因序列的同源性就越高。
可以根据已经亲缘关系较大的动物的基因序列来扩增目的基因的序列。
3 利用Unigene数据库进行电子克隆此分析需要联网至“/blast/blast.cgi选择数据库“dbEST”,利用blastn程序进行同源性检索。
一般情况下可从EST数据库中检索到一批与代分析序列高度同源的EST序列。
选择同源性比分最高的一条EST序列。
从NCBI的UniGene数据库中进行检索,得到相应的UniGene编号。
获得待分析序列的UniGene编号以后,就可以将与UniGene Cluster的所有核酸序列下载到本地,利用SequencherTM或其他的序列装配软件进行组装。
形成较长的新生序列。
4 cDNA序列的开放阅读框分析大量的实验证明,在真核生物起始蛋白质合成时,40S核糖体亚基及有关合成起始因子首先与mRNA模板靠近5`末端处结合,然后向3`末端滑行,发现AUG起始密码子时,与60S大亚基结合形成80S起始复合物。
开始转译蛋白质。
这就是Kozak提出的真核生物蛋白质合成起始的“扫描模式”。
MRNA需要翻译为蛋白质方能发挥生物学作用,因此,核酸序列的开放阅读框(open reading frame.ORF)的分析便成为核酸分析的一个重要部分。
基于遗传密码表,可通过计算机方便分析核酸序列的读码框。
联网至/orf finder,输入cDNA序列,计算机将按照六种相位翻译成蛋白质。
5基于核酸序列的电子基因定位对核酸序列进行电子基因定位(即基因的染色体定位),通过所定位区带的相邻基因或者基因簇间接提示该基因的功能,是核酸分析的一个重要方面。
进行电子定位一般有两种策略:(1)通过序列标签位点(Sequence Tagged Site,STS)进行定位;(2)通过UniGene/RH 技术进行定位。
①利用STS数据库进行电子基因定位利用此种方式进行定位时主要是利用NCBI的电子PCR资源,即登录/genome/sts/eper.cgi,输入待分析的序列即可进行查询。
②利用UniGene数据库进行电子基因定位参考前述,首现获得待分析序列所对应的UniGene编号。
而大部分UniGene序列已经具有较为明确的利用放射性杂交(radiation hybrid,RH)技术所给出的定位信息,所以,根据此结果就可以得到待分析序列的基因定位。
6 电子表达谱分析在获得待分析序列的UniGene编号以后,就可以通过参与形成UniGene Cluster 的序列的/细胞来间接地反映待分析序列在何种组织表达,体现在字段“cDNA sources”中。
7基于序列同源性分析的蛋白质功能预测相似的序列很可能具有相似的功能。
因此,蛋白质的功能预测最为可靠的方法是进行数据库相似性检索。
此方法应至少80个氨基酸长度范围内具有25%以上的序列一致才提示可能的显著意义。
目前一般方法是基于NCBI/Blast软件的蛋白质同源性分析类似于核酸序列的同源性分析,用户直接将待分析的蛋白质序列输入NCBI/Blast软件(/blast/)的序列输入框内,选择程序:Blastp”就可联网进行相应分析。
8 较长或全长的cDNA序列注册进行较长或全长cDNA序列注册时,可将其制成一个注册文件,其中可包含有多条cDNA序列。
用户需要将可能多的信息在GenBank所规范的字段中填写。
序列注册文件生成以后,可直接将其以附件方式向NCBI发送Email(gb-sub@)。
一般在3-7个工作日之内可得到回音,并获得新的GenBank序列接收号。
具体过程如下:下载Sequin 软件;安装Sequin软件;运行Sequin.exe文件。
按要求回答一系列问题,包括作者及单位、核酸序列信息、注解信息等。
最后将生成一个序列注册文件(扩展名为sqn)。
可将该文件以附件形式向NCBI发送(gb-sub@)。
一般地,核酸序列信息分析的基本思路:编码区序列(简称CDS)与EST数据比较→寻找感兴趣ESTS (标准:长度≥100bp,同源性介于50%-85%之间)→所选ESTs与GenEmble数据库比较→找出未克隆ESTs→再与dbEST、dsSTS、dbHTGs、MGD及UniGene数据库比较搜寻重叠群Contigs→设计引物进行PCR扩增或筛选cDNA文库或索取cDNA克隆号进行电子拼接获取全长cDNA→基因定位、表达、结构、功能检测分析等。