如何找基因全序
如何查找基因的序列(全)

如何查找基因序列?(转载)(2010-08-01 11:47:41)如何查找基因序列?——在Genbank中寻找目的基因的实例——献给受类似问题困扰的广大酷友,以及给我动力和信心发表原创帖的基因酷的朋友们。
酷友感言:网络的世界很精彩,网络的查询很无奈。
为了我们的科学研究事业,为了我们能够顺利毕业,我们的广大酷友们在网络的海洋里遨游…遨游…咋就找不到彼岸呢?今天要设计这个基因的PCR引物,明天又要查那个基因的信息,那么大一张网,唉想起来就郁闷……鉴此,我们推出了利用Genbank查找基因序列的帖子,希望对大家有所帮助,并请大家多多指教!当然,如果您已经是此中高手,那就权当我是班门弄斧了,呵呵。
1. 根据文献搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”,就可以找到他了。
举例说明,例如:在2003年JBC的文章(Conditional Knock-out ofIntegrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。
在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy 了)这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。
一步一步教你使用NCBI查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。
现在我就结合我自己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。
希望大家都能发表自己的使用心得,让我们共同进步!我分以下几个部分说一下 NCBI 的使用:Part one 如何查找基因序列、mRNA、PromoterPart two 如何查找连续的 mRNA、cDNA、蛋白序列Part three 运用 STS 查找已经公布的引物序列Part four 如何运用 BLAST 进行序列比对、检验引物特异性特别感本版版主,将这个帖子置顶!从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我投票却暂时不能投票的)各位战友表示真诚的感,各位战友!请大家对以下我发表的容提出自己的意见。
关于NCBI 其他方面的使用也请水平较高的战友给予补充First of all,还是让我们从查找基因序列开始。
第一部分利用Map viewer 查找基因序列、mRNA 序列、启动子(Promoter)下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤1.打开Map viewer 页面,网址为:/mapview/index.html在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。
操作完毕如图所示:2.点击“GO”出现如下页面:3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图:说明一下:1、染色体的红色区域即为你的目的基因所处位置。
2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。
设计引物原则以及如何查找基因序列

引物设计原则:1.找出这种细胞物种的PTN全长核苷酸序列2.采用primer premier 5.0软件设计引物设计应注意如下要点:● 1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应[2]。
● 2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。
引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加[2]。
● 3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。
不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A[3][4]。
另外,引物二聚体或发夹结构也可能导致PCR 反应失败。
5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。
● 4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。
上下游引物的GC含量不能相差太大[2][5]。
● 5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。
Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method) [6][7]。
● 6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。
应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG值相对较高的引物。
引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应[6]。
●7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行[8]。
●8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。
查找细胞系中基因序列的方法

查找细胞系中基因序列的方法文章标题:探索细胞系中基因序列的方法与挑战在当今科技发展迅猛的时代,生物学领域的研究也日新月异。
细胞系中基因序列的研究,对于理解生物学、疾病机制以及药物研发都具有重要意义。
然而,要想深入了解细胞系中基因序列,需要探索多种方法和技术,并面对众多挑战。
为了更好地了解细胞系中基因序列的方法和挑战,我们首先需要明确细胞系的概念。
细胞系是指源自同一个母细胞的一系列细胞,它们可以长时间稳定地传代培养,具有相似的形态、遗传特性和生物学行为。
在细胞系的研究中,寻找并验证基因序列是至关重要的一环。
一、细胞系中基因序列的方法1.1 PCR技术PCR(聚合酶链式反应)技术是目前应用最为广泛的一种方法,通过PCR 技术可以扩增和纯化细胞系中单个基因的DNA序列,为后续研究提供了重要的物质基础。
1.2 基因组测序技术随着高通量测序技术的发展,基因组测序技术也逐渐成熟。
研究者可以利用基因组测序技术,对整个细胞系的基因序列进行全面的测序和分析,从而获得更多的信息。
1.3 分子克隆技术分子克隆技术是一种常用的方法,可以将感兴趣的基因序列从细胞系中克隆出来,用于进一步的功能研究和表达。
以上这些方法,都可以帮助研究者在细胞系中寻找和验证基因序列,提供了丰富的实验手段。
二、细胞系中基因序列研究的挑战2.1 样本来源的复杂性细胞系来源的多样性和复杂性,是研究的首要挑战。
不同类型的细胞系可能存在着巨大的遗传变异,这需要研究者在样本来源的选择上格外谨慎。
2.2 基因重组的干扰在细胞系中进行基因序列研究时,可能会遇到基因重组等干扰因素,这些干扰会影响研究结果的准确性。
2.3 数据分析的复杂性对于大规模的基因组测序数据,数据分析将面临复杂多变的挑战。
研究者需要具备深厚的数据处理和分析能力,才能从海量数据中提取有效信息。
三、结语在细胞系中寻找和验证基因序列,需要综合运用多种方法和技术,并面对众多挑战。
对于研究者来说,需要不断更新知识、拓展视野,以更好地应对细胞系基因序列研究中的各种挑战。
一步一步教你使用NCBI查找DNA、mRNA、cDNA

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、...最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。
现在我就结合我自己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。
希望大家都能发表自己的使用心得,让我们共同进步!我分以下几个部分说一下 NCBI 的使用:Part one 如何查找基因序列、mRNA、PromoterPart two 如何查找连续的 mRNA、cDNA、蛋白序列Part three 运用 STS 查找已经公布的引物序列Part four 如何运用 BLAST 进行序列比对、检验引物特异性特别感谢本版版主,将这个帖子置顶!从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友!请大家对以下我发表的容提出自己的意见。
关于NCBI 其他方面的使用也请水平较高的战友给予补充First of all,还是让我们从查找基因序列开始。
第一部分利用Map viewer 查找基因序列、mRNA 序列、启动子(Promoter)下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤1.打开Map viewer 页面,网址为:/mapview/index.html在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。
操作完毕如图所示:2.点击“GO”出现如下页面:3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene前面的小方框里打勾,然后点击Filter. 出现下图:说明一下:1、染色体的红色区域即为你的目的基因所处位置。
2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。
尽管你分别点击后,序列代码、序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。
应用NCBI的Map viewer查找基因序列

应用NCBI的Map viewer查找基因序列、mRNA序列、启动时间:2011-06-08 22:23来源:生物吧作者:刘浩点击: 796 次一步一步教你使用NCBI查找DNA、mRNA 、cDNA、Protein、引物设计、BLAST 序列比对等(作者:urbest) 关键词: NCBI 使用方法引物设计序列比对总共分为四个部分介绍一下NCBI的使用:Part one一步一步教你使用NCBI查找DNA、mRNA、cDNA、Protein、引物设计、BLAST序列比对等(作者:urbest)关键词: NCBI 使用方法引物设计序列比对总共分为四个部分介绍一下NCBI的使用:Part one 如何查找基因序列/mRNA/PromoterPart two 如何查找连续mRNA/cDNA/蛋白序列Part three 运用STS查找已经公布的引物序列Part four 如何运用BLAST进行序列比对、检验引物特异性Part one: 利用Map viewer查找基因序列、mRNA序列、启动子(Promoter)[同一个页面即可显示基因序列和启动子]下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤一、打开Map viewer页面,网址为:/mapview/index.html在search的下拉菜单里选择物种,for后面填写你的目的基因。
操作完毕如图所示:二、点击“GO”出现如下页面:三、在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene前面的小方框里打勾,然后点击Filter,出现下图:说明一下:1、染色体的红色区域即为你的目的基因所处位置。
2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。
尽管你分别点击后,序列代码、序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。
现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。
如何查找基因的序列(带图表)

e-133
gi|728993|sp|P40293|C79A_BOVIN B-cell antigen receptor comp...
312
3e-85
gi|126779|sp|P11911|C79A_MOUSE B-cell antigen receptor comp... 278
5e-75
gi|728994|sp|P40259|C79B_HUMAN B-cell antigen receptor comp... 55
1
2 3
比对结果会在10秒左右后出现, 注意结果很多,一直下拉右侧工具条,会看到很多不同意义的比对结果。
• Search BLAST (/BLAST/) for P11912
Database: All non-redundant(非冗余) sequences 6,507,231 sequences; 2,219,987,828 total letters
如果想找的基因是第一个序列即isoform a, 就可以点击NM_001025366.1, 得到如下界面:
If the gene sequence is known, and you want to find the corresponding GenBank ID, use /BLAST/ Click on the type of nucleotide search you want and enter the sequence. Results will be displayed with the GenBank ID included. To view information about a gene sequence with a given GenBank ID, go to /entrez/query.fcgi? db=Nucleotide
利用Pubmed Map viewer查找基因序列

利用Pubmed Map viewer查找基因序列、mRNA 序列、启动子(Promoter)来源:dxy/lovelifeangel 发布时间:2009-09-22 查看次数:2234下面以大鼠(rattus norvegicus)的结缔组织生长因子(C T G F)为例讲述一下具体的操作步骤1.打开Map viewer页面,网址/mapview/index.html在search 的下拉菜单里选择物种,for 后面填写你的目的基因。
操作完毕如图所示:2.点击“GO”出现如下页面:3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene前面的小方框里打勾,然后点击Filter. 出现下图:说明一下:1、染色体的红色区域即为你的目的基因所处位置。
2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。
尽管你分别点击后,序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。
现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。
我也推荐大家使用这个序列。
4.点击上述三条序列第一条序列(即reference)对应的"Genes seq",出现新的页面,页面下方为:5.点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能,结果如图所示:先对上面这张图做点简要的说明,在Sequence Format(序列输出格式)后面是一个下拉式选择菜单,默认的为FASTA 格式,还有一个是GenBank 格式。
我推荐大家选择GenBnak格式,因为这个格式提供了很多该基因的信息,而FASTA 格式只有基因序列。
6.在Sequence Format 后选择GenBank,然后点击下面的Display,目的基因的相关信息和序列就出现在眼前了。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何找基因全序
————————————————————————————————作者:————————————————————————————————日期:
利用Pubmed Map viewer查找基因序列、mRNA 序列、启动子(Promoter)
遗传分子统计2010-03-24 16:11:24 阅读759 评论0字号:大中小
下面以大鼠(rattus norvegicus)的结缔组织生长因子(C T G F)为例讲述一下具体的操作步骤
1.打开Map viewer 页面,网址/mapview/index.html在search 的下拉菜单里选择物种,for 后面填写你的目的基因。
操作完毕如图所示:
2.点击“GO”出现如下页面:
3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图:
说明一下:1、染色体的红色区域即为你的目的基因所处位置。
2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。
尽
管你分别点击后,序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。
现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。
我也推荐大家使用这个序列。
4.点击上述三条序列第一条序列(即reference)对应的"Genes seq",出现新的页面,页面下方为:
5.点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能,结果如图所示:
先对上面这张图做点简要的说明,在Sequence Format(序列输出格式)后面是一个下拉式选择菜单,默认的为FASTA 格式,还有一个是GenBank 格式。
我推荐大家选择GenBnak格式,因为这个格式提供了很多该基因的信息,而FASTA 格式只有基因序列。
6.在Sequence Format 后选择GenBank,然后点击下面的Display,目的基因的相关信息和序列就出现在眼前了。
点击后如图所示(网页较大,只抓取一小部分以作示范):
在上述打开的网页中,你可以看到基因长度,基因序列,以及这个基因是如何被报道出来的等各种信息。
你会看到: mRNA complement(join(2338..3702, 4082..4293, 4424..4675, 4861..5083, 5171..5454))这代表了从基因的2338 位开始就是转录区了,即我们常说的mRNA 片断,由于内含子的存在,所以mRNA 在DNA 序列上分成了几段。
CDS complement (join(3406..3702,4082..4293,4424..4675,4861..5083,5171.. 5230)) CDS 代表编码序列,即蛋白编码区是从3406开始的(ATG),由于剪接作用所以CDS 区也是不连续的。
说到这里,可能很多朋友都已经明白了promoter 即启动子区域在哪里了。
但我还是再唠叨几句:转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,如果你要研究promoter 区的话,建议你选择转录起始位点前的2000个碱基进行研究,一般默认的是这样。
当然你如果觉得长度太长不好研究的话,也可以只研究-1000 到0 这一千个碱基,因为一般情况下,启动子区的变异都在这个区域内。
这样大家就可以找到自己的目的基因序列和启动子了,这种方法可能使用的人不是很多,但我个人比较喜欢,因为它最大的优点是可以找到启动子区域和其他调控区域。