生物信息分析常用名词解释

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息分析常用名词解释

生物信息学(bioinformatics):综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。包括生物学数据的研究、存档、显示、处理和模拟,基因遗传和物理图谱的处理,核苷酸和氨基酸序列分析,新基因的发现和蛋白质结构的预测等。

基因组(genome):是指一个物种的单倍体的染色体数目,又称染色体组。它包含了该物种自身的所有基因。

基因(gene):是遗传信息的物理和功能单位,包含产生一条多肽链或功能RNA所必需的全部核苷酸序列。

基因组学:(genomics)是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱)、核酸序列测定、基因定位和基因功能分析的科学。基因组学包括结构基因组学(structural genomics)、功能基因组学(functional genomics)、比较基因组学(Comparative genomics)

宏基因组学:宏基因组是基因组学一个新兴的科学研究方向。宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。

蛋白质组学(proteomics):阐明生物体各种生物基因组在细胞中表达的全部蛋白质的表达模式及功能模式的学科。包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和相互作用等。

遗传图谱:指通过遗传重组所得到的基因线性排列图。

物理图谱:是利用限制性内切酶将染色体切成片段,再根据重叠序列把片段连接称染色体,确定遗传标记之间的物理距离的图谱。

转录图谱:是利用EST作为标记所构建的分子遗传图谱。

基因文库:用重组DNA技术将某种生物细胞的总DNA 或染色体DNA的所有片断随机地连接到基因载体上,然后转移到适当的宿主细胞中,通过细胞增殖而构成各个片段的无性繁殖系(克隆),在制备的克隆数目多到可以把某种生物的全部基因都包含在内的情况下,这一组克隆的总体就被称为某种生物的基因文库。

转录组:转录组即特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA 和非编码RNA。转录组研究是基因功能及结构研究的基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本及基因序列,已广泛应用于基础研究、临床诊断和药物研发等领域。

数字化表达谱分析:细胞中基因转录的动态可以精确而特异地反映其组织差异、发育阶段、健康状态及应激反应,基因转录水平检测是功能基因组学和医学研究的一项基础实验。数字化表达谱(Digital Gene Expression Tag Profiling)利用新一代高通量测序技术和高性能计算分析技术,能够全面、经济地快速检测某一物种特定组织或状态下的基因表达情况。已广泛应用于基础科学研究、医学研究和药物研发等领域。

小分子RNA测序分析:小分子RNA是生物体内一类重要的特殊分子,诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。基于solexa高通量测序技术的小RNA数字化分析,一次性获得数百万条小分子RNA序列,能够快速全面地鉴定该物种在该状态下的小分子RNA和发现新的小分子RNA,构建样品之间的小分子RNA差异表达谱,为小分子RNA功能研究提供有力工具。

WGS:以准随机的猎枪射击模式来类比全基因组打断方式,具体:将全基因组DNA随机打断为所需要的长度形成文库,再对每个片段进行测序,最后通过生物信息学的方法拼接完成整个基因组。

鸟枪法(shotgun sequencing method ):将目的DNA随机地处理成大小不同的片段,再将这些片段的序列连接起来的测序方法。

Fosmid:一种用于测试是构建文库的载体,与cosmid类似,但是是从细菌F质粒改造而来。Fosmid大小约8k,Fomsid能够插入大约40k的外源DNA,在大肠杆菌复制中,属于紧缩型。Hamiltonian path:首先将所有reads构成有向图G,每个reads看成一个节点,reads之间的重叠overlap,那么相应节点间有边。寻找通过每个reads一次且仅一次的一条路径,这样的路径就是Hamiltonian path。这种方法分为:1找到序列见的重叠信息;2由重叠关系形成G图;3根据质量等,在找到一条路径,形成consensus序列。

cDNA文库:以mRNA为模板,经反转录酶催化,在体外反转录成cDNA,与适当的载体(常用噬菌体或质粒载体)连接后转化受体菌,则每个细菌含有一段cDNA,并能繁殖扩增,这样包含着细胞全部mRNA信息的cDNA克隆集合称为该组织细胞的cDNA文库。

TA克隆:TA克隆方法(Original TA Cloning Kit)把PCR片断与一个具有3‘-T突出的载体DNA连接起来的方法。

PCR:聚合酶链式反应,其英文Polymease Chain Reaction(PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火及适温延伸等几步反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。

N50:The N50 statistic is a measure of the average length of a set of sequences, with greater weight given to longer sequences. It is used widely in genome assembly, especially in reference to contig lengths within a draft assembly.

Contig:In shotgun DNA sequencing projects, a contig (from contiguous) is a set of overlapping DNA segments derived from a single genetic source. A contig in this sense can be used to deduce the original DNA sequence of the source。

Scaffold:also called super contigs which is linked by the contigs of their paired releations and filled with Ns.

遗传密码:指信使RNA(mRNA)分子上从5'端到3'端方向,由起始密码子AUG开始,每三个核苷酸组成的三联体。它决定肽链上某一个氨基酸或蛋白质合成的起始、终止信号。

起始密码子:蛋白质翻译过程中被核糖体识别并与起始tRNA(原核生物为甲酰甲硫氨酸tRNA,真核生物是甲硫氨酸tRNA)结合而作为肽链起始合成的信使核糖核酸(mRNA)三联体碱基序列。大部分情况下为AUG,原核生物中有时为GUG等。

终止密码子:termination codon;stop codon蛋白质翻译过程中终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列。一般情况下为UAA、UAG和UGA,它们不编码氨基酸。

密码子的简并性:一个氨基酸由一个以上的三联体密码编码的现象叫做密码子的简并性。其中的密码就叫做简并密码子。

启动子:是基因转录起始所必须的一段DNA序列,一般位于结构基因的上游,是DNA 分子上与RNA聚合酶特异性结合而使转录起始的部位,启动子本身不被转录。

终止子:常指转录终止子。转录过程产生RNA的一段可终止转录的茎-环结构序列;位于模板基因下游该结构所对应的DNA序列。

外显子:外显子(英语expressed region) 是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。

内含子:内含子(Intron)是一个基因中非编码DNA片段,它分开相邻的外显子。更精确的定义是:内含子是阻断基因线性表达的序列。DNA上的内含子会被转录到前体RNA中,但RNA上的内含子会在RNA离开细胞核进行转译前被剪除。

复制体:在DNA合成的生长点(growth point),即复制叉上,分布着各种各样与复制有关

相关文档
最新文档