生物信息学翻译

合集下载

生物信息学期末复习资料（小字）

生物信息学期末复习资料（小字）名词解释或辨析。

1.生物信息学：生物信息学是包含生物信息的获取、处理、贮存、分发、分析和解释的所有方面的一门学科，它综合运用数学、计算机科学和生物学的各种工具进行研究，目的在于了解大量的生物学意义。

2.基因芯片：固定有寡核苷酸、基因组DNA或互补DNA 等的生物芯片。

利用这类芯片与标记的生物样品进行杂交，可对样品的基因表达谱生物信息进行快速定性和定量分析。

3.人类基因组计划：HGP，是一项规模宏大，跨国跨学科的科学探索工程。

其宗旨在于测定组成人类染色体（指单倍体)中所包含的30亿个碱基对组成的核苷酸序列，从而描绘人类基因组图谱，并且辨识其载有的基因及其序列，达到破译人类遗传信息的最终目的。

4.中心法则：分子生物学的基本法则，是1958年由克里克（Crick）提出的遗传信息传递的规律，包括由DNA到DNA的复制，由DNA到RNA的转录和由RNA 到蛋白质的翻译等过程。

20世纪70年代逆转录酶的发现，表明还有由RNA逆转录形成DNA的机制，是对中心法则的补充和丰富。

5.相似性和同源性：相似性（similarity）和同源性（homology）是两个完全不同的概念。

同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。

相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的大小。

当两条序列同源时，他们的氨基酸或核苷酸序列通常有显著的一致性（identity）。

如果两条系列有一个共同进化的祖先，那么他们是同源的。

这里不存在同源性的程度问题，两条序列要么是同源的要么是不同源的。

1.生物信息学：综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。

包括生物学数据的研究、存档、显示、处理和模拟，基因组遗传和物理图谱的处理，核苷酸和氨基酸序列分析，新基因的发现和蛋白质结构的预测等。

2.蛋白质组：指由一个基因组，或一个细胞、组织表达的所有蛋白质。

河大生科院生物信息学考试复习题答案完整版

名词解释1)生物信息学:生物信息学(Bioinformatics)是研究生物信息的采集，处理，存储，传播，分析和解释等各方面的一门学科，它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

2)人类基因组计划: 是由美国科学家于1985年率先提出，于1990年正式启动的，宗旨在于测定组成人类染色体（指单倍体）中所包含的30亿个碱基对组成的核苷酸序列，从而绘制人类基因组图谱，并且辨识其载有的基因及其序列，达到破译人类遗传信息的最终目的。

3)基因芯片:又称DNA阵列或DNA芯片是一块带有DNA微阵列（micorarray）的特殊玻璃片或硅芯片片，在数平方厘米之面积上布放数千或数万个核酸探针；检体中的DNA、cDNA、RNA等与探针结合后，借由荧光或电流等方式侦测。

4)中心法则:是指遗传信息从DNA传递给RNA，再从RNA传递给蛋白质，即完成遗传信息的转录和翻译的过程。

也可以从DNA传递给DNA，即完成DNA的复制过程。

5)一级数据库:一级数据库主要包括原始数据，例如DNA序列、蛋白质序列和蛋白质结构等信息。

数据直接来源于实验获得的原始数据，只经过简单的归类整理和注释。

名词辨析1)信息技术与生物信息学：信息技术是研究信息的获取、传输和处理的技术，由计算机技术、通信技术、微电子技术结合而成，即是利用计算机进行信息处理，利用现代电子通信技术从事信息采集、存储、加工、利用以及相关产品制造、技术开发、信息服务的新学科。

生物信息学是研究生物信息的采集，处理，存储，传播，分析和解释等各方面的一门学科，它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

2)基因与基因组：基因是指具有遗传效应的DNA片段。

而基因组指的是单倍体细胞中的全套染色体，或是单倍体细胞中的全部基因。

3)相似性与同源性：相似性是指不同染色体之间基因序列的相似或相异程度。

同源性是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。

成绩单翻译指南

一、成绩单表格课程名称Course课程性质Property学分Credit成绩Score等级Grade教务处Academic Administration学院Colledge二、课程说明及等级必修Compulsory选修Optional优秀Very Good良好Good中等Medium不及格Failed三、课程名大学体育P.E.大学物理实验College Physics电工学Electronical Engineering概率论与数理统计Probability Theory and Mathematical Statistics计算机网络技术基础Basis of Network Technology道德修养与法律基础Moral Cultivation & Basis of Law物理化学实验Experiments of Physical Chemistry形势与政策Current Politics生命科学导论Introduction to Life Science金工实习Metalworking Practice认识实习Cognition Practice生产实习Production Practice职业生涯发展Career Development算机应用基础Basis of Computer Use计中国近现代史纲要Modern History of China马克思主义基本原理Principles of Marxism中国特色社会主义理论Theory of Socialism with Chinese Characteristics C语言程序设计C Language Programming大学物理College Physics高等数学Advanced Mathematics数据库应用基础Basis of Database Use线性代数Linear Algebra分子生物学Molecular Biology化工原理Principles of Chemical Engineering化工原理课程设计Project on Chemical Engineering生物化学Biochemistry生物化学实验Experiments of Biochemistry仪器分析Instrumental Analysis细胞生物学Cellular Biology生物分离工程Bioseparation Engineering生物工艺学Biotechnology微生物学Microbiology微生物学实验Experiments of Microbiology食品检测与分析Food Testing & Analysis食品营养学Nutrition普通生物学General Biology无机化学及实验Inorganic Chemistry & Experiments分析化学Analytical Chemistry分析化学实验Experiments of Analytical Chemistry物理化学Physical Chemistry化工制图及化工厂设计Chemical Graphing & Design of Chemical Plants 有机化学Organic Chemistry有机化学实验Experiments of Organic Chemistry普通化学General Chemistry生化设备Biochemical Equipment现代生化分析Contemporary Biochemistry Analysis生物信息学Bioinformatics超分子化学Supermolecular Chemistry微生物工程Microorganic Engineering应用微生物学Applied Microbiology微生物遗传学Microorganic Genetics植物细胞工程Plant Cell Engineering动物细胞培养Animal Cell Culture遗传学Genetics基因工程Genetic Engineering植物病原微生物Plant Pathogetic Microbes药学概论Introduction to Pharmacy植物生理学Plant Physiology生态学Ecology大学英语生物科学基础实验军事理论及训练信息技术基础B德育与法律基础大学信息技术综合实验应用写作VB程序设计语言基础化学实验无机及分析化学中国传统文化生物化学篮球汽车驾驶理论与交通安全无公害农产品土肥管理大学物理生物信息学乒乓球俱乐部遗传学植物生理学现代仪器分析实验植物育种原理与技术酶工程分子生物学生物产品分离技术基因工程综合实验基因工程基因工程课程论文组织培养教学实习农业生物技术体育俱乐部训练课社会实践与调查报告毕业论文信息技术基础马克思主义哲学原理基础化学实验生物多样性与保护线性代数影视鉴赏马克思主义政治经济学原理高等数学管理学有机化学大学语文概率统计公共关系学大学物理实验网球中国化的马克思主义读书及社会实践活动普通微生物学劳动羽毛球现代仪器分析细胞生物学分子免疫学细胞生物技术生物制药组织培养综合实验组织培养组织培养课程论文生命科学进展基因工程综合实验综合专业实践应用微生物学教学实习植物实习模块问题补充：再加几个科学社会主义理论与实践自然辩证法高级生物化学细胞分子生物学生物信息学生物学研究方法原理基因工程生物化学与分子生物学进展学术研讨与学术报告学位英语高级生物化学研究原理高级生物化学研究技术文献检索与写作核算化学推荐答案College EnglishBiological scientific experimentsThe military theory and practiceInformation technology BMoral and legal basisUniversity information technology integrated experiment Application of writingbotanyVB programming languageBasic chemistry experimentInorganic and chemical analysisChinese traditional culturebiochemistrybasketballAutomobile driving theory and traffic safetyPollution-free agricultural soil managementUniversity physicsbioinformaticsTable tennis clubgeneticsPlant physiologyModern instrument analysis experimentPlant breeding theory and technologyEnzyme engineeringMolecular biologyBiological product separation technologyGenetic engineering experimentGenetic engineeringGenetic engineering coursesTissue culture teaching practiceAgricultural biotechnologySports club sessionSocial practice and research reportGraduation thesisInformation technologyMarxist philosophy principleBasic chemistry experimentBiodiversity and protectionThe linear algebraAppreciation of theMarxist political economics principleHigher mathematicsmanagementOrganic chemistrytheProbability and statisticsPublic relationsUniversity physics experimenttennisSinicization of marxismReading and social practicezoologyGeneral microbiologylaborbadmintonModern instrument analysisCell biologyMolecular immunologyCell biological technologybiopharmaceuticalComprehensive experimental training organizationTissue cultureTissue culture courseLife science advancesGenetic engineering experimentComprehensive professional practiceApplied microbiology teaching practicePlant practice module要是答案还满意的话，记得采纳哦，O(∩_∩)O谢谢~！祝你进步！。

生物信息学常用名词解释（一）

生物信息学常用名词解释（一）在生物信息中会出现很多的特殊名词，从这次内容开始，我们将逐渐推送一些生物信息相关的一些名词解释。

生物信息学（bioinformatics）：综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。

包括生物学数据的研究、存档、显示、处理和模拟，基因遗传和物理图谱的处理，核苷酸和氨基酸序列分析，新基因的发现和蛋白质结构的预测等。

基因组（genome)：是指一个物种的单倍体的染色体数目，又称染色体组。

它包含了该物种自身的所有基因。

基因（gene）：是遗传信息的物理和功能单位，包含产生一条多肽链或功能RNA所必需的全部核苷酸序列。

基因组学（genomics)：是指对所有基因进行基因组作图（包括遗传图谱、物理图谱、转录图谱）、核酸序列测定、基因定位和基因功能分析的科学。

基因组学包括结构基因组学（structural genomics)、功能基因组学（functional genomics)、比较基因组学(Comparative genomics)。

蛋白质组学（proteomics）：阐明生物体各种生物基因组在细胞中表达的全部蛋白质的表达模式及功能模式的学科。

包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和相互作用等。

高通量测序：高通量测序技术（High-throughputsequencing，HTS）是对传统Sanger测序（称为一代测序技术）革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing，NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

下一代测序：英文名为Next Generation Sequencing，简称为NGS。

也叫做二代测序或者高通量测序。

生物信息学期末考试重点

1、生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科，也是随着生命科学和计算机科学的迅猛发展，生命科学和计算机科学相结合形成的一门新学科.它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

2、数据库(Database）是按照数据结构来组织、存储和管理数据的仓库，它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据，而转变成用户所需要的各种数据管理的方式。

数据库有很多种类型，从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。

3、表达序列标签从一个随机选择的cDNA 克隆进行5'端和3’端单一次测序获得的短的cDNA 部分序列，代表一个完整基因的一小部分，在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。

EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库，因此EST也能说明该组织中各基因的表达水平。

4、开放阅读框是基因序列中的一段无终止序列打断的碱基序列，可编码相应的蛋白.ORF识别包括检测六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。

ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。

5、蛋白质的一级结构在每种蛋白质中氨基酸按照一定的数目和组成进行排列，并进一步折叠成特定的空间结构前者我们称为蛋白质的一级结构，也叫初级结构或基本结构。

蛋白质一级结构是理解蛋白质结构、作用机制以及与其同源蛋白质生理功能的必要基础.6、基因识别是生物信息学的一个重要分支，使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。

生物大数据_福建农林大学中国大学mooc课后章节答案期末考试题库2023年

生物大数据_福建农林大学中国大学mooc课后章节答案期末考试题库2023年1.Bioinformatics的含义是（）答案:生物信息学2.利用PubMed文献数据查找论文“Transgenic plants of Petunia hybridaharboring the CYP2E1 gene efficiently remove benzene and toluenepollutants and improve resistance to formaldehyde”的第一作者是答案:Zhang D3.被誉为“生物信息学之父”的科学家是（）答案:林华安4.Proteomics的含义是（）答案:蛋白质组学5.生物信息学主要是利用哪种工具实现对生命科学研究中生物信息的存储、检索和分析的？（）答案:计算机6.HGP是（）答案:人类基因组计划7.下列哪些方法不能用于遗传育种（）答案:自然选择8.Genbank数据库中，mRNA的获取号可以以（）字母开头答案:NM_9.下列那个数据库不属于NCBI（）答案:ArrayExpress10.大数据处理遇到的瓶颈不包括（）答案:数据量11.可以用来做数据库搜索的比对算法是（）答案:BLAST12.下列哪个方法最可能在基因组组装过程中留下空缺（）答案:鸟枪法建库13.“一旦空位，永远空位”描述的是（）答案:渐进比对算法14.下列不属于分子生物学数据库的特点的是（）答案:版本不更新15.GenBank中具有唯一性的字段是（）答案:Accession16.哪个基因组序列还完全未被破解（）答案:恐龙17.下面哪个工具可以用来检验原始读段的质量？（）答案:Fastqc18.基于边合成边测序的测序方法是（）答案:Illumina/Solexa19.比较成熟的三代测序技术是（）答案:PacBio20.不采用荧光标记核苷酸的测序技术是（）答案:NanoPore21.靶向测序使用的测序文库是（）答案:Amplicon22.RNA-seq从头组装的常用工具是（）答案:Trinity23.RNA-Seq技术用途不包括（）答案:基因组测序24.重测序数据分析的最后一步是（）答案:功能注释25.影响基因组组装效果的因素不包括（）答案:测序时间26.组装基因组时，由重复序列导致的错误类型不包括（）答案:基因融合27.重复序列是在基因组中出现次数大于1的DNA片段，不包括（）答案:调控序列28.研究蛋白质与DNA相互作用的是（）答案:ChIP-seq29.在线的染色体可视化工具是（）答案:Genome browser30.下列属于最不易突变的氨基酸（）答案:半胱氨酸31.常用的2个全基因组测序策略是答案:鸟枪法逐步克隆法32.二代测序数据分析中经常使用的2种比对工具是答案:BowtieBWA33.20世纪70年代，出现的2种DNA测序方法是答案:链终止测序法化学降解测序法34.关于C值悖论的描述正确的有哪些答案:亲缘关系相近的物种间C值差异很大C值远远超过了遗传信息量的需要进化程度低的生物C值反而更高35.基因组重测序技术可被用于哪些检测领域答案:皮草的真伪检测中草药的产区检测食品掺假检测宠物疾病检测36.fastaq文件中，Q值越小，测序质量越高（）答案:错误37.基因组从头组装的本质是寻找重叠区域（）答案:正确38.读段长于重复序列的长度才可能填补空缺（）答案:正确39.Contig越长基因组拼接效果越好（）答案:正确40.N50可以作为评估基因组组装效果的一个指标（）答案:正确41.RNA-seq基因对应的读段数量和基因长度及测序深度有关（）答案:正确42.进行有参考基因组的二代测序数据比对时，只需要基因组序列文件即可（）答案:错误43.FPKM是单端RNA-seq基因表达量的表示方法（）答案:错误44.对于复杂基因组，一般一种测序文库就足够了（）答案:错误45.测序文库构建很大程度决定了测序数据的好坏（）答案:正确46.二代测序的核心技术是循环芯片测序法（）答案:正确47.测序深度越高，从头组装的质量一定越好（）答案:错误48.测序深度越高，测序数据量越大（）答案:正确49.二代测序数据文件的后缀是.fa或.fastq（）答案:正确50.基于焦磷酸合成测序的方法是SOLiD/ABI（）答案:错误51.Sanger测序发现时间早于K.Mullis的PCR（）答案:正确52.DNA测序和蛋白质测序相关技术都获得过诺贝尔奖（）答案:正确53.大规模基因组测序主要有逐步克隆和鸟枪法2种策略（）答案:正确54.多数遗传性状是由单个基因决定的（）答案:错误55.人类基因组计划是中国人主持的第一个国际项目（）答案:错误56.相同长度序列，蛋白质组的复杂度低于基因的复杂度（）答案:错误57.一个氨基酸的性质主要由它的侧链决定（）答案:正确58.大数据必然会造福人类答案:错误59.大数据已经成为我国国家战略答案:正确60.双端测序与单端测序的区别在于，前者需要在DNA片段的两端分别加上引物和连接子答案:正确61.配对测序方式可以用来解决重复序列长度超过read长度，无法拼接易形成断点的问题答案:正确62.配对测序是一种特殊的双端测序方式答案:正确63.读段文件除了文本格式之外，还可以用图象表示答案:错误64.测序深度即测序得到的碱基总量（bp）与基因组大小（Genome）的比值，它是评价测序量的指标之一答案:正确65.二代测序数据文件的后缀是.fa或.fastq答案:正确66.常见的三大核酸数据库中，位于欧洲的是答案:EMBL##%_YZPRLFH_%##embl##%_YZPRLFH_%##Embl67.列举二代测序数据分析中经常使用的1种短序列比对工具。

生物信息学名词解释

1.计算生物信息学（Computational Bioinformatics）是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科，以生物数据作为研究对象，研究理论模型和计算方法，开发分析工具，进而达到揭示这些数据蕴含的生物学意义的目的。

2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。

3.双碱基编码技术：在测序过程中对每个碱基判读两遍，从而减少原始数据错误，提供内在的校对功能。

代表测序方法：solid 测序。

4.焦磷酸测序法：焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。

焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。

在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。

例如：454测序仪5.tblastn：用蛋白质序列查找核苷酸序列。

6.STS:STS是序列标记位点（sequence-tagged site）的缩写，是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断，一般长200bp－500bp。

它可用PCR方法加以验证。

将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。

在基因组作图和测序研究时，当各个实验室发表其DNA测序数据或构建成的物理图时，可用STS来加以鉴定和验证，并确定这些测序的DNA片段在染色体上的位置；还有利于汇集分析各实验室发表的数据和资料，保证作图和测序的准确性。

7.EST:表达序列标签技术（EST，Expressed Sequence Tags）EST技术直接起源于人类基因组计划。

生物信息学复习总结

生物信息期末总结1.生物信息学（Bioinformatics）定义：（第一章）★生物信息学是一门交叉科学，它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面，它综合运用数学、计算机科学和生物学的各种工具来阐明和理解大量数据所包含的生物学意义。

（或：）生物信息学是运用计算机技术和信息技术开发新的算法和统计方法，对生物实验数据进行分析，确定数据所含的生物学意义，并开发新的数据分析工具以实现对各种信息的获取和管理的学科。

（NSFC）2. 科研机构及网络资源中心：NCBI：美国国立卫生研究院NIH下属国立生物技术信息中心；EMBnet：欧洲分子生物学网络；EMBL-EBI：欧洲分子生物学实验室下属欧洲生物信息学研究所；ExPASy:瑞士生物信息研究所SIB下属的蛋白质分析专家系统；(Expert Protein Analysis System)Bioinformatics Links Directory；PDB (Protein Data Bank)；UniProt 数据库3. 生物信息学的主要应用:1．生物信息学数据库；2．序列分析；3．比较基因组学；4．表达分析；5．蛋白质结构预测；6．系统生物学；7．计算进化生物学与生物多样性。

4.什么是数据库：★1、定义：数据库是存储与管理数据的计算机文档、结构化记录形式的数据集合。

（记录record、字段field、值value）2、生物信息数据库应满足5个方面的主要需求：（1）时间性；（2）注释；（3）支撑数据；（4）数据质量；（5）集成性。

3、生物学数据库的类型：一级数据库和二级数据库。

（国际著名的一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等；蛋白质序列数据库有SWISS-PROT等；蛋白质结构库有PDB等。

）4、一级数据库与二级数据库的区别：★1）一级数据库：包括：a.基因组数据库----来自基因组作图；b.核酸和蛋白质一级结构序列数据库；c.生物大分子(主要是蛋白质)的三维空间结构数据库，(来自X-衍射和核磁共振结构测定)；2）二级数据库：是对原始生物分子数据进行整理、分类的结果，是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

attenuator：衰减子。

存在调节转录的终止的DNA区域,它控制了一些细菌操纵子的表达; 位于启动子和第一个结构基因之间，引起转录的部分终止的序列区段。

C-region：免疫球蛋白轻和重链的恒定区,和T-细胞受体α,β,和γ链；根据特定的链可包括一个或多个外显子。

CAAT-signal:真核生物启动子中CAAT盒。

位于可能参与RNA聚合酶结合的真核生物转录单位的起始点的75bp上游的保守序列的一部分；共有序列＝GG(C或T)CAATCT。

CDS：蛋白质编码区，对应于蛋白质中的氨基酸序列的核苷酸的序列(位置包括终止密码子);特征包括氨基酸概念上的翻译。

Conflict：在这一位点或区域，单独确定的“相同”序列有所不同。

D-loop：置换环；线粒体DNA内的一个区域,其中RNA的短的序列与DNA的一条链配对,代替了这一区域的原始配对DNA链;也用于说明在RecA蛋白质催化的反应中，侵入的单链替代双链DNA的一条链的区域
D-segmen t：D-免疫特征区。

免疫球蛋白重链的多变区,和T-细胞受体的β链。

enhancer：启动子顺式作用增强子，它增强了(一些)真核生物启动子的作用,并能在任一方向和与启动子相关的任何位置处(上游或下游)起作用。

exon：编码剪接mRNA部分的基因组区域;可以含有5'UTR,所有CDS,和3'UTR。

GC-signa l：真核生物启动子中GC盒，位于真核生物转录单位起始点上游的保守的富含GC区域,可以以多重拷贝或任一方向存在;共有序列=GGGCGG。

gene：鉴定为基因的生物学意义的区域，并已经指定名称。

INDA：间插DNA；通过重组中的任何一种能被消除的DNA。

intron：内含子。

被转录的DNA区段，但通过同时剪接位于其两侧的序列（外显子）即可从转录体内部将其除去。

J-segment：J-免疫特征区，免疫球蛋白轻链和重链的连接区段,和T-细胞受体α,β和γ链。

LTR：长终止重复序列。

长的末端重复，在确定序列的两端直接重复的序列，类型典型地见于逆转录病毒中。

mat-peptide：成熟的肽或蛋白质的编码序列；翻译后修饰之后成熟的或最终的肽或蛋白质产物的编码序列；位置不包括终止密码子(与相应的CDS不同)。

misc-binding：其他结合位点，不能用任何其它Binding关键词(primer_bind或protein_bind)表述的与另一个组成成分共价或非－共价结合的核酸中的位点。

misc-difference：其它特征区，特征序列与记载中存在的有所不同,并且不能用任何其它不同关键词(conflict,unsure,old_sequence,mutation,variation,allele或modified_base)表述。

misc-feature：其它重要生物功能区，不能用任何其它的特征关键词表述的具有生物学意义的区域；新的或少见的特征。

misc-recomb：其它重组特征区，任何一般性的,位点特异性的或复制的重组事件的位点,该位点中有不能用其它重组关键词(iDNA和virion)或来源关键词的修饰词
(/transposon,/proviral)表述的双螺旋DNA的断裂和愈合。

misc-RNA：其它转录特征区，不能用其他RNA关键词
（prim_transcript,precursor_RNA,mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS,sig_peptide,
mat-peptide,intron,polyA_site,rRNA,tRNA,scRNA和snRNA)限定的任何转录本或RNA产物。

misc-signal：其它信号区，含有控制或改变基因功能或表达之信号的任何区域,所述信号不能用其他Signal关键词
（promoter,CAAT_signal,TATA_signal,-35_signal,10_signal,GC_signal,RBS,polyA_signal,enhancer,a ttenuator,terminator和rep_origin）来表述。

Misc-structur e：其它DNA或RNA结构，不能用其他Structure关键词(stem_loop和D-loop)表述的任何二级或三级结构或构象。

Modified-base：修饰碱基，被指示的核苷酸是经修饰的核苷酸,并应由被指示的分子(在mod_base修饰词意义中给出)所取代。

MRNA：信使RNA, 包括5'非翻译区(5'UTR)，编码序列(CDS，外显子)和３'非翻译区（３'UTR）
N-region：在重排的免疫球蛋白区段之间插入的额外的核苷酸。

old-sequence：旧版本序列，在此位置处，所表述的序列修改了此序列以前的版本。

polyA-signal：多聚A信号区，聚腺苷酸化之后内切核酸酶裂解RNA转录本所必需的识别区域；共有序列＝AATAAA。

polyA-site：mRNA的多聚A添加位点，RNA转录本上的位点,通过转录后聚腺苷酸化该位点将被加上腺嘌呤残基。

precursor-RNA：前体RNA，仍不是成熟的RNA产物的任何RNA种类；可包括5'剪切区(5'clip)，5'非翻译区(5'UTR)，编码序列(CDS，外显子)，间插序列（内含子），3'非翻译区
（3'UTR）,和3'剪切区(3'clip)。

prim-transcript：初始(未处理)转录区，包括５'剪切区（５'clip）,５'非翻译区（５'UTR）,编码序列(CDS,外显子),间插序列(内含子),3'非翻译区(3'UTR)和3'剪切区(3'clip)。

primer-bind：引物非共价结合位点，起始复制,转录或逆转录的非－共价的引物结合位点;包括合成的例如PCR引物元件的位点。

RBS：核糖体结合位点。

repeat-region：含有重复单位的基因组区域。

repeat-unit：单个重复原件。

rep-origin：复制起点；复制核酸以得到两个相同拷贝的起始位点。

rRNA：核糖体RNA。

S-region：S-免疫特征区，免疫球蛋白重链的开关区；它参与重链DNA的重排,导致来自相同B－细胞的不同免疫球蛋白类的表达。

Satelite：卫星DNA重复序列，短的基本重复单位的很多串联重复(相同或相关的);大多数具有的碱基组成或其它性质与基因组的一般水平不同,这使得它们与大部分(主带)的基因组DNA分离开来。

scRNA：胞浆内小RNA。

sig-peptide：信号肽编码区，结构域涉及被分泌的蛋白质的Ｎ－末端结构域的编码序列；此新生多肽与膜的结合；前导序列。

snRNA：核内小RNA。

snoRNA：是一类新的核酸调控分子,大小在几十到几百核苷酸,能与特定的蛋白质,如核纤蛋白(fibrillarin)等结合生成snoRNP。

在真核生物核糖体的生物合成中起关键作用。

source：NCBI分类学数据库记录号；鉴定序列中特定范围的生物来源；此关键词是强制性的；每一项至少要有一个跨越整个序列的单一来源关键词；每个序列可允许有一个以上的来源关键词。

stem-loop：DNA或RNA中的发夹环，由RNA或DNA单链的相邻（反向）互补序列之间的碱基一配对形成的双螺旋区域。

STS：序列标签位点，表述基因组上作图界标并能通过PCR检测的短的，单拷贝DNA序列；通过测定STS系列的次序即可作出图谱的基因组区域。

TATA-signal：真核生物启动子中TATA盒，在每个真核生物RNA聚合酶Ⅱ转录单位起点前约25bp处发现的保守的富含AT的七聚体，它可能涉及使酶定位以正确地起始；共有序列＝TATA （Ａ或Ｔ）Ａ（Ａ或Ｔ）。

Terminator：转录终止位点，位于转录本的末端或者与启动子区域相邻的DNA序列，该序列可导致RNA聚合酶终止转录；也可以是阻抑蛋白的结合位点。

transit-peptide：转运肽编码区，核编码的细胞器蛋白质Ｎ－末端结构域的编码序列；此结构域参与将蛋白质翻译后运送到细胞器中。

tRNA：转运RNA。

V-region：V-免疫特征区，免疫球蛋白轻链和重链的可变区，和Ｔ－细胞受体α，β和γ链；编码可变的氨基末端部分；可由V＿segment,D_segment,N_region和J_segment组成。

V-segment：免疫球蛋白轻链和重链的可变区段，和T －细胞受体α，β和γ链；编码大多数可变区（v_region）。

Variation：变异区，含有来自相同基因的稳定突变的相关系列（例如RFLP，多态性等），在此（和可能其它）位置处所述相同基因与被表述的不同。

3’clip：前体转录时切除的3’端区域。

3’UTR：3’端不翻译区域。

5’clip：前体转录时切除的5’端区域。

10-signal：Pribnow盒；细菌转录单位起点上游约10bp处的保守区域,它可能参与结合RNA 聚合酶。

35-signal：细菌转录单位起点上游约35bp处的保守六聚体。