基因家族的定义
基因家族的分类

基因家族的分类
基因家族指的是一组在基因序列、基因结构或基因功能等方面有相似性的基因。
基因家族的分类方法有多种,其中几种主要的分类方法如下:
1. 序列同源性分类:这是一种最基本的分类方法,即根据基因的序列同源性将其分为同源家族和异源家族。
同源家族是指基因序列高度相似且功能相似的基因集合,异源家族则是对应的功能不同或序列差异较大的基因集合。
这种分类方法可以通过比对基因序列的相似性和亲缘树分析来实现。
2. 功能分类:这是根据基因的功能特点将其分类。
比如将基因分为代谢酶家族、激素家族、细胞周期调控家族等等。
这种分类方法主要依据基因产物的生物学功能来划分。
3. 结构组成分类:这是根据基因编码蛋白质的结构特点将其分类。
比如将基因分为转录因子家族、免疫球蛋白家族、组蛋白家族等等。
这种分类方法主要依据组成部分组成相似性的基因,并根据其编码蛋白质的结构特点进行分类。
4. 进化分类:这是根据基因的进化关系将其分类。
将不同物种中具有同源性的基因归入一个基因家族。
这种分类方法主要依据基因在演化过程中的进化关系,从而进一步分析它们在不同物种间的相似性和功能。
总之,基因家族的分类方法有多种,包括序列同源性分类、功能分类、结构组成分类和进化分类等等,不同的分类方法可以用于不同的研究目的。
生物进化中的基因家族与基因重复

生物进化中的基因家族与基因重复基因家族与基因重复是生物进化中的重要现象,它们在形成和塑造物种多样性方面起着重要作用。
基因家族是指一组具有相似序列和功能的基因,而基因重复则是指拥有相似或相同序列的基因在同一个个体或物种中的存在。
在本文中,将介绍基因家族与基因重复的定义、形成机制以及它们在生物进化中的重要意义。
一、基因家族的定义和形成机制基因家族是指在一个或多个基因组中存在的具有相似序列和功能的基因群。
基因家族可以通过基因重复事件形成,其中最常见的两种机制是基因复制和基因转座。
1. 基因复制:基因复制是指一个基因在基因组中发生复制,生成两个或更多拷贝。
这种复制可以是整个基因的复制,也可以是基因中特定的片段的复制。
基因复制可以直接复制到同一染色体上,也可以通过染色体间的重组事件复制到不同染色体上。
2. 基因转座:基因转座是指基因或基因片段从一个染色体位置转移到另一个染色体位置。
基因转座可以通过转座酶的介导完成,这些酶能够识别特定的DNA序列并催化转座事件的发生。
基因转座可以导致基因家族的形成,因为转座事件会在基因组中产生与原始基因相似的新序列。
二、基因家族的功能和进化意义基因家族的形成和存在具有重要的功能和进化意义。
以下是它们在生物进化中的几个重要作用:1. 增加基因多样性:基因家族为物种提供了基因多样性的基础。
由于基因家族中的基因具有相似的序列和功能,因此它们可以通过小范围的突变快速适应环境的变化。
这种基因多样性的存在使得物种在进化过程中能够更好地适应不同的环境压力。
2. 促进新基因的演化:基因家族中的基因经过演化和多样性的塑造,可能会产生新的基因变体或新的基因功能。
这些新基因的出现可以提供物种进化所需的新的生理或生化功能。
例如,哺乳动物皮脂酸脱羧酶家族中的基因扩增和多样性演化,导致了新的基因变体的出现,从而增加了哺乳动物的适应能力。
3. 调节基因表达:基因家族中的基因通常会在不同的组织和不同的发育阶段中发挥不同的功能。
基因家族、管家基因的概念

基因家族、管家基因的概念
1、基因家族概念:基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物,同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。
2、管家基因的概念:管家基因是指所有类型组织细胞在任何时候都需要表达的基因。
由于管家基因是生命活动必需的基因,表达相对稳定,差异小。
所以在基因芯片技术中根据各芯片的管家基因可以得出标准化系数进行标准化较正;管家基因在所有的细胞中都有表达,因此有关管家基因的概念有助于分析差异表达基因的表达情况,进而进行差异表达基因的克隆;通过管家基因,能比较不同样本中某种mRNA的水平。
基因家族的概念

基因家族的概念基因家族的概念1. 引言基因家族(gene family)是指一组相似或相关的基因,它们在生物体中以多个拷贝的形式存在。
基因家族的出现和演化是通过基因重复事件而产生的,这些事件包括基因复制、基因转座和基因重组等。
基因家族在进化过程中发挥了重要的作用,它们对生物体的适应性和多样性起到了关键的推动作用。
本文将深入探讨基因家族的概念,其重要性以及相关领域的研究进展。
2. 基因家族的形成和演化基因家族是由基因重复事件导致的,这些事件可以是基因复制(gene duplication)、基因转座(gene transposition)或基因重组(gene recombination)等。
在基因复制过程中,某个基因的拷贝通过突变和选择的作用逐渐发展出新的功能和表达模式。
基因转座则是指基因在染色体上的位置发生了改变,从而产生了新的基因。
基因重组则是指两个不同的基因在染色体上发生了交换,从而形成了新的组合。
3. 基因家族的重要性基因家族在生物的进化和多样性中起到了重要的作用。
基因家族提供了基因多样性的基础。
通过基因的多次重复和演化,新的基因产生了新的功能和表达模式,进而促进了生物体对环境的适应和进化。
基因家族在维持生物体的稳定性上也起到了关键的作用。
由于基因家族中的基因具有相似的序列和结构,它们通常会在相同条件下被调控,在某种程度上实现了对基因的冗余。
这种冗余性使得基因家族中的某个基因发生突变或缺失时,其他基因可以起到补偿作用。
4. 基因家族的研究进展近年来,基因家族的研究在生物学领域取得了显著的进展。
通过高通量测序技术和生物信息学方法,研究人员可以对基因家族的成员进行鉴定和分类,并分析它们的进化关系和功能。
人们还发现了许多具有重要生物学功能的基因家族,例如免疫球蛋白基因家族和微小RNA基因家族等。
这些研究为我们深入理解基因家族提供了重要的线索。
5. 总结与展望基因家族是生物进化和多样性的重要基础,它们通过基因重复事件的发生和演化推动了生物体的适应性和进化。
基因家族的定义

什么是一个基因家族呢由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因被称为基因家族(gene family)。
基因重复主要有三种方式:片段复制、串联重复和逆转录转座或其他转座事件等,基因重复后可以彼此形成基因簇(gene clusters),同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。
基因突变是基因分子进化的第一原因,由核苷酸替代、插入/缺失、重组和基因转换等引发的突变基因或DNA序列,通过群体水平的遗传漂变和/或自然选择进行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会增加,相对基因重复是非常少的,主要是影响基因的序列以及其编码的蛋白。
基因家族主要是指一组功能相似且核苷酸序列具有同源性的基因,是具有显著相似性的一组基因,编码相似的蛋白质产物。
有时定义基因家族,从结构域角度来刻画。
如:一类基因,其编码蛋白都含有同一个结构域,这一类基因是一个基因家族。
比如MADS-box基因家族,这类基因都含有MADS-box结构域,还有SET结构域基因家族。
这个定义信息更偏向功能信息,一般来说结构域决定某种功能,因为结构域序列保守,易形成稳定的三维结构。
这与共同祖先的定义有些差别,很多结构域难找得到其共同祖先。
另外一个基因的共同祖先定义比较复杂的,越是历史久远的祖先,因为物种的在进化过程中发生了很多丢失和增加事件。
共同祖先是个相对的概念,比如植物的共同祖先,一般包括藻类及其它绿色植物,而被子植物共同祖先,根据已经测序的基因组,一般指单双子叶之前就可以。
如果从共同祖先定义基因家族,很多已知的基因家族就要被分成很多个基因家族。
有很多网站(数据库)专门收集结构域,比如Pfam和InterPro,这两个数据库内容差不多。
分子生物学L7-L12问题及答案

L71.gene family:基因家族。
它是指生物基因组中存在的许多来源相同,结构相似、功能相关的一组基因。
其成员可以成簇排列在一起或散布在不同染色体上(或兼而有之)。
2.Alu family:Alu家族,又称Alu序列。
是一种长度约为300 bp的DNA序列,因其第170位置附近都有AGCT 这样的限制性内切酶AluⅠ识别位点,可被限制性内切酶AluⅠ所切割(AG↓CT)而得名。
Alu族序列成员众多,在基因组中重复百万次以上,且广泛散布在非重复序列之间。
3.Satellite DNA:卫星DNA。
是位于真核细胞染色体中,由许多相同或相关的短小重复序列高度串联重复而成的DNA序列区。
它主要存在于染色体的着丝粒部位,通常不被转录。
因其碱基组成中GC含量少,与染色体其他部分DNA相比具有不同的浮力密度,在氯化铯密度梯度离心后呈现与大多数DNA有差别的“卫星”带而得名。
Minisatellite:小卫星DNA。
是一种存在于真核生物基因组DNA中比卫星DNA短的串联重复序列,重复序列单位长度在10-100bp 之间, 且在其重复单元之间并不存在间隔序列。
Microsatellite:微卫星DNA。
它是存在于真核基因组DNA中的一种具有比小卫星DNA更短重复单元(2~4bp)的卫星DNA,重复序列单位长度小于10 bp(一般是2-5,最多为6) ,例如真核生物染色体末端的端粒就是一种微卫星DNA。
STR:短串联重复序列(short tandem repeat,STR),又称微卫星DNA(microsatellite DNA)。
VNTR:(Variable number of tandem repeat),即数目可变的串联重复序列,又称小卫星DNA (Minisatellite DNA)。
4.globin:珠蛋白。
是具有携带氧能力的蛋白质。
如血红蛋白、肌红蛋白、神经珠蛋白、胞红蛋白等。
5.To illustrate the developmental control via example. (via globin)通过珠蛋白阐述发育控制?血红蛋白是脊椎动物红血球的主要成分,其功能是运送氧气和二氧化碳。
基因家族的概念和分类

基因家族的概念和分类=================基因家族是一组具有相似功能或结构相似的一组基因。
这些基因可能是在物种进化过程中,通过基因复制或水平基因转移等途径产生的。
根据不同的分类标准,基因家族可以按照不同的方式进行分类。
以下是几种常见的基因家族分类方式:1. 同源基因家族------------同源基因家族是一组在物种间保守存在的基因,它们在进化过程中由一个原始基因通过复制产生的。
这些基因通常具有相似的结构和功能,并可能在不同的生物体内发挥着相似的生物学作用。
2. 直系同源基因家族--------------直系同源基因家族是由一个共同祖先基因通过不同物种内的复制产生的。
这些基因通常在物种内保守存在,并具有相似的结构和功能。
直系同源基因家族通常被用来研究物种进化和系统发生关系。
3. 旁系同源基因家族--------------旁系同源基因家族是由不同祖先基因通过复制产生的。
这些基因通常具有相似的结构和功能,但它们不是由一个共同祖先基因复制而来。
旁系同源基因家族通常被用来研究物种进化和系统发生关系。
4. 伪基因家族---------伪基因家族是由已经失去功能的基因残基组成的。
这些基因残基通常是由基因突变或染色体变异产生的,并且它们不再表达产生有功能的蛋白质。
伪基因家族可以被用来研究物种内的进化过程和遗传变异。
5. 重复基因家族---------重复基因家族是由一组相似的但并非完全相同的基因组成的。
这些基因可能是在物种进化过程中,通过基因复制或水平基因转移等途径产生的。
重复基因家族通常被用来研究物种内的遗传多样性和进化过程。
6. 水平转移基因家族--------------水平转移基因家族是通过水平基因转移产生的。
这些基因通常是从其他物种转移过来的,因此它们不属于该物种的直系同源基因家族。
水平转移基因家族可以被用来研究物种间的进化关系和遗传多样性。
7. 非直系同源基因家族--------------非直系同源基因家族是由不同物种内的直系同源基因通过水平基因转移产生的。
22基因家族

基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物,[1]同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。
[编辑]参考1.^朱玉贤等《分子生物学》高等教育出版社ISBN 978-7-04-022214-2中文名称:基因家族英文名称:gene family定义1:基因组中存在的许多来源于同一个祖先,结构和功能相似的一组基因。
同一家族的这些基因的外显子具有相关性,可在基因组内集中或分散分布。
应用学科:生物化学与分子生物学(一级学科);总论(二级学科)定义2:同一物种中结构与功能相似,进化起源上密切相关的一组基因。
应用学科:遗传学(一级学科);分子遗传学(二级学科)以上内容由全国科学技术名词审定委员会审定公布定义真核细胞中,许多相关的基因常按功能成套组合,被称为基因家族。
构成基因组进化中,一个基因通过基因重复产生了两个或更多的拷贝,这些基因即构成一个基因家族。
特点是具有显著相似性的一组基因,编码相似的蛋白质产物。
同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。
一组功能相似且核苷酸序列具有同源性的基因,可能由某一共同祖先基因经重复和突变产生。
由外显子相关的一组基因所组成,家族成员来自某个祖先基因的倍增和变异。
多基因家族真核基因组的特点之一就是存在多基因家族(multi gene family)。
多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。
多基因家族分类一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
什么是一个基因家族呢?由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因被称为基因家族(gene family)。
基因重复主要有三种方式:片段复制、串联重复和逆转录转座或其他转座事件等,基因重复后可以彼此形成基因簇(gene clusters),同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。
基因突变是基因分子进化的第一原因,由核苷酸替代、插入/缺失、重组和基因转换等引发的突变基因或DNA序列,通过群体水平的遗传漂变和/或自然选择进行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会增加,相对基因重复是非常少的,主要是影响基因的序列以及其编码的蛋白。
基因家族主要是指一组功能相似且核苷酸序列具有同源性的基因,是具有显著相似性的一组基因,编码相似的蛋白质产物。
有时定义基因家族,从结构域角度来刻画。
如:一类基因,其编码蛋白都含有同一个结构域,这一类基因是一个基因家族。
比如MADS-box基因家族,这类基因都含有MADS-box结构域,还有SET结构域基因家族。
这个定义信息更偏向功能信息,一般来说结构域决定某种功能,因为结构域序列保守,易形成稳定的三维结构。
这与共同祖先的定义有些差别,很多结构域难找得到其共同祖先。
另外一个基因的共同祖先定义比较复杂的,越是历史久远的祖先,因为物种的在进化过程中发生了很多丢失和增加事件。
共同祖先是个相对的概念,比如植物的共同祖先,一般包括藻类及其它绿色植物,而被子植物共同祖先,根据已经测序的基因组,一般指单双子叶之前就可以。
如果从共同祖先定义基因家族,很多已知的基因家族就要被分成很多个基因家族。
有很多网站(数据库)专门收集结构域,比如Pfam和InterPro,这两个数据库内容差不多。
这些数据库以Hmmer算法为基础,根据Uniprot中包含的蛋白,进行序列连配找到保守的片段(结构域),再以这些序列使用Hmmer构建种子,保存这些种子。
一个蛋白拿过来后,与这些种子比对,根据打分能判断出这个蛋白是不是含有这个结构域,这也是判断一个基因编码蛋白是不是属于这个家族。
基因家族定义基因组进化中,一个基因通过基因重复产生了两个或更多的拷贝,这些基因即构成一个基因家族。
是具有显著相似性的一组基因,编码相似的蛋白质产物。
在真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(gene family)。
同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。
一组功能相似且核苷酸序列具有同源性的基因,可能由某一共同祖先基因经重复和突变产生。
多基因家族真核基因组的特点之一就是存在多基因家族(multi gene family)。
多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。
多基因家族大致可分为两类:一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。
在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。
假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。
与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。
人们推测,假基因的来源之一,可能是基因经过转录后生成的RNA前体通过剪接失去内含子形成mRNA,如果mRNA经反复转录产生cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。
多基因家族的进化在进化过程中,基因家族如编码rRNA的基因或编码组蛋白的基因都是从共同的祖先基因通过重复(duplication)和歧化(divergence)进化而来的,它们具有相同或相关的功能。
虽然如此,但它们在发育过程中并不总是同时表达的,不同的成员可能在不同的发育阶段和(或)不同的组织中表达,如有些血红蛋白基因家族成员在成体中表达,而另一些则只在胎儿期表达,这一事实说明在基因调控水平发生了进化歧化(evolutionary divergence)。
在足够时间的进化过程中,基因家族中某些成员的DNA序列可能歧化为可编码一种具有新功能的蛋白,例如,乳清蛋白(lactalbumin)基因与溶菌酶基因就属于同一个家族,前者编码催化乳糖合成的酶的一个亚基,后者编码的溶菌酶能降解某些细菌细胞壁的多糖化合物,但它们具有一个共同的特点就是都作用于碳水化合物。
我们也已经知道,基因家族中的某些成员并不转录或转录本不翻译成有功能的蛋白,即成为基因家族中的假基因。
研究发现,这些无功能的假基因缺乏必要的启动序列和缺乏一个或多个具活性的成员中特有的内含子序列。
DNA重复通常是指DNA片段数的增加,它可以是一个完整基因的重复(基因重复)、基因的一部分重复、一个完整染色体的重复(非整倍体)、或整个基因组的重复(多倍体)。
基因家族是由于连续的基因重复所造成的。
非整倍体常导致生物体的不育,而基因组重复只是使基因增加拷贝数,并不产生新的基因,对基因组的复杂性并没有改变。
从基因组进化的角度来看,更多的是考虑单个基因或一些基因的重复,而不是整个基因组的重复。
珠蛋白是一个多基因家族,在人类的第16号染色体上发现了7个类a珠蛋白基因,在第11号染色体上发现了6个类b珠蛋白基因,在动物甚至植物中也发现了珠蛋白基因,表明这是一个非常古老的基因家族。
在多种动物中几乎所有有功能的珠蛋白基因结构都相同,由3个外显子组成,中间间隔着两个内含于。
但珠蛋白基因的数量和次序在各种动物中是不同的。
由于所有的珠蛋白基因的结构和顺序都是相似的,因此它们存在着一个祖先珠蛋白基因(多半和现在存在的肌红蛋白基因相关)。
在约5亿年前,祖先珠蛋白基因经重复和歧化产生了原始的a珠蛋白基因和b珠蛋白基因,再追溯至8亿年前,这个祖先珠蛋白基因本身也是通过基因重复而产生的,它的另一份拷贝进化为现今的肌红蛋白(myoglobin)基因,肌红蛋白基因的组成和珠蛋白基因相似,其主要功能也同珠蛋白一样是贮存氧,因此我们可以将三个外显子结构看成是它们共同的祖先。
植物的豆血红蛋白(leghemoglobin)基因是和珠蛋白基因相关的,植物豆血红蛋白基因存在着很多原始的类型,它比肌红蛋白基因多一个内含子,但它与肌红蛋白很相似。
某些原始的鱼类只有单个类型的珠蛋白链,因此它们必然是在珠蛋白基因尚未发生重复前就歧化了出来。
在某些两栖动物中含有a和b连锁的珠蛋白基因,这是由祖先珠蛋白基因重复后经突变形成的。
后来进一步重复,在哺乳动物中形成了a珠蛋白家族和b珠蛋白家族。
重复在进化中是经常发生的,事实上,珠蛋白基因的拷贝数在某些人类群体中是有变化的,例如大部分人在16号染色体上有2个a基因(a1、a2,图12-9),但有些个体在此染色体上只有1个,而另一些个体有3个甚至有4个a珠蛋白基因。
此表明在多基因家族中基因的重复和缺失是恒定的进行过程。
重复也可以通过转座而产生。
基因组中的基因家族(来源于首席医学网)在人及高等有机体基因组中,有许多基因家族。
有的基因家族成员多,有的基因家族成员少;有的基因家族成员功能相似,有的基因家族成员功能各异[1]。
所谓多基因家族是指一类具有序列同源性及相似功能的基因;而基因超家族是指一类具有序列同源性而不具相似功能的基因。
如果一类蛋白或基因具有共同起源的一个结构域,就属于一个基因超家族,同一个基因可归属于两个或多个基因超家族。
有关基因家族的研究起始于二十世纪七十年代,目的是为阐明个体或群体遗传差异与基因冗余(gene redundancy)的关系。
文献表明:免疫球蛋白基因超家族与其它多基因家族进化的分子机制相似,染色体不等交换和基因转换(gene conversion)导致了免疫球蛋白基因的进化。
为阐明基因家族进化和变异的分子机制,应同时考虑染色体不等交换、基因突变、自然选择及随机漂变等因素。
同一基因家族中不同成员的序列同源性取决于基因突变与染色体不等交换的频率,也与自然选择及随机漂变有关[1]。
基因超家族的一个重要特点是不同成员具有不同的表达模式(expression patterns),而同一多基因家族的不同成员往往具有相同的表达调控机制。
因此,有必要阐明基因超家族成员其表达模式改变的诱因。
一些大的基因超家族通常包括数个单基因和几个多基因家族,这些基因家族的形成是有机体进化的分子基础。
基因组中几乎所有的基因可归属于一个或更多的基因超家族。
同源性比较可用于分析不同基因间的进化关系;系统发生分析可剖析基因家族不同成员的相关性;基因进化树可澄清基因拷贝数增加或基因重复(gene duplication)的历史,同时,为识别不同种属同源基因提供有益信息。
1. 基因家族在基因组中的分布1.1 成簇存在的基因家族许多重要的基因家族在基因组中成簇存在,也即同一基因家族的不同成员在基因组中重复串联排列。
这些成簇存在的基因是种系生殖细胞在减数分裂过程中,通过染色体不等交换和基因转换形成的。
一些多基因家族成员的拷贝数巨大,如核糖体RNA或组蛋白基因家族,这是由于有机体需要其大量的基因表达产物。
在真核生物中,rRNA基因通常形成一个多基因家族。
rRNA基因的一个重复单位包含一个转录区和一个非转录间隔区,转录区包括18S、5.8S和28S rRNA基因,该重复单位在基因组中重复数百次。
rRNA 多基因家族不同成员进化的分子机制一致,尽管不同种属rRNA基因重复单位的序列有所差异,但同种属rRNA基因重复单位之间的同源性很高。
在高等有机体基因组中,核小体的四种核心组蛋白基因通常成簇存在,该基因簇在基因组中重复数十次,这些基因在细胞周期的S期同步表达。
也有几个组蛋白基因的表达与细胞周期无关,此类组蛋白基因的表达与一般的组织特异性基因相似。
一些成簇存在的基因超家族成员功能各异,最典型是珠蛋白基因超家族(globin gene superfamily)。
哺乳类珠蛋白基因超家族由α样珠蛋白基因家族、β样珠蛋白基因家族和肌红蛋白家族三个基因家族组成。
前两个基因家族由成簇存在的基因编码,而肌红蛋白由单个基因编码。
每个基因簇包括胚胎期、成人期α或β珠蛋白基因及假基因。