基因组学考试答案

基因组学考试答案
基因组学考试答案

基因组学

一、名词解释

1.gene:基因是有遗传效应的DNA片段,是控制生物性状的基本遗传单位。Gene一词于1909年由丹麦植物学家Wilhelm Johannsen首次提出,以取代孟德尔的factor等用语。

2.肿瘤标志物:反应肿瘤存在的化学类物质。它们或不存在于正常成人组织而仅见于胚胎组织,或在肿瘤组织中的含量大大超过在正常组织里的含量,它们的存在或量变可以提示肿瘤的性质,借以了解肿瘤的组织发生、细胞分化、细胞功能,以帮助肿瘤的诊断、分类、预后判断以及治疗指导。

3.基因组编辑:genome editing,一种在基因组水平上对DNA序列进行改造的遗传操作技术。技术的原理是构建一个人工内切酶,在预定的基因组位置切断DNA,切断的DNA在被细胞内的DNA修复系统修复过程中会产生突变,从而达到定点改造基因组的目的。

4.BLAST:Basic Local Alignment Search Tool,一套在蛋白质数据库或者DNA数据库中进行相似性比较的分析工具。

5.微生物组群:微生物组群是指在多细胞生物体中发现的一组共生的病原微生物菌群,包括细菌、古细菌、原生生物、真菌和病毒等。微生物组群在免疫、体内激素代谢平衡方面有至关重要的作用。

6.组蛋白修饰:组蛋白修饰是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修饰的过程。

7.L-W曲线:Lander-Waterman模型是1988年美国Eric Lander以及Michael Waterman提出的一个数学模型,广泛用于基因组大小评估,还能够推算出覆盖度和reads的关系,在测序和序列组装中起到关键的指导意义。对于已知待测基因组大小的G和测序长度L都是常数,使用Lander-Waterman模型绘制L-W曲线,可以得到contig数与基因组大小(G)和测序reads数(N)的关系图。

8.液体活检:Liquid Biopsy,是一种利用高通量测序技术来检测血液中的小DNA碎片的技术。可用于癌症早期临床诊断。

9.miRNA:miRNA 是一类进化上保守的非编码小分子RNA,具有在翻译水平调控基因表达的功能。

10.N50:contigs或scaffolds从大到小排列,当其累计长度刚刚超过全部不组装序列的总长度的50%是,最后一个contig或scaffold的大小即为N50的大小,N50对评价基因测序的完整性有重要意义。

11.STR:微卫星DNA,重复单位序列最短,只有2~6bp,串联成簇,长度50~100bp,又称为短串联重复序列(Short Tandem Repeat STR)。广泛分布于基因组中。其中富含A-T碱基对,是在研究DNA多态性标记过程中发现的。

12.HLA:HLA系统是具有代表性的序列多态性遗传标记。HLA基因是位于6p21.31、全长3.6Mb的由一系列紧密连锁的位点所组成的具有高度多态性的复合体。

13.SNP:single nucleotide polymorphism,单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。

14.痕量DNA: 痕量DNA又称低拷贝模板(low copy number,LCN)。

15.Alignment:序列比对是基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。

16.SBS:SBS法是一种基于DNA合成反应的测序技术,又称Sanger法。其使用双脱氧核算-ddNTP作为链终止剂。

17.KEGG: KEGG(京都基因与基因组百科全书) 是了解高级功能和生物系统(如细胞、生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实

验技术的实用程序数据库资源,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一,以"理解生物系统的高级功能和实用程序资源库"著称。

18.iPS:诱导多能干细胞,是由动物体细胞,经四种或者多种诱导因子(oct4,c-myc,sox2,klf4等)感染,在一定条件下转化为与ES(embryo stem ,胚胎干细胞)形态,功能类似的ips细胞,ips具有分化潜能,在体外能分化为EB(胚体),在动物体内能形成畸胎瘤或者嵌合体。

19.遗传标记:遗传标记是指在遗传分析上用作标记的基因,具有遗传上的可遗传性、个体性和可识别性,以及方便取样和快速分析等特点。主要特点为多态性、高频性、共显性、规律性。

20.e-PCR:electronic PCR,e-PCR 技术是利用生物信息学数据库作为平台, 借助相应的分析运算软件, 搜索所查询的DNA 序列(query sequence) 是否含有序列标记位点(Sequence Tagged Sit , STS) , 根据STS 在已知基因组图谱的位置将所查询的DNA 序列在基因组图谱上进行定位。

21.免疫组测序:(Immune Repertoire sequencing(IR-SEQ))是以T/B 淋巴细胞为研究目标,以多重PCR或5’RACE技术目的扩增决定B细胞受体(BCR)或T细胞受体(TCR)多样性的互补决定区(CDR区),再结合高通量测序技术,全面评估免疫系统的多样性,深入挖掘免疫组库与疾病的关系。

22.靶区域测序:是指对一个较大的区域或几个不同的基因组区域同时进行测序。DNA捕获是靶区域测序制备模板的主要方法。

23.基因电路:是一种将基因网络和电子网络电路做类比的研究方法,在这种类比下,成熟的电路分析可以被用来分析基因网络的功能和结构。

24.连锁不平衡:(linkage disequilibrium) 在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称连锁不平衡。

25.后随基因:在DNA复制过程中,以亲代链(5’→ 3’)为模板时,子代链的合成不能以3’→5’方向进行,而是按5’→ 3’方向合成出许多小片段,因为是冈崎等人研究发现,因此称冈崎片段。由许多冈崎片段连接而成的子代链称为后随链。在后随链上的基因称为后随基因。26. Synthia:第一个人工合成的基因组,由美国生物学家文特尔领导的研究团队,重塑"丝状支原体丝状亚种"(Mycoplasma mycoides)这种微生物的DNA,并将新DNA片段"黏"在一起,植入另一种山羊支原体中。新生命1个月前诞生,昵称Synthia"Synthia"(合成体),这种微生物由蓝色细胞组成,能够生长、繁殖,细胞分裂了逾10亿次。

27.PGT:Preimplantation Genetic Testing,植入前检测是指通过显微操作技术取出早期胚胎(体外受精后、植入前)的一个或少数几个细胞及囊胚期的胚胎滋养层,应用DNA分析技术进行特定基因和染色体畸变的检测。

28.CRISPR:CRISPR是基因组中自然存在的成簇的规律间隔的短回文重复序列。CRISPR序列广泛分布于细菌和古菌基因组中。

29.RFLP:(Restriction Fragment Length Polymorphism,限制性片段长度多态性)第一代DNA 标记是RFLP,是一种“单位点双等位”的遗传标记。

30.Genome:基因组,在生物学中,一个生物体的基因组是指包含在该生物的DNA中的全部遗传信息。一个生物体的基因组是指一套染色体中的完整的DNA序列。

31.假基因:(pseudogene),是基因组中与编码基因序列非常相似的非功能性基因组DNA 拷贝,一般情况都不被转录,且没有明确生理意义。

32.K-mer:K-mer就是一个基因长度为K的DNA序列,K为整数。K-mer大小选取取决于它的主要使用目的:拼接和比对。所以,一般来说K-mer的唯一性越高越好。

33.C值悖论:目前C值得概念已推广到所有生物的基因组大小。原先的研究认为,物种基

因组的大小与生物的复杂性相关。但是某些物种经常出现C值和生物复杂性不一致的情况,主要是由各种重复序列引起的,称此为C值悖论(C-value paradox)。

34.CpG岛:哺乳动物中CpG以两种形式存在:一种是分散于DNA序列中;另一种呈现高度聚集状态,称为CpG岛(CpG island)。在正常组织里,70%~90%散在的CpG是被甲基修饰的,而CpG岛则是非甲基化的。并且CpG岛常位于转录调控区附近。

35. Lod 值:确定两个基因座是否在染色体上距离很近,因此可能一起遗传的统计学评估。通常判定连锁关系是以Lod值大小为依据。Lod值为0,意味着连锁假设与不连锁假设的可能性相等;Lod值为正值,有利于连锁;Lod值为负值,表示有一定重组率的连锁。

36.ChIP-Seq:染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP) 是研究体内蛋白质与DNA相互作用的,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。ChIP-Seq技术是将ChIP与MPH测序技术相结合,ChIP-Seq的数据是DNA序列的,为各种DBP 的结合区域的研究提供了高分辨率的方法。

37.表现型:具有特定基因型的个体,在一定环境条件下,所表现出来的性状特征的总和。

38.中性演化学说:认为分子水平上的大多数突变是中性或近中性的,自然选择对它们不起

作用,这些突变全靠一代又一代的随机漂变而被保存或趋于消失,从而形成分子水平上的进化性变化或种内变异。

39.Assembly:序列组装,序列的组装一般包括contig组装、scaffold构建以及“补洞”等几个步骤,是将原始的下机序列还原成DNA序列片段。

40.非编码RNA:(Non-coding RNA)是指不编码蛋白质的RNA。其中包括rRNA,tRNA,snRNA,snoRNA 和microRNA 等多种已知功能的RNA,还包括未知功能的RNA。

41.精准医学:指根据每个病人的个人特征量体裁衣式地制定个性化治疗方案。它是由“个性化医疗”联合最新的遗传检测技术发展而来。

42.重叠基因:(overlapping gene)是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列成为两个或两个以上基因的组成部分。

43.遗传图:是人类基因组计划绘制的人类基因组四张图的第一张图。指通过遗传学方法如

遗传重组等测得的参数来表示基因或DNA标记在染色体上得相对位置与遗传距离的图谱。

44.基因型:是某一生物个体全部基因组合的总称。

45.b-PCR:booster PCR,增敏PCR,其在扩增模板量很低的样品时可明显提高PCR产量。

46.MPH:Massively Parallel High-thriughput ,大规模并行高通量测序,又称新一代或下一代

测序,是测序技术发展史上影响最为深远的一场革命。其以芯片技术实现了大规模多模板并行测序。但其通量的提高也损失了下机读长,需要通过生物信息软件来实现。

47. de novo sequencing:从头测序是指不依赖于任何基因组参考序列信息即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。48:单基因病:单基因遗传病的发生主要受一个基因的控制,其遗传方式遵循孟德尔遗传规律,因此也称为孟德尔遗传病,可简称为遗传病或单基因病。

49.二次打击假说:第一,一次突变发生于生殖细胞,此后由这个细胞分裂分化的所有细胞

都已经是突变过一次了的,如果这些细胞再次由于某些理化因素影响而发生突变,而可能会导致癌症。第二,两次突变均发生于同一体细胞,则这个细胞可能会癌变。

50.驱动基因:与癌症发生发展相关的重要基因称为驱动基因,驱动基因决定了这个癌症最

主要的原因。当驱动基因突变后,就会把癌细胞"驱动"起来。

二、综述

6. DNA结构及有关机制与测序仪设计

摘要:核酸是生命的遗传物质,除少数病毒外,大多数生物的遗传物质为DNA。DNA 的二级结构主要包括A-DNA、B-DNA、Z-DNA等,同时还有高级结构三链DNA、四

链体DNA的存在。DNA的结构具有多态性,不同形态的DNA都具有各自的生物学作用。DNA测序技术至今已经发展到了第三代测序技术,随着DNA测序技术的不断发展,我们对生物基因组的研究也越来越深入。

关键词:DNA结构;螺旋;测序技术;测序仪

一、DNA的结构和有关机制

1.1 DNA的一级结构

DNA的一级结构即是指DNA链上脱氧核苷酸的排列顺序,它们通过3’,5’-磷酸二酯键相连而形成的大分子聚合物,5’端含有磷酸(5’-Pi),3’端含有羟基(3’-OH)。DNA所特有的物理化学和生物学上的性质和功能都是源于它的一级结构。其以三联体密码子的形式来编码蛋白质,每三个核苷酸对应一个氨基酸。

1.2 DNA的二级结构

DNA的二级结构为双螺旋结构,并且在螺旋的表面都有大小不同的凹槽。DNA的二级结构具有多种构象,包括A、B、C、Z型。上世纪50年代,根据R.Franklin 和M.Wilkins对DNA纤维的X-光衍射分析以及Chargaff的碱基当量定律的提示,Watson和Crick 提出了DNA二级结构为的双螺旋模型。他们发现的这种双螺旋DNA为B-DNA,是双链DNA的优势构象,广泛存在于基因组内。B-DNA是在相对湿度为92%时进行X射线衍射图谱测定得到的,即碱基对与螺旋轴垂直,每个碱基对围绕相邻的碱基对旋转36°,因此一个螺旋含有十个碱基对,长3.4nm。螺旋外部的两个“沟”,一个宽而深,称为“大沟”,为DNA与DNA和DNA与蛋白质的相互作用提供了环境;一个窄而浅,称为“小沟”,为一些小分子和DNA相互作用提供了环境。A-DNA是在相对湿度为65%-75%的条件下形成的,每圈有11个碱基对,碱基对的平面与螺旋轴成30°。B-DNA和A-DNA在一定条件下可以相互转换,如在转录过程中,DNA模板被RNA聚合酶结合合成RNA时,DNA可能变成A型。C-DNA是以Li+作为反离子,当相对湿度降到66%时就会出现。C-DNA 呈左手螺旋,每圈螺旋含有9.3个碱基,目前这一构象仅在实验室中观察到,在生物体内并未有证据证明它的存在。Z-DNA为左手双螺旋,每圈螺旋有12个碱基对,长4.5nm,比B-DNA更细长。现有研究表明Z-DNA参与基因调节和控制基因的开关。因为Z-DNA的形成,使局部DNA双链处于不稳定状态有利于双链解开,而DNA解链是DNA复制和转录的必要环节。DNA的二级结构具有多态性,

但B-DNA是生物体内最常见、最稳定的构象,由于DNA一直处于动态的过程中,所以才会有其他构象的出现。

1.3 DNA的高级结构

DNA更高级的结构包括三链DNA和四链体DNA。三链DNA是在DNA双螺旋的基础上形成的三链区的3条链均为同源嘌呤(HPu)或同源嘧啶(HPy),即整段的碱基均为嘌呤或者嘧啶。根据第三条链的来源,三链DNA可分为分子间和

分子内两组;根据三条链的组成以及相对位置又可分为Pu-Pu-Py和Py- Pu- Py两

种类型。最常见的为Py- Pu- Py型,它的三条链中有两条链为正常的双螺旋,第

三条嘧啶链位于双螺旋的大沟中T与嘌呤链的方向一致T并随双螺旋结构一起旋转。碱基的配对方式不变,但第三条链上的C必须质子化,且与G形成两个氢键。

四链体DNA也是非经典的碱基配对方式,主要有G-quadruplex和i-motif两类。G-quadruplex是在G-四联体的中心有一个有四个带负电荷的氧原子围城的口袋,通过G-四联体的堆积可以形成分子内或分子间的右手螺旋。i-motif的形成原理为:胞嘧啶C在酸性环境下可以被质子化为C+,与C形成三氢键的配对。富含C的寡核苷酸片段部分质子化后,通过C·C+配对成平行的双链结构,然后双链反向排列,碱基对之间相互交错,从而形成四链结构。

二、DNA测序技术的发展与测序仪设计

DNA测序技术是分子生物学相关领域研究中常用的技术方法之一。迄今为止已经发展到了第三代测序技术。每一代测序技术的更迭都是技术领域的重大突破,既降低了测序的成本,又提高了测序的速度,使测序技术可以更加广泛的应用于各个领域。伴随着测序技术的不断发展,各种类型的测序仪也是争相涌现,为测序技术的进步提供了条件。

2.1第一代测序技术和测序仪设计

第一代测序技术主要SBC和SBS两种方法。SBC法是1977年美国哈佛大学的Maxam和Gilbert发明的,因此也称为Maxam-Gilbert method。该方法是利用化学

降解法来进行DNA测序。方法是将5′端被标记的目的DNA分子分别进行5个各自独立的反应,分别用不同的化学试剂将目的DNA分子部分打碎成重复的单个碱

基片段,然后进行聚丙烯酰胺凝胶电泳分离,再经过放射线自显影,根据不同泳道所显示的条带情况,从而可以获得目的DNA分子的碱基序列。SBS法是1997

年由Sanger发明的,其原理是利用双脱氧核苷三磷酸(ddNTP)的结构比脱氧核苷三磷酸(dNTP)缺少了3’-OH,因此可以使得DNA链的合成中断这个性质来

设计四个相互独立的反应。在每个反应中都分别加入四种dNTP和不同的ddNTP,并用同位素进行标记。由于加入的ddNTP的量占得比例很小,因此最后会合成出不同长度的DNA链。最后利用聚丙烯酰胺凝胶电泳分离得到DNA分子的碱基序列。由于SBS法比SBC法具有更多的优点,例如所用试剂无毒、操作简单、结果稳定、所需设备简单等等,SBS法广为使用。

上世纪80年代末期,荧光标记技术凭借更加安全的特性逐渐取代同位素标记技术。1986年,Leroy Hood发明了四色荧光物质,不同波长的激光可激发其产生不同的颜色。用这些荧光物质来标记四种不同的ddNTP,可以实现一条电泳道测定所有的反应产物,使用对应的激光器可以对胶板上的通过的测序反应产物进行扫描。测序的效率被提高了很多,分辨率也大为提高。根据上述原理,美国ABI 公司推出了第一台商品化的测序仪——ABI370A,但此阶段的测序仪并没有实现完全的自动化,其中的制胶和加样还是需要人工来完成。随着基因组学的发展对测序技术的要求,后来的毛细管电泳技术相比平板电泳技术实现了更加规模化、高通量、低成本的特点。此时期ABI公司开发的377型、373型测序仪采用了毛细管电泳技术,可以实现电泳过程自动化、并行化,灵敏度高、所需样品少,且快速高效。

2.2第二代测序技术和测序仪设计

第二代测序技术又叫下一代测序技术,它突破了第一代测序技术效率的瓶颈问题,实现了真正意义上的高通量测序,是测序技术发展史上影响最为深远的一场革命。目前第二代测序的主要技术平台包括Roche/454 GS FLX、

Illumina/SolexaGenomeAnalyzer、Helicos BioSciences公司的HeliScope? Single Molecule Sequencer、美国DanaherMotion公司推出的Polonator;以及连接法测序(sequencing by ligation),即通过引物来定位核酸信息,技术平台有Applied Biosystems/SOLiD? system。以上技术平台所运用的测序原理均为循环微阵列法。

以Illumina测序仪所使用的克隆单分子阵列技术为例来讲一下该类型的测序

仪的设计原理。将目的DNA分子打断成100~200 bp的片段,随机连接到固相基质上,经过Bst聚合酶延伸和甲酸胺变性的桥PCR循环,生成大量的DNA簇,每个DNA簇中约有1000个相同序列的DNA片段。之后的反应与Sanger法类似,加入

用4种不同荧光标记并结合了可逆终止剂的dNTP。固相基质上每个孔有八道独立检测的位点,所以一次可以并行八个独立文库,可容纳数百万的模版克隆,可把多个样品混合在一起检测,每个固相基质上一次可读取10亿个碱基。DNA簇与单链扩增产物的通用序列杂交,由于终止剂的作用,DNA聚合酶每次循环只延伸一个dNTP。每次延伸所产生的光信号被标准的微阵列光学检测系统分析测序,下一次循环中把终止剂和荧光标记基团裂解掉,然后继续延伸dNTP,实现了边合成边测序技术。

2.3第三代测序技术和测序仪设计

虽然第二代技术已经逐渐趋于成熟,但是仍然它仍然存在一些固有的问题,如成本、结果误差等,随着科学技术的进一步发展,出现了第三代测序技术。其中包括单分子读取技术和纳米孔单分子测序技术,它们都不需要PCR扩增,具有很好的应用前景。

PacBio测序仪的基本原理是单分子实时测序技术(SMRT),可以实现DNA 甲基化的直接测序。

纳米孔测序的基本原理是当单链DNA分子穿过生物分子组成的纳米级小孔时,由于不同的碱基的形状大小有差异,与孔内的环式糊精分子发生特异性反应,引起电阻变化。只要在纳米孔的两侧加上一个恒定电压就可以检测到纳米孔的电流变化,从而反映出通过小孔的单链DNA分子的碱基排序情况。该技术的主要问题暴扣纳米孔的精度、双链DNA穿过纳米孔的速度问题。

参考文献:

1.郭海学. DNA结构的多态性[J]. 生物学杂志,1999,(04):8-10.

2.李彦明,张映,关志刚. 遗传的物质基础——DNA结构的多态性[J]. 生物学通

报,2004,(09):22-24.

3.徐亮. DNA结构多态性及小分子对其识别与调控[D].武汉大学,2012.

4.谢浩,赵明,胡志迪,王大巾等.DNA测序技术方法研究及其进展.生命的化学.2015,35:811-816.

5.刘振波.DNA测序技术比较.生物学通报,2012,47:14-17.

6.MaxamAM, GilbertW. Sequencingend-labeled DNA with basespecific chemical cleavages. Methods Enzymol,1980, 65: 499-560.

7.Matthew W. Anderson and Iris Schrijver. Next Generation DNA Sequencing and the Future of Genomic Medicine. Genes 2010, 1, 38-69; doi:10.3390.

8.韩九强,吴思佳,刘瑞玲,吕红强,钟德星. 第二代基因测序仪的硬件设计[J]. 生命科学仪器,2017,(01):43-45+42.

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

现代分子生物学重点

现代分子生物学 第一章 DNA的发现: 1928年,英国Griffith的体内转化实验 1944年,Avery的体外转化实验 1952年,Hershey和Chase的噬菌体转导实验 分子生物学主要研究内容(p11) DNA的重组技术 基因表达调控研究 生物大分子的结构功能研究——结构分子生物学 基因组,功能基因组与生物信息学研究 第二章 DNA RNA组成 脱氧核糖核酸 A T G C 核糖核酸 A U G C 原核生物DNA的主要特征 ①一般只有一条染色体且带有单拷贝基因; ②整个染色体DNA几乎全部由功能基因与调控序列组成; ③几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。 染色体作为遗传物质的特点: (1)分子结构相对稳定(贮存遗传信息) (2)通过自我复制使前后代保持连续性(传递遗传信息) (3)通过指导蛋白质合成控制生物状态(表达遗传信息) (4)引起生物遗传的变异(改变遗传信息) C值以及C值反常 C值单倍体基因组DNA的总量 C值反常C值往往与种系进化的复杂程度不一致,某些低等生物却有较大的C值。如果这些DNA 都是编码蛋白质的功能基因,那么,很难想象在两个相近的物种中,他们的基因数目会 相差100倍,由此推断,许多DNA序列可能不编码蛋白质,是没有生理功能的。 DNA的中度重复序列,高度重复序列 中度各种rRNA,tRNA以及某些结构基因如组蛋白基因都属于这一类 高度卫星DNA 核小体 是由H2A H2B H3 H4 各2分子生成的八聚体和约200bp的DNA构成的,H1在核小体外面。 真核生物基因组的结构特点 ①基因组庞大; ②大量重复序列; ③大部分为非编码序列,90%以上; ④转录产物为单顺反子; ⑤断裂基因; ⑥大量的顺式作用元件; ⑦DNA多态性:SNP和串联重复序列多态性; ⑧端粒(telomere)结构。

基因组考研试题及答案解析(华东师范大学)

第一章基因组学 1、学习基因组学所面临的挑战和意义? 全面鉴定人类基因组所编码的结构和功能成分;发展对人类基因组的可遗传变异的详细理解;发展基于基因组学的方法来预测疾病的敏感性和药物反应,疾病的早期检验,以及疾病的分子分类;应用新的基因和代谢通路的知识开发有效的、新的疾病治疗方法发展;理解物种间的进化变异及其机制;关键农作物基因的克隆和功能验证;基于基因组的工具来提高农作物产量,解决世界粮食危机及全球温饱问题。 2、DNA作为遗传物质的优点? 信息量大,集成度高;碱基互补配对,保证精确复制;核糖2’碳位脱氧,在水溶液中稳定 性好;以T取代U,没有C脱氨变U的危险。 3、证明DNA双螺旋的证据? 各种生物物理证据;X射线衍射图谱;碱基比例;模型构建。 4、DNA、RNA的两个重要化学差异有哪些? 碱基组成;链数。 5、原核、真核生物基因组的不同点? 原核生物:基因组为环状双链DNA分子;只有一个复制起始点;具有操纵子结构:指数个功能上相关的基因串联在一起,连同上游的调控区和下游的转录终止信号构成基因的表达单位:一般无重叠基因;基因是连续的,无内含子;编码区在基因组中的比例;基因组中重复 序列很少;具有编码同工酶的基因(isogene):同工酶是指具有相同催化功能而化学结构不 同的酶,它受一个或几个基因座等位基因;分子中有多功能识别区域复制、转录起始区复制、转录终止区 真核生物:体细胞: 两套基因组(二倍体细胞)性细胞: 一套基因组(单倍体细胞);基因组结构复杂,数目庞大, 多个复制起始点;mRNA为单顺反子:真核基因转录产物为单顺反子,即一种基因编码一种多肽链或RNA链,每个基因转录有各自的调节元件;含大量重复 序列;非编码序列占90%以上;基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子;功能相关的基因串联在一起形成基因家族 7、真核生物染色体三大要素及功能? 着丝粒:控制细胞分裂时染色体的取向和移动;端粒:防止染色体末端粘连,保证DNA长度稳定;复制原点:起始DNA复制。 8、染色体末端的端粒为什么很重要? 维持染色体结构的完整性,防止染色体被核酸酶降解及染色体间相互融和;防止染色体结构基因在复制时丢失,解决了末端复制的难题。 9、人类基因组中存在哪些类型的重复DNA? 串联重复基因: 6、简述DNA组成基因的两个重要实验? 第二章基因组的复制 1、在Meselson-Stahl的实验前,我们不知道DNA复制是“弥散型”“半保留型”或“全保留型”,描述经几种不同方式复制,子代分子DNA中DNA的区别? 2、什么是半不连续复制模型? 前导链(leading strand):以5’-3’方向连续合成的DNA 链 滞后链(lagging strand):总体上沿着3’到5’方向延伸,但以小片段形式(5¢-3¢)不连续合成,最后共价连接起来 3、为什么需要RNA引物来引发DNA复制呢? (1)RNA引物可以提供3’-OH末端作合成新DNA链起点。

基因组学复习题

基因组学复习题 Prepared on 22 November 2020

第1章 1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

第四章 基因与基因组学(答案)

第四章基因与基因组学(答案) 一、选择题 (一)单项选择题 1.关于DNA分子复制过程的特点,下列哪项是错误的? A.亲代DNA分子双股链拆开,形成两条模板链 B.新合成的子链和模板链的碱基互补配对 C.复制后新形成的两条子代DNA分子的碱基顺序与亲代的DNA分子完全相同 D. 以ATP、UTP、CTP、GTP和TDP为合成原料 E.半不连续复制 *2.建立DNA双螺旋结构模型的是: A.Mendel B.Morgan C.Hooke D.Watson and Crick E.Sthleiden and Schwann *3.下列哪个不属于基因的功能? A.携带遗传信息 B.传递遗传信息 C.决定性状 D.自我复制 E.基因突变 4.DNA分子中核苷酸顺序的变化可构成突变,突变的机制一般不包括: A.颠换 B.内复制 C.转换 D.碱基缺失或插入 E.不等交换 5.下列哪一种结构与割(断)裂基因的组成和功能的关系最小? A.外显子 B.内含子 C.TATA框 D.冈崎片段 E.倒位重复顺序 *6.在一段DNA片段中发生何种变动,可引起移码突变? A.碱基的转换 B.碱基的颠换 C.不等交换 D.一个碱基对的插入或缺失 E.3个或3的倍数的碱基对插入或缺失 7.从转录起始点到转录终止点之间的DNA片段称为一个: A.基因 B.转录单位 C.原初转录本 D.核内异质RNA E.操纵子 8.在DNA复制过程中所需要的引物是; A.DNA B.RNA C.tRNA D.mRNA E.rRNA 9.下列哪一项不是DNA自我复制所必需的条件? A.解旋酶 B.DNA多聚酶 C.RNA引物 D. ATP、GTP、CTP和TTP及能量 E.限制性内切酶 10.引起DNA形成胸腺嘧啶二聚体的因素是 A.羟胺 B.亚硝酸 C.5-溴尿嘧啶 D.吖啶类 E.紫外线 11.引起DNA发生移码突变的因素是 A.焦宁类 B.羟胺 C.甲醛 D.亚硝酸 E.5-溴尿嘧啶 12.引起DNA分子断裂而导致DNA片段重排的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 13.可以引起DNA上核苷酸烷化并导致复制时错误配对的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 14.诱导DNA分子中核苷酸脱氨基的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 15.由脱氧三核苷酸串联重复扩增而引起疾病的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 16.在突变点后所有密码子发生移位的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 *17.异类碱基之间发生替换的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 18.染色体结构畸变属于 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 *19.由于突变使编码密码子形成终止密码,此突变为 A.错义突变 B.无义突变 C.终止密码突变 D.移码突变 E.同义突变 *20.不改变氨基酸编码的基因突变为 A.同义突变 B.错义突变 C.无义突变 D.终止密码突变 E.移码突变 21.可以通过分子构象改变而导致与不同碱基配对的化学物质为 A.羟胺 B.亚硝酸 C.烷化剂 D.5-溴尿嘧啶 E.焦宁类 *22.属于转换的碱基替换为 A.A和C B.A和T C.T和C D.G和T E.G和C *23.属于颠换的碱基替换为 A.G和T B.A和G C.T和C D.C和U E.T和U (二)多项选择题

分子生物学考试重点

基因文库:包括基因组文库和部分基因文库。将含有某种生物不同基因的许多 DNA片段,(导入受体菌的群体中储存,各个受体菌分别含有这种生物的不同的基因,称为基因文库。) 蛋白激酶:是指能够将磷酸集团从磷酸供体分子转移到底物蛋白的氨基酸受体上的一大类酶。 蛋白磷酸酶:是具有催化已经磷酸化的蛋白质分子发生去磷酸化反应的一类酶分 子,与蛋白激酶相对应存在,共同构成了磷酸化和去磷酸化这一重要的蛋白质活性的开关系统。 受体:是细胞膜上或细胞内能识别外源化学信号并与之结合的蛋白分子。是信息分子的接收分子,它们的化学本质是存在于细胞表面或细胞内的蛋白分子。mRNA剪接:去除初级转录物上的内含子,把外显子连接成为成熟RNA的过程前导链:在复制过程中,连续复制的链的前进方向始终与复制叉前进方向一致称为前导链 校对:DNApolI的3’到5’外切酶活性将错配的A水解下来,同时利用5’到3’聚合 酶活性补回正确配对的C,复制可以继续下去,这种功能称为校对 核小体:真核生物染色质由DNA与蛋白质构成,其基本单位是核小体。各两分子的H2A、H2B、H3、H4构成八聚体的核心组蛋白,双链DNA缠绕在这一核心上形成核小体的核心颗粒。颗粒之间再由DNA和组蛋白H1构成的链接区相连形成串珠样结构。 解链温度/融解温度(Tm):在解链过程中,紫外吸光度的变化ΔA260达到最大变化值的一半时所对应的温度定义为DNA的解链温度或融解温度。Tm值:DNA在加热变性过程中,紫外吸收值达到最大值的50%时的温度 增色效应:在DNA解链过程中,由于有更多的共轭双键得以暴露,含有DNA的溶液在260nm 处的吸光度随之增加,这种现象称为DNA的增色效应 DNA复性:当变性条件缓慢除去后,使原来两条彼此分离的DNA链重新缔合,形成双螺旋结构,这个过程称为DNA的复性。 退火:热变性的DNA经缓慢冷却后可以复性,这一过程称为退火。 DNA变性:某些理化因素(温度,pH,离子强度)导致DNA双链互补碱基对之间的氢键发生断裂,使DNA双链解离为单链的现象 DNA复制:以亲代DNA分子为模板按照碱基配对原则合成子代DNA分子的过程。广义也指DNA或RNA基因组的扩增过程,其化学本质是酶促脱氧核苷酸聚合反应 不对称转录:在DNA分子双链上,按碱基互补配对规律能指导转录生成RNA的一股链作为模板指导转录,另一股链则不转录,这种模板选择性称为不对称转录 转录:以DNA为模板合成RNA的过程称为转录。 逆转录:是以RNA为模板合成DNA的过程,即RNA指导下的DNA合成。此过程中,核酸合成与转录(DNA到RNA)过程与遗传信息的流动方向(RNA到DNA)相反称为逆转录 颠换:嘌呤被嘧啶取代或反之。 转换:DNA链中一种嘌呤被另一种嘌呤取代,或嘧啶被另一种嘧啶所取代。

基因组学答案

基因组学答案 名词解释: 1基因组:生物的整套染色体所含有的全部DNA序列 2物理作图;采用分子生物学技术直接将DNA标记,基因或克隆标定在基因组的实际位置所构建的位置图,物理图的距离依作图方法而异,辐射杂种作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距单位为DNA的分子长度,即碱基对 3单核苷酸多态性:基因组中单个核苷酸的突变称为点突变 4蛋白质组:基因组表达的最终结果是一组蛋白质 5开放阅读框:所有编码蛋白质的基因都含有开放读框,它们由一系列5指令氨基酸的密码子组成 6兼性异染色质:细胞中非持久性的异染色质,仅在某些细胞或细胞的某一阶段出现 7副突变:指在杂合子中某一等位基因影响同一座位上另一等位基因的表达 8表观遗传:不涉及DNA序列的编译,但基因的表达模式发生了可遗传的改变,并能通过有丝分裂和减数分裂将改变的基因表达模式传递给子细胞或下一代的过程 9染色质重建:染色质由收缩状态向伸展开放状态的转变 10基因组印记:印记基因的表达取决于它是在父源染色体上还是在母源染色体上,来自父源和母源的印记基因有所不同 1C值;指的是一个单倍体基因组中DNA的总量 2限制性片段长度多态性:由于同源染色体同一区段DNA序列的差异,当用限制酶处理时,可产生产生长度不同的限制性片段。3微卫星序列:其重复单位为1-6个核苷酸,由10-50个重复单位串联组成 4遗传作图:采用遗传学分析方法将基因或其它DNA分子标记标定在染色体上构建连锁图称之为遗传连锁图 5基因等高线:指连续分布的具有相似碱基组成的DNA片段,她们在基因组中成片相嵌排列 6组成性异染色质:这是所有细胞中均有的一种持久性的结构,这些染色质不含任何基因,总是保持紧密的组成状态 7基因组:生物的整套染色体所含有的全部DNA序列 8染色体重排:涉及染色体不同区段相对位置的重新排列,是基因组进化的重要途径之一 9转录物组:基因组在整个生命过程中所表达的全部转录产物的总和 10假基因:指来源于功能基因但已使其活性的DNA序列,有沉默的假设基因,也有可转录的假基因 基因组学简答题: 1生物基因中有哪些异常结构基因? 重叠基因、基因内基因、反义基因 2有哪些DNA分子标记? 限制性片段长度多态性、简单序列长度多态性、单核苷 酸多态性 3miRNA的生物学功能有哪些? 1在mRNA翻译起始后干扰翻译的继续进行2在翻译的起始阶段阻止翻译起始复合物的组装3促使mRNA降解4遗传密码有什么特点? 通用性、兼并性、摇摆、偏爱、偏离(课本230) 5真核生物DNA复制有哪些特点? 1互补单链的合成以5’-3’极性方式进行 2DNA两条分子链的合成在时间上和空间上的非对称性的 3RNA其实合成不需要引物,但DNA起始复制需要引物。 4细胞中新链DNA的合成以碱基互补方式进行 6简述高等真核生物基因组序列组成。 高度重复序列,中度重复序列,单一序列,基因主要位于单一序列 7简述细胞器基因组起源的内共生理论 细胞器中基因表达的过程与细菌的情况相似。细胞器基因与细菌基因序列的相似性高于同源核基因。因此内共生学说认为线粒体和叶绿体是游离细菌的化身,他们曾于远古的真核细胞结合,并最终定居在真核细胞中。 8基因租的cpG岛有什么特点? 1)已知的大多数的CPG岛都位于管家基因和大部分阻止专一性表达基因的5’侧翼区以及基因的第一个的外显子区。2)CpG 岛中双碱基CpG均为甲基化。而整个基因组中约60%-80%的CpG 军备甲基化。 9比较遗传图与物理图的组成可以得到什么启示? 1)重组率随让染色体长度的增加而递减,人类的21号染色体的长臂的重组率为1Cm/Mb,短臂侧围2Cm/mb;2)大多数染色体近着丝粒区重组率受到抑制,远着丝粒区重组率趋向增加;3)染色体连锁不平衡的碱基组成和基因组成有明显的特征 10生物进化历程中,新基因有哪些产生方式? 1基因加倍后的趋异2外显子或结构域洗牌3逆转录及其随后的趋异或重排4外源基因水平转移5基因裂变和融合6非编码序列转变为编码序列 论述题: 1叙述真核生物与原核生物基因组的差异。 1)真核基因组指一个五中的单倍体染色体组所含有的整套基因,原核一般只有一个环状DNA分子,其上所含有的基因为一个基因组:2)原核的染色体分子量较小,基因组含有大量单一顺序,真核基因组存在大量非编码序列:3)原核还含有各种质粒和转座因子:4)真核的基因组都是由DNA序列组成,原核基因组还可能由RNA组成 2概述基因组的研究内容 1)以原基因测序为目标的结构基因学;2)以基因功能鉴定为目标的功能基因学 3有哪些试验方法可以研究基因功能 剔除,RNA干扰,过量表达

基因组学试题

基因组学试题 1、什么是基因组(5分)?什么是转录组(5份)?说明基因组 合的关系和异同(10分)基因组是生物体(细胞或病毒)中所有的DNA的总和, 包括所有的基因和基因间区域,包 括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。 基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA 量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异 转录组: ?生物体、组织、细胞不同生长发育阶段的转录产物不同。 ?生物体不同组织、同一组织不同细胞的转录产物不同。 ?生物体、组织、细胞不同环境、不同生理状态下的转录产物 不同。 ?转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA 2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组 ?一条环状DNA; ?只有一个复制起始点; ?有操纵子(Operon)结构

1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起, 手统一调控区调控。 2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节 子(regulon)调控。 ?结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质 ?基因是连续的,无内含子,转录后不剪接; ?重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。 真核生物基因组 ?复杂的染色体结构,一般有多条染色体 ?每条染色体上有多个复制起始点; ?基因组中有大量的重复序列(轻度、中度、高度重复); ?基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;?有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族 ?有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。 3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义 何在(15分)?采用遗传学分析方法将基因或其它DNA标记

分子生物学试题_完整版(Felisa)

05级分子生物学真题 一、选择题 1、激活子的两个功能域,一个是转录激活结构域,另一个是(DNA结合域) 2、转录因子包括通用转录因子和(基因特异转录因子) 3、G-protein激活needs(GTP)as energy. 4、Promoters and(enhancers)are cis-acting elements. 5、噬菌体通过(位点专一重组)整合到宿主中 6、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 7、mRNA的剪切跟(II)类内含子相似 8、UCE是(I)类启动子的识别序列 9、TATA box binding protein在下列哪个启动子里面存在(三类都有) 10、(5S rRNA)是基因内部启动子转录的 11、人体全基因组大小(3200000000bp) 12、与分枝位点周围序列碱基配对的剪接体(U2snRNP) 13、tRNA基因是RNA聚合酶(III)启动的 14、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 15、乳糖操纵子与阻遏蛋白结合的物质是(异构乳糖)。 16、核mRNA的内含子剪接和(II类内含子剪接)的过程相似 17、基因在转录时的特点(启动子上无核小体) 18、RNA干涉又叫(转录后的基因沉默,PTGS) 19、内含子主要存在于(真核生物) 20、snRNA在下列哪种反应中起催化酶的作用(mRNA的剪接) 二、判断题 1、原核生物有三种RNA聚合酶。 2、抗终止转录蛋白的机制是使RNA聚合酶忽略终止子。 3、RNA聚合酶II结合到启动子上时,其亚基的羧基末端域(CTD)是磷酸化的。 4、Operon is a group of contiguous,coordinately controlled genes. 5、RNA聚合酶全酶这个概念只应用于原核生物。 6、聚腺苷酸尾是在mRNA剪接作用前发生的。 7、σ在转录起始复合复合物中使得open到closed状态(closed转变成open) 8、剪接复合体作用的机制:组装、作用、去组装,是一个循环 三、简答题 1、原核生物转录终止的两种方式。 2、组蛋白乙酰化对基因转录的影响。 3、G蛋白在翻译中的作用有哪些? 4、什么是转座?转座子有哪些类型? 5、简述增强子的作用机制。 04级分子生物学期末题目 一、选择题(20题) 1、tRNA的5端剪切所需的酶(RNase P) 2、人体全基因组大小(3,200,000,000bp) 3、(5S rRNA)是基因内部启动子转录的 4、线虫反式剪接所占比例(10%-20%) 5、与分枝位点周围序列碱基配对的剪接体(U2snRNP)

分子生物学知识点归纳

分子生物学 1.DNA的一级结构:指DNA分子中核苷酸的排列顺序。 2.DNA的二级结构:指两条DNA单链形成的双螺旋结构、三股螺旋结构以及四股螺旋结构。 3.DNA的三级结构:双链DNA进一步扭曲盘旋形成的超螺旋结构。 4.DNA的甲基化:DNA的一级结构中,有一些碱基可以通过加上一个甲基而被修饰,称为DNA的甲基化。甲基化修饰在原核生物DNA中多为对一些酶切位点的修饰,其作用是对自身DNA产生保护作用。真核生物中的DNA甲基化则在基因表达调控中有重要作用。真核生物DNA中,几乎所有的甲基化都发生于二核苷酸序列5’-CG-3’的C上,即5’-mCG-3’. 5.CG岛:基因组DNA中大部分CG二核苷酸是高度甲基化的,但有些成簇的、稳定的非甲基化的CG小片段,称为CG岛,存在于整个基因组中。“CG”岛特点是G+C含量高以及大部分CG二核苷酸缺乏甲基化。6.DNA双螺旋结构模型要点: (1)DNA是反向平行的互补双链结构。 (2)DNA双链是右手螺旋结构。螺旋每旋转一周包含了10对碱基,螺距为3.4nm. DNA双链说形成的螺旋直径为2 nm。每个碱基旋转角度为36度。DNA双螺旋分子表面存在一个大沟和一个小沟,目前 认为这些沟状结构与蛋白质和DNA间的识别有关。 (3)疏水力和氢键维系DNA双螺旋结构的稳定。DNA双链结构的稳定横向依靠两条链互补碱基间的氢键维系,纵向则靠碱基平面间的疏水性堆积力维持。 7.核小体的组成: 染色质的基本组成单位被称为核小体,由DNA和5种组蛋白H1,H2A,H2B,H3和H4共同构成。各两分子的H2A,H2B,H3和H4共同构成八聚体的核心组蛋白,DNA双螺旋缠绕在这一核心上形成核小体的核心颗粒。 核小体的核心颗粒之间再由DNA和组蛋白H1构成的连接区连接起来形成串珠样结构。 8.顺反子(Cistron):由结构基因转录生成的RNA序列亦称为顺反子。 9.单顺反子(monocistron):真核生物的一个结构基因与相应的调控区组成一个完整的基因,即一个表达单位,转录物为一个单顺反子。从一条mRNA只能翻译出一条多肽链。 10.多顺反子(polycistron): 原核生物具有操纵子结构,几个结构基因转录在一条mRNA链上,因而转录物为多顺反子。每个顺反子分别翻译出各自的蛋白质。 11.原核生物mRNA结构的特点: (1) 原核生物mRNA往往是多顺反子的,即每分子mRNA带有几种蛋白质的遗传信息。 (2)mRNA 5‘端无帽子结构,3‘端无多聚A尾。 (3)mRNA一般没有修饰碱基。 12.真核生物mRNA结构的特点: (1)5‘端有帽子结构。即7-甲基鸟嘌呤-三磷酸鸟苷m7GpppN。 (2)3‘端大多数带有多聚腺苷酸尾巴。 (3)分子中可能有修饰碱基,主要有甲基化。 (4)分子中有编码区和非编码区。 14.tRNA的结构特点 (1)tRNA是单链小分子。 (2)tRNA含有很多稀有碱基。 (3)tRNA的5‘端总是磷酸化,5’末端核苷酸往往是pG. (4)tRNA的3‘端是CCA-OH序列。是氨基酸的结合部位。 (5)tRNA的二级结构形状类似于三叶草,含二氢尿嘧啶环(D环)、T环和反密码子环。 (6)tRNA的三级结构是倒L型。D环和T环在L的拐角上。 15.rRNA (1)rRNA是细胞内含量最丰富的RNA,它们与核糖体蛋白共同构成核糖体,后者是蛋白质合成的场所。 (2)核糖体和rRNA一般都用沉降系数S表示大小。原核生物核糖体的沉降系数为70S,由50S和30S 两个大小亚基组成,30S小亚基含有16SrRNA和21种蛋白质。50S大亚基含有23S和5SrRNA以及 34种蛋白质。真核生物沉降系数为80S,由大小亚基组成。40S小亚基含有18SrRNA和30多种蛋 白质。60SrRNA含有5S、5.8S和28SrRNA 以及大约45种蛋白质。 16.核酶(ribozyme):某些RNA分子能催化自身或其他RNA分子进行化学反应,即具有酶样的催化活性,这类具有催化活力的RNA称为核酶。核酶分为3类:(1) 异体催化的剪切型。(2)自体催化的剪切型(3)内含子的自我剪切型。 17.核内不均一RNA(hnRNA):真核生物转录生成的mRNA前体即为hnRNA。这类mRNA前体必须经过一系列的加工处理才能变成成熟的mRNA。加工过程的主要环节包括:(1)5‘端加帽(2)3’端加尾(3)内含子的切除和外显子的连接(4)分子内部的甲基化修饰(5)核苷酸序列的编辑作用。 18.miRNA:是一种单链小分子RNA,广泛存在于真核生物中,是一组不编码蛋白质的短序列RNA,其特点就是高度的保守性、时序性和组织特异性。研究表明miRNA可能决定组织和细胞的功能特异性,也可能参与了复杂的基因调控,对组织的发育起重要作用。 19.siRNA:小干扰RNA。是人工合成的短的双链RNA,它可抑制细胞内特定基因的表达,导致转录后基因失

基因组学复习题

第1章 1)什么是C-值悖理?什么是N-值悖理? C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类? mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型? tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因?假基因是如何形成的? 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达? 为什么? 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族? 什么是超基因家族? 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别?为什么会产生这些差别? 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

基因组学复习资料整理

基因组学 1. 简述基因组的概念和其对生命科学的影响。 基因组:指一个物种的全套染色体和基因。广义的基因组:核基因组,线粒体基因组,叶绿体基因组等。 基因组计划对生命科学的影响: ①研究策略的高通量,彻底认识生命规律:基因组研究高通量,研究手段和 研究策略的更新,加强了生命科学研究的分工与协作,从不同层次深入研究生命现象。 ②促进了相关学科的发展:分子生物学遗传学生物信息学生物化学细胞生 物学生理学表观遗传学等 ③物种的起源与进化: Ⅰ.重要基因的发掘、分离和利用:遗传疾病相关基因,控制衰老的基因,工业价值的细菌基因,重要农艺性状基因等。 Ⅱ.充分认识生命现象:基因的表达、调控,基因间的相互作用,不同物种基因组的比较研究,揭示基因组序列的共性,探讨物种的起源和进化。 ④伦理学法律问题:伦理问题,知识产权问题,法律问题,社会保险问题。 2. Ac/Ds转座因子 Ac因子有4563bp,它的大部分序列编码了一个由5个外显子组成的转座酶基因,成熟的mRNA有3500bp。该因子本身的两边为11bp的反向重复末端(IR),发生错位酶切的靶序列长度8bp。Ds因子较Ac因子短,它是由Ac因子转座酶基因发生缺失而形成的。不同的Ds因子的长度差异由Ac因子发生不同缺失所致。 Ac/Ds因子转座引起的插入突变方式:玉米Bz基因是使糊粉层表现古铜色的基因,当Ac/Ds转座插入到Bz基因座后,糊粉层无色。当Ac/Ds因子在籽粒发育过程,部分细胞发生转座,使Bz靶基因发生回复突变,从而形成斑点。 Ac/Ds两因子系统遗传特点: 1)Ac具有活化周期效应,有活性的Ac+因子被甲基化修饰后会形成无活性的ac-因子,反之无活性的ac-因子去甲基化成有活性的Ac+因子。 2)Ac与Ds因子有时表现连锁遗传但更多表现独立遗传。 3)Ac对Ds的控制具有负剂量效应。 4)Ac/Ds可引发靶基因表现为插入钝化、活性改变、表达水平改变和缺失突变等。 5)Ds的结构不同,插入同一靶基因的位点可能不同,形成的易变基因的表型也不同。(分子生物学79-81) 3. 正向遗传与反向遗传 正向遗传学研究指从突变体开始的遗传学研究,关心的问题是突变体表型的变化是由哪一个基因功能丧失后引起。 反向遗传学研究指从基因序列开始的遗传学研究,关心的问题是基因功能丧失后会使植物的表型产生什么样的变化。

遗传学重点名词解释

Chapter 1 性状(character): 生物体所表现的明显的能够遗传的特征。 单位性状(unit character):一个基因或一组基因所决定的一个性状,作为一个遗传单位进行传导。 相对性状(contrasting character):遗传学中同一单位性状的相对差异。 真实遗传(true-breeding)自带性状永远与亲代性状相同的遗传方式。 纯系(pure line):能够进行真是遗传的品种。 三个假说:(1)遗传因子成对存在(颗粒遗传因子) (2)显隐性(3)分离 表型(phenotype):个体形状的外在表现。 基因型(genotype):决定个体表型的基因形式。 等位基因(allele):一个基因的不同形式,是由突变形成的。 纯合体(homozygote):基因座上有两个相同的等位基因,就这个基因座而言,这种个体或细胞成为纯合体。 杂合体(heterozygote):基因座上有两个不同的等位基因。 侧交:杂交产生的后代与隐性纯合亲本交配以检测自带个体基因型。 自由组合定律:配子形成后,同一基因的等位基因分离,非等位基因自由组合。 染色体(chromosome)常由脱氧核糖核酸、蛋白质和少量核糖核酸组成的线状或棒状物,是生物主要遗传物质的载体。 染色质(euchromatin):用碱性染料染色时着色浅的部位,是构成染色体DNA 的主体,在间期呈高度分散状态。 异染色质(heterochromatin):用碱性染色质染色时着色深的部位,又分为组成型染色质. 组成型染色质(constitutive heterochromatin): 在染色体上的大小和位置恒定,在间期时,仍保持螺旋化。如着丝粒。 兼性异染色体(facultative heterochromatin.): 起源于常染色质,在个体发育的特定阶段可转变成异染色质。如x染色体失活。 着丝粒(centromeres):每个染色体上都有一个高度浓缩的区域。 核型分析(karyotype):是指某一物种染色体的组成,通常用中期染色体的照片,铵长臂的大小或总的长度排列,用来表明物种的特点以及和亲缘种之间的进化关系。 带型(banding patterns):用特定的染料对染色体染色后,会出现深浅不一的条带,条带的位置和大小既有高度的染色体的专一性。 端粒(tele mere): 真核生物染色体的末端,有许多成串短的序列组成。 端粒的功能:稳定染色体末端结构,防止染色体间末端连接,并可补偿前导链和后滞链5’末端在消除RNA 引物后造成的空缺。 细胞周期(cell cycle):一次分裂的开始到下一次分裂的开始的这段时间。 姐妹染色单体(sister chromosome):染色体复制,着丝粒的DNA也复制,尽管仅能看到一个着丝粒。复制了的染色体是两个完全一样的拷贝。 G1 S关卡:检测细胞大小和DNA是否受损伤。 G2 M关卡:细胞进入有丝分裂之前检测细胞的生理状态。(如果DNA复制

相关文档
最新文档