基因组学试题

基因组学试题
基因组学试题

基因组学与生物信息学闭卷考试I:笔试题

1、请介绍用于遗传图谱构建的至少三种DNA分子标记,包括其名称(中英文)、基本原理及优缺点。(15分)

4 SSR(SSLP)

简单序列重复标记(Simple sequence repeat, 简称SSR标记)或简单序列长度多态性(Simple sequence length polymorphism, 简称SSLP标记)

由Moore等于1991年创立。SSR即微卫星DNA,是一类由几个(多为1-5个)碱基组成的基序(motif)串联重复而成的DNA序列,其长度一般较短,广泛分布于基因组的不同位置,如(CA)n、(AT)n、(GGC)n等重复。不同遗传材料重复次数的可变性,导致了SSR长度的高度变异性,这一变异性正是SSR标记产生的基础。尽管微卫星DNA分布于整个基因组的不同位置,但其两端序列多是保守的单拷贝序列,因此可以根据这两端的序列设计一对特异引物,通过PCR技术将其间的核心微卫星DNA序列扩增出来,利用电泳分析技术就可获得其长度多态性,即SSR标记。

SSR标记的主要特点有:(1)数量丰富,广泛分布于整个基因组;(2)具有较多的等位性变异;(3)共显性标记,可鉴别出杂合子和纯合子;(4)实验重复性好,结果可靠;(5)由于创建新的标记时需知道重复序列两端的序列信息,因此其开发有一定困难,费用也较高。

5STS

序标位(Sequence tagged sites, 简称STS标记)

由Olson于1989年开发成功。STS是指基因组中长度为200-500bp,且核苷酸顺序已知的单拷贝序列,通过PCR可将其专一扩增出来。其基本原理是,依据单拷贝的RFLP探针、微卫星序列、Alu因子等两端序列,设计合适的引物,进行PCR扩增,电泳显示扩增产物多态性。有时扩增产物还需要特定的限制性内切酶酶解后才能表现出多态性。目前用于STS引物设计的主要是RFLP探针。

STS标记的主要特点有:(1)标记来源广,数量多;(2)共显性遗传,可区分纯合子和杂合子;(3)技术简便,检测方便;(4)与SSR标记一样,开发依赖于序列分析及引物合成,成本较高;(5)多态性常常低于相应的RFLP标记,这是因为STS仅仅检测该引物所分布区域的片段差异或酶切位置差异,而RFLP标记的多态性往往可能是探针以外区域的差异,这一部分差异无法转化成STS标记的多态性。

1 RFLP

限制性片段长度多态性标记(Restriction fragment length polymorphism, 简称RFLP标记)

该技术由Grodzicker等于1974年创立。特定生物类型的基因组DNA经某一种限制性内切酶完全酶解后,会产生分子量不同的同源等位片段,或称限制性等位片段。RFLP标记技术的基本原理就是通过电泳的方法分离和检测这些片段。凡是可以引起酶解位点变异的突变,如点突变(新产生和去除酶切位点)和一段DNA的重新组织(如插入和缺失造成酶切位点间的长度发生变化)等均可导致限制性等位片段的变化,从而产生RFLP。该技术包括以下基本步骤:DNA提取;用DNA限制性内切酶消化;凝胶电泳分离限制性片段;将这些片段按原来的顺序和位置转移到易操作的滤膜上;用放射性同位素或非放射性物质标记的DNA作探针与膜上的DNA杂交(称 Southern杂交);放射性自显影或酶学检测显示出不同材料对该探针的限制性酶切片段多态性。

RFLP标记的主要特点有:(1)遍布于整个基因组,数量几乎是无限的;(2)无表型效应,不受发育阶段及器官特异性限制;(3)共显性,可区分纯合子和杂合子;(4)结果稳定、可靠;(5)DNA需要量大,检测技术繁杂,难以用于大规模的育种实践中。

2、什么是基因组诠释(Genome Annotation)?可以从哪几个水平进行?试举例分析其对基因组学研究的意义。(15分)

In the context of genomics, annotation is the process of marking the genes and other biological fea tures in a DNA sequence.

在基因组图谱中,基因组诠释是一个在DNA序列中标记基因和生物学功能的过程。

基因组序列诠释可以从以下两个水平进行:基因水平、蛋白水平、转录水平。

步骤:1。寻找基因;2。获取基因全长cDNA序列;3。确定DNA顺序中基因的位置;4。实验确认基因的功能;5。基因表达;6。蛋白质组学

意义:基因组是由编码序列和非编码序列组成,基因诠释能有效寻找基因在基因组中的位置,并对其功能进行研究,能有效揭示基因组序列所包含的全部遗传信息、基因组作为一个整体是如何行使其功能的。

3. 1988年建立的美国国家生物技术信息中心(NCBI)是生命科学研究者经常要访问的重要网站,因为它可以提供许多免费的资源服务和在线分析工具(或软件),那么请列举至少5种并说明其功能(或用途)。(15分)

4.简述研究蛋白质与蛋白质相互作用的方法。(15分)

双杂交

酵母双杂交系统由Fields和Song等首先在研究真核基因转录调控中建立。典型的真核生长转录因子,如GAL4、GCN4、等都含有二个不同的结构域: DNA结合结构域(DNA-binding domain)和转录激活结构域(transcription-activating domain)。前者可识别DNA上的特异序列,并使转录激活结构域定位于所调节的基因的上游,转录激活结构域可同转录复合体的其他成分作用,启动它所调节的基因的转录。二个结构域不但可在其连接区适当部位打开,仍具有各自的功能。而且不同两结构域可重建发挥转录激活作用。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白-蛋白的相互作用。主要有二类载体: a 含DNA -binding domain的载体; b 含DNA-activating domain的载体。上述二类载体在构建融合基因时,测试蛋白基因与结构域基因必须在阅读框内融合。融合基因在报告株中表达,其表达产物只有定位于核诓拍芮 ǜ婊 虻淖 肌@ 鏕AL4-bd具有核定位序列(nuclear-localization sequence),而GAL4-ad没有。因此,在GAL4-ad氨基端或羧基端应克隆来自SV40的T-抗原的一段序列作为核定位的序列。

双杂交系统的另一个重要的元件是报道株。报道株指经改造的、含报道基因(reporter gene)的重组质粒的宿主细胞。最常用的是酵母细胞,酵母细胞作为报道株的酵母双杂交系统具有许多优点: 〈1〉易于转化、便于回收扩增质粒。〈2〉具有可直接进行选择的标记基因和特征性报道基因。〈3〉酵母的内源性蛋白不易同来源于哺乳动物的蛋白结合。一般编码一个蛋白的基因融合到明确的转录调控因子的DNA-结合结构域(如GAL4-bd, LexA-bd);另一个基因融合到转录激活结构域(如GAL4-ad, VP16)。激活结构域融合基因转入表达结合结构域融合基因的酵母细胞系中,蛋白间的作用使得转录因子重建导致相邻的报道基因表达(如lacZ),从而可分析蛋白间的结合作用。

酵母双杂交系统能在体内测定蛋白质的结合作用,具有高度敏感性。主要是由于:①采用高拷贝和强启动子的表达载体使杂合蛋白过量表达。②信号测定是在自然平衡浓度条件下进行,而如免疫共沉淀等物理方法为达到此条件需进行多次洗涤,降低了信号强度。③杂交蛋白间稳定度可被激活结构域和结合结构域结合形成转录起始复合物而增强,后者又与启动子DNA结合,此三元复合体使其中各组分的结合趋于稳定。④通过mRNA产生多种稳定的酶

使信号放大。同时,酵母表型, X-Gal及HIS3蛋白表达等检测方法均很敏感

亲和层析

亲和层析(affinity chromatography)

利用共价连接有特异配体的层析介质分离蛋白质混合物中能特异结合配体的目的蛋白或其它分子的层析技术。

(一)原理

亲和层析是一种吸附层析,抗原(或抗体)和相应的抗体(或抗原)发生特异性结合,而这种结合在一定的条件下又是可逆的。所以将抗原(或抗体)固相化后,就可以使存在液相中的相应抗体(或抗原)选择性地结合在固相载体上,借以与液相中的其他蛋白质分开,达到分离提纯的目的。

此法具有高效、快速、简便等优点。

(二)载体的基本要求和选择

理想的载体应具有下列基本条件:①不溶于水,但高度亲水;②惰性物质,非特异性吸附少;

③具有相当量的化学基团可供活化;④理化性质稳定;⑤机械性能好,具有一定的颗粒形式以保持一定的流速;⑥通透性好,最好为多孔的网状结构,使大分子能自由通过;⑦能抵抗微生物和醇的作用。

可以做为固相载体的有皂土、玻璃微球、石英微球、羟磷酸钙、氧化铝、聚丙烯酰胺凝胶、

淀粉凝胶、葡聚糖凝胶、纤维素和琼脂糖。在这些载体中,皂土、玻璃微球等吸附能力弱,且不能防止非特异性吸附。纤维素的非特异性吸附强。聚丙烯酰胺凝胶是目前的首选优良载体。

琼脂糖凝胶的优点是亲水性强,理化性质稳定,不受细菌和酶的作用,具有疏松的网状结构,在缓冲液离子浓度大于0.05Mol/L时,对蛋白质几乎没有非特异性吸附。琼脂糖凝胶极易被溴化氢活化,活化后性质稳定,能经受层析的各种条件,如0.1Mol/L NaOH或1Mol/L HCl 处理2h~3h及蛋白质变性剂7Mol/L尿素或6Mol/L盐酸胍处理,不引起性质改变,故易于再生和反复使用。

琼脂糖凝胶微球的商品名为Sepharose,含糖浓度为2%、4%、6%时分别称为2B、4B、6B。因为Sepharose 4B的结构比6B疏松,而吸附容量比2B大,所以4B应用最广。

免疫共沉淀

免疫共沉淀(Co-Immunoprecipitation)是以抗体和抗原之间的专一性作用为基础的用于研究蛋白质相互作用的经典方法。是确定两种蛋白质在完整细胞内生理性相互作用的有效方法。其原理是:当细胞在非变性条件下被裂解时,完整细胞内存在的许多蛋白质-蛋白质间的相互作用被保留了下来。如果用蛋白质X的抗体免疫沉淀X,那么与X在体内结合的蛋白质Y也能沉淀下来。这种方法常用于测定两种目标蛋白质是否在体内结合;也可用于确定一种特定蛋白质的新的作用搭档。

其优点为:(1)相互作用的蛋白质都是经翻译后修饰的,处于天然状态;(2)蛋白的相互作用是在自然状态下进行的,可以避免人为的影响;(3)可以分离得到天然状态的相互作用蛋白复合物。缺点为:(1)可能检测不到低亲和力和瞬间的蛋白质-蛋白质相互作用;(2)两种蛋白质的结合可能不是直接结合,而可能有第三者在中间起桥梁作用;(3)必须在实验前预测目的蛋白是什么,以选择最后检测的抗体,所以,若预测不正确,实验就得不到结果,方法本身具有冒险性。

在免疫共沉淀实验中要保证实验结果的真实性,应注意以下几点:

(1) 确保共沉淀的蛋白是由所加入的抗体沉淀得到的,而并非外源非特异蛋白,单克隆抗体的使用有助于避免污染的发生;

(2) 要确保抗体的特异性,即在不表达抗原的细胞溶解物中添加抗体后不会引起共沉淀;

(3) 确定蛋白间的相互作用是发生在细胞中,而不是由于细胞的溶解才发生的,这需要进行蛋白质的定位来确定。

试题1:

下列序列是一段cDNA序列,请利用生物信息学的方法得出其基因的全序列,并对其蛋白质序列进行功能预测分析。

A TTA TTGGGACGTTGA TGCTAGCCGA TGTTAGTAAACAAACAAAAGGGAGGTCTTCGT CGGAAAGGGCTTAA TTTTTCA T

AAGCAAACGTCACCGA TTGGCGA TGGAAGTTCAGGAGTTCTGCGAAAA TA TGGAGGA GA TCGAAGA TGAAAACTACGACG

AGGAGAAGTCAGCTAGAACCTCGGA TGAAAA TCGCAAGCAAAA TCACAGCGAGA TCG AGAAGCGGCGTCGGGACAAGA TG

AACACGTACA TCAACGAGCTCTCCTCCA TGA TTCCCA TGTGCTTTGCGA TGCAGCGAAA GCTGGACAAACTGACTGTGCT

CCGGA TGGCAGTGCAGCA TCTGCGAGGGA TCCGTGGCAGCGGCAGCTTACA TCCA TTC AACGGA TCCGA TTACCGGCCTA

GCTTCCTGTCCGACCAGGAGCTCAAGA TGA TTA TCCTGCAAGCGTCGGAGGGA TTCCT GTTCGTGGTAGGTTGTGACCGA

GGACGCA TCCTGTACGTTTCCGA TTCGGTGTCCAGTGTGCTGAACAGCACCCAAGCGG ACCTGCTGGGACAGAGCTGGTT

CGACGTCCTGCA TCCGAAGGACA TAGGCAAGGTTAAGGAGCAGCTA TCCTCACTGGAA CAGTGTCCCAGGGAAAGGCTTA

TCGA TGCGAAGACCA TGTTGCCCGTTAAGACCGACGTTCCACAGAGCTTGTGCCGCCT GTGTCCGGGTG

试题2:

分析下列序列,并找出与之同源性最高的水稻基因GASVSRGRAARVPAPEPEPEEALDLSQLPPELLLVVLSHVPPRTLLGRCRQVCRGWRALVD GQALWLLILARDHGA TGRALLHLARSCQSPARNARPCPLGRFCARRPIGRNLIRNPCGQEG LRKWMVQHGGDGWVVEENRTTVPGAPSQTCFVTSFSWCCKKQVLDLEEEGLWPELLDS GRIEICVSDWWGARHDSGCMYRLLVQLLDANQTVLDKFSA VPDPIPQWNNNACLHVTH VFSNIKMGVRFVSFEHRGQDTQFWAGHYGARVTNSSVIVRVRLS

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

基因组考研试题及答案解析(华东师范大学)

第一章基因组学 1、学习基因组学所面临的挑战和意义? 全面鉴定人类基因组所编码的结构和功能成分;发展对人类基因组的可遗传变异的详细理解;发展基于基因组学的方法来预测疾病的敏感性和药物反应,疾病的早期检验,以及疾病的分子分类;应用新的基因和代谢通路的知识开发有效的、新的疾病治疗方法发展;理解物种间的进化变异及其机制;关键农作物基因的克隆和功能验证;基于基因组的工具来提高农作物产量,解决世界粮食危机及全球温饱问题。 2、DNA作为遗传物质的优点? 信息量大,集成度高;碱基互补配对,保证精确复制;核糖2’碳位脱氧,在水溶液中稳定 性好;以T取代U,没有C脱氨变U的危险。 3、证明DNA双螺旋的证据? 各种生物物理证据;X射线衍射图谱;碱基比例;模型构建。 4、DNA、RNA的两个重要化学差异有哪些? 碱基组成;链数。 5、原核、真核生物基因组的不同点? 原核生物:基因组为环状双链DNA分子;只有一个复制起始点;具有操纵子结构:指数个功能上相关的基因串联在一起,连同上游的调控区和下游的转录终止信号构成基因的表达单位:一般无重叠基因;基因是连续的,无内含子;编码区在基因组中的比例;基因组中重复 序列很少;具有编码同工酶的基因(isogene):同工酶是指具有相同催化功能而化学结构不 同的酶,它受一个或几个基因座等位基因;分子中有多功能识别区域复制、转录起始区复制、转录终止区 真核生物:体细胞: 两套基因组(二倍体细胞)性细胞: 一套基因组(单倍体细胞);基因组结构复杂,数目庞大, 多个复制起始点;mRNA为单顺反子:真核基因转录产物为单顺反子,即一种基因编码一种多肽链或RNA链,每个基因转录有各自的调节元件;含大量重复 序列;非编码序列占90%以上;基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子;功能相关的基因串联在一起形成基因家族 7、真核生物染色体三大要素及功能? 着丝粒:控制细胞分裂时染色体的取向和移动;端粒:防止染色体末端粘连,保证DNA长度稳定;复制原点:起始DNA复制。 8、染色体末端的端粒为什么很重要? 维持染色体结构的完整性,防止染色体被核酸酶降解及染色体间相互融和;防止染色体结构基因在复制时丢失,解决了末端复制的难题。 9、人类基因组中存在哪些类型的重复DNA? 串联重复基因: 6、简述DNA组成基因的两个重要实验? 第二章基因组的复制 1、在Meselson-Stahl的实验前,我们不知道DNA复制是“弥散型”“半保留型”或“全保留型”,描述经几种不同方式复制,子代分子DNA中DNA的区别? 2、什么是半不连续复制模型? 前导链(leading strand):以5’-3’方向连续合成的DNA 链 滞后链(lagging strand):总体上沿着3’到5’方向延伸,但以小片段形式(5¢-3¢)不连续合成,最后共价连接起来 3、为什么需要RNA引物来引发DNA复制呢? (1)RNA引物可以提供3’-OH末端作合成新DNA链起点。

基因组学复习题

基因组学复习题 Prepared on 22 November 2020

第1章 1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

第四章 基因与基因组学(答案)

第四章基因与基因组学(答案) 一、选择题 (一)单项选择题 1.关于DNA分子复制过程的特点,下列哪项是错误的? A.亲代DNA分子双股链拆开,形成两条模板链 B.新合成的子链和模板链的碱基互补配对 C.复制后新形成的两条子代DNA分子的碱基顺序与亲代的DNA分子完全相同 D. 以ATP、UTP、CTP、GTP和TDP为合成原料 E.半不连续复制 *2.建立DNA双螺旋结构模型的是: A.Mendel B.Morgan C.Hooke D.Watson and Crick E.Sthleiden and Schwann *3.下列哪个不属于基因的功能? A.携带遗传信息 B.传递遗传信息 C.决定性状 D.自我复制 E.基因突变 4.DNA分子中核苷酸顺序的变化可构成突变,突变的机制一般不包括: A.颠换 B.内复制 C.转换 D.碱基缺失或插入 E.不等交换 5.下列哪一种结构与割(断)裂基因的组成和功能的关系最小? A.外显子 B.内含子 C.TATA框 D.冈崎片段 E.倒位重复顺序 *6.在一段DNA片段中发生何种变动,可引起移码突变? A.碱基的转换 B.碱基的颠换 C.不等交换 D.一个碱基对的插入或缺失 E.3个或3的倍数的碱基对插入或缺失 7.从转录起始点到转录终止点之间的DNA片段称为一个: A.基因 B.转录单位 C.原初转录本 D.核内异质RNA E.操纵子 8.在DNA复制过程中所需要的引物是; A.DNA B.RNA C.tRNA D.mRNA E.rRNA 9.下列哪一项不是DNA自我复制所必需的条件? A.解旋酶 B.DNA多聚酶 C.RNA引物 D. ATP、GTP、CTP和TTP及能量 E.限制性内切酶 10.引起DNA形成胸腺嘧啶二聚体的因素是 A.羟胺 B.亚硝酸 C.5-溴尿嘧啶 D.吖啶类 E.紫外线 11.引起DNA发生移码突变的因素是 A.焦宁类 B.羟胺 C.甲醛 D.亚硝酸 E.5-溴尿嘧啶 12.引起DNA分子断裂而导致DNA片段重排的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 13.可以引起DNA上核苷酸烷化并导致复制时错误配对的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 14.诱导DNA分子中核苷酸脱氨基的因素 A.紫外线 B.电离辐射 C.焦宁类 D.亚硝酸 E.甲醛 15.由脱氧三核苷酸串联重复扩增而引起疾病的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 16.在突变点后所有密码子发生移位的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 *17.异类碱基之间发生替换的突变为 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 18.染色体结构畸变属于 A.移码突变 B.动态突变 C.片段突变 D.转换 E.颠换 *19.由于突变使编码密码子形成终止密码,此突变为 A.错义突变 B.无义突变 C.终止密码突变 D.移码突变 E.同义突变 *20.不改变氨基酸编码的基因突变为 A.同义突变 B.错义突变 C.无义突变 D.终止密码突变 E.移码突变 21.可以通过分子构象改变而导致与不同碱基配对的化学物质为 A.羟胺 B.亚硝酸 C.烷化剂 D.5-溴尿嘧啶 E.焦宁类 *22.属于转换的碱基替换为 A.A和C B.A和T C.T和C D.G和T E.G和C *23.属于颠换的碱基替换为 A.G和T B.A和G C.T和C D.C和U E.T和U (二)多项选择题

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

基因组学与蛋白质组学

《基因组学与蛋白质组学》课程教学大纲 学时: 40 学分:2.5 理论学时: 40 实验学时:0 面向专业:生物科学、生物技 术课程代码:B7700005先开课程:生物化学、分子生物 学课程性质:必修/选修执笔人:朱新 产审定人: 第一部分:理论教学部分 一、课程的性质、目的和任务 《基因组学与蛋白质组学》是随着生物化学、分子生物学、结构生物学、晶体学和计算机技术等的迅猛发展而诞生的,是融合了生物信息学、计算机辅助设计等多学科而发展起来的新兴研究领域。是当今生命科学研究的热点与前沿领域。由于基因组学与蛋白质组学学科的边缘性,所以本课程在介绍基因组学与蛋白质组学基本基本技术和原理的同时,兼顾学科发展动向,讲授基因组与蛋白组学中的热点和最新进展,旨在使学生了解现代基因组学与蛋白质组学理论的新进展并为相关学科提供知识和技术。 二、课程的目的与教学要求 通过本课程的学习,使学生掌握基因组学与蛋白质组学的基本理论、基础知识、主要研究方法和技术以及生物信息学和现代生物技术在基因组学与蛋白质组学上的应用及典型研究实例,熟悉从事基因组学与蛋白质组学的重要方法和途

径。努力培养学生具有科学思维方式、启发学生科学思维能力和勇于探索,善于思考、分析问题的能力,激发学生的学习热情,并通过学习提高自学能力、独立思考能力以及科研实践能力,为将来从事蛋白质的研究奠定坚实的理论和实践基础。 三、教学内容与课时分配 第一篇基因组学

第一章绪论(1学时) 第一节基因组学的研究对象与任务; 第二节基因组学发展的历程; 第三节基因组学的分子基础; 第四节基因组学的应用前景。 本章重点: 1. 基因组学的概念及主要任务; 2. 基因组学的研究对象。 本章难点: 1.基因组学的应用及发展趋势; 2.基因组学与生物的遗传改良、人类健康及生物进化。建议教学方法:课堂讲授和讨论 思考题: 查阅有关资料,了解基因组学的应用发展。 第二章人类基因组计划(1学时) 第一节人类基因组计划的诞生; 第二节人类基因组研究的竞赛; 第三节人类基因组测序存在的缺口; 第四节人类基因组中的非编码成分; 第五节人类基因组的概观; 第六节人类基因组多样性计划。 本章重点: 1. 人类基因组的研究; 2. 人类基因组多样性。 本章难点: 人类基因组序列的诠释。 建议教学方法:课堂讲授和讨论 思考题:

基因组学答案

基因组学答案 名词解释: 1基因组:生物的整套染色体所含有的全部DNA序列 2物理作图;采用分子生物学技术直接将DNA标记,基因或克隆标定在基因组的实际位置所构建的位置图,物理图的距离依作图方法而异,辐射杂种作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距单位为DNA的分子长度,即碱基对 3单核苷酸多态性:基因组中单个核苷酸的突变称为点突变 4蛋白质组:基因组表达的最终结果是一组蛋白质 5开放阅读框:所有编码蛋白质的基因都含有开放读框,它们由一系列5指令氨基酸的密码子组成 6兼性异染色质:细胞中非持久性的异染色质,仅在某些细胞或细胞的某一阶段出现 7副突变:指在杂合子中某一等位基因影响同一座位上另一等位基因的表达 8表观遗传:不涉及DNA序列的编译,但基因的表达模式发生了可遗传的改变,并能通过有丝分裂和减数分裂将改变的基因表达模式传递给子细胞或下一代的过程 9染色质重建:染色质由收缩状态向伸展开放状态的转变 10基因组印记:印记基因的表达取决于它是在父源染色体上还是在母源染色体上,来自父源和母源的印记基因有所不同 1C值;指的是一个单倍体基因组中DNA的总量 2限制性片段长度多态性:由于同源染色体同一区段DNA序列的差异,当用限制酶处理时,可产生产生长度不同的限制性片段。3微卫星序列:其重复单位为1-6个核苷酸,由10-50个重复单位串联组成 4遗传作图:采用遗传学分析方法将基因或其它DNA分子标记标定在染色体上构建连锁图称之为遗传连锁图 5基因等高线:指连续分布的具有相似碱基组成的DNA片段,她们在基因组中成片相嵌排列 6组成性异染色质:这是所有细胞中均有的一种持久性的结构,这些染色质不含任何基因,总是保持紧密的组成状态 7基因组:生物的整套染色体所含有的全部DNA序列 8染色体重排:涉及染色体不同区段相对位置的重新排列,是基因组进化的重要途径之一 9转录物组:基因组在整个生命过程中所表达的全部转录产物的总和 10假基因:指来源于功能基因但已使其活性的DNA序列,有沉默的假设基因,也有可转录的假基因 基因组学简答题: 1生物基因中有哪些异常结构基因? 重叠基因、基因内基因、反义基因 2有哪些DNA分子标记? 限制性片段长度多态性、简单序列长度多态性、单核苷 酸多态性 3miRNA的生物学功能有哪些? 1在mRNA翻译起始后干扰翻译的继续进行2在翻译的起始阶段阻止翻译起始复合物的组装3促使mRNA降解4遗传密码有什么特点? 通用性、兼并性、摇摆、偏爱、偏离(课本230) 5真核生物DNA复制有哪些特点? 1互补单链的合成以5’-3’极性方式进行 2DNA两条分子链的合成在时间上和空间上的非对称性的 3RNA其实合成不需要引物,但DNA起始复制需要引物。 4细胞中新链DNA的合成以碱基互补方式进行 6简述高等真核生物基因组序列组成。 高度重复序列,中度重复序列,单一序列,基因主要位于单一序列 7简述细胞器基因组起源的内共生理论 细胞器中基因表达的过程与细菌的情况相似。细胞器基因与细菌基因序列的相似性高于同源核基因。因此内共生学说认为线粒体和叶绿体是游离细菌的化身,他们曾于远古的真核细胞结合,并最终定居在真核细胞中。 8基因租的cpG岛有什么特点? 1)已知的大多数的CPG岛都位于管家基因和大部分阻止专一性表达基因的5’侧翼区以及基因的第一个的外显子区。2)CpG 岛中双碱基CpG均为甲基化。而整个基因组中约60%-80%的CpG 军备甲基化。 9比较遗传图与物理图的组成可以得到什么启示? 1)重组率随让染色体长度的增加而递减,人类的21号染色体的长臂的重组率为1Cm/Mb,短臂侧围2Cm/mb;2)大多数染色体近着丝粒区重组率受到抑制,远着丝粒区重组率趋向增加;3)染色体连锁不平衡的碱基组成和基因组成有明显的特征 10生物进化历程中,新基因有哪些产生方式? 1基因加倍后的趋异2外显子或结构域洗牌3逆转录及其随后的趋异或重排4外源基因水平转移5基因裂变和融合6非编码序列转变为编码序列 论述题: 1叙述真核生物与原核生物基因组的差异。 1)真核基因组指一个五中的单倍体染色体组所含有的整套基因,原核一般只有一个环状DNA分子,其上所含有的基因为一个基因组:2)原核的染色体分子量较小,基因组含有大量单一顺序,真核基因组存在大量非编码序列:3)原核还含有各种质粒和转座因子:4)真核的基因组都是由DNA序列组成,原核基因组还可能由RNA组成 2概述基因组的研究内容 1)以原基因测序为目标的结构基因学;2)以基因功能鉴定为目标的功能基因学 3有哪些试验方法可以研究基因功能 剔除,RNA干扰,过量表达

基因组学试题

基因组学试题 1、什么是基因组(5分)?什么是转录组(5份)?说明基因组 合的关系和异同(10分)基因组是生物体(细胞或病毒)中所有的DNA的总和, 包括所有的基因和基因间区域,包 括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。 基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA 量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异 转录组: ?生物体、组织、细胞不同生长发育阶段的转录产物不同。 ?生物体不同组织、同一组织不同细胞的转录产物不同。 ?生物体、组织、细胞不同环境、不同生理状态下的转录产物 不同。 ?转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA 2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组 ?一条环状DNA; ?只有一个复制起始点; ?有操纵子(Operon)结构

1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起, 手统一调控区调控。 2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节 子(regulon)调控。 ?结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质 ?基因是连续的,无内含子,转录后不剪接; ?重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。 真核生物基因组 ?复杂的染色体结构,一般有多条染色体 ?每条染色体上有多个复制起始点; ?基因组中有大量的重复序列(轻度、中度、高度重复); ?基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;?有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族 ?有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。 3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义 何在(15分)?采用遗传学分析方法将基因或其它DNA标记

分子生物学试题_完整版(Felisa)

05级分子生物学真题 一、选择题 1、激活子的两个功能域,一个是转录激活结构域,另一个是(DNA结合域) 2、转录因子包括通用转录因子和(基因特异转录因子) 3、G-protein激活needs(GTP)as energy. 4、Promoters and(enhancers)are cis-acting elements. 5、噬菌体通过(位点专一重组)整合到宿主中 6、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 7、mRNA的剪切跟(II)类内含子相似 8、UCE是(I)类启动子的识别序列 9、TATA box binding protein在下列哪个启动子里面存在(三类都有) 10、(5S rRNA)是基因内部启动子转录的 11、人体全基因组大小(3200000000bp) 12、与分枝位点周围序列碱基配对的剪接体(U2snRNP) 13、tRNA基因是RNA聚合酶(III)启动的 14、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 15、乳糖操纵子与阻遏蛋白结合的物质是(异构乳糖)。 16、核mRNA的内含子剪接和(II类内含子剪接)的过程相似 17、基因在转录时的特点(启动子上无核小体) 18、RNA干涉又叫(转录后的基因沉默,PTGS) 19、内含子主要存在于(真核生物) 20、snRNA在下列哪种反应中起催化酶的作用(mRNA的剪接) 二、判断题 1、原核生物有三种RNA聚合酶。 2、抗终止转录蛋白的机制是使RNA聚合酶忽略终止子。 3、RNA聚合酶II结合到启动子上时,其亚基的羧基末端域(CTD)是磷酸化的。 4、Operon is a group of contiguous,coordinately controlled genes. 5、RNA聚合酶全酶这个概念只应用于原核生物。 6、聚腺苷酸尾是在mRNA剪接作用前发生的。 7、σ在转录起始复合复合物中使得open到closed状态(closed转变成open) 8、剪接复合体作用的机制:组装、作用、去组装,是一个循环 三、简答题 1、原核生物转录终止的两种方式。 2、组蛋白乙酰化对基因转录的影响。 3、G蛋白在翻译中的作用有哪些? 4、什么是转座?转座子有哪些类型? 5、简述增强子的作用机制。 04级分子生物学期末题目 一、选择题(20题) 1、tRNA的5端剪切所需的酶(RNase P) 2、人体全基因组大小(3,200,000,000bp) 3、(5S rRNA)是基因内部启动子转录的 4、线虫反式剪接所占比例(10%-20%) 5、与分枝位点周围序列碱基配对的剪接体(U2snRNP)

基因组学复习题

第1章 1)什么是C-值悖理?什么是N-值悖理? C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类? mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型? tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因?假基因是如何形成的? 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达? 为什么? 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族? 什么是超基因家族? 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别?为什么会产生这些差别? 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

基因组学复习资料整理

基因组学 1. 简述基因组的概念和其对生命科学的影响。 基因组:指一个物种的全套染色体和基因。广义的基因组:核基因组,线粒体基因组,叶绿体基因组等。 基因组计划对生命科学的影响: ①研究策略的高通量,彻底认识生命规律:基因组研究高通量,研究手段和 研究策略的更新,加强了生命科学研究的分工与协作,从不同层次深入研究生命现象。 ②促进了相关学科的发展:分子生物学遗传学生物信息学生物化学细胞生 物学生理学表观遗传学等 ③物种的起源与进化: Ⅰ.重要基因的发掘、分离和利用:遗传疾病相关基因,控制衰老的基因,工业价值的细菌基因,重要农艺性状基因等。 Ⅱ.充分认识生命现象:基因的表达、调控,基因间的相互作用,不同物种基因组的比较研究,揭示基因组序列的共性,探讨物种的起源和进化。 ④伦理学法律问题:伦理问题,知识产权问题,法律问题,社会保险问题。 2. Ac/Ds转座因子 Ac因子有4563bp,它的大部分序列编码了一个由5个外显子组成的转座酶基因,成熟的mRNA有3500bp。该因子本身的两边为11bp的反向重复末端(IR),发生错位酶切的靶序列长度8bp。Ds因子较Ac因子短,它是由Ac因子转座酶基因发生缺失而形成的。不同的Ds因子的长度差异由Ac因子发生不同缺失所致。 Ac/Ds因子转座引起的插入突变方式:玉米Bz基因是使糊粉层表现古铜色的基因,当Ac/Ds转座插入到Bz基因座后,糊粉层无色。当Ac/Ds因子在籽粒发育过程,部分细胞发生转座,使Bz靶基因发生回复突变,从而形成斑点。 Ac/Ds两因子系统遗传特点: 1)Ac具有活化周期效应,有活性的Ac+因子被甲基化修饰后会形成无活性的ac-因子,反之无活性的ac-因子去甲基化成有活性的Ac+因子。 2)Ac与Ds因子有时表现连锁遗传但更多表现独立遗传。 3)Ac对Ds的控制具有负剂量效应。 4)Ac/Ds可引发靶基因表现为插入钝化、活性改变、表达水平改变和缺失突变等。 5)Ds的结构不同,插入同一靶基因的位点可能不同,形成的易变基因的表型也不同。(分子生物学79-81) 3. 正向遗传与反向遗传 正向遗传学研究指从突变体开始的遗传学研究,关心的问题是突变体表型的变化是由哪一个基因功能丧失后引起。 反向遗传学研究指从基因序列开始的遗传学研究,关心的问题是基因功能丧失后会使植物的表型产生什么样的变化。

基因组学复习题

第1章1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达?为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族?什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在 5 Mb以下; 3)缺少重复序列;

基因组学与蛋白质组学复习要点(答案)

一、名词: Gene 遗传学概念:基因是世代相传的,基因决定了遗传性状的表达,基因的颗粒性主要表现在世代相传的行为和功能表达上具有相对的独立性,基因呈直线排列在染色体上。 分子生物学概念:合成有功能的蛋白质或RNA所必需的全部DNA(部分RNA病毒除外),即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。 genome 细胞或生物体中,一套完整单体的遗传物质的总和,即某物种单倍体的总DNA。对于二倍体高等生物来说,其配子的DNA总和即一组基因组,二倍体有两份同源基因组。 Protein 生物体中广泛存在的一类生物大分子,由核酸编码的α氨基酸之间通过α氨基和α羧基形成的肽键连接而成的肽链,经翻译后加工而生成的具有特定立体结构的、有活性的大分子。 Proteome (1)由一个基因组所表达的全部相应的蛋白质。(2)在一定条件下,存在于一个体系(包括细胞、亚细胞器、体液等)中的所有蛋白质。 exon 外显子(expressed region)是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质 古细菌 定义1:常生活于热泉水、缺氧湖底、盐水湖等极端环境中的原核生物。具有一些独特的生化性质,如膜脂由醚键而不是酯键连接。在能量产生与新陈代谢方面与真细菌有许多相同之处,而复制、转录和翻译则更接近真核生物。古核生物与真核生物可能共有一个由真细菌的祖先歧化而来的共同祖先。所属学科:生物化学与分子生物学(一级学科);总论(二级学科)定义2:现今最古老的生物群,为地球原始大气缺氧时代生存下来的活化石。为单细胞生物,无真正的核,染色体含有组蛋白,RNA聚合酶组成比细菌的复杂,翻译时以甲硫氨酸为蛋白质合成的起始氨基酸,细胞壁中无肽聚糖,不同于真细菌,核糖体蛋白与真核细胞的类似。许多种类生活在极端严酷的环境中。与真核生物、原核生物并列构成现今生物三大进化谱系。 多聚酶链式反应(PCR) 多聚酶链式反应(PCR):一种体外扩增DNA的方法。PCR使用一种耐热的多聚酶,以及两个含有20个碱基的单链引物。经过高温变性将模板DNA分离成两条链,低温退火使得引物和一条模板单链结合,然后是中温延伸,反应液的游离核苷酸紧接着引物从5…端到3?端合成一条互补的新链。而新合成的DNA又可以继续进行上述循环,因此DNA的数目不断倍增。 基因芯片(DNA微阵列)

基因组学考试资料-整理版

第一章 一、基因组 1、基因组(genome):生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。 2、基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的在规律及其外环境影响机制的科学。 基因组学包括3个不同的亚领域 结构基因组学(structural genomics) :以全基因组测序为目标 功能基因组学(functional genomics):以基因功能鉴定为目标 比较基因组学(comparative genomics) 二、基因组序列复杂性 1、C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg,10-12g)水平表示。 C 值悖理(矛盾)(C-value paradox):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接 近的物种之间,它们的C值可以相差数10倍乃至上百倍。 C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。 2、序列复杂性 单一顺序:基因组中单拷贝的DNA序列 重复顺序:基因组中多拷贝的基因序列 真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分 三、基因与基因家族 1、基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上基本一致而略有不同的成员。 包括编码RNA的基因和编码蛋白质的基因 2、隔裂基因(split gene):指基因部被一个或更多不翻译的编码顺序即含子所隔裂。 3、异常结构基因分类 重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。 基因基因:一个基因的含子中包含其他基因。 反义基因: 与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。 4、假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列. 四、基因组特征比较 真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组围分布大量重复顺序(小基因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长 链DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。) 原核生物基因组的特征 :原核生物基因数目比真核生物少,大小在5 Mb以下; 原核生物基因组结构更紧凑;(极少重复序列;重复基因的数量远远低于真核生物;不存在含子,基本都是编码序列,无断裂基因。)

基因组学答案

1.什么是基因组学?基因组学有哪些特点? 以基因组分析为手段,研究基因组的结构组成、时序表达模式和功能,并提供有关生物物种及其细胞功能进化信息的一门学科。特点:Genome sciences are sequence-based,Genome sciences are data-guided (not so hypothesis-driven),Genome sciences is a systematic approach。 2.什么是模式生物? 生物学家通过对选定的生物物种进行科学研究,用于揭示某种具有普遍规律的生命现象,此时,这种被选定的生物物种为模式生物。在人类基因组计划中,包括对五种生 物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 3.人类基因组计划是哪一年完成的?在科学上有什么意义? 2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。 意义: 首先,获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。 第二,破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。4.基因组学的发展方向是什么? 5. 3 大公共DNA 数据库名称是什么? EMBL,GenBank,DDBJ。 6.什么是一级数据库和二级数据库? Primary Databases:Original submissions by experimentalists,Content controlled by the submitter。 Derivative Databases:Built from primary data,Content controlled by third party。 7.什么是NCBI 的Refseq?什么是Unigene?Unigene 和Refseq 的区别和联系。 RefSeq (accessible via the main page of NCBI) provides an expertly curated accession number that corresponds to the most stable, agreed-upon “reference” version of a sequence. Unigene:MegaBlast based automated sequence clustering,Nonredundant set of gene oriented clusters,Each cluster a unique gene,Information on tissue types and map locations,Includes known genes and uncharacterized ESTs,Useful for gene discovery and selection of mapping reagents。 8.GEO 是什么类型数据库,主要包含什么类型数据? 9.大致介绍一下UCSC GENOME BROWSER? Stands for “Encyclopedia Of DNA Elements”,Public research consortium to carry out a project to identify all functional elements in the human genome sequence,Launched by The National Human Genome Research Institute (NHGRI),Conducted in three phases:pilot project phase,technology development phase,planned production phase。 10.HAVANA 基因是什么类型数据? 11.什么是细菌人工染色体(BAC) 是指一种以F质粒(F-plasmid)为基础建构而成的细菌染色体克隆载体,常用来克隆150kb左右大小的DNA片段,最多可保存300kb个碱基对。 12.什么是遗传图谱?用来构建遗传图谱的标记有哪些?

相关文档
最新文档