第四章-基因的结构和功能

第四章基因的结构和功能

一、教学目的和要求：

１掌握基因概念及其发展；

2 掌握基因的重组测验

3 理解利用顺反试验、互补试验鉴定两个突变型是否属于同一基因的原理；

4 了解缺失作图的原理

二、教学重点：

１基因概念及其发展；

2 基因的重组测验

三、教学难点：

缺失作图的原理

四、教学方法：

面授并辅以多媒体教学

五、教学内容

基因是一个特定的DNA或RNA片段，但并非一段DNA或RNA都是基因。

第一节基因的概念一、基因概念的发展

（一）遗传“因子”：孟德尔认为，生物性状的遗传由遗传因子所控制，性状本身不遗传。（二）染色体是基因的载体：摩尔根实验证明基因位于染色体上，并呈直线排列，提出了遗传学是连锁交换规律，建立了遗传的染色体学说，为细胞遗传学奠定了重要基础。并由此提出基因既是一个功能单位，是一个突变单位，也是一个交换单位的“三位一体”概念。∴经典遗传学认为：基因是一个最小的单位，不能分割；既是结构单位，又是功能单位。（三）DNA是遗传物质：1928年Griffith首先发现了肺炎球菌的转化，证实DNA是遗传物质而非蛋白质；Avery用生物化学的方法证明转化因子是DNA而不是其他物质。

（四）基因是有功能的DNA片段

20世纪40年代Beadle和Tatum提出一个基因一个酶的假说，沟通了蛋白质合成与基因功能的研究

1953年Watson和Crick提出DNA双螺旋结构模型，明确了DNA的复制方式。 1957年Crick 提出中心法则，61年提出三联体遗传密码，从而将DNA分子结构与生物体结合起来

1957年Benzer用大肠杆菌T4噬菌体为材料，分析了基因内部的精细结构，提出了顺反子（cistor)的概念，证明基因是DNA分之上一个特定的区段，是一个功能单位，包括许多突变位点（突变子），突变位点之间可以发生重组（重组子）

理论上，一个基因有多少对核苷酸对就有多少突变子和的重组子，实际上，突变子数少于核苷酸对数，重组子数小于突变子数。

总之：顺反子学说打破了“三位一体”的基因概念，把基因具体化为DNA分子上特定的一段顺序--- 顺反子，其内部又是可分的，包含多个突变子和重组子。

近代基因的概念：基因是一段有功能的DNA序列，是一个遗传功能单位，其内部存在有许多的重组子和突变子。

突变子：指改变后可以产生突变型表型的最小单位。

重组子：不能由重组分开的基本单位。（五）操纵子模型

1961年法国分子生物学家Jacob和Monod通过对大肠杆菌乳糖突变体研究，提出了操纵子学说（operon theory）。阐明了基因在乳糖利用中的作用。

（六）跳跃基因（转座子）和断裂基因的发现

20世纪50年代以前认为每一基因组的DNA是固定的，而且其位置和他们的功能无关。50年代初芭芭拉在玉米的控制因子的研究中指出某些遗传因子可以转移位置，之后在真核生物和原核生物中发现基因组中某些成分不固定性是普遍现象，称跳跃基因。70年代后发现大多真核生物基因都是不连续的，被不编码序列隔开，称断裂基因。

二、基因的类别及其相互关系根据基因的功能和性质，可将其分为以下几类：

（一）结构基因（structural gene)和调节基因(regulatory gene):既可转录又可翻译。

（二）核糖体RNA基因（rRNA基因简称rDNA）和转移RNA基因（tRNA基因简称tDNA ）：只可转录不可翻译。前者专门转录rRNA， rRNA与响应蛋白质结合形成核糖体；后者专门转录tRNA， tRNA作用是激活氨基酸。

（三）启动子（promotor0和操纵基因(operator):既无转录功能又无翻译功能，确切说，它们不能称为基因。

三、基因与DNA一个基因大约有500-6000个核苷酸对，但并非DNA分子上任一含有几千个核苷酸对的区段都是一个基因，基因是一个含有特定遗传信息的DNA分子区段。

如何判断一段核苷酸序列是否是某个基因？

要看这个特定的核苷酸序列是否与其转录产物RNA核苷酸序列或翻译产物多肽链的氨基酸序列相对应，这样就必须同时测定某一段DNA的核苷酸序列和相应产物的序列。

第二节重组测验一、拟等位基因

黑腹果蝇中w a代表杏色眼基因,w代表白色眼基因，且都位于X染色体上

P w a w a× wY

杏色白色

F1 w a w w a Y(杏色眼）

F2 w a w a w a w w a Y wY

若w a 和w为等位基因，F2应该只有亲本两种表型，但在大量的F2群体中却出现了1/1000

野生型红眼出现，红眼不是突变产生，因为不可能出现如此高的频率。

进一步研究证明：这是由于杏色眼基因和白眼基因在染色体上所占的位置（座位）相同，但属于不同的位点，因而它们之间可以发生交换。

P w a+/ w a+ × +w/ Y

F1 w a+/ +w w a+/ Y

（配子）（配子）

w a+ +w w a w ++ w a+ Y

F2出现

++/ w a + 和++ /Y （红眼野生型）

顺反位置效应（cis-trans position effect)： w a +/ +w 两个突变分别在两条染色体上，称为反式（trans)， w a w /++两个土百年同时排在一条染色体上，而另一条染色体上两个位点均正常，称为顺式（cis)。反式表现为突变型，顺式排列为野生型，这种由于排列方式不同而表型不同的现象成为顺反位置效应。

拟等位基因（pseudoallele)：表型效应类似紧密连锁的功能性等位基因，但不是结构性的等位基因，其发现证明：基因是可分的。

二、噬菌体突变型

1、噬菌斑形态的突变型

2、寄主范围的突变型

3、条件致死突变型

概念：条件致死突变（P101） Benzer 实验所用的T4的r Ⅱ突变就是一个条件致死突变型。（见P101表4-1）

三、 Benzer 的重组实验

两种r Ⅱ突变类型：rx 、ry

r+rx × ryr+

↓混合感染

E.coli B 株

小噬菌斑小噬菌斑大噬菌斑 rIII S K( ) B 小噬菌斑无噬菌斑（致死）大噬菌斑 rII 小噬菌斑小噬菌斑大噬菌斑 rI 小噬菌斑小噬菌斑小噬菌斑野生型不同大肠杆菌平板上噬菌斑表型类型表4-1 野生型与几种突变型的区别

接种

B株K(λ)株

计数

r+ry、rxr+ r+r+

r+r+、rxry 仅生长一

四种基因型种重组型

均能生长

重组值计算：rxry的数量与r+r+ 相同，计算时r+r+ 噬菌体数×2。

此种测定方法称为重组测验（recombination test) ，它以遗传图的方式确定突变子之间关系，此方法测定重组频率非常灵敏可以获得小到0.001％，即十万分之一的重组值。

第三节互补测验

一、互补测验的原理和方法

互补测验（顺反测验）：根据功能确定等位基因的测验。即根据顺式表现型和反式表现型来确定两个突变体是否属于同一个基因（顺反子）

彼此互补（complementation)：用 rⅡ突变型成对组合同时去感染大肠杆菌K(λ)株，若被双重感染的细菌中产生两种亲代基因型的子代噬菌体（也有少量重组型的噬菌体），那么就必定是一个突变型补偿了另一个突变型所不具有的功能，这两个突变型就称为彼此互补。若双重感染的细菌不产生子代噬菌体，那么这两种突变型一定有一个相同功能受到损伤。

互补测验结果发现：

rⅡ突变型可分成rⅡ A和rⅡ B两个互补群。所有rⅡ A突变型的突变位点都在rⅡ区的一头，是一个独立的功能单位,所有rⅡB突变型的突变位点都在rⅡ区的另一头，也是一个独立的功能单位.

凡是属于rⅡ A的突变之间不能互补,同理凡是属于rⅡ B的突变之间也不能互补,只有r Ⅱ A和rⅡ B的突变之间可以互补,即双重感染大肠杆菌K(λ)株后可产生子代。

说明: rⅡ A和rⅡ B是两个独立的功能单位,分别具有不同的功能,但它们的功能又是互补的。

互补试验的原理：

表型有无功能互补结论

反式: A+ B

A B+ 突变型－属同一顺反子

反式: A+ B

A B+野生型＋属不同顺反子

二、顺反子互补实验中，两个隐性突变如表现出互补效应，则证明这两个突变型分别属于不同基因；如不能表现出互补，则证明这两个突变型在同一基因内。

对于不同基因间的突变型在互补测验中，不论是顺式还是反式排列均表现出互补效应；但若属于同一基因的不同位点的突变，则顺式结构表现互补，反式结构则不能互补。说明基

因是一个独立的功能单位。顺反子：不同突变之间没有互补的功能区，一个顺反子就是一个基因，就是一个基因座位，包含多个基因位点，是遗传上的一个作用（功能）单位，但不是一个突变单位或重组单位。

顺反试验：指将两个拟突变分别处于顺式和反式，根据其表型确定两个突变是否是同一基因的试验。判断两突变是否处于同一顺反子的方法:

顺式反式分析结论：两突变

+ +/- - + -/- +

表现型野生型野生型属于两个顺反子

表现型野生型突变型属于同一顺反子

遗传上的突变单位和重组单位是突变子（muton)和重组子(roecon)，突变子是基因内改变后可以产生突变表型的最小单位。它只相当与一个核苷酸对，不能将其定义为一个基因。重组子是基因内不能有重组分开的遗传单位，也不能将其定义为一个基因。

所以：基因可分，可分为很多突变子和重组子。

三、基因内互补1、基因内互补的机理

2、

基因内互补与基因间互补的区别

第四节缺失作图

点突变和缺失突变的区别：

、点突变是单个位点的突变，缺失突变是多个位点的突变；

2、点突变可回复，而缺失突变不可；

3、点突变之间可发生重组，缺失突变同另一个基因组在这个缺失区的点突变间不可重组，即无法通过重组而恢复野生型核苷酸顺序。缺失作图：Benzer 根据这一原理很方便地把数千个独立的r Ⅱ突变定位在r Ⅱ遗传图上更小的区段内，此方法称缺失作图。

凡是能和某一缺失突变进行重组的，他的位置一定不在缺失范围内，凡是不能重组的，它的位置一定在缺失范围内。

缺失 1

缺失 2

生野生型重组体，缺失1只有与 c 区突变体杂交才能产生野生型重组体，但2个缺失与b 区的突变体杂交均不能产生野生型重组体。

第五节断裂基因与重叠基因一、外显子与内含子

1977年法国的Chambon 等和Berget 等首次报道基因内部有间隔顺序（spacer sequence)，并由此提出断裂基因（split gene ）的概念。在成熟mRNA 上反映出的DNA 区段，即DNA 序列中被转录成为mRNA 的片段称为外显子（exon 或extron)在成熟mRNA 上未反映出的DNA 区段称为内含子(intron)

二、断裂基因的意义1、有利于储存较多的信息，增加信息量；

2、有利于变异和进化；

3、增加重组机率；

4、可能是基因调控装置

三、重叠基因

1978年英国剑桥大学分子生物学Sarger 分析了 X 174DNA 全序列后，发现它的核苷酸实际数比理论数少614个氨基酸。

同实验室的Barrell 等发现其基因组中有些密码是重叠的，从而形成重叠基因。

重叠基因的几种重叠方式：

明显低于野生型（仅25%）

同野生型一样酶活性不能发生能发生互补缺失突变仅少数能发生普遍存在发生机率基因内互补基因间互补

1、大基因内包含小基因

2、前后两个基因首尾重叠

3、三个基因之间三重重叠

4、反向重叠

5、重叠操纵子

普遍认为：重叠基因不仅是能经济和有效的利用DNA遗传信息量，节约碱基，而且更重要的是便于对基因表达起调控作用。如色氨酸操纵子中trpD基因的翻译依赖与上游基因trpE的翻译，原因是trpE的终止密码子与trpD的起始密码子重叠。

第六节基因的功能一、Garrod的先天性代谢缺陷

二十世纪初，英国医生Garrod首先发现人类中几种先天性代谢缺陷疾病，如苯丙酮尿症（PKU），它有常染色体隐性基因决定。这是因为这种隐性基因不能产生苯丙氨酸羟化酶，因而不能把提内多余的苯丙氨酸转化为酪氨酸，因此血液中的苯丙氨酸积累起来，只能通过苯丙氨酸转移酶的作用，从另一代谢途径转变成有毒的苯丙酮酸，苯丙酮酸从尿液中排除，可通过尿检而确诊，所以称为苯丙酮尿症。

，4二羟苯丙氨酸

pp苯丙酮尿症

苯丙酮酸黑色素

已酰醋酸

CO2+H2O

Garrod认为这些代谢缺陷病是由于缺少某些酶。因此，他第一个提出基因和酶之间关系，认为基因是通过控制酶和其他蛋白质合成来控制细胞代谢的。

二、一个基因一种酶假说

Beadle和Tatum于1941年提出，并因此于1958年获得诺贝尔奖。

（一）生物合成过程

基因： a b c d

↓↓↓↓

酶： A B C D

代谢物：1 → 2 → 3 → 4 → 5

前体物色素原a 色素原b 红色紫色

（二）突变型与合成缺陷

检测的物质

A B C D E G

突 1 ——— + — +

2 — + — + — +

变 3 ————— +

4 — + + + — +

体 5 + + + + — +

突变型: 5 4 2 1 3

↓↓↓↓↓

代谢过程: E → A → C → B → D → G

（三）一个基因一种酶的实验依据精氨酸缺陷型

补充培养基: 鸟aa 瓜aa 精aa

菌株I ――＋

精氨酸突变型菌株II －＋＋

菌株III ＋＋＋

分析得出: 基因 arg1 arg2 arg3

↓↓↓

酶1 酶2 酶3

↓↓↓

前体物鸟aa 瓜aa 精aa

（四）一个基因一种酶的局限性

(1) 并非所有的基因都为蛋白质编码；

(2) 有的酶由多个基因编码；

(3) 有的一个基因控制多个酶；

(4) 有的RNA具有催化活性；

三、一个结构基因一条多肽链的证据

直接证据人的镰刀形细胞贫血症

正常人红细胞中含血红蛋白（HbA）：圆盘状，红色，运载氧气；

镰刀形细胞贫血症患者红细胞含血红蛋白（HbS）：镰刀形，溶血型贫血，不能运载氧气。

正常人基因型为：Hb A Hb A 血红蛋白为HbA

异常人基因型为：Hb S Hb S 血红蛋白为HbS

杂合体基因型为：Hb A Hb S血红蛋白兼有HbA和HbS两种。但由于HbA可携带氧气，因而不表现临床症状。

研究表明： HbA有4条多肽链组成α2β2，其中两条相同的α链，每条具141个氨基酸；两条相同的β链，每条具146个氨基酸。Ingram证明HbA和HbS具有相同的α链，只是β链上第6位氨基酸不同，HbA是谷氨酸，而HbS是颉氨酸， Hb A和Hb S这对等位基因的差别导致了由该基因所控制的多肽链上的一个氨基酸的差别。

由此可见：基因是以某种方式规定了蛋白质中氨基酸顺序的。

欢迎您的下载，

资料仅供参考！

致力为企业和个人提供合同协议，策划案计划书，学习资料等等

打造全网一站式需求

功能基因的克隆及生物信息学分析

功能基因的克隆及其生物信息学分析摘要：随着多种生物全基因组序列的获得，基因组研究正从结构基因组学（structural genomics）转向功能基因组学(functional genomics)的整体研究。功能基因组学利用结构基因组学研究获得的大量数据与信息评价基因功能(包括生化功能、细胞功能、发育功能、适应功能等)，其主要手段结合了高通量的大规模的实验方法、统计和计算机分析技术[1]，它代表了基因分析的新阶段，已成为21世纪国际生命科学研究的前沿。功能基因组学是利用基因组测序获得的信息和产物，发展和应用新的实验手段，通过在基因组或系统水平上全面分析基因的功能，使生物学研究从对单一基因或蛋白的研究转向多个基因或蛋白同时进行系统的研究，是在基因组静态的组成序列基础上转入对基因组动态的生物学功能学研究[2]。如何研究功能基因，也成为我们面临的一个课题，本文就克隆和生物信息学分析在研究功能基因方面的应用做一个简要的阐述。关键词：功能基因、克隆、生物信息学分析。 1.功能基因的克隆 1.1 图位克隆方法图位克隆又称定位克隆，它是根据目标基因在染色体上确切位置，寻找与其紧密连锁的分子标记，筛选BCA克隆，通过染色体步移法逐步逼近目的基因区域，根据测序结果或用BAC、YAC克隆筛选cDNA表达文库寻找候选基因，得到候选基因后再确定目标基因。优点是无需掌握基因产物的任何信息，从突变体开始，逐步找到基因，最后证实该基因就是造成突变的原因。通过图位克隆许多控制质量性状的单基因得以克隆，最近也有报道某些控制数量性状的主效基因（控制蕃茄果实大小的基因克隆[3]、控制水稻成熟后稻谷脱落基因克隆[4]以及小麦VRN2 基因克隆[5]等）也通过图位克隆法获得。

研究细菌基因组结构的意义

细菌基因组的结构和功能细菌和病毒一样同属原核生物，因而细菌基因组的结构特点在许多方面与病毒的基因组特点相似，而在另一些方面又有其独特的结构和功能。本节首先介绍细菌染色体基因组的一般结构特点，然后再具体介绍大肠杆菌染色体基因组的结构和功能。 1细菌染色体基因组结构的一般特点（1）细菌的染色体基因组通常仅由一条环状双链 DNA分子组成细菌的染色体相对聚集在一起，形成一个较为致密的区域，称为类核（nucleoid）。类核无核膜与胞浆分开，类核的中央部分由RNA和支架蛋白组成，外围是双链闭环的DNA超螺旋。染色体DNA通常与细胞膜相连，连接点的数量随细菌生长状况和不同的生活周期而异。在DNA链上与DNA 复制、转录有关的信号区域与细胞膜优先结合，如大肠杆菌染色体DNA的复制起点（OriC）、复制终点（TerC）等。细胞膜在这里的作用可能是对染色体起固定作用，另外，在细胞分裂时将复制后的染色体均匀地分配到两个子代细菌中去。有关类核结构的详细情况目前尚不清楚。（2）具有操纵子结构（有关操纵子结构详见基因表达的调控一章）其中的结构基因为多顺反子，即数个功能相关的结构基因串联在一起，受同一个调节区的调节。数个操纵子还可以由一个共同的调节基因（regulatorygene）即调节子（regulon）所调控。（3）在大多数情况下，结构基因在细菌染色体基因组中都是单拷贝但是编码rRNA的基因rrn往往是多拷贝的,这样可能有利于核糖体的快速组装，便于在急需蛋白质合成时细胞可以在短时间内有大量核糖体生成。（4）和病毒的基因组相似，不编码的DNA部份所占比例比真核细胞基因组少得多。（5）具有编码同工酶的同基因（isogene）例如，在大肠杆菌基因组中有两个编码分支酸（chorismicacid）变位酶的基因，两个编码乙酰乳酸（acetolactate）合成酶的基因。（6）和病毒基因组不同的是，在细菌基因组中编码顺序一般不会重叠，即不会出现基因重叠现象。（7）在DNA分子中具有各种功能的识别区域如复制起始区OriC，复制终止区TerC,转录启动区和终止区等。这些区域往往具有特殊的顺序，并且含有反向重复顺序。

基因组的结构与功能习题

第二章基因组的结构与功能（一）选择题 A 型题 1．原核生物染色体基因组是 A．线性双链DNA分子 B．环状双链DNA分子 C．线性单链DNA分子 D．线性单链RNA分子 E．环状单链DNA分子 2．真核生物染色体基因组是 A．线性双链DNA分子 B．环状双链DNA分子 C．线性单链DNA分子 D．线性单链RNA分子 E．环状单链DNA分子 3．有关原核生物结构基因的转录，叙述正确的是 A．产物多为多顺反子RNA B．产物多为单顺反子RNA C．不连续转录 d．对称转录 E．逆转录4．原核生物的基因组主要存在于 A．质粒 B．线粒体 C．类核 D．核糖体 E．高尔基体 5．下列有关原核生物的说法正确的是 A．原核生物基因组DNA虽然与蛋白结合，但不形成真正的染色体结构 B．结构基因中存在大量的内含子 C．结构基因在基因组中所占比例较小 D．原核生物有真正的细胞核 E．基因组中有大量的重复序列 6．下列有关原核生物的说法不正确的是 A．原核生物的结构基因与调控序列以操纵子的形式存在B．在操纵子中，功能上关联的结构基因串联在一起C．在一个操纵子内，几个结构基因共用一个启动子 D．操纵元件也是结构基因E．基因组中只存在一个复制起点 7．真核生物染色质中的非组蛋白是 A．碱性蛋白质B．序列特异性DNA结合蛋白C．识别特异DNA序列的信息存在于蛋白上 D．不能控制基因转录及表达E．不参与DNA分子的折叠和组装 8．真核生物染色质的基本结构单位是 A．α-螺旋B．核小体 C．质粒 D．?-片层 E．结构域 9．关于真核生物结构基因的转录，正确的说法是 A．产物多为多顺反子RNAB．产物多为单顺反子RNAC．不连续转录D．对称转录E．新生链延伸方向为3'→5' 10．外显子的特点通常是 A．不编码蛋白质B．编码蛋白质C．只被转录但不翻译D．不被转录也不被翻译E．调节基因表达11．下列有关卫星DNA说法错误的是 A．是一种高度重复序列 B．重复单位一般为2~10 bp C．重复频率可达106 D．能作为遗传标记 E．在人细胞基因组中占5%~6%以上 12．下列有关真核生物结构基因的说法不正确的是 A．结构基因大都为断裂基因 B．结构基因的转录是不连续的 C．含有大量的重复序列 D．结构基因在基因组中所占比例较小 E．产物多为单顺反子RNA 13．染色体中遗传物质的主要化学成分是 A．组蛋白 B．非组蛋白 C．DNA D．RNA E．mRNA 14．真核生物染色质中的组蛋白是 A．酸性蛋白质 B．碱性蛋白质 C．一种转录因子 D．带负电荷 E．不带电荷 15．指导合成真核生物蛋白质的序列主要是 A．高度重复序列 B．中度重复序列 C．单拷贝序列 D．卫星DNA E．反向重复序列

基因表达及分析技术

基因表达及其分析技术生命现象的奥秘隐藏在基因组中，对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA 测序到SNP、拷贝数变异(copy number variation , CNV)等DNA多态性分析，到DNA 甲基化修饰等表观遗传学研究，生命过程的遗传基础不断被解读。基因组研究的重要性自然不言而喻。应该说，DNA 测序技术在基因组研究中功不可没，从San ger测序技术到目前盛行的新一代测序技术(Next Gen eration Seque ncing NGS)到即将走到前台的单分子测序技术，测序技术是基因组解读最重要的主流技术。而基因组测序、基因组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”，再清晰的序列信息也无法真正说明一个基因的功能，基因功能的最后鉴定还得依赖转录组学和蛋白组学，而转录作为基因发挥功能的第一步，对基因功能解读就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关，最终需要转基因、基因敲除、突变、 RNAi 、中和抗体等技术验证，并必不可少要结合基因转录、翻译和蛋白修饰等数据。基因实现功能的第一步就是转录为mRNA或非编码RNA，转录组学主要研究基因转录为RNA 的过程。在转录研究中，下面几点是必须考虑的： 1，基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达，而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基

基因芯片数据功能分析

生物信息学在基因芯片数据功能分析中的应用2009-4-29 随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成，人类基因组研究的重心逐渐进入后基因组时代(PostgenomeEra)，向基因的功能及基因的多样性倾斜。通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析，研究相应基因在生物体内的功能，阐明不同层次多基因协同作用的机理，进而在人类重大疾病如癌症、心血管疾病的发病机理、诊断治疗、药物开发等方面的研究发挥巨大的作用。它将大大推动人类结构基因组及功能基因组的各项基因组研究计划。生物信息学在基因组学中发挥着重大的作用,而另一项崭新的技术——基因芯片已经成为大规模探索和提取生物分子信息的强有力手段，将在后基因组研究中发挥突出的作用。基因芯片与生物信息学是相辅相成的，基因芯片技术本身是为了解决如何快速获得庞大遗传信息而发展起来的，可以为生物信息学研究提供必需的数据库，同时基因芯片的数据分析也极大地依赖于生物信息学，因此两者的结合给分子生物学研究提供了一条快捷通道。本文介绍了几种常用的基因功能分析方法和工具：一、GO基因本体论分类法最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology（GO，即基因本体论）数据库是一个较大的公开的生物分类学网络资源的一部分，它包含38675个Entrez Gene注释基因中的17348个，并把它们的功能分为三类：分子功能，生物学过程和细胞组分。在每一个分类中，都提供一个描述功能信息的分级结构。这样，GO中每一个分类术语都以一种被称为定向非循环图表（DAGs）的结构组织起来。研究者可以通过GO分类号和各种GO数据库相关分析工具将分类与具体基因联系起来，从而对这个基因的功能进行描述。在芯片的数据分析中，研究者可以找出哪些变化基因属于一个共同的GO功能分支，并用统计学方法检定结果是否具有统计学意义，从而得出变化基因主要参与了哪些生物功能。

第四章-基因的结构和功能

第四章基因的结构和功能一、教学目的和要求：１掌握基因概念及其发展； 2 掌握基因的重组测验 3 理解利用顺反试验、互补试验鉴定两个突变型是否属于同一基因的原理； 4 了解缺失作图的原理二、教学重点：１基因概念及其发展； 2 基因的重组测验三、教学难点：缺失作图的原理四、教学方法：面授并辅以多媒体教学五、教学内容基因是一个特定的DNA或RNA片段，但并非一段DNA或RNA都是基因。第一节基因的概念一、基因概念的发展（一）遗传“因子”：孟德尔认为，生物性状的遗传由遗传因子所控制，性状本身不遗传。（二）染色体是基因的载体：摩尔根实验证明基因位于染色体上，并呈直线排列，提出了遗传学是连锁交换规律，建立了遗传的染色体学说，为细胞遗传学奠定了重要基础。并由此提出基因既是一个功能单位，是一个突变单位，也是一个交换单位的“三位一体”概念。∴经典遗传学认为：基因是一个最小的单位，不能分割；既是结构单位，又是功能单位。（三）DNA是遗传物质：1928年Griffith首先发现了肺炎球菌的转化，证实DNA是遗传物质而非蛋白质；Avery用生物化学的方法证明转化因子是DNA而不是其他物质。（四）基因是有功能的DNA片段 20世纪40年代Beadle和Tatum提出一个基因一个酶的假说，沟通了蛋白质合成与基因功能的研究 1953年Watson和Crick提出DNA双螺旋结构模型，明确了DNA的复制方式。 1957年Crick 提出中心法则，61年提出三联体遗传密码，从而将DNA分子结构与生物体结合起来 1957年Benzer用大肠杆菌T4噬菌体为材料，分析了基因内部的精细结构，提出了顺反子（cistor)的概念，证明基因是DNA分之上一个特定的区段，是一个功能单位，包括许多突变位点（突变子），突变位点之间可以发生重组（重组子）理论上，一个基因有多少对核苷酸对就有多少突变子和的重组子，实际上，突变子数少于核苷酸对数，重组子数小于突变子数。总之：顺反子学说打破了“三位一体”的基因概念，把基因具体化为DNA分子上特定的一段顺序--- 顺反子，其内部又是可分的，包含多个突变子和重组子。近代基因的概念：基因是一段有功能的DNA序列，是一个遗传功能单位，其内部存在有许多的重组子和突变子。突变子：指改变后可以产生突变型表型的最小单位。重组子：不能由重组分开的基本单位。（五）操纵子模型 1961年法国分子生物学家Jacob和Monod通过对大肠杆菌乳糖突变体研究，提出了操纵子学说（operon theory）。阐明了基因在乳糖利用中的作用。

几种常用的基因功能分析方法和工具

几种常用的基因功能分析方法和工具（转自新浪博客）一、GO分类法最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology（GO，即基因本体论）数据库是一个较大的公开的生物分类学网络资源的一部分，它包含38675 个Entrez Gene 注释基因中的17348个，并把它们的功能分为三类：分子功能，生物学过程和细胞组分。在每一个分类中，都提供一个描述功能信息的分级结构。这样，GO中每一个分类术语都以一种被称为定向非循环图表（DAGs）的结构组织起来。研究者可以通过GO分类号和各种GO 数据库相关分析工具将分类与具体基因联系起来，从而对这个基因的功能进行描述。在芯片的数据分析中，研究者可以找出哪些变化基因属于一个共同的GO功能分支，并用统计学方法检定结果是否具有统计学意义，从而得出变化基因主要参与了哪些生物功能。 EASE（Expressing Analysis Systematic Explorer）是比较早的用于芯片功能分析的网络平台。由美国国立卫生研究院（NIH）的研究人员开发。研究者可以用多种不同的格式将芯片中得到的基因导入EASE 进行分析，EASE会找出这一系列的基因都存在于哪些GO分类中。其最主要特点是提供了一些统计学选项以判断得到的GO分类是否符合统计学标准。EASE能进行的统计学检验主要包括Fisher 精确概率检验，或是对Fisher精确概率检验进行了修饰的EASE 得分（EASE score）。由于进行统计学检验的GO分类的数量很多，所以EASE采取了一系列方法对“多重检验”的结果进行校正。这些方法包括弗朗尼校正法（Bonferroni），本杰明假阳性率法（Benjamini falsediscovery rate）和靴带法（bootstraping）。同年出现的基于GO分类的芯片基因功能分析平台还有底特律韦恩大学开发的Onto-Express。2002年，挪威大学和乌普萨拉大学联合推出的Rosetta 系统将GO分类与基因表达数据相联系，引入了“最小决定法则”（minimal decision rules）的概念。它的基本思想是在对多张芯片结果进行聚类分析之后，与表达模式不相近的基因相比，相近的基因更有可能参与相同的生物学功能的实现。比较著名的基于GO分类法的芯片数据分析网络平台还有七十多个，表1列举了其中的一部分。二、通路分析法通路分析是现在经常被使用的芯片数据基因功能分析法。与GO分类法（应用单个基因的GO分类信息）不同，通路分析法利用的资源是许多已经研究清楚的基因之间的相互作用，即生物学通路。研究者可以把表达发生变化的基因列表导入通路分析软件中，进而得到变化的基因都存在于哪些已知通路中，并通过统计学方法计算哪些通路与基因表达的变化最为相关。现在已经有丰富的数据库资源帮助研究人员了解及检索生物学通路，对芯片的结果进行分析。主要的生物学通路数据库有以下两个：①KEGG 数据库：迄今为止，KEGG数据库（Kyoto encyclopedia of genes and genomes）是向公众开放的最为著名的生物学通路方面的资源网站。在这个网站中，每一种生物学通路都有专门的图示说明。②BioCarta 数据库：BioCarta 是一家生物技术公司，它在其公共网站上提供了用于绘制生物学通路的模板。研究者可以把符合标准的生物学通路提供给BioCarta数据库。BioCarta数据库不会检验这些生物学通路的质量，因此其中的资源质量参差不齐，并且有许多相互重复。然而BioCarta数据库数据量巨大，且不同于KEGG数据库，包含了大量代谢通路之外的生物学通路，所以也得到广泛的应用。最先出现的通路分析软件之一是GenMAPP（gene microarray pathway profiler）。它可以免费使用，其最新版本为Gen-MAPP2。在这个软件中，使用者可以用几种灵活的文件格式输入自己的表达谱数据，GenMAPP的基因数据库包含许多从常用的资源中得到的物种特异性的基因注释和识别符（ID）。这些ID可以将使用者输入的基因与不同的生物学通路的基

02 生物化学习题与解析--核酸的结构与功能

核酸的结构与功能. 一、选择题（一） A 型题 1 ．核酸的基本组成单位是 A ．磷酸和核糖 B ．核苷和碱基 C ．单核苷酸 D ．含氮碱基 E ．脱氧核苷和碱基 2 ． DNA 的一级结构是 A ．各核苷酸中核苷与磷酸的连接键性质 B ．多核苷酸中脱氧核苷酸的排列顺序 C ． DNA 的双螺旋结构 D ．核糖与含氮碱基的连接键性质 E ． C 、 A 、 U 、 G 4 种核苷酸通过3′ , 5′- 磷酸二酯键连接而成 3 ．在核酸中，核苷酸之间的连接键是 A ．糖苷键 B ．氢键 C ．3′ ,5′- 磷酸二酯键 D ．1′ , 3′- 磷酸二酯键 E ．2′ ,5′- 磷酸二酯键 4 ．核酸中稀有碱基含量最多的是 A ． rRNA B ． mRNA C ． tRNA D ． hnRNA E ． snmRNA 5 ．核酸的最大紫外光吸收值一般在 A ． 280nm B ． 260nm C ． 240nm D ． 200nm E ． 220nm 6 ．有关核酸酶的叙述正确的是 A ．由蛋白质和 RNA 构成 B ．具有酶活性的核酸分子 C ．由蛋白质和 DNA 构成的 D ．专门水解核酸的核酸 E ．专门水解核酸的酶 7 ． DNA 与 RNA 彻底水解后的产物是 A ．戊糖不同，碱基不同 B ．戊糖相同，碱基不同 C ．戊糖不同，碱基相同 D ．戊糖不同，部分碱基不同 E ．戊糖相同，碱基相同 8 ．关于 DNA 的二级结构，叙述错误的是 A ． A 和 T 之间形成三个氢键， G 和 C 之间形成两个氢键 B ．碱基位于双螺旋结构内侧 C ．碱基对之间存在堆积力 D ．两条链的走向相反 E ．双螺旋结构表面有大沟和小沟 9 ．关于 mRNA 叙述正确的是 A ．大多数真核生物的 mRNA 在5′ 末端是多聚腺苷酸结构 B ．大多数真核生物的 mRNA 在5′ 末端是 m 7 GpppN- C ．只有原核生物的 mRNA 在3′ 末端有多聚腺苷酸结构 D ．原核生物的 mRNA 在5′ 末端是 m 7 GpppN- E ．所有生物的 mRNA 分子中都含有稀有碱基 10 ．关于 DNA 热变性的描述正确的是 A ． A 260 下降 B ．碱基对可形成共价键连接

基因组学(结构基因组学和功能基因组学)

问：基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点？答：人类基因组计划完成后生物科学进入了人类后基因组时代，即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代，生命科学的主要研究对象是功能基因组学，包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。基因组研究应该包括两方面的内容：以全基因组测序为目标的结构基因组学(struc tural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段，以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段，是利用结构基因组学提供的信息系统地研究基因功能，它以高通量、大规模实验方法以及统计与计算机分析为特征。功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics)，它利用结构基因组所提供的信息和产物，发展和应用新的实验手段，通过在基因组或系统水平上全面分析基因的功能，使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括：生物学功能，如作为蛋白质激酶对特异蛋白质进行磷酸化修饰；细胞学功能，如参与细胞间和细胞内信号传递途径；发育上功能，如参与形态建成等采用的手段包括经典的减法杂交，差示筛选，cDNA代表差异分析以及mRNA差异显示等，但这些技术不能对基因进行全面系统的分析。新的技术应运而生，包括基因表达的系统分析，cDNA微阵列，DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异，因此需要建立模式生物体。功能基因组学

基因家族生信分析

基因家族生信分析一、什么是基因家族概念：是来源于同一个祖先，有一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因，他们在结构和功能上具有明显的相似性，编码相似的蛋白质产物。划分：按功能划分：把一些功能类似的基因聚类，形成一个家族。按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族。 1.常见基因家族： WRKY基因家族：是植物前十大蛋白质基因家族之一，大量研究表明，WRKY 基因家族的许多成员参与调控植物的生长发育，形态建成与抗病虫。 NBS-LRR抗病基因家族：是植物中最大类抗病基因家族之一。 MADS-BOX基因家族：是植物体内的重要转录因子，它们广泛地调控着植物的生长、发育和生殖等过程。在植物中参与花器官的发育，开花时间的调节，在果实，根，茎，叶的发育中都起着重要的作用。热激蛋白70家族（HSP70）是一类在植物中高度保守的分子伴侣蛋白，在细胞中协助蛋白质正确折叠。二、基因家族分析流程：

●利用蛋白保守域结构提取号在Pfam数据库提取其隐马尔科夫模型矩阵文件（*.hmm） ●在数据库（Ensemble 、JGI、NVBI）下载你所需要的物种的基因组数据（*.fa,*.gff） ●在虚拟机中Bio-Linux中的hummsearch程序，用隐马尔科夫模型矩阵文件在蛋白序列文件中搜索含有该保守结构域的蛋白 ●将蛋白序列导入MEGA软件构建进化树（可以阐明成员之间系统进化关系，从进化关系上揭示其多样性） ●利用MEME搜索蛋白质的保守结构域利用MEME搜索基因家族成员的motif可以揭示基因家族在物种内的多样化及其功能，如果他们都含有相同的motif表明其功能具有相似性，如果部分家族成员含有其他不同的motif,很可能这些成员有其他特异功能，或者可以归分为一个亚族 ●绘制基因染色体位置图从*.gff文件中抽取我们搜索到的基因位置信息，http://mg2c.iask.in/mg2c_v2.0/在线绘制基因染色体位置图通过染色体位置分布，可以了解基因主要分布字哪条染色体上，及是否能形成基因簇（被认为是通过重组与错配促进基因交流） ●基因结构分析从gff文件中抽取基因的结构信息，绘制转录本结构图。 ●计算串联重复基因的Ka,Ks 1.首先将筛选到的基因的cds序列进行多序列对比，筛选identity > 75%，tength大于对比的两条序列中较长的那条的长度的75%，将筛选到的基因分别用clustalw进行比对，比对结果导入 KsKs_Calculster计算Ka，Ks、 Ka/ks比，计算核苷酸的非同义替代（ka）与核苷酸的同义替代（ks）的平均速率。 2.Ka/ks比值<1表明：通过纯化选择降低了氨基酸变化的速率；比值=1表示中性选择；比值>1,表明这些基因可能已经收到积极选择，有利于适应性遗传，这些受正向选择的基因将作为以后的研究重点。软件的安装从图片中获得进入NCBI-blast官网复制blast-linux版本的链接