密码子偏好性与异源蛋白表达

密码子偏好性与异源蛋白表达
密码子偏好性与异源蛋白表达

密码子偏性与异源蛋白表达

原文:Claes Gustafsson, et al. TRENDS in Biotechnology, 2004,22(7): 346-353.

https://www.360docs.net/doc/3c15208206.html,/corp/images/MS102504CG.pdf

翻译:zhxm409511

在1977年,当Genetech的科学家和他们的科研合作伙伴首次利用细菌生产出人类蛋白(生长激素释放抑制因子)时[1],蛋白的异源表达在整个生物技术产业中发挥着关键的角色。那时,仅知道生长激素释放抑制因子的氨基酸序列,还不知如何从人的基因组中克隆该基因,因此,Genetech小组采用数条寡核苷酸合成了14个密码子长的生长激素释放抑制因子基因。Itakura和同事们设计这些寡核苷酸时遵循了三条标准[1]。首先,优先使用MS2噬菌体偏爱的密码子——尽管当时对大肠杆菌的基因组DNA序列还知之甚少,却已刚刚完成了MS2噬菌体的测序,并认为该噬菌体的序列能够代表大肠杆菌高表达基因所使用的密码子。其次,消除寡核苷酸不必要的分子内和分子间配对,因为这可能影响基因合成。第三,避免那些先是富含GC随后是富含AT的序列,当时认为这种序列可能会导致转录终止。结果,利用这条合成的基因首次制生产出来了具有功能活性的多肽。

25年后的今天,大多数基因克隆自cDNA文库或直接利用聚合酶链反应(PCR)从相应的基因组中扩增获得。要尽量避免从头合成基因,因为这样做需要消耗大量的财力和人力[2]。尽管基于PCR的克隆被广泛使用,但很多情况下它还是不及所描述的那样快捷和容易。它经常需要一些不易得到的模板(对于具有内含子的生物,需要cDNA模板),此外还需要进行PCR条件的优化,需要对PCR产物进行测序,如果PCR引入了任何的配对错误,还经常需要通过定点突变进行修复。然而,当扩增出的基因克隆入表达载体后,真正有趣的事情就发生了:经常是没有蛋白表达或表达水平很低。人们已经进行了大量的研究,以提高克隆基因的表达水平,包括优化宿主的生长条件,建立新的宿主系,改用新的宿主,和无细胞系统[3]。尽管这些方法都取得了一些进展,但它们都是围绕一个最根本问题进行的:一种生物所采用的编码蛋白的DNA序列经常不同于另外一种生物在编码该蛋白时所采用的DNA序列。

为什么不同的生物会偏爱不同的密码子?

遗传密码采用61组三连核苷酸(密码子)编码20种氨基酸,采用3个密码子终止翻译。因此每个氨基酸利用1个(Met和Trp)至6个(Arg,Leu,和Ser)同义密码子编码。这些密码子在核糖体中被互补的tRNAs阅读,而这些tRNAs已经事先携带了相应的氨基酸。密码子的兼并性使得同一蛋白可采用多种不同的核苷酸序列编码。对于两种不同的生物,或对于同一生物的高表达和低表达基因,有时甚至在同一个操纵子内部,对不同密码

子的使用频率差别可能很大[4]。

迄今,科学家仍在思索是什么进化压力导致了密码子使用偏性[5]。每种生物内同义密码子之间的突变-选择平衡至少可部分解释基因组GC含量对密码子分布的影响及密码子使用形式的改变[6]。一些研究者推断,旨在减少同工tRNAs多样性的密码子偏性能够降低新陈代谢负荷,因此,有利于生物在快速生长条件下节约部分能量[7]。不管是什么原因导致了密码子偏性,已日益清楚的是密码子偏性对异源蛋白表达有深远的影响[8]。

密码子偏性的观察

一个基因的密码子偏性及其表达水平之间的关联被用来定义密码子适用指数(CAI)[9]。这种衡量密码子使用的方法源自由众多高表达基因组成的引用集(reference set),而这些高表达基因通常被用于衡量一种生物对特定密码子的偏爱程度。根据基因组序列数据,这一指数可被用于预测内源基因的表达水平[10]。然而因为该指数衡量的是偏爱程度,而非偏爱的性质,因此不能用于评价一个基因和一个候选宿主之间的兼容性。基因可能具有更高的偏性,以至导致很高的CAI,但基因偏爱的密码子可能与宿主细胞偏爱的密码子截然不同。

主成分分析法能够将多维的信息压缩成一个两维图形。它提供了一个非常方便的方法去观察不同生物间密码子偏性的差别。图1展示了8个经广泛研究的生物基因组的平均密码子偏性。图中显示,Streptomyces coelicolor具有非常极端的密码子使用图形。该生物的每一个摆动位置(每个密码子的第三个碱基,遗传密码子的兼并性就产生于此)都是G或C,以至S. coelicolor具有很高的GC含量(71%)。图中还显示,Saccharomyces cerevisiae,Caenorhabditis elegans和Arabidopsis thaliana聚集成群,指示它们具有相似密码子偏性,提示在表达C. elegans和A. thaliana的天然基因时,S. cerevisiae可能是一个很合适的宿主。图1还明确的显示,E. coli和人之间的密码子偏性具有明显的不同。这证实了很多研究者通过大量研究获得的结果:在按人的密码子使用方式表达蛋白时,E. coli不是最佳的宿主。利用图中的密码子分布,可以帮助观察每种生物对密码子的使用与其他生物有何不同。例如,哺乳动物细胞通常使用AGG和AGA编码Arg(分别占人基因Arg密码子的11.2%),然而,它们却很少在E. coli中使用(分别为2.1%和2.4%)。因此,在图1中,从人的整体密码子偏性可以看出,AGG和AGA有助于主成分2(PC2)的正偏离。相比之下,E. coli 偏爱的Arg密码子为CGT(16.4%的情况下使用,在人基因的使用频率为4.5%),因此,CGT有助于PC2的负偏离。因此,“密码子使用间距”图非常有用,它能够快速鉴别出每种生物基因不经常使用的密码子,而这些密码子可能会给异源表达带来麻烦。

密码子偏性是如何影响蛋白表达的?

密码子偏性被确定为原核基因表达中一个最重要的因素[11]。其理由很明显,因为原核细胞偏爱的密码子与相应的tRNAs 浓度成正相关。这种关联有助于优化翻译系统,平衡密码子含量和同工tRNA 的浓度[12]。例如,在E. coli 中,tRNA 4Arg 阅读不经常使用的AGG 和AGA 两个Arg 密码子,在细胞中tRNA 4Arg 只具有很低的水平。看起来,密码子使用和同工tRNA 浓度好象是共同进化的结果,与低表达基因相比,这一共同进化的选择压力对高表达基因的影响更加显著[13]。

同工tRNAs 与密码子频率的共同进化有时甚至会偏离规范的遗传密码子[14]。比较基因组学研究为遗传密码子的进化带来了曙光[15,16],不同生物间的轻微的密码子差别是异源蛋白表达的重要阻碍。的确,有些生物,尤其是纤毛虫在阐明端粒生物学方面发挥了重要的作用,它拥有tRNAs 能够将规范的终止密码子TAA 和TAG 识别为Glu ,使得这些图1. 以图形表示“密码子使用间距”。主成分分析(PCA )所采用的算法能够将

几个相关变量(在此指密码子使用频率)转换成少数的被称为主成分的不相关变量。第

一个主成分尽可能多的代表数据中的变异,每个随后的变量尽可能多的代表剩余的变

异。八种生物(http://www.kazusa.or.jp/codon/)所有蛋白对每种密码子的使用频率被列

成表格(8行/生物×62列/密码子),再通过PCA 生成一个“密码子使用间隔”图。Met

和Trp 分别由密码子ATG 和TGG 编码,在此这两个密码子被忽略。总密码子变异信息

的70%由PC1代表,12%由PC2代表。黑色方块表示负荷量(例如,每个密码子对两

个主成分的贡献;举例来说GAT 和CAG 对PC2没有什么贡献,但对PC1具有几乎相

等的负性和正性贡献)。The values of the codon loads have been normalized to that of the

organism distribution. 红色正方形表示该间距中每种生物的偏爱。该图形是采用

Mathworks 的MatLab (https://www.360docs.net/doc/3c15208206.html,/)绘制的。

基因不可能进行异源表达。

通过修饰宿主提高表达

如果密码子偏性对异源基因表达的负面影响来自于不同的tRNA水平,其解决方法之一就是拓宽宿主细胞内的tRNA库。这可以借助过表达编码稀有tRNAs的基因来实现。对于E. coli,argU基因就是促进表达人基因的首要目标,该基因编码稀有的tRNA4Arg(阅读AGG和AGA密码子),tRNA2Ile(阅读AUA),tRNA3Leu(阅读CUA和CUG),tRNA2Pro (阅读CCC和CCU)[8]。过表达这些tRNA基因的E. coli菌株可以从公司购买,如Stratagene (https://www.360docs.net/doc/3c15208206.html,/)和Novagen (https://www.360docs.net/doc/3c15208206.html,/html/NVG/home.htm /)。已有几个实验室的研究表明,当宿主细胞内相应tRNA的含量增加后,那些含稀有密码子基因的表达水平获得了显著提高[8]。

起初,tRNA过表达好象是一个非常有吸引力的手段,不过还是有几点警告是必需要注意的。表达来自不同生物的基因需要过表达不同的tRNAs,因此对于那些与E. coli比起来不易操作的宿主细胞,该策略的吸引力大为减少。此外,改变细胞内tRNA浓度还可能对新陈代谢产生影响。然而,或许最为重要的问题还是增加tRNA浓度会对氨酰化和tRNA 修饰产生怎样的影响,以及过表达蛋白的组成是否会稳定。

tRNA分子在氨酰化和参加翻译过程之前要经过很多加工。已经发现E. coli的tRNAs 需要进行30多处核苷酸修饰;一些发生在所有tRNAs的相同位点,一些仅发生在一个或少数几个tRNAs[17]。很多tRNA修饰散布在整个tRNA分子,尤其是那些位于反密码子环的修饰,已经表明能够促进读码稳定性[18]。这些修饰的目的之一被认为是减少翻译的移码:实验表明,缺少某些tRNA修饰可导致翻译过程中出现错义和无义错误[17],例如,tRNA 上第37位鸟嘌呤核苷(m1G)的N-1位缺乏甲基化可导致翻译移码[19]。

因此,一个关于tRNA过表达策略的问题就是,产生完全功能的tRNA需要其他的细胞组分,而在单独过表达tRNA时这些组分的供应可能有限。当tRNA1Leu在E. coli中过表达时,tRNA至少在两方面严重缺乏修饰:37位的m1G和32位的假尿嘧啶核苷(ψ)。只有40%的tRNA Leu1分子被氨酰化,菌株生长缓慢,核糖体步移时间减少2-3倍[20]。情况相似, tRNA Tyr的过表达导致37位的2-甲硫基-N-6-异戊烯腺苷(ms2i6A)修饰下降,在体外tRNA的效率下降[21]。伴随tRNA Phe过表达产生的ms2i6A导致翻译的忠实性下降[22]。作为未氨酰化tRNA的函数,翻译错义置换率的增加大于一个数量级。对忠实性丧失的一个特殊关注是,如果将所产生的异源蛋白混合物导入脊椎动物体内,它可能会诱发产生免疫反应[23]。

除了翻译忠实性和宿主新陈代谢问题之外,tRNA过表达策略还不够非常灵活。与E.

coli相比,难以对真菌或哺乳动物宿主细胞进行工程改造。在真核细胞,tRNA表达受拷贝

数驱动,而非启动子强度,使得这一问题更加复杂化。对于某些应用,如DNA疫苗这一

新兴领域,宿主工程更是不可能。于是只好通过修饰基因获得高表达。

来自密码子优化的结果

通常,如果一个基因包含越多宿主细胞罕用的密码子,就越不可能获得高水平的异源

表达[8]。如果稀有密码子成串出现或出现在基因读码框的5’端,则会导致表达水平急剧下

降。提高表达常用的一个策略就是改变目的基因的稀有密码子,使之更接近于宿主细胞的

密码子使用方式,而不改变所编码蛋白的氨基酸序列。采用的技术包括序列定点突变[24]

和全基因合成[25]。

如表1所示,我们力图找出在相同系统中对天然基因及密码子优化基因进行蛋白表达

水平比较的所有已发表文献。每个研究所采用的密码子优化方法不同,但都进行了一个或

一个以上的密码子替换,由宿主细胞中稀少使用的密码子替换为宿主细胞频繁使用的密码

子。

表1.文献汇编,在所有文献中对密码子优化和野生型序列的基因表达进行了直接比

较,并对蛋白产量进行了检测。

基因来源蛋白名称宿主提高情况文献

H. sapiens IL2 E. coli 16倍38

C. tetani 片段C E. coli 4倍39

B. thuringiensis CryIA(b), CryIA(c) L. esculentum 100倍40

B. thuringiensis CryIA(b), CryIA(c) Nicotiana tabacum 由未检测出至 >0.1%总蛋白 40 M. musculus IG κ链S. cerevisiae > 50 倍41

Bacillus hybrid (1,3-1,4)-β-葡聚糖

H. vulgare 由未检测出至至每2 x 105原生质体40ng 42

H. sapiens TnT E. coli 10和40倍(两种不同结构) 43

HIV Gp120 H. sapiens >40 倍44

A. victoria GFP H. sapiens 由未检测出至出现实质性信号 44 A. victoria GFP H. sapiens 22 倍45

A. victoria 突变的GFP C. albicans 由未检测出至western出现强条带29

M. musculus c-Fos E. coli 由未检测出至占可溶蛋白的20% 27

S. oleracea 质体蓝素 E. coli 1.2倍46

H. sapiens 神经纤维瘤蛋白 E. coli 3倍47

L. monocytogenes LLO M. musculus 100倍48

H. sapiens M2-2 E. coli 140倍49

R. prowazekii Tlc E. coli 无效50

BPV1 L1 and L2 mammalian > 1 x 103倍51

H. sapiens PC-TP E. coli 由痕量至细胞裂解液蛋白的10% 26 H. sapiens hCG-βDictyostelium 4-5倍52

T. aestivum CYP73A17 S. cerevisiae 4、7和13倍(三种不同的构造) 53

T. aestivum CYP73A17 N. tabacum 5倍53 HIV gag H. sapiens > 322倍54 Dermatophagoides P roDer p1 P. troglodytes 5-10倍55 HIV gag H. sapiens 1.5-2倍28

Plasmodium EBA-175 region II

and MSP-1 M. musculus 4倍56

Tn10/Herpes simplex virus rtTA M. musculus >

20倍57

HPV L1 H. sapiens 1 x 104–1 x 105倍58 C. diphtheriae –

mammal hybrid

DT P. pastoris 0至10mg/L 59 P1 phage Cre Mammalian 1.6倍60 A. equina Equistatin P. pastoris 2倍61 H. sapiens IL-6 E. coli 3倍62 H. sapiens 葡糖脑苷脂酶Pichia pastoris 8-10倍(两种不同构造) 63 Schistosoma

mansoni

SmGPCR H. sapiens 由刚能检测到至western出现强条带64 C. elegans GluClα1, GluClβR. norvegicus 6-9倍65 Herpesvirus U51 Mammalian 10-100倍66 HIV gag , pol, env, nef H. sapiens 分别>250x, >250x, >45x, >20x 67 H. sapiens IL-18 E. coli 5倍68 HPV E5 Mammalian 6-9倍69 HPV E7 Mammalian 20-100倍70 Plasmodium EBA175的F2结构阈E. coli, Pichia pastoris 4倍9倍71

很多密码子优化的报道都是采用E. coli表达哺乳动物蛋白。在几种情况下,蛋白表达水平获得了急剧的提高。两篇论文指出,利用天然基因表达时,不能有效检测出目的蛋白。在密码子优化后,获得了占E. coli总可溶蛋白10%-20%的表达水平[26,27]。在E. coli中表达哺乳动物蛋白时,由密码子优化带来的表达增加通常在5-15倍之间,经常占E. coli 可溶蛋白的5%。

密码子优化的另一个非常成功的应用是提高病毒基因在哺乳动物细胞系中的表达,一般通过全部重新合成基因实现。病毒是一种特殊而又有趣的例子,因为它们的密码子经常受完全不同的压力约束:它们经常通过重叠读码框来负载高密度的信息。很多病毒基因还在编码序列内部编码顺势负调控序列。仅需要表达该蛋白时,可以按照宿主密码子偏性重新合成基因,同时也破坏了调控元件,使蛋白产量得以提高[28]。在DNA疫苗研究中通常对病毒基因的密码子进行优化,通过提高目的抗原的表达来提高免疫原性。在很多已发表的研究中,测定了注射DNA后诱发的免疫反应而不是蛋白浓度。在表1中遗漏了很多这样的例子,表1中仅列举了直接测定蛋白浓度的文献。

缩写:BPV1,牛乳头瘤病毒I型;Cry,结晶;DT,白喉毒素;EBA,红细胞结合蛋白;GFP,绿色荧光蛋白;GluCI,谷氨酸通道;Gp120,糖蛋白120;hCG-β,人绒膜促

性腺激素;HPV,人乳头瘤病毒;IL,白介素;LLO,listeriolysin O;MSP,裂殖子表面蛋白;PC-TP,磷脂酰胆碱转移蛋白;rtTA,reverse Tet transactivator;SmGPCR,Schistosoma mansoni G蛋白偶连受体;Tn,转座子;TnT,肌钙蛋白T;Tic,ATP/ADP转移酶。

对于那些使用不规范密码子的生物,在异源表达其蛋白时需要重新合成基因。这包括一些病原体如Candida albicans[29],和纤毛虫模型生物如Tetrahymena[30]。在异源表达这些生物的基因时,消除可能被阅读为终止信号或不同氨基酸的密码子非常重要。

密码子偏性之外的因素

基因的密码子偏性对其表达有很大的影响,这可能误导人们认为它是唯一影响基因表达的因素。实际上,表达载体的选择和转录启动子也非常重要[3]。围绕基因读码框5’端的核苷酸序列显得优为敏感,包括对稀有密码子的存在[31,32]以及与起始密码子AUG相临的密码子[33,34]。翻译效率的降低可能伴随有更低的mRNA水平,因缺乏核糖体的保护会使mRNA暴露于内源性RNases,尽管这样,在翻译和不能完全去卷绕mRNA稳定性之间还是存在着某些相互作用[2]。mRNA的5’末端结构也会对翻译产生显著的影响[35],已经表明,在目的基因上游耦合一个简短的可以翻译的开放读码框(ORFs)作为一种策略,可以成功的提高一些问题基因的表达效率[36]。

还值得注意的是,有效翻译是必要的但尚不足以产生功能性蛋白。因为多肽链必须经过正确的折叠,在有些情况下还要形成合适的二硫键,甚至要进行例如糖基化等翻译后期修饰才能生成功能性蛋白。对于这些过程,缺少恰当的氧化还原作用环境,伴侣蛋白,normal association partners或修饰酶将会是另一种挑战。这些问题已经超出本文的范围。

基因设计的考虑

重新设计一个基因既自由又费心。在选择谱受约束最小的一端有数量众多的DNA序列能够编码一个氨基酸序列。假设每个氨基酸平均可以被三个不同的密码子编码,则一个由100个氨基酸组成的蛋白,大约能够被3100(~5×1047)个核苷酸序列编码产生。这些可能的序列中有哪些可以带来高水平的异源蛋白表达,又如何将这些序列挑选出来呢?在Box1中描述了如何采用密码子使用分布图设计与合成密码子优化基因。

在选择谱的另一端则只有一个核苷酸序列。在这种情况下,每个氨基酸仅使用一个密码子——被宿主细胞最频繁使用的那个同义密码子。“一个氨基酸——一个密码子”的方法有几个缺点。首先,相对于tRNA的一个子集(组合)而言,由这种基因转录出来的大量mRNA将会产生一个高密码子浓度,导致tRNA库失去平衡、倾斜的密码子使用方式以及潜在的翻译错误[23]:异源表达的蛋白可能占总细胞质量的60%,因此采用单一的tRNA 库将是一个非常严重的问题。在“一个氨基酸——一个密码子”优化的基因中引入同义突

变可以提高蛋白表达水平4倍[37]。第二,在密码子选择上如果没有机动性,则难以避免基因和mRNA中产生一些重复元件和二级结构,抑制和糖体通过颈环结构[35]。重复元件可能使基因合成的难度增加,如果是内部合成则更加麻烦,如果是由商家合成则会更加昂贵和耗时。严重的重复元件还会影响基因在宿主内的稳定性。第三,经常需要在序列中引入或排除一些序列元件,如限制性内切酶位点,以便于随后的操作。如果密码子使用被严格固定下来,则不可能再提供这些便利。

结论

编码于ORF中的遗传信息远不止蛋白的氨基酸序列。根据目前的估计,40%-60%的人类多内含子基因都具有选择性剪接,在所有基因中,10%-20%都发生反义转录,mRNA编辑是常见现象(至少在神经细胞),调节元件亦很丰富,通过RNAi和其他mRNA降解途径引导mRNA降解的序列元件存在于整个人类基因组中。随着我们开始从不同层次洞察存在于DNA编码区的错综复杂的信息,我们已经开始懂得如何在设计基因和遗传网络时做出富于信息的决定。

设计和使用合成基因为研究者提供了一种有效控制异源蛋白表达的机制。和操纵密码子偏性一样,可以增加一个肽标签,去除剪接位点,根据需要增加限制性内切酶位点。在过去的20多年,基因合成的花费和忠实性好象正在沿着一个与寡核苷酸合成相似的道路前进,使得基因合成越来越划算。这一趋势使得科学家们把精力更多的放在科学上,而不是花费在获得工作所需要的工具上。

Box1. 基因设计过程

在DNA2.0(https://www.360docs.net/doc/3c15208206.html,/)基础上所建立的一个设计基因序列编码特定蛋白的方法见图1。该过程包括,根据目的采用一个初始密码子表,通过一系列的筛选,排除那些与其他设计约束不相符合的序列。如图1所示,每次筛选都会排除一些可能的序列,除密码子偏性以外,再经过5-6次约束,还是会保留很多可能序列的。下面对每次筛选都进行了详细的描述。

图1. 基因设计流程图。这是一个设计核苷酸序列在异源宿主中表达的一般过程。对于

一个由100个氨基酸组成的蛋白,经每次筛选后,幸存下来核苷酸序列的大概数量被显

示于图中。

1.构建和使用一个密码子使用表

大量的基因组序列在当前都可以获得,使得构建任何生物的密码子使用表成为可能(非常出色的汇编见http://www.kazusa.or.jp/codon/)。例如,在E. coli中表达时,其高表达(II型)基因的密码子使用情况可以从https://www.360docs.net/doc/3c15208206.html,/~mmaduro/codonusage/ codontable.htm获得[72]。可以通过两个步骤对这些密码子使用表进行改编后用于基因设计。首先,设定阈值水平;即低于特定值(通常介于5%-10%之间)的所有频率都被设定为0,从而使稀有密码子被全部消除。对剩余的频率进行标准化,以使得每个氨基酸所对应的总密码子使用频率等于100%。

如果要在不止一个宿主中表达蛋白,还可以构建一个杂合的密码子使用表。消除低于任何宿主阈值的密码子。对剩余的密码子使用频率,按最具限制性生物的密码子频率进行标准化,或根据所有宿主计算出每个密码子的平均值。

一旦密码子使用表被构建出来,将由电脑根据密码子使用表中每个密码子的频率随机选择密码子,列举出各候选序列。每个设计的序列将通过随后的筛选,以确保与其他的设计标准相吻合。

2.消除不利的密码子配对和极端GC含量

基因的GC含量和临近密码子的出现频率(密码子配对几率)是两个与密码子使用频

率相关的重要因素。密码子配对频率能够使每个密码子的预期统计学分布发生显著的偏移。采用Boycheva等[73]描述的算法和GenBank中的E. coli序列,可以计算出在高表达E. coli基因中密码子配对是被避免的。以鉴别出的应该避免的密码子配对作为标准,就可以拒绝一些候选设计。

3.消除重复序列

可以通过标准的方法如BLAST对序列本身进行比对,找出直接重复序列[74]。那些包含明显长度直接重复序列的候选设计序列将被剔除。

4.避免不利的mRNA二级结构

已经有证据表明,稳定的mRNA结构尤其是转录产物5’端的结构能够减少基因的表达[2,35]。可以通过计算自由能,鉴别出哪些mRNA可能会采取这种结构。进行这种分析的软件可以在https://www.360docs.net/doc/3c15208206.html,/applications/mfold/找到。

5.避免或引入限制性内切酶位点

有没有选择合适的限制性内切酶位点,经常对随后的基因操作非常重要,在载体之间交换,交换蛋白结构阈,以及增加或去除多肽标签或融合蛋白部分。可以对候选序列进行检测,以确保正确安置或去除了限制性内切酶位点。

6.其他约束

还可以通过包括避免脆性剪接位点,调控元件,免疫激活或免疫抑制元件(对DNA 疫苗而言)[76],RNA甲基化信号,selenocystein incorporation信号和许多其他依赖所使用生物系统的因素和特殊考虑,审查基因设计方案。还可以通过基因设计增大遗传距离,从而避免与内源基因同系物重组或避免侵害专利序列。

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数 1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU ) 是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下: 公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。研究中通常先利用高表达基因的RSCU值建立参考表格。 2、密码子适应指数(Codon Adaptation Index, CAI) 可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。 w ij(The relative adaptiveness of a codon): 密码子相对适应度 上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值 L是指基因中所使用的密码子数。 3、密码子偏好参数(Codon Preference Parameter, CPP) CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。 x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除) 4、有效密码子数(Effective Number of Codon, ENC) ENC值的范围在20~ 61之间, 越靠近20偏性越强。此值是描述密码子使用偏离随机选择的

金属硫蛋白的生理作用

金属硫蛋白的生理作用 张俊燕 (化学化工学院云南师范大学昆明650500) 摘要: 金属硫蛋白(MT)在1987年根据MT命名委员会规定,具有:低分子量,6000-7000道尔顿,含有60~63个氨基酸残基;高金属含量,每个蛋白质分子可结合7~12个金属离子;氨基酸特征组成,半胱氨酸的含量占23%~33%,不含芳香族氨基酸和组氨酸;独特的氨基酸序列结构,即半胱氨酸残基的分布有特征性分布的保守性很强;所有的半胱氨酸残基均为还原态出现,并以金属离子通过巯基结合,从而具有金属巯基化合物的光谱特性;具有金属硫醇簇结构。特征的蛋白质或多肽被称MT。 本文重点介绍金属硫蛋白在,清除自由基、解除重金属的毒素、抗辐射、调节机体内的微量元素等方面的生理作用。 关键词:金属硫蛋白、自由基、抗辐射、重金属、微量元素、生理作用。 引言: 一、金属硫蛋白简介 金届硫蛋白(metaHothioneins,MT)是一类富含金属与巯基的非酶蛋白,广泛存在于生物界它与“硬梆榔”的金属有着一种奇妙的亲缘关系.它能和许多金属元素结台成各种金属斑蛋白,所以又称为“重金属结台蛋白”。 二、金属硫蛋白的结构

现代生化丹1f『技术的应用.使研究者对MT 的分干结构有了较深捌的了解不管从何种生物悼中分离出来的MT,分子量6000~7000,比一般蛋白质的分子量低,为低分子量蛋白质哺乳动物的MT分子一般为61~62个氨基酸残基所组成的多肽链。其中含半胱氪酸20个,约占l/3;6~8个赖氪酸,7~10十丝氪酸在氨基酸末端是单一的乙酰甲硫氪酸在MT分子中,含有2个金属硫簇,分别螯合4个和3十二价金属离子。金属离子与半胱氪酸残基的琉基共价结台令人惊奇的是.MT 的20个半胱氨酸琉基均处于还原状态[1]。 三、金属硫蛋白的一般特征 经实验表明,金属硫蛋白具有很强抗热变性和抗蛋白酶消化作用,并且不宜失活,在0~4℃条件下可存活2-3年,在常温条件下也可保存1.5年[1]。 四、金属硫蛋白的生理作用 1、解除重金属的毒性: MT的巯基基团(-SH)能强烈螯合有毒金属汞、银、铅、镉、砷、铬、镍等[2, 3],其中螯合铅的强度比锌大200倍,而螯合镉的强度又比铅大10倍,并可将之排出体外,从而使它们无法毒害人体,同时对体内锌等微量元素无影响。MT是目前临床是最理想的生物整合解毒剂。 2、清除体内自由基、防止机体衰老: MT是细胞中防御自由基伤害的一种重要机制,可藉由自由基的清除来达到防止DNA伤害的发生[4];是体内清除自由基能力最强的一种,其清除自由基的能力约为SOD的1,000倍[5],而也是谷胱甘(GSH)

密码子偏好性与异源蛋白表达

密码子偏性与异源蛋白表达 原文:Claes Gustafsson, et al. TRENDS in Biotechnology, 2004,22(7): 346-353. https://www.360docs.net/doc/3c15208206.html,/corp/images/MS102504CG.pdf 翻译:zhxm409511 在1977年,当Genetech的科学家和他们的科研合作伙伴首次利用细菌生产出人类蛋白(生长激素释放抑制因子)时[1],蛋白的异源表达在整个生物技术产业中发挥着关键的角色。那时,仅知道生长激素释放抑制因子的氨基酸序列,还不知如何从人的基因组中克隆该基因,因此,Genetech小组采用数条寡核苷酸合成了14个密码子长的生长激素释放抑制因子基因。Itakura和同事们设计这些寡核苷酸时遵循了三条标准[1]。首先,优先使用MS2噬菌体偏爱的密码子——尽管当时对大肠杆菌的基因组DNA序列还知之甚少,却已刚刚完成了MS2噬菌体的测序,并认为该噬菌体的序列能够代表大肠杆菌高表达基因所使用的密码子。其次,消除寡核苷酸不必要的分子内和分子间配对,因为这可能影响基因合成。第三,避免那些先是富含GC随后是富含AT的序列,当时认为这种序列可能会导致转录终止。结果,利用这条合成的基因首次制生产出来了具有功能活性的多肽。 25年后的今天,大多数基因克隆自cDNA文库或直接利用聚合酶链反应(PCR)从相应的基因组中扩增获得。要尽量避免从头合成基因,因为这样做需要消耗大量的财力和人力[2]。尽管基于PCR的克隆被广泛使用,但很多情况下它还是不及所描述的那样快捷和容易。它经常需要一些不易得到的模板(对于具有内含子的生物,需要cDNA模板),此外还需要进行PCR条件的优化,需要对PCR产物进行测序,如果PCR引入了任何的配对错误,还经常需要通过定点突变进行修复。然而,当扩增出的基因克隆入表达载体后,真正有趣的事情就发生了:经常是没有蛋白表达或表达水平很低。人们已经进行了大量的研究,以提高克隆基因的表达水平,包括优化宿主的生长条件,建立新的宿主系,改用新的宿主,和无细胞系统[3]。尽管这些方法都取得了一些进展,但它们都是围绕一个最根本问题进行的:一种生物所采用的编码蛋白的DNA序列经常不同于另外一种生物在编码该蛋白时所采用的DNA序列。 为什么不同的生物会偏爱不同的密码子? 遗传密码采用61组三连核苷酸(密码子)编码20种氨基酸,采用3个密码子终止翻译。因此每个氨基酸利用1个(Met和Trp)至6个(Arg,Leu,和Ser)同义密码子编码。这些密码子在核糖体中被互补的tRNAs阅读,而这些tRNAs已经事先携带了相应的氨基酸。密码子的兼并性使得同一蛋白可采用多种不同的核苷酸序列编码。对于两种不同的生物,或对于同一生物的高表达和低表达基因,有时甚至在同一个操纵子内部,对不同密码

1-大肠杆菌重组蛋白表达提取及纯化实验(最新整理)

第一天 1、配置LB培养基: 酵母粉15g、胰蛋白胨30g、氯化钠30g,定容至3000ml。调节PH至 7.4(2M NaOH),高压蒸汽灭菌20分钟,37℃保存。分装成15瓶(每瓶200ml)。 2、接种(超净台要提前杀菌通风) 取4瓶上述培养基,每瓶加200μlAMP(1:1000)、60μl菌液。37℃过夜。 第二天 1、扩大培养(超净台) 4瓶扩至16瓶,每瓶培养基加200μlAMP,摇床培养1小时左右。 2、诱导(超净台) 加40μlIPTG,加完后去除封口的除牛皮纸,扎口较松。25℃摇床培养4小时。 3、离心获取菌体 4℃,8000rpm离心25分钟。注意配平。 4、超声波破碎菌体 离心后去上清,向沉淀加入(600mlPB裂解液、300μl溶菌酶、3mlPMSF)。将菌液转入2个烧杯中,冰浴超声波破菌,400W,75次,每次6秒,间隔2秒。离心收集上清液。 600mlPB裂解液:20mM/L PB,10mM/L EDTA,5%甘油,1mM/L DTT,调节PH至7.4。 超声波破碎:首先用去离子水清洗探头,再将盛有菌液的小烧杯置于有冰 水混合物的大烧杯中,冰水界面略高于菌液面即可。探头浸没于菌液中,不可伸入过长。注意破菌过程中由于冰的融化导致的液面变化。 5、抽滤(双层滤纸) 洗胶(GST)。将上述上清液抽滤,滤液与GST胶混合,磁力搅拌过夜。 第三天

1、抽滤蛋白-胶混合液,滤液取样20μl,留电泳。 2、洗杂蛋白,用1×PBS+PMSF(1000:1)约400ml,洗脱若干次,用移液枪吸去上层泡沫(杂蛋白),至胶上无泡沫为止。 3、洗脱目的蛋白,洗脱液加50ml,分3次进行(15+15+15),每次加入后间歇搅拌,自然静置洗脱15分钟,抽滤,勿使胶干,合并洗脱液,取样20μl,留电泳。用洗脱液调零,测OD280。(OD值达到1.5为佳) 4、将洗脱液置于透析袋中(透析袋应提前煮好),将透析袋置于2L透析液1中,加入磁珠置于4℃冰箱内磁力搅拌器上,4小时后换为透析液2。胶的回收:用3M氯化钠溶液(用1×PBS溶液溶解)、1×PBS(无沉淀)洗涤,20%乙醇洗脱,装瓶。 洗脱液:50mM/LTRIS-HCL 、10mM/LGSH 透析液1:20mM/L TRIS-HCL、1mM/L EDTA 、0.15mM/L DTT 透析液2::0.5mM/L EDTA、1×PBS

重组蛋白表达系统的选择

重组蛋白表达系统的选择、表达策略和方法学研究 宁

1. 前言 在生命科学的很多研究和应用领域中,如何获得大量、均一、高纯、有活性的蛋白质都是一个关键问题。现代重组蛋白表达技术为我们提供了多种选择:传统的大肠杆菌、酵母、昆虫和哺乳动物细胞表达系统以及较新的植物和体外表达系统。每种表达系统都有很多成功的例子,但重组蛋白的个性不尽相同,没有任何一个系统和方法是普遍适用的,为目的蛋白选择一个恰当的表达系统也就成为表达工作的重中之重。 关于目的蛋白的一切信息,对表达系统的选择都是有帮助的,有几个最基本的问题一定要在表达之前回答清楚:目的蛋白的来源是原核还是真核生物?具有什么样的功能?分子量和聚合状态?是膜蛋白还是水溶蛋白?胞表达还是分泌表达?是否需要以及需要何种翻译后修饰?有没有配体、底物或产物类似物可以利用?对蛋白酶是否敏感?有多少分子及分子间二硫键?对目的蛋白的表达量、活性、表达速度和成本有怎样的要求?除了摸清目的蛋白的脾性,还要清楚各个表达系统的特点、优势和局限性,才能找到表达工作的大略方向,要获得最适合目的蛋白的表达方案,还需要在具体实验中调整优化。 表1比较了目前常用的表达系统的特点,并给出了粗略的适用围。 大肠杆菌酵母昆虫细胞哺乳动物细胞流程简单简单复杂复杂 培养基简单简单复杂复杂 成本低低中高 产率高中中低 表达量高高较高较低 蛋白折叠中较好较好好 胞外表达周质空间分泌至培养基分泌至培养基分泌至培养基 细胞增殖周期30min 90min 18H 24H 折叠常有错误折叠偶有不当折叠正确折叠正确 二硫键难以形成有有有 N-糖基化无甘露糖残基,高无唾液酸,简单复杂 O-糖基化无有有有 磷酸化无有有有 酰化无有有有 γ-羧基化无无无有 适用原核蛋白、简单 真核蛋白 真核蛋白、分泌 表达蛋白 真核蛋白、分泌 表达蛋白 复杂高等真核生 物蛋白 表1:常用表达系统比较

甜瓜属人工异源四倍体Cucumis×hytivus早期世代表型与基因表达变化研究

甜瓜属人工异源四倍体Cucumis×hytivus早期世代表型与基因 表达变化研究 多倍体化是高等植物进化过程的重要阶段,是植物进化的主要动力之一。研究表明,异源多倍体在形成的早期可发生广泛的基因组构成和基因表达水平的变化,与此同时,异源多倍体形成早期也常表现出不同于其二倍体祖先、且不能用孟德尔定律解释的新表型,这些变化直接关系到物种的形成和稳定。 分子标记及比较基因组学的发展为认识种间杂交和多倍体化进程提供了重 要依据。前人研究天然异源多倍体进化过程中发生的种种变化主要是通过比较其与二倍体祖先的“候选”后代而进行的。 但现有的天然异源多倍体大多数形成于成千上万年以前,基因组经历了长期的“多倍体二倍化”过程,其二倍体祖先也不断进化或已灭绝,因此很难确定它们在早期进化中发生的表型和基因表达变化的具体过程和机制。新合成的异源多倍体及一些“年轻”的异源多倍体,由于其亲缘关系明晰,为准确、深入研究多倍体基因组进化及相关机制提供了良好的模式系统。 通过这种模式系统,可以精确比较亲本二倍体种与人工异源多倍体早期世代间的表型和基因表达变化特点,从而为丰富多倍体物种进化理论提供重要的例证。本研究基于实验室已合成的甜瓜属人工异源四倍体C.×hytivus(2n=4x=38),比 较研究了其早期世代间的形态学和细胞学变化特征、基因表达变化的特点和黄瓜por基因在异源四倍早期世代的表达和序列变化特征,探讨了异源多倍化引发以 上变化的相关机制。 具体如下:1.甜瓜属人工异源四倍体C.×hytivus早期世代表型变化研究研究了甜瓜属人工异源四倍体C.×hytivus早期四个自交世代S1-S4的主要形态学

金属硫蛋白基本知识

金属硫蛋白 1、MT命名及定义 根据与 MT结合的金属的不同,对只舍一种金属,例如 Cd或 Cu等,可分别定名为镉金属硫蛋白或铜金属碗蛋白等;还可根据结合金属的摩尔含量写成 Cd 7–MT、Zn 7 –MT等 (表示每分子结合7个分子Cd或Zn)。对于含一种以上金属, 如同时含 Cd和Zn时,可写成Cd,Zn-MT。对其分子结构上的差别,可用罗马数字和小写字母标出,例如MT-Ⅱ、MT-Ⅰ、MT-Ⅱ a 等。 经典MT定义:根据金属硫蛋白命名委员会(Thecommitteeon the Nomenclature of Metallothionein)的建议,1988年,Kagi将具有以下特征的蛋白质或多肽定义为MT(Kagi & Schaffer, 1988)。 1.低分子量,一般为6,000-7,000道尔顿,含60-63个氨基酸残基; 2.高金属含量,每分子蛋白质可结合7个二价金属离子,或多至18个一价金属离子; 3.特有的氨基酸组成,无芳香族氨基酸及组氨酸; 4.富含Cys残基(约23-33%),无二硫键;特征的氨基酸序列,Cys残基在氨基酸序列中占据相当保守的位置; 5.所有的Cys残基均以还原态存在;并通过巯基以硫酯键结合金属离子;从而具有金属巯基化合物的特征吸收光谱。 实际上,这只是对经典MT的一个定义。现在MT家族所包括的成员远远超出以上定义的范围。 ※ Cys半胱氨酸 2、MT的分类 1.1 根据 MT的结构差异,一般将其分3类 第1类:MT的氨基酸序列中的半胱氨酸位置与最先从马肾中分离的 MT的氨基酸序列中的半胱氨酸位置紧密相关的多肽。所有哺乳动物的 MT都属于这一类。其它来源的 MT只要其基本结构与哺乳动物的MT相似亦归这一类。 第2类:MT氨基酸序列结构中的半胱氨酸位置与马肾 MT关系较远,与哺乳动物 MT没有或很少有相似的进化关系。如酿酒酵母和某些高等植物的 MT属于这一类。 第 3类:非典型的 MT。是一类由非转译合成的金属硫醇盐多肽,由γ-谷氨酰半胱氨酰基单元组成。这类MT主要来源于真核微生物,常称之为类 MT。依据它们之间的差异,又可分为4种类 MT: 第一类:含大量的酸性氨基酸残基,天冬氨酸含量大于 14%,谷氨酸含量大于18%,这类 MT仅被Cu、Ag诱导。 第二类:它们由同样的肽基亚单位构成,基本结构为γ-谷氨酰肽或称(γ -EC) n G 或 (γ-Glu-Cys) n -Gly。 第三类: MT不舍芳香族氨基酸,分子量为9~9.5kD。

转录因子WRKY的同义密码子使用偏好性分析

拟南芥和水稻转录因子WRKY的同义密码子使用偏好性分析 生物科学2004级何瑞 指导老师刘汉梅讲师 摘要:本文首次对拟南芥和水稻WRKY基因家族的密码子用法进行了分析,发现两个物种WRKY基因的碱基组成明显不同,水稻的密码子在第一、二、三位GC含量都明显高于拟南芥,且第三位差异最大。不同物种的WRKY基因存在共同的进化趋势,即基因GC3s 逐步增大。对应性分析结果显示,拟南芥WRKY基因的密码子使用偏性受碱基组成等多种因素共同作用,水稻主要受碱基组成和基因表达水平两个因素的影响。最后确定了拟南芥和水稻WRKY基因家族的最优密码子,分别为11个和27个。研究结果为深入开展其进化、表达调控机制和提高该基因家族新成员预测的准确性等提供了重要的理论依据。 关键词:WRKY基因,密码字偏好性,GC含量,Enc Synonymous Codon Bias of WRKY Gene Family in Aribidopsis and Rice HE Rui Biological Science,Grade 2004 Directed by LIU Han-mei (instructor) Abstract: WRKY gene family were firstly analyzed on the codon bias in Arabidopsis and Rice. The components of nitrogenous bases in the two species are obviously different: the GC content at the fist, second and third position of Rice are significantly higher than those of Aribidopsis, that discrepancy at the third position is the most marked. Meanwhile, as WRKY gene family is evolving, G-ending and C-ending codons of both Aribidopsis and Rice are good for the genes evolution. According to Correspondence Analysis, the codon usage of WRKY gene in Aribidopsis is affected by many factors, such as the components of nitrogenous bases. But the components of nitrogenous bases and the gene expression level are two primary factors in Rice. The numbers of the optimal codon in Arabidopsis and Rice are 11 and 27. The results of the the research provide the accuracy of important theoretical basis of forecasts for its evolution, regulation of gene expression and adding the gene family members. Keywords: WRKY Gene,Codon bias,GC content,Enc 蛋白质中的氨基酸序列是由mRNA中核苷酸序列决定的。mRNA上连续相邻的核苷酸以3个为一体,即三联体密码子,进行翻译时,识别与其对应的tRNA,正确的译出遗

异源表达

异源表达确实是个很困难的课题,不同的体系、菌种、载体,不同的组合,确实不知道会有哪种适合目的基因 另外重组工程菌的稳定性也是个难题,不过有不同的难度: 1。以质粒的形式存在于菌体里,以质粒表达 这种一般保存还是容易的,多数情况下用抗生素压着就问题不大,而且直接用质粒保存,用时现转也能顺利表达的情况也有的是 2。重组在宿主基因组中,与宿主蛋白一起表达 这就保存起来比较困难了,毕竟不是原装货,很有可能穿几代以后就被踢出来了,有时即使没有踢出来也不表达了(我就遇到过,鉴定基因还在,就是不表达了),很有可能插入的位点在宿主基因组的非活跃区域,过几代就基因沉默了。。。。 一般个人认为可以一试的方法包括 (1)用抗生素传代、保菌后抗生素复苏等等 (2)得到工程菌后第一代就保10管,取一管传一代再保10管,再取一管做使用菌株,也就是保存最原始的菌种 (3)筛选时多筛点,几十个菌株同时传代,5代以后(其实最好10-30代,可惜一般没那个精力)还能保留表达能力的算相对比较稳定了 异源蛋白的表达是个很复杂的问题,有许许多多的影响因素,而且由于蛋白本身千差万别,很难有一个很完善或很标准的流程方法。 另外,表达的宿主也是多种多样,目前比较常用的包括 E.coli,酵母(以甲醇酵母居多),昆虫细胞,哺乳动物细胞等,各自有着其本身的特点,优缺点各异。 但是,异源表达又是分子生物学中很重要的一个工具,园子里不少战友都在做这方面的工作,许多帖子在讨论这方面的问题。因此想发起一个针对这方面的专题讨论,希望有助于大家的工作,当然也希望能对自己的工作有所帮助,欢迎大家讨论。 还有,由于本人只做了有关E.coli和甲醇酵母的工作,其他虽然我们研究所也有人做,但毕竟本身没做过,若有错误或不严谨的地方欢迎战友们指正。 首先在这里提出几方面问题,希望大家讨论: 1. 宿主的选择。 表达宿主虽众多,但比较常用的也就 E.coli,酵母(以甲醇酵母居多),昆虫细胞,哺乳动物细胞等,各自代表了一种体系。 E.coli 原核宿主,无翻译后修饰。但周期短、费用低、表达量大,一直是最常用的宿主之一。蛋白一般很好表达,量很大,但很可能由于蛋白的翻译后修饰不完善而没有活性(或形成包涵体),尤其是表达真核蛋白时最应注意。

金属硫蛋白在肺癌细胞系中的表达及其临床意义

金属硫蛋白在肺癌细胞系中的表达及其临床意义【摘要】目的探讨肺鳞癌、腺癌中金属硫蛋白在肺癌细胞系中的表达。方法运用sp免疫组化方法检测检测肺癌细胞系的表达定位。结果 mt在肺癌细胞系a549、be1表达,均为胞浆表达。在hbe为胞核表达。结论 mt在非小细胞肺癌转移起促进作用。 【关键词】金属硫蛋白;肺癌;转移 doi:10.3969/j.issn.1004-7484(x).2012.08.120 文章编号:1004-7484(2012)-08-2512-01 expression and clinical significance of metallothionein in lung cancer cell lines liu jun,zhang yun-biao,zhang ting,shen xiao-xia,zhang jun-yi,jiang gui-yang 1.liaoning province shenyang city sujiatun district hospital pathology department,liaoning shenyang 110101; 2.liaoning province shenyang hunnan new district hospital,liaoning shenyang 110068; 3.department of ophthalmology the first affiliated hospital china medical university,liaoning shenyang 110001; 4.the fourth affiliated hospital of liaoning university of traditional chinese medicine department of hemodialysis,liaoning shenyang 110101; 5.department of pathology,chifeng university school of

竹节参转录组使用密码子偏好性分析

梁一娥?齐敏杰?丁延庆?等.竹节参转录组使用密码子偏好性分析[J].江苏农业科学?2019?47(2):59-63.doi:10.15889/j.issn.1002-1302.2019.02.013 竹节参转录组使用密码子偏好性分析 梁一娥1?齐敏杰1?丁延庆2?张一来2 (1.贵州师范大学生命科学学院?贵州贵阳550000?2.安顺学院农学院?贵州安顺561000) 一一摘要:竹节参是我国珍稀濒危中药材?研究其基因密码子使用模式?可为利用基因工程技术实现人参皂苷异源生物合成及竹节参分子育种改良提供理论依据?以竹节参转录组测序结果为数据来源?筛选编码蛋白基因序列(coding sequence?简称CDS)碱基数不小于300bp的11199条完整开放阅读框序列作为研究对象?利用Codon和SPSS软件分别统计竹节参基因密码子GC含量二密码子第3位的(C+G)含量(GC3)和密码子第1二第2位(G+C)含量的平均值(GC12)二同义密码子的相对使用度(RSCU)二有效密码子数(ENC)等密码子偏好性指标?通过中性绘图(GC12vs.GC3)二PR2绘图和ENC-GC3s绘图分析影响竹节参密码子使用模式的因素?结果表明?竹节参基因的平均GC二GC12和GC3s含量分别为44.67%二46.97%和39.80%?其密码子使用模式受到突变和选择等多重因素的影响?确定了31个竹节参最优密码子?除了UUG外?其余最优密码子均以A或T结尾?竹节参密码子使用模式与大肠杆菌和酿酒酵母相比差异较大?选取毕赤酵母作为竹节参基因的异源表达宿主更为合适?一一关键词:竹节参?转录组?密码子使用模式?最优密码子 一一中图分类号:Q755?S567.5+10.1一一文献标志码:A一一文章编号:1002-1302(2019)02-0059-05收稿日期:2017-08-27 基金项目:国家自然科学基金(编号:31660252)?贵州省优秀青年科技人才专项(编号:黔科合人字[2015]18号)?贵州省教育厅创新群体重大研究项目(编号:黔教合KY[2016]049号)? 作者简介:梁一娥(1994 )?女?贵州遵义人?硕士研究生?主要从事微生物学研究?E-mail:1013653671@qq.com? 通信作者:张一来?博士?教授?主要从事植物次生代谢调控研究?E-mail:975575681@qq.com? 一一遗传密码子是生物体DNA与蛋白质之间信息传递的基本单位?具有简并性?即同一氨基酸有多个对应的密码子?编码同一种氨基酸的密码子叫作同义密码子?同义密码子在同一物种不同基因间或不同物种内的使用频率大有不同?这种不均衡使用模式称为密码子使用偏好性?通常把使用频率较高的一种或几种同义密码子称为最优密码子[1-2]?研究显示?不同物种之间基因密码子偏好性是由突变压力(如GC含量二基因碱基组成)和自然选择作用(如翻译起始信号二基因表达水平二蛋白结构与长度二tRNA丰度等)引起的?mRNA的二级结构及其稳定性二翻译的速度和准确度二蛋白质折叠等因素也与密码子的偏好性有关[3-4]?对物种密码子偏好性开展研究?有助于理解物种进化发展及密码子使用偏好性的调控机制?密码子偏好性在基因异源表达研究方面也显示了重要作用?基因的表达量越大?其密码子偏好性越强[5]?根据这一原理?替换基因低表达密码子可以提高外源基因表达量?同时根据密码子使用偏好性可以选择更为合适的宿主表达系统?有报道表明?可通过优化密码子的方式来提高外源基因在宿主细胞中的表达量[6-7]?周宗梁等通过优化密码子的方法提高了苏云金芽孢杆菌基因cry1Ah在玉米和水稻中的表达量 [8-9] ?杨金玲等通过优化蝎毒镇痛活性肽基因BmKAngM1? 将其导入毕赤酵母后该基因表达量得到显著提高[10] ?通过使 用最优密码子?在草菇 [11] 二拟南芥 [12] 二川母贝 [13] 二菠萝 [14] 等 生物中均得到了很好的研究成果? 竹节参(PanaxjaponicusC.A.Mey)为多年生草本植物?属于五加科(Paeoniaceae)人参属?是我国珍稀濒危的 七类中草药 之一?具有抗炎二延缓衰老二降血糖等药理作用?有着极高的药用和保健价值?竹节参中富含活性物质三萜皂苷?也是其特征性成分?目前在竹节参种质资源[15-16]二毛状根的培养[17]二基因工程代谢的调控[18]二生药学鉴定[19]二精油成分分析[20]和三萜皂苷代谢追踪[21]等几个研究领域已经开展了许多研究工作?但直接从竹节参中通过分离提取的方法获得三萜皂苷对资源消耗极大?技术难度较高?若利用生物合成的方法则可以很好地解决这一困难?实现有效成分的生物合成?选择适合关键酶基因高效表达的异源表达系统是一个重要步骤?本研究以竹节参转录组数据为材料?通过分析竹节参基因密码子组成的各项指标?研究竹节参表达基因密码子使用偏好性及其影响因素?以期为竹节参相关基因表达系统的选择及分子育种提供理论基础?1 材料与方法1.1一数据来源 竹节参转录组数据来源于文献[22]?通过Perl语言程序 对竹节参转录组数据进行过滤筛选?筛选出碱基数?300bp的蛋白质编码序列共11199条?作为密码子分析的数据来源?本研究中使用到的大肠杆菌(Escherichiacoli)二酿酒酵母(Saccharomycescerevisiae)和毕赤酵母(Pichiapastoris)的密码子偏好性数据来自CodonUsagedatabase(http://www.kazusa.or.jp/codon/)? 1.2一竹节参基因GC含量分析及中性绘图利用CodonW1.4.2(http://codonw.sourceforge.net/)统 计分析竹节参基因密码子的碱基组成规律?测得鸟嘌呤和胞嘧啶总体含量G+C二密码子第3位碱基组成(A3二G3二C3二 95 江苏农业科学一2019年第47卷第2期

金属硫蛋白综述

金属硫蛋白(Metallothionein,MT) 综 述 报 告 王吉

目录 一、MT的主要生理功能…………………………………… (一)重金属的去除解毒功能………………………………… (二)自由基的清除功能……………………………………… (三)抗肿瘤功能……………………………………………… 二、金属硫蛋白提取工艺………………………………… (一)MT的诱导………………………………………………… (二)MT的提取与分离纯化…………………………………… (三)MT的检测方法…………………………………………… 三、MT的应用……………………………………………… 四、MT的研究展望…………………………………………

金属硫蛋白(Metallothionein,MT) ——综述报告 王吉 摘要:金属硫蛋白(metallothionein,MT)是一种广泛存在于生物界、低分子 量、高金属含量、功能独特的蛋白质。目前,对MT的研究已涉及农业、医药、生物 化学、分子生物学、环境科学、卫生毒理学、食品科学、营养学、保健科学和方法学 等领域,其特殊的理化性质与结构及独特的生物学功能在疾病的发生、发展、诊断及 发病机制探讨中显示了重要作用。 关键词:金属硫蛋白MT,医学,环保,动物养殖 前言:金属硫蛋白(metallothionein,MT) ,化学名为金属硫组氨酸三甲基 内盐,是一类广泛存在于生物中的低分子质量(2 ~7kD)、富含半胱氨酸(20%~30%)、 不含组氨酸和芳香族氨基酸的一类金属结合蛋白质。MT能被金属、细胞因子、荷尔蒙、 细胞毒性药物、有机化学药物和应激等诱导。自1957年Margoshoes等首次报道从马 肾中分离得到Cd-MT以来,MT成为基础和应用科学的热点之一,也是我国“863 ”重 大攻关课题和“火炬”计划之一,我国在MT 的研究和应用方面已经在国际上占有重 要一席。但目前,人们对金属硫蛋白在生物学上的功能的认识远远不够,还有待进一 步研究。临床实验证明,MT具有调节生物体内微量元素浓度以及对重金属的解毒作用, 此外它对激素、细胞代谢的调节,细胞分化和增殖的控制以及参与紫外(UV)诱导反应 和清除自由基都有重要作用。对MT的研究和开发利用涉及农业、医药、保健、生物 工程、环境保护等各个领域。到目前为止,已经在瑞士、日本、美国、中国等国家相 继召开了 5 次金属硫蛋白国际会议。 一、MT的主要生理功能 (一)重金属的去除解毒功能 目前,金属硫蛋白解毒机理尚不明确,可能通过这样3 个途径: 1.与重金属螯合成无活性的复合物; 2.螯合重金属,并将其排出体外; 3.减少金属的进入量。目前普遍让人接受的一种观点是还原条件下MT通过巯基与金属离 子结合再形成Cys-M 或Cys-M-Cys 键。 (二)自由基的清除功能 正常情况下,参与代谢的氧大多数与氢结合生成水,然而有一部分氧被酶催化形成超氧阴离子,后者又可以形成氧化氢,它们都属于自由基。自由基有很多种,如氧自由基和羟自由基。一般来说,动物体组织内自由基较少,其参与体内的重要有益的反应。但当机体处于病理或应激时,体内自由基产生过多,就使机体许多重要的生物大分子发生不可逆的氧化损伤,从而导致细胞结构和功能的破坏甚至导致细胞的突变。由于MT具有特殊的化学结构,

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件 题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。 人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。Yasukazu Nakamura博士: The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。 PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。 Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。目前的版本为2.1。Thomas Sch?dl:开发设计的以图形形式对异源基因表达的密码子使用分析软件 (Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。内容: 一:密码子使用统计数据库 Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。每个物种的密码子使用情况都可以通过WWW方式以网页的形式进行分析查询。 在该数据库中29,311个物种的不同形式的密码子使用情况被统计,包含1,756,171 个全长编码区序列。该数据库的数据来源于NCBI GenBank 的Flat File[December 19 2005]. 在数据库的编写过程中,GenBank中的pri (primate sequence entries), rod (rodent sequence entries), mam (other mammalian sequence entries), rt (other ertebrate sequence entries), in (inertebrate sequence entries), pln (plant sequence entries), bct (bacterial sequence entries), rl (iral sequence entries) and phg (phage sequence entries) 文件类型所代表的数据被采用,而EST,pat (patent sequence entries), rna (Structural RNA sequence entries), sts (STS: sequence tagged site sequence entries), syn (synthetic and chimeric sequence entries) and una (unanotated sequence entries)文件类型所代表的数据被舍弃。另外,编码区序列(complete sequenced protein coding genes)被采用,但测序数据中包含的不明确碱基所代表的密码子被排除。 数据库的使用方法: 该数据库可以对物种的拉丁名进行密码子使用情况的搜索,但数据库的搜索是不支持英文别名的。比如对于酵母密码子的搜索,要用其拉丁名Saccharomyces cereisiae,而“yeast”的搜索结果显示为零。另外,数据库对物种也进行了字母排序的统计,同样对酵母,进入S起始的“字典”里可以找到。对于线粒体、叶绿体的密码子使用情况,数据库同样给出了汇总整理。 二:密码子偏好性分析 对于密码子偏好性的分析,有Correspondence Analysis of Codon Usage软件分析程序(/)和graphical codon usage analyser在线分析软件(/faq.php?on=cut)。而对于E. coli,由于其作为发酵工程表达蛋白的最主要的手段,因此Morris Maduro博士针对E. coli开发了 E. coli Codon Usage Analyzer(.edu/~mmaduro/codonusage/usage.htm),目前的版本为2.1,它对于在

低温脂肪酶基因的异源表达

低温脂肪酶基因的异源表达 引言 低温脂肪酶是一种胞外酶,酶的产生要经过异源表达,修饰折叠,最终分泌至细胞外。决定脂肪酶表达的因素是多方面的,如宿主、外源基因、外界环境以及它们之间的相互作用等。低温脂肪酶的异源表达大多选择大肠杆菌做为宿主。 现已发现分子伴侣能识别并调节细胞内多肽的折叠。如果宿主体细胞分子伴侣与外源基因表达所需要的分子伴侣不匹配,外源基因便不能正确表达。革兰氏阳性菌所产脂肪酶首先以“前酶原”的形式表达,酶的前体区域(pre.region)为信号肽,运输酶原至细胞外,酶原在胞外经蛋白酶水解后断裂产生成熟酶。Rosenau将革兰氏阴性菌脂肪酶的分泌机制概括为三种类型。 (1)含有ATP结合盒(ABC)的输出体(ATP-binding cassette exporter)。这种类型适用于N端缺少代表性的信号序列,但c端包含靶信号序列的脂肪酶的分泌。ABC输出体包括三种蛋白质,由内而外依次是ATP酶,弓型的细胞膜融合蛋白(MFP)和外膜蛋白(OMP)。三种蛋白质组合体横跨内外细胞膜,从而在周质中形成通道直接将酶分泌到胞外。 (2)分泌子(secreton)介导的分泌。这种类型主要由xcp基因编码的蛋白质组成,其分布于细胞内外膜,并在外膜形成孔状通道。 (3)自输送体(autotransporter)介导的分泌。通过该途径分泌的脂肪酶尽管分泌到胞外,但仍然与细胞表面密切相连或紧紧固着在细胞表面。脂肪酶包含两个独特的结构域,N端具有催化活性并且暴露在细胞外,c端结构与所谓的自动输送蛋白(autotransporterprotein)类似,通过形成B.折叠结构的分泌通道协助将脂肪酶N端转运出外膜。 Quyen在对脂肪酶异源表达的研究时发现,在分子伴侣的作用下,大肠杆菌中表达的P.cepacia 的脂肪酶可以分泌。但也有学者研究发现,能表达脂肪酶并不意味着能完全分泌至胞外。有一部分菌表达的重组蛋白存在于周质中,只有少部分分泌至胞外。Feller研究发现,莫拉氏菌TA144的脂肪酶在大肠杆菌中表达后,培养物的上清液几乎没有酶活性,而菌悬液有一定的酶活力,说明脂肪酶没有分泌到胞外,而是存在与外周质空间或镶嵌于细胞膜上。迄今为止,已经有多例低温脂肪酶能用基因工程技术成功表达的报告。Choo等将分离自阿拉斯加土壤的适冷的假单胞杆菌的低温脂肪酶基因在大肠杆菌中表达。其最适pH为8.0左右,在45℃时酶活力最高。以对硝基苯月桂酸酯为底物计算酶的活化能为7.7kcal/mol,低于其它南极适冷菌的12~~~~~~~17 kcal/mol,和中温铜绿假单胞菌的25 kcal/mol。Feller_9 报道了一株南极适冷型莫拉氏菌的脂肪酶基因在中温型大肠杆菌中的克隆与表达。结果发现,包含有耐冷型脂肪酶编码基因的克隆只有在生长温度从对应嗜温菌的最适生长温度37℃降至25~C或17℃以后,才表达有酯解活力脂肪酶,从而防止基因产物的热变性,重组酶的最适温度比野生型低了10~C,而且异源表达的脂肪酶比野生型具更明显的热不稳定性。Rashid[1 将深海分离出的假单胞杆菌KB700A脂肪酶基因在大肠杆菌中成功表达。其基因序列与中温菌P. P.fluorescens 的脂肪酶基因的序列同源性可达90%,该脂肪酶只有在Ca 作用下才表现酶活力,另外添加Mn2+ 、Sr2+ 等离子以及去垢剂皆可提高酶活。

实验三 重组蛋白的表达及Western boltting鉴定

实验三重组蛋白的表达及Western boltting鉴定 一、实验内容 1.重组蛋白在大肠杆菌中的诱导表达。 2.重组蛋白的Western boltting鉴定。 二、实验要求 通过实验,要求学生掌握外源基因在原核细胞中表达的方法,掌握Western bolt的基本原理、实验操作步骤及注意事项。 三、实验方法 1.重组蛋白的原核表达与SDS-PAGE分析 (1)将含有重组质粒的细胞在LB平板(含抗生素)上划线,37℃培养过夜。(2)从LB平板挑取单菌落分别移至2 mL的LB培养液(含抗生素),37 ℃振荡培养过夜。 (3)将过夜培养物按1:100转接于2 mL的LB培养液(含抗生素),37℃继续振摇培养至细菌生长对数中期(OD600值达0.5~0.6)。 (4)加入IPTG至终浓度0.5 mmol/L,37℃诱导表达3~6 hr。 (5)取200 μL菌液装入1.5 mL Eppendorf管中,以5000 rpm离心1 min,得到菌体细胞。将细胞重悬于30 μL水,再加入10 μL 4 × SDS-PAGE加样缓冲液,混匀,100℃煮沸10 min后,12,000 rpm离心2 min,吸取上清转移至另一新的离心管中。 (6)样品取5~10 μL进行SDS-PAGE分析。 2.Western blot分析 (1)取4 μL阳性克隆诱导后的样品,利用15%SDS-PAGE电泳分离。 (2)用半干式电转移法将蛋白转至NC膜上。 a.将聚丙稀酰胺凝胶浸泡在电转移缓冲液中平衡10 min。 b.裁剪与凝胶大小相同的NC膜,在电转移缓冲液中平衡10 min。 c.裁剪合适大小的滤纸,用电转移缓冲液浸润,按阳极、三层滤纸、NC膜、 凝胶、三层滤纸、阴极的顺序叠放电转移三明治。 d.按0.5 mA/cm2膜恒流电转移30~50 min。 (3)杂交 a.将NC膜在5%脱脂奶封闭液中室温反应1 hr。 b.TBST漂洗3 × 10 min c.转移膜至用TBST1:100稀释的一抗工作液(抗六个组氨酸单克隆抗体)中, 室温反应1 hr。 d.TBST漂洗3 × 10 min e.转移膜至用TBST1:2000稀释的辣根过氧化物酶(HRP)偶联的羊抗兔I gG

相关文档
最新文档