密码子偏好性

合集下载

豇豆叶绿体基因组密码子使用偏好性分析

豇豆叶绿体基因组密码子使用偏好性分析

核农学报2023,37(6):1118~1129Journal of Nuclear Agricultural Sciences豇豆叶绿体基因组密码子使用偏好性分析仇学文李丹甘玉迪杨有新程柳洋徐梦怡吴才君 *(江西农业大学农学院,江西南昌330000)摘要:为了探究豇豆(Vigna unguiculata)叶绿体基因组密码子的使用模式,本研究从NCBI下载完整的豇豆叶绿体基因组序列,并对其进行结构分析。

利用CodonW和CUSP对筛选获得的50条可编码蛋白序列(CDS)进行分析,获得GC1、GC2、GC3、RSCU、CAI、CBI、Fop、ENc、RFSC等重要参数,并进行中性绘图、PR2-plot绘图、ENc-plot绘图以及对应分析、最优密码子分析和其他物种对比分析。

结果发现,豇豆叶绿体基因密码子更偏向以A或U(T)结尾,G和C在密码子各位置中的占比较低,平均值为36.31%;有效密码子数(ENc)的平均值为44.903,密码子偏好性较弱;GC1与GC2、GC3间均有相关性,表明碱基突变对密码子选择也有影响。

从中性绘图、PR2-plot绘图、ENc-plot绘图结果可以看出,豇豆叶绿体密码子使用偏好性同时受到了碱基突变与自然选择的影响。

本研究最终筛选出20个最优密码子,并将豇豆叶绿体基因组密码子使用频率与其他物种进行比较,发现豇豆与番茄在密码子使用频率上存在较高的相似度。

本研究结果为提高豇豆叶绿体外源基因的表达效率提供了参考依据。

关键词:豇豆;叶绿体;基因组;密码子;使用偏好性DOI:10.11869/j.issn.1000⁃8551.2023.06.1118生物体内的DNA序列表达与信息传递主要借助64个密码子进行,而大多数氨基酸有不止一个密码子对应,称为密码子的简并性[1]。

编码同一个氨基酸的多个密码子称为同义密码子,除色氨酸与蛋氨酸之外,其余18个氨基酸都有多个同义密码子。

而某些同义密码子被高频使用的现象被称为密码子使用偏好性(codon usage bias, CUB)[2]。

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

口蹄疫病毒VP1基因密码子偏好性分析

口蹄疫病毒VP1基因密码子偏好性分析

116口蹄疫病毒VP1基因密码子偏好性分析马 园1,仲 亮2,王国华3,田普厚3,张 涛3,武俊兰3,刘 月3,马红艳3,徐婉瑛3,石顺利4,张七斤1(1. 内蒙古农业大学兽医学院,内蒙古呼和浩特 010018;2. 额尔克哈什哈苏木综合保障和技术推广中心,内蒙古阿拉善 750300;3. 内蒙古必威安泰生物科技有限公司,内蒙古呼和浩特 011500;4.通辽市家畜繁育指导站,内蒙古通辽 028000)摘 要:VP1蛋白是口蹄疫病毒(FMDV)的主要结构蛋白,可诱导机体产生中和抗体以及激发保护性免疫应答。

为探究VP1基因密码子偏好性,筛选出其最佳体外表达系统,使用Visual Gene Developer、CodonW、GraphPad Prism等软件,对VP1基因进行密码子偏好性分析,同时将VP1基因密码子使用频率与大肠杆菌、毕赤酵母、昆虫杆状病毒和哺乳动物细胞表达系统作了比较。

结果显示,VP1基因的CAI为0.21,ENC为55.43,GC3S为65.26%,表明该基因密码子使用偏好较弱并且密码子偏好以G/C碱基结尾。

结合VP1基因与各表达系统密码子使用频率比值,发现其与昆虫杆状病毒表达系统频率比值差异最小且CAI最大,因此推断昆虫杆状病毒表达系统是FMDV VP1基因最适体外表达系统。

本研究为FMDV亚单位疫苗研制等提供了技术基础。

关键词:口蹄疫病毒;VP1基因;密码子;外源表达;昆虫杆状病毒表达系统中图分类号:S852.65 文献标识码:A 文章编号:1005-944X(2021)04-0116-08DOI:10.3969/j.issn.1005-944X.2021.04.024 开放科学(资源服务)标识码(OSID):Analysis on Codon Preference of FMDV VP1 GeneMa Yuan1,Zhong Liang2,Wang Guohua3,Tian Puhou3,Zhang Tao3,Wu Junlan3,Liu Yue3,Ma Hongyan3,Xu Wanying3,Shi Shunli4,Zhang Qijin1(1. College of V eterinary Medicine,Inner Mongolia Agricultural University,Hohhot,Inner Mongolia 010018,China;2. Erkhash Hasumu Comprehensive Security and Technology Promotion Center,Alashan,Inner Mongolia 750300,China;3. Inner Mongolia Bigvet Biotech. Co.,Ltd.,Hohhot,Inner Mongolia 011500,China;4. Tongliao Animal Breeding Station,Tongliao,Inner Mongolia 028000,China)Abstract:VP1 protein is the main structural protein of foot-and-mouth disease virus(FMDV),by which neutralizing antibodies could be induced and protective immune response could be stimulated. In order to identify the codon preference of VP1 gene and screen its best expression system in vitro,relevant analysis was carried out by use of Visual Gene Developer,Codon W,GraphPad Prism and other softwares whilst the usage frequency of VP1 gene codon was compared with that of E. coli,Pichia pastoris,insect baculovirus and mammalian expression systems. The results showed that the CAI value of VP1 gene was 0.21,ENC value was 55.43,and GC3S was 65.26%,indicating that the codon usage preference was weak and ended with G/C base. It was found that,the frequency ratio of VP1 gene to insect baculovirus expression system was minimum,compared to that to the codon of various expression systems,and the CAI value was maximum. Therefore,it was concluded that insect baculovirus expression system was the most appropriate expression system in vitro for FMDV VP1 gene,technical support was thus provided for development of FMDV sub-unit vaccine.Key words:FMDV;VP1 gene;codon;exogenous expression;insect baculovirus expression system收稿日期:2021-02-02 修回日期:2021-02-22通信作者:张七斤。

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

密码子使用偏好性量化方法研究

密码子使用偏好性量化方法研究

密码子使用偏好性量化方法研究摘要在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。

文章概述了目前提出的密码子使用偏性的量化方法及实现原理。

目前研究发现:有些量化密码子偏性的方法受高表达基因参考数据集未完全注释的限制,不同密码子位置对变异和选择的影响不同,以及不同密码子位置处GC 含量和嘌呤含量的贡献不同。

由此展望密码子偏性量化方法发展方向为:需要设计不需要相关参考基因集合先验知识的密码子使用偏性量化方法;考虑不同位置处背景核苷酸组成的密码子使用偏性的量化方法;同时考虑基因表达水平的密码子使用偏性量化方法。

最后,归纳了目前可用的密码子使用偏性的量化工具和数据库。

关键词同义密码子, 密码子使用偏性, 背景核苷酸, GC3, 高表达基因密码子使用偏性是指在不同物种间或同一物种内的基因翻译过程中,某些密码子的使用次数多于其它同义密码子的现象。

密码子使用偏性现象在许多物种中广泛存在。

在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。

分子进化研究表明:密码子使用偏性在基因组中广泛存在,对基因组进化有极深的影响(Sharp and Matassi, 1994)。

并且密码子与氨基酸的关系影响到细胞的蛋白质组分的变化,即分子机制的变化(Xiao and Yu, 2007)。

同时,密码子使用偏性的有效衡量对相关基因功能的推断很重要。

最近的研究表明某些特殊同义密码子的使用也能影响蛋白质的折叠和错误折叠(Tsai et al., 2008;Marin, 2008)。

基因组内不同基因具有不同的密码子使用偏性,变异、选择和随机漂移是形成物种间密码子使用偏性的三个主要原因(Bulmer, 1991; Palidwor et al., 2010Supek et al., 2010 ; Shah and Gilchrist, 2011)。

密码子偏好性分析..

密码子偏好性分析..

手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:

其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。

进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA

如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。

密码子偏好性读书报告演示


4、核糖体和基因定位
5、预测物种亲缘关系生 存环境
6、预测未知基因功能和 表达水平
影响蛋白质的结构与功能基因的密码子偏性与所 马建民等[4]通过聚类分析方法研究发 编码蛋白质结构域的连接区和二级结构单元的连接 现,哺乳动物MHC 基因的密码子偏性与所编 区有关、翻译速率在连接区会降低。改变密码子使 码蛋白质的三级结构密切相关,可通过影响 用模式可目的性改变特定蛋白质的结构与功能。 mRNA 不同区域的翻译速度,来改变编码蛋 白质的空间构象,从而改变蛋白质功能 通过比较密码子的使用模式,来进行真核生物核 基因定位功能密码子的使用模式在细胞核 糖体在细胞内以及未知蛋白基因在基因组的定位。 和细胞质遗传物质之间也存在差异,如核基 因中的起始密码子只有ATG,而线粒体基因 中的起始密码子为ATN;核基因中的终止密 码子TGA 在线粒体基因中用来编码色氨酸等 [5]。 预测进化规律类似的密码子使用模式,预示着物 目前已有研究通过比较密码子偏性的差异 种相近的亲缘关系或生存环境。 程度, 来分析物种间的亲缘关系和进化历 程。 线粒体基因组具有母系遗传、分子结构简 单、多态性丰富等优点,是一种重要的分子 标记,研究其密码子使用偏好性,可以很好 地用于确定动物类群的遗传分化和系统发生 关系 利用密码子使用偏好性和某种功能的关联程度, 对某些未知功能基因进行预测。利用已知的密码子 偏好知识,对未知表达水平的基因进行判定,初步 判断该基因的表达水平高或低。
2、CAI 密码子适应指数 3、CPP
9、COA 对应分析 10、AT-skew AT偏移 11、HE 高表达优越密码子
4、ENC 有效密码子数
5、FOP 最优密码子使用频率 6、CBI 密码子偏爱指数 7、G+C
12、GRAVY 蛋白疏水水平

密码子偏好性与异源蛋白表达

密码子偏性与异源蛋白表达原文:Claes Gustafsson, et al. TRENDS in Biotechnology, 2004,22(7): 346-353./corp/images/MS102504CG.pdf翻译:zhxm409511在1977年,当Genetech的科学家和他们的科研合作伙伴首次利用细菌生产出人类蛋白(生长激素释放抑制因子)时[1],蛋白的异源表达在整个生物技术产业中发挥着关键的角色。

那时,仅知道生长激素释放抑制因子的氨基酸序列,还不知如何从人的基因组中克隆该基因,因此,Genetech小组采用数条寡核苷酸合成了14个密码子长的生长激素释放抑制因子基因。

Itakura和同事们设计这些寡核苷酸时遵循了三条标准[1]。

首先,优先使用MS2噬菌体偏爱的密码子——尽管当时对大肠杆菌的基因组DNA序列还知之甚少,却已刚刚完成了MS2噬菌体的测序,并认为该噬菌体的序列能够代表大肠杆菌高表达基因所使用的密码子。

其次,消除寡核苷酸不必要的分子内和分子间配对,因为这可能影响基因合成。

第三,避免那些先是富含GC随后是富含AT的序列,当时认为这种序列可能会导致转录终止。

结果,利用这条合成的基因首次制生产出来了具有功能活性的多肽。

25年后的今天,大多数基因克隆自cDNA文库或直接利用聚合酶链反应(PCR)从相应的基因组中扩增获得。

要尽量避免从头合成基因,因为这样做需要消耗大量的财力和人力[2]。

尽管基于PCR的克隆被广泛使用,但很多情况下它还是不及所描述的那样快捷和容易。

它经常需要一些不易得到的模板(对于具有内含子的生物,需要cDNA模板),此外还需要进行PCR条件的优化,需要对PCR产物进行测序,如果PCR引入了任何的配对错误,还经常需要通过定点突变进行修复。

然而,当扩增出的基因克隆入表达载体后,真正有趣的事情就发生了:经常是没有蛋白表达或表达水平很低。

人们已经进行了大量的研究,以提高克隆基因的表达水平,包括优化宿主的生长条件,建立新的宿主系,改用新的宿主,和无细胞系统[3]。

刺猬线粒体基因组密码子偏好性分析

收稿日期:2023-05-05作者简介:韩君(1988—),男,黑龙江哈尔滨人,硕士,工程师,研究方向为生物信息学与多组学数据分析。

刺猬线粒体基因组密码子偏好性分析韩君(北京康仁堂药业有限公司,北京101301)摘要:为利用分子技术探究刺猬皮等组织作为中药使用的机制,促进远东刺猬分子进化研究。

以远东刺猬线粒体全基因组序列为材料,从中筛选出长度大于300bp 的非重复编码序列(CDS )12条,利用CodonW1.4.2、SPSS 25.0和Excel 2007等软件分析其密码子偏好性。

结果显示:密码子第3位的碱基平均GC 含量为24.30%;有效密码子数目(ENC )分布范围为31.83~50.67,平均值为43.37;相对同义密码子使用度(RSCU )值>1.00的密码子共有32个,偏好以碱基A 或U (T )结尾。

中性绘图分析结果显示,GC 1和GC 2的平均值(GC 12)与GC 3之间的相关系数为0.443;ENC-plot 分析结果显示,多数基因在标准曲线附近聚集;对应性分析结果表明,第1~4个向量轴的贡献率分别为35.64%、16.22%、10.26%和9.13%,同义密码子第3位的GC 含量(GC3s )、ENC 与第1向量轴(Axis1)呈显著正相关;密码子适应指数(CAI )与Axis1呈负相关,最终确定CUA 、AUA 、GUU 、UCU 、CCC 、ACA 、GCU 、CAU 、AAA 、GAA 、UGA 、CGC 、GGC 和GGA 为最优密码子。

通过优化远东刺猬线粒体基因组密码子以及应用分子手段进行深入研究,有助于探究远东刺猬组织入药机制。

关键词:远东刺猬;线粒体;密码子;偏好性;中药中图分类号:S862;R282文献标志码:A文章编号:1001-0084(2023)04-0031-07Codon Preference Analysis on MitochondrialGenome of Erinaceus amurensisHAN Jun(Beijing Tcmages Pharmaceutical Co.,Ltd.,Beijing 101301,China )Abstract:Using molecular technique to explore the mechanism of hedgehog hide and other tissues applied astraditional Chinese medicine,and promote molecular evolution of Erinaceus amurensis in the Far East,taking the complete mitochondrial genome sequence of Erinaceus amurensis as the material,12non-repeating coding sequences (CDS)with a length greater than 300bp were selected as the research objects in this study,and their codon preference was analyzed by using CodonW1.4.2,SPSS 25.0,Excel 2007and other software.The average GC content of the third codon was 24.30%;the number of effective codons (ENC)ranged from 31.83to 50.67,with an average value of 43.37;and the relative synonymous codon usage (RSCU)value of 32codons was greater than 1.00,and the preference ends with either A or U (T).According to neutral plot analysis,the correlation coefficientbetween the average value (GC 12)of GC 1,and GC 2and GC 3was 0.443.In addition,ENC-plot analysis also revealed that most genes cluster near the standard curve;besides,the corresponding analysis showed that the contribution rates of the 1-4vector axes were 35.64%,16.22%,10.26%and 9.13%,respectively;and the GC content of the third synonymous codon (GC3s )and ENC were significantly positively correlated with the first vector axis (Axis1).In addition,the codon adaptation index (CAI)was negatively correlated with Axis1.Hence,it could finally beDOI:10.20041/ki.slbl.2023.04.006猬科在我国共有5个属7个种。

密码子偏好性分析课件

要求较高。
现有的研究方法和技术还存在一 定的局限性,例如在数据采集、 处理和分析等方面,需要进一步
完善和改进。
研究的发展趋势与前景
随着基因组测序技术的不断发展,可以预见未来将有更多的物种基因组被测序,为 密码子偏好性研究提供更多的数据资源。
计算机科学和统计学的技术进步将为密码子偏好性研究提供更加高效和准确的分析 工具和方法,有助于揭示更深层次的规律和机制。
撰写报告
将分析过程、方法和结果写成报告,以供后续研究和参考。
03
密码子偏好性模型
建立模型
基于序列数据的统计模型
01
Hale Waihona Puke 利用序列数据,通过统计方法建立模型,分析密码子的使用偏
好。
基于基因组数据的机器学习模型
02
利用基因组数据,通过机器学习算法建立模型,预测密码子的
使用偏好。
基于生物信息的综合分析模型
03
数据分析
统计每个密码子的使用频率
根据计算方法得到的密码子使用频率数据进行排序和统计,得出 每个密码子的使用频率。
分析偏好性
对比不同种类生物的密码子使用频率数据,分析密码子的偏好性。
寻找热点密码子
根据统计分析结果,寻找热点密码子,即使用频率最高的密码子。
结果展示
制作图表
根据数据分析结果,制作条形图、饼图、柱状图等图表,直 观展示密码子的使用频率和偏好性。
其他因素
翻译后修饰
某些蛋白质在翻译后需要进行修饰,这种修饰可能会影响密码子的使用。
代谢途径
不同生物体具有不同的代谢途径,这可能会影响密码子的使用和偏好性的形成 。
05
密码子偏好性与蛋白质 表达
密码子使用与蛋白质表达关系
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CCC (6.2)
CAC (7.3)
CGC (14.0)
C
CUA (5.6)
CCA (9.1)
CAA (14.4)
CGA (4.8)
A
CUG (37.4)
CCG (14.5)
CAG (26.7)
CGG (7.9)
G
A
AUU (29.6)
ACU (13.1)
AAU (29.3)
AGU (13.2)
U
AUC (19.4)
ACC (18.9)
AAC (20.3)
AGC (14.3)
C
AUA (13.3)
ACA (15.1)
AAA (37.2)
AGA (7.1)
A
AUG (23.7)
ACG (13.6)
AAG (15.3)
AGG (4.0)
G
G
GUU (21.6)
GCU (18.9)
GAU (33.7)
GGU (23.7)
精氨酸
Arginine
Arg
R
CGU,CGC,CGA,CGG,AGA,AGG
天冬酰胺
Asparagine
Asn
N
AAU,AAC
天冬氨酸
Asparticacid
Asp
D
GAU,GAC
半胱氨酸
Cystine
Cys
C
UGU,UGC
谷氨酸
Glutamicacid
Glu
E
GAA,GAG
谷氨酰胺
Glutarnine
A
UUG (12.9)
UCG (4.4)
UAG (0.8)
UGG (13.2)
G
C
CUU (13.2)
CCU (17.5)
CAU (10.9)
CGU (4.5)
U
CUC (19.6)
CCC (19.8)
CAC (15.1)
CGC (10.4)
C
CUA (7.2)
CCA (16.9)
CAA (12.3)
CGA (6.2)
A
CUG (39.6)
CCG (6.9)
CAG (34.2)
CGG (11.4)
G
A
AUU (16.0)
ACU (13.1)
AAU (17.0)
AGU (12.1)
U
AUC (20.8)
ACC (18.9)
AAC (19.1)
AGC (19.5)
C
AUA (7.5)
ACA (15.1)
Methionine
Met
M
AUG
苯丙氨酸
Phenylalanine
Phe
F
UUU,UUC
脯氨酸
Proline
Pro
P
CCU,CCC,CCA,CCG
丝氨酸
Serine
Ser
S
UCU,UCC,UCA,UCG,AGU,AGC苏氨酸Th源自eonineThrT
ACU,ACC,ACA,ACG
色氨酸
Tryptophan
U
GUC (13.1)
GCC (21.6)
GAC (17.9)
GGC (20.6)
C
GUA (13.1)
GCA (23.0)
GAA (35.1)
GGA (13.6)
A
GUG (19.9)
GCG (21.1)
GAG (19.4)
GGG (12.3)
G
表3大肠杆菌密逆码子
丙氨酸
Alanine
Ala
A
GCU,GCC,GCA,GCG
AAA (24.4)
AGA (12.2)
A
AUG (22.0)
ACG (6.1)
AAG (31.9)
AGG (12.0)
G
G
GUU (11.0)
GCU (18.4)
GAU (21.8)
GGU (10.8)
U
GUC (14.5)
GCC (27.7)
GAC (25.1)
GGC (22.2)
C
GUA (7.1)
GCA (15.8)
GAA (29.0)
GGA (16.5)
A
GUG (28.1)
GCG (7.4)
GAG (39.6)
GGG (16.5)
G
表2大肠杆菌密码子偏好性
第二位碱基(‰)
第三位碱基
U
C
A
G
第一位碱基
U
UUU (24.4)
UCU (13.1)
UAU (21.6)
UGU (5.9)
U
UUC (13.9)
Gln
Q
CAA,CAG
甘氨酸
Glycine
Gly
G
GGU,GGC,GGA,GGG
组氨酸
Histidine
His
H
CAU,CAC
异亮氨酸
Isoleucine
Ile
I
AUU,AUC,AUA
亮氨酸
Leucine
Leu
L
UUA,UUG,CUU,CUC,CUA,CUG
赖氨酸
Lysine
Lys
K
AAA,AAG
蛋氨酸
图1人类密码子偏好性
第二位碱基(‰)
第三位碱基
U
C
A
G
第一位碱基
U
UUU (17.6)
UCU (15.2)
UAU (12.2)
UGU (10.6)
U
UUC (20.3)
UCC (17.7)
UAC (15.3)
UGC (12.6)
C
UUA (7.7)
UCA (12.2)
UAA (1.0)
UGA (1.6)
UCC (9.7)
UAC (11.7)
UGC (5.5)
C
UUA (17.4)
UCA (13.1)
UAA (2.0)
UGA (1.1)
A
UUG (12.9)
UCG (8.2)
UAG (0.3)
UGG (13.4)
G
C
CUU (14.5)
CCU (9.5)
CAU (12.4)
CGU (15.9)
U
CUC (9.5)
Trp
W
UGG
酪氨酸
Tyrosine
Tyr
Y
UAU,UAC
缬氨酸
Valine
Val
V
GUU,GUC,GUA,GUG
起始密码子
AUG
终止密码子
UAG,UGA,UAA
相关文档
最新文档