密码子偏好性分析

合集下载

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

兰科植物FNR基因的密码子偏好性分析

兰科植物FNR基因的密码子偏好性分析

兰科植物FNR基因的密码子偏好性分析作者:李蓉谢析颖王雪晶苏立遥林玉玲郭容芳陈裕坤赖钟雄徐涵来源:《热带作物学报》2018年第06期摘要为揭示兰科植物FNR基因的特性和密码子偏好性,采用DNAMAN、CodonW和SPSS软件及 EMBOSS、SWISS-MODEL在线网站对17种兰科植物的FNR基因序列、氨基酸序列、同源区域及蛋白质三维结构进行分析。

结果表明:兰科植物FNR基因普遍具有在A/T (U)与G/C之间较弱的密码子偏好性;密码子的末位在A和T(U)之间存在显著的T (U)偏好性,在C和G之间存在显著的C偏好性;NADP结合域比非结合域有较小的密码子偏好性;基于CDS和氨基酸聚类结果比基于RSCU聚类更接近于植物的进化分类;自然选择的作用是导致兰科植物FNR基因的密码子使用偏好性的主要成因。

关键词兰科;FNR基因;密码子偏好性中图分类号 S682.31 文献标识码 ACodon Usage Bias of Ferredoxin-NADP+ Oxidoreductase (FNR)in OrchidaceaeLI Rong1, XIE Xiying1, WANG Xuejing1, SU Liyao1, LIN Yuling1, GUO Rongfang1,CHEN Yukun1, LAI Zhongxiong1*, XUHAN Xu1,2*1 Institute of Horticulture of Biotechnology, Fujian Agriculture and Forestry University,Fuzhou, Fujian 350002, China2 Institut de la Recherche Interdisciplinaire de Toulouse, Toulouse 313008, FranceAbstract For a good understanding of the codon usage bias of ferredoxin-NADP+ oxidoreductase (FNR) in Orchidaceae, the gene sequence, amino acid sequence, homologous region and three-dimensional protein structure of 17 FNR genes in Orchidaceae were analyzed by DNAMAN,CodonW, SPSS softwares, and EMBOSS, SWISS-MODEL online programs. The results showed that there was a low-level codon usage bias in FNR genes between A/T(U) and G/C;there existed a significant T(U) bias between A and T(U) and a significant C bias between C and G in the codons; NADP binding domain showed less codon bias than that of the non-binding domain; the cluster tree based on coding sequence (CDS) as well as amino acid sequences matched better with the plant evolution classification; the codon usage bias of FNR was mainly influenced by the natural selection in Orchidaceae.Key words orchidaceae; FNR gene; codon usage biasdoi 10.3969/j.issn.1000-2561.2018.06.015基因表达是细胞在生命活动过程中将储存在DNA双链中的遗传信息转录、翻译为具有生物活性的蛋白质的过程。

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

密码子偏好性分析..

密码子偏好性分析..

手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:

其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。

进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA

如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。

因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。

人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。

Yasukazu Nakamura博士:The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。

PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。

Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。

目前的版本为2.1。

Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。

内容:一:密码子使用统计数据库Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。

数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。

10种植物psy基因密码子使用偏好性分析

10种植物psy基因密码子使用偏好性分析

八氢 番 茄 红 素 合 成 酶 (PSY)是 植 物 类 胡 萝 卜素生物合成途 径 中 的 关 键 酶,对 于 番 茄 红 素 的 合成具有重要作用,犘犛犢 基因表达量高低显著调 控着植物类 胡 萝 卜 素 的 合 成 和 积 累[1],敲 除 番 茄 SlPSY1 基 因 导 致 番 茄 中 类 胡 萝 卜 素 缺 失 , [2] 犘犛犢 基因在烟草[3]、玉米 和 [4] 番 茄 中 超 表 达 提 高 了胡萝卜 素 含 量 和 其 他 次 级 代 谢 物。犘犛犢 基 因 不仅限制了类胡 萝 卜 素 的 生 物 合 成,而 且 在 非 生 物胁迫中也 起 到 作 用。比 如 脱 落 酸、茉 莉 酸 甲 酯 和盐胁迫 。 [57] 在香菜中,茉莉酸甲酯处理 后 导 致 犘犛犢 基因表达增强 。 [8]
1犇犻狊狋狉犻犫狌狋犻狅狀狅犳犲犳犳犲犮狋犻狏犲狀狌犿犫犲狉狅犳犮狅犱狅狀狊犈犖犆犪狀犱犌犆犮狅狀狋犲狀狋犪狋狋犺犻狉犱狊狔狀狅狀狔犿狅狌狊犮狅犱狅狀狆狅狊犻狋犻狅狀犌犆3狊犪狀犱狆犪狉犻狋狔犪狀犪犾狔狊犻狊狅犳犘犛犢犵犲狀犲狊犳狅狉狋犺犲狆犾犪狀狋狊狆犲犮犻犲狊组织图上的每个长方形表示对应于物种的密码子以列显示的rscu值以行显示eachsquareonselforganizingmaprepresentstherscuvalueofacodonshownincolumnscorrespondingtothespeciesshowninrows
收 稿 日 期 :20190730 修 回 日 期 :20191128 基 金 项 目 :国 家 自 然 科 学 基 金 (31860548);石 河 子 大 学 育 种 专 项 (kx0301)。 第 一 作 者 :李 慧 姬 ,女 ,硕 士 研 究 生 ,从 事 植 物 逆 境 相 关 功 能 基 因 研 究 。Email:929281557@qq.com 通 信 作 者 :吉 雪 花 ,女 ,博 士 ,副 教 授 ,主 要 从 事 蔬 菜 抗 逆 及 种 质 资 源 创 新 研 究 。Email:lilysnowjxh@163.com

菠萝叶绿体基因组密码子偏好性分析

菠萝叶绿体基因组密码子偏好性分析作者:杨祥燕蔡元保谭秦亮覃旭黄显雅吴密来源:《热带作物学报》2022年第03期摘要:葉绿体基因组密码子偏好性影响基因的表达效率,对于叶绿体基因工程应用及物种遗传改良具有重要的科学意义。

为了明确菠萝叶绿体基因组密码子偏好性的使用特征及主要影响因素,本研究以菠萝叶绿体基因组为研究对象,利用生物信息学软件分析其密码子的使用模式和偏好性。

密码子偏好性相关参数分析显示:(1)菠萝叶绿体基因密码子的GC含量平均值为38.31%,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,密码子前两位的GC平均含量明显高于第3位;(2)有效密码子数(ENC)的取值范围为38.48~61.00,平均值为47.21,其密码子偏性较弱。

相关性分析显示:(1)GC1与GC2显著相关,GC all与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关;(2)ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关;(3)密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数。

RSCU分析显示,29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个。

中性绘图分析显示,GC12与GC3的相关系数和回归系数分别为0.065和0.085,二者不显著相关。

ENC-plot 绘图分析显示,大多数基因分布于标准曲线附近,多数ENC比值分布在–0.05~0.05区间。

PR2-plot绘图分析显示,所有基因不均匀分布在平面图的4个区域内,密码子第3位嘧啶T/C 的使用频率高于嘌呤A/G。

这3种绘图分析综合表明,自然选择和突变作为主要因素,相对均衡地影响菠萝叶绿体基因组的密码子偏好性。

最优密码子和RSCU分析显示,29个RSCU>1的密码子及筛选的18个最优密码子绝大多数偏好以A或U结尾。

这些研究结果可为外源基因的密码子优化及提高其表达效率提供科学依据。

密码子偏性分析精品资料

2结果与分析
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。

密码子的简并性及偏好性

密码⼦的简并性及偏好性在氨基酸密码⼦及逆密码⼦表⼀贴中,我们以及提到密码⼦表中总计有64种,但实际最终对应翻译的⽬的氨基酸种类只有20种,这就意味着,存在某些多个密码⼦编码同⼀种氨基酸的现象,也称做密码⼦的简并性。

正是由于该特性,每个氨基酸⾄少对应1种密码⼦,最多可以有⼀种氨基酸对应6种密码⼦。

但这些编码相同氨基酸的不同密码⼦,在不同物种、不同⽣物体中使⽤的频率并⾮完全地平均分布,也即绝⼤多数⽣物倾向于只利⽤这些密码⼦中的⼀部分,该现象也称密码⼦的偏好性。

其中那些被最频繁利⽤的密码⼦称为最佳密码⼦(optimal codons),⽽那些不被经常利⽤的密码⼦称为稀有或利⽤率低的密码⼦(rare or low-usage codons)。

不论是真核⽣物还是原核⽣物,每种⽣物都会表现出某种程度的密码⼦利⽤的差异或偏爱。

这些偏好性的产⽣可能与两个原因有关:⼀是避免使⽤类似终⽌密码⼦的密码⼦;⼆是这些偏好能够有效地翻译密码⼦,因为这些密码⼦对应于⽣物体中⾮常丰富的tRNA 。

⽆论导致这种偏好的原因到底是什么,不同⽣物的密码⼦使⽤偏性的差异可以⾮常⼤。

因此,我们在做蛋⽩表达或⽣产时,就需要考虑到密码⼦偏好性的问题。

利⽤偏爱密码⼦(preferred codons),并避免利⽤率低的或稀有的密码⼦,从⽽实现对⽬的表达基因的重新设计也称为密码⼦最佳化。

下表总结了源⾃http://www.kazusa.or.jp/codon/的最常使⽤的表达系统,包括⼈类、⼩⿏、家蚕、酵母在内的真核表达宿主以及原核表达宿主⼤肠杆菌中的密码⼦应⽤的偏好性。

此外,在附件中,我们挑选了⼀篇针对毕⾚酵母(Pichia pastoris )进⾏密码⼦优化的科研论⽂。

密码⼦偏好性表第⼆位碱基U C A G 第⼀位碱基UUU (17.6)UCU (15.2)UAU (12.2)UGU (10.6)UUC (20.3)UCC (17.7)UAC (15.3)UGC (12.6)UUA (7.7)UCA (12.2)UAA (1.0)UGA (1.6)⼈类UUG (12.9)UCG (4.4)UAG (0.8)UGG (13.2)第⼀位碱基CUU (13.2)CCU (17.5)CAU (10.9)CGU (4.5)CUC (19.6)CCC (19.8)CAC (15.1)CGC (10.4)CUA (7.2)CCA (16.9)CAA (12.3)CGA (6.2)CUG (39.6)CCG (6.9)CAG (34.2)CGG (11.4)第⼀位碱基AUU (16.0)ACU (13.1)AAU (17.0)AGU (12.1)AUC (20.8)ACC (18.9)AAC (19.1)AGC (19.5)AUA (7.5)ACA (15.1)AAA (24.4)AGA (12.2)AUG (22.0)ACG (6.1)AAG (31.9)AGG (12.0)第⼀位碱基GUU (11.0)GCU (18.4)GAU (21.8)GGU (10.8)GUC (14.5)GCC (27.7)GAC (25.1)GGC (22.2)GUA (7.1)GCA (15.8)GAA (29.0)GGA (16.5)GUG (28.1)GCG (7.4)GAG (39.6)GGG (16.5)⼩⿏第⼀位碱基UUU (17.2)UCU (16.2)UAU (12.2)UGU (11.4)UUC (21.8)UCC (18.1)UAC (16.1)UGC (12.3)UUA (6.7)UCA (11.8)UAA (1.0)UGA (1.6)UUG (13.4)UCG (4.2)UAG (0.8)UGG (12.5)第⼀位碱基CUU (13.4)CCU (18.4)CAU (10.6)CGU (4.7)CUC (20.2)CCC (18.2)CAC (15.3)CGC (9.4)CUA (8.1)CCA (17.3)CAA (12.0)CGA (6.6)CUG (39.5)CCG (6.2)CAG (34.1)CGG (10.2)第⼀位碱基AUU (15.4)ACU (13.7)AAU (15.6)AGU (12.7)AUC (22.5)ACC (19.0)AAC (20.3)AGC (19.7)AUA (7.4)ACA (16.0)AAA (21.9)AGA (12.1)AUG (22.8)ACG (5.6)AAG (33.6)AGG (12.2)第⼀位碱基GUU (10.7)GCU (20.0)GAU (21.0)GGU (11.4)GUC (15.4)GCC (26.0)GAC (26.0)GGC (21.2)GUA (7.4)GCA (15.8)GAA (27.0)GGA (16.8)GUG (28.4)GCG (6.4)GAG (39.4)GGG (15.2)家蚕第⼀位碱基UUU (15.3)UCU (12.7)UAU (13.9)UGU (8.7)UUC (24.0)UCC (12.0)UAC (22.0)UGC (11.3)UUA (13.1)UCA (13.0)UAA (1.4)UGA (0.6)UUG (15.8)UCG (11.0)UAG (0.6)UGG (11.7)第⼀位碱基CUU (11.5)CCU (14.0)CAU (10.3)CGU (9.8)CUC (14.6)CCC (11.7)CAC (13.8)CGC (10.5)CUA (8.8)CCA (13.6)CAA (18.7)CGA (7.0)CUG (18.4)CCG (13.0)CAG (17.4)CGG (5.4)第⼀位碱基AUU (18.6)ACU (15.6)AAU (20.5)AGU (10.3)AUC (20.7)ACC (14.2)AAC (24.9)AGC (12.5)AUA (15.9)ACA (15.9)AAA (34.0)AGA (14.1)AUG (23.4)ACG (11.9)AAG (28.4)AGG (8.9)第⼀位碱基GUU (16.8)GCU (25.3)GAU (25.6)GGU (21.7)GUC (16.7)GCC (19.7)GAC (28.8)GGC (18.8)GUA (12.4)GCA (14.6)GAA (36.0)GGA (21.4)GUG (19.4)GCG (13.5)GAG (26.2)GGG (7.7)第⼀位碱基UUU (26.1)UCU (23.5)UAU (18.8)UGU (8.1)UUC (18.4)UCC (14.2)UAC (14.8)UGC (4.8)酵母UUA (26.2)UCA (18.7)UAA (1.1)UGA (0.7)UUG (27.2)UCG (8.6)UAG (0.5)UGG (10.4)第⼀位碱基CUU (12.3)CCU (13.5)CAU (13.6)CGU (6.4)CUC (5.4)CCC (6.8)CAC (7.8)CGC (2.6)CUA (13.4)CCA (18.3)CAA (27.3)CGA (3.0)CUG (10.5)CCG (5.3)CAG (12.1)CGG (1.7)第⼀位碱基AUU (30.1)ACU (20.3)AAU (35.7)AGU (14.2)AUC (17.2)ACC (12.7)AAC (24.8)AGC (9.8)AUA (17.8)ACA (17.8)AAA (41.9)AGA (21.3)AUG (20.9)ACG (8.0)AAG (30.8)AGG (9.2)第⼀位碱基GUU (22.1)GCU (21.2)GAU (37.6)GGU (23.9)GUC (11.8)GCC (12.6)GAC (20.2)GGC (9.8)GUA (11.8)GCA (16.2)GAA (45.6)GGA (10.9)GUG (10.8)GCG (6.2)GAG (19.2)GGG (6.0)⼤肠杆菌第⼀位碱基UUU (24.4)UCU (13.1)UAU (21.6)UGU (5.9)UUC (13.9)UCC (9.7)UAC (11.7)UGC (5.5)UUA (17.4)UCA (13.1)UAA (2.0)UGA (1.1)UUG (12.9)UCG (8.2)UAG (0.3)UGG (13.4)第⼀位碱基CUU (14.5)CCU (9.5)CAU (12.4)CGU (15.9)CUC (9.5)CCC (6.2)CAC (7.3)CGC (14.0)CUA (5.6)CCA (9.1)CAA (14.4)CGA (4.8)CUG (37.4)CCG (14.5)CAG (26.7)CGG (7.9)第⼀位碱基AUU (29.6)ACU (13.1)AAU (29.3)AGU (13.2)AUC (19.4)ACC (18.9)AAC (20.3)AGC (14.3)AUA (13.3)ACA (15.1)AAA (37.2)AGA (7.1)AUG (23.7)ACG (13.6)AAG (15.3)AGG (4.0)第⼀位碱基GUU (21.6)GCU (18.9)GAU (33.7)GGU (23.7)GUC (13.1)GCC (21.6)GAC (17.9)GGC (20.6)GUA (13.1)GCA (23.0)GAA (35.1)GGA (13.6)GUG (19.9)GCG (21.1)GAG (19.4)GGG (12.3)。

密码子偏好表

密码子偏好表DNA密码子是指DNA分子上一组三个碱基(核苷酸)的排列顺序,它们对应着氨基酸的编码。

在遗传密码表中,常用的密码子有某种氨基酸的编码,而有些密码子编码了相同的氨基酸。

这种一对多的编码关系就是密码子偏好。

密码子偏好表是一种记录了各种氨基酸编码的密码子使用频率的工具。

通过分析密码子的使用频率,我们可以了解到细胞对不同氨基酸的需求程度,进而提供改良基因表达的依据。

本文将对密码子偏好表的研究内容进行讨论。

一、密码子偏好的分析方法密码子偏好的分析通常基于大规模的基因组数据。

研究者可以从不同生物体的基因组数据库中获取相关数据,并利用生物信息学工具进行分析。

下面介绍几种常用的密码子偏好分析方法:1. 基于相对密码子使用频率的分析方法这种方法主要是比较不同密码子在基因组中的相对使用频率。

通过计算某个密码子相对于其他密码子在同一个位置上的使用频率,可以得出具体的密码子偏好情况。

这种方法需要大规模的基因组数据支持,具备较高的可靠性和准确性。

2. 基于机器学习的方法机器学习方法可以利用已知的密码子和氨基酸关系,构建模型来预测未知密码子的氨基酸编码。

这种方法可以通过训练集和测试集的分割,提高密码子偏好预测的准确性。

然而,由于模型的构建和调整需要大量的计算和优化,这种方法的复杂度较高。

3. 基于统计学的方法统计学方法通过对密码子出现的频率进行统计学分析,来确定密码子偏好情况。

这种方法常常用于不同物种间的密码子偏好比较。

通过统计学的方法,可以发现特定物种在某些密码子的使用上存在明显差异,这些差异可能与物种的进化和适应环境有关。

二、密码子偏好的影响因素密码子偏好的形成和影响因素非常复杂,下面列举了一些常见的影响因素:1. 突变率和选择压力密码子偏好可能受到突变率和选择压力的共同影响。

突变率指的是密码子在基因组中发生变异的速率,而选择压力指的是外界环境对密码子选择的影响。

突变率越高,密码子偏好可能越小,因为基因组中出现新的密码子编码的几率会增加。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract Lipopolysaccharide-binding protein(LBP) is key factor in identifying endotoxin of gram-negative bacterium and starting immune response. The aim of this study was to understand LBP gene codon use features and provide foundation for selecting appropriate receptor animals and expression systems. In this
摘 要 脂多糖结合蛋白(lipopolysaccharide-binding protein, LBP)是机体识别革兰氏阴性菌内毒素并启 动免疫反应的关键因子。为了了解 LBP 基因的密码子使用特性,为其选择合适的受体动物以及最佳外源 表达系统提供依据,本研究运用 CHIPS、CUSP 和 CodonW 在线程序分析自主电子克隆的猪(Sus scrofa) LBP 基因(GenBank 登录号: NM-001128435.1)的密码子偏好性,并与猪 8 种抗病相关基因、模式生物基因 组以及其他物种 LBP 基因相比较。结果表明,猪 LBP 基因大部分偏好使用以 G/C 结尾的密码子,27 种偏 好密码子(相对使用度(RSCU)>1)中偏好性较强的有 GCC、CAC、CTG 和 TCC(RSCU≥2),而猪 8 种抗病 相关基因有 23 种偏好密码子,全部以 G/C 结尾,并且偏好性较强的密码子有 GCC、ATC、CTG 和 GTG;通 过比较 14 种动物的 LBP 基因密码子偏好性,发现 14 个物种的 LBP 基因表达水平一般,并且都偏好以 G/C 结尾的密码子;聚类分析发现,偶蹄目猪与 2 种食肉目动物(猫(Felis catus)和狗(Canis))聚为一类,与系统 分类关系不一致;在密码子的使用频率上,猪 LBP 基因与小鼠(Mus musculus)基因组的差异小于大肠杆菌 (Escherichia coli)和酵母菌(Saccharomyces)等 2 种模式生物基因组,故小鼠更适合作为该 LBP 基因的外源表 达宿主。本研究结果为 LBP 基因在动物遗传改良中选择合适的受体动物、选择最佳的外源表达系统以及 提高其表达水平提供一定的理论依据。 关键词 猪,脂多糖结合蛋白基因(LBP),密码子偏好性
究在不断发展,从研究方向来看,以前主要研究原核
脂 多 糖 结 合 蛋 白 (lipopolysaccharide- binding
生物以及低等真核生物中密码子偏性与基因表达的 protein, LBP)是机体识别革兰氏阴性菌内毒素并启
关系(Gustafsson et al., 2004),随后更多的开始关注 动免疫反应的关键因子。目前关于猪(Sus scrofa)
哺乳动物、植物等高等生物的密码子偏性,这可以有 LBP 基因的研究报道较少,喻礼怀等(2012)利用电
效地分析动植物的基因表达差异以及分子进化机制 子克隆成功克隆出猪 l., 2007),并且通过比较密码子偏性 Uenishi 等(2004)通过猪 EST 序列数据库成功拼接
突变和选择的影响,还受其他多种因素影响,如基 CodonW 在线程序,分析猪 LBP 基因的密码子偏
Online system:
农业生物技术学报 Journal of Agricultural Biotechnology
2013, 21(10):1135~1144 DOI: 10.3969/j.issn.1674-7968.2013.10.001
研究论文 Article
research, pig(Sus scrofa) LBP gene(GenBank Accession: NM- 001128435.1) based on electronic cloning sequence was analyzed by Codon W, CHIPS, and CUSP programs online, and then compared with eight disease resistance- related genes, genomes in model organisms and LBP genes from 14 animal species. The results showed that most of pig LBP genes were bias toward the synonymous codons with G and C at the third codon position. There were twenty- seven biased codons (relative synonymous codon usage(RSCU) >1), whose biased strongly codons were GCC, CAC, CTG and TCC (RSCU≥2). However, all of eight disease resistance-related genes were bias toward codons with G and C, and had twenty-three biased codons, whose biased strongly codons were GCC, ATC, CTG and GTG. The comparative analysis results of LBP genes from 14 animal species also showed that gene expression level was general in 14 animal species,and all of the LBP genes were bias toward the synonymous codons with G and C at the third codon position, which was possible due to special functions of these genes. Clustering analysis showed that pigs belonging to artiodactyla and animals belonging to carnivora were together for a class, which disagreed with taxonomic relationship. The differences in codon usage frequency between pig LBP gene and genome of Mus musculus were less than other two kinds of model organisms' (Escherichia coli and Saccharomyces Yeast) genome. Therefore, Mus musculus expression systems might be more suitable for expression of LBP gene. This study can provide certain theoretical basis for selecting the appropriate receptor animals in animal genetic improvement, selecting appropriate expression systems and improving the expression level of LBP gene. Keywords Pig, Lipopolysaccharide-binding protein gene(LBP), Codon bias
为同义密码子的末位碱基突变是中性选择的结果, 达水平的预测都有待解决,分析密码子偏好性有助
而这种选择不受自然选择压力的影响;选择-突变- 于指导外源基因进行分子改造,从而提高该基因的
漂变学说认为同义密码子的偏好性使用主要是用 表达效率以及新基因预测和基因组注释的准确性
于选择最优密码子。研究发现密码子偏性不仅受 ( 刘 汉 梅, 2010)。 本 研 究 运 用 CHIPS、CUSP 和
遗传信息是主要按照“中心法则”进行传递,即 Powell, 1997)、翻译的起始效应(Sakai et al., 2001)
从 DNA 转录为 mRNA,最后翻译成氨基酸的过程。 以及氨基酸保守性(张文娟, 2006)等。密码子偏性
其中,氨基酸是以三联体密码子形式编码,每个氨基 分析已经成功运用到转基因研究中,通过比较某一
基金项目:国家自然科学基金(No.31172183),江苏省科技支撑计划(农业)(No. BE2012330, BE2010371, BE2013345)和江苏 省产学研前瞻性联合研究项目(No.BY2012157) 收稿日期:2013-05-21 接受日期:2013-07-15
农业生物技术学报 1136 Journal of Agricultural Biotechnology
猪脂多糖结合蛋白基因(LBP)的密码子偏好性分析
吴正常 1 王靖 1 赵乔辉 1 朱世平 1 訾臣 1 吴圣龙 1,2 包文斌 1,2*
1 扬州大学动物科学与技术学院,江苏省动物遗传繁育与分子设计重点实验室,扬州 225009;2 江苏省现代种猪分子选育工程技术研究中心, 常州 213149 *通讯作者,wbbao@
的差异程度,来分析物种间的亲缘关系。
出猪 LBP 基因的 mRNA 序列,GenBank 登录号为
密码子偏性现象存在 2 种理论,即中性理论和 NM_001128435。虽然已经预测出猪 LBP 基因的编
选择-突变-漂变学说(Bulmer, 1991)。中性理论认 码序列,但该基因最佳外源表达系统的选择以及表
相关文档
最新文档