密码子偏好性分析
兰科植物FNR基因的密码子偏好性分析

兰科植物FNR基因的密码子偏好性分析作者:李蓉谢析颖王雪晶苏立遥林玉玲郭容芳陈裕坤赖钟雄徐涵来源:《热带作物学报》2018年第06期摘要为揭示兰科植物FNR基因的特性和密码子偏好性,采用DNAMAN、CodonW和SPSS软件及 EMBOSS、SWISS-MODEL在线网站对17种兰科植物的FNR基因序列、氨基酸序列、同源区域及蛋白质三维结构进行分析。
结果表明:兰科植物FNR基因普遍具有在A/T (U)与G/C之间较弱的密码子偏好性;密码子的末位在A和T(U)之间存在显著的T (U)偏好性,在C和G之间存在显著的C偏好性;NADP结合域比非结合域有较小的密码子偏好性;基于CDS和氨基酸聚类结果比基于RSCU聚类更接近于植物的进化分类;自然选择的作用是导致兰科植物FNR基因的密码子使用偏好性的主要成因。
关键词兰科;FNR基因;密码子偏好性中图分类号 S682.31 文献标识码 ACodon Usage Bias of Ferredoxin-NADP+ Oxidoreductase (FNR)in OrchidaceaeLI Rong1, XIE Xiying1, WANG Xuejing1, SU Liyao1, LIN Yuling1, GUO Rongfang1,CHEN Yukun1, LAI Zhongxiong1*, XUHAN Xu1,2*1 Institute of Horticulture of Biotechnology, Fujian Agriculture and Forestry University,Fuzhou, Fujian 350002, China2 Institut de la Recherche Interdisciplinaire de Toulouse, Toulouse 313008, FranceAbstract For a good understanding of the codon usage bias of ferredoxin-NADP+ oxidoreductase (FNR) in Orchidaceae, the gene sequence, amino acid sequence, homologous region and three-dimensional protein structure of 17 FNR genes in Orchidaceae were analyzed by DNAMAN,CodonW, SPSS softwares, and EMBOSS, SWISS-MODEL online programs. The results showed that there was a low-level codon usage bias in FNR genes between A/T(U) and G/C;there existed a significant T(U) bias between A and T(U) and a significant C bias between C and G in the codons; NADP binding domain showed less codon bias than that of the non-binding domain; the cluster tree based on coding sequence (CDS) as well as amino acid sequences matched better with the plant evolution classification; the codon usage bias of FNR was mainly influenced by the natural selection in Orchidaceae.Key words orchidaceae; FNR gene; codon usage biasdoi 10.3969/j.issn.1000-2561.2018.06.015基因表达是细胞在生命活动过程中将储存在DNA双链中的遗传信息转录、翻译为具有生物活性的蛋白质的过程。
密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。
如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。
第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。
研究中通常先利用高表达基因的RSCU值建立参考表格。
2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。
CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。
CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。
w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。
3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。
它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。
x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。
密码子使用偏好性量化方法研究

密码子使用偏好性量化方法研究摘要在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
文章概述了目前提出的密码子使用偏性的量化方法及实现原理。
目前研究发现:有些量化密码子偏性的方法受高表达基因参考数据集未完全注释的限制,不同密码子位置对变异和选择的影响不同,以及不同密码子位置处GC 含量和嘌呤含量的贡献不同。
由此展望密码子偏性量化方法发展方向为:需要设计不需要相关参考基因集合先验知识的密码子使用偏性量化方法;考虑不同位置处背景核苷酸组成的密码子使用偏性的量化方法;同时考虑基因表达水平的密码子使用偏性量化方法。
最后,归纳了目前可用的密码子使用偏性的量化工具和数据库。
关键词同义密码子, 密码子使用偏性, 背景核苷酸, GC3, 高表达基因密码子使用偏性是指在不同物种间或同一物种内的基因翻译过程中,某些密码子的使用次数多于其它同义密码子的现象。
密码子使用偏性现象在许多物种中广泛存在。
在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
分子进化研究表明:密码子使用偏性在基因组中广泛存在,对基因组进化有极深的影响(Sharp and Matassi, 1994)。
并且密码子与氨基酸的关系影响到细胞的蛋白质组分的变化,即分子机制的变化(Xiao and Yu, 2007)。
同时,密码子使用偏性的有效衡量对相关基因功能的推断很重要。
最近的研究表明某些特殊同义密码子的使用也能影响蛋白质的折叠和错误折叠(Tsai et al., 2008;Marin, 2008)。
基因组内不同基因具有不同的密码子使用偏性,变异、选择和随机漂移是形成物种间密码子使用偏性的三个主要原因(Bulmer, 1991; Palidwor et al., 2010Supek et al., 2010 ; Shah and Gilchrist, 2011)。
密码子偏好性分析..

手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:
其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。
进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA
如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。
《密码子偏好性分析》课件

04
通过绘制ENC-GC3s曲线图,分析GC3s含量与密码子 偏好的关系。
密码子使用模式的影响因素
自然选择
自然选择是影响密码子使用模式的主要因素之一,适应环境变化 的基因会逐渐积累优势,导致密码子使用模式的改变。
基因表达水平
高表达的基因往往具有更加简练和一致的密码子使用模式,以降低 翻译过程中的能量消耗和错误率。
在本课件中,我们介绍了密码子偏好性分析的基本概念、 研究方法和应用,包括密码子使用频率的统计、差异分析 、进化分析和生物信息学软件的应用等。
通过案例分析和实际应用,我们展示了密码子偏好性分析 在基因表达调控、基因组进化和生物信息学研究中的应用 价值。
研究展望
01
02
03
04
随着新一代测序技术的发展 ,将会有更多的基因组和转 录组数据可供分析,这将为 密码子偏好性分析提供更多 的数据来源和应用场景。
《密码子偏好性分析 》ppt课件
目录
CONTENTS
• 密码子偏好性概述 • 密码子使用模式分析 • 密码子偏好性与基因表达水平的
关系 • 密码子偏好性与基因功能的关系
目录
CONTENTS
• 密码子偏好性与生物进化的关系 • 总结与展望
01
密码子偏好性概述
密码子偏好性的定义
密码子偏好性是指生物在基因表达过程中,对使 用不同密码子的倾向性。
计算不同基因或物种的Codon Usage Table(密码子 使用表),记录各个密码子的使用频率。
输标02入题
利用RSCU(Relative Synonymous Codon Usage )值来衡量密码子的偏好性,即将各个密码子的使用 频率标准化,消除氨基酸丰度的影响。
密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。
因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。
人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。
Yasukazu Nakamura博士:The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。
PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。
Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。
目前的版本为2.1。
Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。
内容:一:密码子使用统计数据库Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。
数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。
10种植物psy基因密码子使用偏好性分析
八氢 番 茄 红 素 合 成 酶 (PSY)是 植 物 类 胡 萝 卜素生物合成途 径 中 的 关 键 酶,对 于 番 茄 红 素 的 合成具有重要作用,犘犛犢 基因表达量高低显著调 控着植物类 胡 萝 卜 素 的 合 成 和 积 累[1],敲 除 番 茄 SlPSY1 基 因 导 致 番 茄 中 类 胡 萝 卜 素 缺 失 , [2] 犘犛犢 基因在烟草[3]、玉米 和 [4] 番 茄 中 超 表 达 提 高 了胡萝卜 素 含 量 和 其 他 次 级 代 谢 物。犘犛犢 基 因 不仅限制了类胡 萝 卜 素 的 生 物 合 成,而 且 在 非 生 物胁迫中也 起 到 作 用。比 如 脱 落 酸、茉 莉 酸 甲 酯 和盐胁迫 。 [57] 在香菜中,茉莉酸甲酯处理 后 导 致 犘犛犢 基因表达增强 。 [8]
1犇犻狊狋狉犻犫狌狋犻狅狀狅犳犲犳犳犲犮狋犻狏犲狀狌犿犫犲狉狅犳犮狅犱狅狀狊犈犖犆犪狀犱犌犆犮狅狀狋犲狀狋犪狋狋犺犻狉犱狊狔狀狅狀狔犿狅狌狊犮狅犱狅狀狆狅狊犻狋犻狅狀犌犆3狊犪狀犱狆犪狉犻狋狔犪狀犪犾狔狊犻狊狅犳犘犛犢犵犲狀犲狊犳狅狉狋犺犲狆犾犪狀狋狊狆犲犮犻犲狊组织图上的每个长方形表示对应于物种的密码子以列显示的rscu值以行显示eachsquareonselforganizingmaprepresentstherscuvalueofacodonshownincolumnscorrespondingtothespeciesshowninrows
收 稿 日 期 :20190730 修 回 日 期 :20191128 基 金 项 目 :国 家 自 然 科 学 基 金 (31860548);石 河 子 大 学 育 种 专 项 (kx0301)。 第 一 作 者 :李 慧 姬 ,女 ,硕 士 研 究 生 ,从 事 植 物 逆 境 相 关 功 能 基 因 研 究 。Email:929281557@qq.com 通 信 作 者 :吉 雪 花 ,女 ,博 士 ,副 教 授 ,主 要 从 事 蔬 菜 抗 逆 及 种 质 资 源 创 新 研 究 。Email:lilysnowjxh@163.com
菠萝叶绿体基因组密码子偏好性分析
菠萝叶绿体基因组密码子偏好性分析作者:杨祥燕蔡元保谭秦亮覃旭黄显雅吴密来源:《热带作物学报》2022年第03期摘要:葉绿体基因组密码子偏好性影响基因的表达效率,对于叶绿体基因工程应用及物种遗传改良具有重要的科学意义。
为了明确菠萝叶绿体基因组密码子偏好性的使用特征及主要影响因素,本研究以菠萝叶绿体基因组为研究对象,利用生物信息学软件分析其密码子的使用模式和偏好性。
密码子偏好性相关参数分析显示:(1)菠萝叶绿体基因密码子的GC含量平均值为38.31%,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,密码子前两位的GC平均含量明显高于第3位;(2)有效密码子数(ENC)的取值范围为38.48~61.00,平均值为47.21,其密码子偏性较弱。
相关性分析显示:(1)GC1与GC2显著相关,GC all与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关;(2)ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关;(3)密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数。
RSCU分析显示,29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个。
中性绘图分析显示,GC12与GC3的相关系数和回归系数分别为0.065和0.085,二者不显著相关。
ENC-plot 绘图分析显示,大多数基因分布于标准曲线附近,多数ENC比值分布在–0.05~0.05区间。
PR2-plot绘图分析显示,所有基因不均匀分布在平面图的4个区域内,密码子第3位嘧啶T/C 的使用频率高于嘌呤A/G。
这3种绘图分析综合表明,自然选择和突变作为主要因素,相对均衡地影响菠萝叶绿体基因组的密码子偏好性。
最优密码子和RSCU分析显示,29个RSCU>1的密码子及筛选的18个最优密码子绝大多数偏好以A或U结尾。
这些研究结果可为外源基因的密码子优化及提高其表达效率提供科学依据。
密码子偏性分析精品资料
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。
密码子偏好表
密码子偏好表DNA密码子是指DNA分子上一组三个碱基(核苷酸)的排列顺序,它们对应着氨基酸的编码。
在遗传密码表中,常用的密码子有某种氨基酸的编码,而有些密码子编码了相同的氨基酸。
这种一对多的编码关系就是密码子偏好。
密码子偏好表是一种记录了各种氨基酸编码的密码子使用频率的工具。
通过分析密码子的使用频率,我们可以了解到细胞对不同氨基酸的需求程度,进而提供改良基因表达的依据。
本文将对密码子偏好表的研究内容进行讨论。
一、密码子偏好的分析方法密码子偏好的分析通常基于大规模的基因组数据。
研究者可以从不同生物体的基因组数据库中获取相关数据,并利用生物信息学工具进行分析。
下面介绍几种常用的密码子偏好分析方法:1. 基于相对密码子使用频率的分析方法这种方法主要是比较不同密码子在基因组中的相对使用频率。
通过计算某个密码子相对于其他密码子在同一个位置上的使用频率,可以得出具体的密码子偏好情况。
这种方法需要大规模的基因组数据支持,具备较高的可靠性和准确性。
2. 基于机器学习的方法机器学习方法可以利用已知的密码子和氨基酸关系,构建模型来预测未知密码子的氨基酸编码。
这种方法可以通过训练集和测试集的分割,提高密码子偏好预测的准确性。
然而,由于模型的构建和调整需要大量的计算和优化,这种方法的复杂度较高。
3. 基于统计学的方法统计学方法通过对密码子出现的频率进行统计学分析,来确定密码子偏好情况。
这种方法常常用于不同物种间的密码子偏好比较。
通过统计学的方法,可以发现特定物种在某些密码子的使用上存在明显差异,这些差异可能与物种的进化和适应环境有关。
二、密码子偏好的影响因素密码子偏好的形成和影响因素非常复杂,下面列举了一些常见的影响因素:1. 突变率和选择压力密码子偏好可能受到突变率和选择压力的共同影响。
突变率指的是密码子在基因组中发生变异的速率,而选择压力指的是外界环境对密码子选择的影响。
突变率越高,密码子偏好可能越小,因为基因组中出现新的密码子编码的几率会增加。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(四)基因长度
(五)蛋白质的结构功能
基因密码子的使用与基因编码的蛋白的结构和功能有关 ,蛋白质的折叠 方式与序列之间存在一定的相关性 ,蛋白质的三级结构与密码子使用概 率有密切的关系。在不同物种中类型相同的基因具有相近的密码子使用 模式 。对于同一类型的基因由物种引起的同义密码子使用偏性的差异较 小。
如何在genebank中查找一基因的序列
(1)如果拥有基因accession号即可,在下拉按钮中选中Nucleotide, Search前输入accession号,直接会输出所需的基因序列。 (2)如果拥有基因ID号,也可以用ID号来查询,例如我们要查询一个ID 号为16151096 的基因
密码子偏好性分析
陈永红 孟如月
制
密码子是核酸携带信息和蛋白质携带信息间
对应的基本原则, 是生物体内信息传递的基本 环节。在 生物的遗传密码中, 除色氨酸和甲硫氨酸只有 一个密码子外, 其余氨基酸都有一个以上的简 并密码子。对 同一物种, 不同蛋白编码密码子在基因中出现 的频率不同; 就同一种氨基酸而言, 编码该氨 基酸的不同密 码子的比率在不同的蛋白中也有差异, 因此生 物体基因对简并密码子的选择具有一定的偏 爱性。
最有密码子鉴定原则: 1,密码子的可变位点 (wobblebase)与细胞内浓度最高的tRNA的反义密 码子第一位互补; 2,tRNA的反密码子的可变位点为或5一梭甲基尿啼陡时相对于G更偏好 结尾为A的密码子; 3,反义密码子的可变位点为l(Inosine)时,更偏好结尾为U或C的密码子; 4,密码子若第一、二位均为A或U,则第三位更加偏好C。
有效密码子数 ( Effective Number of Codon ,Nc)
C AI 测量的是某个基因所用的密码子与高表达基因所用密码子的接近程 度 。 和 C AI 不同 ,Nc测量的是某个基因的密码子偏好程度 , 如果一个 基因平均使用每一个密码子 ,则其 Nc 为 61 ,如果一个基因只使用每组同 义密码子中的一个 ,则其 Nc 为 20 。理论上讲 ,一个具有低 C AI 的基因 也可以同时具有低 Nc 值 ,换句话说 , 该基因具有较强的密码子偏好性 , 只不过其偏向的并不是高表达基因所用的密码子 。
研究方法
基因样本的选择
GeneBank ( http: / /www.ncbi.nlm.nih.gov / ) 中获得,样本选择原 则: ①样本为全长蛋白质编码基因序列( CodonDNA sequence,CDS) ; ②CDS 长度大于 300bp; ③对于基因家族成员仍包含于分析样本内; ④不包括非研究类别基因序列;
密码子在蛋白翻译过程中需要和携带对应反密码子的tRNA相互识别作用, 才能把游离的氨基酸残基转移到多肽链上因 此这 些对应的的 tRNA丰度 就决定了蛋白质合成的资源。密码子使用的偏性与细胞内tRNA 的含量 呈正相关。 基因长度越长,能够容纳的密码子越多。在没有其他压力的情况下,则 同义密码子被选择的概率不会受样本容量限制而出现统计上的误差;相 反基因长度越短,可以编码的密码子数量和种类越少,甚至有的密码子 根本不会出现 。
如图
分析结果如下:
结果如下:
同样,可计算出密码子适应指数:
Sequence: AY047586.1 CAI: 0.109
用chips计算出有效密码字数: # CHIPS codon usage statistics Nc = 48.082
计算同义密码子相对使用频率(relative frequency of synonymous codon,RFSC)
其中RSCUmax、是高表达参照基因中,每一个氨基酸里使用频率最高的密码子的相对同义密码子使用频率,L是基因中 密码子的个数
高 频 密 码 子与最优密码子
某一密码子相对同义密码子使用频率单值超过60% 或者超过该组同义密 码子平均占有频率的1.5 倍的密码子即为高频码子。 最后采用高表达优越密码子分析方法先,计算每个基因的密码子有效数 和相对同义密码子用法, 然后再根据各 Nc值确 定高表达和低表达样本 组,计算出这两个样本组中各个密码子各自的值,最后通过卡方检验确 定出高表达基因的优越密码子确定最优密码子。
计算公式:
其中p,表示密码子i的使用频率,n是所有密码子的数目
GC 和 GC3s G C 测量的是基因中 G 和 C 的含量 。G C 3s 则计算密码子第三个碱基 中出现 G 或 C 的频率 。一般认为这两个因素对基因的密码子选择有重 要影响。 GC content 不同物种GC含量变化很大 识别基因水平转移,判断外源基因 GC skew (G-C)/(G+C)% 预测细菌或古细菌复制起点
同义密码子相对使用度(Relative synonymous codon usage, RSCU):它是 指对于某一特定的密码子,在编码对应氨基酸的同义密码子间的相对概率,去除 了氨基酸组成对密码子使用的影响。该值的计算方法为某一密码子所使用的频率 与其在无偏使用时预期频率之间的比值,如果密码子的使用没有偏好性,该密码 子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相 对较多的密码子,反之亦然 。
反映的是在样本总数中各个密码子的使用频率,即某一密码子在样本中 的实际观察值与该密码子对应的氨基酸在样本中的实际观察值的比值。 用软件codonw(/)来计算。
由于密码子偏性的研究近年来一直是一个热点,因此研究的指标也出现 得很多,如可以衡量特定基因偏性大小的密码子偏爱指CBI(Morton1993) 和最优密码子使用频率 FOp(LavnerandKotlar2005),弥补了密码子的 相对嫡值的加Ew(Suzukietal.2004)等。多种多样的技术和方法促进了密 码子偏性的研究,但是也产生了一些的研究结果之间存在了的不一致, 特别是有些方法仅仅能运用于局限的物种或某些特定的基因中。因此在 使用这些新开发的方法时,必须了解每一种方法背后的假设和推论,才 能确保结果的正确性。
其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。
手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:
(六)蛋白的疏水性水平以及氨基酸
保守性不同的基因编码序列其氨基酸含量有可能不同,一 方 面 ,稀有 氨基酸由于本身出现几率小,一旦使用某种密码子而其他密码子出现几 率更小;另 一 方 ,面对 于 比 较 保 守 的氨基酸不容易发生突变则其密 码子使用模式固定为序列本身组成。
研究方法
(一)研究指标
(一)基因序列碱基组成的偏好性
在不存在自然选择压力 的 情 况 下, 一定方向的突变压会影响序列本 身的碱基组成 ,而这一效应同时也会反映在同义密码子的第 3位上。这 样 的偏好性仅仅是反映了序列组成的特征,而与蛋白功能或表达水平无 关。
(二)弱的自然选择效应
对于所有密码子家族来讲,即使存在密码子偏好性,由于同义密码子并 不改变最终的蛋白产 物。所以对于那些频繁被使用的密码子的选择性被 认为是很弱的。但是这种弱的选择会体现在基因表达水平上。在高表达 的基因中,密码子使用偏好性要强过一 般表达的基因。
进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA
如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。
同义密码子(Synonymous Codons):编码同一氨基酸
的密码子。
在蛋白质编码过程中, 某一物种或某一基因通常倾向
于使用一种或几种特定的同义密码子, 这种现象称为 同义密码子的使用偏性(Synony mous Codon Usage Bias)
研究密码子使用偏性的意义: (一)作为预测真核生物核糖体在细胞内定位的一种