优化基因表达的关键因素
基因表达优化的3个关键步骤

特定功能的 Motif
许多 motif 在基因表达过程中承担着重要的角色,随着研究的不断开展,功能性 motiБайду номын сангаас 也在 不断被发现,我们会将其不断地添加到南京德泰生物的密码子优化工具中。举例如下:
TATA 框:是构成真核生物的启动子元件之一,位于转录起始点上游-30bp 处,它可 以保证转录的正确定位
基因表达优化的 3 个关键步骤
亲和标签的选择 表达条件的优化 密码子优化
概述
基因表达优化的目的在于通过重组基因技术表达出尽可能接近天然构象的重组蛋白质。重组 蛋白表达的关键要素包括基因、载体、表达宿主、表达培养条件。这些要素之间是相互影响 的,所以为了更好地达到优化的目的,需要将目标放到其所在上下文中进行优化。密码子优 化作为一种相对成熟的生物信息手段,已经被广泛应用于重组蛋白表达过程中。同时融合标 签的选择,表达条件的优化对目标蛋白的表达量及表达质量也起到至关重要的作用。接下来 将对融合标签、表达条件、密码子优化参数进行介绍。
基因合成
表达载体构建
平衡 GC 含量 正反向重复序列 二级结构
目标基因上下文 酶切位点
基因转录
平衡 GC 含量 平衡 CpG 岛 SD 序列 Kozak 序列 TATA 框 Chi 位点 终止信号 隐蔽剪切 位点
mRNA 翻译及折叠
密码子偏好性 GC 含量 polyA 位点 信号 mRNA 二级结构 mRNA 自由能 核糖体绑定位点
激活,会造成 mRNA 的剪接偏离我们的预期。
仔细研究转录、翻译的过程,并不断阅读基础资料及最新研究进展,不断搜集相关的 motif 模式,我们南京德泰生物在不断完善密码子优化算法。在载体设计上,我们要通盘考虑。当 然,部分 motif 已经固化到了商业载体上了。
基因治疗中的基因启动子与增强子设计与构建

基因治疗中的基因启动子与增强子设计与构建基因治疗是一种利用基因工程技术来治疗疾病的方法。
在基因治疗中,基因的表达调控是至关重要的一步。
基因的表达需要一个启动子来启动基因的转录,同时增强子的作用可以提高基因的表达水平。
合理设计和构建基因启动子和增强子对于基因治疗的成功至关重要。
基因启动子是调控基因表达的关键元素之一,它们位于基因的上游区域,可以结合转录因子,通过调节转录以实现基因表达控制。
在基因治疗中,设计和选择适当的启动子非常重要。
主要的原则是选择能够实现高水平和特异性基因表达的启动子。
一些常用的启动子包括CMV启动子、EF1α启动子和hEF1α启动子等。
CMV启动子广泛应用于基因治疗领域,因为它具有高度活性和广谱的转录活性。
EF1α启动子和hEF1α启动子具有相似的特性,能在多种细胞系中实现高表达。
根据实际需求,选择适合的启动子非常重要。
增强子是另一种在基因治疗中常用的基因调控元素,它可以增强启动子对转录因子的结合,提高基因转录和表达水平。
增强子通常位于启动子的上游或下游区域,并与启动子通过调节染色质结构密切合作。
在基因治疗中,增加基因的表达水平非常重要,因此增强子的设计与构建十分重要。
为了设计和构建适当的基因启动子和增强子,下面是一些建议:首先,了解目标细胞和目标基因的特性。
了解目标细胞的生长环境、代谢活性、表达系统等特点,以便选择适当的启动子和增强子。
同时,了解目标基因在不同组织和细胞系中的表达水平和特异性,以便选择适合的启动子和增强子。
其次,选择适当的启动子和增强子。
根据目标基因和目标细胞的特性,选择合适的启动子和增强子。
在选择启动子时,考虑到其活性和特异性,以及在不同细胞系和组织中的表达特点。
在选择增强子时,考虑到其对启动子的增强效应和在目标细胞中的可操作性。
在设计和构建基因启动子和增强子时,需要注意以下几点:1. 启动子和增强子的序列设计:根据特定的需求,可以通过计算机辅助设计工具来优化启动子和增强子的序列,提高其活性和特异性。
环境因素与基因表达调控

环境因素与基因表达的关联
▪ 环境因素对基因表达的影响方式
1.顺式作用元件:环境中的刺激因素可通过与基因上游的顺式作用元件结合,影响RNA聚合 酶的招募和转录起始,从而调控基因表达。 2.反式作用因子:环境中的信号分子可与细胞内的反式作用因子结合,改变其活性和结合顺式 作用元件的能力,进而影响基因表达。 3.表观遗传修饰:环境因素可引起DNA甲基化、组蛋白修饰等表观遗传改变,从而影响染色 质结构和基因表达。
▪ 环境因素与疾病发生发展的关联
1.许多疾病的发生与发展与环境因素的暴露密切相关。 2.环境因素可通过影响基因表达调控网络,导致细胞功能异常和疾病发生。 3.了解环境因素与基因表达的关联,有助于疾病的预防和治疗。
环境因素与基因表达的关联
物信息学的发展,对环境因素与基因表达调控机制的研究不断深入 。 2.研究人员利用基因组学、转录组学、表观组学等多组学技术,揭示了许多环境因素对基因表 达的调控机制和靶基因。 3.未来研究可进一步关注环境因素与基因表达调控的个体差异和时空特异性,为精准医学和个 性化健康干预提供理论依据。
▪ 顺式作用元件
1.顺式作用元件是指DNA序列上能够影响基因表达的调控区域 。 2.常见的顺式作用元件包括启动子、增强子、沉默子等。 3.不同顺式作用元件的作用机制和位置效应不同,对基因表达 的调控具有重要影响。
基因表达调控基本原理
▪ 反式作用因子
1.反式作用因子是指能够结合顺式作用元件并调节基因表达的 蛋白质因子。 2.反式作用因子通常具有DNA结合域和转录激活域,能够特异 性识别并结合顺式作用元件。 3.反式作用因子的表达和活性受到多种因素的调节,包括磷酸 化、泛素化等修饰过程。
▪ 环境污染与疾病发生
1.环境污染物可诱导基因表达异常,导致细胞功能紊乱和疾病 发生。 2.长期暴露于环境污染物可增加患癌症、心血管疾病和神经系 统疾病的风险。 3.环境因素的改善可有效减少疾病的发生。
基因表达调控及其研究方法进展

基因表达调控及其研究方法进展基因表达是生物学研究中的核心问题之一,而基因表达调控则是确定基因表达的关键因素。
基因表达调控指的是一系列分子机制,能够调节基因的转录、翻译等过程,从而影响蛋白质的合成。
本文将介绍基因表达调控及其研究方法的最新进展。
1.转录调控转录调控是基因表达调控的第一步,它可以是启动子区域或DNA结构的调节。
目前,空间组织和化学修饰是重要的 DNA 结构因素。
新近发现的 N6-甲基腺嘌呤 (N6-methyladenine, 6mA) 和N6,2'-O-二甲基腺苷 (N6,2'-O-dimethyladenosine, m6A) 是在真核生物中被发现的新的 DNA和RNA化学修饰。
此外,名为 eRNA 的可链RNA也在转录调控中扮演重要角色。
eRNA是一种引导启动子区域进行组装的RNA,能够在转录因子的帮助下影响基因表达。
2.转录后调控转录后调控是指不影响核苷酸序列但在mRNA处理、剪接、核糖体结合、转运和翻译过程中对 mRNA 的调节。
其分子机制包括RNA 结构和 RNA 及蛋白质的相互作用。
最近,新的 RNA 测序技术和方法已被广泛应用于生物学研究。
例如,这些技术能够验证RNA修饰和剪接,探测小RNA,和识别 m6A RNA和mRNA-RNA交互等。
3.表观遗传调控表观遗传调控包括 DNA 甲基化、组蛋白修饰和非编码 RNA (ncRNA) 调控等。
DNA 甲基化是基因表达调控中常见的改变方式。
之前我们认为 DNA 甲基化是稳定的。
然而最近的技术研究表明甲基化可能会被去除或改变,因此甲基化对基因调控的影响有一些变量因素。
另一方面,组蛋白修饰通常导致染色质状态的转变并影响基因表达的可及性。
ncRNA调控,如长链ncRNA,短链ncRNA以及微RNA,可与靶基因的启动子区域的某些元素相结合,从而影响基因表达和转录过程。
随着高通量测序和核糖体分析技术的发展,已经发现了许多新的调控因子及其功能,同时也涌现出了许多新的研究方法。
基因治疗中的表达载体构建与优化方法

基因治疗中的表达载体构建与优化方法基因治疗是一种新兴的治疗方法,通过将修饰过的基因导入患者体内,以实现对疾病基因的修复或替代。
在基因治疗中,表达载体的构建和优化是关键的一步,它决定了基因在患者体内的表达效率和稳定性。
本文将介绍基因治疗中常用的表达载体构建与优化方法。
表达载体是将目标基因导入细胞内进行表达的工具。
常见的表达载体主要包括质粒和病毒载体。
质粒是一种双链DNA分子,它可以自主复制和表达携带的基因。
病毒载体是一种利用病毒基因表达机制的表达工具,常见的病毒载体有腺病毒、逆转录病毒和腱病毒等。
表达载体的选择应根据具体的治疗目标、基因大小和细胞类型等因素进行考虑。
表达载体的构建是基因治疗中的关键一步。
首先,需要将目标基因克隆到合适的表达载体中。
这可以通过PCR扩增目标基因,然后利用限制性内切酶进行酶切,并将目标基因与表达载体连接。
常用的连接方法有限制性内切酶切和连接、PCR聚合、Ligase连接等。
连接完成后,需要进行质粒或病毒载体的复制,以获得足够多的表达载体。
表达载体的优化是为了提高基因在患者体内的表达效率和稳定性。
优化的方法有很多种,下面将介绍几种常见的方法。
首先,可以通过调整启动子和增强子的选择来提高基因表达效率。
启动子是调控基因转录的序列,它的选择可以影响基因的表达水平。
常用的启动子有CMV启动子、EF1α启动子和PGK启动子等。
增强子可以增加基因的表达水平,常用的增强子有CMV增强子、SV40增强子和EF1α增强子等。
通过合理选择启动子和增强子的组合,可以提高基因在细胞内的表达水平。
其次,可以通过改变表达载体的拓扑结构来提高基因表达效率。
常用的方法有线性化质粒和环形质粒之间的选择。
线性化质粒在导入细胞内后,可更容易与细胞内的转录因子结合,从而促进基因的表达。
环形质粒则具有更好的稳定性,在不进一步构建的情况下,可以长期保持在细胞内。
此外,还可以通过引入信号序列来优化基因的靶向表达。
信号序列是一段具有特定功能的氨基酸序列,能够促使基因产物在细胞中的定位和分泌。
基因治疗中的基因修饰载体选择与优化

基因治疗中的基因修饰载体选择与优化基因治疗是一种重要的生物技术,旨在通过向患者体内引入特定的基因来治疗或预防疾病。
一个关键的问题是如何有效地将目标基因传送到患者体内。
基因修饰载体的选择和优化是实现高效基因治疗的重要一环。
基因修饰载体是将目标基因传递到细胞内的介质,通常由两个主要组成部分构成:基因传递的载体(如病毒或质粒)和携带目标基因的DNA片段。
在选择和优化基因修饰载体时,以下几个因素需要考虑。
首先,选择合适的基因传递载体非常重要。
最常用的基因传递载体有病毒和质粒两种。
病毒有多种类型,包括腺病毒、逆转录病毒和腺相关病毒等。
病毒能够高效地传递基因到细胞内,但也存在一些潜在的问题,如免疫反应和基因传递的效率限制。
质粒则是一种无害的环形DNA分子,可以通过电穿孔、胶质转染或共转染等方式传递到细胞内。
质粒的使用相对安全,但传递效率较低。
因此,在选择基因传递载体时,需要综合考虑病毒和质粒的优缺点,根据治疗需求和目标细胞类型进行选择。
其次,目标基因的选择和优化也是基因修饰载体设计的关键。
目标基因的选择应该基于疾病的类型和特点。
例如,基因治疗用于治疗遗传性疾病时,目标基因可能是一个缺失或突变的基因,用于恢复蛋白质的功能。
在优化目标基因时,可以采用多种策略。
一种常见的策略是优化基因的信号序列,以确保基因在目标细胞中得到充分的表达。
另一种策略是使用启动子和增强子序列来调节基因的表达水平。
此外,还可以使用遗传密码子优化技术,使得目标基因在适应宿主细胞的转录和翻译机器时效率更高。
基因修饰载体的设计还需要考虑目标细胞类型和递送策略。
不同类型的细胞可能对基因修饰载体有不同的偏好。
例如,一些细胞具有高度易感性,可以通过简单的递送策略(如病毒转染或质粒电转染)实现高效基因传递。
然而,其他细胞类型可能需要经过基因修饰载体的定向修改,以提高基因递送的效率和特异性。
这种定向修改可以通过改变病毒或质粒表面蛋白的配体,或采用基因修饰载体与胶体或纳米粒子复合等方法实现。
高中生物中的基因表达调控

高中生物中的基因表达调控在高中生物的学习中,基因表达调控是一个极其重要的概念。
它就像是一个精细而复杂的指挥系统,决定着生物体何时、何地以及如何表达特定的基因,从而影响着生命活动的方方面面。
要理解基因表达调控,首先得知道什么是基因表达。
简单来说,基因表达就是基因通过转录和翻译产生具有生物活性的蛋白质或 RNA 的过程。
而基因表达调控呢,则是指对这个过程进行调节和控制,以确保基因在合适的时间、空间和条件下进行表达,并且表达的水平恰到好处。
为什么基因表达调控如此重要呢?想象一下,如果我们身体里的每一个基因都在不停地表达,无时无刻不在大量产生蛋白质,那将会是一场混乱的灾难!相反,如果基因该表达的时候不表达,或者表达的量不够,也会导致各种问题。
所以,基因表达调控对于生物体的正常生长、发育、繁殖以及适应环境变化都至关重要。
基因表达调控可以发生在多个层面。
在转录水平上,这是基因表达调控的关键环节之一。
DNA 上的基因并不是随时都能被转录成 RNA 的,而是受到各种因素的影响。
比如,存在一些特殊的蛋白质,叫做转录因子,它们能够与基因的特定区域结合,促进或者抑制转录的进行。
以细菌为例,它们有一种叫做操纵子的结构,这是一个很典型的转录水平调控的例子。
操纵子包括一组相关的基因,以及调控这些基因表达的元件。
比如,乳糖操纵子,当环境中有乳糖而没有葡萄糖时,乳糖会与一种阻遏蛋白结合,使其构象发生改变,不再能够与操纵基因结合,从而让 RNA 聚合酶能够顺利地结合到启动子上,启动基因的转录,产生分解乳糖所需的酶。
在转录后水平,基因表达调控也在发挥作用。
RNA 经过转录产生后,还需要经过一系列的加工和修饰,比如剪接、加帽、加尾等。
这些过程都可以对基因表达进行调控。
翻译水平的调控同样不容忽视。
核糖体与 mRNA 的结合、起始密码子的识别、以及翻译的速度等,都可能受到调控。
除了这些分子层面的调控机制,细胞和生物体还可以通过更宏观的方式来调控基因表达。
环境因素对基因表达的调控机制

环境因素对基因表达的调控机制基因是生命的基本单位,而基因表达则决定了细胞功能和生物体的特征。
然而,基因表达不仅仅受到基因本身的遗传因素的影响,环境因素也扮演着重要的角色。
环境因素可以影响基因的活性和调控模式,从而进一步影响基因表达。
本文将探讨环境因素对基因表达的调控机制。
一、DNA甲基化DNA甲基化是一种重要的表观遗传修饰方式,通过添加甲基基团到DNA分子中,可以影响基因的可读性。
环境因素可以直接或间接地影响DNA甲基化程度,从而调节基因的表达。
例如,高温、饥饿、毒素暴露等环境压力可以引起DNA甲基化水平的变化,导致与应激相关的基因表达变化。
二、组蛋白修饰组蛋白修饰是另一种重要的表观遗传调控机制。
环境因素可以通过改变组蛋白修饰模式来调节基因表达。
例如,在环境温度变化下,组蛋白乙酰化修饰的模式会发生改变,从而影响热应激相关基因的表达。
此外,研究还表明,组蛋白甲基化修饰也受到环境因素的影响,这种修饰方式与基因的静默或激活相关。
三、非编码RNA在基因表达调控机制中,非编码RNA(ncRNA)起到了重要的作用。
环境因素可以通过调节ncRNA的表达来影响基因的转录和翻译。
例如,一些环境胁迫可以诱导小RNA的表达,这些小RNA可以与mRNA结合,从而干扰基因的转录和翻译过程,进而影响基因的表达。
四、转录因子转录因子是基因表达调控的关键调节器。
环境因素可以改变转录因子的活性和表达水平,从而影响基因的转录过程。
例如,在感染病原体的过程中,免疫应答转录因子的活性会发生变化,从而引起免疫相关基因的表达变化。
此外,研究还发现,环境因素可以通过改变转录因子的DNA结合亲和力来调节基因的表达。
综上所述,环境因素对基因表达的调控机制非常复杂。
通过调节DNA甲基化、组蛋白修饰、非编码RNA和转录因子等多种方式,环境因素可以直接或间接地影响基因的表达。
这一研究领域的深入探索,将有助于我们更好地理解基因与环境之间的相互作用,以及对环境因素进行合理调控的重要性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
优化基因表达的关键因素
作者:来源:时间:2006-5-30 21:07:17 阅读次数:3211
在基因表达研究中,研究者比较注意选择合适的表达载体和宿主系统,而往往忽视基因本身是否与载体和宿主系统为最佳匹配这样一个实质性问题。
基因的最佳化表达可以通过对基因的重新设计和合成来实现,如消除稀有密码子而利用最佳化密码子,二级结构最小化,调整GC含量等。
以下就密码子最佳化、翻译终止效率和真核细胞中异源蛋白表达的问题加以说明。
密码子最佳化(codon optimization)
遗传密码有64种,但是绝大多数生物倾向于利用这些密码子中的一部分。
那些被最频繁利用的称为最佳密码子(optimal codons),那些不被经常利用的称为稀有或利用率低的密码子(rare or low-usage codons)。
实际上用做蛋白表达或生产的每种生物(包括大肠杆菌,酵母,哺乳动物细胞,Pichia,植物细胞和昆虫细胞)都表现出某种程度的密码子利用的差异或偏爱。
大肠杆菌、酵母、果蝇、灵长类等每种生物都有独特的8个密码子极少被利用。
有趣的是,灵长类和酵母有6个同样的利用率低的密码子。
大肠杆菌、酵母和果蝇中编码丰度高的蛋白质的基因明显避免低利用率的密码子。
因此,重组蛋白的表达可能受密码子利用的影响(尤其在异源表达系统中)的事实并不很奇怪。
你的基因利用的密码子可能不是你正在利用的蛋白生产系统进行高水平表达所偏爱的密码子,这种情况是可能的。
利用偏爱密码子(preferred codons)并避免利用率低的或稀有的密码子可以合成基因,基因的这种重新设计叫密码子最佳化。
在同源表达系统中,同较低水平表达的基因相比,较高表达的基因可能有很不同的密码子偏爱。
通过对密码子利用的归类分析,人们可以真正预测任何基因在酵母中的表达水平。
在诸如Zea mays的其他生物中,大量高表达基因强烈偏爱以G或C结尾的密码子。
而且,在Dictyostelium中,同低水平表达的基因比较,高表达基因有较大数目的偏爱密码子。
在大肠杆菌中表达哺乳动物基因是不可预测和具有挑战的。
例如直到最近才实现了人血红蛋白的过表达。
为了达到血红蛋白的好的表达水平,Alpha-球蛋白cDNA不得不用大肠杆菌偏爱的密码子进行重新合成。
在异源宿主中实现象血红蛋白这样复杂的蛋白质的过表达可能需要最佳化密码子,这些研究者为此提供了令人信服的资料。
成簇的低利用率的密码子抑制了核糖体的运动,这是基因不能以合适水平表达的一个明显机制。
核糖体翻译由九个密码子组成的信使(含几个低利用率密码子或全部为低利用率密码子)时的运动速度要比翻译不含低利用率密码子的同样长的信使的速度慢。
即使低利用率密码子簇位于3'端,信使最后也会被核糖体”拥挤”而损害,核糖体又回到5'端。
3'端低利用率密码子簇的抑制效应可以和全部信使都由低利用率密码子组成的抑制效应一样大。
如果低利用率密码子簇位于5'端,其效应是起始核糖体数目的全面减少,导致蛋白合成中信使的低效率。
散在分布的稀有密码子对翻译的效应还未很好地研究,但是有证据表明这种情况的确对翻译效率有负面效应。
其他因素也可以影响蛋白表达,包括使mRNA去稳定的序列。
重新设计合成基因可以去除或改变这些序列,导致高水平表达。
消除稀有密码子、去除任何去稳定序列和利用最佳密码子的基因的重新设计都可能增加蛋白产量,使的蛋白生产更有效和经济。
翻译终止效率
蛋白表达水平受许多不同因素和过程影响。
蛋白稳定性、mRNA稳定性和翻译效率在蛋白生产和积累中起主要作用。
翻译过程分为起始、延伸和终止三个期。
对于翻译的起始,原核mRNA需要5'端非翻译前导序列中有一段叫
Shine-Dalgarno序列的特异核糖体结合序列。
在真核细胞,有效的起始依赖于围绕在起始密码子ATG上下游的一段叫Kozak序列的序列。
密码子利用或偏爱对延伸有深刻的影响。
例如,如果mRNA有很多成簇的稀有密码子,这可能对核糖体的运动速度造成负面影响,大大减低了蛋白表达水平。
翻译终止是蛋白生产必须的一步,但其对蛋白表达水平的影响还没有被研究清楚。
但是最近的科学研究表明终止对蛋白表达水平有很大的影响。
总的来说,更有效的翻译终止导致更好的蛋白表达。
绝大多数生物都有偏爱的围绕终止密码子的序列框架。
酵母和哺乳动物偏爱的终止密码子分别是UAA和UGA。
单子叶植物最常利用UGA,而昆虫和大肠杆菌倾向于用UAA。
翻译终止效率可能受紧接着终止密码子的下游碱基和紧靠终止密码子的上游序列影响。
在酵母中通过改变围绕终止密码子的局部序列框架,翻译终止效率可能被减低几个100倍。
对于UGA和UAA,紧接着终止密码子的下游碱基对有效终止的影响力大小次序为G>U,A>C;对于UAG是U、A>C>G。
对于大肠杆菌,翻译终止效率可因终止密码子及临近的下游碱基的不同而显著不同,从80%(UAAU)到7%(UGAC)。
对于UAAN和UAGN系列,终止密码子下游碱基对翻译的有效终止的影响力大小次序为U>G>A、C。
UAG极少被大肠杆菌利用,相比UAAN和UGAN,UAG表现了有效的终止,但其后的碱基对有效终止的影响力为G>U,A>C。
对于哺乳动物,偏爱的终止密码子为UGA,其后的碱基可以对in vivo翻译终止有8倍的影响(A、G>>C、U)。
对于UAAN系列,in vivo终止效率可以有70倍的差别,UGAN系列为8倍。
如果终止密码子附近序列没有最佳化,可能发生明显增加的翻译通读,因此减少了蛋白表达。
例如,在兔网状细胞无细胞翻译系统里,UGAC的翻译通读可以高达10%,而第四个碱基如果为A,G 或C,翻译通读为<1%。
总的来说,翻译起始框架、翻译终止序列框架和密码子利用应该仔细选择,以利于蛋白的最高水平表达。
翻译终止序列框架能几倍地改变蛋白生产水平。
真核细胞中的异源蛋白表达
异源蛋白质在细菌中表达是目前使用的主要的蛋白生产系统。
大肠杆菌一直是最经济的系统之一。
然而为了生产需要特异修饰、胞外分泌或有特异折叠需要的蛋白质,其他表达系统也是需要的。
真核细胞在表达原核来源的基因、真核基因的cDNA拷贝或其他无内含子的基因时可能表现很多特异问题。
富含AT的基因在很多真核细胞中表达时会遭遇很剧烈的障碍。
主要的真核信号序列如加
poly-A的位点、酵母转录终止位点和真核mRNA去稳定序列都是富含AT的。
内含子序列也趋向于富含AT,尽管他们有参与剪切过程的很特异的识别序列。
虽然绝大多数原核基因没有剪切或聚腺苷过程,但这些真核过程需要的保守序列可能存在于原核基因中,因此当这些基因在真核细胞中表达时可能引起特异的问
题。
而且诸如哺乳动物和单子叶植物细胞的特异真核表达系统可能不能有效地表达无内含子的基因。
真核mRNA在离开细胞核进而在胞浆的核糖体上被翻译前需要特异的处理和修饰。
这些过程包括去除内含子、5'端甲基化帽子形成和3'端加poly-A。
内含子去除需要5'剪切位点、G75/G100U100A65AG65U保守序列、3'剪切位点、富含密啶NC66A100G100/G56保守序列和C72T98R77A100Y75保守序列。
有效的加poly-A和mRNA剪切需要一个由两个部分组成的信号:加poly-A保守序列AAUAAA 和在切割位点内的50个碱基的富含GT的序列。
酵母真核转录终止序列(几个不同的富含AT序列,如含TTTTTATA,TATATA,TACATA,TAGTAGTA的一个38bp区域)被研究的最清楚。
这些结果来自对酵母突变体CYCI mRNA的mRNA水平和相对长度的确定的实验。
近期用in vivo质粒稳定性分析的研究结果证明:TATATA似乎和原始的38bp野生型区域一样有效地终止转录,而TAGATATATATGTAA和TACATA效率差些,TTTTTTTATA几乎没有效率。
所有这些序列在反方向时没有终止转录功能。
不幸的是几乎没有其他真核表达系统转录终止序列方面的信息。
内含子对几个哺乳动物基因的正常表达是必需的,包括Beta-球蛋白、SV40 late mRNA和二氢叶酸还原酶基因。
单子叶植物细胞充分表达乙醇脱氢酶的cDNA 拷贝、报告基因氯霉素乙酰转移酶、Beta葡萄糖苷酸酶和其他缺乏内含子的基因时也依赖内含子。
转录区域内引入内含子可以通过未确定的转录后机制增强表达。
(免疫球蛋白基因)内含子可能也包含转录增强子,因此通过转录机制增强表达。
总的来讲,如果存在某些DNA序列,真核异源蛋白表达可能是个难题。
为避免剧烈的表达减少,需要对基因进行扫描,确认是否含上述提及的富含AT的序列。
而且,在几个真核系统表达无内含子基因可能需要引入内含子以实现外源蛋白的充分表达。