微生物次级代谢产物合成基因簇预测分析
次级代谢产物基因簇

次级代谢产物基因簇次级代谢产物基因簇是指一组在细胞内合成和调控次级代谢产物的基因序列。
次级代谢产物是一类细胞内产生的化合物,不同于细胞的生存所必需的主要代谢产物,而是具有特定的生理功能或生物活性。
这些次级代谢产物包括抗生素、抗肿瘤物质、植物次生代谢产物等,对人类和生物体的生理活动具有重要的影响。
次级代谢产物基因簇通常由多个连续排列的基因组成,这些基因按特定的顺序编码了合成次级代谢产物所需的酶和调控蛋白等。
基因簇的存在使得细胞能够高效地合成次级代谢产物,并保证其在合适的时间和条件下被产生。
在细菌中,次级代谢产物基因簇的存在非常普遍。
细菌通过次级代谢产物基因簇合成了许多重要的化合物,如抗生素。
抗生素基因簇通常由多个基因组成,这些基因编码了合成抗生素所需的酶和蛋白质。
这些基因按照一定的顺序排列在细菌的染色体上,形成基因簇。
通过对这些基因簇的研究,科学家们可以了解到抗生素的合成机制,并可以通过调控基因簇的表达来提高抗生素的产量或改变抗生素的结构,从而开发出更加有效的抗生素。
除了细菌,植物中也存在许多次级代谢产物基因簇。
植物次级代谢产物基因簇的研究对于揭示植物次生代谢的合成机制和调控网络非常重要。
通过对植物次级代谢产物基因簇的分析,科学家们可以了解到植物合成次级代谢产物的途径和关键酶,进而可以通过基因工程手段来提高植物次级代谢产物的产量或改变其结构,从而获得具有更好生物活性的化合物。
近年来,随着基因组学和生物信息学的发展,科学家们可以通过对基因组的分析来预测和鉴定次级代谢产物基因簇。
通过对不同生物的基因组进行比对和分析,可以找到具有相似结构和功能的基因序列,并判断其是否属于次级代谢产物基因簇。
这为研究次级代谢产物的合成机制和调控网络提供了重要的工具。
次级代谢产物基因簇的研究不仅对于药物开发和农业生产具有重要意义,还对于生物多样性和生态系统的保护具有重要意义。
许多次级代谢产物具有抗菌、抗肿瘤和抗虫等生物活性,对人类健康和生物体的生存发展起到重要作用。
第12组激活沉默基因以获取新型微生物次级代谢产物的策略素材

8
异源表达使得沉默基因在新的表达系统中无需按照原来的起始位点进行有效转 录,对培养条件也无特殊要求,克服了天然生产菌表达 水平低、遗传操作困难、 不容易规模培养等缺点,为工业化生产扫清障碍。另外,它还适用于生长缓慢 的微生物,如蓝细菌、真菌等。由该法已发现多种新的生物活性物质。
9
实现天然产物异源表 达生物合成必须要解 决以下几个问题。
激活沉默基因以获取新型微生物次 级代谢产物的策略研究
组员: 季宗德 郭秋香 张羡媛
赵琪
1
一直以来,天然产物在人类疾病的治疗过程中发挥着重 要作用。
根据2007 年的统计,1981~2006 年间国际上所有批 准的药物中,超过 50%来源于天然产物、天然产物的衍生物 或模拟天然产物药效基团的合成化合物。 尤其是,目前临 床上使用的 60%的抗癌药物和 70%的抗生素是天然产物或 者基于天然产物研发的药物。
18
6 单菌多次级代谢产物策略
单菌多次级代谢产物(one strain-many compounds,OSMAC)策略,是通过 改变培养培养基成分、通气量及添加重金属和酶抑制剂等发酵条件来获取更多新型 的次级代谢产物的方法
缺点:OSMAC 策略虽然有效, 但是其工作量 大,且最终能 否获得新的有 活性的次级代 谢产物并不确 定
中国科学家更是于 2009 年 发起了“万种微生物基因组” 计划,预计在3年内完成1万 种微生物物种全基因组序列 图谱的构建。
4
在常规培养条件下,大 多数生物合成基因簇不表 达或以极低水平表达并在 沉默生物合成基因簇包含了 特定条件下被激活而表达 多种结构类型的微生物次级代谢 活性产物,这些 DNA序列称 产物编码信息, 提供了丰富的合 为沉默生物合成基因簇。 因此,如何利用现有 成生物学天然元件或模块 , 并为 未来设计和构建新型微生物次级 的研究成果和技术手段 代谢产物生物合成途径提供丰富 进行激活沉默基因以获 的物质基础。
微生物次级代谢产物生物合成基因簇技术分析

微生物次级代谢产物生物合成基因簇技术分析作者:宫克飞来源:《中国科技博览》2013年第28期[摘要]微生物产生众多结构和生物活性多样的次级代谢产物,其生物合成基因簇的克隆是药物创新和产量提高的必要前提。
[关键词]生物合成技术中图分类号:[Q528+.2] 文献标识码:A 文章编号:1009-914X(2013)28-0296-01微生物产生的次级代谢产物在化学结构和生物活性方面多种多样,主要的产生菌类群包括放线菌、芽孢杆菌、粘细菌、假单胞菌、蓝细菌、真菌等,其中已知抗生素的三分之二以上是以链霉菌为代表的放线菌产生的。
根据结构特点可以基本上将抗生素分为β内酰胺、氨基糖苷、核苷、四环素、多肽、糖肽、大环内酯、安莎、聚醚和类萜等种类。
以上多种多样抗生素的结构特点也决定了它们生物活性的多样性,除了可以抑菌杀菌外,还可以作为抗癌药、抗寄生虫药、除草剂、酶抑制剂、免疫调节剂、受体拮抗剂、低血胆固醇治疗剂等等,在医疗、工业、农牧渔业和环境保护等领域均发挥着重要作用。
随着大量微生物次级代谢产物的分离,从自然界直接分离具有新结构、新活性化合物变得越来越困难,已知结构化合物分离的重复性很高。
另一方面,临床上病原微生物的耐药性日益严重,伴随着多耐药性、高耐药性病原菌以及艾滋病、SARS、禽流感等新型疾病不断出现,如何利用已有资源,定向创造新结构、新活性化合物以及提高微生物次级代谢产物的产量,成为当务之急。
分子生物学基础上的组合生物合成(combinatorial biosynthesis)和代谢工程(metabolic engineering)成为解决上述问题的重要手段,但是次级代谢产物生物合成基因(簇)的克隆与功能鉴定是这两项技术实施的必要前提。
一、微生物次级代谢产物生物合成基因簇的组成特点自从Malpartida等1984年克隆了放线紫红素的全部生物合成基因,以及随后克隆的榴菌素、红霉素、泰乐星等生物合成基因,揭示了微生物次级代谢产物生物合成基因成簇排列的特征,即与特定产物合成相关的结构基因、调节基因、耐药性基因和转运蛋白等集中位于染色体的一段连续区域。
antismash的原理和应用

ANTISMASH的原理和应用介绍ANTISMASH是一种用于分析次级代谢产物基因簇在细菌、真菌和植物中的存在和特征的工具。
它可以通过分析基因组序列来预测和注释这些基因簇,帮助科研人员理解次级代谢产物在生物体中的合成和功能。
原理ANTISMASH利用计算机算法来分析基因组序列中的次级代谢产物基因簇。
它首先会使用预训练的模型来识别基因组中的潜在基因簇,然后利用多种算法对这些基因簇进行进一步的分析和注释。
这些算法包括拟合HMM(隐马尔可夫模型),识别保守的主要酶基因,预测次级代谢物的结构类型等。
最后,ANTISMASH会生成详细的报告,其中包含关于基因簇中基因的功能注释、预测次级代谢物的结构类型和潜在活性等信息。
应用ANTISMASH在生物研究中有着广泛的应用。
以下是一些常见的应用领域:1.生物药物研发:ANTISMASH可以帮助科研人员发现潜在的次级代谢产物基因簇,从而开发新的生物药物。
通过分析基因组序列,ANTISMASH可以预测次级代谢物的结构类型和潜在活性,为药物研发提供重要的信息。
2.农业和食品科学:ANTISMASH可以帮助农业科学家和食品科学家研究植物中的次级代谢产物。
通过分析基因组序列,ANTISMASH可以帮助研究人员了解植物中次级代谢产物的合成途径和功能,从而改良农作物和提高食品质量。
3.微生物生态学:ANTISMASH可以在微生物生态学中发挥重要的作用。
通过分析微生物基因组序列,ANTISMASH可以帮助科研人员了解微生物群落中的次级代谢产物合成的多样性和功能。
这对于理解微生物在生态系统中的作用十分重要。
4.天然产物研究:ANTISMASH可以用于研究和发现天然产物。
通过分析基因组序列,ANTISMASH可以帮助研究人员预测潜在的次级代谢产物基因簇,这对于发现新的天然产物具有重要意义。
总结ANTISMASH是一种用于分析次级代谢产物基因簇的工具,通过分析基因组序列可以帮助科研人员预测和注释基因簇,并理解次级代谢产物在生物体中的合成和功能。
微生物源化合物合成基因簇异源表达研究进展

使用的多种药 物都属于这一类化合 物, 在农业上使 用 的一些 农 药 、 兽药等也属于这类化合 物u J 。一 些
对 人 类极 为安 全 并能 有效 杀 灭靶 标 生 物 的聚 酮类 化
论( 如图 1 ) , 并对如何利用异源表达开发新化合物进
行综述。
合物也被应用于食品领域 J 。由非核糖体肽合酶
关键 词 异 源表 达 中图分 类号 : Q 9 3 6 次级代 谢基 因簇 文献标 识码 : A 聚酮 类物质 非核糖 体肽 文 章编 号 : 1 0 0 3— 0 1 7 4 ( 2 0 1 5 ) 0 9— 0 1 3 3— 0 7 簇, 从 而达 到 获得新 活性 化合 物 的 目的 。
2 0 1 5年 9月 第3 O卷第 9期
中国粮油学报
J o u r n a l o f t h e C h i n e s e C e r e a l s a n d Oi l s As s o c i a t i o n
Vo 1 . 3 0. No . 9
S e p . 2 01 5
微 生 物 源化 合 物合 成基 因簇 异 源 表达 研 究 进 展
黄 颖 赵 晨 关 雄 张晓琳
1 0 0 0 3 7 ) 3 5 0 0 0 2 ) ( 国家粮 食局 科学 研究 院 , 北京
( 福建 农林 大学 生物农 药 与化 学生 物学 教育 部重 点实 验室 , 福州 摘 要
p e n d e n t C l o n i n g ) J 、 G i b s o n等 温 一 步 法 _ l 等 。 D N A 合 成 和组装 策 略的优 势 在 于 能够 实 现 基 因簇 的密码 子 优化 和调 控 基 因 的选 择 , 并 可 以 添加 或 删 除 酶 切 位 点 。在 一 个 简 单 的 宿 主 中 ( 例 如 大 肠 杆 菌
次级代谢产物的生物合成与调节

氯霉素,利福霉素等
怎样解除这种分解代谢物调整?
六、能荷调整(磷酸盐旳调整)
↓*2
八氢番茄红素
↓
六氢番茄红素
↓
ζ—胡萝卜素
↓
链孢红素
↓
番茄红素
↙
↘
γ—胡萝卜素
δ—胡萝卜素
↓
↓
海胆酮 ←─β—胡萝卜素
α—胡萝卜素
↓
Байду номын сангаас
↓
↓
角黄素
β—隐黄质
叶黄素
↓
↓
虾青素
玉米黄素
↓↑
环氧玉米黄素 → 辣椒红素
↓↑
紫黄素
→ 辣椒玉红素
↓
新黄素
类胡萝卜素旳生物合成途径
•次级代谢酶旳专一性低
相对来说催化初级代谢产物合成旳酶专一性强,催化 次级代谢产物合成旳某些酶专一性不强,所以在某种 次级代谢产物合成旳培养基中加入不同旳前体物时, 往往能够造成机体合成不同类型旳次级代谢产物。
41
七、细胞膜透性旳调整
外界物质旳吸收或代谢产物旳分泌都需经细胞 膜旳运送,如发生障碍,则胞内合成代谢物不 能分泌出来,影响发酵产物收获,或胞外营养 物不能进入胞内,也影响产物合成,产量下降。
在青霉素发酵中,产生菌细胞膜输入硫化物能 力旳大小影响青霉素发酵单位旳高下。假如输 入硫化物能力增长,硫源供给允足,合成青霉 素旳量就增多。
(1)筛选营养缺陷型回复突变株
微生物次级代谢讲解

次级代谢物生物合成步骤: ① 养分摄入细胞内; ② 通过中枢代谢途径养分转化为中间体; ③ 次级代谢物前体的生物合成;
中间体 :对初级代谢而言; 前体: 对次级代谢而言; 有时二者是同一物质,有时前体在中间体的基础(jīchǔ)上结构略 有改变。
④ 如有必要,改变其中的一些中间体; ⑤ 前体进入次级代谢物生物合成的专有途径; ⑥ 次级代谢的主要骨架形成后,作最后的修饰,成为产物。
Rose的定义(1979): 前体(precursor)是在细胞内生成的,或由培养基 提供的,能被代谢形成某种终产物的物质。 Stanbury等的定义(1984): 前体指加入到某一培养基中的一些化学物质被直接 结合到所需产物中。
精品资料
前体现代定义: 指加入到发酵培养基中的某些化合物,它能被微
生物直接结合到产物分子(fēnzǐ)中去,而自身的结 构无多大变化,且具有促进产物合成的作用。
精品资料
(一)微生物次级(cì jí)代谢的特 性
①一般不在生长期产生,而在生长后期(hòuqī)形 成
抗生素晚合成的原因之一可能是避免生长受其自身产 物的抑制; 次级代谢产物的合成过程一般是在培养 基中缺乏某种营养物质,菌体生长受到限制时才启动 的。
精品资料
精品资料
②种类繁多(fánduō),结构特殊,含不常见的化学键:
66化学结构乳链球菌素的化学结构ileileddhbalasalaleudhaabusalalysglyproglyabusalaglymetleualaasnmetlysalaabuhisalaabusholysddhavalhisileseralasabuaminobutyricaciddhadehydroalaninedhbdehydrobutyrine乳链球菌素乳链球菌素n乳链球菌素能有效地抑制引起食品腐败的许多革兰阳乳链球菌素能有效地抑制引起食品腐败的许多革兰阳性菌如肉毒梭菌金黄色葡萄球菌溶血链球菌和性菌如肉毒梭菌金黄色葡萄球菌溶血链球菌和利斯特菌的生长和繁殖尤其对产生孢子的革兰阳利斯特菌的生长和繁殖尤其对产生孢子的革兰阳性菌如枯草芽孢杆菌和嗜热脂肪芽孢杆菌等有很性菌如枯草芽孢杆菌和嗜热脂肪芽孢杆菌等有很强的抑制作用
构巢曲霉基因组研究

FA,改变功能注释
ED,实验确定
EP,表达模式
丝状真菌的一个重要特征是能够产生次级代谢产物,因此研 究真菌的次级代谢也就成为对基因簇研究的而一个拓展。基 因测序的最新进展表明真菌基因组拥有远远多于在实验室常 规条件下表达次级代谢产物的基因簇。这些沉默的基因簇对 我们研究其次生代谢物来说是个巨大挑战,然而我们已经使 用了很多方法来尝试激活它们。丝状真菌的次级代谢产物是 很有效的化合物,从这些致命的毒素中分离出的抗生素具有 潜在的抗癌作用。丝状真菌在药物的发现和发展史上扮演着 重要的角色,比如抗生素有青霉素,免疫抑制剂有环孢菌素, 抗真菌剂有灰黄霉素和棘白菌素,降血脂药有洛伐他丁都来 源于丝状真菌。许多有生物活性的次级代谢产物在常规实验 条件下容易获得,并且已经获得了药物开发专利。
2-ethyl-4,6-dihydroxy-3,5-dimethylbenzaldehyde 2-乙基-4,6-二羟基-3,5-二甲基苯 Ferricrocin 铁菌素:抗革兰氏阳性菌抗生素 (2Z,4Z)-4,6-Dimethylocta-2,4-dienoic acid (2Z,4Z)-4,6-二甲基辛-2,4-二烯酸 Penicillin 青霉素:是抗菌素的一种,是指分子中含有青霉烷、能破 坏细菌的细胞壁并在细菌细胞的繁殖期起杀菌作用的一类抗生素 norsolorinic acid 降散盘衣酸 Terrequinone A:是由构巢曲霉(Aspergillus nidulans)分泌的具有抗 癌活性的二级代谢产物,有着广阔的应用前景和市场潜力。 Aspyridone A, B:利培酮,用于治疗急性和慢性精神分裂症。特别 是对阳性及阴性症状及其伴发的情感症状(如焦虑、抑郁等)有较好 的疗效。
基因本体( Gene Ontology ,GO):是一个在生物信息学 领域中广泛使用的本体。它是一个词汇表,具有树形结构, 可以电脑操作和动态搜索。 GO 涉及的基因和基因产物词汇 分为三大类,涵盖生物学的三个方面: ① 细胞组件(Cellular Component):指基因产物位于何种细 胞器或基因产物组中(如糙面内质网、核糖体、蛋白酶体 等),即基因产物在什么地方起作用。 ② 分子功能(Molecular Function):描述在个体分子生物 学水平上的活性。如催化活性或结合活性。 ③ 生物学过程(Biological Ptocess):指由分子功能有序地 组成的,具有多个步骤的一个过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
NRPS A domain
specificities are predicted using both the signature sequence method and the support-vector machinesbased method of NRPSPredictor2
24
analysis of secondary metabolism gene
nonribosomal peptides 非核糖体肽(NRP) bacteriocins 细菌素 aminocoumarins 基香豆素
butyrolactones 丁内酯
terpenes 萜烯 beta-lactams β-内酰胺 siderophores 铁载体
indoles 吲哚类
lantibiotics 羊毛硫抗生素
3
次级代谢产物简介
次级代谢产物:微生物生长到一定阶段才产生的化学结构十分复 杂、对该生物无明显生理功能,或并非是微生物生长和繁殖所必 需的物质 主要来源:放线菌、真菌等
Zwittermicin A
4
次级代谢产物简介
polyketides (type I) 聚酮(PK) polyketides (type II) polyketides (type III)
gene prediction by Glimmer3 (prokaryotic data) or GlimmerHMM
(eukaryotic data) Transform the predicted results to EMBL format
21
Detection of gene clusters
微生物次级代谢产物及其生物 合成基因簇预测分析
------antiSMASH
次级代谢产物及其生物合成基因簇简介
主 要 内 容
antiSMASH 分析方法及流程
antiSMASH 的优势与比较
次级代谢产物的分类鉴定概貌
2
微生物学发展史中四位重要人物
Louis Pasteur 法国人,开创 了微生物技术 的新时代
8
PKS
McDaniel et al., Proc. Natl. Acad. Sci. USA, 96 (1999) 1846–1851
9
NRPS-PKS
Brian M. Kevany etal., APPLIED AND ENVIRONMENTAL MICROBIOLOGY, 2009, 1144 –1155
Using HMMer3 tool (/) aligh Pfam-source and other pHMMs library
Compound class NRPS NRPS NRPS Description Condensation domain Adenylation domain Adenylation domain with integrated oxidase Ketosynthase domain Acyltransferase domain FabH fatty acid synthase Enediyine ketosynthase Modular ketosynthase Type II PKS Chain length factor HMM name Condensation AMP-binding A-OX Source PFAM PF00668.13 PFAM PF00501.21 This study
23
Predicted core structure
PKS AT domain
specificities are predicted using a 24 amino acid signature sequence of the active site as well as other pHMMs
V1.2 (August 20th, 2011)
17
Based on profile hidden Markov models of genes that are specific for certain types of gene clusters, antiSMASH is able to accurately identify the gene clusters encoding secondary metabolites of all known broad chemical classes antiSMASH not only detects the gene clusters, but also offers detailed sequence analysis
Alexander Fleming 苏格兰人,发现青霉 素及其治疗传染性疾 病的功效, 1945年获 得诺贝尔生理医学奖
Selman worksman 美国人,对土壤微生 物产生抗生素物质进 行了系统和开创性工 作,发现了抑制肺结 核的链霉菌素,1952年 获得诺贝尔生理医学 奖
Francisco Malpartida 西班 牙人,于 1984 年, 第一个克隆了放线紫 红素的 完整合成基 因 簇
次级合成基因簇的挖掘
传统的天然产物分离通常是通过活性跟踪的策略。
第一篇对NRPS进行 预测的文章
NATURE , 417 ,2002
J. Antibiot. 59(3): 168–176, 2006
J. Antibiot. 59(9): 533–542, 2006
Microbiology 154, 1555–1569,2008
Terpene synthase Phyphytoene_synth
PFAM PF03936.9 This study
Filter negative and positive pHMMs Gene clusters are defined by locating clusters of signature gene pHMM hits spaced within <10 kb mutual dis-tance
生理活性物质
受体拮抗剂
………..
6
次级代谢产物生物合成基因簇
次级代谢产物的编码基因通常在基因组中成簇存在,编码 具有多种功能的复合酶 研究的最清楚为 NRPS : nonribosomal peptides synthetase PKS: polyketides synthetase
NRPS-PKS hybrid
7
次级代谢产物生物合成基因簇
PKS和NRPS复合酶的基因主要是由连续的 模块(Module)构成,每个基因模块的产物可催化多 聚酮或多肽链的一轮延伸和可能的修饰。 一个基因可能含有多个模块(Module) 模块(Module)非最小单位(下级单元:结构域) 一种次级代谢产物的合成由多个基因共同编码
22
NRPS/PKS domain architecture analysis
Domains and subgroups are detected using another pHMMs library Conserved motifs are detected using the pHMMs in the CLUSEAN package
PKS PKS PKS (neg.)
PKS PKS PKS
PKS_KS PKS_AT fabH
ene_KS mod_KS t2clf
SMART SMART This study
Yadav et al. (2009) Yadav et al. (2009) This study
Terpene Terpene ……….
20
Input files
Genbank format or EMBL format : annotated nucleotide file
Fasta format : the fasta should be single sequence FASTA files (with one ">")
15
Gene clusters distributed in fungi genome
Core orthologous and species-specific gene clusters in three fungi
16
antiSMASH
(antibiotics & Secondary Metabolite Analysis Shell)
aminoglycosides / aminocyclitols 氨基糖甙类/氨基环醇
ectoines 四氢嘧啶
nucleosides 核苷
phosphoglycolipids 磷酸糖脂
melanins 黑素类
others
5
次级代谢产物简介
抗生素:抗细菌、抗真菌、抗病毒、抗肿瘤等 酶抑制剂
免疫抑制剂
14
Gene clusters distributed in fungi genome
gene clusters in the 27 sequenced fungal genomes predicted by SMURF
N. Khaldi et al. , Fungal Genetics and Biology 47 ,(2010) 736–741
18
Analysis tools of antiSMASH
NCBI BLAST+ HMMer 3, Muscle 3 Glimmer 3 FastTree
TreeGraph 2 Indigo-depict PySVG JQuery SVG
19
Pipeline for genomic analysis of secondary metabolites