细菌全基因组测序PPT课件
合集下载
细菌全基因组测序 ppt课件

基因家族(gene family) 和基因簇(gene cluster)分析
基因组中来源相同,结构和功能相关的基因 聚集在一起形成基因家族。
基因家族的各个成员紧密成簇排列成大段的串联 重复单位,分布在某一条染色体的特殊区域
genefamily.xls
基因家族聚类结果
genefamily.stat
各基因家族统计信息
培养条件① 培养条件②
或活性较低
测定转录 组mRNA
细菌全基因组测序
比较 新 差异 基因
其他方面的应用研究
❖ 应用NMR、FTIR、UV, 14C标记的木质 素降解机理方面的研究; ❖农药残留物以及其他一些难降解有机物的 降解; ❖ 重金属有机物化合物的降解。
② 木质素降解过程中涉及到的细胞外酶主要有:木质素过氧化物酶
(LiP)和锰过氧化物酶(MnP),以及漆酶(Lac)。此外,一 些附属酶参与过氧化氢的产生,乙二醛氧化酶(glyoxal oxidase, 缩写作GLOX)和芳基醇氧化酶(aryl alcohol oxidase,缩写作 AAO)属于这类酶。
对4株菌的亲缘关系进行分析,确定菌株之间的相互关 系;
通过对4株菌进行进化分析,判定是否为古菌或新的菌 种。
细菌全基因组测序
基因分离
下一步的实验安排
对已注释出的基因进行验证
载体
酶切
酶切
连接
转化
筛选 表达
细菌全基因组测序
未注释出功能的基因鉴定,挖掘新基因
DNA 转录 RNA 翻译 Protein
细菌全基因组测序
“一个物种基因组计划的完成, 就意味着这一物种学科和产业 发展的新开端”
向仲怀院士
谢谢!!
细菌全基因组测序
细菌学:第十章 细菌基因组学课件

意外的发现
• 另外,此前科学界一致认为鸡没有嗅觉 ,但是分析结果表明鸡具有大量的嗅觉 基因,味觉基因却很缺乏。
• 分析还发现,鸡缺乏人类所具有的产生 乳汁、唾液和牙齿的基因。
鸡基因组研究的意义
• 鸡是研究低等脊椎动物和人类等哺乳动物 的一种比较理想的中介。
• 将人类基因组与鸡等其他生物的基因组进 行比较,有助于更深入理解人类基因的结 构和功能,进而开发治疗疾病的新手段, 对于培育优质鸡种、改善食品安全、控制 禽流感病毒的蔓延也有重要意义。
1. 原核生物基因组的大小--基因组较大的原
• 1997 年9 月,大肠杆菌的完整基因图谱已绘制成 功, 基因组全序列完成, 全长为5Mb ,共有4 288 个基因,同时也搞清了所有基因产物的氨基酸序 列.
• 人们常说,每个分子生物学家都对两种生物感 兴趣,一种是所研究的物种,另一种就是E. coli。研究人员可以利用实验室中的E. coli菌株 克隆DNA、表达蛋白质、分离目的基因等,如 果没有E. coli,实验室将无法工作。
测序微生物的类别
• 几乎所有类别的病毒 • 模式微生物 • 极端环境微生物 • 病原原核生物 • 环境降解微生物 • 其他
Viruses
微生物基因组的特点
类别
特征
染色体结构 基因组大小 编码序列
多为一条环状闭合双链DNA 从0.16-13Mb 占基因组总长度的90%,平均为1Kb左 右
GC含量
鸡的进化研究
• 鸡是种常见的家禽,长期受到进化生物学家的 青睐。它的基因序列也有助于科学家了解农业 和进化学上重要特性的遗传学基础。
转基因小鸡
• 对鸡和人类的基因组进行比较后发现约 七千万个碱基对是共有的。
• 这暗示着在大约三亿一千万年前二个物 种从共同祖先分化出来的时候,遗传物 质具有守恒性。
细菌全基因组测序

细菌全基因组测序
• 细菌全基因组测序概述 • 细菌基因组的组成与结构 • 细菌全基因组测序的应用 • 细菌全基因组测序的挑战与前景 • 案例分析
01
细菌全基因组测序概述
定义与目的
定义
细菌全基因组测序是指对细菌的全基 因组进行测序,获取其完整的DNA序 列信息。
目的
细菌全基因组测序主要用于细菌种属 鉴定、基因功能研究、药物靶点发现 和抗药性分析等。
基因组的复制与表达
01
复制机制
细菌基因组的复制开始于特定的起点,称为复制原点。复制过程中,
DNA聚合酶沿着DNA链移动,并合成新的DNA互补链。
02
转录过程
在细菌中,DNA的转录过程由RNA聚合酶催化。转录从启动子开始,
沿着DNA模板链移动,直到遇到终止子并结束转录过程。
03
翻译过程
细菌中的mRNA通过核糖体进行翻译,生成蛋白质。每个核糖体都沿着
04
细菌全基因组测序的挑战与前景
数据解析与存储的挑战
1 2
数据量庞大
细菌全基因组测序产生大量数据,需要高效的数 据解析和存储技术,以确保数据准确性和完整性。
算法优化
针对基Байду номын сангаас组数据的算法需要进行优化,以提高数 据处理速度和准确性,满足实时分析的需求。
3
云计算平台
利用云计算平台,可以实现数据的高效存储、计 算和分析,为细菌全基因组测序提供强大的计算 资源。
通过比较病原菌基因组序列与已知病原体基因组数据库,可以发现新的病 原菌或变异株,提高疾病诊断的准确性。
病原菌基因组测序还可以帮助了解病原菌的传播途径和流行病学特征,为 防控措施的制定提供科学依据。
案例二
• 细菌全基因组测序概述 • 细菌基因组的组成与结构 • 细菌全基因组测序的应用 • 细菌全基因组测序的挑战与前景 • 案例分析
01
细菌全基因组测序概述
定义与目的
定义
细菌全基因组测序是指对细菌的全基 因组进行测序,获取其完整的DNA序 列信息。
目的
细菌全基因组测序主要用于细菌种属 鉴定、基因功能研究、药物靶点发现 和抗药性分析等。
基因组的复制与表达
01
复制机制
细菌基因组的复制开始于特定的起点,称为复制原点。复制过程中,
DNA聚合酶沿着DNA链移动,并合成新的DNA互补链。
02
转录过程
在细菌中,DNA的转录过程由RNA聚合酶催化。转录从启动子开始,
沿着DNA模板链移动,直到遇到终止子并结束转录过程。
03
翻译过程
细菌中的mRNA通过核糖体进行翻译,生成蛋白质。每个核糖体都沿着
04
细菌全基因组测序的挑战与前景
数据解析与存储的挑战
1 2
数据量庞大
细菌全基因组测序产生大量数据,需要高效的数 据解析和存储技术,以确保数据准确性和完整性。
算法优化
针对基Байду номын сангаас组数据的算法需要进行优化,以提高数 据处理速度和准确性,满足实时分析的需求。
3
云计算平台
利用云计算平台,可以实现数据的高效存储、计 算和分析,为细菌全基因组测序提供强大的计算 资源。
通过比较病原菌基因组序列与已知病原体基因组数据库,可以发现新的病 原菌或变异株,提高疾病诊断的准确性。
病原菌基因组测序还可以帮助了解病原菌的传播途径和流行病学特征,为 防控措施的制定提供科学依据。
案例二
基因组测序技术PPT课件

1 ATACGTTA
2 2GCTGTATGTAAGTCAT
4 C4GATCTGATGTAATGA
3 3TACGTTAG A
5 GTTAGATC
1 ATACGTTA
3 TACGTTAG
4 ACGTTAGA
2
CGTTAGAT
5
GTTAGATC
计算机分析杂交图象 并由探针的重叠情况 推导样品的核酸序列
互补序列为:ATACGTTAGATC 样品序列为:TATGCAATCTAG
在人类基因组进入测序组装阶段就采用此方法, 其基本步骤如下 参考人类基因组图,特别是大量的STS位标作为基点, 进行序列组装,排成重叠克隆群.
先将染色体打成比较大的片段(几十-几百Kb), 利用 分子标记将这些大片段排成重叠的克隆群(Contig), 分别 测序后拼装. 这种策略叫基于克隆群(contig-based)的策 略.
2000年 12 月,第一个植物基因组—— 拟南芥(Arabidopsis thaliana)基因组 被全部测序 ,大小为125 Mb.
一、测序流程1.构建生物基因组或cDNA DNA的提取和制备→酶切制备克隆用DNA片段 →与载体连接→转化受体细胞 →筛用超声波(或限制性内切酶)切成能够测序 的小片断(200-500bp)→小片断和载体结合,植入 细菌中进行扩增(或用PCR扩增) →从细菌中提 取出繁殖好的质粒→ 酶切,制取测序的DNA片段
A
B
C
大片段contig
小片段测序拼装
A
B
C
两种策略的比较
鸟枪法策略
指导测序策略
不需背景信息
时间短 需要大型计算机 得到的是草图(Draft)
构建克隆群 (遗传、物理图谱) 需要几年的时间
生物科技的基因组测序课件

感谢您的观看
汇报人:
基因信息泄露的风险和后果严 重
需要建立完善的基因信息保护 制度和技术保障措施
对基因信息的应用需要遵循伦 理规范和法律规定
基因信息隐私 保护
基因信息安全 管理
基因歧视问题
基因信息交流 与共享问题
基因组测序的未 来展望
新一代基因测序技术将更加准确、快速、经济 基因大数据的积累和分析将助力精准医疗个性化方案制定 人工智能和机器学习在基因测序分析中的应用将进一步提高精准医疗的效率和精度 基因测序技术的不断进步将推动精准医疗领域取得更大的突破和创新
基因组测序的应 用领域
遗传病诊断 癌症治疗 药物研发 个性化医疗
基因组测序在生物制药中的应用: 利用基因组测序技术,发现新的药 物靶点,为新药研发提供基础数据。
基因组测序在个性化治疗中的应用: 根据病人的基因组测序结果,为病 人制定个性化的治疗方案,提高治 疗效果。
添加标题
添加标题
添加标题
添加标题
基因组测序的技 术瓶颈
试剂耗材:高质量的试剂与 消耗品价格不菲
仪器设备:高昂的设备价格 与维护费用
数据分析:需要专业的技术 人员进行数据处理与分析
知识产权:对于某些特殊基 因组,存在知识产权问题需
要解决
基因组测序的原理 测序速度慢的原因 提升测序速度的方法 未来测序技术的发展趋势
基因组测序的深度是影响检测准确性和全面性的关键因素 深度过浅可能导致检测结果不准确,漏检基因突变 深度过深则会增加测序成本和数据分析难度 目前基因组测序的深度一般需要在几十倍到几百倍之间
特点:具有高精度、高速度和高通 量等优点,同时还能避免PCR扩增 偏差和光学干扰等问题
发展前景:随着技术的不断改进和 成本的降低,第三代测序技术将在 未来发挥更加重要的作用。
基因组测序基本原理ppt课件

基因组测序基本原理
大纲
I. 核酸DNA的发现以及测序历史简介 II. 双脱氧化(Sanger dideoxy method)测序 III.大片段的DNA测序与基因组测序的大发展 VI.人类基因组 V. 1000美元个体化基因组测序计划(The “$1,000 dollar genome)
On WebCT -- “The $1000 genome” -- review of new sequencing techniques by George Church
Part I.核酸测序原理
核酸发现与测序简史
DNA测序的简史
MC chapter 12
DNA测序的方法
A. 双脱氧法 (Sanger dideoxy) (primer extension/chaintermination) method: 最流行也是最广为接受的方法。
Maxam-Gilbert化学剪切法(chemical cleavage method): DNA is labelled and then chemically cleaved in a sequence-dependent manner. This method is not easily scaled and is rather tedious 焦磷酸测序(Pyrosequencing): measuring chain extension by pyrophosphate monitoring。焦磷酸测序技术是新一代 DNA序列分析技术,该技术无须进行电泳,DNA片段也无 须荧光标记,操作极为简便,可以快速、准确地确定DNA 序列。
测序的趋势
相对而言一般很少实验室会自己做测序,一则自身测序费用比较高,而且荧光试剂容 易粹灭,同时也比较消耗时间,另外可能出现一些其它问题引起结果不成功。所以大 部分的测序都是送到相关的测序中心或者公司完成:
大纲
I. 核酸DNA的发现以及测序历史简介 II. 双脱氧化(Sanger dideoxy method)测序 III.大片段的DNA测序与基因组测序的大发展 VI.人类基因组 V. 1000美元个体化基因组测序计划(The “$1,000 dollar genome)
On WebCT -- “The $1000 genome” -- review of new sequencing techniques by George Church
Part I.核酸测序原理
核酸发现与测序简史
DNA测序的简史
MC chapter 12
DNA测序的方法
A. 双脱氧法 (Sanger dideoxy) (primer extension/chaintermination) method: 最流行也是最广为接受的方法。
Maxam-Gilbert化学剪切法(chemical cleavage method): DNA is labelled and then chemically cleaved in a sequence-dependent manner. This method is not easily scaled and is rather tedious 焦磷酸测序(Pyrosequencing): measuring chain extension by pyrophosphate monitoring。焦磷酸测序技术是新一代 DNA序列分析技术,该技术无须进行电泳,DNA片段也无 须荧光标记,操作极为简便,可以快速、准确地确定DNA 序列。
测序的趋势
相对而言一般很少实验室会自己做测序,一则自身测序费用比较高,而且荧光试剂容 易粹灭,同时也比较消耗时间,另外可能出现一些其它问题引起结果不成功。所以大 部分的测序都是送到相关的测序中心或者公司完成:
全基因组测序ppt课件

测序数据的生成与分析
01
数据质量控制
去除低质量、污染
和重复序列数据。
02
序列比对
将测序数据与参考 基因组进行比对。
04
注释与解读
对变异进行功能注
03
释和临床意义解读
。
变异检测
识别基因组中的单 核苷酸变异、结构
变异等。
03
全基因组测序的实际应用
人类健康与疾病研究
遗传性疾病诊断
人类进化研究
全基因组测序可以检测出人类基因中 的突变位点,有助于遗传性疾病的诊 断和预防,如罕见病、癌症等。
02
全基因组测序技术原理
测序平台与技术分类
平台类型
基于Sanger的测序、基于焦磷酸测 序、基于纳米孔的测序和基于合成测 序等。
技术分类
长读长测序和短读长测序,单分子测 序和合成测序等。
测序的基本步骤
样本准备焦磷酸酶反应。 通过测序平台产生原始的测序数据。
测序技术的发展历程
1 2
3
第一代测序技术
基于Sanger的DNA测序方法,测序读长较短,通量较低。
第二代测序技术
基于高通量测序技术,如Illumina平台,实现了高通量、高 灵敏度和高精度。
第三代测序技术
基于单分子测序技术,如PacBio和Nanopore平台,具有超 长读长和实时测序能力。
全基因组测序的应用领域
癌症基因组研究
目的
01
通过对癌症患者的基因组进行测序和分析,了解癌症的发生、
发展和转移机制,为癌症的诊断、治疗和预防提供依据。
成果
02
发现了许多与癌症发生、发展相关的基因突变和变异,为个性
化治疗和精准医学提供了有力支持。
(完美版)基因测序流程.PPT文档

翻译:每3个碱基翻译成一个氨基酸。
10。DNA上的基因
确定一条染色体片断上的碱基顺序。 全自动的测序仪器:MegaBace 提质粒:从细菌中提取出繁殖好的质粒 提质粒:从细菌中提取出繁殖好的质粒 转成图论问题:Hamilton和Euler路径 类比:10本圣经,都从随机点起始剪成500个字母左右的小纸条,问:给你这么一堆小纸条,你能读出圣经来吗? 翻译:每3个碱基翻译成一个氨基酸。 Shotgun法序列拼接 任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统 称为genomes(基因组)。 一旦链入DNA中,其后就不能再继续连接 Shotgun法序列拼接 提质粒:从细菌中提取出繁殖好的质粒 拼接错误:Repeat的存在 此方法获1974年的Nobel奖 翻译:每3个碱基翻译成一个氨基酸。
11。什么是电泳?
在凝胶一端小槽中放入荧光标记的DNA 片断,两端加电压,短DNA片断跑得快, 长DNA片断跑得慢。
测序时需要区分长度只差一个碱基的片 断
12。什么是PCR?
DNA体外扩增方法的一种,能够将很少 的试样(比如只有罪犯的一滴血),扩 增成完全相同的无数拷贝。
每PCR一轮,扩增两倍 1-2-4-8-16…
我们能干什么?
测序之前全是生物学问题。 测序之后就全形式化是计算机问题。 天然的形式化:ATCG 核心问题:
字符串比对:两个字符串的距离 拼接问题 蛋白质结构预测:如何从一维预测三维结构?
感谢观看
拼接错误:Repeat的存在
转成图论问题:Hamilton和Euler路径
但是都会拼错!
Shotgun法序列拼接
Low Base Quality
Single Stranded Region
10。DNA上的基因
确定一条染色体片断上的碱基顺序。 全自动的测序仪器:MegaBace 提质粒:从细菌中提取出繁殖好的质粒 提质粒:从细菌中提取出繁殖好的质粒 转成图论问题:Hamilton和Euler路径 类比:10本圣经,都从随机点起始剪成500个字母左右的小纸条,问:给你这么一堆小纸条,你能读出圣经来吗? 翻译:每3个碱基翻译成一个氨基酸。 Shotgun法序列拼接 任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统 称为genomes(基因组)。 一旦链入DNA中,其后就不能再继续连接 Shotgun法序列拼接 提质粒:从细菌中提取出繁殖好的质粒 拼接错误:Repeat的存在 此方法获1974年的Nobel奖 翻译:每3个碱基翻译成一个氨基酸。
11。什么是电泳?
在凝胶一端小槽中放入荧光标记的DNA 片断,两端加电压,短DNA片断跑得快, 长DNA片断跑得慢。
测序时需要区分长度只差一个碱基的片 断
12。什么是PCR?
DNA体外扩增方法的一种,能够将很少 的试样(比如只有罪犯的一滴血),扩 增成完全相同的无数拷贝。
每PCR一轮,扩增两倍 1-2-4-8-16…
我们能干什么?
测序之前全是生物学问题。 测序之后就全形式化是计算机问题。 天然的形式化:ATCG 核心问题:
字符串比对:两个字符串的距离 拼接问题 蛋白质结构预测:如何从一维预测三维结构?
感谢观看
拼接错误:Repeat的存在
转成图论问题:Hamilton和Euler路径
但是都会拼错!
Shotgun法序列拼接
Low Base Quality
Single Stranded Region
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
细菌全基因组测序
生物信息学分析流程图
基因功能注释
基因注释主要基于蛋白序列比对,将基因的 序列与各数据库进行比对,得到对应的功能注 释信息。 注释的蛋白库为:KEGG、COG、SwissProt、 TrEMBL、NR。
B-6 KEGG代谢通路二级分类图
B-9 KEGG代谢通路二级分类图
其他H2O2生 成酶
乙二醛,甲基乙二醛
芳醇(茴香醇、黎芦 醇)
一些化合物
乙二醛氧化成二羟基乙酸,产生H2O2 芳醇氧化成醛,产生H2O2 O2还原成H2O2
论文构思
创新性 系统性 热点,高关注度
增加个性化信息分析
对B-6,B-7,B-8,B-9这4株菌的数据进行分析,寻找 与木质素降解相关基因;
醌 + 氢醌 CO2
α βγ
HO
C C C HO
H3CO C C C HO
CCC
对羟苯基结构(10%)
H3CO
愈创木基结构(70%)
H3CO
紫丁香基结构(20%)
β-O-4型连接
木质素主体结构的连接方式
键型 β-O-4型
连接方式 β-烷基芳基醚键
名称 愈创木基甘油-β-芳基醚
α-O-4型 4-O-5型 α-O-γ型
木质素
Lac MnP LiP
聚合木质素
单体 二聚体 寡聚体
其他酶
Lac MnP LiP
C1C2C3片段 CO2 开环产物 CO2
芳香醛酸
醌 + 氢醌 CO2
木质素 聚合木质素
运用测序数据构思文章
C1C2C3片段 CO2
Lac MnP LiP
单体 二聚体 寡聚体
其他酶
Lac MnP LiP
开环产物 CO2 芳香醛酸
用CAZY数据库对这4株菌的代谢途径进行注释,寻找纤 维素、半纤维素降解家族基因。
对4株菌的亲缘关系进行分析,确定菌株之间的相互关 系;
通过对4株菌进行进化分析,判定是否为古菌或新的菌 种。
基因分离
下一步的实验安排
对已注释出的基因进行验证
载体
酶切
酶切
连接
转化
筛选 表达
未注释出功能的基因鉴定,挖掘新基因
(LiP)和锰过氧化物酶(MnP),以及漆酶(Lac)。此外,一 些附属酶参与过氧化氢的产生,乙二醛氧化酶(glyoxal oxidase, 缩写作GLOX)和芳基醇氧化酶(aryl alcohol oxidase,缩写作 AAO)属于这类酶。
解读策略
③ 木质素降解过程涉及到的其他酶。
对木质素模型化合物作用的相关酶; 木质素单体化合物降解相关酶。
测序数据的解读与分析
解读策略
① 木质素基质是非常巨大的非均性高分子,会受到细胞外酶或试剂
的作用;木质素不含有可水解的化学键,这就意味着木质素降解 所参与的酶必须具有氧化性;木质素具有立体结构不规整性,与 许多其他天然高分子相比,木质素降解要求更具非特异性的作用。
② 木质素降解过程中涉及到的细胞外酶主要有:木质素过氧化物酶
DNA 转录 RNA 翻译 Protein
培养条件① 培养条件②
逆转录
产酶A且活性高 不产酶A或活性较低
测定转录 组mRNA
测定转录 组mRNA
比较 新 差异 基因
其他方面的应用研究
应用NMR、FTIR、UV, 14C标记的木质 素降解机理方面的研究; 农药残留物以及其他一些难降解有机物的 降解; 重金属有机物化合物的降解。
B-6 COG功能分类图
B-9 COG功能分类图
B-6 GC含量、GC skew、 COG 注释基因组分布图
B-9 GC含量、GC skew、 COG 注释基因组分布图
基因家族(gene family) 和基因簇(gene cluster)分析
基因组中来源相同,结构和功能相关的基因 聚集在一起形成基因家族。
β-5型 5-5型 β-β型
α-烷基芳基醚键 二芳基(联苯)醚键
二烷基醚键 α-烷基芳基醚,β-碳键
二苯基(联苯)碳键 β-二烷基碳键
β-1型
β-芳基碳键
愈创木基甘油-α-芳基醚 愈创木基芳基醚
松脂酚
苯基香豆满 二联苯愈创木基丙烷
二芳基(愈创木基)联丙 烷
愈创木基-β-芳基丙烷
木质素降解有关主要的酶和它们催化的主要反应
酶,简写
木质素过氧 化物酶,
LiP 锰过氧化物
酶,MnP
漆酶,Lac
辅助因子或基质“介 体”
主要效应和参与催化的反应
H2O2,黎芦醇
催化木质素非酚型亚结构β-O-4模型中丙基侧链 上的C α-C β键的断裂反应、开环以及其他的反
应
H2O2,Mn,有机酸作 形成苯氧自由基,引起芳香环和C α之间化学键 为螯合剂,硫醇,不 的断裂;MnP-脂质体系可使非酚型β-O-4木质素
基因家族的各个成员紧密成簇排列成大段的串联 重复单位,分布在某一条染色体的特殊区域
genefamily.xls
基因家族聚类结果
genefamily.stat
各基因家族统计信息
distance_data/all.Kas
包含各基因家族的序列等信息
饱和脂质
模型中的C α-C β键和β-芳基-醚键降解
O2,介质(如羟基苯 并三唑或ABTS)
通过氧化C α键和使芳基烷基键断裂,催化β-1和β-O-4-木质素模型化合物中的C α-C β键的断裂; 在“介体”分子存在下,可氧化非酚型β-O-4木
质素模型化合物
乙二醛氧化 酶,GLOX
芳基醇氧化 酶,AAO
生物信息学分析流程图
基因功能注释
基因注释主要基于蛋白序列比对,将基因的 序列与各数据库进行比对,得到对应的功能注 释信息。 注释的蛋白库为:KEGG、COG、SwissProt、 TrEMBL、NR。
B-6 KEGG代谢通路二级分类图
B-9 KEGG代谢通路二级分类图
其他H2O2生 成酶
乙二醛,甲基乙二醛
芳醇(茴香醇、黎芦 醇)
一些化合物
乙二醛氧化成二羟基乙酸,产生H2O2 芳醇氧化成醛,产生H2O2 O2还原成H2O2
论文构思
创新性 系统性 热点,高关注度
增加个性化信息分析
对B-6,B-7,B-8,B-9这4株菌的数据进行分析,寻找 与木质素降解相关基因;
醌 + 氢醌 CO2
α βγ
HO
C C C HO
H3CO C C C HO
CCC
对羟苯基结构(10%)
H3CO
愈创木基结构(70%)
H3CO
紫丁香基结构(20%)
β-O-4型连接
木质素主体结构的连接方式
键型 β-O-4型
连接方式 β-烷基芳基醚键
名称 愈创木基甘油-β-芳基醚
α-O-4型 4-O-5型 α-O-γ型
木质素
Lac MnP LiP
聚合木质素
单体 二聚体 寡聚体
其他酶
Lac MnP LiP
C1C2C3片段 CO2 开环产物 CO2
芳香醛酸
醌 + 氢醌 CO2
木质素 聚合木质素
运用测序数据构思文章
C1C2C3片段 CO2
Lac MnP LiP
单体 二聚体 寡聚体
其他酶
Lac MnP LiP
开环产物 CO2 芳香醛酸
用CAZY数据库对这4株菌的代谢途径进行注释,寻找纤 维素、半纤维素降解家族基因。
对4株菌的亲缘关系进行分析,确定菌株之间的相互关 系;
通过对4株菌进行进化分析,判定是否为古菌或新的菌 种。
基因分离
下一步的实验安排
对已注释出的基因进行验证
载体
酶切
酶切
连接
转化
筛选 表达
未注释出功能的基因鉴定,挖掘新基因
(LiP)和锰过氧化物酶(MnP),以及漆酶(Lac)。此外,一 些附属酶参与过氧化氢的产生,乙二醛氧化酶(glyoxal oxidase, 缩写作GLOX)和芳基醇氧化酶(aryl alcohol oxidase,缩写作 AAO)属于这类酶。
解读策略
③ 木质素降解过程涉及到的其他酶。
对木质素模型化合物作用的相关酶; 木质素单体化合物降解相关酶。
测序数据的解读与分析
解读策略
① 木质素基质是非常巨大的非均性高分子,会受到细胞外酶或试剂
的作用;木质素不含有可水解的化学键,这就意味着木质素降解 所参与的酶必须具有氧化性;木质素具有立体结构不规整性,与 许多其他天然高分子相比,木质素降解要求更具非特异性的作用。
② 木质素降解过程中涉及到的细胞外酶主要有:木质素过氧化物酶
DNA 转录 RNA 翻译 Protein
培养条件① 培养条件②
逆转录
产酶A且活性高 不产酶A或活性较低
测定转录 组mRNA
测定转录 组mRNA
比较 新 差异 基因
其他方面的应用研究
应用NMR、FTIR、UV, 14C标记的木质 素降解机理方面的研究; 农药残留物以及其他一些难降解有机物的 降解; 重金属有机物化合物的降解。
B-6 COG功能分类图
B-9 COG功能分类图
B-6 GC含量、GC skew、 COG 注释基因组分布图
B-9 GC含量、GC skew、 COG 注释基因组分布图
基因家族(gene family) 和基因簇(gene cluster)分析
基因组中来源相同,结构和功能相关的基因 聚集在一起形成基因家族。
β-5型 5-5型 β-β型
α-烷基芳基醚键 二芳基(联苯)醚键
二烷基醚键 α-烷基芳基醚,β-碳键
二苯基(联苯)碳键 β-二烷基碳键
β-1型
β-芳基碳键
愈创木基甘油-α-芳基醚 愈创木基芳基醚
松脂酚
苯基香豆满 二联苯愈创木基丙烷
二芳基(愈创木基)联丙 烷
愈创木基-β-芳基丙烷
木质素降解有关主要的酶和它们催化的主要反应
酶,简写
木质素过氧 化物酶,
LiP 锰过氧化物
酶,MnP
漆酶,Lac
辅助因子或基质“介 体”
主要效应和参与催化的反应
H2O2,黎芦醇
催化木质素非酚型亚结构β-O-4模型中丙基侧链 上的C α-C β键的断裂反应、开环以及其他的反
应
H2O2,Mn,有机酸作 形成苯氧自由基,引起芳香环和C α之间化学键 为螯合剂,硫醇,不 的断裂;MnP-脂质体系可使非酚型β-O-4木质素
基因家族的各个成员紧密成簇排列成大段的串联 重复单位,分布在某一条染色体的特殊区域
genefamily.xls
基因家族聚类结果
genefamily.stat
各基因家族统计信息
distance_data/all.Kas
包含各基因家族的序列等信息
饱和脂质
模型中的C α-C β键和β-芳基-醚键降解
O2,介质(如羟基苯 并三唑或ABTS)
通过氧化C α键和使芳基烷基键断裂,催化β-1和β-O-4-木质素模型化合物中的C α-C β键的断裂; 在“介体”分子存在下,可氧化非酚型β-O-4木
质素模型化合物
乙二醛氧化 酶,GLOX
芳基醇氧化 酶,AAO