生物信息学-蛋白相互作用分析和预测ppt课件
合集下载
蛋白质结构与功能预测 ppt课件

主要选项/参数
• 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-P将蛋白质序列
基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
基于多序列比对预测跨膜区位置和拓扑结构
识别二级结构中构型变化的氨基酸 识别卷曲螺旋
识别革兰氏阴性菌膜Beta桶蛋白结构 搜索序列中保守基序 过滤序列中低复杂区域
基于实验数据预测序列核定位区域
识别序列中二硫键位置
基于折叠结构识别远源蛋白序列 预测单链中原子残基接触性
PROFacc(默认)
PHDhtm(默认)
ASP(默认) COILS(默认)
PROFtmb ProSite(默认)
SEG(默认) PredictNLS(默认) DISULFIND(默认)
AGAPE PROFcon ProDom(默认) CHOP ConSeq
基于轮廓(profile)的神经网络算法预测蛋 白质二级结构
• 胞外末端-Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯 氨酸)
• 胞外-内分界区域-Trp(色氨酸) • 跨膜区-Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸
)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸 )、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸) 和Gly(甘氨酸) • 胞内-外分界区域-Tyr(络氨酸)、Trp(色氨酸)和Phe (苯丙氨酸) • 胞内末端-Lys(赖氨酸)和Arg(精氨酸)
基于多序列比对来预测跨膜 区的程序 基 于 HMM 方 法 的 蛋 白 质 跨 膜区预测工具 基 于 对 TMbase 数 据 库 的 统 计分析来预测蛋白质跨膜区 和跨膜方向
蛋白质蛋白质相互作用ppt课件

个物种的蛋白质进行交互 Blast,即利用一个物种的一 个蛋白质对第二个物种的所有 蛋白质进行Blast,再将在第 二个物种中得到的E值最小的 蛋白质序列对第一个物种的所 有蛋白质进行Blast,如在第 一个物种中E值最小的蛋白质 是原来用来对第二个物种进行 Blast的蛋白质,则这两个蛋 白质互为直系同源蛋白质。
在应用中,通常利用三个物种 进行交互Blast以便更好地确 定直系同源蛋白质。
Org A, Protein1 Blast Org B, All proteins P2 with smallest E value
IleS-MG345- MJ0947
Org B, Protein2 Blast Org A, All proteins P1 with smallest E value
基因位点的上下文 基因临近
聚集
分散
基因融合 (Rosetta-Stone method )
电子双杂交
系统发育上下文
系统发生谱方法 系统树相近 (Mirror tree)
基因表达: mRNA共表达
.
20
一些重要的概念
Ortholog: 直系同源,是指不同物种中来自同一个 祖先的基因和蛋白质。
.
35
Mirror Trees Method
该方法的假设前提是:相互作用的蛋白可能是共进化的。方法是:计算包含
不同物种的蛋白质家族间的进化距离,构建各自相应的进化树,在进化树之间相
似性距离的基础上,构建镜像树,然后由镜像树之间的相似性距离和蛋白质在镜
像树上的位置确定蛋白质之间的两两相互作用。
.
36
.
31
基因组临近/ 基因临近 (1)
在应用中,通常利用三个物种 进行交互Blast以便更好地确 定直系同源蛋白质。
Org A, Protein1 Blast Org B, All proteins P2 with smallest E value
IleS-MG345- MJ0947
Org B, Protein2 Blast Org A, All proteins P1 with smallest E value
基因位点的上下文 基因临近
聚集
分散
基因融合 (Rosetta-Stone method )
电子双杂交
系统发育上下文
系统发生谱方法 系统树相近 (Mirror tree)
基因表达: mRNA共表达
.
20
一些重要的概念
Ortholog: 直系同源,是指不同物种中来自同一个 祖先的基因和蛋白质。
.
35
Mirror Trees Method
该方法的假设前提是:相互作用的蛋白可能是共进化的。方法是:计算包含
不同物种的蛋白质家族间的进化距离,构建各自相应的进化树,在进化树之间相
似性距离的基础上,构建镜像树,然后由镜像树之间的相似性距离和蛋白质在镜
像树上的位置确定蛋白质之间的两两相互作用。
.
36
.
31
基因组临近/ 基因临近 (1)
生物信息学 第六章 蛋白质结构预测及分子设计ppt课件

构,PDP域 更多外部链接(对于RecBCD多达26个)
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)
3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质跨膜区特性 ▪ 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、
Ala等)组成; ▪ 亲水残基往往出现在疏水残基之间,对功能有重要的作用; ▪ 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。 跨膜蛋白序列“边界”原则 ▪ 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) ▪ 胞外-内分界区:Trp(色氨酸) ▪ 跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)
3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质跨膜区特性 ▪ 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、
Ala等)组成; ▪ 亲水残基往往出现在疏水残基之间,对功能有重要的作用; ▪ 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。 跨膜蛋白序列“边界”原则 ▪ 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) ▪ 胞外-内分界区:Trp(色氨酸) ▪ 跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸
生物信息学分析方法介绍PPT课件

生物信息学分析方法 介绍
目录
• 生物信息学概述 • 基因组学分析方法 • 转录组学分析方法 • 表观遗传学分析方法 • 蛋白质组学分析方法 • 生物信息学分析流程和方法比较
01
生物信息学概述
生物信息学的定义和重要性
定义
生物信息学是一门跨学科的学科,它利用计算机科学、数学和工程学的原理和 技术,对生物学数据进行分析、建模和解读,以揭示生命现象的本质和规律。
研究蛋白质的序列、结构 和功能,以及蛋白质相互 作用和蛋白质组表达调控 机制。
研究基因转录本的序列、 结构和表达水平,以及转 录调控机制。
研究基因表达的表观遗传 调控机制,如DNA甲基化 、组蛋白修饰等。
通过对患者基因组、蛋白 质组和转录组等数据的分 析,为个性化医疗和精准 医学提供支持。
02
基因组学分析方法
基因组注释
基因组注释是指对基因组序列中的各 个区域进行标记和描述的过程,包括 基因、转录单元、重复序列、调控元 件等。
注释信息可以通过数据库(如RefSeq、 GeneBank等)或注释软件(如GATK、 ANNOVAR等)获取。注释信息对于 理解基因组的生物学功能和进化关系 具有重要意义。
基因组变异检测
基因组变异检测是指检测基因组序列 中的变异位点,包括单核苷酸变异、 插入和缺失等。
VS
变异检测对于遗传疾病研究、进化生 物学和生物进化研究等领域具有重要 意义。常用的变异检测方法有SNP检 测、CNV检测等,它们基于不同的原 理和技术,具有不同的适用范围和精 度。
03
转录组学分析方法
RNA测序技术
利用生物信息学方法和算法,对 RNA测序数据进行基因融合检测, 寻找融合基因及其融合方式。
基因融合检测结果可以为研究肿 瘤等疾病提供重要线索,有助于 深入了解疾病发生发展机制。
目录
• 生物信息学概述 • 基因组学分析方法 • 转录组学分析方法 • 表观遗传学分析方法 • 蛋白质组学分析方法 • 生物信息学分析流程和方法比较
01
生物信息学概述
生物信息学的定义和重要性
定义
生物信息学是一门跨学科的学科,它利用计算机科学、数学和工程学的原理和 技术,对生物学数据进行分析、建模和解读,以揭示生命现象的本质和规律。
研究蛋白质的序列、结构 和功能,以及蛋白质相互 作用和蛋白质组表达调控 机制。
研究基因转录本的序列、 结构和表达水平,以及转 录调控机制。
研究基因表达的表观遗传 调控机制,如DNA甲基化 、组蛋白修饰等。
通过对患者基因组、蛋白 质组和转录组等数据的分 析,为个性化医疗和精准 医学提供支持。
02
基因组学分析方法
基因组注释
基因组注释是指对基因组序列中的各 个区域进行标记和描述的过程,包括 基因、转录单元、重复序列、调控元 件等。
注释信息可以通过数据库(如RefSeq、 GeneBank等)或注释软件(如GATK、 ANNOVAR等)获取。注释信息对于 理解基因组的生物学功能和进化关系 具有重要意义。
基因组变异检测
基因组变异检测是指检测基因组序列 中的变异位点,包括单核苷酸变异、 插入和缺失等。
VS
变异检测对于遗传疾病研究、进化生 物学和生物进化研究等领域具有重要 意义。常用的变异检测方法有SNP检 测、CNV检测等,它们基于不同的原 理和技术,具有不同的适用范围和精 度。
03
转录组学分析方法
RNA测序技术
利用生物信息学方法和算法,对 RNA测序数据进行基因融合检测, 寻找融合基因及其融合方式。
基因融合检测结果可以为研究肿 瘤等疾病提供重要线索,有助于 深入了解疾病发生发展机制。
蛋白相互作用的研究技术分子生物学PPT教案

BFP---GFP CFP---YFP
B: blue G: green C: cyan Y: yellow
激发波长 383 488 434 513
发射波长 448 510 477
532
荧光共振能量转移技术可以研究分子内部对 某些刺激发生的构象变化,也能研究分子间 的相互作用。它可以在活体中检测,非常灵 敏,分辨率高,能够检测大分子的构象变化 ,能够定性定量的检测相互作用的强度。
M13噬菌体
丝 状 噬 菌 体
λ噬菌体、T4噬菌体、T7噬菌体
蝌 蚪 形 噬 菌 体
最关键的优势:
1. 淘选的高效率使得在极低的存在水平下, 挑选到高亲和力噬菌体成为可能;
2. 所挑选到的噬菌体可在微量存在的情况下, 通过感染细菌得到富集;
3. 展示的多肽或蛋白质与其包含在噬菌体内 部的基因密码的连接,使得结合肽或蛋白 质的序列分析既快速又简便。
基本原理是将一种蛋白质固定于某种基质上 (如Sepharose离子交换琼脂糖),当细胞抽 提液经过该基质时,可与该固定蛋白相互作用 的配体蛋白被吸附,而没有被吸附的非目标蛋 白则随洗脱液流出。被吸附的蛋白可以通过改 变洗脱液或者洗脱条件而回收下来。
融合蛋白pull-down实验
为了更有效地利用蛋白质亲和色谱,可以将待研 究的蛋白以融合蛋白形式表达,即将“诱饵”蛋 白与一种易于纯化的配体蛋白相融合。1988年 Smith等利用谷胱甘肽-S-转移酶(glutathioneS-transferase ,GST)融合标签从细菌中一步纯化出 GST融合蛋白。从此GST融合蛋白在蛋白质相互 作用研究领域里得到极大的推广。
蛋白相互作用的研究技术分子生物学
会计学
1
➢ 蛋白质是生命活动的主要执行者
蛋白质结构与功能预测课件

蛋白质三维结构模拟
学习交流PPT
4
蛋白质结构预测过程
蛋白质理化性质 和一级结构
ORF翻译 蛋白质序列
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测
有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
学习交流PPT
5
ExPASy(Expert Protein Analysis System)Tools ()
学习交流PPT
Hale Waihona Puke 17二、蛋白质跨膜区分析(a)-Type I membrane protein
(b)-Type II membrane protein
(c)-Multipass transmembrane proteins
(d)-Lipid chain-anchored membrane proteins
学习交流PPT
19
跨膜蛋白序列“边界”原则 -Landolt Marticorena et al.,
1993
• 胞外末端-Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨 酸)
• 胞外-内分界区域-Trp(色氨酸)
• 跨膜区-Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨 酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨 酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸) 和Gly(甘氨酸)
理论 pI 值
氨基酸组成
返回结果
正/负电荷残基数
学习交流PPT
14
原子组成
分子式 总原子数 消光系数
半衰期
学习交流PPT
学习交流PPT
4
蛋白质结构预测过程
蛋白质理化性质 和一级结构
ORF翻译 蛋白质序列
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测
有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
学习交流PPT
5
ExPASy(Expert Protein Analysis System)Tools ()
学习交流PPT
Hale Waihona Puke 17二、蛋白质跨膜区分析(a)-Type I membrane protein
(b)-Type II membrane protein
(c)-Multipass transmembrane proteins
(d)-Lipid chain-anchored membrane proteins
学习交流PPT
19
跨膜蛋白序列“边界”原则 -Landolt Marticorena et al.,
1993
• 胞外末端-Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨 酸)
• 胞外-内分界区域-Trp(色氨酸)
• 跨膜区-Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨 酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨 酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸) 和Gly(甘氨酸)
理论 pI 值
氨基酸组成
返回结果
正/负电荷残基数
学习交流PPT
14
原子组成
分子式 总原子数 消光系数
半衰期
学习交流PPT
蛋白质生物信息学(共45张PPT)

利用生物信息学软件DNAman将VH-L-L的核苷酸序列翻译
为氨基酸序列
利用NCBI提供的ORF Finder预测VH-L-L的 ORF,从预测结果看出VH-L-L是一段连续 的较长的ORF,它可能是一个完整的编码 序列
利用ProtParam对VH-L-L的氨基酸序列及基本 理化性质进行了分析。
析,更加深入地理解DNA序列,结构,演化及其 与生物功能之间的关系。
研究课题涉及到分子生物学,分子演化及结构生 物学,统计学及计算机科学等许多领域。
研究过程
以数据(库)为核心 1 数据库的建立 2 生物学数据的检索 3 生物学数据的处理 4 生物学数据的利用:计算生物学
研究展望
由于生物信息学是基于分子生物学与多种学科交叉而成的 新学科,现有的形势仍表现为各种学科的简单堆砌,相互之 间的联系并不是特别的紧密。在处理大规模数据方面,没 有行之有效的一般性方法;而对于大规模数据内在的生成 机制也没有完全明了,这使得生物信息学的研究短期内很 难有突破性的结果。
第一节生物信息学与蛋白质工程 一、生物信息学概述
生物信息学是利用应用数学、信息学、统计 学和计算机科学的方法研究生物学的问题。
1987年,林华安首创Bioinformation 一词,被誉为”世界生物信息之父”。
概述
生物信息学分子生物学与信息技术(尤其是互联网 技术)的结合体。
研究材料和结果就是各种各样的生物学数据 研究工具是计算机
由于DNA自动测序技术的快速发展,
DNA数据库中的核酸序列公共数据量 以每天106bp速度增长,生物信息迅速 地膨胀成数据的海洋。毫无疑问,我们 正从一个积累数据向解释数据的时代转 变,数据量的巨大积累往往蕴含着潜 在突破性发现的可能。 “生物信息学” 正是从这一前提产生的交叉学科。
(2021)蛋白相互作用完美版PPT

在体外和体内(大肠杆菌BL21 中) 分别证明了,只有借助亮氨酸拉链的相互作用,GFP 的2 个多肽片段才能够靠近,重新形成完整的GFP
的第158 位氨基酸. 在体外和体内(大肠杆菌BL21 蛋白,并发射荧光.
青色荧光蛋白(cyan fluorescent protein, CFP)、黄色荧光蛋白(yellow fluorescent protein, YFP)为目前蛋白-蛋白相互作用研究中
单,由于只是检测荧光的有无, 因而背景干净, 检测更加灵敏. 重建后的荧光蛋白结构较 稳定,双分子荧光互补技术还可以用于研究 蛋白质之间的弱相互作用或瞬间相互作用[
3) 必须通过酵母细胞培养才能观察到结果,耗时较长.
的亮氨酸拉链介导的GFP 重组实验. 该实验选用 两段重组基因在细胞中融合表达,若目标蛋白间存在相互作用,通过linker 牵引荧光蛋白的N 端片段与C 端片段就能够相互靠近,进而
形成荧光蛋白生色团重新发出荧光.
了易被检测的GFP 蛋白,将其从氨基酸Gln157- 系统中相互作用的蛋白在其天然环境中处于不同
在荧光显微镜下检测是否有互补荧光产生,就可 以推断出两目标蛋白是否发生了相互作用。
Bimolecular Fluorescence Complementation (BiFC)
Bimolecular Fluorescence Complementation (BiFC)
• 优点: • BiFC系统对仪器要求低、数据处理相对简
Identifying Protein-Protein Interactions: FRET
Identifying Protein-Protein Interactions: FRET
• 青色荧光蛋白(cyan fluorescent protein, CFP)、黄色 荧光蛋白(yellow fluorescent protein, YFP)为目前蛋白 -蛋白相互作用研究中最广泛应用的FRET对。CFP的发射 光谱与YFP的吸收光谱相重叠。将供体蛋白CFG和受体 蛋白YFG分别与两种目的蛋白融合表达。当两个融合蛋 白之间的距离在5-10nm的范围内,则供体CFP发出的荧 光可被YFP吸收,并激发YFP发出黄色荧光,此时通过测 量CFP荧光强度的损失量来确定这两个蛋白是否相互作用。 两个蛋白距离越近,CFP所发出的荧光被YFP接收的量就 越多,检测器所接收到的荧光就越少。
的第158 位氨基酸. 在体外和体内(大肠杆菌BL21 蛋白,并发射荧光.
青色荧光蛋白(cyan fluorescent protein, CFP)、黄色荧光蛋白(yellow fluorescent protein, YFP)为目前蛋白-蛋白相互作用研究中
单,由于只是检测荧光的有无, 因而背景干净, 检测更加灵敏. 重建后的荧光蛋白结构较 稳定,双分子荧光互补技术还可以用于研究 蛋白质之间的弱相互作用或瞬间相互作用[
3) 必须通过酵母细胞培养才能观察到结果,耗时较长.
的亮氨酸拉链介导的GFP 重组实验. 该实验选用 两段重组基因在细胞中融合表达,若目标蛋白间存在相互作用,通过linker 牵引荧光蛋白的N 端片段与C 端片段就能够相互靠近,进而
形成荧光蛋白生色团重新发出荧光.
了易被检测的GFP 蛋白,将其从氨基酸Gln157- 系统中相互作用的蛋白在其天然环境中处于不同
在荧光显微镜下检测是否有互补荧光产生,就可 以推断出两目标蛋白是否发生了相互作用。
Bimolecular Fluorescence Complementation (BiFC)
Bimolecular Fluorescence Complementation (BiFC)
• 优点: • BiFC系统对仪器要求低、数据处理相对简
Identifying Protein-Protein Interactions: FRET
Identifying Protein-Protein Interactions: FRET
• 青色荧光蛋白(cyan fluorescent protein, CFP)、黄色 荧光蛋白(yellow fluorescent protein, YFP)为目前蛋白 -蛋白相互作用研究中最广泛应用的FRET对。CFP的发射 光谱与YFP的吸收光谱相重叠。将供体蛋白CFG和受体 蛋白YFG分别与两种目的蛋白融合表达。当两个融合蛋 白之间的距离在5-10nm的范围内,则供体CFP发出的荧 光可被YFP吸收,并激发YFP发出黄色荧光,此时通过测 量CFP荧光强度的损失量来确定这两个蛋白是否相互作用。 两个蛋白距离越近,CFP所发出的荧光被YFP接收的量就 越多,检测器所接收到的荧光就越少。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
string
/
基因表达分析(GEO)
近年来,利用高通量方法检测基因表达越来越普 及,诸如微阵列杂交和基因表系列分析(SAGE) 可以同时测量数以万计的基因转录子(gene transcript)。基因表达大棚车(GEO:Gene Expression Omnibus)则是归档和自由分发科研人 员提交的高通量基因表达数据的公共仓库。目前, GEO存储了大约10亿单个基因表达的数据,来自 于100多种生物,内容广泛涉及到各种生物学问题。 这些大容量的数据可以使用用户友好的以Web为 基础的工具进行有效的挖掘,检索和可视化表达。 GEO的网址是/geo。
为什么要有CGAP?
在过去的二十年中,我们已经了解到遗 传学改变是所有癌症的根结所在。为此, CGAP将统一最新的技术,以及那些又节约 经费又有很高的通量的技术,来确定所有 与癌症的产生和发展有关的基因。
计划的目标
获得关于正常,癌前,和恶性细胞的全 面的分子学特征。
Gene Ontology
基因功能分类标准体系
Gene Ontology Consortium(GO的发起组织) 的数据库中有3大独立的ontology被建立起来: biological process生物过程, molecular function分 子功能及cellular component细胞组分。而这三 个ontology下面又可以独立出不同的亚层次, 层层向下构成一个ontologies的树型分支结构。
蛋白相互作用分析和 预测
蛋白相互作用预测机理:
expression, orthology, domain co-occurrence, post-translational modifications, sub-cellular location identified by experimental methods
癌基因组表达差异分析
CGAP计划是一项由NCI建立和主持的交叉学科的 计划,用来产生用于解码肿瘤细胞的分子结构所需 的信息和技术工具。CGAP被分为五个互补的自主 部分,每一个都有它自己的目的,信息学工具和资 源。The Human Tumor Gene Index (hTGI)人类肿瘤 基因索引指明了在人类肿瘤发生过程中的基因表达。 Molecular Profiling (MP)分子表达谱展示了用前列腺 作为例子来从分子水平分析人类组织样品的概念。 The Cancer Chromosome Aberration Project (CCAP)癌 症染色体变异计划(CCAP)描述了同恶性转移相 关的染色体改变。The Genetic Annotation Index (GAI) 遗传注解索引指明和描绘了同癌症相关的多态性。 The Mouse Tumor Gene Index (mTGI)小鼠肿瘤基因 索引(mTGI)确定了在小鼠肿瘤发生过程中的基 因表达。
可以说, GO是生物学的统一化工具。
信号传导通路查询
已发表蛋白相互作用数据库分析
IntAct HPRD DIP BioGRID MINT string
Байду номын сангаас PIPs 人的蛋白相互作用预测
APID: Agile Protein Interaction DataAnalyzer