蛋白质组学及其研究方法与进展

蛋白质组学及其研究方法与进展
蛋白质组学及其研究方法与进展

蛋白质组学及其研究方法与进展

蛋白质是生命活动的体现者,基因的表达最后是通过蛋白质来体现的,在这个过程中,蛋白质起了连接基因与表现的功能。蛋白质是有氨基酸组成的,组成蛋白质的氨基酸的种类及排列顺序构成了蛋白质的一级结构,而在一级机构基础上的多肽链本身的折叠和盘绕方式构成了蛋白质的二级结构,考虑到多肽链上原子在空间的分布,由二级结构进一步形成了蛋白质的三级结构,对于有多个亚基的蛋白质还存在四级结构。

蛋白质的一级结构决定了高级结构,而高级结构则决定着蛋白质的生物学功能。如今对于蛋白质研究已经单独形成了一个活跃的生物学分支学科―――蛋白质组学,在蛋白质的研究中发挥着很重要的作用,下面将介绍蛋白质组学的一些基本内容及研究进展。

一.产生背景[1]

在20世纪中后期随着DNA双螺旋结构的提出和蛋白质空间结构的解析,生命科学研究进入了分子生物学时代,对遗传信息载体DNA和生命功能的体现者蛋白质的研究,成为了其主要内容。90年代初期启动的庞大的人类基因组计划.在经过各国科学家多年的努力下,已经取得了巨大的成就。10多种低等模式生物的基因组序列测定L三完成;第一个多细胞生物一线虫基因组的DNA全序列测定也在1998年年底完成;人类所有基因的部分序列测定(EST)已经完成;人类基因组的全序列测定有可能提前到2003年完成。生命科学已跨入了后基因组时代。在后基因组时代,研究重心将从揭示生命的所有遗传信息转移到在整体水平上对功能的研究。这种转向的第一个标志是产生了功能基因组学这一新学科,即从基因组整体水平上对基因的活动规律进行阐述。如在mRNA 水平上,通过DNA 芯片(DNA chips)和微阵列(Microarray)法等技术检测大量基因的表达模式,并取得了很好的进展。但是,mRNA的表达水平(包括mRNA的种类和含量)由于mRNA储存和翻译调控以及翻译后加工等的存在.并不能直接反映蛋白质的表达水平}蛋白质自身特有的活动规律,如蛋白质的修饰加工、转运定位结构形成、代谢、蛋白质与蛋白质及其他生物大分子的相互作用等.均无法从在基因组水平上的研究获知。因此,对生物功能的主要体现者或执行者一蛋白质的表达模式和功能模式的研究就成为生命科学发展的必然。在此背景下.80年代中期,国际上葫发了一门研究细胞内垒部蛋白质的组成及其活动规律的新兴学科- 蛋白质组学(Proteomic)。

蛋白质组(proteome)一词是马克.威尔金斯(Marc Wilkins)最先提出来的, 最早见诸于1995年7月的“Electrophoresis”杂志上它是指一个有机体的全部蛋白质组成及其活动方式。蛋白质组研究虽然尚处于初始阶段, 但已经取得了一些重要进展。当前蛋白质组学的主要内容是, 在建立和发展蛋白质组研究的技术方法的同时, 进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面,通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱, 相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱

建立的意义在于为进一步的分析工作提供基础。蛋白质组分析的另一方面, 是比较分析在变化了的生理条件下蛋白质组所发生的变化。如蛋白质表达量的变化, 翻译后修饰的变化, 或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。

细胞或组织的蛋白质不是杂乱无章的混合物, 蛋白质间的相互作用、相互协调是细胞进行一切代谢活动的基础。蛋白质间的相互作用及作用方式同样也是蛋白质组研究所面临的问题。研究蛋白质间的相互作用有多种方法, 常用的如酵母双杂交系统、亲和层析、免疫沉淀、蛋白质交联等。其中, 酵母双杂交系统是当前发展迅速、应用广泛的主要方法。

二.发展趋势[2]

国际上蛋白质组研究进展十分迅速,不论基础理论还是技术方法,都在不断进步和完善。相当多种细胞的蛋白质组数据库已经建立,相应的国际互联网站也层出不穷。1996年,澳大利亚建立了世界上第一个蛋白质组研究中心:Australi a Proteome Analysis Facility ( APAF )。丹麦、加拿大、日本也先后成立了蛋白质组研究中心。在美国,各大药厂和公司在巨大财力的支持下,也纷纷加入蛋白质组的研究阵容。去年在瑞士成立的GeneProt公司,是由以蛋白质组数据库“S WISSPROT” 著称的蛋白质组研究人员成立的,以应用蛋白质组技术开发新药物靶标为目的,建立了配备有上百台质谱仪的高通量技术平台。而当年提出Huma n Protein Index 的美国科学家Normsn G. Anderson也成立了类似的蛋白质组学公司,继续其多年未实现的梦想。2001年4月,在美国成立了国际人类蛋白质组研究组织(Human Proteome Organization, HUPO),随后欧洲、亚太地区都成立了区域性蛋白质组研究组织,试图通过合作的方式,融合各方面的力量,完成人类蛋白质组计划(Human Proteome Project)。

三.研究技术[7]

<1>用于分离的双向电泳(2-DE)

蛋白质组研究的发展以双向电泳技术作为核心. 双向电泳由O’Farrell’s于19 75年首次建立并成功地分离约1 000个E.coli蛋白,并表明蛋白质谱不是稳定的,而是随环境而变化. 双向电泳原理简明,第一向进行等电聚焦,蛋白质沿p H梯度分离,至各自的等电点;随后,再沿垂直的方向进行分子量的分离. 目前,随着技术的飞速发展,已能分离出10 000个斑点(spot). 当双向电泳斑点的全面分析成为现实的时候,蛋白质组的分析变得可行.

样品制备(sample prepareation)和溶解同样事关2-DE的成效,目标是尽可能扩大其溶解度和解聚,以提高分辨率. 用化学法和机械裂解法破碎以尽可能溶解和解聚蛋白,两者联合有协同作用. 对IEF(isoelectric focusing)样品的预处理涉及溶解、变性和还原来完全破坏蛋白间的相互作用,并除去如核酸等非蛋白物质.理想的状态是人们应一步完成蛋白的完全处理. 近来,在“变性剂鸡尾酒”中,含14~16个碳的磺基甘氨酸三甲内盐(ASB14~16)的裂解液效果最好. 而离液

剂2 mol/L硫脲和表面活性剂4%CHAPS的混合液促使疏水蛋白从IPG(immobil

ized pH gradients)胶上的转换. 三丁基膦(Tributyl phosphine,TBP )取代β-巯基乙醇或DTT完全溶解链间或链内的二硫键,增强了蛋白的溶解度,并导致转至第二向的增加. 两者通过不同的方法来增加蛋白的溶解度,作为互补试剂会更有效. 在保持样品的完整性的前提下,可利用超离和核酸内切酶去除核酸(DNA). 除此之外,机械力被用来对蛋白分子解聚,如超声破碎等. 另外,添加PMSF等蛋白酶抑制剂,可保持蛋白完整性. 由于商品化的IPG胶条是干燥脱水的,可在其水化的过程中加样,覆盖整个IPG胶,避免在样品杯中的沉淀所致的样品丢失. 此外,低丰度蛋白(low abundance protein)在细胞内可能具有重要的调节功能,代表蛋白质组研究的“冰山之尖”,故分离低丰度蛋白是一种挑战. 亚细胞分级和蛋白质预分级、提高加样量(已达到1~15 mg级的标准)、应用敏感性检测,可以提高其敏感性. 如一种多肽免疫2-DE印迹(MI-2DE)是利用几种单克隆抗体技术来分析和检测. 提高组蛋白和核糖体蛋白等碱性蛋白(basic proteins)的分离是另一难点. 由于碱性pH范围内凝胶基质的不稳定及逆向电渗流(EOF)的产生,对PI(等电点)超过10的碱性蛋白,通过产生~的山梨醇梯度和16%的异丙醇可减少之. 亦可用双甲基丙烯酰胺来增加基质的稳定性.

2-DE面临的挑战是高分辨率和重复性. 高分辨率确保蛋白最大程度的分离,高重复性允许进行凝胶间配比(match). 对2-DE而言,有3种方法分离蛋白:1)I SO-DALT(isoelectric focus)以O’Farrell’s技术为基础. 第一向应用载体两性电解质(carrier ampholyte, CA),在管胶内建立pH梯度. 随着聚焦时间的延长,pH梯度不稳,易产生阴极漂移. 2) NEPHGE(non-equilibrium pH gradient electrophor esis)用于分离碱性蛋白(pH>7.0). 如果聚焦达到平衡状态,碱性蛋白会离开凝胶基质而丢失. 因此,在等电区域的迁移须在平衡状态之前完成,但很难控制. 3)I PG-DALT发展于80年代早期. 由于固相pH梯度(Immobilized pH gradient, IPG)的出现解决了pH梯度不稳的问题. IPG通过immobiline共价偶联于丙烯酰胺产生固定的pH梯度,克服了IEF的缺点,从而达到高度的重复性. 目前可以精确制作线性、渐进性和S型曲线,范围或宽或窄的pH梯度. 新的酸性pH 3~5或碱性pH 6~11的IPG凝胶梯度联合商品化的pH 4~7的梯度可对蛋白质形成蛋白质组重叠群(proteomic contigs)从而有效分离.

分离后的斑点检测(spot detection)亦很重要. 所采用的检测策略和分离后所

采用的方法的相互作用是很重要的. 此外,还需考虑反应的线性、饱和阈/动态范围、敏感性、对细胞蛋白群的全体定量分析的适应性、可行性. 目前,没有一种蛋白染色覆盖广泛的浓度和PI及分离后分析技术. 银染已成为一种检测2-DE的流行方法,可检测少到2~5ng的蛋白,因此较考马斯亮蓝R-250敏感. 多数糖蛋白不能被考马斯亮蓝染色,一些有机染料不适于PVDF膜. 放射性标记不依赖其代谢的活性,并仅适于对合成的蛋白质检测. 另有一种改良的2-DE(差异凝胶电泳),即应用两种不同的染料荧光标记两个样品,使在同一凝胶上电泳后的凝胶图象为两个,避免了几种2-DE的比较,可在纳克级进行检测.

较早期相比,2-DE有两个主要的进步:首先,极高的重复性使有机体的参考图谱,可通过Internet获得,来比较不同组织类型、不同状态的基因表达;其次,高加样量使得2-DE成为一项真正的制备型技术.

<2> 鉴定技术(Identification)

如果目前分离蛋白质组的最好技术是2-DE,那么随之而来的挑战是数百数千个蛋白如何被鉴定. 在这里,我们不考虑传统的蛋白鉴定方法,如免疫印迹法、内肽的化学测序、已知或未知蛋白的comigration分析,或者在一个有机体中有意义的基因的过表达. 并不是因为这些方法无效,而是因为它们通常耗时、耗力,不适合高流通量的筛选. 目前,所选用的技术包括对于蛋白鉴定的图象分析、微量测序;进一步对肽片段进行鉴定的氨基酸组分分析和与质谱相关的技术.

(1) 图象分析技术(Image analysis). “满天星”式的2-DE ,那么随之而来的挑战是数百数千个蛋白如何被鉴定. 在这里,我们不考虑传统的蛋白鉴定方法,如免疫印迹法、内肽的化学测序、已知或未知蛋白的comigration分析,或者在一个有机体中有意义的基因的过表达. 并不是因为这些方法无效,而是因为它们通常耗时、耗力,不适合高流通量的筛选. 目前,所选用的技术包括对于蛋白鉴定的图象分析、微量测序;进一步对肽片段进行鉴定的氨基酸组分分析和与质谱相关的技术.

(1) 图象分析技术(Image analysis). “满天星”式的2-DE图谱分析不能依靠本能的直觉,每一个图象上斑点的上调、下调及出现、消失,都可能在生理和病理状态下产生,必须依靠计算机为基础的数据处理,进行定量分析. 在一系列高质量的2-DE凝胶产生(低背景染色,高度的重复性)的前提下,图象分析包括斑点检测、背景消减、斑点配比和数据库构建. 首先,采集图象通常所用的系统是电荷耦合CCD(charge coupled device)照相机;激光密度仪(laser densitometers)和P hospho或,对图象进行数字化. 并成为以象素(pixels)为基础的空间和网格. 其次,在图象灰度水平上过滤和变形,进行图象加工,以进行斑点检测. 利用Laplacian,Gaussian,DOG(difference of Gaussians) opreator使有意义的区域与背景分离,精确限定斑点的强度、面积、周长和方向. 图象分析检测的斑点须与肉眼观测的斑点一致. 在这一原则下,多数系统以控制斑点的重心或最高峰来分析,边缘检测的软件可精确描述斑点外观,并进行边缘检测和邻近分析,以增加精确度. 通过阈值分析、边缘检测、销蚀和扩大斑点检测的基本工具还可恢复共迁移的斑点边界. 以PC机为基础的软件Phoretix-2D正挑战古老的Unix 为基础的2-D分析软件包. 第三,一旦2-DE图象上的斑点被检测,许多图象需要分析比较、增加、消减或均值化. 由于在2-DE中出现100%的重复性是很困难的,由此凝胶间的蛋白质的配比对于图象分析系统是一个挑战. IPG技术的出现已使斑点配比变得容易. 因此,较大程度的相似性可通过斑点配比向量算法在长度和平行度观测. 用来配比的著名软件系统包括Quest,Lips,Hermes,Gemini 等,计算机方法如相似性、聚类分析、等级分类和主要因素分析已被采用,而神经网络、子波变换和实用分析在未来可被采用. 配比通常由一个人操作,其手工设定大约50个突出的斑点作为“路标”,进行交叉配比. 之后,扩展至整个胶.

例如:精确的PI和MW(分子量)的估计通过参考图上20个或更多的已知蛋白所组成的标准曲线来计算未知蛋白的PI和MW. 在凝胶图象分析系统依据已知蛋白质的pI值产生PI网络,使得凝胶上其它蛋白的PI按此分配. 所估计的精确度大大依赖于所建网格的结构及标本的类型. 已知的未被修饰的大蛋白应该作为

标志,变性的修饰的蛋白的PI估计约在±0.25个单位. 同理,已知蛋白的理论分子量可以从数据库中计算,利用产生的表观分子量的网格来估计蛋白的分子量.

未被修饰的小蛋白的错误率大约30%,而翻译后蛋白的出入更大. 故需联合其他的技术完成鉴定.

(2) 微量测序(microsequencing). 蛋白质的微量测序已成为蛋白质分析和鉴定的基石,可以提供足够的信息. 尽管氨基酸组分分析和肽质指纹谱(PMF)可鉴定由2-DE分离的蛋白,但最普通的N-末端Edman降解仍然是进行鉴定的主要技术. 目前已实现蛋白质微量测序的自动化. 首先使经凝胶分离的蛋白质直接印迹在PVDF膜或玻璃纤维膜上,染色、切割,然后直接置于测序仪中,可用于sub picomole水平的蛋白质的鉴定. 但有几点需注意:Edman降解很缓慢,序列以每40 min 1个氨基酸的速率产生;与质谱相比,Edman降解消耗大;试剂昂贵,每个氨基酸花费3~4$. 这都说明泛化的Edman降解蛋白质不适合分析成百上千的蛋白质. 然而,如果在一个凝胶上仅有几个有意义的蛋白质,或者如果其他技术无法测定而克隆其基因是必需的,则需要进行泛化的Edman降解测序.

近来,应用自动化的Edman降解可产生短的N-末端序列标签,这是将质谱的序列标签概念用于Edman降解,业已成为一种强有力的蛋白质鉴定. 当对Ed man的硬件进行简单改进,以迅速产生N-末端序列标签达10~20个/d,序列检签将适于在较小的蛋白质组中进行鉴定.若联合其他的蛋白质属性,如氨基酸组分分析、肽质质量、表现蛋白质分子量、等电点,可以更加可信地鉴定蛋白质. 选择BLAST程序,可与数据库相配比. 目前,采用一种Tagldent的检索程序,还可以进行种间比较鉴定,又提高了其在蛋白质组研究中的作用.

(3) 与质谱(mass spectrometry)相关的技术. 质谱已成为连接蛋白质与基因的重要技术,开启了大规模自动化的蛋白质鉴定之门. 用来分析蛋白质或多肽的质谱有两个主要的部分,1)样品入机的离子源,2)测量被介入离子的分子量的装置.首先是基质辅助激光解吸附电离飞行时间质谱(MALDI-TOF)为一脉冲式的离

子化技术. 它从固相标本中产生离子,并在飞行管中测其分子量. 其次是电喷雾质谱(ESI-MS),是一连续离子化的方法,从液相中产生离子,联合四极质谱或在飞行时间检测器中测其分子量. 近年来,质谱的装置和技术有了长足的进展. 在MALDI-TOF中,最重要的进步是离子反射器(ion reflectron)和延迟提取(delayed ion extraction),可达相当精确的分子量. 在ESI-MS中,纳米级电雾源(nano-ele ctrospray source)的出现使得微升级的样品在30~40 min内分析成为可能. 将反相液相色谱和串联质谱(tandem MS)联用,可在数十个picomole的水平检测;若利用毛细管色谱与串联质谱联用,则可在低picomole到高femtomole水平检测;当利用毛细管电泳与串联质谱连用时,可在小于femtomole的水平检测[25]. 甚至可在attomole水平进行. 目前多为酶解、液相色谱分离、串联质谱及计算机算法的联合应用鉴定蛋白质. 下面以肽质指纹术和肽片段的测序来说明怎样通

过质谱来鉴定蛋白质.

1)肽质指纹术(peptide mass fingerprint, PMF)是由Henzel等人于1993年提出.用酶(最常用的是胰酶)对由2-DE分离的蛋白在胶上或在膜上于精氨酸或赖氨酸的C-末端处进行断裂,断裂所产生的精确的分子量通过质谱来测量(MALDI-TO F-MS,或为ESI-MS),这一技术能够完成的肽质量可精确到0.1个分子量单位. 所有的肽质量最后与数据库中理论肽质量相配比(理论肽是由实验所用的酶来

“断裂”蛋白所产生的). 配比的结果是按照数据库中肽片段与未知蛋白共有的肽

片段数目作一排行榜,“冠军”肽片段可能代表一个未知蛋白.若冠亚军之间的肽片段存在较大差异,且这个蛋白可与实验所示的肽片段覆盖良好,则说明正确鉴定的可能性较大.

2)肽片段(peptide fragment)的部分测序. 肽质指纹术对其自身而言,不能揭示所衍生的肽片段或蛋白质. 为进一步鉴定蛋白质,出现了一系列的质谱方法用来描述肽片段. 用酶或化学方法从N-或C-末端按顺序除去氨基酸,形成梯形肽片段(ladder peptide). 首先以一种可控制的化学模式从N-末端降解,可产生大小不同的一系列的梯形肽片段,所得一定数目的肽质量由MALDI-TOF-MS测量. 另一种方法涉及羧基肽酶的应用,从C-末端除去不同数目的氨基酸形成肽片段.

化学法和酶法可产生相对较长的序列,其分子量精确至以区别赖氨酸(128.09)和谷氨酰胺(128.06). 或者,在质谱仪内应用源后衰变(post-source decay, PSD)和碰撞诱导解离(collision-induced dissociation, CID),目的是产生包含有仅异于一个氨基酸残基质量的一系列肽峰的质谱. 因此,允许推断肽片段序列. 肽片段PSD 的分析在MALDI反应器上能产生部分序列信息. 首先进行肽质指纹鉴定. 之后,一个有意义的肽片段在质谱仪被选作“母离子”,在飞行至离子反应器的过程中降解为“子离子”. 在反应器中,用逐渐降低的电压可测量至检测器的不同大小的片段. 但经常产生不完全的片段. 现在用肽片段来测序的方法始于70年代末的CI D,可以一个三联四极质谱ESI-MS或MALDI-TOF-MS联合碰撞器内来完成.

在ESI-MS中,由电雾源产生的肽离子在质谱仪的第一个四极质谱中测量,有意义的肽片段被送至第二个四极质谱中,惰性气体轰击使其成为碎片,所得产物在第三个四极质谱中测量. 与MALDI-PSD相比,CID稳定、强健、普遍,肽离子片段基本沿着酰胺键的主架被轰击产生梯形序列. 连续的片段间差异决定此序

列在那一点的氨基酸的质量. 由此,序列可被推测. 由CID图谱还可获得的几个序列的残基,叫做“肽序列标签”. 这样,联合肽片段母离子的分子量和肽片段距N-、端的距离将足以鉴定一个蛋白质.

(4) 氨基酸组分分析. 1977年首次作为鉴定蛋白质的一种工具,是一种独特的“脚印”技术. 利用蛋白质异质性的氨基酸组分特征,成为一种独立于序列的属性,不同于肽质量或序列标签. Latter首次表明氨基酸组分的数据能用于从2-DE 凝胶上鉴定蛋白质. 通过放射标记的氨基酸来测定蛋白质的组分,或者将蛋白质印迹到PVDF膜上,在155℃进行酸性水解1 h,通过这一简单步骤的氨基酸的提取,每一样品的氨基酸在40min内自动衍生并由色谱分离,常规分析为100

个蛋白质/周. 依据代表两组分间数目差异的分数,对数据库中的蛋白质进行排榜,“冠军”蛋白质具有与未知蛋白质最相近的组分,考虑冠亚军蛋白质分数之间的差异,仅处于冠军的蛋白质的可信度大. Internet上存在多个程序可用于氨基酸组分分析,如AACompIdent,ASA,FINDER,AAC-PI,PROP-SEARCH等,其中,在PROP-SEARCH中,组分、序列和氨基酸的位置被用来检索同源蛋白质. 但仍存在一些缺点,如由于不足的酸性水解或者部分降解会产生氨基酸的变异. 故应联合其他的蛋白质属性进行鉴定.

<3>生物大分子NMR技术

与X一光衍射不同,可在溶液中测定大分子三维结构的高场NMR仪,不要求提供晶体样品,仅需将很小体积高浓度蛋白溶液放置于强磁场中。因此,该技术已成为结构蛋白质组学研究的关键性技术。NMR法也可用于测定溶液中接近于生理状态的蛋白质构象,如有人用”C,-5N,2H标记NMR,研究小于40kD的蛋白质小分子,蛋白质作用的动力学过程,以及与蛋白质活性功能紧密相关的可变尾部构蒙。NMR法虽对样品无破坏作用,然而仍有一些/1 足之处,如实验时间长,蛋白质标记过程复杂,无法鉴定较大蛋白质结构。

四.研究新前沿―――定量蛋白质组学[5]

定量蛋白质组学(quantitmlive proteomics),即对蛋白质的差异表达进行准确的定量分析。这一概念的提出,标志着蛋白质组技术的不断改进和完善,蛋白质组学研究已从对蛋白质简单的定性向精确的定量方向发展。定量蛋白质组学已逐渐成为了蛋白质组研究的新前沿。随着2DE—MS途径自动化的不断完善,新的研究方案也不断提出,如多维LC-MS/MS途径在对细胞的蛋白质组进行研究同时,对功能蛋白质组研究显得更为重要。因为体内发挥重要调节功能的往往是一一些低丰度的蛋白质,如何检测这些蛋白质,并对其准确定量,已成为定量蛋白质组学研究中必须解决的一大难题,也将成为今后蛋白质组技术方法学上研究重点之一。通过放射性同位素或 N代谢标记蛋白,而后经2DE—MS途径,可以大范围地对蛋白质表达定量分析。但由于2DE本身的局限性(一般说来,分析型2DE的上样量至多达到nag级),使得想通过这一途径来分析定量低丰度蛋白质变得十分困难。相比而言,ICAT战略从理论上不受上样量的限制因此,ICAT方法对低丰度的蛋白质(密码子偏依值小于0.1)也能准确的鉴别与定量,这就为蛋白质组学的进一步的发展提供了广阔的空间。

五.数据库介绍[6]

随x晶体衍射分子结构测定技术的发展,蛋白质组数据库日益丰富完善起来。林木类第一个公开的数据库——海生松数据库以及拟南芥质膜蛋白质组数据库的公布,为植物蛋白组学的研究提供了丰富的信息和数据。

PDB蛋白数据库(Protein Data Bank,http://WWW.rcsb.org/pdb/)是国际上惟一的生物大分子结构数据档案库,由美国纽约Brookhaven国家实验室于1971年创建。PDB收集了很多X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。20世纪90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能,数据库的数据量呈直线上升。目前,PDB数据库中已经存放了22 611套原子坐标,其中大部分为蛋白质。

Scop(Structural Classification of Proteins,http://scop.mrcimb.cam.a c.uk/scop/)蛋白质结构分类数据库由英国医学研究委员会(MRC)分子生物学实验室和蛋白质工程中心开发,拥有蛋白质结构数据库分类、检索和分析系统,依据三维折叠模式和进化关系划分已知结构的蛋白质。另一个著名的蛋白质分类数据库CATH(http:,/www.biochem.uc1.ac.uk/bsm/cath_ new/inde

x.html/),其名称是由类型(c l ass)、构架(architecture)、拓扑结构(topology)

和同源性(homology)的第一个字母缩写而来的,它由英国伦敦大学开发和维护。

由欧洲分子生物学实验室提供的PHD的web服务(http://www.embl—heidelberg.de/predictprotein/predictprotein.htm1),可对蛋白质序列和结构进行分析,当用户在此网页上提交序列后,可以获得此蛋白序列的许多相关信息,如功能位点、结构域、基序、主要的二级结构、二硫键等。

SW ISS一3DIM AGEfDatabase of annotated 3D images,http://expas y.hcuge.ch/pub/graphics/)是注释的蛋白质三维图像数据库,由欧洲分子生物学实验室提供的对蛋白质序列和结构进行分析的Web服务,(http://ww w.embl—heidelberg.de/predictprotein/predictprotein.htm1)在此网页上提交序列后,可以获得与此序列相关的许多蛋白二级结构信息,如结构域、基序、功能位点等。通过瑞士生物信息学研究所网址(http://www.expasy.org/swi ssmod/SWlSS—MODEL.htm1)可根据提交的蛋白质序列搜索同源性较高的已知结构的蛋白,模拟构建蛋白质的三维结构。但当搜索不到同源性高的序列时就无法预测结构。

SWISS—PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS—PROT中尽可能减少了冗余序列,并与其他3O多个数据库建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS—PROT和其他EBI的数据库。SWISS—PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。SWISS—PROT的网址是:http://www.ebi.a c.uk/swissprot/。

PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中t~,(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶一底物相互作用、活化和调控级联与具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FA STA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。PIR和PSD的网址是:http://pir.georgetown.edu/。

PROSITE数据库收集了有显著生物学意义的蛋白质位点和序列模式,并能据此快速、可靠地鉴别未知功能序列所属的蛋白质家族。在有的情况下,某个蛋

白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE搜索找到隐含功能的基序。PR OSITE涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、与小分子或其他蛋白质结合的结构域等;此外,PROSITE还包括由多序列比对构建的分布图(profile),能更敏感地发现序列与分布图的相似性。PROSITE 主页上(http://www.expasy.ch/prosite)提供各种相关检索服务。

由美国橡树岭国家重点实验室徐鹰教授等开发的PROSPECT软件则用提交序列和数据库中的模板结构进行联配,并根据最佳联配,构建出蛋白质三维结构。

参考文献

[1]李林,吴家睿,李伯良.蛋白质组学的产生及其重要意义.生命科学.1999.vol 11.第二期

[2]曾嵘,夏其昌.蛋白质组学研究进展与趋势. 中国科学院院刊.2002.第3期

[3]纪建国,茹炳根. 蛋白质组学研究相关技术及其在生物医学研究中的应用. 药物生物技术.2002.vol9

[4]张效云,董明纲,闫智宏. 功能蛋白质组学研究. 医学综述.2OO2年.vol8.第l2期

[5]袁泉,赵辅昆. 蛋白质组研究新前沿:定量蛋白质组学.生物化学与生物物理学报.2001.vol33.第五期

[6]季芝娟,薛庆中. 植物蛋白质组学研究进展. 生命科学.2004.vol16.第4期

[7] https://www.360docs.net/doc/ac9299567.html,/e/search/result/?searchid=140

蛋白质组学的应用研究进展

蛋白质组学的应用研究进展 蛋白质组学的应用研究进展 尹稳1 伏旭2 李平1 (1. 兰州大学第二医院,兰州 730030 ;2. 兰州大学第二医院急救中心,兰州730030) 摘要:蛋白质组学(Proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织或体液中的所有蛋白质组成 及其功能的新兴学科。虽然基因决定蛋白质的水平,但是基因表达的水平并不能代表细胞内活性蛋白的水平,蛋白质组学分析是对蛋白质翻译和修饰水平等研究的一种补充,是全面了解基因组表达的一种必不可少的手段。蛋白质组学相关技术的发展极大地推动了蛋白质组学的研究进展,使其在各研究领域得到了广泛的应用。对蛋白质组学相关技术及其在各领域的应用进行了综述,最后对蛋白质组学的发展趋势和应用前景作出展望。 关键词:蛋白质组学双向凝胶电泳 质谱 生物信息学 应用现状 Application Research Progress of Proteomics (1. Lanzhou University Second Hospital,Lanzhou 730030 ;2. Department of Emergency,Lanzhou University Second Hospital,Lanzhou 730030) Abstract: Proteomics is an emerging discipline for studying proteins composition and function in a type of cell, tissue or body fluids in a large-scale, high-throughput and systematic level. While genes determine the level of protein, but the level of gene expression can not represent the intracellular reactive protein levels. Proteomic analysis is a complement to the study of translation and modification and also an indispensable tool for a comprehensive understanding of genome expression. The development of proteomic technologies has greatly promoted the progress of proteomic research, and it has been widely used in various research fields.This paper revieweded the proteomic technologies and the applications in various fields are also briefly reviewed. Finally, some future issues are presented.

蛋白质组学研究方法选择及比较

蛋白质组学研究方法选择及比较 目前研究蛋白组学的主要方法有蛋白质芯片及质谱法,本文将从多方面对两种研究方法进行了解与比较; 蛋白质芯片(Protein Array) 将大量不同的蛋白质有序地排列、固定于固相载体表面,形成微阵列。利用蛋白质分子间特异性结合的原理,实现对生物蛋白质分子精准、快速、高通量的检测。 主要类型: ●夹心法芯片(Sandwich-based Array) ●标记法芯片(Label-based Array) ●定量芯片(Quantitative Array) ●半定量芯片(Semi-Quantitative Array) 质谱(Mass Spectrometry) 用电场和磁场将运动的离子按它们的质荷比分离后进行检测,测出离子准确质量并确定离子的化合物组成,即通过对样品离子质荷比的分析而实现对样品进行定性和定量的一种方法。 主要类型:

●二维电泳+质谱(2D/Mass Spectrometry, MS) ●表面增强激光解吸电离飞行时间质谱(Surface-enhanced laser desorption/ionization- time of flight, SELDI) ●同位素标记相对和绝对定量(Isobaric tags for relative and absolute quantitation, iTRAQ) Protein Array or Mass Spectrometry? 如何选择合适的研究方法?以下将从六个方面进行比较与推荐: 1.筛查蛋白组学表达差异 建议选择:RayBiotech(1000个因子的芯片)+质谱 a)不同的方法学有不同的特点:对于质谱,可以筛查到未知的蛋白,但是对于分子量大、 低丰度的蛋白质,质谱的灵敏度和准确性有一定的限制。 b)不同的方法能筛查到的目标不同:根据Proteome Analysis of Human Aqueous Humor 一文中报道,质谱筛查到的差异蛋白集中在小分子与代谢物。而用RayBiotech芯片筛查到的结果,多是集中在细胞因子、趋化、血管、生长等等。 c)质谱筛查到355个蛋白,而RayBiotech抗体芯片也筛查到328个蛋白,且用定量芯片 验证25个蛋白有差异,这些蛋白是质谱找不到的。目前RayBiotech夹心法抗体芯片已经可以检测到1000个蛋白,采用双抗夹心法,尤其是对于低丰度蛋白,有很好的灵敏度和特异性,很多的低丰度蛋白是抗体芯片可以检测出来,而质谱检测不到的,且样品不经过变性和前处理,保持天然状态的样品直接检测,对于蛋白的检测准确度高。 d)质谱的重复性一直是质谱工作者纠结的问题,不同操作者的结果,不同样品处理条件, 峰值的偏移等影响因素都会产生大的影响;RayBiotech的夹心法芯片重复性高。

蛋白质组学的应用研究进展_尹稳

?综述与专论? 2014年第1期 生物技术通报 BIOTECHNOLOGY BULLETIN 随着基因组计划的完成,生命科学研究开始进入以基因组学、蛋白质组学、营养组学、代谢组学等“组学”为研究标志的后基因组时代。蛋白质组(proteome)一词最早是由澳大利亚科学家Wilkins 和Williams 于1994年提出[1],1995年7月最早见诸于Electrophoresis 杂志[2],意指一个细胞或组织中由基因组表达的全部蛋白质。蛋白质组学(proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织、体液中的所有蛋白质组成、功能及其蛋白之间的相互作用的学科。 虽然基因决定蛋白质的水平,mRNA 只包含了转录水平的调控,其表达水平并不能代表细胞内活 收稿日期:2013-09-05基金项目:甘肃省科技计划基金资助项目(0708NKCA129),兰州大学第二医院医学研究基金项目(YJ2010-08)作者简介:尹稳,女,硕士,研究方向:蛋白质组学;E -mail :yinwen0508@https://www.360docs.net/doc/ac9299567.html, 通讯作者:伏旭,男,硕士,研究方向:生物化学与分子生物学;E -mail :fuxu0910@https://www.360docs.net/doc/ac9299567.html, 蛋白质组学的应用研究进展 尹稳1 伏旭2 李平1 (1.兰州大学第二医院,兰州 730030;2.兰州大学第二医院急救中心,兰州 730030) 摘 要: 蛋白质组学(Proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织或体液中的所有蛋白质组成及其功能的新兴学科。虽然基因决定蛋白质的水平,但是基因表达的水平并不能代表细胞内活性蛋白的水平,蛋白质组学分析是对蛋白质翻译和修饰水平等研究的一种补充,是全面了解基因组表达的一种必不可少的手段。蛋白质组学相关技术的发展极大地推动了蛋白质组学的研究进展,使其在各研究领域得到了广泛的应用。对蛋白质组学相关技术及其在各领域的应用进行了综述,最后对蛋白质组学的发展趋势和应用前景作出展望。 关键词: 蛋白质组学 双向凝胶电泳 质谱 生物信息学 应用现状 Application Research Progress of Proteomics Yin Wen 1 Fu Xu 2 Li Ping 1 (1. Lanzhou University Second Hospital ,Lanzhou 730030;2. Department of Emergency ,Lanzhou University Second Hospital ,Lanzhou 730030) Abstract: Proteomics is an emerging discipline for studying proteins composition and function in a type of cell, tissue or body fluids in a large -scale, high -throughput and systematic level. While genes determine the level of protein, but the level of gene expression can not represent the intracellular reactive protein levels. Proteomic analysis is a complement to the study of translation and modification and also an indispensable tool for a comprehensive understanding of genome expression. The development of proteomic technologies has greatly promoted the progress of proteomic research, and it has been widely used in various research fields.This paper revieweded the proteomic technologies and the applications in various fields are also briefly reviewed. Finally, some future issues are presented. Key words: Proteomics Two -dimensional gel electrophoresis Mass spectrometry Bio -informactics Application status 性蛋白的水平[3],且转录水平的分析不能反应翻译后对蛋白质的功能和活性起至关重要作用的蛋白修饰过程[4],如酰基化、泛素化、磷酸化或糖基化等。而蛋白质组学除了能够提供定量的数据以外,还能提供包括蛋白定位和修饰的定性信息。只有通过对生命过程中蛋白质功能和蛋白质之间的相互作用以及特殊条件下的变化机制进行研究,才能对生命的复杂活动具有深入而又全面的认识。近年来,蛋白质组学技术取得了长足的发展,随着新技术的不断涌现,其应用范围也不断扩大。本文对蛋白质组学相关技术及其在各研究领域的应用进行了简要的归纳和评述,并对蛋白质组学的发展趋势和应用前景

蛋白质组学研究的完整解决方案

蛋白质组学研究的完整解决方案 人体内真正发挥作用的是蛋白质,蛋白质扮演着构筑生命大厦的“砖块”角色,随着破译生命密码的人类基因组计划进入尾声,一个以蛋白质和药物基因学为研究重点的后基因组时代已经拉开序幕,蛋白质将是今后的重点研究方向之一。然而,蛋白质的分离和鉴定非常费时,目前测定蛋白质的技术远远落后于破译基因组的工具,最好的实验室每天只能分离和识别出100种蛋白质。据估计,人体内可能有几十万种蛋白质,这大概需要10年时间进行识别。 为了加快蛋白质组学研究进程,以专业生产蛋白质组学研究设备而著称的美国Genomic Solution Inc.公司开发了完整的蛋白质组学解决方案,由一系列机械手臂与软件,并结合了二维电泳实验设备与质谱仪,可以进行高效、自动化且具重复性的试验分析。在Genomic solution值得信赖的技术平台上,你的研究工作将更富成效,重复性更好。在这一整套Investigator平台上,各仪器之间配合无隙,由于它的整合性及标准性,使得研究进程大大加快,原来需要9—12个月才能获得数据结果发表的时间减少到9—12周。这套完整的系统具备蛋白质组研究所需的众多功能:2-D电泳、图像获取、2-D胶分析、蛋白样品切割、蛋白消化、MALDI样品准备、消化及点样、数据分析整合,再加上制备好的胶、试剂及附件,使研究工作可以立即展开。此套设备为进行蛋白质组学研究的利器,大大加速了蛋白质分离和鉴定的速度。该系统主要由以下几部分组成: 一、2-D电泳系统(Investigator? 2-D Electophoresis System) 该系统主要进行2D PAGE第一向等电聚焦凝胶电泳和第二向SDS-PAGE电泳,设备包括2-D电泳系统所需的各种设备,如pHaser?(IPG胶条电泳)、管状制胶设备、二维电泳装置、电源设备、半导体冷却器及各种相关的蛋白纯化试剂盒。 产品特征: * 提供2D PAGE电泳所需的各种设备,使电泳更加简便,大大节约研究时间 * 高分辨率:有效的第一向等电聚焦凝胶电泳和23cm X 23cm第二向SDS-PAGE大面积板胶提供清晰的电泳图像,有效提高单体、磷酸化和糖基化蛋白的分离 * 大容量:可同时容纳15块1mm一维管状胶,或8块2-3mm管状胶;10块IPG胶条和10块二维电泳板胶 * 灵活性:该系统用于管状胶、IPG 胶条、预制胶、自制胶和SDS PAGE胶使用 * 恒温:高效的半导体制冷装置保证电泳体系温度恒定,温度变化< 0.5℃ * 专门为高分辨率2D PAGE而设计的电源系统 * 提供超纯的相关化学试剂和药品

比较蛋白质组学研究中的稳定同位素标记技术

进展评述 比较蛋白质组学研究中的稳定同位素标记技术 刘新1,2 应万涛1,2 钱小红1,23 (1军事医学科学院放射与辐射医学研究所 北京 100850;2北京蛋白质组研究中心 北京 102206) 摘 要 比较蛋白质组学是指在蛋白质组学水平上研究正常和病理情况下细胞或组织中蛋白质表达变化,以期发现具有重要功能的生物标识物,为疾病的早期诊断提供依据。近年来它正成为蛋白质组学研究的热点和发展趋势。比较蛋白质组学的研究方法和策略有多种,本文就最近几年来稳定同位素标记技术(体内代谢标记技术和体外化学标记技术)在比较蛋白质组学研究中的进展进行综述。 关键词 比较蛋白质组学 稳定同位素标记 体内代谢标记 体外化学标记 Application of Stable Isotope Labeling in Comparative Proteomics Liu X in1,2,Y ing Wantao1,2,Qian X iaohong1,23 (1Beijing Institute of Radiation Medicine,Beijing100850; 2Beijing Proteome Research Center,Beijing102206) Abstract C omparative proteomics is the research of protein expression changing between normal and pathological cell or tissue on the proteome level.P otential biomarkers w ould be discovered from the research by comparative proteomics, which will be helpful to the diagnosis and therapy of diseases.In the recent years,it has been becoming the hot spot of the proteomics research and many strategies used in comparative proteomics have been developed.During those approaches,the strategies based on stable is otopic labeling coupled with mass spectrometry have been extensively used and lots of success ful applications have been reported.In contrast to the traditional radioactive is otope labeling method,stable is otope labeling technique was not radioactive and the operation is simple.Metabolic labeling in viv o and chemical labeling in vitro are tw o parts of stable is otope labeling technique,which both have various advantages and disadvantages.This paper reviewed the progress of stable is otope labeling technique in comparative proteomics. K ey w ords C omparative proteomics,S table is otope labeling,Metabolic labeling in viv o,Chemical labeling in vitro 随着人类基因组精确图谱的公布,基因组功能的阐明已经成为生命科学研究中一项极重要的任务[1]。蛋白质是基因的最终产物同时也是基因功能的最终执行体,因而人类基因的表达及其功能有待于在蛋白水平上揭示。蛋白质组学的研究目的是分离和鉴定组织或细胞中的所有蛋白质。生物体在生长发育过程中,基因组是相对稳定的,而蛋白表达是高度动态变化的,并且具有严格调控的时间和空间特异性[2]。为了研究生物体在不同状态下表达的所有蛋白质的动态变化,比较蛋白质组学应运而生,即在蛋白组学水平上,研究在正常生理和病理状态,或受到不同的外部环境刺激下,或在突变等因素影响下,蛋白质表达的变化情况,以期发现生物体内关键的调控分子及与疾病相关的蛋白质标志物,最终为疾病的防诊治、新型疫苗的研发等提供理论依据。 为了研究蛋白质表达的动态变化,基因表达检测技术,如微阵列法[3]、DNA(脱氧核糖核酸)芯片法[4]等曾被广泛使用。这些方法虽然能够实现对mRNA(信使核糖核酸)进行定性和定量分析,但 刘新 男,27岁,博士生,现从事比较蛋白质组学研究。 3联系人,E2mail:qianxh1@https://www.360docs.net/doc/ac9299567.html, 国家自然科学基金(20505019、20505018)、国家重点基础研究发展规划项目(2004C B518707)和北京市科技计划重大项目(H030230280190)资助项目 2006207220收稿,2006209221接受

蛋白质组学的研究进展及应用

《蛋白质工程》 (课程论文)题目名称:蛋白质组学技术的研究进展及应用 所在学院:生命科学与技术学院 专业(班级):生技131班 学生姓名:梁健 授课教师:韩晓菲

蛋白质组学技术的研究进展及应用 生技131班梁健13772025 摘要:随着人类基因组计划全部测序的初步完成,研究重点转到对基因功能的研究上。蛋白质作为基因功能的主要体现者,对其表达模式和功能的研究成为热点,出现了蛋白质组学。研究蛋白质组学有助于了解蛋白的结构、细胞的功能、生命的本质及活动规律,为疾病的诊断、治疗、疫苗及新药开发提供科学依据。关键词:蛋白质组学;进展;应用 蛋白质组学(proteomics)是产生于20世纪90年代中期的一门新兴学科,以 细胞内全部蛋白质的存在及其活动方式为研究对象,是后基因组时代生命科学研究的核心内容。蛋白质组学的产生与发展经历了一个漫长的过程,在这个过程中,研究者不断修正蛋白质组学的发展方向和推进蛋白质组学相关支撑技术的快速 发展,进而拓展蛋白质组学在整个生命科学和生物医学研究中的应用,成为后基因组时代重要的研究新领域,并成功地应用到基础研究及医学研究等各个领域,推进其迅速发展。 1 蛋白质组学的概念及研究内容 1.1蛋白质组学的概念 蛋白质组(proteome)源于protein和genome两词的杂合,最早是由澳大利亚 的WILKINS等于1995年提出,其定义为“一种基因组所表达的全部蛋白质”。早期相对狭义的蛋白质组的概念是指在某一特定的时间和空间条件下,1个细胞的基因组所表达的蛋白质数目的总和。随着研究的深入,人们提出了广义的蛋白质组的概念,用来描述1个细胞、组织、器官或1个物种的生命个体,在其不同的生存及发育条件下所表达的各种蛋白数目的总和。所以蛋白质组所含的蛋白数目及其表达量是随着时间和空间的不同而不断发生变化的。蛋白质组学最有价值的优势是它可以观察在特定的时间下一个完整的蛋白质组或蛋白亚型在某种生理 或病理状态中,发生的相应的变化。 1.2 研究内容 根据研究内容的不同,蛋白质组学可分为差异蛋白质组学(或称表达蛋白质 组学)、结构蛋白质组学和功能蛋白质组学,其中差异蛋白质组学在蛋白质组学 研究中十分常用且应用广泛。差异蛋白质组学主要是研究比较在2种或多种不同条件下蛋白质组表达的差异变化。结构蛋白质组学主要是蛋白质表达模式的研究,包括蛋白质氨基酸序列分析及空间结构的解析。蛋白质表达模式的研究是蛋白质组学研究的基础内容,主要研究特定条件下某一细胞或组织的所有蛋白质的表征问题。功能蛋白质组学主要是蛋白质功能模式的研究,包括蛋白质的功能和蛋白

质谱技术在蛋白质组学研究中的应用_甄艳

第35卷 第1期2011年1月 南京林业大学学报(自然科学版) J o u r n a l o f N a n j i n g F o r e s t r y U n i v e r s i t y (N a t u r a l S c i e n c e E d i t i o n ) V o l .35,N o .1 J a n .,2011 h t t p ://w w w .n l d x b .c o m [d o i :10.3969/j .i s s n .1000-2006.2011.01.024]  收稿日期:2009-12-31 修回日期:2010-10-26  基金项目:国家自然科学基金项目(31000287);江苏省高校自然科学基础研究项目(10K J B 220002) 作者简介:甄艳(1976—),副教授,博士。*施季森(通信作者),教授。E -m a i l :j s h i @n j f u .e d u .c n 。  引文格式:甄艳,施季森.质谱技术在蛋白质组学研究中的应用[J ].南京林业大学学报:自然科学版,2011,35(1):103-108. 质谱技术在蛋白质组学研究中的应用 甄 艳,施季森 * (南京林业大学,林木遗传与生物技术省部共建教育部重点实验室,江苏 南京 210037) 摘要:随着蛋白质组学研究的迅速发展,质谱技术已成为应用于蛋白质组学研究中的强有力工具和核心技术。质谱技术的先进性在于为蛋白质组学研究提供的通量和分子信息。笔者重点概述了基于质谱路线的蛋白质组学研究,介绍了基于质谱的定量蛋白质组学﹑翻译后修饰蛋白质组学、定向蛋白质组学、功能蛋白质组学以及基于串联质谱技术的蛋白质组学数据解析的研究 进展。 关键词:质谱;蛋白质组学;定量蛋白质组学;翻译后修饰;定向蛋白质组学;功能蛋白质组学中图分类号:Q 81 文献标志码:A 文章编号:1000-2006(2011)01-0103-06 A p p l i c a t i o n o f m a s s s p e c t r o m e t r y i n p r o t e o m i c s s t u d i e s Z H E NY a n ,S H I J i s e n * (K e y L a b o r a t o r y o f F o r e s t G e n e t i c s a n d B i o t e c h n o l o g y M i n i s t r y o f E d u c a t i o n , N a n j i n g F o r e s t r y U n i v e r s i t y ,N a n j i n g 210037,C h i n a ) A b s t r a c t :W i t ht h e r a p i d d e v e l o p m e n t o f p r o t e o m i c s ,m a s s s p e c t r o m e t r y i s m a t u r i n g t o b e a p o w e r f u l t o o l a n dc o r e t e c h -n o l o g y f o r p r o t e o m i c s s t u d i e s d u r i n g t h e r e c e n t y e a r s .T h e s u p e r i o r i t y o f m a s s s p e c t r o m e t r y l i e s i n p r o v i d i n g t h e t h r o u g h -p u t a n d t h e m o l e c u l a r i n f o r m a t i o n ,w h i c hn o o t h e r t e c h n o l o g y c a n b e m a t c h e di np r o t e o m i c s .I nt h i s r e v i e w ,w e m a d e a g l a n c e o n t h e o u t l i n e o f m a s s s p e c t r o m e t r y -b a s e d p r o t e o m i c s .A n dt h e nw e a d d r e s s e d o n t h e a d v a n c e s o f d a t a a n a l y s i s o f m a s s s p e c t r o m e t r y -b a s e dp r o t e o m i c s ,q u a n t i t a t i v em a s ss p e c t r o m e t r y -b a s e dp r o t e o m i c s ,p o s t -t r a n s l a t i o n a l m o d i f i c a t i o n s b a s e d m a s s s p e c t r o m e t r y ,t a r g e t e d p r o t e o m i c s a n df u n c t i o n a l p r o t e o m i c s b a s e d -m a s s s p e c t r o m e t r y . K e yw o r d s :m a s ss p e c t r o m e t r y ;p r o t e o m i c s ;q u a n t i t a t i v ep r o t e o m i c s ;p o s t -t r a n s l a t i o n m o d i f i c a t i o n ;t a r g e t e d p r o -t e o m i c s ;f u n c t i o n a l p r o t e o m i c s 蛋白质组学(P r o t e o m i c s )是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的学科。目前蛋白质组学的研究主要有两条路线:一是基于双向电泳的蛋白质组学;二是基于质谱的蛋白质组学,其中基于双向电泳的蛋白质组学研究路线最终也离不开质谱技术的应用。自20世纪80年代末,两种质谱软电离方式即电喷雾电离(e l e c t r o s p r a y i o n i z a t i o n ,E S I )和基质辅助激光解析离子化(m a -t r i x a s s i s t e d l a s e r d e s o r p t i o n i o n i z a t i o n ,M A L D I )的发明和发展解决了极性大、热不稳定蛋白质和多肽分 析的离子化和分子质量大的测定问题[1] ,蛋白质组学研究中常用的质谱分析仪包括离子阱(i o n t r a p ,I T ),飞行时间(t i m e o f f l i g h t ,T O F ),串联飞行时间(T O F -T O F ),四级杆/飞行时间(q u a d r u p o l e /T O F h y b r i d s ),离子阱/轨道阱(I T /o r b i t r a ph y b r i d ) 和离子阱/傅里叶变换串联质谱分析仪(I T /F o u r i e r t r a n s f o r m i o n c y c l o t r o nr e s o n a n c em a s s s p e c t r o m e t e r s h y b r i d s ,I T /F T M S ),这些质谱仪具有不同的灵敏度、分辨率、质量精确度和产生不同质量的M S /M S 谱[2] 。质谱作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备及数据分析的信息学工具被广泛地应用。因此,有学者指出质谱技术 已在蛋白质组学研究中处于核心地位[3] 。目前在通量及所包含的分子信息内容上,基于质谱的蛋白质组学技术在细胞生物学研究中可以鉴定和量化

蛋白质组学的研究进展及应用

蛋白质组学的研究进展及应用 21世纪是生命科学的时代随着人类基因组序列的完成和生命科学进入后基因组时代,研究这些基因的表达和调控已成为首要任务。因此,蛋白质组学研究已成为21世纪生命科学的战略任务蛋白质组学是所有或部分蛋白质在生命活动过程中的功能和作用。可以说,这是现代生物学研究的一个必不可少的手段。本文分析了蛋白质组学的内涵和研究进展,并介绍了蛋白质组学的应用领域,以帮助人们更好地理解蛋白质组学的意义,促进蛋白质组学的更好发展。 关键词蛋白质组学;研究;应用文件识别码A,文件识别码R341于 ,文号XXXX,是一门以生物体的全部或部分蛋白质为研究对象,研究生物体、细胞(组织)或基因组的蛋白质变化规律的学科。蛋白质组学可以在整体水平上研究蛋白质表达和调控的水平和调控,旨在了解蛋白质与 相互作用的关系,为生命活动规律提供理论和物质基础,也为人类健康带来理论基础和解决方案 随着人类基因组序列的完成,生命科学研究的重点已经转移到基因表达产物即蛋白质的研究上。蛋白质组学已成为21世纪生命科学研究的战略任务和重点1.2蛋白质组学 的研究内容传统的蛋白质研究侧重于单个蛋白质的研究,而蛋白质组学则侧重于生物体全部或部分蛋白质的研究随着学科的逐步发展,蛋白质组学的研究内容也在不断更新和完善。蛋白质研究中的翻

译后修饰已经成为蛋白质组学研究的重要组成部分,因为翻译后修饰是蛋白质调节功能的重要途径在不同的发育阶段、生长阶段和不同的病理条件下,不同细胞类型的基因表达是不同的,因此有必要对细胞甚至亚细胞进行准确的蛋白质组学研究。最后,双向电泳被用来分离蛋白质。根据等电点和分子量的不同,用双向电泳分离不同种类的蛋白质。通过技术分离和处理的蛋白质可以在质谱系统中分析,以获得蛋白质的定性数据。1.3蛋白质组学的进展 蛋白质组学的主要任务是建立基于获取和分析蛋白质状态和规律的技术为了满足这些要求,需要高吞吐量技术。在研究技术方面,目前我国已经出现了高灵敏度、高效率的蛋白质分离和鉴定方法,如二维色谱-串联质谱 谱(2D-高效液相色谱/质谱-质谱)、电离飞行时间质谱 (MALDI-TOF/质谱)等。,获得了国际认可,具有一定的优势。其中,飞行时间电离质谱(MALDI-TOF/MS)是近年来广泛应用的软电离质谱,具有高准确度、高分辨率和低成本的特点。因此,蛋白质组学的发展离不开研究技术和方法的不断改进。 目前,中国已先后建立了一批蛋白质组学研究中心或实验室,如复旦大学蛋白质组学研究中心和中国科学院蛋白质组学重点实验室,为中国蛋白质组学研究提供了更加专业、便捷的技术服务平台。1.4蛋白质组学研究的意义 蛋白是生理功能的执行者和生命现象的直接体现。对蛋白质结构和功能的研究将直接阐明生理或病理条件下生命的变化机制。蛋白质

蛋白质组学研究进展与趋势综述

蛋白质组学研究进展与趋势 蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。1 994 年澳大利亚Macquaie 大学的Wilkins 和Williams 等在意大利的一次科学会议上首次提出了蛋白质组(Proteome)这个概念。2001 年的Science 杂志已把蛋白质组学列为六大研究热点之一,其“热度”仅次于干细胞研究,名列第二。蛋白质组学的受关注程度如今已令人刮目相看。本文就蛋白质组学研究相关技术与趋势等方面进行简要综述。 1.蛋白质组学研究的研究意义和背景 随着人类基因组计划的实施和推进,生命科学研究已进入了后基因组时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组中所采用的策略,如基因芯片、基因表达序列分析(Serial analysisof gene expression, SAGE)等,都是从细胞中mRNA 的角度来考虑的,其前提是细胞中mRNA 的水平反映了蛋白质表达的水平。但事实并不完全如此,从DNA mRNA 蛋白质,存在三个层次的调控,即转录水平调控(Transcriptional control ),翻译水平调控(Translational control),翻译后水平调控(Posttranslationalcontrol )。从mRNA 角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA 丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。更重要的是,蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等则几乎无法从mRNA 水平来判断。毋庸置疑,蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制。蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。虽然蛋白质的可变性和多样性等特殊性质导致了蛋白质研究技术远远比核酸技术要复杂和困难得多,但正是这些特性参与和影响着整个生命过程。 传统的对单个蛋白质进行研究的方式已无法满足后基因组时代的要求。这是因为:(1)生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。(2) 多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。(3) 在执行生理功能时蛋白质的表现是多样的、动态的,并不象基因组那样基本固定不变。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。因此在上世纪90 年代中期,国际上产生了一门新兴学科-蛋白质组学(Proteomics),它是以细胞内全部蛋白质的存在及其活动方式为研究对象。可以说蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是后基因组时代生命科学研究的核心内容之一。 虽然第一次提出蛋白质组概念是在1994 年,但相关研究可以追溯到上世纪90 年代中期甚至更早,尤其是80 年代初,在基因组计划提出之前,就有人提出过类似的蛋白质组计划,当时称为Human Protein Index 计划,旨在分析细胞内的所有蛋白质。但由于种种原因,这一计划被搁浅。90 年代初期,各种技术已比较成熟,在这样的背景下,经过各国科学家的讨论,才提出蛋白质组这一

蛋白质组学研究的基本步骤

请简述蛋白质组学研究的基本步骤 1.蛋白质样品的制备:蛋白质样品的制备是蛋白质组学研究的首要环节,也是最为重要的部分。蛋白质样品的质量直接影响到科学研究的真实性和可信度。 2.蛋白质的分离:双向凝胶电泳技术是目前最基础和常用的蛋白质分离方法,它能将数千种蛋白质同时分离与展示的分离技术。双向电泳分为等电聚焦电泳和SDS-PAGE两个步骤,即先进行等电聚焦电泳,按照pI的不同将蛋白分离,然后再进行SDS-PAGE按照分子量的大小不同对蛋白进行分离。IPG胶条的应用,大大提高了双向电泳的重复性。 3. 蛋白质双向电泳凝胶的染色。目前双向电泳凝胶的染色的方法有3种,分别为考马斯亮蓝染色法、银染法和荧光染色法。考马斯亮蓝染色法,操作简便,无毒性,染色后的背景及对比度良好,与下游的蛋白质鉴定方法兼容,但灵敏度较低,可以检测到30~100 ng蛋白质。银染法是一种较为流行的染色方法,银染成本较低,灵敏度高,可检测少到2~5ng的蛋白。荧光试剂显色对蛋白质无固定作用,与质谱兼容性好,而其灵敏度与银染相仿,但线性范围要远高于银染,这使二维电泳分离蛋白质的荧光检测受到普遍关注和应用。 4.双向电泳凝胶图像的采集与分析:图像采集系统通过投射扫描根据吸光度的大小获碍蛋白质点的光密度信息。一般来说,该光密度值与蛋白质点的表达丰度成正比,以便于软件分析时的定量比较。完成图像采集后采用ImageMaster等图像分析软件进行分析。分析步骤:蛋白质点检测、背景消减、归一化处理、蛋白质点匹配。 5.蛋白质鉴定:蛋白质鉴定是蛋白质组学研究中的核心内容。目前蛋白质鉴定技术主要有Edman 降解法测序、质谱。质谱是目前最常用的蛋白质鉴定方法。质谱技术的基本原理是带电粒子在磁场或电场中运动的轨迹和速度依粒子的质量与携带电荷之比质荷比( m/z) 的不同而变化,可以据此来判断粒子的质量和特性。质谱完成后利用蛋白质的各种属性参数如相对分子质量、等电点、序列、氨基酸组成、肽质量指纹谱等在蛋白质数据库中检索,寻找与这些参数相符的蛋白质。

蛋白质组学研究进展

基因组研究自从开展以来已经取得了举世瞩目的成就。在过去几年中, 已经陆续完成了包括大肠杆菌、酿酒酵母、拟南芥(T. Arabidopsis)等十多种结构比较简单的生物的基因组DNA的全序列分析。线虫(C.elegans)的基因组DNA测序工作已基本完成。规模更为庞大的人类基因组计划预期在本世纪初(2003~2005年)也将完成全部基因组DNA的序列分析。这些进展是非常令人振奋的。但是也随之产生了新问题。大量涌出的新基因数据迫使我们不得不考虑这些基因编码的蛋白质有什么功能这个问题。不仅如此, 蛋白质作为生物功能的主要载体,拥有自身特有的活动规律,在细胞合成蛋白质之后, 这些蛋白质往往还要经历翻译后的加工修饰、转运定位、结构变化、蛋白质与蛋白质间、蛋白质与其他生物大分子的相互作用等,也就是说, 一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。包容了数千甚至数万种蛋白质的细胞是如何运转的?或者说这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调的?这些问题远不是基因组研究所能回答得了的。因为基因组学有这样的局限性,促使人们从整体水平上探讨细胞蛋白质的组成及其活动规律。 为了充分了解和全面认识生命活动的奥秘,90年代中期,在人类基因组研究计划的基础上,萌发了一门新兴的学科¾蛋白质组学(proteomics),即从蛋白质组的水平进一步认识生命活动的机理和疾病发生的分子机制。科学家们预测,随着人类基因组全部测序工作的完成,21世纪生命科学的研究重心将从基因组学转移到蛋白质且学,生命科学领域内一个崭新的时代¾蛋白质组时代即将开始。

1994年,澳大利亚Macquarie大学的Wilkins和Williams首先提出了蛋白质组(Proteome)的概念,最早见诸于1995年7月的“Electrophoresis”杂志上, 它是指一个有机体的全部蛋白质组成及其活动方式。早期定义为:微生物基因组表达的整套蛋白质,在多细胞微生物中,整套蛋白质指一种组织或细胞表达的蛋白质,后来定义为:一个基因组所表达的蛋白质。但是,从基因表达的角度来看,蛋白质组的蛋白质数目总是少于基因组的基因数目。从蛋白质修饰的角度来看,蛋白质组的蛋白质数却多于其相应的ORF数目,因为mRNA的剪切和编辑可使一个ORF产生数种蛋白质,蛋白质翻译后的修饰,如糖基化、磷酸化同样增加蛋白质的种类,氨基酸序列一致的一级结构在一定条件下可以形成功能完全不一样的具有不同空间结构的蛋白质,如朊病毒。故"蛋白质组内蛋白质数目要多于基因组内的基因数目"。 蛋白质组研究虽然尚处于初始阶段, 但已经取得了一些重要进展。当前蛋白质组学的主要内容是, 在建立和发展蛋白质组研究的技术方法的同时, 进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面, 通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱, 相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱建立的意义在于为进一步的分析工作提供基础。蛋白质组分析的另一方面, 是比较分析在变化了的生理条件下蛋白质组所发生的变化。如蛋白质表达量的变化、翻译后修饰的变化, 或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。

蛋白质组学及其研究方法与进展

蛋白质组学及其研究方法与进展 蛋白质是生命活动的体现者,基因的表达最后是通过蛋白质来体现的,在这个过程中,蛋白质起了连接基因与表现的功能。蛋白质是有氨基酸组成的,组成蛋白质的氨基酸的种类及排列顺序构成了蛋白质的一级结构,而在一级机构基础上的多肽链本身的折叠和盘绕方式构成了蛋白质的二级结构,考虑到多肽链上原子在空间的分布,由二级结构进一步形成了蛋白质的三级结构,对于有多个亚基的蛋白质还存在四级结构。 蛋白质的一级结构决定了高级结构,而高级结构则决定着蛋白质的生物学功能。如今对于蛋白质研究已经单独形成了一个活跃的生物学分支学科―――蛋白质组学,在蛋白质的研究中发挥着很重要的作用,下面将介绍蛋白质组学的一些基本内容及研究进展。 一.产生背景[1] 在20世纪中后期随着DNA双螺旋结构的提出和蛋白质空间结构的解析,生命科学研究进入了分子生物学时代,对遗传信息载体DNA和生命功能的体现者蛋白质的研究,成为了其主要内容。90年代初期启动的庞大的人类基因组计划.在经过各国科学家多年的努力下,已经取得了巨大的成就。10多种低等模式生物的基因组序列测定L三完成;第一个多细胞生物一线虫基因组的DNA全序列测定也在1998年年底完成;人类所有基因的部分序列测定(EST)已经完成;人类基因组的全序列测定有可能提前到2003年完成。生命科学已跨入了后基因组时代。在后基因组时代,研究重心将从揭示生命的所有遗传信息转移到在整体水平上对功能的研究。这种转向的第一个标志是产生了功能基因组学这一新学科,即从基因组整体水平上对基因的活动规律进行阐述。如在mRNA 水平上,通过DNA 芯片(DNA chips)和微阵列(Microarray)法等技术检测大量基因的表达模式,并取得了很好的进展。但是,mRNA的表达水平(包括mRNA的种类和含量)由于mRNA储存和翻译调控以及翻译后加工等的存在.并不能直接反映蛋白质的表达水平}蛋白质自身特有的活动规律,如蛋白质的修饰加工、转运定位结构形成、代谢、蛋白质与蛋白质及其他生物大分子的相互作用等.均无法从在基因组水平上的研究获知。因此,对生物功能的主要体现者或执行者一蛋白质的表达模式和功能模式的研究就成为生命科学发展的必然。在此背景下.80年代中期,国际上葫发了一门研究细胞内垒部蛋白质的组成及其活动规律的新兴学科- 蛋白质组学(Proteomic)。 蛋白质组(proteome)一词是马克.威尔金斯(Marc Wilkins)最先提出来的, 最早见诸于1995年7月的“Electrophoresis”杂志上它是指一个有机体的全部蛋白质组成及其活动方式。蛋白质组研究虽然尚处于初始阶段, 但已经取得了一些重要进展。当前蛋白质组学的主要内容是, 在建立和发展蛋白质组研究的技术方法的同时, 进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面,通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱, 相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱

相关文档
最新文档