蛋白质Cα原子接触数的数字特征分析

龙源期刊网 https://www.360docs.net/doc/051898626.html,

蛋白质Cα原子接触数的数字特征分析

作者：范宁

来源：《数字技术与应用》2010年第04期

摘要:Cα是蛋白质分子中的重要原子,是蛋白质折叠和设计中的重要研究对象。本文根据α-氨基酸和Cα原子的理化特性,引入接触数的概念,从数字特征方面研究蛋白质中Cα原子空间拓扑结构。主要利用结构规律统计与计算机模拟手段,对1653个蛋白质PDB进行了处理分析,对

Cα原子数目所占比例、Cα原子平均接触数、接触数变化率进行了讨论。最后以1EXS为例加以说明,其中多于65%的Cα原子间距大于3个原子单位,平均接触数变化率在4-10之间波动较大,且Cα原子分布不均匀。本文是关于生物、统计学科结合的研究,在数字表征、数据挖掘层面上,分析了Cα原子,为人工组合蛋白质提供了数字支持;同时也对氨基酸理化特性指出了以Cα原子为基准的新方向。

关键词:蛋白质Cα原子平均接触数数字特征

1 引言

研究蛋白质的结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。

目前,研究蛋白质结构普遍使用的方法是实验,理论分析和计算。学者江凡[1]介绍了X射线晶体学、二维核磁共振和低温冷冻电镜等蛋白质空间结构的实验测定方法。文献[2]应用统计

分析方法,利用数据挖掘中的数据分布拟合理论对生物科学领域中的蛋白质侧链空间结构进行

统计分析。以世界上广泛使用的生物分子三维结构数据库PDB为基础,利用残基侧链碳原子间距离的统计分析方法,文献[3-4]用统计和几何方法给出了氨基酸在蛋白质空间结构中的深度计算,并利用PDB数据库得到了不同氨基酸在蛋白质中的深度倾向性因子,并得到了这些倾向性因子与氨基酸的物理、化学综合特性的相关性质。文献[5]就蛋白质结构预测的方法和应用进行

了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问题进行了讨论,指出了今后蛋白质结构预测研究重点在于优化比对算法和计分函数以及膜蛋白的结构预测。文献[6]以“相对熵”作为优化函数,仅用蛋白质主链上的两两连续的Cα原子间的距离信息以及20 种氨基酸的接触势的一个扩展形式,提出了一个有效快速的折叠预测优化算法,对几个真实蛋白质做了算法测试,预测构象相对于它们天然结构的均方根偏差为5～7a.u,本文坐标和距离所用单位皆为原子单位,且省略书写单位符号a.u。文献[6]的工作表明Cα原子在α-氨基酸中的重要作用决定着整体分子的性质与物理形态。但没有计算Cα原子的接触数及其数学特征。文献[7-9]讨论了蛋白质的结构和性质,提出进一步研究的必要性与可能性。