TINKER4.2_CN

TINKER4.2_CN
TINKER4.2_CN

=================

TINKER4.2手册简译

=================

** 这是对TINKER4.2手册各部分的大概内容的简单翻译;

** 不全,只翻大意;部分专有名词不翻;;

** 部分条目进行了重新排序,以方便阅读;

** 个别地方提供了译者的评论或注解(**);

** 译文中所有“当前版本”均指TINKER4.2;

----------------------------------

1. TINKER Package简介

----------------------------------

TINKER的特征

(1)从序列构建蛋白和核酸模型

(2)结构优化和能量最小化

(3)给定结构分解计算能量

(4)分子动力学和随机动力学(stochastic dynamics)

(5)模拟退火

(6)正则模式分析和振动频率计算

(7)全局优化和构象搜索

(8)搜索过渡态和变形路径

(9)用晶体数据拟合能量参数

(10)distance geometry with pairwise metrization

(11)分子体积和表面积

(12)结构变异的自由能变(即缓慢生长法)

(13)基于potential smoothing的高级算法

TINKER强调“乐于修改”(ease of modification),即在源代码基础上自己写一些程序或做一些修改。

TINKER使用FORTRAN77。模块化。目前,新code主要在Linux下面编写运行。而且在努力把F77下写的code 转换到高版FORTRAN上来。

TINKER支持的力场类型

- AMBER94/96, CHARMM19/22/27, MM2/MM3, OPLS-UA, OPLS-AA;

- Liam Dang极化势和我们自己的AMOEBA参数;

** 5.0已经支持MMFF;

----------------------

2. 安装TINKER

----------------------

最新版TINKER5.1提供编译好的LINUX/WINDOWS/MAC可执行文件,直接去去https://www.360docs.net/doc/d611219151.html,下载。

匿名ftp: anonymous:youremail@https://www.360docs.net/doc/d611219151.html,/pu b/tinker

也提供源代码。编译方法:找到对应你的平台(OS: Linux/Win)和编译器(intel/G Fortran/G95...)的make文件,复制到源代码文件夹下,依次执行:(假设>为Linux提示符)

>./compile.make

>./li b rary.make

>./link.make

完了生成一大堆可执行的.x文件,你可以执行rename.make把它们的后缀.x全部去掉。

** 运行:直接执行对应的TINKER可执行文件。比如要做MD,准备好盒子(比如eaxample.xyz)和配置文件exam ple.key以后(这2个文件的名称需要相同),键入:

> dynamic example.xyz

即可进入TINKER的交互模拟中。交互是说TINKER会提示你输入要跑多少步,时间步长等等信息。你也可以提前把这些参数依次写到一个script里面,比如example.dat,然后直接执行:

> dynamic < example.dat > example.log

具体可参考test文件夹下的文件。

-----------------------------------

3. 输入和输出文件的类型

-----------------------------------

SAMPLE.xyz TINKER独有的xyz坐标文件(TINKER-xyz)。

** TINKER-xyz在普通的xyz文件原子名称前面添加了一列原子序号,坐标后面添加了一列数字表示原子类型(数字是你的力场文件中对该原子定义的原子类型的序号),后面还有若干列表示连通性(跟当前原子联通的原子的序号)。TINKER-xyz可以由普通的pd b文件转换而来。转换的工具可以用TUNKER的子程序pd b xyz,也可以用li nux下的b a b el这个工具(搜索"b a b el txyz")。

SAMPLE.int 内坐标文件

SAMPKE.key 定义模拟参数的文件;如果没有,则所有需要的模拟参数均按缺省参数进行

SAMPLE.dyn 包含了继续(restart)一个MD或随机MD模拟所需的坐标,加速度,盒子的尺寸形状等信息。

SAMPLE.end 假如你正在跑一个名为SAMPLE的MD模拟,想中止它,在Linux下,你可以按ctrl^C;但是TINKE R提供一个更优雅的方式,你直接创建一个SAMPLE.end的文件,TINKER看到它就会在跑完当前步以后正常结束退出。

SAMPLE.001, SAMPLE.002, ... 这叫cycle file。好几种计算都会产生这种文件。不同计算产生的cycle file内容不一样。比如,MD的cycle file就是安设定的频率进行的输出文件,tra j ectory的一个frame;振动分析中,每个cycle file包含一种振动模式。

SAMPLE.log 界面软件FFE产生的log文件

SAMPLE.arc TINKER的tra j ectory文件,TUNKER-xyz格式。 需要在key文件中指定archi v e关键词才会产生。

SAMPLE.pd b 一般的pd b文件。TINKER可将TINKER-xyz转成pd b; 有个子程序Protein可以根据氨基酸序列生成pd b。

SAMPLE.se q氨基酸序列文件,标准单字符表示,每行50个残基。 这种文件是当你用pd b xyz将pd b文件转成TI NKER-xyz的时候自动生成的,或者是用PROTEIN or NUCLEIC子程序由序列创建结构文件是自动生成的。注意,当你想将TINKER文件转成标准pd b文件是,必须有这个se q文件。

SAMPLE.frac TINKER中的单晶胞分坐标文件。其内部格式与TINKER-xyz格式相同,只不过这里的坐标是分坐标而非以Angstrom为单位。**“分坐标”是指原子在晶胞某个方向上的位置是以一个[0,1]区间的小数表示的坐标,其实际值为这个小数乘以该方向的晶胞矢量。**

SAMPLE.xmol XMakeMol支持的一种文件类型。TINKER子程序ARCHI V E可以将一系列xyz形式的cycle file转成XMakemol X YZ文件,然后能用XMakeMol动态显示。.xmol文件并不包含TUNKER原子类型信息,所以不可能再将xmol转回成TUNKER-xyz文件。

SAMPLE.car Accelerys InsightII支持的坐标文件。TINKER子程序ARCHI V E可以将一系列xyz形式的cycle file转成car文件,然后由InsightII动态显示。car文件也不能转回成TINKER-xyz文件。

DORCEFIELD.prm TINKER力场参数文件均以prm为扩展名。

------------------------

4. TINKER子程序

------------------------

ANAL YZ E 单点能和性质计算:总能,各分项能量,单个原子的能量,总的偶极距和它的各个分量,惯性矩和旋转半径,列出所用力场参数,与各种作用相关的能量。

MINIMI Z E 结构优化,或者说能量最小化。Cartesian坐标。L-BF G S最小化。改进Jorge Nocedal算法。需要输入xyz文件名,目标rms梯度(收敛标准)** rms是指前后两个构象原子坐标间的均方差root mean s q uare, 用以表示坐标的变化。当能量对坐标变化的梯度接近于0的时候,即认为达到了局部极值)】预优化的时候,建议此值取0.1~1.0 kcal/mol/A。**

D Y NAMIC 运行一个MD或随机MD(SD, stochastic dynamics). 基于v elert积分或Beeman积分(一种改进V elert 积分)。**可进行1.N V E, 2.N V T, 3.NPH, 4.NPT 四种系综模拟。必须依次输入xyz文件名,力场文件名,模拟步数(N),时间步长(fs),输出频率(ps),系综类型(1/2/3/4),其它参数(如N V T需要输入温度)**

MONTE 使用Monte Carlo进行能量最小化。Harold Scheraga课题组开发的算法。

MINIROT 类似于MINIMI Z E,也是结构优化,不使用Cartesian坐标,而仅对内坐标中的二面角(dehedral angle)优化。输出保存在内坐标int文件中,或一系列cycle文件。

MINRI G ID 类似于MINIMI Z E,但是在key文件中定义一些group保持刚性。

NEWTON 一种非常耗时但精确的能量最小化算法。需要计算梯度(一阶导)和Hessian矩阵(二阶导)。**Hessian矩阵计算极其耗时,因为要对每一个原子的每一个坐标分量进行数值差分计算**

NEWTROT 类似于NEWTON,但只对二面角变量做优化。

OPTIMI Z E William Da v idon的可选条件变量矩阵优化算法。这种算法是用一个估计的HESSIAN矩阵来加速优化。

PATH 沿某种预设的反应坐标计算一些列能量。El b er的基于拉格朗日乘因子的反应路径跟踪算法的一个变种。

PSS 分子构象的全局优化。势能平滑化和搜索算法(a potential smoothing and search algorithm)。【势能平滑化是一种分子动力学模拟的加速采样技术,用以克服不同局部能量最小点之间的能垒。怎么克服呢?人为加大能量最小点附近的能量,这样整个势能面就变的平滑,方便在整个构象空间采样。采样完成后,使用统计热力学公式重新计算各构象的分布权重】

SADDLE 分子构型分析,找鞍点的算法。**就是搜过渡态了。过渡态就是在一个方向上是最大,而其他方向都是最小的点。

SCAN 分子构型分析,找能量的全局最小点。**先找尽可能多的局部能量最小点,然后比较谁是全局最优。困难是很难翻越能垒,怎么办呢?用一个叫b asin hopping method的方法

V IBRATE 正则振动分析,计算振动频率。**找到能量最小点,要计算一下看看有没有虚频

XTALFIT 使用实验测定的晶体结构数据和热力学数据自动拟合力场参数。实验数据包括晶格能,偶极距。

XTALMIN 晶体能量最小化。可以优化晶胞参数,即改变盒子的边长和三个晶面角。

ALCHEM Y 运行自由能微扰模拟方法。**比如将溶剂水中的Cl-微扰成一个Br-离子,以计算两者溶剂化自由能的差,即看谁更容易溶解。**

ANNEAL 模拟退火。**进行常温动力学模拟的时候,由于模拟时间短的限制,往往难以跳出一个局部最小构象。

为了对不同的局部最小能量构象采样,可以对体系进行升温,升高到比如1000K跑一会儿,然后再把温度降下来,进行低温下的平衡态模拟和采样,称为模拟退火算法。一般需要反复进行多次。**

G DA 对Strau b的G aussian Density模拟退火算法的实现。

---------------------------

5. 额外的应用程序

--------------------------

RADIAL 计算径向分布函数。

DIFFUSE 计算自扩散常数。对均相液体使用爱因斯坦方程。要处理混合体系,得自己改code。

CORRELATE 从一系列TINKER cylce files中计算时间相关函数。需要用户提供函数性质,比如速度自相关函数。

SPECTRUM 从速度自相关函数计算能谱Power spectrum。

POLARI Z E 计算分子极化率。以TINKER-xyz为输入。输出包括整体极化率张量及其本征值。**极化率张量是个3* 3矩阵**

SPACEFILL 计算分子的体积和表面积。包括v dW体积,可及表面积并分解为几何组成部分。表面积可分解为每个

原子的凸起贡献。

X YZ EDIT 操作TINKER-xyz文件。功能: (1)当前原子序号整体错位;(2)删除单个原子(3)删除某个原子类型(4)删

除某个Cutoff之外的所有原子(6)用新的原子类型替代旧的原子类型(7)按原子间拒设定连通性(8)转换单位: Bohr-Angstrom(9)翻转生成镜像(10)平移质心到原点(11)平移指定原子到原点(12)平移和旋转惯性坐标系(13)Mo v e to Sp ecified Rigid Body Coordinates(14)创建和填充一个周期性盒子(15)把当前分子浸没到溶剂盒子里(16)把另外一个xyz文件附加到当前文件中

PRMEDIT 给一个力场增加原子类型以后,这个程序用来给所有的原子进行重新编号。

CR Y STAL 将晶体分坐标文件转成模拟单胞;将单胞扩展成超胞;可出力最常见的25中晶体空间群。要处理其它空间群,自己改code。

NUCLEIC 根据序列构建核酸结构和坐标文件。

PROTEIN 根据序列构建蛋白结构和坐标文件。

SUPERPOSE 计算两个分子最好的重叠方式。

DIST G EOM 在给定的距离约束和二面角约束下,产生一系列蛋白构象的子程序。使用“距离几何”方法。

INTX YZ / X YZ INT 内坐标文件int转TINKER-xyz文件。

PDBX YZ / X YZ PDB

S Y B Y LX YZ mol2文件转TINKER-xyz,不包含原子类型信息。(全是0)

ARCHI V E 把TINKER cycle文件转成一个arc文件。可转成car文件,或xmol文件。

DOCUMENT 列出TINKER源代码中的子程序(routines),模块(common b locks),合法关键词。也可以按格式列出标准的TINKER参数文件。

------------------------

6. 力场参数文件

------------------------

AMOEBA 大量离子和有机小分子的可极化力场

AMOEBAPRO 蛋白可极化力场

WATER AMOEBA的可极化水模型

AMBER94/96/98/99 蛋白和核酸全原子力场。96改变了一些二面角参数;98改变了一些糖的torsion角参数;99改变了一些b ond/angle/torsion参数;

CHARMM19蛋白的全原子力场。无核酸。

DUDEK1990年以前TINKER的一些关于蛋白的可极化力场参数

MM2/MM3/MM3PRO Allinger的MM系列力场,致力于预测准确的分子构型;

OPLSUA/OPLSAA Jorgensen老人家开发的系列参数,一直是众多力场非键参数的来源;

SMOOTH用于Potential soothing方法的OPLA_UA力场

SMOOTHAA用于Potential soothing方法的OPLA_AA力场

-----------------------

7. Key文件设置

-----------------------

key文件是模拟控制文件,包括了模拟运行所需要的全部可选参数。模拟前TINKER先找与xyz的同名key文件,找不到就找同目录下的tinker.key。都找不到也能运行,这时候全部使用缺省参数。

key文件中每行一个关键词+参数。关键词前的空格忽略。整个key文件对大小写不敏感,与顺序无关。需要多个数字做参数时,多个数字之间可以空格,逗号,或ta b隔开。

----------------------------------------------------

8. 关于一些特征和方法的说明

---------------------------------------------------

(1)文件版本号

对同一个文件操作产生的文件名会相同。比如X YZ INT将molecule.xyz转成int文件时,自动命名为molecule.int。如果此时已经有一个molecule.int,那就自动命名为molecule.int_2.以此类推。

(2)命令行操作

Unix下用-k指定key文件名称。比如:

> newton molecule -k test a a 0.01

调用newton子程序,对结构文件molecule.xyz使用test.key控制文件。

(3)原子类型Atom types和原子类别Atom classes

因为不可能对所有原子类型形成的angle, torsion等参数进行参数化,所以简单分了几种原子类别classes。原子类别下面分原子类型type。属于同一原子类别的,不太重要的,或者不敏感的,就都用同一种参数。大大减少需要参数化的原子类型数目。

(4)局部结构计算

有两种方法计算一个分子体系的一部分能量。

1. TINKER允许通过key文件将体系定义成acti v e和inacti v e两部分。在MINIMI Z E或MD中,只有acti v e原子允许移动。力场引擎计算所有至少涉及一个acti v e原子的作用项。或者说,任何相互作用,只要它的能量能被活动原子改变就会被计算。

2. 把原体系分成一系列atom groups。这些groups可有key文件定义。同一原子不得属于2个groups。然后进一步允许用户指定哪些相互作用对能量有贡献。还可以定义这些贡献对总能的权重。

(5)金属配合物和超共价化合物

当前TINKER版本只允许原子成键数目不超过4.要处理高配位化合物,就去改源代码sizes.i中的max v al的参数,然后重新编译。TINKER对金属配合物的支持正在开发中。

(6)非键作用的邻位原子搜索方法

除了标准的双循环方法,Light方法可用于加速邻位原子搜索。这个方法基于对排好序的原子列表取交叉部分。这个方法对于cutoff明显小于盒子边长一半的情况特别有效,大大加快计算。

(7)势能函数的截断

TINKER采用多项式能量切换方法(Polynomial energy switching)处理截断

(8)Ewald求和方法

对于简单的电荷-电荷势函数,可用PME方法;对于可极化原子多极作用,则提供正常的Ewald求和方法。(PME 是一种特殊的Ewald方法)对于这两种情况,都应该设置合理的Ewald coefficient和实空间截断半径。

(9)连续溶剂模型

SOL V ATE关键词提供多种连续溶剂算法。

两种简单的表面积积分方法:Eisen b erg and McLachlan的ASP方法,和Scheraga’s group的SASA方法。此2

法可用于任何标准的TINKER力场计算。

基于广义波恩公式(generalized Born formalism)的不同方法:Still's group的1990年原始的“洋葱壳层”的G B/S A方法; 1997年解析的G B/SA模型;Hawkins, Cramer and Truhlar的提出对加和去屏蔽算法; Schaefer and Ka rplus的解析的连续溶剂方法(ACE)。目前,广义波恩方法只能用于处理非极化的简单电荷间的静电作用。

对于G B/SA类型的溶剂模型的进一步评价: “洋葱壳层”模型主要是为了比较的目的而提供的。根据原始文献,它对空腔使用解析的方法计算表面积,对极化项使用数值方法。这种方法很慢,尤其是对于大的体系,并且不包

含Born半径链规则项对一阶导的贡献。所以不推荐使用。其它G B/SA方法使用近似的空腔项,而且包括对一阶导的校正,计算速度与体系尺寸的平方成比例,可用于MINIMI Z E, MD和大的体系。

此外,当前的TINKER版本不要用ACE模型。这个算法在源程序中写好了,但是参数化还没有完成。截止2000年,参数值仅适用于CHARMM19的ACE计算。

(10)可极化的多极静电作用

当前TINKER版本支持4极矩的原子多极静电作用,包括互相的,和直接的(单向的)两极极化。计算是W Smith的CCP%算法和Apple q uist-Dykstra的笛卡尔多极张量方法的组合实现。目前提供解析能量和笛卡尔梯度代码。

TINKER允许通过Thole提出的作用衰减方案计算分子内的极化。使用这个方案,必须将所有mutual-1x-scal关键词设为1.另外一个极化scaling系列关键词,direct-1x-scal和polar-1x-scal,可独立设置以启用各种不同的极化模型。要使用Apple q uist-style模型不带极化衰减,设置polar-damp为0即可。

(11)PSS, Potential Energy Smoothing平滑势能法

当前TINKER已经实现了好几种平滑势能搜索方法(PSS, Potential Smoothing and Search)。这些方法与Scher aga的Diffusion E q uation方法,Strau b的G aussian Density Annealing退火法,Shalloway的Packet Annealing

退火法,和V erschelde的有效弥散势方法(Effecti v e Diffused Potential)同属于一个家族。但是我们的算法反映了

了我们自己在这个领域的当前进展。TINKER平滑势能方法的很多方面是随机模拟退火的决定论的相似版本(the d eterministic analog of stochastic simulated annealing)。PSS算法非常强大,但是相对较新,我们课题组正在不断改进,测试和验证。此版本也包括一个SCAN子程序,实现b asin-hopping构象扫描算法,可以有效对平滑过的势能面进行扫描。

X.J. Wang, 2011.07.23 Morning

--------------------------------------------

一花一世界, 一草一天堂

相关主题
相关文档
最新文档