TINKER4.2_CN

=================

TINKER4.2手册简译

=================

** 这是对TINKER4.2手册各部分的大概内容的简单翻译；

** 不全，只翻大意；部分专有名词不翻；；

** 部分条目进行了重新排序，以方便阅读；

** 个别地方提供了译者的评论或注解(**)；

** 译文中所有“当前版本”均指TINKER4.2；

----------------------------------

1. TINKER Package简介

----------------------------------

TINKER的特征

（1）从序列构建蛋白和核酸模型

（2）结构优化和能量最小化

（3）给定结构分解计算能量

（4）分子动力学和随机动力学（stochastic dynamics）

（5）模拟退火

（6）正则模式分析和振动频率计算

（7）全局优化和构象搜索

（8）搜索过渡态和变形路径

（9）用晶体数据拟合能量参数

（10）distance geometry with pairwise metrization

（11）分子体积和表面积

（12）结构变异的自由能变（即缓慢生长法）

（13）基于potential smoothing的高级算法

TINKER强调“乐于修改”(ease of modification)，即在源代码基础上自己写一些程序或做一些修改。

TINKER使用FORTRAN77。模块化。目前，新code主要在Linux下面编写运行。而且在努力把F77下写的code 转换到高版FORTRAN上来。

TINKER支持的力场类型

- AMBER94/96, CHARMM19/22/27, MM2/MM3, OPLS-UA, OPLS-AA；

- Liam Dang极化势和我们自己的AMOEBA参数；

** 5.0已经支持MMFF;

----------------------

2. 安装TINKER

----------------------

最新版TINKER5.1提供编译好的LINUX/WINDOWS/MAC可执行文件，直接去去https://www.360docs.net/doc/d611219151.html,下载。

匿名ftp: anonymous:youremail@https://www.360docs.net/doc/d611219151.html,/pu b/tinker

也提供源代码。编译方法：找到对应你的平台(OS: Linux/Win)和编译器(intel/G Fortran/G95...)的make文件，复制到源代码文件夹下，依次执行：(假设>为Linux提示符)

>./compile.make

>./li b rary.make

>./link.make

完了生成一大堆可执行的.x文件，你可以执行rename.make把它们的后缀.x全部去掉。

** 运行：直接执行对应的TINKER可执行文件。比如要做MD，准备好盒子(比如eaxample.xyz)和配置文件exam ple.key以后（这2个文件的名称需要相同），键入：

> dynamic example.xyz

即可进入TINKER的交互模拟中。交互是说TINKER会提示你输入要跑多少步，时间步长等等信息。你也可以提前把这些参数依次写到一个script里面，比如example.dat，然后直接执行：

> dynamic < example.dat > example.log

具体可参考test文件夹下的文件。

-----------------------------------

3. 输入和输出文件的类型

-----------------------------------

SAMPLE.xyz TINKER独有的xyz坐标文件（TINKER-xyz）。

** TINKER-xyz在普通的xyz文件原子名称前面添加了一列原子序号，坐标后面添加了一列数字表示原子类型（数字是你的力场文件中对该原子定义的原子类型的序号），后面还有若干列表示连通性（跟当前原子联通的原子的序号）。TINKER-xyz可以由普通的pd b文件转换而来。转换的工具可以用TUNKER的子程序pd b xyz，也可以用li nux下的b a b el这个工具（搜索"b a b el txyz"）。

SAMPLE.int 内坐标文件

SAMPKE.key 定义模拟参数的文件；如果没有，则所有需要的模拟参数均按缺省参数进行

SAMPLE.dyn 包含了继续(restart)一个MD或随机MD模拟所需的坐标，加速度，盒子的尺寸形状等信息。

SAMPLE.end 假如你正在跑一个名为SAMPLE的MD模拟，想中止它，在Linux下，你可以按ctrl^C；但是TINKE R提供一个更优雅的方式，你直接创建一个SAMPLE.end的文件，TINKER看到它就会在跑完当前步以后正常结束退出。

SAMPLE.001, SAMPLE.002, ... 这叫cycle file。好几种计算都会产生这种文件。不同计算产生的cycle file内容不一样。比如，MD的cycle file就是安设定的频率进行的输出文件，tra j ectory的一个frame；振动分析中，每个cycle file包含一种振动模式。

SAMPLE.log 界面软件FFE产生的log文件

SAMPLE.arc TINKER的tra j ectory文件，TUNKER-xyz格式。需要在key文件中指定archi v e关键词才会产生。

SAMPLE.pd b 一般的pd b文件。TINKER可将TINKER-xyz转成pd b; 有个子程序Protein可以根据氨基酸序列生成pd b。

SAMPLE.se q氨基酸序列文件，标准单字符表示，每行50个残基。这种文件是当你用pd b xyz将pd b文件转成TI NKER-xyz的时候自动生成的，或者是用PROTEIN or NUCLEIC子程序由序列创建结构文件是自动生成的。注意，当你想将TINKER文件转成标准pd b文件是，必须有这个se q文件。

SAMPLE.frac TINKER中的单晶胞分坐标文件。其内部格式与TINKER-xyz格式相同，只不过这里的坐标是分坐标而非以Angstrom为单位。**“分坐标”是指原子在晶胞某个方向上的位置是以一个[0,1]区间的小数表示的坐标，其实际值为这个小数乘以该方向的晶胞矢量。**

SAMPLE.xmol XMakeMol支持的一种文件类型。TINKER子程序ARCHI V E可以将一系列xyz形式的cycle file转成XMakemol X YZ文件，然后能用XMakeMol动态显示。.xmol文件并不包含TUNKER原子类型信息，所以不可能再将xmol转回成TUNKER-xyz文件。

SAMPLE.car Accelerys InsightII支持的坐标文件。TINKER子程序ARCHI V E可以将一系列xyz形式的cycle file转成car文件，然后由InsightII动态显示。car文件也不能转回成TINKER-xyz文件。

DORCEFIELD.prm TINKER力场参数文件均以prm为扩展名。

------------------------

4. TINKER子程序

------------------------

ANAL YZ E 单点能和性质计算：总能，各分项能量，单个原子的能量，总的偶极距和它的各个分量，惯性矩和旋转半径，列出所用力场参数，与各种作用相关的能量。

MINIMI Z E 结构优化，或者说能量最小化。Cartesian坐标。L-BF G S最小化。改进Jorge Nocedal算法。需要输入xyz文件名，目标rms梯度(收敛标准）** rms是指前后两个构象原子坐标间的均方差root mean s q uare, 用以表示坐标的变化。当能量对坐标变化的梯度接近于0的时候，即认为达到了局部极值)】预优化的时候，建议此值取0.1～1.0 kcal/mol/A。**

D Y NAMIC 运行一个MD或随机MD(SD, stochastic dynamics). 基于v elert积分或Beeman积分（一种改进V elert 积分）。**可进行1.N V E, 2.N V T, 3.NPH, 4.NPT 四种系综模拟。必须依次输入xyz文件名，力场文件名，模拟步数(N)，时间步长(fs)，输出频率(ps)，系综类型(1/2/3/4)，其它参数（如N V T需要输入温度）**

MONTE 使用Monte Carlo进行能量最小化。Harold Scheraga课题组开发的算法。

MINIROT 类似于MINIMI Z E，也是结构优化，不使用Cartesian坐标，而仅对内坐标中的二面角(dehedral angle)优化。输出保存在内坐标int文件中，或一系列cycle文件。

MINRI G ID 类似于MINIMI Z E，但是在key文件中定义一些group保持刚性。

NEWTON 一种非常耗时但精确的能量最小化算法。需要计算梯度(一阶导)和Hessian矩阵(二阶导)。**Hessian矩阵计算极其耗时，因为要对每一个原子的每一个坐标分量进行数值差分计算**

NEWTROT 类似于NEWTON，但只对二面角变量做优化。

OPTIMI Z E William Da v idon的可选条件变量矩阵优化算法。这种算法是用一个估计的HESSIAN矩阵来加速优化。

PATH 沿某种预设的反应坐标计算一些列能量。El b er的基于拉格朗日乘因子的反应路径跟踪算法的一个变种。

PSS 分子构象的全局优化。势能平滑化和搜索算法(a potential smoothing and search algorithm)。【势能平滑化是一种分子动力学模拟的加速采样技术，用以克服不同局部能量最小点之间的能垒。怎么克服呢？人为加大能量最小点附近的能量，这样整个势能面就变的平滑，方便在整个构象空间采样。采样完成后，使用统计热力学公式重新计算各构象的分布权重】

SADDLE 分子构型分析，找鞍点的算法。**就是搜过渡态了。过渡态就是在一个方向上是最大，而其他方向都是最小的点。

SCAN 分子构型分析，找能量的全局最小点。**先找尽可能多的局部能量最小点，然后比较谁是全局最优。困难是很难翻越能垒，怎么办呢？用一个叫b asin hopping method的方法

V IBRATE 正则振动分析，计算振动频率。**找到能量最小点，要计算一下看看有没有虚频

XTALFIT 使用实验测定的晶体结构数据和热力学数据自动拟合力场参数。实验数据包括晶格能，偶极距。

XTALMIN 晶体能量最小化。可以优化晶胞参数，即改变盒子的边长和三个晶面角。

ALCHEM Y 运行自由能微扰模拟方法。**比如将溶剂水中的Cl-微扰成一个Br-离子，以计算两者溶剂化自由能的差，即看谁更容易溶解。**

ANNEAL 模拟退火。**进行常温动力学模拟的时候，由于模拟时间短的限制，往往难以跳出一个局部最小构象。

为了对不同的局部最小能量构象采样，可以对体系进行升温，升高到比如1000K跑一会儿，然后再把温度降下来，进行低温下的平衡态模拟和采样，称为模拟退火算法。一般需要反复进行多次。**

G DA 对Strau b的G aussian Density模拟退火算法的实现。

---------------------------

5. 额外的应用程序

--------------------------

RADIAL 计算径向分布函数。

DIFFUSE 计算自扩散常数。对均相液体使用爱因斯坦方程。要处理混合体系，得自己改code。

CORRELATE 从一系列TINKER cylce files中计算时间相关函数。需要用户提供函数性质，比如速度自相关函数。

SPECTRUM 从速度自相关函数计算能谱Power spectrum。

POLARI Z E 计算分子极化率。以TINKER-xyz为输入。输出包括整体极化率张量及其本征值。**极化率张量是个3* 3矩阵**

SPACEFILL 计算分子的体积和表面积。包括v dW体积，可及表面积并分解为几何组成部分。表面积可分解为每个

原子的凸起贡献。

X YZ EDIT 操作TINKER-xyz文件。功能: （1）当前原子序号整体错位；(2)删除单个原子(3)删除某个原子类型(4)删

除某个Cutoff之外的所有原子(6)用新的原子类型替代旧的原子类型(7)按原子间拒设定连通性(8)转换单位： Bohr-Angstrom(9)翻转生成镜像(10)平移质心到原点(11)平移指定原子到原点(12)平移和旋转惯性坐标系(13)Mo v e to Sp ecified Rigid Body Coordinates(14)创建和填充一个周期性盒子（15）把当前分子浸没到溶剂盒子里（16）把另外一个xyz文件附加到当前文件中

PRMEDIT 给一个力场增加原子类型以后，这个程序用来给所有的原子进行重新编号。

CR Y STAL 将晶体分坐标文件转成模拟单胞；将单胞扩展成超胞；可出力最常见的25中晶体空间群。要处理其它空间群，自己改code。

NUCLEIC 根据序列构建核酸结构和坐标文件。

PROTEIN 根据序列构建蛋白结构和坐标文件。

SUPERPOSE 计算两个分子最好的重叠方式。

DIST G EOM 在给定的距离约束和二面角约束下，产生一系列蛋白构象的子程序。使用“距离几何”方法。

INTX YZ / X YZ INT 内坐标文件int转TINKER-xyz文件。

PDBX YZ / X YZ PDB

S Y B Y LX YZ mol2文件转TINKER-xyz，不包含原子类型信息。（全是0）

ARCHI V E 把TINKER cycle文件转成一个arc文件。可转成car文件，或xmol文件。

DOCUMENT 列出TINKER源代码中的子程序(routines)，模块(common b locks)，合法关键词。也可以按格式列出标准的TINKER参数文件。

------------------------

6. 力场参数文件

------------------------

AMOEBA 大量离子和有机小分子的可极化力场

AMOEBAPRO 蛋白可极化力场

WATER AMOEBA的可极化水模型

AMBER94/96/98/99 蛋白和核酸全原子力场。96改变了一些二面角参数；98改变了一些糖的torsion角参数；99改变了一些b ond/angle/torsion参数；

CHARMM19蛋白的全原子力场。无核酸。

DUDEK1990年以前TINKER的一些关于蛋白的可极化力场参数

MM2/MM3/MM3PRO Allinger的MM系列力场，致力于预测准确的分子构型；

OPLSUA/OPLSAA Jorgensen老人家开发的系列参数，一直是众多力场非键参数的来源；

SMOOTH用于Potential soothing方法的OPLA_UA力场

SMOOTHAA用于Potential soothing方法的OPLA_AA力场

-----------------------

7. Key文件设置

-----------------------

key文件是模拟控制文件，包括了模拟运行所需要的全部可选参数。模拟前TINKER先找与xyz的同名key文件，找不到就找同目录下的tinker.key。都找不到也能运行，这时候全部使用缺省参数。

key文件中每行一个关键词+参数。关键词前的空格忽略。整个key文件对大小写不敏感，与顺序无关。需要多个数字做参数时，多个数字之间可以空格，逗号，或ta b隔开。

----------------------------------------------------

8. 关于一些特征和方法的说明

---------------------------------------------------

(1)文件版本号

对同一个文件操作产生的文件名会相同。比如X YZ INT将molecule.xyz转成int文件时，自动命名为molecule.int。如果此时已经有一个molecule.int，那就自动命名为molecule.int_2.以此类推。

(2)命令行操作

Unix下用-k指定key文件名称。比如：

> newton molecule -k test a a 0.01

调用newton子程序，对结构文件molecule.xyz使用test.key控制文件。

(3)原子类型Atom types和原子类别Atom classes

因为不可能对所有原子类型形成的angle, torsion等参数进行参数化，所以简单分了几种原子类别classes。原子类别下面分原子类型type。属于同一原子类别的，不太重要的，或者不敏感的，就都用同一种参数。大大减少需要参数化的原子类型数目。

(4)局部结构计算

有两种方法计算一个分子体系的一部分能量。

1. TINKER允许通过key文件将体系定义成acti v e和inacti v e两部分。在MINIMI Z E或MD中，只有acti v e原子允许移动。力场引擎计算所有至少涉及一个acti v e原子的作用项。或者说，任何相互作用，只要它的能量能被活动原子改变就会被计算。

2. 把原体系分成一系列atom groups。这些groups可有key文件定义。同一原子不得属于2个groups。然后进一步允许用户指定哪些相互作用对能量有贡献。还可以定义这些贡献对总能的权重。

(5)金属配合物和超共价化合物

当前TINKER版本只允许原子成键数目不超过4.要处理高配位化合物，就去改源代码sizes.i中的max v al的参数，然后重新编译。TINKER对金属配合物的支持正在开发中。

(6)非键作用的邻位原子搜索方法

除了标准的双循环方法，Light方法可用于加速邻位原子搜索。这个方法基于对排好序的原子列表取交叉部分。这个方法对于cutoff明显小于盒子边长一半的情况特别有效，大大加快计算。

(7)势能函数的截断

TINKER采用多项式能量切换方法(Polynomial energy switching)处理截断

(8)Ewald求和方法

对于简单的电荷-电荷势函数，可用PME方法；对于可极化原子多极作用，则提供正常的Ewald求和方法。（PME 是一种特殊的Ewald方法）对于这两种情况，都应该设置合理的Ewald coefficient和实空间截断半径。

(9)连续溶剂模型

SOL V ATE关键词提供多种连续溶剂算法。

两种简单的表面积积分方法：Eisen b erg and McLachlan的ASP方法，和Scheraga’s group的SASA方法。此2

法可用于任何标准的TINKER力场计算。

基于广义波恩公式(generalized Born formalism)的不同方法：Still's group的1990年原始的“洋葱壳层”的G B/S A方法； 1997年解析的G B/SA模型；Hawkins, Cramer and Truhlar的提出对加和去屏蔽算法； Schaefer and Ka rplus的解析的连续溶剂方法(ACE)。目前，广义波恩方法只能用于处理非极化的简单电荷间的静电作用。

对于G B/SA类型的溶剂模型的进一步评价： “洋葱壳层”模型主要是为了比较的目的而提供的。根据原始文献，它对空腔使用解析的方法计算表面积，对极化项使用数值方法。这种方法很慢，尤其是对于大的体系，并且不包

含Born半径链规则项对一阶导的贡献。所以不推荐使用。其它G B/SA方法使用近似的空腔项，而且包括对一阶导的校正，计算速度与体系尺寸的平方成比例，可用于MINIMI Z E, MD和大的体系。

此外，当前的TINKER版本不要用ACE模型。这个算法在源程序中写好了，但是参数化还没有完成。截止2000年，参数值仅适用于CHARMM19的ACE计算。

(10)可极化的多极静电作用

当前TINKER版本支持4极矩的原子多极静电作用，包括互相的，和直接的(单向的)两极极化。计算是W Smith的CCP%算法和Apple q uist-Dykstra的笛卡尔多极张量方法的组合实现。目前提供解析能量和笛卡尔梯度代码。

TINKER允许通过Thole提出的作用衰减方案计算分子内的极化。使用这个方案，必须将所有mutual-1x-scal关键词设为1.另外一个极化scaling系列关键词，direct-1x-scal和polar-1x-scal，可独立设置以启用各种不同的极化模型。要使用Apple q uist-style模型不带极化衰减，设置polar-damp为0即可。

(11)PSS, Potential Energy Smoothing平滑势能法

当前TINKER已经实现了好几种平滑势能搜索方法（PSS， Potential Smoothing and Search）。这些方法与Scher aga的Diffusion E q uation方法，Strau b的G aussian Density Annealing退火法，Shalloway的Packet Annealing

退火法，和V erschelde的有效弥散势方法(Effecti v e Diffused Potential)同属于一个家族。但是我们的算法反映了

了我们自己在这个领域的当前进展。TINKER平滑势能方法的很多方面是随机模拟退火的决定论的相似版本（the d eterministic analog of stochastic simulated annealing）。PSS算法非常强大，但是相对较新，我们课题组正在不断改进，测试和验证。此版本也包括一个SCAN子程序，实现b asin-hopping构象扫描算法，可以有效对平滑过的势能面进行扫描。

X.J. Wang, 2011.07.23 Morning

--------------------------------------------

一花一世界，一草一天堂