分子动力学模拟-经验谈

分子动力学模拟-经验谈
分子动力学模拟-经验谈

分子动力学攻略

此文为dddc_redsnow发表于biolover上的关于分子动力学的系列原创文章,相当经典与精彩,特此将系列文章整合,一起转载,望学习动力学的新手们共同学习,提高进步,在此特向dddc_redsnow本人表示感谢。

动力学系列之一(gromacs,重发)

在老何的鼓励下,发一下我的gromacs上手手册(我带人时用的,基本半天可以学会gromcas)

######################################################

# Process protein files step by step #

###################################################### pdb2gmx -f 2th_cap.pdb -o 2th_cap.gro -p 2th_cap.top -ignh -ter

nedit 2th_cap.top

editconf -f 2th_cap.gro -o 2th_cap_box.gro -d 1.5

genbox -cp 2th_cap_box.gro -cs -p 2th_cap.top -o 2th_cap_water.gro

make_ndx -f 2th_cap_water.gro -o 2th_cap.ndx

genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_All.itp

genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_M.itp

genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_C.itp

nedit Flavo.itp

grompp -f em.mdp -c 2th_cap_water.gro -p 2th_cap.top -o prepare.tpr

genion -s prepare.tpr -o 2th_cap_water_ion.gro -np 1 -pq 1

#####################################################

# Minimize step by step #

# 1. minimization fixing whole protein #

# 2. minimization fixing maincharin of protein #

# 3. minimization fixing Ca of protein #

# 4. minimization without fix #

##################################################### grompp -np 4 -f em.mdp -c 2th_cap_water_ion.gro -p 2th_cap.top -o minimize_water.tpr mpirun -np 4 mdrun -nice 0 -s minimize_water.tpr -o minimize_water.trr -c

minimize_water.gro -e minimize_water.edr -g minimize_water.log &

grompp -np 4 -f em.mdp -c minimize_water.gro -p 2th_cap.top -o minimize_sidechain.tpr mpirun -np 4 mdrun -nice 0 -s minimize_sidechain.tpr -o minimize_sidechain.trr -c minimize_sidechain.gro -e minimize_sidechain.edr -g minimize_sidechain.log &

grompp -np 4 -f em.mdp -c minimize_sidechain.gro -p 2th_cap.top -o

minimize_sidechain_ex.tpr

mpirun -np 4 mdrun -nice 0 -s minimize_sidechain_ex.tpr -o minimize_sidechain_ex.trr -c minimize_sidechain_ex.gro -e minimize_sidechain_ex.edr minimize_sidechain_ex.log & grompp -np 4 -f em.mdp -c minimize_sidechain_ex.gro -p 2th_cap.top -o minimize_all.tpr mpirun -np 4 mdrun -nice 0 -s minimize_all.tpr -o minimize_all.trr -c minimize_all.gro -e minimize_allx.edr -g minimize_all.log&

editconf -f minimize_all.gro -o minimize_all.pdb

#####################################################

# Raise temperature step by step #

# 1. raise from 0K to 100K fixing whole protein #

# 2. raise from 100K to 200K fixing whole protein #

# 3. raise from 200K to 300K fixing whole protein #

# 4. balance fixing maincharin of protein #

# 5. balance fixing Ca of protein #

##################################################### grompp -np 4 -f heat.mdp -c minimize_all.gro -p 2th_cap.top -o temperature100K.tpr mpirun -np 4 mdrun -nice 0 -s temperature100K.tpr -o temperature100K.trr -c temperature100K.gro -e temperature100K.edr -g temperature100K.log &

grompp -np 4 -f heat.mdp -c temperature100K.gro -p 2th_cap.top -o temperature200K.tpr mpirun -np 4 mdrun -nice 0 -s temperature200K.tpr -o temperature200K.trr -c temperature200K.gro -e temperature200K.edr -g temperature200K.log &

grompp -np 4 -f heat.mdp -c temperature200K.gro -p 2th_cap.top -o temperature300K.tpr mpirun -np 4 mdrun -nice 0 -s temperature300K.tpr -o temperature300K.trr -c temperature300K.gro -e temperature300K.edr -g temperature300K.log &

g_energy -f temperature300K.edr -s temperature300K.tpr -o temperature300K.xvg grompp -np 4 -f heat.mdp -c temperature300K.gro -p 2th_cap.top -o T300K_M.tpr

mpirun -np 4 mdrun -nice 0 -s T300K_M.tpr -o T300K_M.trr -c T300K_M.gro -e T300K_M.edr -g T300K_M.log &

grompp -np 4 -f heat.mdp -c T300K_M.gro -p 2th_cap.top -o T300K_Ca.tpr

mpirun -np 4 mdrun -nice 0 -s T300K_Ca.tpr -o T300K_Ca.trr -c T300K_Ca.gro -e

T300K_Ca.edr -g T300K_Ca.log &

grompp -np 4 -f heat.mdp -c T300K_Ca.gro -p 2th_cap.top -o T300K_MD.tpr

mpirun -np 4 mdrun -nice 0 -s T300K_MD.tpr -o T300K_MD.trr -c T300K_MD.gro -e

T300K_MD.edr -g T300K_MD.log &

至此,全部搞定,可以跑了。PJ的东西放出来敏感,原创的教学东西也可以收精华吧

动力学系列之二(amber基础篇)

上次写了一个,结果一下在因为发贴的原因丢了,加上最近忙的要命,不过还是吃完饭干活前,静下心写一下amber,amber远比gromacs要复杂(不过还比不上charmm,估计第一次看charmm脚本的人一定觉得自己选错了行当,类fortran的语言加上自创的格式,唉,又是一段心酸的往事...)。我把amber 分成两部分讲,第一部分讲基础,第二部分讲应用。这里先讲第一部分。

1. 关于整体概括. amber的文件格式有三种最为重要:top, crd and pdb。pdb可以生成top and crd, top and crd也可以转换成pdb,这些都是ascii码文件,可以手动编辑(这也是DNA+Protein时候有时不得不作的事情,巨大的工作量)。top文件中是拓扑文件,相当于gromacs的top,不过直接把lib的参数搞过来,不要再调用lib了。crd文件是坐标和速度文件,类似于gro文件,pdb不用我说了吧。

2. amber中的概念: 所有的单元从原子,小分子,残基,碱基等等一直到大分子都是unit,熟悉C++,JAVA 的朋友想一下object就理解了,amber的xleap的操作就像一个外包体,利用object的独立性进行关联,组合或者分拆object, 实现不同的功能,每一个unit都是独立单元。而标准的氨基酸,碱基就像class,你自己的蛋白就是object。每个class对应多个有自己名字的object。这些都是在xleap中实现的,xleap

就是利用这种关系来导入,修改蛋白或者DNA/RNA。

3. amber自带gaff力场(比gromacs那个网页算的小分子正规多了),适用于大部分有机小分子,当然修改力场文件可以让你获得更多的支持,尤其是特殊的原子比如说卤素,金属原子。电荷是采用的resp 拟和,而不是原子的partial charge,这个的优点见JACS的原始文献,不再赘述,主要是考虑极化。

4. 通过xleap搞定了大分子,小分子,水,溶剂离子,跑得时候就是sander了,当然8以后的pmemd 是更好的选择,不过只能跑pme方式的动力学。

5. 轨迹文件amber做的不好,太大,没有压缩。断点续跑也不如gromacs,半个坐标的情况时有出现,只见原子叉叉满天飞啊,那叫一个壮观。分析工具首推ptraj(不是我推的,是他们,我个人喜欢carnal),加各种辅助工具可以实现gromacs的各种功能。

6. 优点:上次说过了,轨迹稳定,重复性好,可信度高。有些朋友非要跑出个地动山摇,惊涛骇浪的轨迹,不推荐您使amber,估计等到它跑到那一天,您也毕业了。缺点:真的打算用amber吗,打算跑10ns 吗?打算有什么特别有意思的想法吗?恭喜您,您可以考虑买硬盘了。amber的存储量大概是

1ns->1.5GB, 如果想发一个好一点的文章,阐述一个精细的机理,没有10条轨迹搞不定的,算算是多少硬盘....我的一个题平均120G轨迹。

洋洋洒洒写了这么多,不过amber的真正强大之处还不在这里,它的强大在于它的应用广泛,有着各种的“人无我有,人有我精”的套件,下次我在应用篇里面详细讲一下

动力学系列之三(amber应用篇)

上海的天气真是一天一变啊,又是大雨滂沱了。反正出不去了,索性把amber的第二部分写完,大家周末也有个消遣。

上回说amber的基础应用谈到了他有很多应用的套件,这里我把最常用的以及比较容易发好文章的几个部分讲解以下:

1。首先要说的就是用于药物设计平衡的sander/pmemd,一般来说,用amber作一下平衡是同源模建的重要可选步骤之一,尤其适用于结构不确定性大的loop和缺乏明确模板的地方,当然,如果您要是有macromodel,还是用那个,最近的文章发现申稿人很喜欢那个,可能是因为那个公司比较得到大家的认可吧

2。MMPBSA, 计算自由能的很好选择,KUNZ他们组就喜欢拿这个说事,作为虚筛的终结器。当然了方法的想法是很好的,不过还是有一些缺点的,比如对共轭体系,可极化严重的分子计算结果很不准确。MMPBSA流行的时候只做一个这个旧可以发Protein Sci. 现在基本不可能了,不过还是很好的一个计算自由能的方法,平均半个小时一个分子

3。NMODE,有的朋友问要什么样的分析工具,NMODE绝对是一个可选的东东,具体的原理我不讲了,很简单,矩阵二次求导做频率,底频高幅运动就是它分析的对象,Maccoman他们组只做这个就在JMB 上发了无数的文章(人家是开山鼻祖,我们做,呵呵,估计就是BJ也很难啊)

4。Alan扫描:预测突变影响的工具,很粗糙,但是如果你计算资源不是很多的话,这个是推荐的方法。原理没什么可讲的,想用的去看manual,不到1页

5。TMD,我最近做的东西,和什么SMD了,FMD了。。。。一大堆兄弟姐妹啊,不过也快做烂了,可以模拟蛋白大幅运动的过渡态

6。TI。目前公认的计算自由能最好方法,缺点是相当的耗时间,一个师兄做n年,结果发现不适合他的体系,韶华逝水啊,没有时间的朋友千万不要碰

上面的这些方法都是最常用的,也是文章中暴光频率最高,精通2到3个,一个好体系,综合起来,可以冲击JMB或者JACS。呵呵,外面雨终于小了,希望大家看了能有帮助,会一个技术不难,难的是把这个

技术用的恰到好处,下次有时间聊聊怎么综合使用各种工具分析问题

动力学系列之四(能量分析)

明天就是5.1,可是手里还是一大堆的活,实验也是诡异的要命,时光真是快啊。前面对两个基本软件介绍了一下,本来想讲讲charmm和macromodel,后来想想,没有什么意思,还是讲一下分析方法对大家更适用,如果大家真的想听这两个软件,后面我再补充。动力学分析方法多种多样,但是能量永远是不变的话题,很多问题的说明都是以能量为基础的,这里说的能量包括各种力场能量,溶剂化能,自由能等。我主要对自由能讲解一些如何进行计算。在amber中,可以通过mmpbsa来计算这个相对自由能,在免费的软件gromacs中,能量的计算(不知道有心的朋友是否自己加和过他提供的能量项,是不是缺点儿什么啊^v^)相当的粗糙,虽然提供了计算自由能的工具,但是源码中却是空,不知道到哪个版本才能实现。amber是比较好用,但是也是一个收费软件,特别是想发文章的朋友要注意了。如果是不想买amber 的朋友,一个中间路线就是用gromacs跑轨迹,用autodock算能量(自由能),虽然不如mmpbsa

原理上准确,但是忽略部分熵效应也在变动不大的体系也还不错。下面这个脚本是我自己写的,可以实现这一功能,希望能对大家有个帮助:#!/bin/sh #'$1' is set for different list name #'$2' is set for the ligand name #prepare the $2.bnd in advance with command:

#/~root/autodock/dist305/bin/pdbtoatm lig.pdbq|

~root/autodock/dist305/bin/atmtobnd >lig.bnd for snapshot in `cat $1` do

rec=protein_mn_hoh1.${snapshot} lig=$2.${snapshot} echo ${rec} #assign the atomic solvation parameters to PDBQ-formatted version of your macromolecule, ~root/bin/addsol ${rec}.pdbq ${rec}.pdbqs ~root//bin/autotors -A $2.bnd ${lig}.pdbq ${lig}.out.pdbq > ${lig}.out.${rec}https://www.360docs.net/doc/2313947402.html, ~root/autodock/dist305/bin/autodock3 -p

${lig}.out.${rec}.dpf -l ${lig}.out.${rec}.epdb.log -c > $1_Binding ~root//bin/Docked.awk ${lig}.out.${rec}.epdb.log >> $1_Docked ~root//bin/Inter_score.awk

${lig}.out.${rec}.epdb.log >> $1_Inter_Energy ~root//bin/Intra_score.awk

${lig}.out.${rec}.epdb.log >> $1_Intra_Energy #rm -f *.map *.fld *.xyz *.err *.pdbqs *.glg *.log *.com *.gpf *.dpf Binding.awk #!~root/bin/gawk -f BEGIN{ name=ARGV[1] split(name,array,".") } { if($0 ~ /Estimated Free Energy of Binding/) {print array[1]" "$9" " $10} } Docked.awk #!~root/bin/gawk -f BEGIN{ name=ARGV[1] split(name,array,".") } { if($0 ~ /Final Docked Energy/) {print array[1]" "$7" " $8} }

动力学系列之五(外一篇,1-4楼加在一起)

上次发了系列四的能量计算后,不少朋友pm我,既然可以用多个大分子构象计算能量曲线,反过来是否可以用一个大分子对小分子数据库做类似dock, gold那种虚拟筛选那?答案是可以的,不过这个要通过脚本来实现,虽然也有一个程序,但是那个程序是我写给ddgrid这个工程的,这半年暂时不能放出来,年底给大家共享(主要原因是怕阿)。言归正传,不过这个脚本也可实现一样的功能,就是时间上慢一些,空间上占用多一点,以前在别的地方放过早期的版本,这次放一个完全版,而且包含了我们常用的参数设置。虽然和动力学这个系列关系不是非常紧密,但是在进行多个阳性物对比动力学的时候结合上一个脚本可以把大量工作简单化。废话少说,放东西先:

--------------------------------------

主程序, 由于论坛屏蔽原因,我用了替代字符,而且好像总是砍掉我的字符啊

不得不分开发,请大家见谅

"&&"请转换为"EOF"后使用

--------------------------------------

//准备文件

#!/bin/sh

receptor=receptor.mol2

rec=${receptor%.mol2}

mol2topdbqs $receptor

for ligand in `cat mol2.list`

do

lig=${ligand%.mol2}

deftors $ligand <<&&

//选项

1

c

c

&&

#if(-z ${lig}.pdbq) then

# deftors $ligand <<&&

# a

# 1

# c

# c

# &&

#endif

#vi ${lig}.pdbq << &&

#:%s/ Br/ b /g

#:%s/ Cl/ c /g

#wq

#&&

(转载) 分子动力学攻略

动力学系列之六(膜蛋白的模拟)

今天是假期的最后一天(不过好像大家都是8号上班了,我们特殊,不过后面是惨痛的10天连续工作),整理一下思路,写一些膜蛋白的模拟,膜蛋白的工作量大,需要进行的准备工作多,做一个膜蛋白相当于两个球蛋白的工作量。我先介绍一下膜蛋白的一些基本概念:

1。膜蛋白-顾名思义,就是存在于细胞膜和细胞核(线粒体膜也有,不过不属于主流,暂时忽略之)双层脂质膜上的大型蛋白质。膜蛋白从拓扑结构可以分为几种,酶(3500个左右),7次跨膜的G偶联受体(2000个左右),离子通道(1000个左右),核的激素受体(150个左右)

2。生物膜膜蛋白可分为外周膜蛋白和内在膜蛋白,后者约占整个膜蛋白的70%~80%,它们部分或全部

嵌入膜内,有的则是跨膜分布,如受体、离子通道、离子泵、膜孔、运载体(transporter)以及各种膜酶等等。象水溶性蛋白质一样,要深入了解膜蛋白的功能必须解析它们的三维结构。第一个水溶性蛋白质——肌红蛋白的三维结构的解析是由英国Kendrew于1957年用X射线衍射法完成的,从而使他获得了诺贝尔奖。随着相关技术的日益改进与发展,迄今蛋白质解析出具有原子分辨率的三维结构已达13 000个左右,而且正以2000个/年的速率递增。但是其中内在膜蛋白只有26个左右(根据2000年6月的统计),换言之,仅占所有已经解析出三维结构的蛋白质的0.2%。因此,用MD理解膜蛋白的作用机制也成为2000年后的一个热点。

3。当获得了一个膜蛋白后,该怎么下手那(废话,当然是越快越好,世界上n多个组都瞄着新的膜蛋白那,JMB和PNAS的常客啊),准备过程我简要介绍一下,细节如果大家感兴趣,我今后再详细说一下,不过确实的繁琐啊,我花了两个月时间搞这个东东:

a. 修补残基(这个都知道怎么做了,不说了)

b. 选择合适的膜,膜的种类也是很多的,所以大家不要挑花眼啊(网上有,自己down,我也可以提供一个,呵呵,别人的,不过是我们修改了一点不合理结构的,获得方法, pm我)

c. 把蛋白正确的放到膜里面,去掉重叠部分,打通蛋白内部的通道(最关键的一步,决定了是否可以正确的模拟和结果的可靠性)

d. 膜两侧包水加box

e. MD

第三步是做膜蛋白的精髓,不同的组使用的方法不同,我自己写了一个简单的Interactive的程序,供组里的人使用,这次是第一次发布到外面(dos版,linux或者sgi的,可以pm我),可以非常简单的实现这一步,不要做繁琐的处理,google上可以搜到钾通道的处理方法,8页english, 相当的麻烦,gromacs 给了一个命令,但是膜不合适(他给的膜也就适合做demo,缺乏合理性)。当然,即使搞定了上述5步,强大的cpu和足够的硬盘是基本的保障,否则2006年交的作业,2007年可以才能进行分析。

明天EMBO就要开始了,牛人我知道的来了两个,都是做的最前沿的东东,一个是free enregy landscape, 另一个是structrual genomics。去听听,有什么感想后面和大家共享

动力学系列之七(同源模建)

最近去听了几场embo, 觉得自己还是有很多地方需要提高啊,而且今年的embo的特色很突出,可能代表了当今的潮流吧,等embo结束,我写一个自己的感受,大家分享。动力学里面核心是生物大分子,当然有NMR和X-RAY最好,如果没有,就需要同源模建技术来构建蛋白。同源模建技术在90年代风靡一时,简单的模建在一些高档次的文章中独撑一面,2000年以来,随着技术的成熟和应用的广泛,这项技术逐渐成为一个基本工具出现在各种文献中。同源模建是一个根据模板蛋白将一级序列转成3D结构的技术总称,包括了threading和homology两种,当让后来发展的fugue啊,geneatlas等等都是以次为基础。在这两种中,又以后者重要(因为简单而且准确性高),在很多软件中都提供了相应的功能,做的最好的商业软件是INSIGHTii和modeller(这个非常傻瓜,但是结果的可控制性不高), 免费的有spdbvierwer和一些在线服务器.。如果买了这个软件的朋友一定首选insightII做,因为审稿人很偏爱这个;没有买的朋友最好的方法是找买了的单位合作(D版发文章会给你的导师和单位带来很多麻烦),如果找不到,只好用spdbviewer了,但是这样的结构最好不要发在纯计算的杂志上,被拒的危险很大。说了这么多废话,我这次主要介绍INSIGHTii的用法和一些使用细节:

一. insightII

最强大的同源模建软件(前提是你看了所有的manual,理解了各种算法和参数的意义),可以进行各种模建和验证预测。主要分以下几个步骤:

a. input sequence,alignment(pariwise and multi alignment,主要是对类似结构要很好了解,manual的排列原则写的非常好,建议大家仔细看)

b. refine (我个人使用的笔记)

1. Check and correct potentials, partial charges, and hydrogens before submitting a Discover/CHARMm job.

①Builder from the Module pulldown

②For hydrogens, use the Hydrogen command in the Modify pulldown

③Potential atom types and partial charges, use the commands in the Forcefield pulldown.

2. Check and correct steric overlaps

①Bump command from the Measure pulldown

②Relieve them by moving atoms with the Torsion command in the Transform pulldown.

3. Find unacceptable steric overlaps caused by one to three interactions or short bond lengths.

①Using the Geometry command in the Modify pulldown in the Builder module.

4. End Repair

5. Splice Repair

6. Energy Minimization

①Relax command provides for the selective minimization of sections of the model protein.

7. Molecular Dynamics

①Explore command in the Refine pulldown can accomplish this task.

同源模建技术给我们带来了更多选择和探索新领域的机会,但是有一点请大家注意,如果你的蛋白同源性不高,波动性过大,关键位点差异显著的话,要谨慎的选择同源模建,因为这样构造出来的蛋白很可能误导你后面的工作,因为往往同源模建在我们这里都是一个课题的第一步,决定了后面这个课题是否成功的关键

(转载) 分子动力学攻略

动力学系列之八(如何设计动力学)

今天下午没有课程,可以闲下来写点东西,上面谈了那么多技术,说到底,应该为了解决问题.动力学的课题我大大小小也作了不少,当然目的不同,设计也不同.这次我讲一下怎么设计动力学的整个课题,主要是思路方面,细节就不谈了,例子就讲我在JACS发过的一篇文章(J. AM. CHEM. SOC., 127, 11709-11719 ,2005),希望作的不好的地方大家指正

这是一个典型的配体诱导open-closed运动的文章,为后面的抑制剂设计打下了基础,在这个机理上,获得了36/60的活性化合物,最好的几个正在结构改造中(有的是相当的麻烦啊,痛啊).设计这个题目的目的就是为了根据ATP和TNPATP的不同来设计抗生素的先导化合物.

采用方法:GMD (gromacs), PCA, QM, Homology, Protein-Protein docking

1. 首先通过GMD解析两个小分子构象变化

2. 从结构入手分析产生变化的原因

3. 设计QM来验证ATP变化的假说

4. 设计PCA来分析蛋白的变化,并通过PCA将小分子变化与蛋白变化关联起来

5. 分析得出大分子打开的根本原因来自于小分子的构想周期性变化

6. 利用Protein-Protein docking进行反应初始环境的构建,并用GMD来考证结构的正确性

7. 总结整个磷酸化机制,并提出设计抑制剂的关键性氨基酸(控制蛋白口袋开合)

基本上开始时值是设计了前几步,随着课题的深入不断对问题深化,最后得出结论。在同时进行的药物设计上采用了这个机制的关键氨基酸限制性搜寻,获得36个阳性化合物,从一个侧面证明机制的正确性。

在上面这个例子中,动力学起了一个串联起各项技术桥梁的作用,当然,最后的机制还是由根据综合各项技术提出的。作一个计算课题的关键我个人觉得是知道什么时候选用什么样的技术,理解这个技术的算法和机理,这样才能心中有雄兵。

一家之谈,不足之处请大家指正

动力学系列之九(动力学发展方向)

今天embo整个结束了,我断断续续的听的(因为最近实在是太忙而且有的听不懂)。前面谈了许多技术阿,思路阿,对于中国从事计算生物学,计算化学的人来说,最重要的是在国外已经有的基础上发展自己的东西,不能亦步亦趋。自从六七十年代Karplus发展动力学以来,动力学经过了几次大的波折,开始的时候模拟真空中几十个氨基酸,慢慢的可以模拟大一些的蛋白,随着计算资源的发展和算法的改进,水环境可以加入到模拟当中。进入90年代,膜蛋白,尤其是GPCR和离子通道的模拟成功进一步推动了整个动力学的应用范围。回头来我们看一看整个发展历程,表面上动力学的一个大的方向是模拟越来越大的体系,模拟越来越长的时间,模拟越来越多的次数来满足动力学原理上的随机问题。如果我们眼光只看着这些,我们永远也无法超越国外的水平,因为国外新生代比较好的动力学组已经不是把应用作为主要目标了,他们在反思动力学到底可以为科学的发展贡献什么,怎么用动力学来预测想要的东西,计算/生物/化学怎么结合起来,相互验证着进行解决实验无法测得尺度上的微观问题。国外的人来参观,你说你模拟了多长,多少条轨迹,实际人家不是真正的佩服你,只是佩服你能搞到这么多的计算资源。如果你能在算法或者动力学本身原理上提出见解;你通过动力学发现了一些东西,结果实验证明是正确的,人家才是由衷的说fine,这次embo课程中,象clark,grummuller等都是将生物和计算结合的比较好的组,用到的手段包括AFM,荧光,NOE,NMR 等等。许多做实验的朋友可能觉得动力学好发文章,可以make story,所以趋之若鹜,实际冷静一下,你要考虑一下如果你要做动力学,你应该怎么做,怎么和你的实验结合起来,把一个课题,一个体系,一个机制完整的呈现出来,我提几个自己的想法,大家指正:

1. 结构生物学结合动力学(最容易)进行结构功能研究

2. 酶学结合动力学进行残基突变,酶反应机理的研究

3. 蛋白组学结合动力学进行partner的识别

4. 信号传导通过动力学研究构象如何变化实现信号传输

5. 其他,包括folding, 蛋白演化这些原来纯粹的计算生物学的方向,现在可以结合AFM, Biocore等仪器来验证你的idea

说了这么多,最后有几个建议,送给想做动力学的朋友

1. 不要只解释别人的实验结果,提出机制。从去年年底到今年,发现动力学的文章最大的变化就是这个,只解释的文章被拒稿率猛增,QSAR的今天就是md的明天

2. 不要局限于细节,要有大局观,从整体入手考虑文章构架

3. 给出预测,并用实验验证它,如果你没有条件,一定要提出你的建议,没有建议的文章不要投4分以上的杂志

4. 数据分析不是目的,整理思路才是关键,我有海量数据,但是人家没有海量时间听你讲,看你的罗罗嗦嗦象唐僧一样,马上给你kill,理由就是你的文章没有新颖性,没有条理性

5. 建议一定要做重复,就是同一条轨迹最好多跑几边,从统计学意义上说明问题,不要保侥幸心里

分子动力学简介及在药物化学中应用

分子动力学是一门结合物理,数学和化学的综合技术,我做过一点这方面的工作,谈一点自己的感受,对大家可能有些帮助吧

1. 动力学可以解决什么问题

做药物化学最重要是要有有前途的先导化合物,而先导化合物的来源两大支柱之一就是虚拟筛选技术,作为虚拟筛选技术串连技术的最终一步,动力学有着可以选择最有前途分子进行合成的作用,提高靶酶先导化合物的阳性成功率;另外动力学还可以对已知的化合物进行研究,获得进一步改造的空间;在生物化学领域,更多的蛋白性质可以被探索,这样动态设计药物分子先导成为可能。

2.什么样的体系适合做动力学

不是所有的体系都适合做动力学,有的体系跑了分析了快一年才发现原来并不适合做动力学(组里有过这

样的先例),轨迹扔了可惜,不扔是垃圾,还占空间,被人骂(组里硬盘空间太少,才几个T)。动力学最重要的是选择体系,这也就是说什么样的体系适合做动力学(或者说适合发文章的).

以下几类都是比较好作的:

a. ligand induced conformation

b. open-closed mechanism

c. binding mechanism

d. large-scale mechnism

e. free energy evaluation(这个对做药物化学的人很重要)

不好做的有(但是作出来会很好)

a. membrane protein

b. ion-channel protein

c. Protein-DNA/RNA interaction

千万不要去尝试(会让你做完欲哭无泪的)

a. homoloy-based MD(especillay <30%),几乎文章做一个拒一个,除非你自己组里有人给作实验验证

b. independent stable protein,分析不出什么东西,小东西比方说水啊什么的,这个都已经过时了,不要扣细节了

c. Super large-scale MD, 这个我不用说了吧,估计我们作不了的呵呵,别的地方也很难做

d. 不知道自己为什么去作MD,先跑上再说的那种(最危险的一个),没有人指点你会迷失在分析的海洋中。

2.选择什么样的软件做动力学

动力学的软件多如牛毛,选择哪个去做哪?我只谈主流的自己摸过的几个(排名不分先后),Gromacs, amber, charmm, gromose和macromodel。NAMD我没有摸过,不敢评价。

a. Gromacs大家问的最多,我先说。一个字!快。其他的优点还有分析傻瓜,简单易学(我自己带人的话,一个上午之内保证学会,大家不要板砖啊,确实是缺乏内涵,傻瓜的很),可以pull(而且可以想怎么pull就怎么pull,还可以多个pull)。我说说缺点:结果可靠性差,重复性难,高档次分析工具欠缺,分析工具中bug多(仔细看就会知道,结果一看就知道不对),并行通信量大.....。这个软件只适合没有经济能力购买商业软件和需要长时间动力学(微秒)的同学使用

b. amber和charmm(偷懒了,放在一起),两者差不多,但是前者商业化程度更好,做得比较容易上手;后者还是老样子,脚本复杂,分支狂多,这也和karplus学生众多有关(孩子多了就是不好管啊)。优点都是结果相对准确,可信度高,具有高档次分析工具。缺点是上手难,跑的慢,理论基础要好,狂占空间(我都被管理员说了无数次了,唉)

c. gromose,拥有和CPMD的无缝接口是最大的优点。什么,不知道CPMD是什么,算我没说,跳过这个软件吧

d. macromodel,商业化最好,拥有能力最强,号称动力学黄金标准的MD软件。一个字,贵。但是人家薛定额做的就是好,结果被各大公司使用频率最高,药物化学个人推荐首选。

e. 其他,还有很多动力学软件,NAMD是比较出名的一个,但是我没有摸过,没有什么特色主要是。更小的大家如果感兴趣,一句话:小玩贻情,大作伤身。

3.应该做什么样的分析

rmsd,rmsf, t, e,dis, angle这些俗套就算了,最重要的是你对你的体系精通,各种实验结果了然于胸,机制脱口欲出,靶标分子的作用方式才是分析改造化合物的关键。最好掌握一些发展前沿的分析手段,一两句话说不清楚,这个我下次有时间再开个贴说说。

洋洋洒洒写了半天,后来写困了,可能前言不搭后语了,大家不要拍我啊,仅供大家参考

分子动力学的模拟过程

分子动力学的模拟过程 分子动力学模拟作为一种应用广泛的模拟计算方法有其自身特定的模拟步骤,程序流程也相对固定。本节主要就分子动力学的模拟步骤和计算程序流程做一些简单介绍。 1. 分子动力学模拟步驟 分子动力学模拟是一种在微观尺度上进行的数值模拟方法。这种方法既可以得到一些使用传统方法,热力学分析法等无法获得的微观信息,又能够将实际实验研究中遇到的不利影响因素回避掉,从而达到实验研宄难以实现的控制条件。 分子动力学模拟的步骤为: (1)选取所要研究的系统并建立适当的模拟模型。 (2)设定模拟区域的边界条件,选取粒子间作用势模型。 (3)设定系统所有粒子的初始位置和初始速度。 (4)计算粒子间的相互作用力和势能,以及各个粒子的位置和速度。 (5)待体系达到平衡,统计获得体系的宏观特性。 分子动力学模拟的主要对象就是将实际物理模型抽象后的物理系统模型。因此,物理建模也是分子动力学模拟的一个重要的环节。而对于分子动力学模拟,主要还是势函数的选取,势函数是分子动力学模拟计算的核心。这是因为分子动力学模拟主要是计算分子间作用力,计算粒子的势能、位置及速度都离不开势函数的作用。系统中粒子初始位置的设定最好与实际模拟模型相符,这样可以使系统尽快达到平衡。另外,粒子的初始速度也最好与实际系统中分子的速度相当,这样可以减少计算机的模拟时间。 要想求解粒子的运动状态就必须把运动方程离散化,离散化的方法有经典Verlet算法、蛙跳算法(Leap-frog)、速度Veriet算法、Gear预估-校正法等。这些算法有其各自的优势,选取时可按照计算要求选择最合适的算法。 统计系统各物理量时,便又涉及到系统是选取了什么系综。只有知道了模拟系统采用的系综才能釆用相对应的统计方法更加准确,有效地进行统计计算,减少信息损失。 2. 分子动力学模拟程序流程 具体到分子动力学模拟程序的具体流程,主要包括: (1)设定和模拟相关的参数。 (2)模拟体系初始化。 (3)计算粒子间的作用力。 (4)求解运动方程。 (5)循环计算,待稳定后输出结果。 分子动力学模拟程序流程图如2.3所示。

分子动力学模拟

分子动力学模拟 分子动力学就是一门结合物理,数学与化学的综合技术。分子动力学就是一套分子模拟方法,该方法主要就是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量与其她宏观性质。 这门技术的发展进程就是: 1980年:恒压条件下的动力学方法(Andersenの方法、Parrinello-Rahman法) 1983年:非平衡态动力学方法(Gillan and Dixon) 1984年:恒温条件下的动力学方法(能势‐フーバーの方法) 1985年:第一原理分子动力学法(→カー?パリネロ法) 1991年:巨正则系综的分子动力学方法(Cagin and Pettit)、 最新的巨正则系综,即为组成系综的系统与一温度为T、化学势为μ的很大的热源、粒子源相接触,此时系统不仅同热源有能量交换,而且可以同粒子源有粒子的交换,最后达到平衡,这种系综称巨正则系综。 进行分子动力学模拟的第一步就是确定起始构型,一个能量较低的起始构型就是进行分子模拟的基础,一般分子的其实构型主要就是来自实验数据或量子化学计算。在确定起始构型之后要赋予构成分子的各个原子速度,这一速度就是根据玻尔兹曼分布随机生成,由于速度的分布符合玻尔兹曼统计,因此在这个阶段,体系的温度就是恒定的。另外,在随机生成各个原子的运动速度之后须进行调整,使得体系总体在各个方向上的动量之与为零,即保证体系没有平动位移。 由上一步确定的分子组建平衡相,在构建平衡相的时候会对构型、温度等参数加以监控。 进入生产相之后体系中的分子与分子中的原子开始根据初始速度运动,可以想象其间会发生吸引、排斥乃至碰撞,这时就根据牛顿力学与预先给定的粒子间相互作用势来对各个例子的运动轨迹进行计算,在这个过程中,体系总能量不变,但分子内部势能与动能不断相互转化,从而体系的温度也不断变化,在整个过程中,体系会遍历势能面上的各个点,计算的样本正就是在这个过程中抽取的。 用抽样所得体系的各个状态计算当时体系的势能,进而计算构型积分。 作用势的选择与动力学计算的关系极为密切,选择不同的作用势,体系的势能面会有不同的形状,动力学计算所得的分子运动与分子内部运动的轨迹也会不同,进而影响到抽样的结果与抽样结果的势能计算,在计算宏观体积与微观成分关系的时候主要采用刚球模型的二体势,计算系统能量,熵等关系时早期多采用Lennard-Jones、morse势等双体势模型,对于金属计算,主要采用morse势,但就是由于通过实验拟合的对势容易导致柯西关系,与实验不符,因此在后来的模拟中有人提出采用EAM等多体势模型,或者采用第一性原理计算结果通过一定的物理方法来拟合二体势函数。但就是对于二体势模型,多体势往往缺乏明确的表达式,参量很多,模拟收敛速度很慢,给应用带来很大困难,因此在一般应用中,通过第一性原理计算结果拟合势函数的L-J,morse等势模型的应用仍非常广泛。 分子动力学计算的基本思想就是赋予分子体系初始运动状态之后,利用分子的自然运动在相空间中抽取样本进行统计计算,时间步长就就是抽样的间隔,因而时间步长的选取对动力学模拟非常重要。太长的时间步长会造成分子间的激烈碰撞,体系数据溢出;太短的时间步长会降低模拟过程搜索相空间的能力,因此一般选取的时间步长为体系各个自由度中最短运动周期的十分之一。但就是通常情况下,体系各自由度中运动周期最短的就是各个化学键的振动,而这种运动对计算某些宏观性质并不产生影响,因此就产生了屏蔽分子内部振动或其她无关运动的约束动力学,约束动力学可以有效地增长分子动力学模拟时间步长,提高搜索相空间的能

分子动力学方法模拟基本步骤

分子动力学方法模拟基本步骤 1.第一步 即模型的设定,也就是势函数的选取。势函数的研究和物理系统上对物质的描述研究息息相关。最早是硬球势,即小于临界值时无穷大,大于等于临界值时为零。常用的是LJ势函数,还有EAM势函数,不同的物质状态描述用不同的势函数。 模型势函数一旦确定,就可以根据物理学规律求得模拟中的守恒量。 2 第二步 给定初始条件。运动方程的求解需要知道粒子的初始位置和速度,不同的算法要求不同的初始条件。如:verlet算法需要两组坐标来启动计算,一组零时刻的坐标,一组是前进一个时间步的坐标或者一组零时刻的速度值。 一般意思上讲系统的初始条件不可能知道,实际上也不需要精确选择代求系统的初始条件,因为模拟实践足够长时,系统就会忘掉初始条件。当然,合理的初始条件可以加快系统趋于平衡的时间和步伐,获得好的精度。 常用的初始条件可以选择为:令初始位置在差分划分网格的格子上,初始速度则从玻尔兹曼分布随机抽样得到;令初始位置随机的偏离差分划分网格的格子上,初始速度为零;令初始位置随机的偏离差分划分网格的格子上,初始速度也是从玻尔兹曼分布随机抽样得到。 第三步 趋于平衡计算。在边界条件和初始条件给定后就可以解运动方程,进行分子动力学模拟。但这样计算出的系统是不会具有所要求的系统的能量,并且这个状态本身也还不是一个平衡态。 为使得系统平衡,模拟中设计一个趋衡过程,即在这个过程中,我们增加或者从系统中移出能量,直到持续给出确定的能量值。我们称这时的系统已经达到平衡。这段达到平衡的时间成为驰豫时间。 分子动力学中,时间步长的大小选择十分重要,决定了模拟所需要的时间。为了减小误差,步长要小,但小了系统模拟的驰豫时间就长了。因此根据经验选择适当的步长。如,对一个具有几百个氩气Ar分子的体系,lj势函数,发现取h为0.01量级,可以得到很好的相图。这里选择的h是没有量纲的,实际上这样选择的h对应的时间在10-14s的量级呢。如果模拟1000步,系统达到平衡,驰豫时间只有10-11s。 第四步 宏观物理量的计算。实际计算宏观的物理量往往是在模拟的最后揭短进行的。它是沿相空间轨迹求平均来计算得到的(时间平均代替系综平均)

分子动力学模拟方法概述(精)

《装备制造技术》 2007年第 10期 收稿日期 :2007-08-21 作者简介 :申海兰 , 24岁 , 女 , 河北人 , 在读研究生 , 研究方向为微机电系统。 分子动力学模拟方法概述 申海兰 , 赵靖松 (西安电子科技大学机电工程学院 , 陕西西安 710071 摘要 :介绍了分子动力学模拟的基本原理及常用的原子间相互作用势 , 如Lennard-Jones 势 ; 论述了几种常用的有限差分算法 , 如 Verlet 算法 ; 说明了分子动力学模拟的几种系综及感兴趣的宏观统计量的提取。关键词 :分子动力学模拟 ; 原子间相互作用势 ; 有限差分算法 ; 系综中图分类号 :O3 文献标识码 :A 文章编号 :1672-545X(200710-0029-02 从统计物理学中衍生出来的分子动力学模拟方法 (molec- ular dynamics simulation , M DS , 实践证明是一种描述纳米科技 研究对象的有效方法 , 得到越来越广泛的重视。所谓分子动力学模拟 , 是指对于原子核和电子所构成的多体系统 , 用计算机模拟原子核的运动过程 , 从而计算系统的结构和性质 , 其中每一个原子核被视为在全部其他原子核和电子所提供的经验势场作用下按牛顿定律运动 [1]。它被认为是本世纪以来除理论分析和实验观察之外的第三种科学研究手段 , 称之为“计算机实验” 手段 [2], 在物理学、化学、生物学和材料科学等许多领域中得到广泛地应用。

根据模拟对象的不同 , 将它分为平衡态分子动力学模拟 (EM DS (和非平衡态分子动力学模拟 (NEM DS 。其中 , EM DS 是分子动力学模拟的基础 ; NEM DS 适用于非线性响应系统的模拟 [3]。下面主要介绍 EM DS 。 1分子动力学方法的基本原理 计算中根据以下基本假设 [4]: (1 所有粒子的运动都遵循经典牛顿力学规律。 (2 粒子之间的相互作用满足叠加原理。 显然这两条忽略了量子效应和多体作用 , 与真实物理系统存在一定差别 , 仍然属于近似计算。 假设 N 为模拟系统的原子数 , 第 i 个原子的质量为 m i , 位置坐标向量为 r i , 速度为 v i =r ? i , 加速度为 a i =r ?? i , 受到的作用力为 F i , 原子 i 与原子 j 之间距离为 r ij =r i -r j , 原子 j 对原子 i 的作用力为 f ij , 原子 i 和原子 j 相互作用势能为 ! (r ij , 系统总的势能为 U (r 1, r 2, K r N = N i =1! j ≠ i ! " (r ij , 所有的物理量都是随时 间变化的 , 即 A=A (t , 控制方程如下 : m i r ?? i =F i =j ≠ i

分子动力学模拟

分子动力学模拟 分子动力学是一门结合物理,数学和化学的综合技术。分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。 这门技术的发展进程是: 1980年:恒压条件下的动力学方法(Andersenの方法、Parrinello-Rahman法) 1983年:非平衡态动力学方法(Gillan and Dixon) 1984年:恒温条件下的动力学方法(能势‐フーバーの方法) 1985年:第一原理分子动力学法(→カー?パリネロ法) 1991年:巨正则系综的分子动力学方法(Cagin and Pettit). 最新的巨正则系综,即为组成系综的系统与一温度为T、化学势为μ的很大的热源、粒子源相接触,此时系统不仅同热源有能量交换,而且可以同粒子源有粒子的交换,最后达到平衡,这种系综称巨正则系综。 进行分子动力学模拟的第一步是确定起始构型,一个能量较低的起始构型是进行分子模拟的基础,一般分子的其实构型主要是来自实验数据或量子化学计算。在确定起始构型之后要赋予构成分子的各个原子速度,这一速度是根据玻尔兹曼分布随机生成,由于速度的分布符合玻尔兹曼统计,因此在这个阶段,体系的温度是恒定的。另外,在随机生成各个原子的运动速度之后须进行调整,使得体系总体在各个方向上的动量之和为零,即保证体系没有平动位移。 由上一步确定的分子组建平衡相,在构建平衡相的时候会对构型、温度等参数加以监控。 进入生产相之后体系中的分子和分子中的原子开始根据初始速度运动,可以想象其间会发生吸引、排斥乃至碰撞,这时就根据牛顿力学和预先给定的粒子间相互作用势来对各个例子的运动轨迹进行计算,在这个过程中,体系总能量不变,但分子内部势能和动能不断相互转化,从而体系的温度也不断变化,在整个过程中,体系会遍历势能面上的各个点,计算的样本正是在这个过程中抽取的。 用抽样所得体系的各个状态计算当时体系的势能,进而计算构型积分。 作用势的选择与动力学计算的关系极为密切,选择不同的作用势,体系的势能面会有不同的形状,动力学计算所得的分子运动和分子内部运动的轨迹也会不同,进而影响到抽样的结果和抽样结果的势能计算,在计算宏观体积和微观成分关系的时候主要采用刚球模型的二体势,计算系统能量,熵等关系时早期多采用Lennard-Jones、morse势等双体势模型,对于金属计算,主要采用morse势,但是由于通过实验拟合的对势容易导致柯西关系,与实验不符,因此在后来的模拟中有人提出采用EAM等多体势模型,或者采用第一性原理计算结果通过一定的物理方法来拟合二体势函数。但是对于二体势模型,多体势往往缺乏明确的表达式,参量很多,模拟收敛速度很慢,给应用带来很大困难,因此在一般应用中,通过第一性原理计算结果拟合势函数的L-J,morse等势模型的应用仍非常广泛。 分子动力学计算的基本思想是赋予分子体系初始运动状态之后,利用分子的自然运动在相空间中抽取样本进行统计计算,时间步长就是抽样的间隔,因而时间步长的选取对动力学模拟非常重要。太长的时间步长会造成分子间的激烈碰撞,体系数据溢出;太短的时间步长会降低模拟过程搜索相空间的能力,因此一般选取的时间步长为体系各个自由度中最短运动周期的十分之一。但是通常情况下,体系各自由度中运动周期最短的是各个化学键的振动,而这种运动对计算某些宏观性质并不产生影响,因此就产生了屏蔽分子内部振动或其他无关运动的约束动力学,约束动力学可以有效地增长分子动力学模拟时间步长,提高搜索相空间的能

MS分子动力学模拟具体实施步骤

第3章 铁基块体非晶合金‐纳米晶转变的动力学模拟过程 3.1 Discover模块 3.1.1 原子力场的分配 在使用Discover模块建立基于力场的计算中,涉及几个步骤。主要有:选择力场、指定原子类型、计算或指定电荷、选择non‐bond cutoffs。 在这些步骤中,指定原子类型和计算电荷一般是自动执行的。然而,在某些情形下需要手动指定原子类型。原子定型使用预定义的规则对结构中的每个原子指定原子类型。在为特定的系统确定能量和力时,定型原子使工作者能使用正确的力场参数。通常,原子定型由Discover使用定型引擎的基本规则来自动执行,所以不需要手动原子定型。然而,在特殊情形下,人们不得不手动的定型原子,以确保它们被正确地设置。 图 3-1 1)计算并显示原子类型:点击Edit→Atom Selection,如图3‐1所示 图3-2 弹出对话框,如图3‐2所示 从右边的…的元素周期表中选择Fe,再点Select,此时所建晶胞中所有Fe

原子都将被选中,原子被红色线圈住即表示原子被选中。再编辑集合,点击Edit →Edit Sets,如图3‐3、3‐4所示。 图3-3 图3-4 弹出对话框见图3‐4,点击New...,给原子集合设定一个名字。这里设置为Fe,则3D视图中会显示“Fe”字样,再分配力场:在工具栏上点击Discover按 钮,从下拉列表中选择Setup,显示Discover Setup对话框,选择Typing选项卡,见图3‐5。 图3-5 在Forcefield types里选择相应原子力场,再点Assign(分配)按钮进行原子力场分配。注意原子力场中的价态要与Properties Project里的原子价态(Formalcharge)一致。

分子动力学模拟-经验谈

分子动力学攻略 此文为dddc_redsnow发表于biolover上的关于分子动力学的系列原创文章,相当经典与精彩,特此将系列文章整合,一起转载,望学习动力学的新手们共同学习,提高进步,在此特向dddc_redsnow本人表示感谢。 动力学系列之一(gromacs,重发) 在老何的鼓励下,发一下我的gromacs上手手册(我带人时用的,基本半天可以学会gromcas) ###################################################### # Process protein files step by step # ###################################################### pdb2gmx -f 2th_cap.pdb -o 2th_cap.gro -p 2th_cap.top -ignh -ter nedit 2th_cap.top editconf -f 2th_cap.gro -o 2th_cap_box.gro -d 1.5 genbox -cp 2th_cap_box.gro -cs -p 2th_cap.top -o 2th_cap_water.gro make_ndx -f 2th_cap_water.gro -o 2th_cap.ndx genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_All.itp genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_M.itp genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_C.itp nedit Flavo.itp grompp -f em.mdp -c 2th_cap_water.gro -p 2th_cap.top -o prepare.tpr genion -s prepare.tpr -o 2th_cap_water_ion.gro -np 1 -pq 1 ##################################################### # Minimize step by step # # 1. minimization fixing whole protein # # 2. minimization fixing maincharin of protein # # 3. minimization fixing Ca of protein # # 4. minimization without fix # ##################################################### grompp -np 4 -f em.mdp -c 2th_cap_water_ion.gro -p 2th_cap.top -o minimize_water.tpr mpirun -np 4 mdrun -nice 0 -s minimize_water.tpr -o minimize_water.trr -c minimize_water.gro -e minimize_water.edr -g minimize_water.log & grompp -np 4 -f em.mdp -c minimize_water.gro -p 2th_cap.top -o minimize_sidechain.tpr mpirun -np 4 mdrun -nice 0 -s minimize_sidechain.tpr -o minimize_sidechain.trr -c minimize_sidechain.gro -e minimize_sidechain.edr -g minimize_sidechain.log & grompp -np 4 -f em.mdp -c minimize_sidechain.gro -p 2th_cap.top -o minimize_sidechain_ex.tpr mpirun -np 4 mdrun -nice 0 -s minimize_sidechain_ex.tpr -o minimize_sidechain_ex.trr -c minimize_sidechain_ex.gro -e minimize_sidechain_ex.edr minimize_sidechain_ex.log & grompp -np 4 -f em.mdp -c minimize_sidechain_ex.gro -p 2th_cap.top -o minimize_all.tpr mpirun -np 4 mdrun -nice 0 -s minimize_all.tpr -o minimize_all.trr -c minimize_all.gro -e minimize_allx.edr -g minimize_all.log&

分子动力学模拟讲解

分子动力学模拟 一,软件: NAMD:https://www.360docs.net/doc/2313947402.html,/Research/namd/免费注册之后进行免费下载, 只需要下载解压不需要安装 VMD:https://www.360docs.net/doc/2313947402.html,/Research/vmd/免费,分子可视化和辅助分析软 件 二,分子动力学模拟需要的数据文件包括: (1)蛋白质的PDB文件,此文件只记录原子空间位置,能够从RCSB管理的PDB数据库(https://www.360docs.net/doc/2313947402.html,/pdb/)下载。 (2)PSF文件,此文件负责储存蛋白质的结构信息,记录蛋白质原子之间的成键情况。用户需要根据自己要求生成该文件。 (3)力场参数文件。此文件是分子动力学模拟的核心。CHAYMM,X-PLOR,AMBER和GROMACS 是经常用到的四种力场。NAMD能够利用上述每一种力场执行分子动力学模拟。 (4)配置文件(configuration file)。此文件作用是告知NAMD分子动力学模拟的各种参数,例如PDB和PSF两个文件保存的位置,模拟结果储存在哪里,体系的温度是多少等等。此文件也是要用户根据需求自己生成。同一配置的电脑,蛋白质分子大小不同,模拟运行的时间也不同,通常大蛋白质需要较长的时间。 三.以蛋白质1L63为例给出操作说明。 在PDB数据库下载蛋白质1L63. 建立文件夹1L63,其中包括以下几个文件,其中.conf文件需要修改,下面第4步会讲到。 以下生成PSF文件: 1.单击VMD,file-New Molecule-打开Molecule File Browser对话框,单击Browse按钮,在文件浏览器中找到文件夹1L63,在此文件夹中选择1L63.pdb,单击Load按钮载入1L63.pdb 2.除去pdb文件中带有的水分子 单击Extension-TK Console,弹出VMD Tk Console窗口。 首先用cd命令改变当前目录到1L63文件夹下,然后输入下列命令: set L63[atomselect top protein] $L63writepdb L63p.pdb 这样,1L63文件夹下就生成了文件L63P.pdb。这一PDB文件仅包含蛋白质,不包含水分子。 3.生成psf文件。 注意,这里仅讲全自动的psf文件生成器,描述如下: 选择Extensions-Modeling-Automatic PSF Builder菜单项,点击左上角的Options,选择Add solvation box,和Add neutralizing ions,点击右下角的I’m feeling lucky按钮,

分子动力学模拟教学教材

分子动力学模拟

分子动力学模拟 分子动力学是一门结合物理,数学和化学的综合技术。分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。 这门技术的发展进程是: 1980年:恒压条件下的动力学方法(Andersenの方法、Parrinello-Rahman法)1983年:非平衡态动力学方法(Gillan and Dixon) 1984年:恒温条件下的动力学方法(能势‐フーバーの方法) 1985年:第一原理分子动力学法(→カー?パリネロ法) 1991年:巨正则系综的分子动力学方法(Cagin and Pettit). 最新的巨正则系综,即为组成系综的系统与一温度为T、化学势为μ的很大的热源、粒子源相接触,此时系统不仅同热源有能量交换,而且可以同粒子源有粒子的交换,最后达到平衡,这种系综称巨正则系综。 进行分子动力学模拟的第一步是确定起始构型,一个能量较低的起始构型是进行分子模拟的基础,一般分子的其实构型主要是来自实验数据或量子化学计算。在确定起始构型之后要赋予构成分子的各个原子速度,这一速度是根据玻尔兹曼分布随机生成,由于速度的分布符合玻尔兹曼统计,因此在这个阶段,体系的温度是恒定的。另外,在随机生成各个原子的运动速度之后须进行调整,使得体系总体在各个方向上的动量之和为零,即保证体系没有平动位移。由上一步确定的分子组建平衡相,在构建平衡相的时候会对构型、温度等参数加以监控。

进入生产相之后体系中的分子和分子中的原子开始根据初始速度运动,可以想象其间会发生吸引、排斥乃至碰撞,这时就根据牛顿力学和预先给定的粒子间相互作用势来对各个例子的运动轨迹进行计算,在这个过程中,体系总能量不变,但分子内部势能和动能不断相互转化,从而体系的温度也不断变化,在整个过程中,体系会遍历势能面上的各个点,计算的样本正是在这个过程中抽取的。 用抽样所得体系的各个状态计算当时体系的势能,进而计算构型积分。 作用势的选择与动力学计算的关系极为密切,选择不同的作用势,体系的势能面会有不同的形状,动力学计算所得的分子运动和分子内部运动的轨迹也会不同,进而影响到抽样的结果和抽样结果的势能计算,在计算宏观体积和微观成分关系的时候主要采用刚球模型的二体势,计算系统能量,熵等关系时早期多采用Lennard-Jones、morse势等双体势模型,对于金属计算,主要采用morse 势,但是由于通过实验拟合的对势容易导致柯西关系,与实验不符,因此在后来的模拟中有人提出采用EAM等多体势模型,或者采用第一性原理计算结果通过一定的物理方法来拟合二体势函数。但是对于二体势模型,多体势往往缺乏明确的表达式,参量很多,模拟收敛速度很慢,给应用带来很大困难,因此在一般应用中,通过第一性原理计算结果拟合势函数的L-J,morse等势模型的应用仍非常广泛。 分子动力学计算的基本思想是赋予分子体系初始运动状态之后,利用分子的自然运动在相空间中抽取样本进行统计计算,时间步长就是抽样的间隔,因而时间步长的选取对动力学模拟非常重要。太长的时间步长会造成分子间的激烈碰撞,体系数据溢出;太短的时间步长会降低模拟过程搜索相空间的能力,因此

分子动力学模拟基础知识

分子动力学模拟基础知识 ? Molecular Dynamics Simulation o MD: Theoretical Background Newtonian Mechanics and Numerical Integration The Liouville Operator Formalism to Generating MD Integration Schemes o Case Study 1: An MD Code for the Lennard-Jones Fluid Introduction The Code, mdlj.c o Case Study 2: Static Properties of the Lennard-Jones Fluid (Case Study 4 in F&S) o Case Study 3: Dynamical Properties: The Self-Diffusion Coefficient ? Ensembles o Molecular Dynamics at Constant Temperature Velocity Scaling: Isokinetics and the Berendsen Thermostat Stochastic NVT Thermostats: Andersen, Langevin, and Dissipative Particle Dynamics The Nosé-Hoover Chain Molecular Dynamics at Constant Pressure: The Berendsen Barostat Molecular Dynamics Simulation We saw that the Metropolis Monte Carlo simulation technique generates a sequence of states with appropriate probabilities for computing ensemble averages (Eq. 1). Generating states probabilitistically is not the only way to explore phase space. The idea behind the Molecular Dynamics (MD) technique is that we can observe our dynamical system explore phase space by solving all particle equations of motion . We treat the particles as classical objects that, at least at this stage of the course, obey Newtonian mechanics. Not only does this in principle provide us with a properly weighted sequence of states over which we can compute ensemble averages, it additionally gives us time-resolved information, something that Metropolis Monte Carlo cannot provide. The ``ensemble averages'' computed in traditional MD simulations are in practice time averages : (99) The ergodic hypothesis partially requires that the measurement time, , i , in the system. The price we pay for this extra information is that we must at least access if not store particle velocities in addition to positions, and we must compute interparticle forces in addition to potential energy. We will introduce and explore MD in this section.

分子动力学模拟I

Gromacs中文教程 淮海一粟 分子动力学(MD)模拟分为三步:首先,要准备好模拟系统;然后,对准备好的系统进行模拟;最后,对模拟结果进行分析。虽然第二步是最耗费计算资源的,有时候需要计算几个月,但是最耗费体力的步骤在于模拟系统准备和结果分析。本教程涉及模拟系统准备、模拟和结果分析。 一、数据格式处理 准备好模拟系统是MD最重要的步骤之一。MD模拟原子尺度的动力学过程,可用于理解实验现象、验证理论假说,或者为一个待验证的新假说提供基础。然而,对于上述各种情形,都需要根据实际情况对模拟过程进行设计;这意味着模拟的时候必须十分小心。 丢失的残基、原子和非标准基团 本教程模拟的是蛋白质。首先需要找到蛋白质序列并选择其起始结构,见前述;然后就要检查这个结构是否包含所有的残基和原子,这些残基和原子有时候也是模拟所必需的。本教程假定不存在缺失,故略去。 另一个需要注意的问题是结构文件中可能包含非标准残基,被修饰过的残基或者配体,这些基团还没有力场参数。如果有这些基团,要么被除去,要么就需要补充力场参数,这牵涉到MD的高级技巧。本教程假定所有的蛋白质不含这类残基。 结构质量 对结构文件进行检查以了解结构文件的质量是一个很好的练习。例如,晶体结构解析过程中,对于谷氨酰胺和天冬酰胺有可能产生不正确的构象;对于组氨酸的质子化状态和侧链构象的解析也可能有问题。为了得到正确的结构,可以利用一些程序和服务器(如 WHATIF)。本教程假定所用的结构没有问题,我们只进行数据格式处理。 二、结构转换和拓扑化 一个分子可以由各个原子的坐标、键接情况与非键相互作用来确定。由于.pdb 结构文件只含有原子坐标,我们首先必须建立拓扑文件,该文件描述了原子类型、电荷、成键情况等信息。拓扑文件对应着一种力场,选择何种力场对于拓扑文件的建立是一个值得仔细考虑的问题。这里我们用的是GROMOS96 53a6连接原子力场,该力场对于氨基酸侧链的自由能预测较好,并且与NMR试验结果较吻合。

分子动力学模拟

分子动力学模拟 The Standardization Office was revised on the afternoon of December 13, 2020

分子动力学模拟 分子动力学是一门结合物理,数学和化学的综合技术。分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。 这门技术的发展进程是: 1980年:恒压条件下的动力学方法(Andersenの方法、Parrinello-Rahman法)1983年:非平衡态动力学方法(Gillan and Dixon) 1984年:恒温条件下的动力学方法(能势‐フーバーの方法) 1985年:第一原理分子动力学法(→カー?パリネロ法) 1991年:巨正则系综的分子动力学方法(Cagin and Pettit). 最新的巨正则系综,即为组成系综的系统与一温度为T、化学势为μ的很大的热源、粒子源相接触,此时系统不仅同热源有能量交换,而且可以同粒子源有粒子的交换,最后达到平衡,这种系综称巨正则系综。 进行分子动力学模拟的第一步是确定起始构型,一个能量较低的起始构型是进行分子模拟的基础,一般分子的其实构型主要是来自实验数据或量子化学计算。在确定起始构型之后要赋予构成分子的各个原子速度,这一速度是根据玻尔兹曼分布随机生成,由于速度的分布符合玻尔兹曼统计,因此在这个阶段,体系的温度是恒定的。另外,在随机生成各个原子的运动速度之后须进行调整,使得体系总体在各个方向上的动量之和为零,即保证体系没有平动位移。由上一步确定的分子组建平衡相,在构建平衡相的时候会对构型、温度等参数加以监控。

分子动力学模拟及其在材料中的研究进展

《材料计算设计基础》 学号: 流水号: 姓名: 完成日期:

分子动力学模拟及其在材料中的研究进展 摘要:本文综述了分子动力学模拟技术的发展,介绍了分子动力学的分类、运动方程的求解、初始条件和边界条件的选取、平衡系综及其控制、感兴趣量的提取以及分子动力学模拟在材料中的研究进展。 关键词:分子动力学模拟平衡态系综金属材料感兴趣量径向分布函数 引言 科学工作者在长期的科学研究实践中发现,当实验研究方法不能满足研究工作的需求时,用计算机模拟却可以提供实验上尚无法获得或很难获得的重要信息;尽管计算机模拟不能完全取代实验,但可以用来指导实验,并验证某些理论假设,从而促进理论和实验的发展。特别是在材料形成过程中许多与原子有关的微观细节,在实验中基本上是无法获得的,而在计算机模拟中即可以方便地得到。这种优点使分子动力学模拟在金属材料研究中显得非常有吸引力。 分子动力学MD (Molecular Dynamics)模拟就是用计算机方法来表示统计力学,作为实验的一个辅助手段。MD模拟就是对于原子核和电子所构成的多体系统,求解运动方程(如牛顿方程、哈密顿方程或拉格朗日方程),其中每一个原子核被视为在全部其它原子核和电子作用下运动,通过分析系统中各粒子的受力情况,用经典或量子的方法求解系统中各粒子在某时刻的位置和速度,以确定粒子的运动状态,进而计算系统的结构和性质。该模拟技术主要涉及粒子运动的动力学问题,与蒙特卡罗模拟方法(简称MC)相比,分子动力学是一种“确定性方法”, 它所计算的是时间平均,而MC进行的是系综平均。然而按照统计力学各态历经假设,时间平均等价于系综平均。因此,两种方法严格的比较计算能给出几乎相同的结果。 经典的分子动力学方法是Alder等于1957年提出并首先在“硬球”液体模型下应用,发现了由Kirkwood在1939年根据统计力学预言的“刚性球组成的集合系统会发生有液相到结晶相的转变”。后来人们称这种相变为Alder相变。Rahman

金属铝分子动力学模拟

物理计算与设计报告书 院(系)名称: 学生姓名: 专业名称: 班级: 时间: 金属铝分子动力学模拟

摘要:分子动力学模拟,是指对于原子核和电子所构成的多体系统,用计算机模拟 原子核的运动过程,并从而计算系统的结构和性质,其中每一原子核被视为在全部其它 原子核和电子所提供的经验势场作用下按牛顿定律运动。我们用c语言编写程序,VMD 动画演示得到原子在拉伸过程中的变化。在控制温度不变的情况下,得到了金属铝分子 的动力学模拟过程。通过不断拉伸,趋衡铝分子,计算其势能,力,速度,观察每次拉 伸过程中以及拉伸后铝原子的排列,得到金属铝的运动细节,从而更加利于我们了解铝 的性质。 结论:原子两端的拉力与原子势能的变化曲线基本一致。原子间断层以滑层方式断 裂。 关键词:铝分子,分子动力学,c语言,势能 1 引言 人们很早就知道材料的力学性能随尺度发生变化尺度减小, 材料中缺陷存在的几率降低, 材料的强度提高同时尺度的变化可能导致材料内在变形竞争机制的改变, 例如多晶材料晶粒粒径在微米级以上时, 强度主要受位错强化机制控制, 而粒径进入纳米级后, 材料的变形主要来源于晶界滑移等机制原子尺度下, 微观效应占主导地位, 材料的理化、力学性能表现出与宏观不同、甚至相反的特性。Brenner发现金属单晶晶须拉伸强度与晶须直径呈反比,Fleck在微米级细铜丝的扭转试验中观察到尺寸效应纳米电机系统(NEMS)的出现同迫切要求了解纳米尺度下材料的力学行为, 当前从实验上较难获得详细的信息, 而分子动力学模拟可以提供相关细节. 分子动力学通过直接模拟原子的运动过程, 使我们能够详细了解模拟对象的演化发展历史分子动力学模拟的一个关键在于原子势函数的选取原子势早期一般采用简单的对势, 但对势无法正确描述弹性常数, 其结果不理想世纪年代提出的镶嵌原子法、有效介质理论更客观地反映了原子间多体作用的本质, 可得到较合理的结果.认为体系总能量为

分子动力学模拟方法的基本原理与应用

分子动力学模拟方法的基本原理与应用 摘要: 介绍了分子动力学模拟的基本原理及常用的原子间相互作用势, 如Lennard-Jones势; 论述了几种常用的有限差分算法, 如Verlet算法; 说明了分子动力学模拟的几种系综及感兴趣的宏观统计量的提取。 关键词: 分子动力学模拟; 原子间相互作用势; 有限差分算法; 分子动力学是一门结合物理,数学和化学的综合技术。分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。 从统计物理学中衍生出来的分子动力学模拟方法(Molecular Dynamics Simulation, MDS) , 实践证明是一种描述纳米科技研究对象的有效方法, 得到越来越广泛的重视。所谓分子动力学模拟, 是指对于原子核和电子所构成的多体系统, 用计算机模拟原子核的运动过程, 从而计算系统的结构和性质, 其中每一个原子核被视为在全部其他原子核和电子所提供的经验势场作用下按牛顿定律运动。它被认为是本世纪以来除理论分析和实验观察之外的第三种科学研究手段, 称之为“计算机实验”手段, 在物理学、化学、生物学和材料科学等许多领域中得到广泛地应用。 科学工作者在长期的科学研究实践中发现,当实验研究方法不能满足研究工作的需求时,用计算机模拟却可以提供实验上尚无法获得或很难获得的重要信息;尽管计算机模拟不能完全取代实验,但可以用来指导实验,并验证某些理论假设,从而促进理论和实验的发展。特别是在材料形成过程中许多与原子有关的微观细节,在实验中基本上是无法获得的,而在计算机模拟中即可以方便地得到。这种优点使分子动力学模拟在材料研究中显得非常有吸引力。 分子动力学模拟就是用计算机方法来表示统计力学,作为实验的一个辅助手段。分子模拟就是对于原子核和电子所构成的多体系统,求解运动方程(如牛顿方程、哈

分子动力学模拟知识点总结

分子动力学模拟: 对于原子核和电子组成的多体体系,求解运动方程(哈密顿,牛顿,拉格朗日),用经典和量子化方法求解粒子的运动状态。 MC方法:系综(抽样)平均法分子动力学:时间平均 一优点:遇到的不利影响因素回避掉,从而达到实验研宄难以实现的控制条件。核心算法:粒子的运动状态就必须把运动方程离散化,离散化的方法有经典Verlet算法、蛙跳算法(Leap-frog)、速度Veriet算法、Gear预估-校正法等。缺点:元胞体积和形状不变,不含有自由电子,对金属体系计算不理想。 注意:一般而言,MD模拟时间足够长,初始条件不会影响计算结果,但是会加大构型平衡的计算时间。 二步骤: 1.选取所要研究的系统并建立适当的模拟模型。 2.设定区域的边界条件,选取粒子间相互作用势模型;要注意观察PBC边界条 件的使用,以及计算格子和建模的晶格子之间的关系。体系是单胞沿不同方向重复叠合而组成。但模拟时只保留基本单元,由平移对称矩阵计算得到其他原子的空间坐标。最小近邻的截断半径。 3.设定系统所有粒子的初始位置和初始速度; 4.计算粒子间相互作用力和势能,以及各个粒子的位置和速度;最好与实际模 型相符,以减少达到平衡的时间。势场参数调整,最小近邻的截断半径。 对势:LJ势(惰性气体,过渡金属,柔韧材料),Born-lande势(离子晶体),Morse势,Johnson势(金属)发展到三体势,缺点是导致Cauchy关系,即不能描述晶体的弹性性质。 多体势:80年代以后,EAM势等(晶体对势+核嵌入电子云嵌入能),多用于金属。 5.待体系达到平衡后,构型积分获得体系的宏观性质。选取合适的系综,控制

相关文档
最新文档