新一代高精度生物大分子力场
gaff力场分子模型

gaff力场分子模型(原创实用版)目录1.GAFF 力场分子模型简介2.GAFF 力场的发展历程3.GAFF 力场的特点和优势4.GAFF 力场在我国的应用现状与前景正文一、GAFF 力场分子模型简介GAFF(General Amino Acid Force Field)力场分子模型是一种用于描述生物大分子(如蛋白质和核酸)中分子间相互作用力的物理模型。
在生物物理学、生物信息学和药物设计等领域具有广泛应用。
该模型通过大量实验数据和理论计算参数化,以模拟生物大分子在各种条件下的结构和动力学行为。
二、GAFF 力场的发展历程GAFF 力场分子模型的发展始于 20 世纪 90 年代,由美国加州大学洛杉矶分校的研究团队提出。
该团队基于早期的力场模型,如 MM3、MM4 和MM5 等,结合大量实验数据,对力场参数进行了优化和改进,最终形成了GAFF 力场。
此后,GAFF 力场经过多次更新和完善,现已成为生物大分子研究领域的重要工具。
三、GAFF 力场的特点和优势1.高精度:GAFF 力场分子模型通过大量的实验数据和理论计算参数化,具有较高的模拟精度,能够较好地反映生物大分子在实际环境中的结构和动力学特征。
2.广泛适用性:GAFF 力场适用于多种生物大分子,包括蛋白质、核酸、多糖等,为研究不同类型生物大分子的相互作用提供了便利。
3.灵活性:GAFF 力场提供了多种算法和参数设置,可以根据研究者的需求和计算资源进行选择,适应不同应用场景的需求。
4.开源性:GAFF 力场分子模型的源代码和相关工具对外公开,便于研究者进行二次开发和定制,促进了该领域的技术创新和应用拓展。
四、GAFF 力场在我国的应用现状与前景近年来,我国在生物物理学、生物信息学和药物设计等领域取得了显著进展,GAFF 力场分子模型在这些成果中发挥了重要作用。
目前,我国已有多个研究团队在 GAFF 力场的基础上,开展了针对特定生物大分子或疾病的研究,取得了一系列原创性成果。
NAMD 是一个用于生物大分子大规模分子动力学的并行软件软件介绍

1软件介绍NAMD是一个用于生物大分子大规模分子动力学的并行软件,支持Charmm、Namd和Amber 等多种力场,由美国Illinois大学生物物理系和计算机系联合开发,旨在开发出高效的分子动力学并行程序,可支持Charm++并行。
目前NAMD还支持在GPU加速器上的运算。
NAMD具有非常强的大规模并行计算能力,已经实现了在上千个处理器上的并行计算,对包含超过三十万个原子的大分子系统进行模拟。
NAMD注册后可以免费下载使用:/Research/namd/2软件依赖Fortran90编译:操作系统自带的GCC编译器;单精度FFTW3数学库: fftw3,编译时加--enable-float选项;GPU节点CUDA驱动;还依赖以下系统盘自带的安装包:tcl-8.5.7-6.el6.x86_64tcl-devel-8.5.7-6.el6.x86_64numactl-devel-2.0.7-6.el6.x86_64操作系统:Ubuntu 16.043安装步骤3.1CUDA到https:///cuda-downloads下载对应操作系统的cuda安装包。
下载后执行:chmod +x cuda_9.0.176_384.81_linux.run #使之具有可执行权限sudo sh cuda_9.0.176_384.81_linux.run然后按照相关的提示输入安装路径即可,本文选择默认路径。
详细安装步骤可以参考CUDA 9安装手册。
环境变量:cat /etc/profile.d/cuda-env.shexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATHexport C_INCLUDE_PATH=/usr/local/cuda/include:$C_INCLUDE_PATH4NAMD编译和运行下载NAMD 2.1.3文件:在NAMD官方网站可以下载,链接如下:/Research/namd/2.13/features.html在release note中,介绍了该版本的NAMD一些新特性,点击download site即可进入下载页面,注册后即可下载。
生物大分子的纳米尺度结构和功能研究

生物大分子的纳米尺度结构和功能研究生命起源到现代生态系统的演化历程,是一个自组织、自适应、自生命工程的复杂过程,其中所需要进行的各种化学反应依赖于生物分子之间的相互作用。
生物大分子指的是生物体内的宏分子,包括碳水化合物、脂质、核酸和蛋白质等。
这些宏分子在体内发挥着重要的生理功能,使得生命得以延续。
在宏观上,生物大分子对人类产生的影响通常体现在医药和食品方面。
但是在纳米尺度上,生物大分子却有着更为重要的应用前景,这是因为它们在纳米级别上展现出了诸多奇妙的物理与化学特性。
纳米结构是一种介于分子和宏观物体之间的结构,其尺度一般处于1至100纳米之间。
生物大分子在纳米尺度上的结构与功能的研究,具有重要的理论意义和实际应用意义。
生物大分子的纳米尺度结构生物大分子在纳米尺度的结构与功能已经成为一个火热的领域。
如何解决生物大分子的纳米尺度结构和功能问题,是现代生物化学和物理学研究的重要方向之一。
蛋白质是生物大分子中最具代表性的一类物质,也是生化领域研究的重要对象。
蛋白质的体积尺度约为1-10立方微米,蛋白质分子内部的结构和功能具有高度的复杂性。
纳米技术、生物技术以及计算机技术等现代科技手段的发展,为研究蛋白质的纳米尺度结构和功能奠定了坚实的基础。
比如,通过单分子力谱学,生物学家可以更加精确地测量蛋白质的某些物理参数,以便研究蛋白质的动力学和稳定性。
另外,软物质物理学研究的发展,为研究生物高分子的纳米结构和物性奠定了基础。
比如,细胞膜上的蛋白质聚集可以通过超分子自组装的手段来研究,这为细胞信号传递的机制研究提供了一种新的思路。
DNA是生物大分子中的重要成分之一。
DNA可以自搭建成各种结构,其具有非常多的应用价值。
生物化学家通过建立DNA纳米阵列,可以使得DNA纳米结构以一定的精度组织在平面或三维空间中,从而在光、电磁等方面产生特殊的物理化学性质。
在研究生物大分子的纳米结构和功能的过程中,最关键的问题就是需要充分掌握生物大分子的结构和物性的测量、表征和模拟方法。
生物信息学知到章节答案智慧树2023年华东理工大学

生物信息学知到章节测试答案智慧树2023年最新华东理工大学第一章测试1.随着人类基因组计划的完成,以下哪些基因组计划是近期启动的计划参考答案:中国十万人基因组计划;G10K;我们所有人计划;英国十万人基因组计划2.统计学是一门独特学科,不是生物信息学研究工具和手段之一。
参考答案:错3.生物信息学研究任务之一包括SNP的发现和鉴定,对于疾病机理和药物开发靶点发现具有重要意义。
参考答案:对4.随着越来越多大规模测序项目的完成,其中最重要的科学使命之一就是要通过比较基因组学方法了解物种的起源和进化过程参考答案:对5.高等生物基因组中含有大量的非编码区,以及可能含有大量的外源病毒序列,只有通过生物信息学方法,解析其中功能和区域,为将来可能通过基因组编辑技术进行疾病机制解析提供基础参考答案:对第二章测试1.国际核酸数据库由EMBL,DDBJ和GenBank组成,它们在1988年形成国际核酸数据库联合中心,对数据进行参考答案:数据同步更新;数据格式相同;三方共享2.GenBank对于核酸数据的显示方式有以下几种参考答案:GBK;ASN.1;FASTA;Graph3.Uniprot KB对于生物数据在不同数据库中的链接、调用和标签转换具有非常重要的作用参考答案:对4.生物信息学的研究对象中包括各种数据库,比如参考答案:PDB;KEGG;Uniprot;GenBank5.BLAST是基于局部比对算法,采用渐进式比对方法,对数据分成字段等思路进行的成对比对方法参考答案:对第三章测试1.全局序列比对用于整体相似性程度较低、在较小区域内有局部相似性的两个序列比对。
参考答案:错2.以下哪些属于蛋白质打分矩阵?参考答案:遗传密码矩阵;PAM矩阵;BLOSUM矩阵;疏水矩阵3.传统的基于动态规划的局部性比对性算法采用的是精确的序列比对,虽然有着较好的比较结果,但是算法的时间复杂度较高。
参考答案:对4.在蛋白质数据库中比对蛋白质序列,需要选择一下那种blast模式?参考答案:blastp5.多序列比对就是两条以上的序列进行比对,可以用于进化树分析、寻找保守区域等。
discoverystudio药物发现与生物大分子计算模拟平台

Discovery Studio 药物发现与生物大分子计算模拟平台个人电脑上的全新分子建模环境,专业的生命科学分子模拟软件Discovery Studio™ (简称DS), 基于Windows/Linux系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。
它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白质结构功能研究,以及药物发现。
为科学家提供易用的蛋白质模拟、优化和药物设计工具。
通过高质量的图形、多年验证的技术以及集成的环境,DS将实验数据的保存、管理与专业水准的建模、模拟工具集成在一起,为研究队伍的合作与信息共享提供平台。
建立在最新的流程管理平台Pipeline Pilot基础上的DS让数据的共享和交流变得更为方便和简洁。
DS 中的部分功能流程(protocols)可以在Pipeline Pilot中进行编辑和组合,编辑组合而得的新流程可以导入Discovery Studio中使用,这样使得科研流程的方便共享成为可能。
同时,Pipeline Pilot这个开放平台技术还为使用者整合自己的或第三方的软件工具提供了接口。
科研人员可以在一个统一的平台上完成从基因到先导化合物设计的一系列工作,并且可以通过web形式共享研究成果。
DS的服务器-客户端模式使得科研人员能够最方便且最大限度地实现计算资源共享。
DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用)、同源建模、分子力学计算和分子动力学模拟、基于结构药物设计工具(包括配体-蛋白质相互作用、全新药物设计和分子对接)、基于小分子的药物设计工具(包括定量构效关系、药效团、数据库筛选、ADMET)和组合库的设计与分析等。
DS 可以应用于生命科学以下研究领域:新药发现,生物信息学,结构生物学,酶学,免疫学,病毒学,遗传与发育生物学,肿瘤研究。
一、二、Discovery Studio功能模块简介- 基本界面和显示模块- 蛋白质模拟模块- 基于结构的药物发现和设计模块- 基于药效团的药物发现和设计模块- 基于小分子的药物发现和设计模块- 分子力学和分子动力学计算模块- 分析模块基本界面和显示模块·Discovery Studio Standalone可视化界面,是利用Discovery Studio软件进行分子设计和模拟的基础,支持服务器-客户端安装在同一台机器上的运行模式。
分子力场中原子类型和力场参数

分子力场中原子类型和力场参数引言分子力场是研究分子结构和相互作用的重要工具。
它模拟分子中原子之间的相互作用,并通过定义原子类型和力场参数来描述这些相互作用。
本文将介绍分子力场中的原子类型和力场参数,并探讨它们在模拟分子行为中的重要性。
原子类型在分子力场中,每个原子都被赋予一个特定的原子类型。
原子类型可以根据元素周期表上的化学元素进行分类,例如氢、氧、碳等。
此外,还可以根据化学环境和功能基团进行分类,例如芳香环、羧基等。
每个原子类型都有一个唯一的标识符,以便在模拟过程中进行区分。
通常使用字母或数字表示原子类型,例如H代表氢、O代表氧。
确定正确的原子类型对于准确地描述分子结构和相互作用至关重要。
不同的原子类型可能具有不同的力场参数,这将在下一节中详细讨论。
力场参数在分子力场中,每个原子类型都有一组与之相关联的力场参数。
这些参数描述了原子之间相互作用的强度和性质。
常见的力场参数包括键长、键角、二面角和相互作用能。
键长键长是指相邻原子之间共价键的距离。
它决定了分子中化学键的强度和稳定性。
不同类型的化学键具有不同的理想键长值,例如C-C键、C-O键等。
键角键角是指两个相邻化学键之间的夹角。
它描述了分子中原子之间的空间排布和化学键的方向性。
不同类型的化学键具有不同的理想键角值,例如C-C-C角、C-O-H角等。
二面角二面角是指四个相邻原子构成的平面之间的夹角。
它描述了分子中特定功能基团或环结构的构象变化。
不同类型的功能基团或环结构具有不同的理想二面角值,例如苯环上两个相邻氢原子之间的二面角等。
相互作用能相互作用能描述了分子中不同原子之间各种相互作用(如范德华力、库仑力)的强度和性质。
它是模拟分子行为和预测物理化学性质所必需的重要参数。
力场参数选择与开发力场参数的选择和开发是分子力场研究中的重要任务。
通常采用实验数据和量化计算结果来确定合适的力场参数。
实验数据实验数据包括分子结构、振动频率、热力学性质等。
通过与实验数据的比较,可以调整力场参数,使模拟结果与实验结果一致。
生物学中的大分子结构分析方法

生物学中的大分子结构分析方法是研究生命科学的重要手段。
大分子结构包括蛋白质、核酸和多糖,其中蛋白质是执行大部分细胞功能的关键分子。
分析大分子结构的方法涉及到多个领域,包括生物化学、分子生物学、结构生物学和计算生物学。
在本文中,我们将讨论以及它们的应用。
1. 分子生物学方法分子生物学是一种基础科学,研究细胞内生物大分子的结构、功能、合成和调控。
其中包括了核苷酸的测序、基因克隆、多聚酶链式反应等技术。
这些技术在生物学中都有广泛应用。
例如,将DNA片段放入质粒中进行重组,在大肠杆菌中表达蛋白质,或者在哺乳动物细胞中表达人类基因,从而研究它的功能和提供药物治疗策略。
这些技术是研究生命科学中最基本的方法,我们可以通过这些技术用于透析大分子的结构与功能。
2. 生物化学方法生物化学是关于在细胞内的分子反应和化学反应。
在生化学中,经常使用分离、纯化和鉴定大分子的方法。
常见的方法有层析、电泳、分光光度法等。
其中,层析分离是分离大分子的最常见方法。
层析通常是基于分子的物理和化学性质来进行分离,例如分子大小、电荷和亲疏水性。
纯化蛋白质通过层析可以从其他蛋白质中进行分离,这是研究蛋白质结构和功能的必要步骤。
电泳是另一种重要的生物化学方法,该技术通过电场将样品中的带电分子分离出来。
蛋白质电泳是检测细胞蛋白质表达和分离蛋白质的常见技术。
还可以通过分光光度法测量分子吸收物的量、波长、振荡强度等参数,区分化学成分性质差异。
3. X射线晶体学分析X射线晶体学是分析大分子结构的主要方法之一,它是研究大分子晶体结构的一种工具,大部分是用于确定蛋白质的三维结构和核酸结构。
X射线晶体学技术的核心是蛋白晶体,以及确定分子位置和朝向的数据收集和分析。
基本原理是将蛋白分子或核酸样品结晶,用X射线照射样品,记录强度和散射方向,经过计算机程序进行得出生物分子的解剖图,并推出分子结构的三维结构,确定原子的坐标。
目前,蛋白X射线晶体学是最常用的蛋白质结构研究方法之一, 通过诱导晶体形成来产生大量蛋白质结晶,收集 X射线衍射数据并运用结构解析算法得出蛋白质高清晰度的三维结构解析图像,在药物发现和设计方面具有重要作用。
DiscoveryStudio药物发现与生物大分子计算模拟平台

Discovery Studio 药物发现与生物大分子计算模拟平台个人电脑上的全新分子建模环境,专业的生命科学分子模拟软件[PDF 资料下载]Discovery Studio?(简称DS),基于Windows/Linux 系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。
它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白质结构功能研究,以及药物发现。
为科学家提供易用的蛋白质模拟、优化和药物设计工具。
通过高质量的图形、多年验证的技术以及集成的环境,DS将实验数据的保存、管理与专业水准的建模、模拟工具集成在一起,为研究队伍的合作与信息共享提供平台。
建立在最新的流程管理平台Pipeline Pilot 基础上的DS让数据的共享和交流变得更为方便和简洁。
DS 中的部分功能流程(protocols)可以在Pipeline Pilot 中进行编辑和组合,编辑组合而得的新流程可以导入Discovery Studio 中使用,这样使得科研流程的方便共享成为可能。
同时,Pipeline Pilot 这个开放平台技术还为使用者整合自己的或第三方的软件工具提供了接口。
科研人员可以在一个统一的平台上完成从基因到先导化合物设计的一系列工作,并且可以通过web形式共享研究成果。
DS的服务器-客户端模式使得科研人员能够最方便且最大限度地实现计算资源共享。
DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用)、同源建模、分子力学计算和分子动力学模拟、基于结构药物设计工具(包括配体-蛋白质相互作用、全新药物设计和分子对接)、基于小分子的药物设计工具(包括定量构效关系、药效团、数据库筛选、AD MET )和组合库的设计与分析等。
DS 可以应用于生命科学以下研究领域:新药发现,生物信息学,结构生物学,酶学,免疫学,病毒学,遗传与发育生物学,肿瘤研究。
Discovery Studio 药物发现与生物大分子计算模拟平台一、Discovery Studio 功能模块简介二、Discovery Studio 可以运行的硬件平台Accelrys 软件应用于生命科学Accelrys 软件应用于生命科学Discovery Studio 功能模块简介-基本界面和显示模块Discovery Studio StandaloneDiscovery Studio Visualizer Client-蛋白质模拟模块DS MODELERDS Protein RefineDS Protein HealthDS Protein FamiliesDS Sequence Analysis-基于结构的药物发现和设计模块DS Flexible DockingDS LigandFitDS LigandScoreDS LibDockDS CDOCKE RDS Protein DockingDS LudiDS De Novo EvolutionDS LigandFit CAP/ DS Ludi CAPDS GOLD interface-基于药效团的药物发现和设计模块DS Catalyst ConformationDS Catalyst HypothesisDS Catalyst SBPDS Catalyst ScoreDS Catalyst ShapeDS Catalyst DB BuildDS Catalyst DB SearchDS De Novo Ligand BuilderHypoDBPCDB (PharmaCoreDB)-基于小分子的药物发现和设计模块DS QSA RGFA ComponentVAMP Descriptors Component/ DMol3 Descriptors ComponentDS Library DesignDS ADMETDS TOPKAT-分子力学和分子动力学计算模块DS CHARMmDS CHARMm LiteDS CFF (高级II类力场)DS MMFF (Merck Molecular Force Field)-分析模块DS BiopolymerDS Analysis基本界面和显示模块•Discovery Studio Sta ndal one可视化界面,是利用Discovery Studio 软件进行分子设计和模拟的基础,支持服务器-客户端安装在同一台机器上的运行模式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
㊀第1期中㊀国㊀科㊀学㊀基㊀金103㊀㊀双清论坛 专题:理论化学家视角中的仪器创制新一代高精度生物大分子力场高加力∗(吉林大学理论化学研究所,美国明尼苏达大学化学系,明尼苏达州55455)㊀㊀收稿日期:2017G10G18;修回日期:2017G11G12㊀㊀∗通信作者,E m a i l :j i a l i @j i a l i g a o .o r g[摘㊀要]㊀精确地描述分子内和分子间相互作用是生物分子体系动力学计算和模拟的核心问题.势能面的精确度直接影响并决定了整个计算结果的可靠性和预言的准确性.因此,发展和应用精确势能面是生命科学计算中最至关重要的一个环节.可以预言,未来生命科学定量计算的发展途径仍然会与开发新一代更精确的生物分子势能面紧密相关.本文通过经典分子力场发展过程和现状为借鉴,探讨未来分子力场发展的可能趋势.[关键词]㊀分子力场;量子力场;分子力学;量子化学分块法;生物分子计算㊀㊀生物分子体系动力学计算和模拟的核心是描述分子内和分子间相互作用的势能面.势能面的精确度直接影响并决定了整个计算结果的可靠性和预言性.因此,发展和应用精确势能函数是生命科学计算中最至关重要的一个环节,也是从始至今一直投入最多,关注最大,影响最广的科学研究课题[1].未来生命科学定量计算的发展途径仍然会与开发新一代更精确的生物分子势能面紧密相关.本文通过经典分子力场发展过程和现状为借鉴,探讨未来分子力场发展的可能趋势.这里不包括粗粒化方法.1㊀生物分子力场势能面这一概念是建立在量子力学B o r n GO pGpe n h e i m e r 近似之下,原理上可以直接应用量子化学的方法得到精确的结果.然而受限于生物体系的大分子特征,精确的量子化学方法目前仍无法解决生命科学中的复杂问题.大分子体系的势能面,即体系的相互作用能量随原子坐标位置变化的关系,通常是用一系列的解析函数来近似表达的.因为不再直接考虑整个体系的电子结构,这一经典力学的方法也称为分子力学(示例G1分子力学),而表达原子间相互作用的势能函数被统称为分子力场(虽然这里所指的乃是体系的势能).经过半个多世纪来的优化和测试,分子力场目前在其适用范围内已经达到了非常高的精确度.结合分子动力学计算可以用来帮助解析很多的实验现象,预测新功能,设计新实验,以及辅助开发新药物和酶催化反应.而且应用范围涵盖从水溶液中的单个蛋白质分子到病毒壳层和细菌光合作用体系的整体结构[4,5],原子数目超过了1亿个以上.分子力场的精确度会继续提高和发展,包括引进多体极化效应,并有效的应用到更多更广的体系.示例G1:分子力学分子力场是在20世纪60年代由S c h e r a ga 和L i f s o n 等延伸到生物分子体系[2],其势能函数表达式(方程1)一直延续至今:V =b o n d sb12K b (R b -R 0b )2+ a n gl e s a12K a (θa -θ0a )2+ t o r s i o nt n V n t 2[1+c o s (n φt -φ0t )] i m p o r pe r d12K d (δa -δ0a )2+ i <jεi j σi j R i j æèçöø÷12-σi j R i j æèçöø÷6[]+q i q j R i j {}(1)㊀㊀这里,体系总势能可以分成两部分.第一部分包括前四项,用来描述分子内部的共价振动运动,分别表达化学键的伸缩,键角弯曲,分子内旋转(二面角扭转)和非共面扭转.式中的各个符号对应着各种运动的力常数㊁变量和平衡值.第二部分描述分子间非键㊀㊀104㊀中㊀国㊀科㊀学㊀基㊀金2018年连相互作用,包括长程静电作用和范德华作用.虽然半个世纪以来,能量表达形式(1)没有发生基本变化,但是其中的参数发生了质的改变.该式中的参数可以从量子化学计算获得,但更精确的方法是通过对小分子模型体系的热力学性质与实验结果比较优化而得到.我们假定这些通过优化模型体系得到的参数可转移并应用到真正大分子体系之中.值得一提的是在1960年代末L i f s o n提出了生物大分子力场之后,M a r t i n K a r p l u s利用科研休假到他的实验室访问.回到哈佛大学之后K a r p l u s等提出了分子力场与量子化学(QM/MM)结合的一种多尺度概念[3],为此K a r p l u s,L e v i t t和W a r s h e l获得了2013年诺贝尔化学奖.随着经典分子力学的发展,我们面临一个重要的问题:在今后半个世纪及更长远的未来,如何发展生命体系的分子力场?很显然,这里有两个简单的答案:(1)沿着既定过程,继续发展优化方法,如机器学习等,提高分子力学的精确性和应用范畴.(2)发展新的理论框架,超越经典力学的限制,建立新一代量子力学力场,为系统化提高生命科学计算的定量性和预言性奠定基础[6].两个答案都非常重要,各有千秋.前者在近期会更为活跃,因为分子力学算法和计算软件都已经发展成熟.后者则需要发展新概念,建立新算法,开发新程序,但是有望对生命科学计算产生质的跃迁.因此为提高生物分子计算精确性,同时发展这两个方向都是必要的.1.1㊀分子力学的优势和困扰首先,从计算应用上考虑,分子力学在时间和空间尺度上占有绝对优势,其特点是计算速度快,可以应用到超大型的复杂体系并做长时间的分子动力学模拟.如上面提到的整个细胞的生物化学,物理过程.目前大家公认的发展方向集中于处理分子间相互作用产生的极化效应,在(1)式中引入极化能项,并已经有了显著进展[7].分子间极化效应来源于电子云密度的变化,属于量子效应,因此分子力学只能近似地表观描述这一现象,没有一个公认的极化能理论计算方法.应用最多的极化模型有诱导偶极子[8,9],化学势平衡[10],D r u d e振子[11],和A B E E M 原子 键浮动电荷理论[12],其中A B E E M理论是中国的杨忠志和同事提出的[12],并应用到分子间相互作用和液相计算[13].国际上发展最完整的是AGMO E B A极化力场,由美国华盛顿大学的P o n d e r和德克萨斯州立大学的任彭宇合作开发[9].此外分别应用极化偶极子[8]和D r u d e振子方法[11],极化效应也被引进到C H A R MM力场.这里需要强调的是发展生物大分子的极化力场只是近年来才有明显进展,虽然已有较长历史,但仍处于起始阶段[11].因此显著超越非极化力场计算结果的优势目前还没有体现出来,有待更深入研究静电和极化作用的平衡.然而分子力学也有一系列众所周知的明显缺陷[6],包括(a)势能函数和参数都有极大的随机性使得不同力场参数数值非常不同并无法交叉使用;(b)虽然有非谐矫正但势能函数仍然主要依靠谐振子方程表达化学键运动;(c)没有系统途径处理多体极化效应,电荷转移,化学反应,和电子激发态过程.而且最困扰的问题是没有真正可行的办法来解决这些缺陷.示例G2:量子力场量子力学力场[6],简称量子力场,是一个分块化量子化学方法,其原理建立在分子体系的 化学局域性 .首先将整个分子体系划分成N个分子块,通过对子体系,即分子块分别进行量子化学计算而整合整个体系的总能量及其他性质.分块量子化学方法的第一个近似是把整体系的波函数表达成各个分子块波函数的乘积(或分块电子云密度加和).这一近似忽略了分子块之间的电子交换排斥和远程色散作用以及电荷离域效应,因此需要引入参数并做优化处理.分子块之间的长程相互作用不再涉及电子离域效应,主要包括双电子静电相互作用.当分子块相距足够远,量子化学中的双电子积分可以简化成单电子积分,并用量子化学和分子力学(QM/MM)组合迭代方法取代.这是量子力场的第二层近似.最后的第三层次近似是对单 双电子积分做近似处理,如多极矩展开,密度拟合,及半经验积分表达等.可以看出如果不对任何一个层次做近似,量子力场的方法就自然的回到了相对应的从头算法水平.重要的是对于每一个分子块都可以用任何等级的,各块不同的波函数或密度泛函理论来表达.因此量子力场是一个系统化的全量子化学QM/QM组合方法.分块化量子化学方法是当今国际上非常活跃的领域[14],应用范围包括中小型分子的超高精度量子化学计算到生物大分子的动力学模拟.中国的几个小组的工作都处在各自领域的领先地位.主要工作包括张增辉的分子碎片共轭帽方法[15],黎书华与合作者开发的广义能量分块法[16],刘文剑发展的从块㊀第1期高加力:新一代高精度生物大分子力场105㊀㊀到分子整合方法[17],和高加力在1997年美国纽约州立大学时就提出的显性极化理论[6,18].借鉴分子力学力场的成功经验,通过对上面提到的参数优化可以矫正由于分块近似产生的误差,与实验结果相拟合而达到生物分子计算所需要的精确度.量子化学分块法已经成功的应用于各种复杂的分子体系,如分子团簇,蛋白质在水溶液中的分子动力学和蛋白 配体相互作用和光谱等体系[19].1.2㊀为什么发展新一代量子力场分子力学中的理论困难完全来源于基于经典力学的近似.因此,如果我们能够应用量子化学方法求解生物大分子体系的薛定谔方程,用来表达分子势能面,即使是近似的甚至是半经验方法,分子力学所面临的这些几乎无法克服的困难都可以迎刃而解了.我们把直接应用量子化学表达分子体系势能面的方法定义为量子力学力场(简称量子力场),而不是优化经典分子力学的参数重复量子化学计算结果(示例G2量子力场).量子化学具有通用性,适用于任何生物和非生物分子体系.非谐振势能面,电子波函数极化,电荷转移效应都自然而然的包括在量子化学方法之中.这样的一个量子分子力场又是一个可以完全处理基态和激发态化学过程的反应力场.量子力场在两方面不同于量子化学.第一,量子力场是一种量子化学的近似方法,把整个分子体系做分块化近似处理,从而使得各种量子化学方法可以有效的应用到生物大分子体系.第二,量子力场包含经验参数,通过引入具有明确定义的参数来弥补由分块产生的近似误差.因为每个分子块的量子化学计算可以单独分别进行,量子力场可以很容易进行大规模的并行计算,有效利用当前国家超算中心的设备.借鉴于分子力学力场成功的经验,量子力场也可以通过优化少数,类似于密度泛函理论用来处理色散力的原子参数取得液相和生物大分子计算的精确度.量子力场面临的挑战是发展和建立系统化的近似方法,广泛应用各种量子化学波函数分子轨道理论(W F T)和密度泛函理论(D F T)计算方法,与实验结果相比较验证计算的精确性.量子力场的分块化方法与量子化学计算的线性标度方法不尽相同.即使是后者真正达到了线性标度,其处理分子间相互作用的结果是不会超过所用的量化计算的精确性.因此,这些方法仍然满足不了液相和生物大分子动力学计算的需求.而量子力场包含的少数参数提供了优化凝聚态分子动力学计算结果的可能性.分子力学在生物大分子体系的成功应用恰恰是因为有效利用了并优化了(1)式中的经验参数.换句话说,量子力场应用量子化学方法保证了正确描述生物分子体系势能面的定性性质,如电子极化,电荷转移,化学键生成和断裂,而这些性质恰恰是分子力学无法有效表达的.通过分块法,一方面降低计算标度,另一方面通过引进分块参数而优化量子力场的定量结果.所以量子力场同时涵盖了量子化学和分子力学二者的优势,使得生物大分子体系的精确量子化学计算成为可能.2㊀建立和开发新一代分子力场如何成功发展新一代生物大分子量子力场呢?我们仍然借助分子力场成功的先例来探讨这一实际并且重要的问题.如果以使用的广泛性作为标度的话,目前应用于生物大分子体系上最成功的分子力场有AM B E R,C H A R MM,G R OMA C S,O P L S非极化力场,以及AMO E B A极化力场.尽管每个力场的起点和参数优化路径都不尽相同,但是这些分子力场的成功并得到广泛应用有两个惊人的共同点:(1)结合力场的开发,同时发展自己的计算应用软件;(2)有长期且相对稳定的来源于政府部门的科研经费支持.第一点其实很明显,前三个分子力学力场的名字和对应的软件完全相同,而后两个力场也有其应用软件,分别为B O S S和T i n k e r.或许软件的开发促进了力场的发展,或许由于力场的成功使得计算软件得到广泛应用,可以肯定二者同时发展和开发起到了相互促进的作用,并为发展其它分子动力学计算理论和方法提供了条件.另外一个有趣的现象是,与量子化学软件不同,直到近期应用于生物大分子计算的各自软件只能应用自己的分子力场.这里再次体现了分子力场的局限性;即使力场所用的公式完全一样,力场参数还是不能直接应用到其他软件.但是这也说明软件开发和发展分子动力学算法之间的紧密关系.第二点也极为重要,因为软件和力场的开发和优化是一个冗长和艰苦的工作,且需要大量人力物力又不一定是当时最热门的科研课题.在1980年代末发展当代C H A R MM力场的过程中有30多人同时参与不同参数的优化.我们知道C H A R MM 力场到目前还在一直不断改进,包括修改参数和增加应用范围.因此稳定的课题支持也是方法和软件成功发展的前提.3㊀总㊀结本文以经典分子力场发展过程和现状为借鉴,㊀㊀106㊀中㊀国㊀科㊀学㊀基㊀金2018年可以预言开发新一代更精确的分子间相互作用势能函数是保证提高生物大分子定量计算必要条件.未来生物分子力场的发展有两条途径.其一是在现有分子力学框架下继续优化力场参数,包括机器学习,增大应用范畴,进一步引进并优化分子间相互作用的极化效应.第二是引进新范式,超越经典力学限制,建立新一代的量子力学力场.后者是一个全新的概念,需要发展计算方法和软件,目前在世界上也刚刚处于兴起之势,具有发展潜力.此外,我们发现,成功发展并被广泛应用的分子动力学计算方法和分子力场具有两个共同特征,为今后方向提供了极好的借鉴.第一是方法和计算软件的发展紧密相连,相辅相成,相互促进从而保证二者的广泛应用.第二是具有长期的课题支持.生物大分子力场的开发是一个耗时,耗力,虽然极为重要但不一定是当时的热门科研课题,因此对这一战略科研方向的稳定支持亦是至关重要的.参考文献[1]M a c K e r e l lA D.E m p i r i c a l f o r c e f i e l d s f o r p r o t e i n s:C u r r e n t s t a t u s a n d f u t u r e d i r e c t i o n s.A n nR e p C o m p u tC h e m,2005,1:91102.[2]B i x o n M,L i f s o nS.P o t e n t i a l f u n c t i o n s a n d c o n f o r m a t i o n s i nc y c l o a l k a n e s.T e t r a h ed r o n,1967,23(2):769784.[3]W a r s he lA,K a r p l u s M.C a l c u l a t i o nofg r o u n da n de x c i t e d s t a t e p o t e n t i a l s u r f a c e s o f c o n j u g a t e dm o l e c u l e s.I.F o r m u l aGt i o na n d p a r a m e t r i z a t i o n.J.A m.C h e m.S o c.1972,94(16):56125625.[4]Z h a o G,P e r i l l aJ R,Y u f e n y u y E L,e ta l.M a t u r e H I VG1c a p s i ds t r u c t u r e b y c r y oGe l e c t r o n m i c r o s c o p y a nd a l lGa t o mm o l e c u l a r d y n a m i c s.N a t u r e,2013,497(7451):643646.[5]S e n e rM,S t r u m p f e r J,S i n g h a r o y A,e t a l.O v e r a l l e n e r g yc o n v e r s i o n e f f i c i e n c y o f a p h o t o s y n t h e t i c v e s i c l e.E L i f e,2016,5:e09541.[6]X i eW,G a o J.D e s i g n o f a n e x t g e n e r a t i o n f o r c e f i e l d:t h eXGP O L p o t e n t i a l.JC h e mT h e o r y C o m p u t,2007,3(6):18901900.[7]J o r g e n s e n W L.S p e c i a l i s s u e o n p o l a r i z a t i o n.J.C h e m.T h eGo r y C o m p u t,2007,3:1877.[8]G a o J,P a v e l i t e s J J,H a b i b o l l a z a d e hD.S i m u l a t i o no f l i q u i da m i d e s u s i n g a p o l a r i z ab l e i n t e r m o l ec u l a r p o t e n t i a l f u n c t i o n.JP h y sC h e m,1996,100(7):26892697.[9]S h iY,X i aZ,Z h a n g J,e t a l.P o l a r i z a b l ea t o m i cm u l t i p o l eGb a s e d AM O E B A f o rc ef i e l df o r p r o t e i n s.J C h e m T h e o r yC o m p u t,2013,9(9):40464063.[10]K a m i n s k iG A,S t e r nH A,B e r n e B J,e t a l.D e v e l o p m e n t o f a p o l a r i z a b l ef o r c ef i e l df o r p r o t e i n s v i a a bi n i t i o q u a n t u mc h e m i s t r y:f i r s t g e n e r a t i o nm ode l a n d g a s p h a s e t e s t s.2002,23(16):15151531.[11]L e m k u l J A,H u a n g J,R o u xB,e t a l.A ne m p i r i c a l p o l a r i zGa b l e f o r c e f i e l db a s e do n t h e c l a s s i c a l d r u d e o s c i l l a t o rm o d e l:d e v e l o p m e n th i s t o r y a n dr e c e n ta p p l i c a t i o n s.C h e m.R e v,2016,116(9):49835013.[12]Y a n g Z Z,W a n g C S.A t o mGb o n de l e c t r o n e g a t i v i t y e q u a l i z aGt i o nm e t h o da n d i t sa p p l i c a t i o n sb a s e do nd e n s i t y f u n c t i o n a l t h e o r y.JC h e m T h e o r y C o m p u t,2003,2(02):273299.[13]L iH,S u nTT,Z h a n g C,e t a l.QM/MM(A B E E M)S t u d y o nt h e L i g a n d S u b s t i t u t i o n P r o c e s s e so f R u t h e n i u m(I I I)C o m p l e xN AM IGA.C h i nJC h e m,2017,35(3):354362.[14]G a o J,Z h a n g Z H,H o u kK N.B e y o n dQM/MM:F r a g m e n t q u a n t u m m e c h a n i c a l m e t h o d s.A c c C h e m R e s,2014,47,2711.[15]Z h a n g D W,Z h a n g J Z H.M o l e c u l a r f r a c t i o n a t i o nw i t h c o n j uGg a t e c a p s f o r f u l l q u a n t u m m e c h a n i c a l c a l c u l a t i o no f p r o t e i nGm o l e c u l e i n t e r a c t i o ne n e r g y.JC h e m P h y s,2003,119(7),35993605.[16]L i S,L iW,M aJ.G e n e r a l i z e de n e r g yGb a s e d f r a g m e n t a t i o na p p r o a c ha n d i t s a p p l i c a t i o n s t om a c r o m o l e c u l e s a n dm o l e c uGl a r a g g r e g a t e s.A c cC h e m R e s,2014,47(9):27122720.[17]L i Z,L iH,S u oB,e t a l.L o c a l i z a t i o n o fm o l e c u l a r o r b i t a l s:f r o mf r ag m e n t s t om o l e c u l e.A c cCh e m R e s,2014,47(9):27582767.[18]G a o J.T o w a r d am o l e c u l a r o r b i t a l d e r i v e d e m p i r i c a l p o t e n t i a lf o r l i q u i d s i m u l a t i o n s.J P h y sC h e mB,1997,101(4):657663.[19]X i eW,O r o z c oM,T r u h l a rD G,e t a l.XGP o l p o t e n t i a l:A ne l e c t r o n i c s t r u c t u r eGb a s e df o r c e f i e l d f o rm o l e c u l a rd y n a m i c ss i m u l a t i o no f a s o l v a t e d p r o t e i n i nw a t e r.J.C h e m.T h e o r yC o m p u t,2009,5(3):459467.N e x t g e n e r a t i o n f o r c e f i e l d s f o r b i o l o g i c a lm a c r o m o l e c u l e sG a o J i a l i(T h e o r e t i c a l C h e m i s t r y I n s t i t u t e,J i l i nU n i v e r s i t y D e p a r t m e n t o f C h e m i s t r y,U n i v e r s i t y o f M i n n e s o t aM i n n e a p o l i s,MN55455U S A) A b s t r a c t㊀I n t h eh e a r t o fm o l e c u l a r d y n a m i c s s i m u l a t i o n s a n dm o d e l i n g o f b i o l o g i c a lm o l e c u l e s i s t h e p o t e nGt i a l e n e r g y s u r f a c e t h a t d e s c r i b e s t h e i n t e r n a l a n d i n t e r m o l e c u l a r i n t e r a c t i o n s.T h e a c c u r a c y o f t h e p o t e n t i a l e n e r g y s u r f a c e d i r e c t l y i n f l u e n c e s t h e r e l i a b i l i t y a n d p r e d i c t a b i l i t y o f t h e s e c o m p u t a t i o n s.C o n s e q u e n t l y,i t i s a c r i t i c a l l y i m p o r t a n t s t e p t od e v e l o p a n da p p l y a c c u r a t e p o t e n t i a l e n e r g y f u n c t i o n s f o rm a c r o m o l e c u l a r c o m p u t a t i o n s.U n d o u b t e d l y,f u t u r e p r o g r e s s e s t o w a r d s q u a n t i t a t i v e c o m p u t a t i o n a l b i o l o g y w i l l a l s o c o i n c i d e w i t h t h e d e v e l o p m e n t o fm o r e a c c u r a t e,n e x t g e n e r a t i o n f o r c e f i e l d s.I n s p i r e db y t h e s u c c e s s e so f c l a s s i c a l m o l e c u l a rm e c h a n i c a l f o r c e f i e l d s,t h i s a r t i c l e a n a l y z e s p o s s i b l e f u t u r e p r o g r e s s e s.K e y w o r d s㊀m o l e c u l a rm e c h a n i c s;q u a n t u m m e c h a n i c a l f o r c e f i e l d;n e x t g e n e r a t i o n f o r c e f i e l d;f r a g m e n t a l q u a n t u mc h e m i s t r y;c o m p u t a t i o no f b i o l o g i c a lm o l e c u l e s。