生物信息学综述
生物信息学概述(共59张PPT)精选全文完整版

蛋白质 结构
蛋白质 功能
最基本的 生物信息
2024/11/11
生命体系千姿百 态的变化
维持生命活 动的机器
9
第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多
数DNA非编码区域的功能还知之甚少
对于第二部密码,目前则只能用统计学的方法进行分析。破译“第
二遗传密码”:即折叠密码(folding code),从蛋白质的一级结构
Rickettsia prowazekii
Helicobacter pylori
Buchnerasp. APS
Escherichia coli大南芥
Thermotoga maritima
Thermoplasma acidophilum
mouse
Caenorhabitis elegans
以基因组计划的实施为标志的基因组时代(1990年至2001年)是生
物信息学成为一个较完整的新兴学科并得到高速发展的时期。这一 时期生物信息学确立了自身的研究领域和学科特征,成为生命科学 的热点学科和重要前沿领域之一。
这一阶段的主要成就包括大分子序列以及表达序列标签 ( expressed sequence tag,EST)数据库的高速发展、BLAST( basic local alignment search tool)和FASTA(fast alignment)等工具软件的研制和相应新算法的提出、基因的寻 找与识别、电子克隆(in silico cloning)技术等,大大提高
细胞质(线粒体、叶绿体) 基因组DNA
人类基因组:3.2×109 bp 18
人类自然科学史上的 3 大计划
曼哈顿原子 弹计划
阿波罗登月 计划
人类基因组计划
生物信息学中的基因变异数据分析方法综述

生物信息学中的基因变异数据分析方法综述概述随着高通量测序技术的发展,生物学家们可以获取大规模的基因变异数据,这推动了生物信息学中的基因变异数据分析的研究。
基因变异是生物个体遗传信息的重要组成部分,对于理解疾病的发展机制,预测个体对药物的反应以及进行个性化医疗具有重要意义。
本文将综述生物信息学中的基因变异数据分析方法,介绍常用的数据处理流程和分析方法。
1. 数据预处理在基因变异数据分析之前,需要进行一系列的数据预处理。
首先,对原始的测序数据进行质量控制和去除低质量的碱基,通常使用工具如FastQC和Trimmomatic实现。
接下来,进行对齐操作,将测序reads与参考基因组进行比对,主要使用的对齐工具有BWA和Bowtie。
此外,还需要进行去重操作,剔除PCR复制产生的重复片段。
以上步骤的目的是为了减少后续分析中的假阳性和假阴性情况。
2. 变异检测基因变异检测是基因组数据分析的核心环节。
常用的变异检测方法包括单核苷酸变异(SNVs),小片段插入或删除(indels),结构变异和复杂变异等。
SNVs是最常见的基因序列变异,通过和参考基因组的比对,找出个体与参考基因组不同的位点。
本地重组(local realignment)和数基因组(multi-genome)比对是提高SNVs检测准确性的重要工具。
Indels通常对参考基因组序列产生较小的插入或缺失,使用工具如GATK、SAMtools等进行检测。
结构变异通常包括基因内的重复序列插入、删除和基因间的重排等,通过分析测序数据中的拆分对和转座子移动等特征进行检测。
复杂变异是指在基因组中较为罕见的结构重排和序列混合等事件,其检测需要更复杂的流程和工具。
3. 功能注释对于检测到的基因变异,进行功能注释是为了理解其对基因和蛋白质功能的影响。
功能注释根据变异位点的位置和旁系的基因组信息进行分类。
常用的注释工具有ANNOVAR、Variant Effect Predictor (VEP)等。
生物信息学中的基因组序列比较技术综述

生物信息学中的基因组序列比较技术综述简介随着高通量测序技术的发展,大量的基因组序列数据得到了快速生成和存储。
基因组序列比较是一种重要的分析方法,它可以对不同物种的基因组进行比较和分析,从而揭示它们之间的相似性和差异性。
本文将综述生物信息学中常用的基因组序列比较技术,包括全基因组比较、多基因组比较和序列比对等。
一、全基因组比较全基因组比较是一种将两个或多个物种的完整基因组序列进行对比的方法。
该方法可以帮助我们了解不同物种之间的遗传特征、基因家族、进化关系等。
全基因组比较的关键是选择适当的比对算法和数据库。
目前常用的全基因组比较工具有BLAST、LAST、MAUVE等,它们能够高效地比较基因组间的序列相似性。
首先,BLAST(Basic Local Alignment Search Tool)是最常用的比对工具之一。
它通过将一个查询序列与数据库中的序列进行比对来找到相似性较高的序列。
BLAST能够快速且准确地比对基因组序列,是基因组序列比较的重要工具。
其次,LAST(Large-scale Sequence Comparison)是一种用于全基因组比较的软件。
LAST采用剪接相关的比对算法,能够高效地识别基因组中的剪接位点和剪接模式。
此外,LAST 还具有并行计算的能力,能够处理大规模的基因组序列比较任务。
最后,MAUVE是一种用于多基因组比较的软件。
它可以比较多个物种的基因组序列,并根据序列的共线性和重组事件等信息进行分析。
MAUVE能够帮助我们了解物种间的基因组结构和演化关系,对于研究物种间的遗传变异和进化起到了重要作用。
二、多基因组比较多基因组比较是一种比较三个或以上物种之间的基因组序列的方法。
它能够帮助我们了解多个物种之间的共同遗传特征和差异,从而对物种的进化和功能基因进行研究。
常用的多基因组比较方法包括家族标记比较、同源基因分析和基因家族研究等。
家族标记比较是一种通过比较家族标记(如重复序列、转座子等)来揭示物种间的基因组特征。
生物信息学综述论文3900字_生物信息学综述毕业论文范文模板

生物信息学综述论文3900字_生物信息学综述毕业论文范文模板生物信息学综述论文3900字(一):计算机算法在生物信息学中的应用综述论文摘要:在人类基因组计划的推动下,生物信息学得到了人们的广泛关注,并呈现出数量多、计算量大等鲜明特征,因此要求在生物信息学中采用计算机算法,以提高生物信息学处理问题的效率。
以生物信息学中常用的计算机算法为切入点,进一步从基因表达数据分析、基因组序列信息分析、生物序列差异和相似性分析、遗传数据分析以及蛋白质结构与功能预测5个方面,论述了计算机算法在生物信息学中的典型应用。
关键词:生物信息学;基因;计算机算法;数据分析0引言生物信息学(Bioinformatics)作为一门新兴的交叉学科,是随着生命科学和计算机科学的高速发展而出现的。
它通过充分利用生物学、信息学、数学、物理学、统计学以及计算机网络等工具或手段,对大量生物数据信息进行有效的阐明和分析,使之成为具有相应生物意义的生物数据信息。
其涵盖了基因组信息的获取、处理、分配、存储等多个方面,通过对生物信息的比较和分析,从而获取基因编码以及核酸和蛋白质结构功能等信息,是最具活力和发展前景的学科之一。
然而,生物信息学在我国由于起步较晚,加之其自身呈现出的数量多、计算量大等特征,使生物信息学面临着计算瓶颈。
基于此,笔者结合自己的工作实践,对计算机算法在生物信息学中的应用进行探讨,以期为在生物信息学中进行有效的数据挖掘提供理论支持。
1生物信息学中常用的计算机算法算法作为计算机科学的一个重要分支,在计算机科学中居于核心地位。
在信息时代,算法作为解决问题的重要工具之一,其通过输入符合规范的信息,从而在短时间内快速获取所需要的输出,现已在各个领域得到了广泛应用。
在生物信息学中,计算机算法的应用也对生物信息学的发展起着积极推动作用。
生物信息学中常用的计算机算法主要包括以下几种:(1)分治法。
分治法即在解决大的问题实例时,通过将该问题实例分解为具有相同问题的几个小的问题实例,再采用递归方法依次对这些小的问题实例求解,然后将所得的解合并,从而得出大的问题实例的解。
生物信息学的发展

生物信息学的发展生物信息学是一门综合性的学科,它融合了生物学、计算机科学和信息学等多个学科的知识与技术,致力于利用计算机和数据分析方法来研究生物系统的复杂性。
随着生物学研究的进展以及计算机技术的快速发展,生物信息学得到了空前的发展,取得了许多重要的科学成果。
1. 生物信息学的起源和发展生物信息学的起源可以追溯到20世纪50年代,当时人们开始利用计算机技术处理生物数据和进行生物模拟实验。
随着DNA测序技术的不断发展,大量的生物信息数据被产生出来,人们开始认识到利用计算机来存储、管理和分析这些数据是非常重要的。
1990年,人类基因组计划的启动标志着生物信息学的正式诞生,自此之后,生物信息学得到了广泛的关注和发展。
2. 生物信息学的研究内容生物信息学的研究内容非常广泛,涉及到基因组学、转录组学、蛋白质组学、代谢组学等多个领域。
生物信息学的研究可以从多个角度入手,例如:基因组测序与组装、基因功能预测、基因调控网络分析、蛋白质结构预测、基因表达调控机制研究等。
这些研究内容的丰富性使得生物信息学成为了现代生命科学研究中不可或缺的一部分。
3. 生物信息学的应用领域生物信息学的应用领域非常广泛,涵盖了医学、农业、生物技术等多个领域。
在医学领域,生物信息学可以用于研究人类疾病的遗传基础、药物研发和个体化医疗等。
在农业领域,生物信息学可以用于分析农作物基因组,研究抗性和生长性状等重要性状的遗传机制以及改良农作物的育种工作。
在生物技术领域,生物信息学可以用于新药开发、基因工程、生物制造等方面。
4. 生物信息学面临的挑战和发展方向尽管生物信息学在过去几十年取得了显著的发展,但它仍然面临着一些挑战。
首先,生物信息学需要跨学科的知识和技术,因此人才的培养是一个重要的问题。
其次,生物信息学需要处理大规模和复杂的生物数据,因此如何高效地存储和分析这些数据也是一个挑战。
此外,生物信息学还需要不断创新和发展新的算法和方法来解决生物学研究中的问题。
生物信息学研究内容

生物信息学研究内容生物信息学是一门融合生物学、计算机科学和统计学的交叉学科,致力于研究生物学数据的获取、存储、管理、分析和解释等方面的理论与方法。
在当今大数据时代的背景下,生物信息学成为加速生命科学研究和推动医疗健康领域发展的重要工具。
首先,生物信息学的研究内容涉及生物学数据的获取和存储。
随着高通量测序技术的广泛应用,生物学数据产生的速度呈爆发式增长。
生物信息学家致力于开发高效的测序数据获取技术,保证数据的质量和准确性。
此外,生物信息学将生物学数据存储在数据库中,并研发相应的管理系统和工具,方便研究者存取和共享数据,促进科学合作与交流。
其次,生物信息学的研究内容还包括生物学数据的分析和解释。
生物信息学方法涉及基因组学、转录组学、蛋白质组学和代谢组学等领域。
通过基因组学研究,可以深入了解生物个体的基因组特征,揭示基因之间的相互作用以及与表型之间的关联。
转录组学研究关注基因表达的调控机制和不同生物状态下的表达谱变化。
蛋白质组学研究则聚焦于蛋白质的结构、功能和相互作用网络等方面。
而代谢组学则探索生物体内代谢产物的组成和变化规律。
这些分析和解释的工作有助于我们深入理解生命活动的本质,为药物研发、疾病诊断和治疗提供重要参考。
最后,生物信息学研究内容还包括开发算法和软件工具。
基于大规模生物学数据的特点,生物信息学家开发了一系列算法和软件工具,以帮助研究者更高效地分析和解释数据。
其中包括基于机器学习和人工智能的算法,用于预测基因功能、蛋白质结构和相互作用等。
此外,还有丰富的可视化工具和数据库系统,用于数据的直观呈现和资源的整合。
生物信息学的研究内容不仅限于上述几个方面,还包括生物信息学教育、伦理学及法律等领域。
生物信息学在生命科学研究、临床医学、农业科技等领域的应用前景广阔。
通过深入研究生物信息学的相关内容,不仅可以为生命科学研究提供指导和支持,还可以推动生物医学的发展,为人类健康和生物资源利用提供重要的科学依据。
生物信息学技术

生物信息学技术生物信息学技术是一门集生物学、计算机科学和统计学于一体的交叉学科,利用计算机和统计学方法处理和分析生物学数据。
它在现代生物学研究和医学领域中起着重要的作用,可以帮助我们更深入地理解生物学过程、预测生物分子的结构和功能,以及为药物设计和基因疾病研究提供指导。
生物信息学技术包括多个方面。
首先是序列分析,通过对DNA、RNA和蛋白质序列的比对和注释,可以研究基因组各个部分的功能和相互作用。
这种方法可以帮助我们了解基因的演化和功能,发现新基因,并对其进行功能预测。
此外,还可以通过序列比对和同源建模来预测蛋白质的三维结构,为药物设计和基因工程提供参考。
其次是基因表达分析,通过测量基因在不同条件下的表达水平,可以研究基因调控网络以及基因在发育和疾病中的表达模式。
这种方法可以帮助我们识别特定疾病的生物标志物,预测疾病的发生和进展,并寻找新的治疗方法。
另外还有蛋白质结构预测和功能注释,通过生物信息学工具和算法,可以根据蛋白质的序列信息预测其结构和功能。
这对于药物设计和基因工程具有重要意义,可以加速新药的开发过程并优化已有药物的效果。
生物信息学技术在个性化医疗方面也发挥着关键作用。
通过分析个体基因组、转录组和蛋白质组的信息,可以为患者提供更加个性化的诊断、预测和治疗方案。
例如,根据患者的基因型和表型信息,可以预测他们对特定药物的反应和副作用,从而制定最合适的治疗方案,提高治疗效果和安全性。
生物信息学技术在研究领域的广泛应用也带来了大规模数据的挑战。
生物学数据通常以大规模、高维度和多样性的形式存在,需要高效的算法和云计算平台来进行处理和分析。
不断发展的人工智能和机器学习技术正在为生物信息学领域提供更多的机会和挑战。
总的来说,生物信息学技术是生物学和计算机科学相结合的重要领域,可以帮助我们更好地理解生物学过程、预测分子结构和功能,并为药物设计和疾病研究提供指导。
随着技术的不断发展,生物信息学在生物学研究和医学应用中的作用将愈发重要,为人类健康和生命科学的进步作出贡献。
生物信息学简介

生物信息学简介一. 生物信息学诞生的历史必然性生物信息学(Bioinformatics)就其萌生而言,是一门相当古老的学科,因为早在计算机初创期的1956年就已经在美国田纳西州的Gatlinburg召开过首次“生物学中的信息理论讨论会”;而就其发展而言,却是一门相当年轻的学科,因为继20余年的沉默之后,只有伴随着八九十年代计算机技术的迅猛发展,它才同时得以获得自身的大发展。
无论从理论上来讲还是从现实情况来看,生物信息学的实质就是利用计算机科学和网络技术来解决生物学问题。
它的诞生和发展是应时所需,是历史的必然,已经悄然渗透到生物科学的每一个角落,以至人们在意识到它的存在之前就已经离不开它了!二十世纪尤其是末期,生物科学技术的迅猛发展,无论从数量上还是从质量上,都极大地丰富了生物科学的数据资源,数据资源的急剧膨胀首先迫使我们不得不考虑寻求一种强有力的工具去组织他们,以利于对已知生物学知识的储存和进一步加工利用。
大量多样化的生物学数据资源中必然蕴含着大量重要的生物学规律,这些规律是我们解决许多生命之谜的关键所在,然而继续沿用传统手段以人脑来分析如此庞杂的数据实在是太勉为其难了!人们同样需要寻求一种强有力的工具去协助人脑完成这些分析工作。
可以说,伴随着二十一世纪的到来,生物科学的重点和潜在的突破点已经由二十世纪的试验分析和数据积累转移到数据分析及其指导下的试验验证上来,生物科学也正在经历着一个从分析还原思维到系统整合思维的转变。
那么,我们所寻求的那种强有力的数据处理分析工具就成为未来生物科学的关键所在;似乎是上帝的恩赐,伴随着生物科学这一需求的加剧,以数据处理分析为本质的计算机科学技术和网络技术同样获得了突飞猛进的进展,自然就成为生物科学家的必然选择,计算机科学技术和网络技术日益渗透到生物科学的方方面面,一门崭新的、正是如火如荼的、拥有巨大发展潜力的生物信息学也就悄然而坚定地发展和成熟起来了!可以说,历史必然性的选择了生物信息学——生物科学与计算科学的融合体——作为下一代生物科学研究的重要工具。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要:对生物信息学的产生背景及概念进行论述,对生物信息学、计算生物学、基因组信息
学等概念进行区别,重点对生物信息学的研究内容进行综述,并对研究的热点问题进行讨论,
最后对发展前景提出展望。
关键词:生物信息学;基因组信息学;蛋白质结构预测;药物设计
生物信息学的起源
生物信息学是20世纪80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科。
基因组学的出现始于1986年,美国Johns Hopkins大学著名人类遗传学家和内科教授McKusick创造了基因组学(Genomics)这个名词,意指从基因组水平研究遗传的学科。
虽然基因组信息量在生物总信息量中占有极大的比重,但是,生物信息并不仅限于基因组信息,生物信息学也并不等同于基因组信息学。
目前,我们普遍认为生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,找到代表蛋白质和DNA基因的编码区,特别是阐明非编码区的实质,从而认识生物有机体代谢、发育、分化和进化的规律;同时在发现了新基因信息之后进行蛋白质空间结构的模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。
因此,现代生物信息学主要包括3个重要内容,它们分别是基因组信息学、蛋白质的结构模拟以及药物设计。
从20世纪90年代以来,随着各种生物基因组测序计划的展开与分子结构测定技术的突破以及Internet的普及,无数的生物学数据如雨后春笋般迅速涌现。
2001年2月12日,美国Celera公司与美国国家人类基因组计划分别在Science和Nature上公布了人类基因组的精细图谱及其初步分析结果。
2002年4月5日出版的Science杂志又把水稻基因组的序列框架图公布出来。
2002年8月23日出版的Science杂志公布了河豚的全基因组序列。
到目前为止,已经测出了上百种生物体的完整基因组序列。
如何分析这些从实验过程中获得的大量原始数据,并从中获得与生物结构、功能相关的有用信息是当前困扰理论生物学家的一个棘手问题。
生物信息学(Bioinformatics)就是在此背景下发展起来的综合运用生物学、数学、统计学、物理学、化学、信息科学以及计算机科学等诸多学科的理论方法而形成的一门崭新交叉学科。
2生物信息学主要研究内容
从生物信息学研究的具体内容上看,生物信息学主要包括序列比对、序列分析、功能基因组、基因表达数据分析、蛋白质结构、药物设计等方面。
2.1序列比对
在生物学中序列是指核酸或氨基酸序列,序列比对是指比较两个或两个以上符号序列的相似性双序列比较是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的序列。
常用的程序包有BLAST、FASTA等。
多重序列比较是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列比较,以确定该序列与其它序列间的同源性大小。
根据序列同源性分析的结果,重建反映物种间进化关系的进化树。
常用的构建进化树的算法是UPGMA,软件包有PYLIP、MEGA等。
多重序列比对是当前一个研究热点,常用算法有分治法,HMM及聚类法等。
目前基因组比对也引起研究者们的关注。
不同物种间的基因组比对既能够解释和预测他们蛋白质功能的相似性,又能够揭示不同物种间的联系。
基因组比对由于涉及上亿的核酸,计算量很耗时,Delcher提出一种后缀树的方法比较两个基因组。
研究基因组比对算法也是一个研究方向。
2.2序列分析
随着越来越多生物体的DNA序列被人类测定,人们希望通过序列分析来获知其对应的基因和基因调控序列。
重新组装在散弹法DNA测序过程中被打散的DNA序列,即研究基因重组算法是生物信息学研究的重点课题。
基因重组的难点是DNA有很多重复的区域,相同的片段可能属于不同的区域由于基因组中并非所有的核酸都构成基因,所以序列分析的另一个研究内容是对基因组中的基因和基因调控序列进行自动识别。
基因识别是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置。
从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点、内含子、外显子和终止密码子等。
目前在基因识别方面的算法大体可分为基于统计的方法、基于同源性的方法和基于机器学习(如人工神经网络)方法。
同
时对非编码区域的识别也很重要。
在人类基因组中,编码部分仅占总序列的3%~5%,其它的非编码区可能具有未被识别的功能。
分析非编码区DNA序列需要大胆的想象和崭新的思路。
2.3 功能基因组
功能基因组的任务是进行基因组功能注释(Genome annotation),了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活动中的作用。
功能基因组学的研究主要包括以下几个方面的内容:(1)进一步识别基因,识别基因转录调控信息,分析遗传语言。
(2)注释所有基因产物的功能,这是目前基因组功能注释的主要层次。
1995年Owen White设计出了第一套基因组注释软件系统。
该系统能够自动识别基因、转录基因和其他生物学特征,并能够初步分析它们的功能。
序列同源性分析、生物信息关联分析、生物数据挖掘是进行功能注释的主要生物信息学手段。
(3)研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图。
(4)比较基因组学研究,是识别和建立不同生物体的基因或其他基因组特征的联系。
在基因组水平对各个生物进行对照比较,可以揭示生命的起源和进化、发现蛋白质功能。
(5)功能基因组相关信息分析。
包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测。
2.4基因表达数据的分析
对基因表达数据的分析可以获取基因功能和基因表达调控信息,这是生物信息学的重大挑战之一。
目前对基因表达数据的处理主要是进行聚类分析虽然聚类方法是基因表达数据分析的基础,但是目前这类方法只能找出基因之间简单的、线性的关系需要发展新的分析方法以发现基因之间复杂的、非线性的关系。
最近国际上在基因调控网络分析方面出现了许多有意义的工作,建立起一些基因调控网络的数学模型,如布尔网络模型、线性关系网络模型、微分方程模型、互信息相关网络模型等,在此基础研究基因调控网络的动力学性质。
2.5蛋白质结构预测
蛋白质结构预测是生物信息学的重要应用。
蛋白质的氨基酸序列(也称为一级结构)可以容易地由它的基因编码序列获得。
蛋白质的结构对于理解蛋白质的功能十分重要。
目前尚没有普遍可行方案实现蛋白质结构的准确预测;大多数方案为启发式的。
蛋白质结构预测分为二级结构预测和空间结构预测。
理论和实验表明,不同的氨基酸残基在不同的局域环境下具有形成特定二级结构的倾向性,因此在一定程度上二级结构的预测可以归结为模式识别问题。
二级结构预测的目标就是预测某一个片段中心的残基是α螺旋,还是β折叠,或是其它。
常用方法有立体化学方法、图论方法、统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法和人工神经网络方法。
目前较为常用的几种方法有:PHD、PSIPRED、Jpred、PSEDATOR、PSA。
在空间结构预测方面,比较成功的理论方法是同源模型法。
运用同源模型方法可以完成所有蛋白质10%~30%的空间结构预测工作。
得到蛋白质结构后就可以进一步分析研究蛋白质的功能。
药物设计
基于生物大分子结构的药物设计是生物信息学中极为重要的研究领域。
生物信息学可用于药物靶标基因的发现和验证。
有许多数据库可用来获得不同组织在正常/疾病状态下基因表达的差异,通过搜索这些数据库,可以得到候选基因作为药物靶标,特异性地针对某一种疾病。
另外,还可根据蛋白质功能区和三维结构的预测来对药物靶标进行鉴定,以便早期了解所研究蛋白的属性,预测它是否适用于药物作用。
计算机辅助药物设计主要包括活性位点分析法、数据库搜寻、全新药物设计。
目前,活性位点分析软件有DRID、GREEN、HSITE等。
另外还有一些基于蒙特卡罗、模拟退火技术的软件如MCSS、HINT、BUCKETS等。
目前数据库搜寻方法分为两类。
一类是基于配体的,即根据药效基团模型进行三维结构数据库搜寻。
该类方法中比较著名的软件有Catalyst和Unity,而以前者应用更普遍。
另一类方法是基于受体的,也称为分子对接法,具代表性的分子对接软件主要有DOCK、F1exX和GOLD。
全新药物设计方法出现的时间虽然不长,但发展极为迅速,现已开发出一批实用性较强的软件,其主要软件有LUDI、Leapfrog、GROW、SPROU以及北京大学来鲁华等开发的LigBuilder等,其中LUDI最为常用。
3.结束语
生物信息学是一门新兴的极具发展潜力的学科,对计算机工作者也提出极高的要求,在序列比对中目前的研究热点主要有多序列比对算法及基因组比对算法。
在序列分析中重点是研究基因重组及基因识别算法,同时对非编码区的识别也是个重点。
同时后基因组时代从结构转向功能的研究涉及到基因组功能的注释,基因的表达调控机制,比较基因组的研究等内容。
同时蛋白质的结构预测对蛋白质的功能理解也非常重要,然后依据特定蛋白质的功能进行必要的药物设计。