生物信息学的研究现状及其发展问题的探讨_朱杰
生物信息学研究新进展与展望

生物信息学研究新进展与展望随着科技的发展,生物信息学这一交叉学科的研究也越来越受到关注。
生物信息学的研究基于生物学和计算机科学的交叉,主要探究生物信息的获取、存储、处理和分析等方面。
下面将介绍生物信息学的新进展以及未来可能的发展方向。
1. 大数据时代下生物信息学的新挑战随着测序技术的不断发展,科学家们获得了大量的生物数据,如基因组、转录组、蛋白组等。
这些数据不仅数量庞大,而且在科研中应用的难度也越来越高,给生物信息学研究带来了新的挑战。
为了有效地使用这些数据,科学家们开始研究生物信息学的新方法和技术,如机器学习、深度学习以及自然语言处理等。
这些技术的引入使得生物信息学的分析效果更加准确、高效。
2. 人工智能在生物信息学领域应用的新趋势随着人工智能技术的不断发展,人工智能在生物信息学领域的应用也日益增多。
人工智能可以快速分析生物数据,识别模式和趋势,以及预测疾病和药物反应等因素。
例如,科学家们利用深度学习算法,预测肺癌病人的生存期和药物反应等指标。
这一技术的应用可以帮助医生更加准确地诊断肺癌,并根据患者的特征选择最佳的治疗方案。
3. 多组学数据整合的挑战生物信息学的另一个重要领域是多组学数据整合的研究。
从基因组、转录组、蛋白质组等多个层面获取的数据需要整合起来分析,以便更好地理解生物体系统的功能和调控机制。
然而,不同类型的数据来源不同,数据结构和处理方法也不同,这给多组学数据整合带来了很大的挑战。
因此,科学家们致力于研究多组学数据整合的方法,并探索采用深度学习等新技术来帮助整合分析。
4. 未来展望未来,生物信息学的研究将更加聚焦于生命科学中更加深入、复杂的问题。
例如,从生物个体层面到群体层面,探索基因调控、信号通路、代谢途径和细胞、组织、器官及整个生物体系统的功能和调控等方面。
同时,生物信息学和人工智能、机器学习等交叉学科的结合,也将会有更多新的应用和发展。
人工智能在诊断、治疗和药物开发等方面将会扮演更加重要的角色,为我们更好地理解生物体系统提供更加科学、可靠的方法。
生物信息学的发展现状和未来趋势

生物信息学的发展现状和未来趋势生物信息学是计算机科学、统计学、生物学和数学等学科交叉的领域,它将生物学和计算机科学的理论和技术相结合,对生物学研究进行信息化处理和分析。
生物信息学在生命科学、医学和生态环境等方面具有广泛的应用,重要程度不言自明。
本文将从生物信息学的发展现状、未来趋势、重要应用和技术变革等方面进行讨论。
一、生物信息学的发展现状随着人类基因组计划、生命科学的快速发展和计算机科学的进步,生物信息学得到了快速的发展。
生物序列分析、结构生物学、功能基因组、系统生物学等领域的技术和方法也得到了快速的发展和应用。
在基因组学领域,生物信息学应用于序列测定、基因标注、宏基因组分析等方面。
在蛋白质组学方面,生物信息学应用于蛋白质功能预测、结构预测和蛋白质相互作用网络等方面。
在系统生物学方面,生物信息学应用于代谢组学、转录组学和蛋白质组学等方面,通过系统集成分析,揭示细胞、组织和生物体的整体性质。
二、生物信息学的未来趋势生物信息学在未来发展中,趋势主要是三个方向:多样化应用、多学科交叉和高性能计算。
1. 多样化应用未来生物信息学的发展将更加多样化,将涉及到更多的领域。
例如:精准医疗、人工合成生物学、基因编辑等。
生物信息学将在未来的发展中,将越来越广泛地应用于医疗保健、农业、环境保护、食品安全等方面。
2. 多学科交叉生物信息学不仅仅是生命科学和计算机科学的交叉,也涉及到统计学、数学、物理学、工程学等多个学科的交叉。
未来,生物信息学将更加深入地涵盖其他各种交叉学科,从而更好地支持生物学研究进展。
3. 高性能计算大数据时代对计算能力的要求非常高,未来的生物信息学也需要更加高效、高性能、低成本的计算圣杯。
未来,使用巨型计算机和云计算等技术将成为生物信息学的重要手段。
三、生物信息学的重要应用生物信息学在许多领域广泛应用的,具有重要意义。
1. 癌症研究:生物信息学技术可以帮助科学家预测肿瘤分类、发展速度和患病率,从而帮助医生选择最佳治疗方案,甚至帮助构建最佳治疗方案。
生物信息学的发展现状及未来趋势分析

生物信息学的发展现状及未来趋势分析生物信息学的发展现状及未来趋势引言:生物信息学是一门快速发展的交叉学科,通过整合生物学、计算机科学和统计学等多个领域的知识,以理解和解释生物学中的大规模数据。
生物信息学的发展已经取得了显著的进展,并在许多领域产生了重要的应用。
本文将探讨生物信息学的发展现状,并展望未来发展的趋势。
第一部分:生物信息学的发展现状1.1 基因组学基因组学是生物信息学的重要领域之一,它研究生物体的全基因组,帮助科学家理解基因组的结构、功能和进化。
通过高通量测序技术的发展,生物科学家现在能够更加快速、准确地测序DNA片段,并研究某个生物体的所有基因。
1.2 蛋白质组学蛋白质组学是对生物体内所有蛋白质的综合研究。
通过质谱仪等高通量技术,科学家们能够更好地研究蛋白质的结构和功能。
蛋白质组学在药物研发、疾病诊断和治疗方面发挥着重要作用。
1.3 转录组学转录组学研究的是某个生物组织或细胞中所有的RNA分子。
通过转录组学的研究,科学家们可以更深入地了解基因表达的调控机制以及生物体对内外环境的适应能力。
1.4 蛋白质结构预测蛋白质结构预测是生物信息学中的一个重要问题。
准确地预测蛋白质的三维结构对于深入了解其功能和药物设计具有关键作用。
目前,生物信息学的发展使得蛋白质结构预测的准确性大大提高,但仍然存在许多挑战。
第二部分:生物信息学的未来趋势2.1 单细胞转录组学随着单细胞技术的不断发展,单细胞转录组学将成为未来生物信息学的重要方向之一。
通过分析单个细胞的转录组,科学家们能够更准确地了解细胞之间的异质性,从而深入研究生物发育、疾病发展等过程。
2.2 人类表型组学人类表型组学是研究人类基因与表型间关系的一个新兴领域。
通过整合基因组、转录组和蛋白质组等数据,科学家们能够更好地研究人类的性状、疾病易感性和药物反应等问题。
2.3 人工智能与深度学习人工智能和深度学习技术在生物信息学领域的应用越来越广泛。
通过利用机器学习算法,生物学家可以更好地分析和解释大规模生物数据,快速发现新的生物学模式和规律。
生物信息学研究的现状与挑战

生物信息学研究的现状与挑战生物信息学是一门发展迅速的交叉学科,它将计算机科学和生物学结合起来,为生物学研究提供了强大的工具和方法。
随着生物技术的快速发展,生物信息学的应用范围越来越广泛。
本文将围绕生物信息学研究的现状和挑战进行探讨。
一、现状生物信息学的发展可以追溯到上世纪末期,而当时的主要研究方向集中在基因组学和蛋白质组学等领域。
近几年来,生物信息学的应用范围越来越广泛,逐渐扩展到了转录组学、代谢组学和环境基因组学等领域。
随着技术的不断革新,生物信息学领域的研究方法也不断更新。
1. 基因组学和蛋白质组学基因组学和蛋白质组学一直是生物信息学研究的重要领域。
基因组学研究的是生物体的全基因组,包括基因序列、基因结构、基因间的相互作用等内容;蛋白质组学则研究的是生物体中的全部蛋白质,包括蛋白质序列和结构、功能及相互作用等方面。
这两个领域的研究可以帮助我们深入了解生物体的遗传信息和生物学功能。
2. 转录组学转录组学研究的是生物体中的全部RNA,包括mRNA、tRNA、rRNA等。
通过对转录组的分析,可以了解到不同基因的表达情况,同时也可以发现一些新的基因,对于研究生物体的功能和发展规律有着重要的作用。
3. 代谢组学代谢组学研究的是生物体内的代谢产物,包括葡萄糖、氨基酸等。
通过对代谢物的分析,可以深入了解生物体代谢的规律和生物学功能。
4. 环境基因组学环境基因组学研究的是环境中微生物的遗传信息,可以帮助人们更好地了解自然界中微生物的种类和数量分布情况等内容。
这对于研究环境污染、生物多样性和生态系统稳定性等具有重要意义。
二、挑战虽然生物信息学取得了一些重要的成果,但是在实际应用中还存在一些挑战,下面列举一些常见的问题:1. 数据处理问题生物信息学研究中的基础是数据,而处理这些海量数据是一个非常棘手的问题。
因为不同生物体之间的遗传信息差别很大,导致大规模数据的比对、分析及解释非常具有挑战性。
为了解决这个问题,我们需要开发更多高效且精度更高的数据处理工具和算法。
生物信息学研究现状及发展趋势

生物信息学研究现状及发展趋势一、本文概述1、生物信息学的定义与重要性生物信息学是一门跨学科的领域,它运用数学、计算机科学、统计学和生物学的原理和方法,对生物大分子如DNA、RNA和蛋白质的数据进行收集、存储、分析、解释和应用。
其核心在于利用计算技术来解析和理解生物数据中的复杂性和规律性,进而揭示生命的奥秘。
生物信息学的重要性在于,随着高通量测序技术和其他实验技术的发展,生物数据呈指数级增长,而生物信息学正是将这些海量数据转化为可理解和有价值的生物学知识的关键。
生物信息学的重要性体现在多个方面。
它对于基因组学、转录组学、蛋白质组学等各个生物学分支的研究具有至关重要的作用,为生物学的实验设计和数据分析提供了强大的工具。
生物信息学在医学领域也发挥着越来越重要的作用,例如在新药研发、疾病诊断和治疗等方面提供了重要的数据支持。
生物信息学对于生态学和农业科学等领域也有着重要的影响,有助于我们理解和保护生物多样性,提高农作物的产量和品质。
因此,生物信息学不仅是一门重要的交叉学科,也是推动生命科学发展的关键因素之一。
随着技术的不断进步和数据的不断增长,生物信息学在未来的发展中将发挥更加重要的作用。
2、生物信息学的发展历程概述生物信息学作为一门交叉学科,其发展历程可以追溯到20世纪后半叶。
初期,生物信息学主要依赖于计算机科学和统计学的方法,对生物数据进行处理和分析。
随着基因组学、蛋白质组学等高通量技术的快速发展,生物信息学逐渐崭露头角,成为生物学研究的重要分支。
在20世纪90年代,随着人类基因组计划的启动,生物信息学得到了极大的推动。
研究人员开始利用计算机算法和数据库技术,对基因组序列进行注释、比对和分析。
这一时期的生物信息学主要关注基因组序列的解读和基因功能的预测。
进入21世纪,随着高通量测序技术的不断进步,生物信息学的研究范围不断扩大。
除了基因组学外,转录组学、蛋白质组学、代谢组学等领域的数据也开始被纳入生物信息学的研究范畴。
生物信息学的研究现状和应用前景

生物信息学的研究现状和应用前景随着生命科学技术的迅速发展,生物信息学逐渐成为了生命科学的一个重要分支。
生物信息学是利用计算机和数学方法分析、管理和理解生物学及其体系中涉及的各种信息,包括基因序列、蛋白质结构、代谢途径、细胞信号转导等等。
它已经广泛应用于生物学、药理学、医学、环境科学、农业等多个领域,成为了当今科学研究的重要工具。
生物信息学的研究现状基因组学是生物信息学的核心领域之一。
随着技术的不断进步,高通量测序技术已经使重复序列区域得到很好的控制,人类、动物和植物的基因组序列逐渐被揭示。
例如,2012年,国际人类基因组组织成员发表了一个世界范围的研究,他们对2504道人类基因组进行了测序,分析了基因组变异特点及与人类复杂病的关联研究,大量的数据让人类基因组研究进入了全新阶段。
在蛋白质领域,蛋白质结构预测和分析是生物信息学的重点之一。
通过预测蛋白质的三维结构,可以揭示蛋白质的功能和相互作用。
通过比较蛋白质结构的异同,也可以发现结果不正确的多肽链或错配的结合部位。
对于蛋白质结构的研究已经有了很多的突破,例如采用重构重放技术,通过多个结构模板的互相比较来增加结构预测精度。
除此之外,生物信息学还在一些方面产生了新进展。
比如,系统生物学研究生物系统的全貌,包括基因组、表观基因组、转录组、蛋白质组和代谢组等方面。
总体而言,生物信息学在基因组学研究、蛋白质领域研究、系统生物学研究等方面都有了长足的进展。
生物信息学的应用前景生物信息学的应用前景非常广阔。
一方面,它可以为生物学和医学领域提供帮助,使得人们能够更加深入地研究生物相关的问题。
例如,基于生物信息学的技术可以对基因组进行比较,以便更好地了解每个物种的遗传变异,甚至在患病的病例中,可以通过同源比较方法,快速地找到潜在病因点。
这对于研究疾病的基因机制有很大的帮助,推动了疾病的治疗和预防。
此外,由于疾病的多样性影响因素的复杂性,生物信息学也为药物和疫苗的研发提供了新的思路和方法。
生物信息学的研究现状和前景

生物信息学的研究现状和前景生物信息学是一门融合了生物学、计算机科学、统计学和信息学等众多学科的新兴学科,它旨在解决生物学与信息学的结合所带来的众多计算和数据分析问题。
随着生物学技术的不断发展和时代的进步,生物数据量已经成倍增长,高通量数据的产生与处理成为了生物学研究的一大难点,而生物信息学则为解决这一难点提供了新的途径。
本文将从生物信息学的研究现状和前景两方面分别进行阐述。
一、生物信息学的研究现状生物信息学的发展史始于上世纪六十年代,当时的生物信息学主要是研究信息传输与处理等问题。
随着高通量测序技术的出现,生物信息学研究的重点逐渐转移到基因组学、转录组学、蛋白质组学和代谢组学等领域。
当前,生物信息学已经成为生物学与信息学交叉融合的领域之一,得到了快速的发展。
生物信息学研究的内容多方面,例如分子生物学、遗传学、生物信息学数据库、高通量测序等方面。
分子生物学是生物信息学的重要部分,其中研究重点将放在基因序列、基因组学、蛋白质序列、蛋白质结构和三维模拟等方面,广泛应用于疾病的病因探究、疾病的预测、药物的研发等方面。
遗传学是生物信息学中重要的子领域,通过了解遗传信息的变化可以更好的帮助人们认识遗传疾病,以及通过人工改变遗传信息治疗疾病等方式,还通过遗传学手段帮助保护珍贵物种等。
生物信息学数据库是支撑生物信息学研究的重要基础设施,其中包括基因组数据库、蛋白质数据库、限制酶数据库、单核苷酸多态性数据库等,为生物信息学领域的大量数据提供了存储和利用的实质平台。
高通量技术也是生物信息学的重要研究方法之一,包括基于串联式旁路法 (SBS) 的第二代测序技术、基于测序、基因芯片和质谱等技术的高通量化分析技术等,具有快捷、高通量、低成本和高分辨率等优势。
二、生物信息学的研究前景生物信息学的研究前景较广,研究内容也十分丰富。
未来在生物信息学研究领域中,将会有许多重要的问题需要解决。
首先,生物信息技术的发展将在基因组水平上实现从单细胞到全体细胞、从单个组织到整个器官、从单个物种到整个物种群体的高清基因图谱。
生物信息学研究的现状与发展趋势

生物信息学研究的现状与发展趋势随着人类对生命科学越来越深入的探索,生物信息学作为一门新兴的交叉学科,正逐步崛起并拥有着广泛的应用前景。
生物信息学是关于生命过程和结构的信息获取、存储、分析、建模和展示的学科。
通过生物信息学的研究,可以更好的理解和改善生命系统的运行,同时也可以推动其他学科的发展。
在这篇文章中,我们将基于目前的研究现状,就生物信息学的发展趋势作一些探讨。
一、现状1. 序列分析DNA序列、蛋白质序列和小RNA序列是生物信息学的研究重点,大量的算法和工具被开发出来分析这些序列。
例如,基础的序列比对算法就有BLAST、Bowtie等,这些工具可帮助科研人员对相似序列进行比较和寻找适合的靶标序列。
现在,NGS( Next-Generation sequencing )系统的出现,使得序列分析变得更加可靠且高效。
2. 基因组、转录组和蛋白质组在基因组学、转录组学和蛋白质组学的实验技术不断发展的背景下,生物信息学成为了这些实验数据处理和解释方面的重要工具。
标准的基因组序列、转录组序列、蛋白质序列数据、芯片数据、上下游分析、差异表达分析等等的处理都可以依赖于生物信息学算法和工具。
3. 结构生物学结构生物学是研究蛋白质、核酸和其他生物分子三维结构的学科。
在结构生物学的实验数据中,X射线晶体学、核磁共振和电子显微术等成为衡量已知蛋白质结构与研究未知蛋白质的手段,而生物信息学则是将蛋白质的结构和功能深度联系起来的工具。
二、发展趋势1. 人工智能人工智能正逐渐成为生物信息学的新兴领域之一。
人工智能算法可以从海量的生物数据中学习和分析,从而更加高效和准确地预测生物分子结构和功能。
例如,深度学习技术可以代替人眼对大型基因组数据进行分类、分析和预测。
2. 单细胞技术单细胞技术是在单一独立细胞水平上对基因组、转录组和表观组进行细胞学研究的方法。
这一技术因其高通量、高分辨率、内部异质性描述等优点广受欢迎,其应用使得探究有趣的单一细胞和医学追求地球上最极端生存环境的微生物能够成为了现实。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 86 生 物 信 息 学 第 3 卷
其相互关系等知识 ;在大量信息和知识的基础上 ,探 索生命起源 、生物进化以及细胞 、器官和个体的发 生 、发 育 、病 变 、衰 亡 等 生 命 科 学 中 的 重 大 问 题[2 - 3] 。
上述这些数据库只是对原始生物学实验数据进 行简单的整理和归类 ,可称它们为基本数据库 ;随着 生物数据库在种类和数量上的急剧增长 ,其复杂程 度也不断增加 ,这就对数据库的管理带来了挑战 ,一 些将多个基本数据库整合在一起提供综合服务的二 次数据库便出现了 ,常用的有 UniGene , Trans Fac , EPD , Prosite , Prints , Pfam , Blocks , Profiles , DSS P , PubMed 等数据库 。这样用户可以方便地进 行多个数据库的多种查询 。现在大多数数据库能实 现自动投送数据 、在线查询 、在线计算和空间结构的 可视化浏览等多种功能[6] 。目前 ,几乎所有这些数 据库对学术研究部门或人员来说都是免费的 ,可以 免费下载或提供免费服务 。
3. 1 序列比对预测法 序列比对是以核酸和蛋白质序列为依据 ,来比
较两个或两个以上核酸或蛋白质在碱基 (A , T , C , G) 、氨基酸 (20 个氨基酸) 水平上的相似性和不相似 性 。序列比对是生物信息学最基本的分析方法 。常 用的 序 列 比 对 方 法 有 两 两 序 列 比 对 和 多 序 列 比 对[7] 。两两序列比对是比较两序列之间的相似性区 域和保守位点来寻找两序列可能存在的历史进化关 系 。两两序列比对又分为总体序列比对和局部序列 比对 。两个序列的比对有较成熟的动态规划算法 : 总体序列比对是以 Needleman - Wunsch 的算法为 理论体系发展的完善的比对方法 ;当两个序列总体 并不很相似 ,但某些局部片段相似性较高时 , Smith - Waterman 算法是解决局部比对的好算法 ,局部序 列比对正是以 Smith - Waterman 动态规则算法为理 论依据的比对方法 。多序列比对是以两两序列比对 为基础 ,逐步优化两条或多条序列比对结果的方法 , 其目的是建立两条以上序列可能存在的进化关系 。 最常见的多序列比对方法有 Pileup 算法和 Clustalw 算法[8] 。 3. 2 结构比对预测法
Abstract : Introduced the definition of bioinformatics through the developing history of bioinformatics ; summarized the sorts and distribution of
the biological database which is the tool of the modern biological information to be expressed , collected , deposited , transferred and searched on
近年来人类基因组计划和其它物种基因组计划 的启动和实施 ,使人类在生命科学领域尤其是核酸 和蛋白质等生物大分子的序列 、结构与功能等领域 迅速积累了大量数据 。人们渴求新知的愿望促使人 们去挖掘这些巨量数据[1] 。与此同时 ,以计算机技 术和网络技术为代表的信息科学也在近些年得到了 迅猛的发展 ,使巨量数据的分析 、处理与传输成为可 能[2] 。20 世纪 90 年代初 ,由生命科学和信息技术等 学科相结合特别是由分子生物学与计算机信息处理 技术紧密结合而形成的新兴交叉学科 - 生物信息学 应运而生 ,并大大推动了相关研究的开展 。生物信 息学的形成和发展对目前在全球范围内广泛开展的 各物种的基因组学 、蛋白组学 、信息科学 、计算机与 网络技术 、新药开发等多个领域将产生重大影响 ,并 将成为 21 世纪生命科学的基石[3] 。
生 物 信 息 学 China Journal of Bioinformatics 专论与综述
生物信息学的研究现状及其发展问题的探讨
朱 杰
(陕西师范大学物理学与信息技术学院生物物理研究室 西安 710062)
摘要 :结合生物信息学产生的历史条件 ,对生物信息学的定义进行了介绍 ;归纳总结了现代生物信息表述 、采集 、储存 、传递 、 检索的表现形式 - 生物学数据库的分类与分布 ;着重介绍了生物信息学的主要研究内容和基本的分析方法 ,阐明了生物信息 的分析和解读模式 ;强调了生物信息学与其他相关学科的相关性 ,提出了生物信息学发展的一些亟待解决的问题及其相应的 解决方案 。 关键词 :生命科学 ; 生物信息学 ; 数据库 ; 相关性 中图分类号 :Q61 文献标识码 :A 文章编号 :1672 - 5565 (2005) - 04 - 185 - 04
收稿日期 :2005 - 01 - 09 ;修回日期 :2005 - 02 - 22 基金项目 :国家自然科学基金资助项目 (No. 20272035) ;教育部科学技术研究重点项目 (No. 104167) . 作者简介 :朱杰 (1980 - ) ,男 ,土家族 ,湖南张家界人 ,硕士 ,助研 ,陕西物理学会会员 ,主要从事分子生物物理与理论生物物理研究 。
internet. Stressed the main contents and the basic analysis methods of bioinformatics , and illustrated the unscrambling model in biological infor2 mation ; and emphasized the pertinence between bioinformatics and other subjects ; and ended with the author’s personal opinions and sugges2
tions to the development of bioinformatics. There are great potential in the newly and growing field.
Key words :Life Science ;Bioinformatics ;Database ;Pertinence
组成蛋白质的氨基酸序列不仅决定着蛋白质的三 维结构 ,而且也决定着它的功能[3] 。首先以蛋白质的序 列为依据 ,来预测蛋白质的物理性质 ,如分子量、等电 点 、亲水性和疏水性 、跨膜区域 、信号肽和蛋白定位等 。 蛋白质的功能预测是以目的蛋白为线索力图发现它和 功能已知蛋白质的相似性 。蛋白质的功能预测主要侧 重在序列同源性和功能区序列的保守性[11] 。蛋白质二
3 生物信息学的基本分析方法
随着生物信息的急剧增长 ,如何从浩瀚的数据 库中获取有用信息 ,怎样处理提取的数据 ,进而从中 获得与生物结构 、功能相关的信息是一个使理论生 物学家感到棘手的难题[2 - 3] 。借助于计算机科学 、 信息科学及其它学科的共同参与 ,人们发展了生物 信息的多种分析方法 ,其中最基本的方法有序列对 比 、结构对比及功能对比预测法等 。
Bioinformatics’status in quo and its development in Lab , College of Physics and Information Technology , Shaanxi Normal University , Xi’an 710062 , China)
1 生物信息学的基本范畴
“生物信息学”是英文单词“Bioinformatics”的中 文译名 ,它是由美国学者 Lim 在 1991 年发表的文章 中首次使用的[4] 。生物信息学是它包含了生物信息 的获取 、处理 、储存 、分析和解释等在内的所有方面 的一门交叉学科 ,它综合运用数学 、计算机科学和生 物学的各种工具进行研究 , 目的在于了解和阐明大 量生物学数据所包含的生物学意义 。具体来讲 ,生 物信息学是把核酸 、蛋白质等生物大分子数据库作 为主要研究对象 ,用数学 、计算机科学等为主要研究 手段 ,对巨量生物学原始实验数据进行存储 、管理 、 注释 、加工 ,使之成为具有明确生物学意义的生物信 息 ;通过对生物信息的查询 、搜索 、比较 、分析 ,从中 获取基因编码 、基因调控 、核酸和蛋白质结构功能及
2 生物学数据库简介
近年来随着大量生物学实验数据的积累 ,众多 的生物学数据库也相继出现 ,它们各自按照一定的 标准收集和处理生物学实验数据 ,并提供相关的数 据查询 、处理等服务 。而数据库的类型则几乎覆盖 了生命科学的各个领域[3] 。国际上主要的 DNA 序 列 数 据 库 有 GenBank , EMBL , DDJ B , ES Tdb , OMIM , GDB , GSDB 等 ;蛋白质一级结构数据库有 SWISS - PRO T , PIR , O WL , ISSD , MI PS 等 ;蛋白 质二级结构数据库有 PROSI TE , BLOCKS , PRIN TS 等 ;蛋白质和其他生物大分子的三维结构数据库有 PDB , NDB , CCSD 等 ;与蛋白质结构分类有关的数 据库有 SCO P , CATH , FSS P 等[5] 。