生物信息学的现状与展望

合集下载

分子生物学的现况和今后的发展资料讲解

分子生物学的现况和今后的发展资料讲解

分子生物学的现况和今后的发展分子生物学的现况和今后的发展唐宇轩MSN摘要分子生物学是利用分子生物学的技术和方法研究人体内源性或外源性生物大分子和大分子体系的存在、结构或表达调控的变化,从而为疾病的预防、预测、诊断、治疗和转归提供信息和决策依据的一门学科。

近些年其发展迅速,并渗透到了多门学科的研究领域。

分子生物学的发展前景是相当可观的。

关键字分子生物学现状及发展基因治疗蛋白质工程分子生物学的发展及其在临床医学上的应用已经走过了半个多世纪的路程,随着国际交往的增加,近年来我国分子生物学技术有了突飞猛进的发展。

目前在医学院校和省级以上的医院均建立了临床分子生物学实验室。

随着分子生物学的兴起和向各方面的渗透,生物科学的各分支学科也经历着兴衰更替的变化。

从目前的发展状况来看,分子生物学仍将保持带头分支学科的地位,分子生物学带动了整个生物科学的全面发展。

就分子生物学现状来看,现代生物科学是生物科学与众多学科之间相互交叉、渗透和相互促进的结果。

例如:分子生物学渗入到发育生物学产生了分子发育生物学(molecdar developmental biology), 生活周期短的一些动植物如线虫、果蝇、拟南芥已成为发育生物学的重点研究对象,它们的发育过程很多已从分子水平得到了解。

分子生物学与细胞生物学关系密切,已形成一门新的分子细胞生物学(molecdar cell biology)。

许多细胞生物学问题如细胞分裂、细胞骨架(cytoskeleton)、细胞因子(cytoldne)的研究都进入了分子水平。

免疫学与分子生物学结合,产生了分子免疫学(molecular immunology)。

病理学与分子生物学结合,产生了分子病理学(molecular pathology〉,其中病毒学与分子生物学结合,就是分子病毒学(molecular virology〉其他相关科学推动了生物科学对生命现象和本质的研究不断深入和扩大,生物科学的发展也为其他相关科学提出了许多新的研究课题,开辟了许多新的研究领域。

生物信息学认识

生物信息学认识

浅谈生物信息学一、生物信息学产生的背景有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。

自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。

迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。

至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。

它预示着完成人类基因组计划已经指日可待。

截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。

在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。

可以预计,今后DNA序列数据的增长将更为惊人。

生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构,即氨基酸序列的增长。

此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。

基于cDNA 序列测序所建立起来的EST数据库其纪录已达数百万条。

在这些数据基础上派生、整理出来的数据库已达500余个。

这一切构成了一个生物学数据的海洋。

可以打一个比方来说明这些数据的规模。

有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。

而如今生物学数据信息总量已接近甚至超过此数量级。

这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。

数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。

与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。

一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。

合成生物学的前景展望

合成生物学的前景展望

合成生物学的前景展望目录:前言科学定义学科特征发展现状前景展望结语前言当今方兴未艾的合成生物学,是一门建立在生物信息学、DNA化学合成技术、遗传学和系统生物学之上的交叉学科。

近十年来,该学科在病毒全基因组合成、标准化遗传回路和最小基因组研究中取得了巨大的突破,也展现了其在生物科学应用中扮演的重要角色。

本文将通过介绍与分析合成生物学的相关信息展望合成生物学的发展前景。

科学定义目前合成生物学研究涵盖范围广泛,对其定义的表述不尽相同:合成生物学领域知名的网站(http://syntheticbiology. org)这样描述该领域的主要研究内容:“设计和构建新型生物学部件或系统以及对自然界的已有生物系统进行重新设计,并加以应用。

”2010年12月,美国13位知名专家共同完成了一份名为《新的方向》的研究报告,专门探讨合成生物学问题,文中将合成生物学的研究目标定位为:“将标准化的工程技术应用于生物学,以此创造出新型或具有特定功能的生命体或生物系统,以满足无尽的需求。

”合成生物学组织(Synthetic Biology Community)网站上公布的合成生物学的定义则强调合成生物学的两条技术路线:(1)新的生物零件、组件和系统的设计与建造;(2)对现有的、天然的生物系统的重新设计。

综合起来,合成生物学可被理解为基于系统生物学的遗传工程从基因片段、人工碱基DNA子、基因调控网络与信号传导路径到细胞的人工设计与合成,类似于现代集成型建筑工程,将工程学原理与方法应用于遗传工程与细胞工程等生物技术领域,合成生物学、计算生物学与化学生物学一同构成系统生物技术的方法基础。

学科特征1.多学科交叉性:作为一个以多学科为基础的综合性交叉研究领域,对于生物学家,合成生物学打开了一扇探索生命奥秘的大门;工程学家更关注的是该如何将实验流程和各类生物学元件进行模块化、标准化,以及如何有效地控制多个元件的相互协调;而如何将标准化的生物学模块进行数字化、定量化评价,更好地为人造“软件”进行模拟计算从而指导生物系统的构建,则是计算科学在生命科学中应用的突出体现;化学家和药物学家则更愿意将合成生物学看作多种用途的新型工具,用于高效地生产新型燃料和药物。

生物信息学的应用

生物信息学的应用

TrEMBL
一次数据库 UniProt MIPS GenPept NRL-3D NRDB 复合数据库 OWL SWISS-PROT+ TrEMBL PROSITE 二次数据库 PRINTS BLOCKS Pfam IDENTIFY COGs
/trembl/
/index.shtml/ http://mips.gsf.de/ ftp:///pub/genpept/ /general/software/packages/nrl_3d/n rl_3d.html/ / /dbbrowser/OWL/ /clustr/ /prosite/ /dbbrowser/PRINTS/ / / /identify/ /COG/
1990年10月,被誉为生命科学“阿波罗登月计划” 的国际人类基因组计划(HGP)启动。 1995年,美国人类基因组计划第一个五年总结报 告中给出生物信息学一个较为完整的定义。 2000年6月26日,美、英、日、德、法、中等六国 科学家共同努力,完成人类基因组工作草图,这是人 类科学史上又一个里程碑式的事件。 2003年4月14日,国际人类基因组测序组隆重宣布: 美、英、日、德、法和中国科学家历经13年共同努力, 人类基因组序列图(“完成图”)提前绘制成功。人 类迈入“后基因组时代”(Post-genomic Era)。
蛋 白 质
ProDom
http://www.toulouse.inra.fr/prodom.html/
PDB 一次数据库 MMDB
/pdb/home/home.do /Structure/MMDB/mmdb.shtml/
生物信息学的应用
生物信息学(Bioinformatics)
生物分子 数据 + 计算机 计算

生物信息学研究现状

生物信息学研究现状
科 技 信息
径” 为2 5 个像素 , “ 阈值 ” 为1 0 个色 阶, “ 半径 ” 选 项设置图像模糊强度 的 大小 , “ 阈值” 选项 设置图像模糊 范围的大小 。表面模糊 滤镜 在保 留主 要轮廓边缘 的 同时 消除杂色与粒 颗产 生平滑 的模糊效果 , 特别适合用 于消除脸部皱纹 、 斑点 、 毛孔等皮肤问题 。 2 . 创建 “ 嫩肤 ” 图层蒙版调 节嫩肤效果 。按住 A h 键 的同时单击 “ 图 ( 六) 运用 “ 滤镜 ”I ‘ ‘ 锐化”l ‘ ‘ U S M滤镜 ” 增强 照片清晰度 。 执行 “ 滤镜” 锐 化 ”I ‘ . U S M滤 镜” , 在 弹 出对话 框 中设 置数 量 1 2 0 %, 半径 1 像素, 阈值 3 色 阶D I ; 锐化强 度与 图像 大小成 正 比, 参数的 设 置取决于图片最终效果 , 即没 有显示明显的颗粒 、 燥 点又能增强清晰


生物 信 息 学 研 究发 展
生物信 息学是在生命科学 的研究 中, 综合计算 机科 学 、 信息技术和 数学 的理论 、 系统控制论 , 以计算机硬 件 、 软件 和计算 机网络 为主要工 具, 对生物原 始数据进行研 究 、 存档 、 显示、 处理 和模 拟 , 使之 成为具有 明确生物 意义 的生物信 息 , 并 通过对 生物信 息的查 询 、 搜索 、 比较 、 分 析, 从 中获取 基因编码 、 基因调控 、 核酸和蛋 白质结构功能及 其相互关
度。
层” 调板底部孺 “ 图层蒙版” 图标, 创建黑色图层蒙版暂时隐藏滤镜效
果 。选 择“ 嫩肤 ” 图层蒙版使用 画笔涂抹 白色 , 注意避 开眼睛 、 嘴唇 、 鼻 梁等保 护区域 , 覆 盖想要进行平 滑的皮肤 ; 在去除皱纹 、 毛孔 、 斑点 、 均 匀肤色 的基础 上根据脸部结构 、 皮肤纹理等特点 随时调整 画笔大小 、 透 明度 , 最大 限度地保 留原有皮肤质感 。 ( 五) 添加 “ 杂 色” 滤镜增强皮肤 质感 现 人物皮肤 已变得平 滑 、 均匀 、 细腻 , 略透着原有 皮肤 的纹 理。为 了使 人物皮肤 更具质感 、 更 真实 、 自然 , 避免 出现 塑料感还需要 为皮肤 添加 杂色 , 增加纹理与质感。 1 . 创 建“ 皮肤 质感” 新图层 , 按住 A h 键 的同时单击 “ 图层 ” 调板底部

生命科学的发展现状与未来趋势分析

生命科学的发展现状与未来趋势分析

生命科学的发展现状与未来趋势分析从古至今,生命科学一直是人类关注的焦点之一。

随着科学技术的不断进步,生命科学在过去几十年中取得了巨大的发展,为人类社会的进步和繁荣做出了重要贡献。

本文将分析当前生命科学的发展现状,并探讨未来的趋势和挑战。

首先,我们来看生命科学目前的发展现状。

生命科学是一门涉及生物学、生物化学、遗传学、微生物学等多个学科的综合科学,旨在揭示生命的起源、发展和运行规律。

在过去几十年里,生命科学取得了令人瞩目的成就。

例如,人类基因组计划的完成为人类基因研究奠定了基础,深度了解了人类基因组的组成和功能。

生物技术的迅猛发展使得我们能够对疾病的发生机制有更深入的了解,并开发出了许多新的治疗方法和药物。

另外,生物信息学的进步使得我们能够处理和分析大规模的生物数据,有助于揭示生命的复杂性和多样性。

然而,尽管取得了很多成就,但生命科学仍面临着许多挑战。

首先,生命科学的研究对象之一是复杂的生物系统,而生物系统的研究需要针对不同层面的层级进行多尺度的研究,这对科学家来说是一个巨大的挑战。

其次,由于生物学的交叉性和综合性,生命科学研究需要来自不同学科的专业人才,而当前的科学教育和培养体系仍存在不足。

此外,伦理和道德问题也是生命科学面临的重要挑战,如基因编辑技术的应用和遗传信息的隐私保护。

对于生命科学未来的趋势,我们可以预见以下几个方面的发展。

首先,人工智能的快速发展将为生命科学研究提供更多工具和方法,使得大规模数据的分析和模拟成为可能。

其次,合成生物学的兴起将使得我们能够设计和构建具有特定功能和性能的生物系统,这将推动生物医药、能源和环境方面的研究和应用。

此外,纳米技术和生物传感器的进步也将为生物医学的检测、监测和治疗提供更多的可能性。

另外,生态和环境保护问题将成为生命科学研究的重要方向,帮助我们深入理解和掌握地球生态系统的运行规律。

面对未来的挑战和趋势,生命科学研究需要加强国际合作和跨学科交流,共同解决共性和关键科学问题。

21世纪生物技术的发展

21世纪生物技术的发展

论21世纪生物技术的发展趋势现代生物科学的新进展,许多是在采用先进的技术和手段的条件下取得的,这些新技术有:DNA重组技术,DNA合成技术,快速DNA序列测定技术,蛋白质人工合成技术,蛋白质序列测定技术,核酸分子杂交技术,限制性内切酶片段长度多样性技术,反义RNA技术,聚合酶链反应扩增技术,单克隆抗体技术,脉冲电泳技术,磁力共振技术,扫描隧道和原子力显微技术,同步辐射技术,电子计算机技术,等等。

可见,研究技术和手段的革新是当代生物科学的另一个显著特点和发展趋势。

分开来看,生物科学技术拥有众多分支学科技术,现代生物学研究的热点领域有:基因组学、生物信息学、抗体工程技术、组织工程学、干细胞研究、药物分子设计以及行为科学、生态学等。

其中重要领域平台的发展现状和趋势如下:1、基因组学现状与发展趋势人类基因组计划的实施将极大地促进生命科学领域一系列相关科学的发展,阐明基因的结构与功能关系,细胞的发育、生长、分化的分子机理等。

这意味着生命科学从寻找生物学上个别重要的基因发展到整个基因组功能活动规律的研究,实现了从局部到整体的转变。

目前发展的最新趋势就是将最近几年发展起来的许多新技术(如高通量扫描,生物芯片,高密度单核苷酸多态性(SNP)遗传图谱,生物信息学等)与知识融入到分子医学、药理学、毒理学等诸多领域,并运用这些技术与知识大规模系统地从整个基因组层面去研究不同个体的基因差异与药效的关联,侧重于了解有重要功能意义和控制药物代谢与处置的多态性基因,以求探明药理学作用的分子机制以及各种疾病致病的遗传学机理,从而最终达到精确指导开发的目的`。

由于新一代遗传标记物(即单核苷酸多态性)的大规模发现,以及将其迅速应用于群体流行病遗传学,也可大大推动多基因遗传病和常见病(往往是多基因病)机理的基础研究,其研究结果又可以为制药工业提供新的药靶。

2、生物信息学现状与发展趋势生物信息学包括基因组学、结构生物信息学、功能生物信息学和蛋白质组信息学,核心是基因组学,包括基因组信息的获取、处理、存储、分配和解释,首要任务之一是发现新基因和新的功能;结构生物信息学主要研究基因产物即蛋白质和多肽的信息结构;功能生物信息学主要指细胞反应的数据库,存储有各种刺激后细胞基因表达改变的功能信息,提供细胞类型、能够表达的基因及其诱导剂等方面的咨询;蛋白质组信息学主要涉及蛋白质数据库的建立,相关软件的开发和应用,及蛋白质组成员序列、结构、功能、定位分类和蛋白质连锁图的构建,及蛋白质功能结构预测等。

生物信息学

生物信息学

生物信息学邱萌琳11216108一、定义与简介生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。

它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

二、经历阶段前基因组时代(20世纪90年代前)这一阶段主要是各种序列比较算法的建立、生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等。

基因组时代(20世纪90年代后至2001年)这一阶段主要是大规模的基因组测序,基因识别和发现,网络数据库系统地建立和交互界面工具的开发等。

后基因组时代(2001至今)随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。

这种转移的一个重要标志是产生了功能基因组学,而基因组学的前期工作相应地被称为结构基因组学。

三、生物信息学发展简介生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。

研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:遗传因子是以生物成分存在,1871年Miescher 从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色。

1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。

与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。

1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学的现状与展望 The Current Status and The Prospect of Bioinformatics 摘 要:本文阐述了生物信息学产生的背景,生物学数据库,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学数据所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。 关键词:人类基因组计划 生物信息学 一、生物信息学产生的背景

有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面,与 其同步的还有蛋白质的一级结构,即氨基酸序列的增长。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。 数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。 二、生物学数据库

《Nucleic Acids Research》杂志连续七年在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期中详细地介绍了115种通用和专用数据库,包括其详尽描述和访问网址。迄今为止,生物学数据库总数已达500个以上。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有 SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。应该指出,几乎所有这些数据库对学术研究部门或人员来说都是免费的,可以免费下载或提供免费服务。但是鉴于相当多的数据库的经营者们面临着财务紧缺的境地,这种免费的局面还能维持多久就不得而知了。有的数据库,如SWISS-PROT,已开始向商业用户每年收取数千至数万美元不等的使用费。其它数据库暂时还是免费的,但不知是否永远免费。如果一些重要的数据库对学术研究部门开始收费,这对于我国生物信息学的发展是非常不利的。中国是一个基因信息资源大国,我们应当抓紧建设我国自有的数据库,在世界上做出我们自己的贡献,在平等的基础上与国外共享生物信息资源。 三、生物信息学的主要研究内容

生物信息学主要包括以下几个主要研究领域,但是限于篇幅,这里仅列出其名称并只做简单介绍。 1、序列比对(Alignment)。

基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础,非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包——BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。 2、结构比对。 基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。已有一些算法。 3、蛋白质结构预测,包括2级和3级结构预测,是最重要的课

题之一。 从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学 和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。 4、计算机辅助基因识别(仅指蛋白质编码基因)。 基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。 5、非编码区分析和DNA语言研究,是最重要的课题之一。

在人类基因组中,编码部分进展总序列的3~5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。 6、分子进化和比较基因组学,是最重要的课题之一。

早期的工作主要是利用不同物种中同一种基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化。以上研究已经积累了大量的工作。近年来由于较多模式生物基因组测序任务的完成,为从整个基因组的角度来研究分子进化提供了条件。可以设想,比较两个或多个完整基因组这一工作需要新的思路和方法,当然也渴望得到更丰硕的成果。这方面可做的工作是很多的。 7、序列重叠群(Contigs)装配。

一般来说,根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,这就有一个把大量的较短的序列全体构成了重 叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。拼接EST数据以发现全长新基因也有类似的问题。已经证明,这是一个NP-完备性算法问题。 8、遗传密码的起源。

遗传密码为什么是现在这样的?这一直是一个谜。一种最简单的理论认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物最后的共同祖先里,一直延续至今。不同于这种“冻结”理论,有人曾分别提出过选择优化、化学和历史等三种学说来解释遗传密码。随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材。 9、基于结构的药物设计。

人类基因组计划的目的之一在于阐明人的约10万种蛋白质的结构、功能、相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其3级结构的基础上,可以利用分子对接算法,在计算机上设计抑制剂分子,作为候选药物。这种发现新药物的方法有强大的生命力,也有着巨大的经济效益。 10、其他。

如基因表达浦分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域。这里不再赘述。 四、与生物信息学关系密切的数学领域

限于篇幅,仅列出它们的名称。统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应

相关文档
最新文档