基因预测和蛋白质结构预测

合集下载

基因突变对蛋白质功能的影响与预测

基因突变对蛋白质功能的影响与预测

基因突变对蛋白质功能的影响与预测蛋白质是细胞内最重要的功能分子之一,它们参与诸多生命活动的调控、催化反应和物质运输等。

这些不同的功能和作用是由蛋白质的结构决定的,而蛋白质的结构又受到基因的影响。

针对这一点,基因突变是影响蛋白质功能的一个关键因素。

基因突变是指自然通过基因复制或外在因素干扰而引起的基因序列发生改变的现象。

突变可能导致基因产生全新的表型或影响蛋白质的结构和功能。

不同的突变形式,不同的基因位置,都会造成不同的影响。

其中,突变对蛋白质编码区基因的影响是最为重要的。

突变会导致蛋白质结构的变化。

蛋白质的结构决定了其功能,因此,即使是一点微小的突变都可能会导致蛋白质结构和功能的改变。

例如,突变会导致某个氨基酸的替换或者插入,这些小改变会影响蛋白质结构的特定部位,进而影响蛋白质的活性。

此外,突变还可能导致蛋白质结构的完全改变,从而导致原有的功能无法执行。

在基因突变对蛋白质功能的影响中,还有一个很重要的因素是随机性。

不同基因的突变可能会导致不同的蛋白质结构和功能变化,甚至不同的个体之间也可能存在差异。

这就给蛋白质相关的疾病研究带来了很大的挑战。

针对基因突变对蛋白质功能的影响,科学家们开展了很多研究,以便更好地预测蛋白质结构和功能的变化。

其中最常见的方法之一是基于计算机模拟。

计算机模拟能够模拟出基因突变后蛋白质结构的变化和对蛋白质功能的影响。

这些模拟可以帮助科学家们更好地理解蛋白质结构与功能之间的关系,并为药物研究和蛋白质工程提供支持。

除此之外,新兴的技术也为预测基因突变对蛋白质功能的影响提供了更多的方法。

例如,结合深度学习等机器学习技术的神经网络模型可以准确地预测突变对蛋白质功能的影响。

此外,在大规模基因突变筛查之后,也可以通过机器学习模型,评估突变对蛋白质功能的影响,这为疾病的分子级别治疗提供了核心理论支持。

总体来说,基因突变对蛋白质功能的影响是重要的生命科学问题,其对疾病发生、发展和治疗都有着重要的影响。

生物信息学的意义与方法

生物信息学的意义与方法

生物信息学的意义与方法近年来,随着DNA测序技术水平的不断提高,生物信息学逐渐成为了生命科学领域中的重要科研工具。

生物信息学涉及到信息学、生物学、数学、物理学等多个学科领域,在分析生物大数据、预测细胞和分子之间相互作用、揭示生命活动机制等方面发挥了重要作用。

一、生物信息学的意义1. 解读基因组生物信息学可以通过对基因组序列的解析,了解基因组的结构和功能。

通过此方式,科学家们可以发现某些蛋白质在不同物种中的序列很相似,这意味着这些物种可能存在着共同祖先。

这为生命起源的研究提供了有力的证据和支持。

2. 预测蛋白质结构和功能蛋白质是细胞的基本组成单元,对细胞的功能起到至关重要的作用。

生物信息学可以通过计算和模拟手段来预测蛋白质的结构和功能,这有助于科学家们更好地了解蛋白质的构造和作用机理,并为新型药物的开发提供理论依据。

3. 挖掘大数据随着DNA测序技术的普及,生物信息学可以处理大量的生物数据。

通过挖掘大数据,科学家们可以了解基因和表达型之间的关系,发现某些特定基因的调节机制等。

这些发现有助于预测某些基因变异导致的遗传病风险,并为开发个性化药物提供理论支持。

二、生物信息学的方法1. 基因组测序基因组测序是生物信息学的最基础的技术之一。

它可以生成DNA序列,并通过反复比对已知的序列,预测基因位置和边界。

同时,还可以用于检测多样样本间的比较,找出差异性和相同点,为后续研究提供参考。

2. 蛋白质结构预测蛋白质结构预测是生物信息学研究领域的重要分支。

通过计算和建模的方法,可以预测蛋白质在空间中的结构以及蛋白质之间的相互作用。

这有助于科学家们了解蛋白质在生命活动中扮演的角色,为新型药物研发提供理论支持。

3. 生物网络分析生物网络分析是生物信息学的另一种研究方法。

通过这种方法,可以将生物系统模型化成复杂网络,并分析不同节点之间的关联关系。

这有助于了解生物系统中多种因素之间的复杂关系以及各因素对生命活动机理的影响。

蛋白质结构预测及其在结构生物学中的应用

蛋白质结构预测及其在结构生物学中的应用

蛋白质结构预测及其在结构生物学中的应用蛋白质是生命体内最基础的分子,是构成生命物质的基本单位。

每个蛋白质都具有一定的空间结构,这个结构决定了蛋白质的功能。

因此,蛋白质结构的预测对于生命科学、药物设计等领域具有重要的意义。

本文将探讨蛋白质结构预测的基本原理以及在结构生物学中的应用。

一、蛋白质结构预测的基本原理蛋白质的空间结构可以分为四个层次:一级结构(序列)、二级结构(α-螺旋、β-折叠等)、三级结构(多肽链的空间构象)和四级结构(多个多肽链之间的空间关系)。

预测蛋白质的空间结构,从根本上来说就是预测其三级结构的问题。

目前,大部分蛋白质结构预测方法都是基于基因组学的大规模测序数据的,结合一些现有的晶体结构数据库和序列数据库。

基本上,它们都大致包含以下三个步骤:第一步,根据蛋白质的氨基酸序列和模板数据,在蛋白质数据库中寻找最相似的结构;第二步,将找到的最相似的结构作为一个初始模型,使用蛋白质结构预测算法进行优化;第三步,选择最优解或者最优模型。

目前使用最广泛的预测方法是同源建模和蒙特卡罗模拟。

同源建模通过寻找蛋白质序列和已经被解析的蛋白质晶体或者核磁共振数据的相似性,构建一个已知的三维模型。

蒙特卡罗模拟是一种基于优化的预测方法,模拟蛋白质在空间中不同构象的状态,最后得到最佳的构象。

二、蛋白质结构预测在结构生物学中的应用蛋白质的结构预测对于结构生物学的发展起到了重要的推动作用。

此外,它还可以在多个领域中发挥重要的应用。

1.药物设计药物设计是利用化学或者生物学方法开发药品的过程。

在药物设计过程中,蛋白质结构预测是不可或缺的一步。

通过预测蛋白质的结构,科学家可以根据药物和靶标蛋白质之间的相互作用原理来精确设计和优化药物分子结构。

2.蛋白质工程蛋白质工程是指利用基因工程技术对蛋白质分子进行改造的过程。

结合蛋白质结构预测的结果,科学家可以从理论上探究如何改变蛋白质的某些特性,例如抗原性、稳定性、活性等,以实现特定的应用需求。

生物信息学中的基因序列分析与预测

生物信息学中的基因序列分析与预测

生物信息学中的基因序列分析与预测生物信息学是一门综合学科,它将计算机科学、数学和统计学等技术应用于生物学领域。

基因序列分析与预测是生物信息学中的重要研究领域之一,它涉及到对基因序列的分析、注释和预测。

基因序列是生物体内以DNA或RNA形式存在的遗传信息。

通过对基因序列的分析,我们可以了解基因的功能和结构,进而深入研究生物体的生理过程和疾病发生机理。

基因序列的注释则是对基因序列进行功能和结构的解读和标记,在基因组学研究和生物学研究中起到关键作用。

基因序列的预测是通过生物信息学技术对未知基因序列进行功能和结构的预测。

在基因组学研究中,大量基因序列还没有被准确注释,因此基因序列的预测对于深入研究生物体的特征和功能非常重要。

基因序列预测可以通过多种算法和技术来实现,其中最常用的方法包括序列比对、开放阅读框(ORF)预测、蛋白质结构预测等。

序列比对是基因序列分析的基本方法之一,它通过比较待分析序列与已知序列数据库中的序列进行比较,从而找到相似的区域和序列特征。

根据比对结果,可以判断待分析序列与已知序列的亲缘关系、功能和结构等信息。

开放阅读框(ORF)预测是对基因序列中的蛋白编码区域进行预测。

开放阅读框是指在核苷酸序列中没有起始密码子和终止密码子的连续核苷酸序列。

通过使用启动子预测算法和终止密码子识别算法,可以准确地预测基因序列中的开放阅读框,进而推断蛋白编码区域的位置和功能。

蛋白质结构预测是预测待分析基因序列所编码的蛋白质的三维结构。

蛋白质的结构对于其功能和相互作用非常关键,因此准确地预测蛋白质结构对于研究蛋白质的功能和疾病发生机制具有重要意义。

蛋白质结构预测方法主要分为比较模型和折叠模型两种,通过比对已知结构的同源蛋白质,或者通过物理化学规则和算法,可以预测待分析蛋白质的结构。

在生物信息学中,基因序列分析与预测常常是多领域合作的结果,涉及到计算机科学、生物学、数学和统计学等多学科的知识与技术的融合。

随着高通量测序技术的不断发展,我们可以获取到大量的基因序列数据,这为基因序列分析与预测提供了更多的机会和挑战。

生物信息学中常见数据处理方法总结

生物信息学中常见数据处理方法总结

生物信息学中常见数据处理方法总结随着高通量测序技术的发展,生物信息学在生命科学研究中扮演着愈发重要的角色。

生物信息学旨在处理、分析和解释生物学数据,以便从海量的生物信息中挖掘出有意义的知识。

在这个领域中,有许多常见的数据处理方法被广泛应用,下面将对其中一些方法进行总结。

1. 序列比对(Sequence Alignment)序列比对是生物信息学中最常见的数据处理方法之一。

它主要用于比较两个或多个生物序列的相似程度。

比对的目标包括DNA,RNA和蛋白质序列。

序列比对方法的核心在于寻找两个序列之间的匹配模式和不匹配位置,并计算其相似度评分。

常用的序列比对算法有Smith-Waterman算法和Needleman-Wunsch算法。

2. 基因组组装(Genome Assembly)基因组组装是将碎片化的DNA序列重新拼接成完整基因组的过程。

由于基因组非常庞大且复杂,从现有的测序数据中恢复出完整基因组是一项巨大的挑战。

基因组组装方法通常依赖于测序技术的不同,包括De Bruijn图方法、重叠-布局-一致性(Overlap-Layout-Consensus)方法和引导组装方法等。

3. RNA测序分析(RNA-seq Analysis)RNA测序分析是分析转录组数据的一种方法。

它可以帮助研究者了解转录过程中的基因表达和调控机制。

RNA-seq分析通常包括数据质量控制、对原始序列进行去除低质量序列和适配体序列、比对到参考基因组、计算基因表达量以及差异表达基因分析等步骤。

4. 蛋白质结构预测(Protein Structure Prediction)蛋白质结构预测是根据蛋白质的氨基酸序列推断其三维结构的过程。

蛋白质结构预测对于了解蛋白质的功能和相互作用机制至关重要。

通过生物信息学方法,可以预测蛋白质的二级结构、三级结构和蛋白质相互作用等信息。

常用的蛋白质结构预测方法包括模板比对、蛋白质分子动力学模拟和聚类分析等。

蛋白质结构预测与设计技术的研究与应用

蛋白质结构预测与设计技术的研究与应用

蛋白质结构预测与设计技术的研究与应用近年来,蛋白质结构预测与设计技术逐渐成为生物信息学领域研究的热门话题,因其对于了解蛋白质的功能、结构和相互作用机制等方面的意义重大,也对药物研发、基因工程、生物制造等领域的发展起到重要的推动作用。

下面将介绍蛋白质结构预测与设计技术的研究与应用。

一、蛋白质结构预测技术蛋白质结构预测是指根据蛋白质序列信息,预测蛋白质折叠成稳定的三维结构的技术。

不同于普通的分子动力学(MD)模拟等实验手段,蛋白质结构预测利用计算机软件进行模拟和计算。

基于能量最小化、机器学习、统计学等方法,目前已有多种蛋白质结构预测算法开发出来。

其中比较有代表性的包括:1. RosettaRosetta是著名科学家David Baker及其团队开发的一款蛋白质结构预测软件。

该软件基于排斥相互作用原理、骨架碎片拼接技术和Monte Carlo退火模拟等算法,通过对结构多样性的探索,逐步寻找最佳的结构能量最小值,实现高精度的蛋白质结构预测。

2. AlphaFoldAlphaFold是由DeepMind研究团队开发的蛋白质结构预测软件,其特点是采用了深度学习技术,并且在2018年拿下了CASP13的蛋白质结构预测大赛的冠军。

AlphaFold的结构预测精度和准确性都非常高,能够以较快的速度预测出二级结构、域结构、全局结构的信息。

3. I-TASSERI-TASSER是基于蛋白质序列拼装的一款结构预测软件,其优点是具有高速、高效、准确的优点。

I-TASSER通过采用自适应模板拼贴和先进的物理力场优化算法,实现了一系列的分子建模和模拟操作,并将获得的结构导出为pdb格式文件。

第二、蛋白质结构设计技术蛋白质结构设计是指通过人工干预蛋白质质量、构件和环境,控制蛋白质折叠成特定结构的过程,从而改变其性质或功能的技术。

与蛋白质结构预测相比,蛋白质结构设计技术更具有操作性和可控性。

蛋白质结构设计技术可以应用于药物设计、酶催化、材料科学等领域,可实现人工设计“特异性结构”以及“新功能酶”等目标。

基因编码蛋白质的二级结构预测

基因编码蛋白质的二级结构预测

基因编码蛋白质的二级结构预测在生命科学中,蛋白质是最基本的生物大分子之一,也是维持生命活动的基础。

蛋白质的功能和性质很大程度上取决于其三级结构,即由氨基酸组成的线性序列在生理条件下,经过特定过程形成的折叠构象。

然而,三级结构对绝大多数蛋白质的准确预测仍然具有很大挑战性。

相比之下,二级结构预测则更加简单并且通常可以得到很高的准确性。

什么是二级结构?在蛋白质的氨基酸序列中,相邻的多个氨基酸之间通常存在一些规律的相互作用,从而形成了规则的空间结构。

其中最基本的结构单元是alpha螺旋和beta折叠。

这两种结构都具有稳定的形态和重复的配置,能够对蛋白质的稳定性和生物功能起到至关重要的作用。

如何预测二级结构?预测蛋白质的二级结构是基于蛋白质中氨基酸的序列信息,通过建立序列与二级结构之间的对应关系,预测氨基酸序列中会出现的螺旋和折叠段数量和位置。

目前主要采用的方法是通过机器学习算法挖掘氨基酸序列与已知二级结构之间的关联。

传统方法传统方法主要包括一些机器学习算法,例如支持向量机(SVM)、神经网络(NN)、决策树(DT)等等。

这些算法的基本思想是采用特征向量表示氨基酸序列的各种属性,然后通过训练与测试样本的比对,预测蛋白质二级结构。

这些算法在很大程度上可以提高二级结构预测准确度,但是其依赖于人工构建的特征向量,预测准确度在一定程度上受限。

深度学习方法相比之下,深度学习方法在最近几年间得到了广泛的应用。

深度学习方法大大减少了特征向量的构建,从而可以获取更加本质的信息,从而提高了二级结构预测的准确度。

目前主要的深度学习方法包括卷积神经网络(CNN)、循环神经网络(RNN)和变换器(Transformer)等等。

这些算法可以对氨基酸序列进行端对端的处理,从而直接输出其二级结构预测结果。

与传统机器学习方法相比,深度学习方法在处理复杂问题方面更具优势,提高了二级结构预测的准确度。

结语总之,蛋白质的二级结构预测是一项非常具有挑战性的研究课题,对于理解蛋白质三维结构和功能具有重要意义。

生物信息学算法的使用教程

生物信息学算法的使用教程

生物信息学算法的使用教程生物信息学算法是指应用计算机科学和统计学的方法来解决生物学问题的一类算法。

其主要目标是通过收集、存储和分析生物学数据,从中提取有意义的信息。

生物信息学算法在基因组学、转录组学、蛋白质组学等领域发挥着重要作用,帮助科学家们更好地理解生命现象和人类疾病。

本文将介绍几种常用的生物信息学算法,包括序列比对、基因预测、蛋白质结构预测和系统生物学分析,帮助读者了解这些算法的原理和使用方法。

1. 序列比对算法序列比对算法是生物信息学中最常用的算法之一,用于比较两个或多个生物序列的相似性。

这些序列可以是DNA序列、RNA序列或蛋白质序列。

其中,最常见的算法是Smith-Waterman算法和Needleman-Wunsch算法。

Smith-Waterman算法是一种动态规划算法,通过寻找一个最优的局部序列比对。

该算法可以用于比对相似的序列片段,从而发现具有功能相似性的区域。

Needleman-Wunsch算法是一种全局序列比对算法,帮助比对整个序列。

该算法可以用于比对不同物种之间的序列,以及预测序列间的进化关系。

2. 基因预测算法基因预测算法是用于预测DNA序列中的基因位置和结构的算法。

这些算法主要基于类似于启动子、剪接位点、终止子等信号序列的模式识别。

常见的基因预测算法有基于统计模型的算法(如Glimmer和GeneMark)和基于机器学习的算法(如SVM和随机森林)。

这些算法能够从原始DNA序列中识别出编码基因的位置和边界,对基因功能的研究具有重要意义。

3. 蛋白质结构预测算法蛋白质结构预测算法是用于预测蛋白质的三维立体结构的算法。

蛋白质的结构决定了它的功能,因此预测蛋白质结构对于理解蛋白质功能至关重要。

常用的蛋白质结构预测算法有模板比对、序列相似性、碳氮化合物二次结构预测等。

模板比对算法通过比对蛋白质序列与已知的结构相似的模板蛋白质,来预测目标蛋白质的结构。

序列相似性算法将目标蛋白质序列与已知的蛋白质序列比较,从类似的序列中推断出目标蛋白质的结构。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实习五基因预测和蛋白质结构预测
一、实习目的
掌握对给定核酸/蛋白质序列的基因和结果的预测方法
二、实习内容
1、基因预测
基因预测,一般是指预测DNA 序列中编码蛋白质的部分,即外显子部分。

目前基因区域的预测已从单纯外显子预测发展到整个基因结构的预测。

这些预测综合各种外显子预测的算法和人们对基因结构信号(如TATA BOX等)的认识,预测出可能的完整基因。

⏹GENSCAN
GENSCAN是一个使用HMM模型的基因识别程序。

GENSCAN有几个明显的特点:它能在基因组DNA序列中找出一个完整的外显子—内含子结构,具有在给定的DNA序列中识别多个基因的能力,还可以同时处理正、反两条链。

⏹GENEMARK
/genemark/
GENEMARK是一个免费的基因识别软件,它由多个软件组成,分别适用于细菌和原核生物(GeneMark-P)、真核生物(GeneMark-E)以及病毒和噬菌体(GeneMark-S)等。

根据自己的序列所属的物种,选用合适的软件进行分析。

⏹其它基因预测相关网站
基因预测专业网站:
/software.html GRAIL-利用人工神经网络进行预测
/grailexp/geneid
http://genome.imim.es/software/geneid/GLIMMER 利用HMM模型进行基因识别
/software/glimmer/FGENESH
/berry.phtml?topic=index&group=programs&subgroup=gfind
2、蛋白质结构预测
SWISS-PROT曾是最重要的蛋白质数据库之一,现在它已经与trEMBL合并,组成一个新的蛋白质数据库UniProt。

在SWISS-PROT网站上有大量的蛋白质分析工具的链接,/tools/,在这个页面上包括Protein identification and characterization,DNA -> Protein,Similarity searches,Pattern and profile searches,secondary structure prediction,Tertiary structure, Sequence alignment等14类蛋白质分析工具。

蛋白质的二级结构预测就是预测蛋白质序列的哪些部位会形成α-helix,哪些形成β-sheets,哪里形成coil或turn。

也就是判断序列中的每个氨基酸处于H(α-helix),E(β-sheets),C(coil or turn)三态中的哪一态。

⏹GOR:利用GOR方法进行预测
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_gor4.html
⏹HNN:利用神经网络进行二级结构预测
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html
三、作业:
1.搜索一段基因组DNA序列,分别用GENSCAN和GENEMARK进行基因预测,解释预测结果,并分析两个软件结果是相同,如果不同,该如何判定哪个结果更可靠。

答:在NCBI数据库里查找到人类Human DNA sequence from clone RP11-14O9 on chromosome X,将其复制。

(一)GENSCAN基因预测
1. 将复制得到的序列输入到/GENSCAN界面的文本框中,设置次外显子正确概率阈值(Suboptimal exon cutoff),这里的cutoff指的是这个次优外显子预测正确的概率,一般选择0.1以上就可以,如果不需要预测次优外显子,选择1即可。

然后点击
,可得到预测结果如下图,下图1结果为不预测次优外显子,通过设置
Suboptimal exon cutoff为0.1,得到预测次优外显子的结果如图2。

图1 GENSCAN结果不预测次优外显子
图2 预测次优外显子
2. 结果解释
图1显示这段长度为158379 bp的序列中包含4个基因(图1上的为截取前2
个基因)。

4个基因中,有的由输入链编码,有的由输入链的互补链编码,第一个基因有4个外显子,位置分别是从14264—14929bp、20777—20891bp、38297—38382和40478—40561bp(由输入链编码)。

第二个基因有3个外显子,位置是在51067—51252bp、64560—64746bp和67844—67983bp(这里的位置是与输入链相对应的,由于该基因由互补链编码,所以起始位置大于终止位置)。

第一个基因的第一个和第二个外显子的预测正确的概率较高,分别为0.765和0.924,而第三个和最后一个外显子,正确的概率较低,只有0.436和0.288。

第二个基因的三个外显子预测正确的概率为都比较低,分别只有0.376、0.024和0.021 (二)GENEMARK
1. 将所选序列粘贴到此网址界面中的文本框中/genemark/,设置参数,如下图3
图3
图4
2. 结果分析
输出结果显示这条158379bp的序列中包含5个基因,如图4。

从图中看第一个基因有6个外显子,编码序列是从第10776个碱基开始的,外显子的位置分别是:1077—10949bp、10976—11061bp、14264—14929bp、20777—20891bp、33028—33050bp和35981—36049bp。

第二个基因中有4个外显子,从第51067个碱基到67983个碱基。

第三、四、五个基因外显子编码区域如上图4所示,不再赘述。

(三)、综合分析
可以看出用GENEMARK预测得到的结果与GENSCAN有差异,如上图图所示,用GENSCAN预测出4个基因,但是用GENEMARK基因只预测出5个基因,而且基因的起始位点不一样,GENSCAN给出了预测的准确概率,但是GENEMARK却没有给出。

GENEMARK预测出来了5个基因,都由输入链编码,没有单外显子,这个与GENSCAN
相同。

两者相比GENSCAN没有预测出第14264个碱基之前的两个外显子,GENEMARK
没有预测出第40000bp到50000bp之间的外显子,而GENSCAN遗漏了80000bp—100000bp 之间的外显子。

总体来说两种方法预测的基因外显子位置有差异。

人类的基因只有很小一部分时编码蛋白质的外显子,很大一部分是内含子,而且外显子所在区域较集中,构成阅读框,外显子的碱基数目都比较小。

到底哪个软件预测的结果正确,就需要根据多方面信息进行判断,可以再选择其它预测软件,与这两个软件的结果进行比较;也可以查文献,看看该基因的同源基因的结构;还可以将预测出来的基因或其产物(蛋白质)进行BLAST搜索,看是否存在同源序列。

2.搜索一条蛋白质序列,分别用GOR和HNN进行二级结构预测,解释预测结果,两个方法结果有何异同。

答:(一)、首先在NCBI数据库中搜索到人的SOD(superoxide dismutase,超氧化物歧化酶)的蛋白质序列,选择此蛋白质的FASTA格式输出。

(二)、二级结构预测
1. GOR:将SOD蛋白序列输入到以下网址的文本框中,点击即可得到结果,如图
5。

http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_gor4.html
图5
结果解释:SOD 蛋白二级结构中无规则卷曲(Random coil) 结构占到64.29%,35.71%是延伸带(extended strand)结构,不存在其他的结构。

2. HNN :利用神经网络进行二级结构预测
将SOD 的蛋白质序列输入到以下网站的文本框中,点击
,得到如图6的结果
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html
图6
结果解释:用HNN 法得到的分析结果可以看出,SOD 蛋白二级结构中有33.12%是延伸带(extended strand)结构、63.64%是无规则卷曲(Random coil)结构,而 a 螺旋(Alpha helix)结构占到3.25%。

HNN 和GOR 两种方法各有优缺点,要判断哪一种方法得到的结果更好怎需要用不同的方法和软件进行对比分析。

相关文档
最新文档