含假结的RNA二级结构预测算法研究

合集下载

RNAfold预测RNA的二级结构

RNAfold预测RNA的二级结构

RNAfold预测RNA的⼆级结构
在mirdeep软件的分析结果中,会提供miRNA前体的⼆级结构,这个结果实际上是通过调⽤RNAfold来实现的,该软件是⼀个经典的预测RNA⼆级结构的软件,⽹址如下
官⽹提供了在线服务,只需要上传fasta格式的序列即可,⽰意如下
默认参数会输出以下两种⼆级结构
1. optimal secondary structure
最佳⼆级结构,保证对应的⾃由能最⼩,最⼩⾃由能简称MFE, 结果⽰意如下
2. centroid secondary structure
⾃由能表征改变这个结构需要注⼊的能量⼤⼩,对应的数值越⼩,该结构越稳定。

同时给出了可视化结果,⽰意如下
这个程序也是可以下载到本地运⾏的,基本⽤法如下
RNAfold < hsa.hairpin.fa -noPS > precursors.str
-noPS参数代表不产⽣⼆级结构对应的postscript⽂件,这种⽂件可以转换为PDF格式,产⽣的str⽂件内容如下
>hsa-let-7a-1 UGGGAUGAGGUAGUAGGUUGUAUAGUUUUAGGGUCACACCCACCACUGGGAGAUAACUAUACAAUCUACUGUCUUUCCUA (((((.(((..((((((((((((((((...(((.....))).((....))....))))))))))))))))..)))))))) (-35.60)
采⽤dot-bracket表⽰法标记⼆级结构,上述⽤法只给出了最佳的⼆级结构预测结果和对应的⾃由能。

·e n d·。

RNA二级结构的预测和分析技术

RNA二级结构的预测和分析技术

RNA二级结构的预测和分析技术RNA二级结构是RNA分子中一个基本的结构特征,它指的是RNA分子中不同部分之间的互补配对关系。

通过对RNA二级结构的预测和分析,科学家们可以更深入地理解RNA分子的结构和功能,从而为开展RNA研究工作提供有力支持。

下面,我们将对RNA二级结构的预测和分析技术进行一些简要的介绍。

RNA二级结构的预测技术主要分为两类,即序列比对和计算机模拟。

序列比对是通过将已知的RNA序列与待研究的RNA序列进行比较,以找到相应的二级结构信息。

这种方法的主要优点是简单易操作、可靠性高;但是其缺点也是明显的,即需要事先已知一些具有高度保守性的RNA序列作为比对的标准,同时也需要在寻找相应二级结构时进行一定程度的人工干预。

计算机模拟则是通过构建数学模型,结合求解相应的数学问题来预测RNA二级结构信息。

这种方法的主要优点是可以处理大规模的RNA序列数据,同时也可以获得比序列比对更详细和精确的结构信息;但其缺点也非常明显,即需要占用大量的计算资源和时间,同时也存在不同模型对不同RNA序列预测结果的一定偏差性。

在此基础上,科学家们还开发了许多RNA二级结构的分析工具。

其中最常用的是Mfold和RNAstructure这两个软件,它们均可通过计算机模拟的方法为用户提供高质量并且高速的RNA二级结构预测服务。

Mfold是一款基于稳定性理论的RNA二级结构预测软件,其算法使用了一系列能量函数、动态规划算法以及归纳、集成场等技术。

RNAstructure则是一种基于动态规划算法原理的RNA二级结构预测软件,其算法使用特定的统计模型以及相关参数,对已知的RNA序列反复模拟,寻找最稳定的RNA二级结构。

此外,科学家们还开展了许多与RNA二级结构相关的研究。

例如,将RNA二级结构和RNA表达水平、RNA翻译、RNA修饰等结合研究,以探索RNA二级结构与RNA的生物学功能之间的相关性;又如将RNA二级结构与RNA技术、RNA药物设计等结合应用,以探索RNA二级结构在这些领域中的实际应用价值。

RNA二级结构预测及其在RNA功能研究中的应用

RNA二级结构预测及其在RNA功能研究中的应用

RNA二级结构预测及其在RNA功能研究中的应用RNA作为生命分子之一,其在生物过程中发挥着重要的作用。

与DNA不同,RNA分子通过其二级结构来实现其不同的生物学功能。

因此,预测RNA二级结构是RNA功能研究的一个重要环节。

本文将介绍RNA二级结构预测的方法以及其在RNA功能研究中的应用。

一、RNA二级结构预测的方法RNA二级结构是指RNA中相邻的核苷酸间形成的氢键及其他非共价作用力导致的三维结构。

RNA二级结构预测的方法主要包括基于序列和结构比对的方法、基于模型的方法、基于能量函数的方法以及基于机器学习的方法等。

基于序列和结构比对的方法是目前RNA二级结构预测的主要方法之一。

该方法主要依赖于已知的RNA结构数据库,通过比对RNA序列和已知RNA结构的相似性来预测RNA二级结构。

基于模型的方法则是基于近年来RNA三维结构的不断解析,开展的一种相对较新的预测RNA二级结构的方法。

该方法通过建立RNA的三维结构模型来预测RNA二级结构。

基于能量函数的方法则主要依赖于RNA的自由能状态,通过对RNA分子在空间中可能出现的各种构象进行能量计算,最终得出RNA二级结构的最优构象。

基于机器学习的方法则是纯理论算法,主要通过对大量RNA序列和结构数据进行学习并分析,从而找出RNA序列与二级结构之间的相关规律来进行RNA二级结构的预测。

二、RNA二级结构预测在RNA功能研究中的应用RNA分子作为细胞内的一个重要调节分子,在内质网受体与细胞死亡等方面发挥着重要的作用。

而不同的RNA分子通过其不同的二级结构,实现其不同的生物学功能。

因此,RNA二级结构预测在RNA生物学研究中扮演着至关重要的角色。

其中,RNA的识别与作为药物靶点进行研究是RNA生物学研究的重点之一。

在RNA药物开发中,二级结构预测可以为RNA结构的分析提供新的思路,同时能够提供封闭和开放的结构信息。

因此,预测RNA二级结构已被广泛应用于RNA 结构基础研究和RNA药物研究中。

RNA二级结构预测算法的研究

RNA二级结构预测算法的研究

RNA二级结构预测算法的研究RNA是一种重要的生物分子,它在细胞内具有广泛的功能,包括基因表达调控、蛋白质合成、信号传导等。

RNA的二级结构是指RNA分子中核苷酸之间的相互配对关系,是RNA分子功能的决定因素之一、研究RNA二级结构预测算法对于理解RNA功能和生物过程具有重要意义。

RNA二级结构预测算法是通过分析RNA序列的信息,预测RNA分子中核苷酸的配对关系。

二级结构预测算法通常使用序列比对方法并结合一些规则和模型进行。

在过去的几十年中,科学家们通过不断研究,已经提出了多种不同的RNA二级结构预测算法。

下面将介绍几种常见的RNA二级结构预测算法。

1.比较序列分析方法:该方法通过比较相同或相似RNA序列来预测二级结构。

这种方法基于假设,认为在进化过程中,结构相似的RNA会存在相似的序列模式。

比较序列分析方法常用的工具包括BLAST和ClustalW 等。

2.能量最小化方法:该方法通过寻找使得RNA分子的NastrandTotalE能量最小的核苷酸配对方式,来预测RNA二级结构。

能量最小化方法中最常用的模型是动态规划(Dynamic Programming)算法,如Nussinov算法、Zuker算法和McCaskill算法等。

这些算法通过建立RNA分子中核苷酸之间的互补关系和能量函数,将问题转化为求解能量最小化的最优配对路径的问题。

3.统计学习方法:该方法基于大量已知RNA二级结构的训练数据,通过机器学习算法来预测RNA二级结构。

统计学习方法常用的算法包括支持向量机(Support Vector Machine)、随机森林(Random Forest)和神经网络算法等。

4.结构比对方法:该方法基于RNA二级结构的结构保守性,通过比较已知RNA二级结构和待预测RNA序列的结构来预测二级结构。

结构比对方法可以比较准确地预测RNA二级结构,但对于相似结构的预测效果较差。

综上所述,RNA二级结构预测算法是一个复杂而多样的研究领域。

RNA二级结构预测的计算语言学方法

RNA二级结构预测的计算语言学方法

第29卷第6期2008年12月衡阳师范学院学报Jo ur nal of Hengya ng Normal Univer sity No.6Vol.29Dec .2008RNA 二级结构预测的计算语言学方法唐四薪,向 卓,刘艳波(衡阳师范学院计算机科学系,湖南衡阳 421008)摘 要:RNA 是一类重要的生物大分子,计算语言学方法把RNA 序列看成是具有一定语法规则的语句,通过这些语法规划来分析RNA 序列中存在的碱基配对关系,也就是它的语义,从而得到该序列的二级结构,本文阐述了该类方法预测RNA 二级结构的原理及实现。

关键词:RNA ;二级结构;结构预测;计算语言学中图分类号:TP30112文献标识码:A文章编号:1673—0313(2008)06—0090—031 引 言RNA (核糖核酸)是一类重要的生物大分子,它在基因表达的各个阶段发挥着重要功能并扮演着不同角色,随着RNA 基因沉默,RNA 干扰现象的发现,人们逐渐认识到RNA 在遗传中的作用比DNA (脱氧核糖核酸)更重要[1],是基因表达的“幕后主使”,因此最近几届诺贝尔奖频繁地颁给了RNA 领域的研究者。

由于RNA 具有复杂的空间结构,RNA 的功能主要由其结构决定,而不是其碱基序列,所以对RNA 结构的研究成为计算分子生物学的一个重要课题。

RNA 二级结构是RNA 结构在平面上的表示,为RNA 结构的预测提供了独特的计算模型,采用计算语言学的方法研究RNA 二级结构将RNA 序列看成是一种语言,那么二级结构就对应这种语言的句法结构[2]。

通常采用计算语言学中的统计句法分析模型———随机文法模型通过归纳学习得到RNA 序列的二级结构。

通过计算方法预测RNA 的二级结构,将使人们改变只能用生物化学实验方法预测RNA 结构的局限,这将极大的方便人们对RNA 的认识,促进生物学由实验科学向理论科学转变,由RNA 结构研究引发的对RNA 新功能的发现和设计具有新功能的RNA ,将广泛应用于新型药物设计,人类器官移植中排斥问题的解决等。

生物信息学中的RNA二级结构预测算法研究

生物信息学中的RNA二级结构预测算法研究

生物信息学中的RNA二级结构预测算法研究随着基因组学的迅猛发展,生物信息学作为一门跨学科的新兴学科逐渐崛起。

其中RNA二级结构预测算法在生物医学研究中扮演着重要角色。

一、RNA二级结构的意义和作用RNA是一种能直接参与生物体内化学反应或调控基因表达的分子,通过其二级结构实现相应的生物学功能。

RNA二级结构是指RNA分子中,由核苷酸组成的二级结构,通俗地说就是RNA分子的“折纸图”,一种三维空间上的折叠形式。

RNA二级结构决定着RNA的性质和功能,相同的RNA二级结构就有着相似的功能。

目前的生物信息学发展使得人们谋求了更加高效快捷的RNA二级结构预测技术。

RNA二级结构预测技术是一种计算机模型方法,旨在根据RNA序列,快速准确地预测RNA分子的二级结构。

RNA二级结构预测技术在人工辅助RNA二级结构实验研究中起到了至关重要的作用。

例如,在16S rRNA序列的RNA二级结构预测中,它扮演着起着引导性作用,这是研究细菌系统发育的关键实验之一。

二、RNA二级结构预测中常见算法模型分析目前,RNA二级结构预测算法大多基于二维、四方、裸梯度、模板等方法进行预测。

其中,基于二维法的算法中,最常见的有基于结构沿线法和基于动态规划法,以及两者结合的二维松弛法。

基于结构沿线法的RNA二级结构预测算法主要是实现RNA分子序列二级结构中带有稳定的结构沿线组成,即细节高端型RNA二级结构,然后将RNA等离子体无计算,转为复合2D琼脂糖膜上的生化宝石图。

“生化宝石图”采用球面结构体来实现,以及针对一些精细实验,可根据需要进行测试。

除此之外,基于动态规划法的RNA二级结构预测算法中,经常被人采用,并引起了大量的研究。

其基本思路是建立一种RNA序列匹配的概率模型,并根据求最大值的原理来进行RNA二级结构预测。

动态规划法结合了几乎所有的物理模型,使其得到了充分的验证和检验。

此外,在RNA二级结构预测算法中还包括一些新兴的方法,例如基于核型的RNA二级结构预测算法、基于稳定性的RNA二级结构预测算法等。

基于布谷鸟搜索的带假结RNA二级结构预测

基于布谷鸟搜索的带假结RNA二级结构预测

基于布谷鸟搜索的带假结RNA二级结构预测作者:苑寅来源:《中国新技术新产品》2013年第01期摘要:RNA在细胞中具有重要的结构、功能和调节作用。

RNA单链的结构对于其在有机系统中的作用具有决定性影响,因此RNA结构预测成为研究热点。

假结是一种重要但是难以预测的RNA结构。

以热动力学模型与最小自由能量理论为基础,本文提出了一种称为CSRNA的基于布谷鸟搜索的启发式算法,用以预测带假结RNA二级结构。

通过基于已知RNA序列的预测实验,本文比较了CSRNA与几种算法的预测结果,证明CSRNA算法的有用性及有效性。

关键词:RNA二级结构预测; 假结; 最小自由能; 布谷鸟搜索中图分类号: R857.3 文献标识码:A1概述假结结构是一类二级结构子结构,在两个或多个茎区出现交叉嵌套时形成,存在于多种RNA分子二级结构中。

其中茎区是一种二级结构子结构,通过连续的三对或三对以上碱基配对形成。

研究发现,假结结构对于RNA结构的作用具有重要的意义。

RNA分子结构对于其作用有重要影响,其测定可通过X光测定、核磁共振成像等物理方法进行。

但物理方法存在耗时长、财力物力开销大等缺点,限制了其使用。

目前的研究主要通过软件计算方式预测RNA二级结构。

早期的RNA结构预测算法主要是动态规划类型算法。

这些算法具有不适用于较长的RNA序列、算法复杂预测计算耗时长等缺点。

近期研究热点转向基于启发式算法的预测研究。

2 研究现状目前主要预测算法采用最小自由能量模型作为建模基础。

此模型认为在所有可能结构中自由能量最低的预测结构最有可能是给定序列的实际结构。

通过实验及统计估算,可以指定出一系列自由能量计算规则,以计算出任何给定结构的自由能量。

目前的主要算法分为动态规划和启发式两种。

动态规划算法能够在理论上保证搜索到具有全局最小自由能量的结构,但时间复杂度高。

启发式算法收敛速度明显比动态规划算法快,但不能保证得到具有全局最小自由能的结构是其主要缺点。

含假结RNA二级结构类的图语法

含假结RNA二级结构类的图语法
o a sr c u e ro nd r y t t r f m a e t c e ca s o s c n r sr cur sThe ut r r po e a i d f u r sr t d ls f e o da i y t t e . a ho p o s s k n o RNA s c nd r sr cur g a h u e o ay t t e r p u
出它们 的 图语 法 。 得 目标 集 的 结 构 特 征 一 目了然 , 使 目标 集 间 的真 包含 关 系也 通 过 图语 法 直 观 地 体 现 出来 。 关键 词 : 结 ; N 二 级 结 构 ; 写规 则 ; 假 RA 重 图语 法 文章 编 号 :02 8 3 ( 0 80 — 0 3 0 文 献 标 识 码 : 中 图 分 类 号 :P 0 .; 7 ; 5 、 10 — 3 12 0 )2 0 2 — 3 A T 3 1 Q 10176 2

gtcass ce ra d e l s e l a n ma e h p o e n l sv ea in b t e h l se e f u d l hl . k s t e r p r i cu i e r lt ewe n t e ca s s b o n i t o g y
g e ae fo en r td r m t e o tnu u rwrtng f h s r l s n niil t ctr g a s r l n ua e o t e r ph r a h c ni o s e i i o t e e u e o i ta sr u e r ph a e a g g s f h g a g mma . e u h r u rTh a t o p o o e 5 r ph r mma s o e e e t r p s s g a g a r t r prs n 5 tr e case o y i a p e ci n lo t a g t l s s f t p c l r dito ag r hms,t i i ma e t e t c u e e t e f t e a - k s h sr t r f aur o h tr u
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

含假结的RNA二级结构预测算法研究
核糖核苷酸(ribonucleic acid,RNA)作为一类生物大分子,在各种细胞生命过程中扮演着重要的角色,包括遗传信息的表达、传递、基因调控与催化等。

与DNA不同,RNA的结构更加复杂多样,这也是RNA具有丰富功能特性的物质基础。

首先由于物理实验方法检测RNA空间结构成本较高,其次,仅依靠物理实验无法满足海量的待测序列数据。

因此RNA二级结构的算法模拟预测成为一个重要且具有挑战性的课题。

并且,在RNA二级结构中有一类由茎区交叉嵌套产生的子结构叫做假结,由于假结被证实在很多RNA催化过程中起到关键的作用,因此近期在RNA结构预测领域越来越受到重视。

本文将遗传算法应用到RNA二级结构预测当中,并且包含了两类假结结构,并通过实验测试,验证算法的可用性与有效性。

其次针对RNA结构预测的效率问题,提出基于OpenCL的异构并行加速,对串行算法进行改进和优化,分析串行预测算法中可并行的部分,对计算任务进行重新划分,通过CPU+GPU模式进行异构加速,最终通过实验测试对比串行算法与并行算法效率的高低。

论文主要工作如下:(1)实现一种改进的遗传算法,相对于传统的遗传算法,改进了遗传操作,使得预测算法更加接近RNA分子二级结构的折叠过程。

算法基于最小自由能思想,结合Mathews&Turner和Dirks&Pierce两种能量参数,预测包含H型假结在内的两种假结结构。

最终从RNA STRAND数据库中选取的测试集测试获得0.81的阳性预测率、0.79的敏感性。

说明算法有效可用,可以作为RNA二级结构分析的参考之一。

(2)针对基于遗传算法带假结的RNA二级结构预测低效的问题,提出基于Open CL的异构并行加
速算法,首先进行上述串行算法的并行性分析,得到在螺旋区点阵填充及种群迭代进化两个最耗时的阶段可以进行异构加速,然后改进算法过程,在GPU设备上基于Open CL编程框架对上述两个过程进行改进和提升。

最终以相同的测试集进行测试,相对于串行算法,改进后的异构并行加速算法平均可获得2.8x倍的加速。

有效降低了RNA二级结构预测的耗时,提升了算法模拟预测的效率。

相关文档
最新文档