序列比对
序列比对名词解释

序列比对名词解释序列比对,又被称为序列比对分析,是一种分析生物序列相似性的算法,能够比较并对比不同物种之间的 DNA蛋白质序列,以及用于识别和研究共同特征等。
这是一种运用统计学原理的分析方法,能够发现和比较生物物种的进化关系,从而对比其基因组的序列和结构的相似性。
序列比对的原理是,两个序列通过字符匹配单元来评估两个序列的相似性。
两个序列都会被分解成许多小段,这些小段中的字符将会被比较。
这个过程被称为“匹配盒”,他们使得比较更加精确。
这个算法也使用一种叫做全局算法的系统,用于将两个序列中所有的字符串串连接起来,比较它们之间的相似性。
要使用序列比对,需要使用一种特定的算法,这个算法可以计算出两个序列的相似性。
这个算法可以使用非常复杂的方法,也可以使用经典的比较算法,比如Smith-Waterman算法、Needleman-Wunsch算法、BLAST算法等。
序列比对常常被用来进行基因组学分析,可以用来分析DNA序列、蛋白质序列,也可以用来分析特定基因的变异性。
序列比对可以帮助研究者发现某些基因的Protein的特定变体,这也可以帮助研究者更进一步地了解这些基因的功能。
序列比对还可以被用于进化分析,可以比较和分析某些物种的基因组,寻找它们在进化过程中的变化。
序列比对也可以用来研究生物物种之间的相似性,可以用来了解它们的系统进化关系。
序列比对也可以用于识别特定的DNA结构,如DNA序列中出现的特定序列,可以帮助研究者识别出重要的基因序列。
此外,序列比对还可以帮助研究者发现特定序列中引入的错误,这对研究者分析基因组序列特征非常关键。
综上所述,序列比对是一种非常重要的算法,可以应用于基因组学、进化学和生物物种比较研究等领域。
它可以帮助研究者比较不同物种的序列或比较一个物种序列的变异性,并根据得出的结果来了解它们的进化关系和进化机制。
也可以用来发现基因组中的特征和错误,这极大地丰富了基因组学的发展。
序列分析一一序列比对

序列分析一一序列比对序列比对是一种广泛应用于生物学领域的分析方法,用于比较两个或多个序列的相似性和差异。
在分子生物学研究中,序列比对可以用于DNA、RNA或蛋白质序列的比较,从而推断基因或蛋白质的功能、进化关系和结构等信息。
序列比对的目标是找到两个或多个序列之间的共同特征和差异。
首先,需要选择一个参考序列,也称为查询序列。
然后,将其他序列与查询序列进行比较,通过标记相同的碱基或氨基酸,来确定它们之间的相似性和差异。
序列比对的常用方法有全局比对和局部比对。
全局比对尝试将两个序列的每个位置进行比较,寻找最佳的序列匹配。
全局比对适用于两个相似序列的比较,但效率较低。
局部比对则通过在序列中寻找最佳的片段匹配,来发现相似区域。
局部比对适用于寻找序列中的特定区域的共同特征。
常用的序列比对算法包括:Smith-Waterman算法、Needleman-Wunsch算法和BLAST(基本本地比对工具)。
其中,Smith-Waterman算法和Needleman-Wunsch算法是精确的序列比对算法。
这两种算法采用动态规划的方法,在计算比对得分的同时记录了比对路径,从而找到最优的比对结果。
然而,由于时间和空间复杂度较高,这两种算法主要用于较短序列的比对。
BLAST算法则是一种启发式方法,通过快速比较序列的特征,自动生成候选相似序列,并进行相似性评分和排序。
在序列比对中,常用的相似性评分方法是比对得分和比对位点的数目。
比对得分是根据序列之间的匹配和错配得分计算而来的,匹配得分通常较高,而错配得分较低。
比对位点的数目表示在比对结果中匹配和错配的总数。
通过这些评分指标,可以量化序列之间的相似性和差异。
序列比对在生物学研究中起到了重要的作用。
例如,可以通过比对DNA或RNA序列来推断物种之间的亲缘关系和进化历史。
比对蛋白质序列可以预测蛋白质的结构和功能。
此外,序列比对还可以用于寻找序列中的共享特征,例如启动子、编码区和保守区等。
序列比对的基本方法

序列比对的基本方法序列比对是生物信息学中重要的一项任务,它用于比较和分析不同生物序列之间的相似性和差异性。
序列比对方法既可以应用于DNA序列之间的比较,也可以用于蛋白质序列之间的比较。
本文将介绍序列比对的基本方法,包括全局比对、局部比对和多序列比对。
一、全局比对全局比对是将整个序列进行比对,得到两个序列之间的最佳匹配。
最常用的全局比对方法是Needleman-Wunsch算法,该算法用动态规划的方式计算两个序列之间的最佳匹配。
其基本思想是在两个序列中插入一个空位,并为每个空位赋予一定的惩罚分数,然后通过计算每种插入方式的得分来确定最佳插入位置,从而得到最佳匹配。
二、局部比对局部比对是在两个序列中寻找最佳匹配的子序列。
最常用的局部比对算法是Smith-Waterman算法,该算法也是基于动态规划的方法。
不同于全局比对,局部比对将得分为负值的子序列直接设为0,从而忽略掉匹配较差的部分。
该算法在序列比对中应用广泛,可以用于发现序列中的保守区域以及识别重复序列。
三、多序列比对多序列比对是指将多个序列进行比对,从而得到它们之间的相似性和差异性。
多序列比对方法有多种,包括ClustalW、MAFFT和Muscle等。
这些方法常用于计算进化关系,识别保守区域和功能位点等。
其中,ClustalW是最常用的多序列比对软件之一,它使用的是基于目标函数的方法,在多个序列中寻找最佳的全局匹配。
MAFFT和Muscle则分别使用多种算法来处理不同类型的序列,从而提高比对的准确性和效率。
四、快速比对算法传统的序列比对方法在处理大规模序列数据时效率较低。
为了提高比对速度,研究者提出了一系列快速比对算法,如BLAST、 FASTA和Smith-Waterman-Gotoh算法等。
这些算法常用于初步比对和预测,可以在较短的时间内找到相似序列,从而提高工作效率。
其中,BLAST是最常用的快速比对算法之一,其基本思想是将查询序列与参考数据库中的序列进行比对,并根据匹配得分对结果进行排序,从而找到相似序列。
第三章 序列比对

英文名
Glycine Alanine
缩写 简称
Gly Ala G A
中文名
苏氨酸 半胱氨酸
英文名
Threonine Cystine
缩写 简称
Thr Cys T C
缬氨酸
亮氨酸 异亮氨酸 脯氨酸 苯丙氨酸 酪氨酸 色氨酸
Valine
Leucine Isoleucine Proline Phenylalanine Tyrosine Tryptophan
并系同源(paralogy)基因是指同一基因组(或同系物种的 基因组)中,由于始祖基因的加倍而横向(horizontal)产生 的几个同源基因
直系与并系的共性是同源,都源于各自的始祖基因。区别在 于:
在进化起源上,直系同源是强调在不同基因组中的垂直传递,并系 同源则是在同一基因组中的横向加倍;
PAM矩阵的制作步骤:
构建序列相似(99%)的比对 计算氨基酸 j 的相对突变率mj(j被其它氨基酸替换的 次数) 针对每个氨基酸对 i 和 j , 计算 j 被 i 替换次数 替换次数除以相对突变率(mj) 利用每个氨基酸出现的频度对j 进行标准化 取常用对数,得到PAM-1(i, j) 将PAM-1自乘N次,可以得到PAM-N
3 0 1 0 0 0 0 -1 -1 -1 0 -1 0 -2 0 -3 -3 -5 T
6 1 -1 -1 -1 -1 0 0 0 -1 -2 -2 -3 -1 -5 -5 -6 P 2 1 0 0 0 0 -1 -2 -1 -1 -1 -2 0 -4 -3 -6 A 5 0 1 0 -1 -2 -3 -2 -3 -3 -4 -1 -5 -7 -7 G 2 2 1 1 2 0 1 -2 -2 -3 -2 -2 -2 -4 N
基因组学研究中的序列比对

基因组学研究中的序列比对在基因组学研究中,序列比对是至关重要的技术之一。
它可以将已知基因组中的DNA序列与未知的DNA序列进行比较,从而揭示基因组之间的相似性和差异性,为基因功能研究和遗传变异分析提供基础信息。
1. 序列比对的基本原理序列比对的基本原理是将两个或多个DNA序列进行对齐,找出它们之间的相同和不同之处。
这个过程可以通过计算两个序列之间的编辑距离来完成,即计算出将一个序列转化为另一个序列所需的最小操作数,包括插入、删除和替换。
通过比较所有可能的序列对齐方案,可以找到最优的序列比对结果。
2. 序列比对的算法及应用目前,常用的序列比对算法主要包括Smith-Waterman和Needleman-Wunsch算法。
其中,Smith-Waterman算法是一种局部比对算法,适用于寻找两个序列之间的部分相似性。
而Needleman-Wunsch算法是一种全局比对算法,适用于寻找两个序列的整体相似性。
在基因组学研究中,这些算法经常被用于比较不同物种之间的基因组序列,鉴定功能作用未知的基因,以及寻找基因的保守区域和变异区域。
3. 序列比对的挑战和未来发展尽管序列比对技术在基因组学研究中起着至关重要的作用,但它面临着许多挑战和限制。
首先,随着大规模测序技术的不断发展,产生的序列数量不断增加,这给序列比对带来了巨大的计算压力。
其次,由于基因组间存在复杂的结构和变异,序列比对常常受到基序重复、插入缺失和剪接事件等多种因素的影响,导致结果不够准确和完整。
因此,未来需要通过不断改进比对算法和开发更高效的计算平台来应对这些挑战,并不断提高序列比对的准确性和可靠性。
4. 结语综上所述,序列比对技术是基因组学研究中的重要工具之一,它可以提供基因组序列的相似性和差异性信息,帮助我们深入了解物种之间的遗传关系和变异机制。
随着测序技术和计算平台的不断发展,序列比对技术也将不断完善,为基因组学和生命科学研究打下更加坚实的基础。
生物信息学第2版序列比对

四、RNA序列搜索
RNA序列比对/搜索算法可大致分成两类:
⑴ 查询序列(query)的结构未知,要找到数据库中 和其结构相近的同源序列。
第二节 比对算法概要
Section 2 Alignment Algorithms
一、替换计分矩阵
(一)通过点矩阵对序列比较进行计分
A.两条序列完全相同
B.两条序列有一个共同的子序列
C.两条序列反向匹配
D.两条序列存在不连续的两条子序列
(二)DNA序列比对的替换计分矩阵
➢ 等价矩阵(unitary matrix) ➢ 转换-颠换矩阵(transition-transversion mat质序列比对的替换计分矩阵
➢ 等价矩阵 ➢ 遗传密码矩阵(GCM) ➢ 疏水性矩阵(hydrophobic matrix ) ➢ PAM矩阵 ➢ BLOSUM矩阵
➢ PAM矩阵是从蛋白质序列的全局比对结果推导出来 的,而BLOSUM 矩阵则是从蛋白质序列块(短序 列)比对推导出来的。
BLAST算法图示
二、衍生BLAST
(一)PSI-BLAST
➢ 主要用于搜索与感兴趣的蛋白质关系较远的蛋白质。
(二)PHI-BLAST
➢ 用来帮助判断这个蛋白质属于哪个家族。
(三)BLASTZ
➢ BLASTZ是在比对人和鼠的基因组中发展起来的, 它适合于比对非常长的序列。
三、BLAT
➢ BLAT(The BLAST-Like Alignment Tool)与 BLAST搜索原理相似,但发展了一些专门针对全 基因组分析的技术。
序列比对

第二节序列比对1引言序列比对是生物信息学的基本组成和重要基础。
序列比对的基本思想是,基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。
序列比对包括双序列比对(pair alignment)和多序列比对(multiple alignment),主要有三个方面的应用。
1.序列功能预测:了解未知序列和已知序列的相同和不同点,可以推测未知序列的结构和功能。
2.分子进化分析:通过多序列比对,分析序列的相似性,判别序列之间的同源性,推测不同序列在结构、功能以及进化上的联系,进行分子进化上的研究。
3.搜索序列数据库,找到已发布的相似性和同源性序列。
值得注意的是,在分子生物学中,DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构的相似,也可能是功能的相似。
一级结构序列相似的分子在高级结构和功能上并不必然有相似性,反之,序列不相似的分子,可能折叠成相同的空间形状,并具有相同的功能。
一般的序列比对主要是针对一级结构序列上的比较。
序列和结构之间的比对方面也已经有不少研究,有兴趣的读者可以参考“文献“中的”序列和结构之间的比对“部分。
1部分内容取自Weir B.S.Genetic Data AnalysisⅡ—Methods for Discrete Population Genetic Data, Sunderland:Sinauer Associates Inc.Publishes,1996双序列比对双序列比对的算法主要分为两类:1.整体比对(global alignment)从全长序列出发,考虑序列的整体相似性,即。
Needleman-Wunsch算法是一种经典的基于动态规划的整体比对算法,其最佳比对中包括了全部的最短匹配序列。
2.局部比对(Local alignment)考虑序列部分区域的相似性,即有时两个序列总体并不很相似,但某些局部片断相似性很高。
生物信息学中的序列比对与序列分析研究

生物信息学中的序列比对与序列分析研究序列比对与序列分析是生物信息学领域中非常重要的研究内容之一。
在基因组学和蛋白质组学的快速发展下,对生物序列的比对和分析需求不断增长。
本文将介绍序列比对和序列分析的概念、方法和应用,并探讨其在生物学研究中的重要性。
一、序列比对的概念与方法:1. 序列比对的概念:序列比对是将两个或多个生物序列进行对比,确定它们之间的相似性和差异性的过程。
在生物信息学中,序列通常是DNA、RNA或蛋白质的一连串碱基或氨基酸。
序列比对可以用来寻找相似性,例如发现新的基因家族、识别保守的结构域或区分不同的物种。
2. 序列比对的方法:序列比对的方法可以分为两大类:全局比对和局部比对。
全局比对将整个序列进行比对,用于高度相似的序列。
而局部比对则将两个序列的某个片段进行比对,用于相对较低的相似性。
最常用的序列比对算法是Smith-Waterman算法和Needleman-Wunsch算法。
Smith-Waterman算法是一种动态规划算法,它在考虑不同区域的匹配得分时,考虑到了负分数,适用于寻找局部相似性。
而Needleman-Wunsch算法是一种全局比对算法,通过动态规划计算最佳匹配得分和最佳比对方式。
二、序列比对在生物学研究中的应用:1. 基因组比对:序列比对在基因组学中具有广泛的应用。
它可以帮助研究人员对特定基因进行鉴定,发现重要的调控元件以及揭示物种间的基因结构和功能差异。
此外,基因组比对还可以用于揭示突变引起的遗传疾病和肿瘤等疾病的发病机制。
2. 蛋白质结构预测:序列比对在蛋白质结构预测中也起着重要的作用。
通过将待预测蛋白质序列与已知结构的蛋白质序列进行比对,可以预测其二级和三级结构以及可能的功能区域。
这些预测结果对于理解蛋白质的功能和相互作用至关重要。
3. 分子进化分析:序列比对在分子进化研究中也扮演着重要的角色。
通过将源自不同物种的基因或蛋白质序列进行比对,可以构建进化树,研究物种的亲缘关系和演化历史。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)动态规划法进行多序列比对
计算三序列比对 (A)计算三个序列间的一个比对单元(i,j,k)依赖于其7个前导项; (B)计算u=ATGTTAT,v=ATCGTAC,w=ATGC三序列比对的三 维得分矩阵δ。
(二)渐进多序列比对
三个序列的配对比对未必能组合成一个多序列比对
对于接近或超过100个序列的多序列比对,渐进多序
BLAT 把相关的呈共线性的比对结果连接成为更大 的比对结果。
四、RNA序列搜索
RNA序列比对/搜索算法可大致分成两类:
⑴ 查询序列(query)的结构未知,要找到数据库中
和其结构相近的同源序列。
⑵ 利用查询序列的结构信息,在结构信息的使用上 又可以细分为: (a)通过构建一个描述RNA序列共性结构的概率模 型进行数据库检索; (b)基于索引(index)或者模体(motif)描述的 方法定义rna结构或共性结构,并进行数据库 搜索。
了改进 首先,它采用了参照序列(reference sequence), 使用BLASTZ将每一个序列与参照序列进行局部配 对比对,参照序列中的一个碱基比对另一个序列中 的至多一个碱基。
其次,依据计分矩阵和两序列的种系关系,对配对
比对的结果进行所谓的“串连”(chaining)和“连网” (netting)。
三、BLAT
BLAT(The BLAST-Like Alignment Tool)与 BLAST搜索原理相似,但发展了一些专门针对全 基因组分析的技术。 BLAT的优点在于速度快,其比对速度要比BLAST 快几百倍,其根本原因在于: BLAST是将查询序列
索引化,而BLAT则是将搜索数据库索引化,
二、相似与距离的定量描述
相似性可定量地定义为两个序列的函数,即它可有
多个值,值的大小取决于两个序列对应位置上相同 字符的个数,值越大则表示两个序列越相似。 编辑距离(edit distance)也可定量地定义为两个 序列的函数,其值取决于两个序列对应位置上差异 字符的个数,值越小则表示两个序列越相似。
生物信息学
第二章
序列比对
第一节 引
Section 1
言
Introduction
一 、同源、相似与距离
(一) 同源
两个序列享有一个共同的进化上的祖先,则这两 个序列是同源的。 对于两个序列,他们或者同源或者不同源,不能 说他们70%或80%同源。
同源可分为垂直同源(ortholog)和水平同源(paralog)
五、数据库搜索的统计显著性
一个典型的BLAST搜索的输出包括E值和得分,
后者又分原始得分(raw scores)和比特得分(bit scores)。
P=1-e-E
• P值和E值是反映比对显著性的两种不同方式,
大部分BLAST在线服务使用E值而非P值来定
义搜索的统计学显著性。
第四节 比对软件、参数与数据资源
Section 4 Alignment Software, Parameter and Resource
一、参数选择的一般原则
空格罚分涉及几个问题: ①空格罚分是否大于失配罚分; ②不同大小空缺的罚分; ③空格的引入与延伸是否予以不同罚分。
如果一次数据库搜索产生了太多的返回结果,可采取 如下措施:
对于一个比对,不论使用什么计分函数进行计分, 相似性被定义为总等值于最大的计分:
对于k个序列,如果用一个函数cost()对每一列
的所有替换操作进行计分,则多个序列之间的距
离等值于最小的计分:
对相似性的计分
编辑距离(edit distance):一般用海明距离表示。
三、算法实现的比对
列比对具有较高效率。最流行的渐进多序列比对软 件是Clustal家族。
ClustalW有以下特点:
首先,在比对中对每个序列赋予一个特殊的权值以
降低高度近似序列的影响和提高相距遥远的序列的 影响(如下图)。
ClustalW中对序列赋权的方法
其次,根据序列间进化距离的离异度(divergence) 在比对的不同阶段使用不同的氨基酸替换矩阵; 第三,采用了与特定氨基酸相关的空缺(gap)罚分 函数,对亲水性氨基酸区域中的空缺予以较低的罚分; 第四,对在早期配对比对中产生空缺的位置进行较少 的罚分,对引入空缺和扩展空缺进行不同的罚分。
两个序列的局部、全局和glocal比对所对应的路径
二、全基因组比对
全基因组比对主要揭示多个序列中保守的和非保守
的区段以及这些区段在基因组中的分布特征,这里 主要介绍UCSC基因组浏览器(The UCSC Genome Browser)中的全基因组比对方法。
UCSC基因组浏览器中所采用的多序列比对在多方面作
接着,UCSC基因组浏览器使用MULTIZ对多个“串
连”的配对比对进行渐进多序列比对。
小 结
序列比对是基因和DNA序列分析的基础,所依据的两
个核心概念是同源和相似,同源序列一般是相似的,
相似序列不一定是同源的。多序列比对是双序列比对 的自然推广,采用更多物种的序列进行多序列比对常
常能更准确和更可靠地揭示序列的同源性和保守域。
二、主要比对软件
三、EBI中的序列比对工具
双序列比对 特性 Global alignment Global alignment Local alignment Local alignment Local alignment Genomic alignment Genomic alignment 工具 Needle Stretcher Water Lalign Matcher PromoterWise GeneWise 多序列比对 工具 Clustal Omega ClustalW2 DbClustal Kalign MAFFT
用计算机科学的术语来说,比对两个序列就是找出 两个序列的最长公共子序列(longest common subsequence,LCS),它反映了两个序列的最高 相似度。
动态规划法示意 (A)使用动态规划法寻找两个序列的最长公共部分;
(B)动态规划表的填写。
四、序列比对的作用
获得共性序列
序列测序 突变分析 种系分析 保守区段分析 基因和蛋白质功能分析
blastp 蛋白质 蛋白质
方法
用蛋白质查询序列搜索蛋白质序列数据库
blastn
blastx
核酸
核酸
核酸
蛋白质 核酸 核酸
用核酸查询序列搜索核酸序列数据库
将核酸序列按6条链翻译成蛋白质序列后搜 索蛋白质序列数据库 用蛋白质查询序列搜索核酸序列数据库, 核酸序列按6条链翻译成蛋白质 将核酸序列按6条链翻译成蛋白质序列后搜 索由核酸序列数据库按6条链翻译成的蛋白 质序列的数据库
PAM/BLOSUM矩阵编号与序列亲缘关系的比较
二、双序列全局比对
动态规划算法的思想 ⑴ a, b是使用某一字符集∑的序列(DNA 或蛋白质
序列);
⑵ m = a的长度; ⑶ n = b的长度; ⑷ S(i,j) 是按照某替换计分矩阵得到的前缀a[1...i] 与b[1...j]最大相似性得分;
⑸ w(c,d)是字符c和d按照替换计分矩阵计算的得分。 可按照规则建立得分矩阵:
垂直同源与水平同源
(二)相似性与距离
相似性、距离:是两个定量描述多个序列相似度
的度量。
相似性:被比对序列之间的相似程度。 距离:被比对序列间的差异程度。 相似性既可用于全局比对也可用于局部比对,而 距离一般仅用于全局比对,因为它反映了把一个 序列转换成另一个序列所需字符替换的耗费。
第二节
比对算法概要
Section 2 Alignment Algorithms
一、替换计分矩阵
(一)通过点矩阵对序列比较进行计分
A.两条序列完全相同
B.两条序列有一个共同的子序列
C.两条序列反向匹配
D.两条序列存在不连续的两条子序列
(二)DNA序列比对的替换计分矩阵
等价矩阵(unitary matrix) 转换-颠换矩阵(transition-transversion matrix) BLAST矩阵
⑴ 使用参考序列(带“refseq”的)数据库,这样可减
少许多冗余结果; ⑵ 使查询序列只包含一个结构域,减少多结构域带 来的多匹配; ⑶ 根据查询序列与数据库序列的关系使用更合适的 替换计分矩阵; ⑷ 降低E值。
如果一次数据库搜索产生了太少的返回结果,可
采取如下措施:
⑴ 提高E值; ⑵ 使用更大的PAM矩阵或更小的BLOSUM矩阵; ⑶ 减小字长以及减小阈值。
其他多序列全局比对方法 迭代法
基于一致性的方法
遗传算法
五、多序列局部比对
全局比对,其共同特征是序列中所有对应字符均假
定可以匹配,所有字符具有同Байду номын сангаас的重要性,空格的
插入是为了使整个序列得到比对,包括使两端对齐。 局部比对不假定整个序列可以匹配,重在考虑序列 中能够高度匹配的一个区段,可赋予该区段更大的 计分权值,空格的插入是为了使高度匹配的区段得 到更好的比对。
对2个序列进行全局和局部比对可得到完全不同的结果
基于隐马尔可夫模型的多序列比对方法
隐马尔可夫模型和3个蛋白质序列PHSFTYVMT、
PGSFTYW、RFTGFW的最小公共超图
六、比对的统计显著性
确定比对得分score是否偶然:
1.将β球蛋白或肌球蛋白与大量非同源的蛋白质做比
对,然后将score与这些比对的得分进行比较。 2.把一个序列与一组随机产生的序列进行比对,然后 同样将score与这些比对的得分进行比较。 3.随机将两个序列中的一个打乱重组,比如说重组 100次,并与另一个序列比对,同样得到一组比对 的得分。