蛋白质结构预测在线软件
蛋白质结构预测

序列基序识别 二硫键识别 折叠子识别 残基接触预测 结构域预测
结构表面识别
预测蛋白质表面结构功能关键区域
5
PredictProtein Secondary Structure
PredictProtein Secondary Structure
H:螺旋 E:折叠 L:环 e:暴露表面﹥16%残基 b:其它残基
3
PredictProtein提交界面
序列提交窗口
分析方法程序详解
PROFsec(默认) PROFacc(默认) 序列预测
基于轮廓(profile)的神经网络算法预测蛋 白质二级结构 基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
PHDhtm(默认)
ASP(默认) COILS(默认) PROFtmb ProSite(默认) SEG(默认) PredictNLS(默认) DISULFIND(默认) AGAPE PROFcon ProDom(默认) CHOP ConSeq
22
SWISS-MODEL
• SWISS-MODEL是一个蛋白质3D结构数据库,库中收录的蛋白质结
构都是使用SWISS-MODEL同源建模方法得来的。
– /
• 基于同源建模法与PDB数据库已知结构的蛋白质序列比对 进行预测
23
SWISS-MODEL
蛋白质三维结构预测
方法 特点 工具
同源建模法 基于序列同源比对,对于序列相似度>30% SWISS-MODEL, CPHmodels ( Homology/Comparativ 的序列模拟比较有效,最常用的方法 e modelling ) 线串法/折叠识别法 (Threading/Fold recognition) 从头预测法 ( Ab initio/De novo methods ) “串”入已知的各种蛋白质折叠骨架内,适 于对蛋白质核心结构进行预测,计算量大 基于分子动力学,寻找能量最低的构象, 计算量大,只能做小分子预测
SWISS-MODEL 蛋白质结构预测教程

SWISS-MODEL 蛋白质结构预测SWISS-MODEL是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。
该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。
同源建模法预测蛋白质三级结构一般由四步完成:1.从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板;2.待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;3.建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;4.利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。
最后提供给用户的是经过如上四步(或重复其中某几步)后得到的蛋白质三级结构。
SWISS-MODEL工作模式SWISS-MODEL服务器是以用户输入信息的最小化为目的设计的,即在最简单的情况下,用户仅提供一条目标蛋白的氨基酸序列。
由于比较建模程序可以具有不同的复杂性,用户输入一些额外信息对建模程序的运行有时是有必要的,比如,选择不同的模板或者调整目标模板序列比对。
该服务主要有以下三种方式:∙First Approach mode(简捷模式):这种模式提供一个简捷的用户介面:用户只需要输入一条氨基酸序列,服务器就会自动选择合适的模板。
或者,用户也可以自己指定模板(最多5条),这些模板可以来自ExPDB模板数据库(也可以是用户选择的含坐标参数的模板文件)。
如果一条模板与提交的目标序列相似度大于25%,建模程序就会自动开始运行。
但是,模板的可靠性会随着模板与目标序列之间的相似度的降低而降低,如果相似度不到50%往往就需要用手工来调整序列比对。
这种模式只能进行大于25个残基的单链蛋白三维结构预测。
∙Alignment Interface(比对界面):这种模式要求用户提供两条已经比对好的序列,并指定哪一条是目标序列,哪一条是模板序列(模板序列应该对应于ExPDB模板数据库中一条已经知道其空间结构的蛋白序列)。
pep-fold3用法

pep-fold3用法
PEP-Fold3是一款在线蛋白质二级结构预测服务器,它可以根据给定的氨基酸序列预测蛋白质的二级结构。
以下是使用PEP-Fold3进行蛋白质二级结构预测的一般步骤:
1.打开浏览器,访问PEP-Fold3的官方网站。
2.在网站首页上,找到并点击“Start”按钮,开始一个新的预测任务。
3.在打开的页面中,输入待预测的蛋白质氨基酸序列。
可以手动输入序列,也可以上传FASTA格式的序列文件。
4.选择预测参数。
在PEP-Fold3中,可以选择不同的预测参数和算法进行蛋白质二级结构预测。
选择适当的参数可以提高预测的准确性和可靠性。
5.提交预测任务。
完成输入和参数选择后,点击“Submit”按钮提交预测任务。
6.等待预测结果。
PEP-Fold3会自动进行蛋白质二级结构预测,并在完成后将结果发送到用户的邮箱中。
7.分析预测结果。
用户可以下载预测结果文件,并使用文本编辑器或生物信息学软件分析预测结果。
需要注意的是,PEP-Fold3是一种基于机器学习的蛋白质二级结构预测方法,其预测结果的准确性受到多种因素的影响,如序列长度、序列相似性、序列复杂度等。
因此,在进
行蛋白质二级结构预测时,需要综合考虑多种因素,并采用多种方法进行预测和验证。
蛋白质结构预测

6.picornaviral蛋白上的酶切位点(NetPicoRNA) 7.叶绿体传递蛋白(ChoroP) 8.跨膜螺旋(TMHMM) 9.跨膜螺旋的位臵(TOPPRED) 10.跨膜螺旋的位臵和方向(DAS) 数据库搜索: 1.基于预测的线程方法与完全基于序列的数据库搜 索(FRSVR) 2.查找远源同源蛋白序列的Markov model method (SAMT98)
评估: 1.二级结构预测准确性评估(EvalSec) 2. EVA:预测方法自动评估
PP工作原理
• PredictProtein是一项在因特网上提供氨 基酸序列分析,蛋白质结构和功能预测的服 务。通过电邮或因特网,您可以提交单一 蛋白序列或序列比对,PP将返回结果.
1.PP总流程
2. 序 列 分 析 流 程
• SWISS-MODEL反馈的第1封邮件 (Welcome to SwissModel) • SWISS-MODEL反馈的第2封邮件 (SwissModel-Fold-Recognition) • SWISS-MODEL反馈的第3封邮件 (SwissModelSecondaryStructureP...) • SWISS-MODEL反馈的第4封邮件 (SwissModel_TraceLog_AAAa06Zd K) • SWISS-MODEL反馈的第5封邮件 (SwissModel-Model-AAAa06ZdK) 中附有可用大分子结构展示软件 显示的文件AAAa06ZdK.pdb: • SWISS-MODEL反馈的第6封邮件 (SwissModel WhatCheck AAAa06ZdK...) • SWISS-MODEL反馈的第7封邮件 (PredictProtein results)
• META-PP提供单页界面,发送预测查询,到其他蛋白结 构预测服务器。在此界面提交待分析序列,选择所需要 的服务,您将以电子邮件的形式收到答复。在META-PP 提供的序列分析服务包括预测内容: 1.二级结构(JPRED) 2.模拟三维结构(automated modelling,SWISS-MODEL) 3.通过一系列方法和数据库推导三级结构(CPHmodels) 4.信号肽的剪切位点(SignalP) 5.哺乳动物体内黏蛋白的O-GalNAc(突变型)糖基化作用 位臵(NetOglyc)
蛋白二级结构(卷曲螺旋)预测软件---------COILS的使用

预测结果图: 显示沿着序 列各个部分 形成卷曲螺 旋的倾向性
二、BCL-2基因在10个物种 Homo sapiens, Xenopus laevis, Gallus gallus ,Mus musculus, Bos taurus ,Rattus norvegicus ,Capra hircus ,Pan troglodytes ,Canis lupus familiaris ,Felis catus 中ClustalW序列比对分析、MEGA 系统进化分析 、MEME进行保守位 点分析。
BCL-2基因(即B细胞淋巴瘤/白血病-2 基因)是一种原癌基因,它具有抑制凋亡 的作用,并且近年来的一些研究已开始揭 示这一作用的机制。目前已经发现的BCL2蛋白家族按功能可分为两类,一类是像 BCL-2一样具有抑制凋亡作用,而另一类 具有促进凋亡作用。
BCL-2基因在10个物种中的位置:
>gi|262050657|ref|NM_001166486.1| Bos Taurus >gi|50950156|ref|NM_001002949.1| Canis lupus familiaris >gi|548519521|ref|XM_005697325.1| PREDICTED: Capra hircus >gi|57163882|ref|NM_001009340.1| Felis catus >gi|758371883|ref|NM_205339.2| Gallus gallus >gi|72198188|ref|NM_000633.2| Homo sapiens >gi|545477919|ref|NM_009741.4| Mus musculus >gi|694971627|ref|XM_001145537.2| PREDICTED: Pan testroglody >gi|8392973|ref|NM_016993.1| Rattus norvegicus >gi|225735550|ref|NM_001146093.1| Xenopus laevis
蛋白质结构预测和序列分析软件

多序列比对的定义
为了便于描述,对多序列比对过程给出下面的定义。把多序列比对看作一张二维表,表中每一行代表一个序列,每一列代表一个残基的位置。将序列依照下列规则填入表中:
4、 SCOP数据库:
要想了解对已知结构蛋白质进行等级分类的情况可利用SCOP(Structural classification of proteins)数据库,在该库中可以比较某一蛋白质与已知结构蛋白的结构相似性。
5、 CATH 数据库:
CATH(Class, Architecture, Topology and Homologous superfamily)是与SCOP类似的一个数据库。
三、蛋白质二级结构预测网站(数据库)
4、Prosite(蛋白质序列功能位点数据库)
始建于1990年代初,由瑞典生物信息学研究所SIB负责维护。
基于对蛋白质家族中同源序列多重序列比对得到的保守区域,这些区域通常与生物学功能相关。
数据库包括两个数据库文件:数据文件Prosite;说明文件PrositeDoc。
PIR/pirwww
MIPS——Munich Information Centre for Protein Sequences
http://mips.gsf.de/
JIPID——the Japanese International Protein Sequence Database
(a)一个序列所有残基的相对位置保持不变;
蛋白质结构预测和序列分析软件

多序列比对的定义
为了便于描述,对多序列比对过程给出下面的定义。把多序列比对看作一张二维表,表中每一行代表一个序列,每一列代表一个残基的位置。将序列依照下列规则填入表中:
4、 ExPASy数据库:
目前,瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)创建了蛋白质分析专家系统(Expert protein analysis system, ExPASy )。涵盖了上述所有的数据库。
网址:
4、 SCOP数据库:
要想了解对已知结构蛋白质进行等级分类的情况可利用SCOP(Structural classification of proteins)数据库,在该库中可以比较某一蛋白质与已知结构蛋白的结构相似性。
5、 CATH 数据库:
CATH(Class, Architecture, Topology and Homologous superfamily)是与SCOP类似的一个数据库。
SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT的序列数量呈直线增长。
2、TrEMBL数据库:
SWISS-PROT的数据存在一个滞后问题,即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题,TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。
蛋白质结构预测在线软件

蛋白质结构预测在线软件随着计算机技术的发展,越来越多的蛋白质结构预测在线软件被开发出来,并且被广泛应用于生物学研究。
本文将介绍几个常用的蛋白质结构预测在线软件,并对它们的原理和优缺点进行分析。
首先,我要介绍的是PHYRE2、PHYRE2是一款基于比较模型的蛋白质结构预测软件,它通过将待预测的蛋白质序列与已知结构库中的蛋白质序列进行比对,从而预测目标蛋白质的结构。
PHYRE2具有高度自动化的特点,可以在较短的时间内进行大量的结构预测。
但是,PHYRE2的准确性和可靠性相对较低,因为它只依赖于已知结构的信息。
其次,我要介绍的是I-TASSER。
I-TASSER是一种基于碎片装配的蛋白质结构预测软件,它通过将目标蛋白质的序列分解为小的片段,然后通过模板和螺旋转角预测来重新组装这些片段,从而得到目标蛋白质的结构。
I-TASSER具有较高的准确性和可靠性,并且在多个蛋白质结构预测比赛中表现出色。
然而,I-TASSER的计算速度较慢,需要较长的时间来进行结构预测。
另外,我要介绍的是Rosetta。
Rosetta是一种基于物理学的蛋白质结构预测软件,它通过对蛋白质的能量进行优化来确定最稳定的结构。
Rosetta具有较高的准确性和可靠性,并且可以进行全原子级别的结构预测。
然而,由于Rosetta的计算复杂性较高,需要大量的计算资源来进行结构预测。
除了以上介绍的几种蛋白质结构预测在线软件,还有许多其他的软件可供选择,如PSIPRED、HHPred等。
这些软件在原理和性能上有所差异,但都能够对蛋白质的结构进行预测,并为生物学研究提供重要的参考信息。
总结起来,蛋白质结构预测是生物信息学领域的重要课题,需要借助计算机算法来进行预测。
目前有许多蛋白质结构预测在线软件可供选择,它们在原理、准确性、可靠性和计算速度等方面有所差异。
选择合适的软件进行蛋白质结构预测,将对生物学研究产生重要的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质预测分析网址集锦?物理性质预测:?Compute PI/MW????SAPS??基于组成的蛋白质识别预测?AACompIdent???PROPSEARCH??二级结构和折叠类预测?nnpredict??Predictprotein???SSPRED??特殊结构或结构预测?COILS??MacStripe??与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。
?由NCBI检索蛋白质序列?可联网到:“”进行检索。
?利用SRS系统从EMBL检索蛋白质序列?联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。
?通过EMAIL进行序列检索?当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。
?蛋白质基本性质分析?蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。
蛋白质的很多功能特征可直接由分析其序列而获得。
例如,疏水性图谱可通知来预测跨膜螺旋。
同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。
WEB中有很多此类资源用于帮助预测蛋白质的功能。
?疏水性分析?位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。
该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。
输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。
需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。
?进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。
?跨膜区分析?有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。
这些技术主要是基于对已知跨膜螺旋的研究而得到的。
自然存在的跨膜螺旋Tmbase 数据库,可通过匿名FTP获得(,参见表一?资源名称网址说明?TMPRED?基于对tmpred数据库的统计分析PHDhtm??...tprotein.htmlMEMSAT?微机版本?,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
“或“”?前导肽与蛋白质定位?在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。
合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。
一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。
在起始密码子之后,有一段编码疏水性氨基酸序列的RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。
含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
??卷曲螺旋分析?另一个能够直接从序列中预测的功能motif是α-螺旋的卷曲排列方式。
在这种结构中,两种螺旋通过其疏水性界面相互缠在一起形成一个十分稳定的结构。
?蛋白质卷曲的相关资源?资源网址?coiled-coil????蛋白质功能预测?基于序列同源性分析的蛋白质功能预测?到少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显着性意义。
最快的工具如BlastP能很容易地发现显着性片段,而无需使用十分耗时的BLITZ软件。
?基于NCBI/BLAST软件的蛋白序列同源性分析?类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(,选择程序BLASTP就可网上分析。
?基于WU/BLAST2软件进行分析?华盛顿大学的BLAST软件(dove.embl-heidelberg.dl/blast2)也可进行蛋白质序列的同源性分析。
?基于motif、结构位点、结构功能域数据库的蛋白质功能预测?蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。
?同时,分子进化方面的研究表明,蛋白质的不同区域具有不同的进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质的功能。
在序列模式的鉴定方面有两类技术,第一类是依赖于和一致性序列(consensus sequence)或基序各残基的匹配模式,该技术可用于十分容易并快速搜索motif数据库。
?Motif数据库-PROSITE??蛋白质序列的(profile)分析??InterProScan综合分析网站???蛋白质的结构功能域分析?简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接?蛋白质结构预测?PDB数据库?蛋白质基本立体结构数据库(PDB,?其中有大量工具用于查看PDB数据库中的结构,如rasmol,可用于显于出蛋白质的空间结构,下载地址:)? PDBFinder 数据库?是在PDB、DSSP、HSSP基础上建立的二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息随着PDB库每次发布新版,PDBFinder在EBI自动生成,网址为“??NRL-3D数据库?是所有已知结构蛋白质的数据库,可用于查询蛋白序列时行相似性分析以确定其结构?ISSD数据库?蛋白质序列数据库,其每个条目包含一个基因的编码序列,同相应的氨基酸序列对比,并给出相应的多肽链结构数据。
?HSSP数据库?是根据同源性导出的蛋白质二级结构数据库,每一条PDB项目都有一个对应的HSSP文件,?蛋白质结构分类数据库?对已知蛋白质三维结构进行手工分类得到的数据库,位于剑桥的站点也提供BLAST检索服务??MMDB蛋白质分子模型数据库?是ENTREZ检索工具所使用的三维结构数据库,以ASN格式反蚋的PDB 中的结构和序列数据。
NCBI同时提供一个配套的三维结构显示程序的Cn3D,?Dali/FSSP数据库?基于PDB数据库中现有的蛋白质三维结构,用自动结构对比程序Dali比较而形成的折叠单元和家庭分类库。
?蛋白质二级结构预测?基于序列进行蛋白质二级结构方面已有了大量文献描述,本质上,这些研究可被分为两大类:基于单一序列的分析和基于多重序列对齐的分析。
?文献报道PHD程序是目前此方面的最好程序,提供了从二级结构到折叠方面分析的多种资源。
其网址为www.embl-heidel-berg.d ... tprotein.html? 蛋白质三级结构预测?蛋白质同源家庭的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义,同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog),前者指不同物种中具有相同功能和共同起源的基因,后者则指在同一物种内具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌红蛋白。
?蛋白质分类数据库(ProtoMap)?是对SWISS-PROT数据库中的全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到的数据库。
?蛋白质序列多重对齐分析及进化分析?如果发现一个未知蛋白质序列和较多不同和种属或同一种属的蛋白质序列具有较高的同源性(大于30%)那么提示待分析的蛋白质序列可能是相应家族的成员,从而可从分子时化的角度对蛋白质序列进行综合分析。
?常用在线蛋白工具?BCM Search Launcher??蛋白序列二级结构预测综合站点,从此出发,输入蛋白序列,可以根据需要,使用各种在线预测工具,包括Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMpred、SOUSI、Paircoil、Protein Hydrophilicity/Hydrophobicity Search、SOPM,使用十分方便。
? DAS??蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。
?TopPred 2??斯德哥尔摩大学理论化学蛋白预测服务器提供的膜蛋白拓扑学预测Topology prediction of membrane proteins在线工具?SOSUI??东京农业科技大学(Tokyo University of Agriculture and Technology)提供的膜蛋白分类和二级结构预测在线工具。
?PSIpred - MEMSAT2??本蛋白结构预测服务器允许你提交一个蛋白序列,进行二级结构预测与跨膜拓朴结构预测,并将结果用EMAIL提供给您。
?HMMTOP??预测蛋白序列的跨膜螺旋与拓扑结构服务器?TMpred??预测蛋白序列跨膜区?TMHMM??预测蛋白的跨膜螺旋?The PredictProtein server??提供蛋白数据库查询,预测蛋白各种结构的服务?SMART??提供蛋白序列,在结构域数据库中查询,显示出其结构域及跨膜区等? SPLIT??膜蛋白二级结构预测服务器?PRED-TMR??提供基于SwissProt数据库统计分析的预测蛋白跨膜片段的服务?CoPreThi??基于INTERNET的JAVA程序,预测蛋白的跨膜区?TMAP??提供预测蛋白跨膜片段的服务?multalin??蛋白序列对照服务器,比较几条蛋白序列的结构。
?Protein Sequence Analysis?巴斯德研究所提供的常用蛋白序列分析在线工具,绝对精选。
? PSA??Protein Sequence Analysis 服务器为美国波士顿大学生物分子工程研究中心(the BioMolecular Engineering Research Center )开发,提交氨基酸序列,预测二级结构及折叠区域。
?PRS??EMBL提供的以未知蛋白序列的氨基酸组成而非氨基酸序列顺序进行蛋白家族及各种特性预测的服务器,并将结果通过EMAIL发给您。
? AAA??EMBL氨基酸分析服务器,与上一个服务类似,以氨基酸残基组成为蛋白分析基础数据,结合蛋白数据库进行分析。