新版blast本地化构建+数据库下载+序列间的相似性检索

新版blast本地化构建+数据库下载+序列间的相似性检索
新版blast本地化构建+数据库下载+序列间的相似性检索

新版blast本地化构建+数据库下载+序列间的相似性检索

Ethnobotany

前面记录了blast-2.2.23-ia32-win32的本地化构建及相似性检索,NCBI新近对blast程序做了一些修改推出了blast+,这里结合网上资料、blast+的user manual对blast+的本地化构建及使用作一引荐。

1blast+的本地化构建

链接到:ftp://https://www.360docs.net/doc/541475523.html,/blast/executables/blast+/LATEST

下载ncbi-blast-2.2.23+-ia32-win32.tar.gz(绿色版),解压到d盘,并将文件夹更名为blast(我习惯这样做,因为在dos中写命令时方便),这样就安装完毕了,blast下具2个文件即bin 和doc。

2 数据库下载

2.1法1:直接从NCBI下载subject序列去掉txt的扩展名做成数据库即*db,然后将query 序列的txt扩展名掉做成查询文件*in。(格式必须是fasta,名字可以自己随便命名)

2.2法2:从NCBI中的ftp库下载所需要的某一个库或几个库,其链接为

ftp://https://www.360docs.net/doc/541475523.html,/blast/db/

2.3法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。

2.3.1 perl程序的下载和安装

可google“Perl for Windows”获得,也可直接按此连接

https://www.360docs.net/doc/541475523.html,/releases.html下载并,安装到任何盘均可。

2.3.2运行update_blastdb.pl进行下载

2.3.2.1开始>运行>cmd+确认>进入dos系统>输入以下命令打开bin文件夹。

2.3.2.2接着输入下述命令回车查看操作帮助(这一步可以不做,不妨碍后续操作)

2.3.2.3还可输入下述命令回车查看NCBI中的库(无需登录NCBI你就可以看到你所需要的库)

2.3.2.4以下载载体库(vector)为例演示如何下载库。输入如下命令回车即可。

直到后面出现done即表示已经下载完毕。如果下载其他数据库,你就可以在上面的perl update_blastdb.pl 后面的vector换成其它数据库的名字即可。

再做本地blast时即可以你下载的压缩文件名代替你bin中*db数据库,进行搜索。

上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进

行格式化(转化成二进制数据),第三种方法下载速度较慢,但是是NCBI中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。

3序列间的相似性检索

以人的BCL2-like mRNA检索人类的mRNA库为例介绍核酸序列的本地检索。

3.1下载人类的mRNA数据库(只能用后2种方法的其中一种),这里用ftp下载,速度较快,其链接为ftp://https://www.360docs.net/doc/541475523.html,/refseq/H_sapiens/mRNA_Prot/human.rna.fna.gz

解压后置于blast的bin文件夹下。

3.2去NCBI下载BCL2-like的mRNA序列,其登录号为NM_207002.2用作你做该实验的query序列,将该序列置于bin中命名为human,并去掉扩展名。

3.3格式化数据库

开始>运行>cmd+确认>进入dos系统>输入以下命令打开bin文件夹。

输入以下命令对数据库进行格式化。

-in参数后面接将要格式化的数据库,-parse_seqids, -hash_index两个参数一般都带上,主要是为blastdbcmd取子序列时使用,-dbtype nucl告诉程序这是核酸数据库。

3.4运行blastn(blast+)

输入以下命令进行数据检索。

这样即可在bin下查看结果。

以上实验所输入的全部命令如下:

4蛋白序列间的比对检索

数据库格式化命令:makeblastdb.exe –in db –parse_seqids –hash_index –dbtype prot 比对命令:blastp.exe –task blastp –query in –db db –out test.txt

关于参数的说明:

blastp.exe 程序执行命令,exe前的程序根据自己的需要而换;

-task 后面选择你所要用的程序,blastn,blatp,tblastx等;

-query 后接查询序列的文件名称;

-db 后接格式化好的数据库名称;

-out 后接要输出的文件名称及格式;

-dbtype 后接所格式化的序列的类型,核酸用nucl,蛋白质用prot;

makeblastdb.exe格式化数据库的命令;

blastn的相关命令参数可用blastn –help命令查询,blastp的相关命令参数可用blastp –help 查询,依次类推。

希望各位战友将自己的经验分享以将blast越用越好。

参考文献

BLAST Command Line Applications User Manual

中文数据库检索报告

学号:专业:姓名 检索课题:含重金属废水的处理技术 检索工具:中国知网 检索词:重金属,处理 检索过程: 1)制定检索策略 (1)分析课题,选择检索词。 经分析,检索词选择为重金属,处理 (2)检索要求:①期刊范围不限;②学科不限;③时间不限 2)实施检索策略 (1)登陆郑大图书馆,进入中国知网,首先进行初级检索,勾选出与课题密切相关的文献,点击导出/参考文献,然后,用同样的方法进行高级检索,勾选密切相关文献,点击导出/参考文献。如截图所示:

检索结果: [1]马静.天然植物材料作为吸附剂处理低浓度重金属废水的研究[D].湖南大学,2007. [2]李晓星.锰矿石脱硫(H_2S)及其产物处理含重金属废水的研究[D].合肥工业大学,2008. [3]李长波,赵国峥,张洪林,蒋林时,苗磊.生物吸附剂处理含重金属废水研究进展[J].化学与生物工程,2006,02:10-12. [4]吴昊,张盼月,蒋剑虹,肖辉煌,杨力.反渗透技术在重金属废水处理与回用中的应用[J].工业水处理,2007,06:6-9. [5]王湖坤,龚文琪,胡婧.粉煤灰-累托石颗粒吸附材料处理含重金属废水[J].武汉理工大学学报,2007,08:62-66. [6]朱健.应用硅藻土处理含重金属离子废水相关理论基础及关键技术研究[D].中南林业科技大学,2013. [7]黄进.多功能介孔硅基吸附剂的制备及其对重金属废水的处理研究[D].上海师范大学,2013.

[8]刘刚伟.蒙脱石复合颗粒吸附剂的制备及处理含重金属废水的研究[D].武汉理工大学,2009. [9]黄超.凹凸棒土改性及其对含重金属废水净化应用的研究[D].贵州大学,2009. [10]李琛.藻类在含重金属废水处理中的应用[J].电镀与精饰,2011,02:19-23. [11]周芬,汪晓军.化学-混凝沉淀处理含氟含重金属废水研究[J].环境工程学报,2012,02:445-450. [12]刘萍,曾光明,黄瑾辉,牛承岗.生物吸附在含重金属废水处理中的研究进展[J].工业用水与废水,2004,05:1-5. [13]杨晓玲.用气浮法处理含重金属废水[J].云南冶金,2000,04:38-40. [14]许佩瑶,吴世军.粉煤灰处理含重金属废水的研究进展[J].煤炭工程,2010,02:95-97. [15]陶有胜,朱联锡,张克仁.沉淀浮选法治理含重金属废水的研究[J].四川环境,1994,03:22-25. [16]陶有胜,朱联锡,张克仁.沉淀浮选法处理矿山含重金属废水技术初探[J].四川环境,1993,02:36-38. [17]曾桓兴.铁氧体共沉淀技术净化含重金属废水[J].环境科学,1983,04:66-71. [18]齐亚凤.改性甘蔗渣对重金属离子吸附行为研究[D].武汉工程大学,2012. [19]王柯桦,李雅婕.生物法在处理重金属废水中的应用[J].广东化工,2013,02:67-68. [20]朱婧文,刁硕,张阳.海藻在处理含重金属废水中的应用研究[J].北方环境,2013,01:118-119. [21]樊霆.真菌对重金属的抗性机制和富集特性研究[D].湖南大学,2009. [22]凌静.硅藻土对废水中Cd~(2+)和Pb~(2+)的吸附性能研究[D].南华大学,2013. 对检索结果的文献分析: 1)从学术传播度上来看,如下表所示:

几大中文数据库专业检索式举例

几大中文数据库专业检索式举例 CNKI专业检索式 可检索字段: SU=主题,TI=篇名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一作者,AF=作者单位,CV=会议名称,CP=论文集名称, RF=参考文献,RT=更新时间,FU=基金,CLC=中图分类号,IB=ISBN ,CF=被引频次 示例: 1)TI='生态' and KY='生态文明' and (AU % '陈'+'王' ) 可以检索到篇名包括“生态”并且关键词包括“生态文明”并且作者为“陈”姓和“王”姓的所有文章; 2)SU='北京'*'奥运' and FT='环境保护' 可以检索到主题包括“北京”及“奥运”并且全文中包括“环境保护”的信息; 3)SU=('经济发展'+'可持续发展')*'转变'-'泡沫' 可检索“经济发展”或“可持续发展”有关“转变”的信息,并且可以去除与“泡沫”有关的部分内容。 TI='精益生产' and SU=('持续改善'+'改善') and (AU % '陈'+'王' ) CNKI专业检索式: 可检索字段:题名(题名),关键词(关键词),摘要(摘要),全文(全文),作者(作者),第一责任人(第一作者),单位(作者单位),来源(来源),主题(主题),基金(基金),引文(参考文献) SU=('心跳骤停'+'心搏骤停') AND SU=('心肺复苏'+'心肺脑复苏') AND SU=('溶栓治疗'+'尿激酶'+'链激酶'+'组织型纤维蛋白酶原激活剂') 注:SU—限定范围为主题 TI—题名 KY—关键词 AB—摘要 FT—全文 AU—作者 FI—第一作者 AF—作者单位 JN—期刊名称 RF—参考文献

检索工具的分类

1.检索工具的分类 (1)按照信息搜集方法分类 按照信息搜集方法的不同,搜索引擎系统可以分为三大类: 1)目录式搜索引擎(Directory Search Engine) 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory. 2)机器人搜索引擎(Crawler-Based Search Engine) 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google. 3)元搜索引擎(Meta Search Engine) 这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket. 目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有"门户化"的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的"网络门户". (2)按照检索软件分类 按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。 全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。 非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。 主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。 (3)按照检索语言分类 目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。 2.全文数据库的检索软件 (1)Alta Vista 检索引擎 Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库,Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的

中文数据库的检索实验报告

实验报告 课程名称计算机信息检索 实验项目名称 班级与班级代码 实验室名称(或课室) 专业 任课教师 学号: 姓名: 实验日期:

姓名实验报告成绩评语: 指导教师(签名)

年月日说明:指导教师评分后,学年论文交院(系)办公室保存。

实验一 一、实验目的 掌握常见中文数据库的检索方式。利用所学理论知识,结合实验分析不同数据库在信息组织、检索分式等方面的特点。 二、实验内容: 用一专题在六个中文数据库、检索结果主要也目录和摘要为主。 检索专题自选。 1、中国期刊网 2、维普中文科技期刊数据库 3、万方数据资源系统 4、国研网 5、中宏数据库 6、人大复印资料 7、高校财经数据库 三、实验环境 CPU:Intel(R) core?2 CPU 内存:1G 软件: IE 资源:互联网 四、实验步骤 1.进入广东商学院图书馆网页,点击数字资源,进入中国期刊数据库。 2. 根据自己检索课题的要求,采用分类检索与主题检索在加上 3.鉴于以上检索的结果记录数较多,而且与需求的相关性低,采用以下缩减手段:

(1)在检索导航中更改默认分类:只选择“经济与管理”类 (2)更改更新时间(2005~2009),得到结果; (3)把模糊匹配改为精确匹配得到结果; 4. 通过亲自查看其摘要,全文的方式,剔除一些不相关的文献,并归纳出剔除文章的原则。 5. 将最后的所得的与主题密切相关的文献题录信息拷贝下来,保存在作业文件夹中。并在实验报告中体现出来。 6. 把最后所得的期刊论文的全文都一一拷贝下来。保存在自己的移动硬盘中。作为后期撰写文献综述的依据之一。 7. 登陆到学校的重庆维普数据库、人大报刊索引全文数据库,万方全文数据库期刊、国研网子系统,重复2,3,4,5,6,将所得检索结果拷贝下来,放在作业文件夹 五、试验结果 实验步骤3(2)(3)的结果如下,其它数据库结果类似 六、实验分析 期刊网的主页上免费的资源有:学术研究、工具书检索、党和国家大事、文化与生活、学习教育、行业知识仓库等,在相应领域的信息检索中起着重要作用。

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

信息检索 英文全文数据库中文数据库

1检索课程名称:海洋光学遥测信息应用研究 2课题分析::海洋光学主要利用光电子学进行测量以获取特征数据进行研究和指导决策生产,遥测是光电子方法的一种应用,检索课题主要是了解遥测对海洋观测所获取信息的应用或者简单理解为遥测信息在海洋光学中的应用.本检索目的是要找出课题相关文献,为防止漏检应考虑上述两层含义.实质上上述两层含义是一个问题的两个方面 中文关键词: 1遥测 2海洋光学 3应用 3、选择检索工具: 本课题检索目标为中文各类相关文献。根据本图书馆的资源情况选择如下数据库:(1)CNKI 数字图书馆:中国期刊全文数据库 (2)万方数据库(会议论文) (3书生之家数字图书馆等 4、构建检索策略:因“海洋光学”为课题的主体,应优先检索,“遥测”应在检索结果中同时存在。故制定如下检索策略 检索算法:(遥测or遥感)*海洋光学 时间范围:2003-2012 文献范围:期刊论文、会议论文、专著 5、简述检索策略调整的过程: 1)在 CNKI 中国期刊全文数据库中(CNKI 外网): 利用其中的高级检索 输入全文为:遥感 主题为:海洋光学 检索结果为235条结果记录过多 然后在加入关键词“应用”检索结果为12条,能达到我们的预期 2)万方数据库(会议论文) 以会议方式检索 keywords:遥测and 海洋光学检索结果为0 不符合要求于是减少关键词

输入keywords:海洋光学一共检索出9条结果 符合检索结果的要求。 3)书生之家数字图书馆 在图书下图书全文检索,选择按图书内容检索,以所有分类输入遥测and海洋光学, 检索结果为0输入范围太小于是输入“遥测”检索结果为709条,条目过多输入“海洋光学”检索结果为4条以这个为结果比较符合。 6.整理检索结果 1:CNKI中国期刊全文数据库有关专辑检索结果(选1条) 【英文篇名】 ADVANCES IN THE SCIENCE OF MARINE OPTICAL REMOTE SENSING APPLICATION IN CHINA 【作者中文名】潘德炉; 王迪峰; 【作者英文名】 PAN De-lu; WANG Di-feng (Key Lab of Ocean Dynamic Processes and Satellite Oceanography; SIO; SOA; PRC; Hangzhou 310012; China); 【作者单位】国家海洋局海洋动力过程与卫星海洋学重点实验室国家海洋局第二海洋研究所; 国家海洋局海洋动力过程与卫星海洋学重点实验室国家海洋局第二海洋研究所浙江杭州310012; 浙江杭州; 【文献出处】地球科学进展, Advance in Earth Sciences, 编辑部邮箱 2004年 04期 期刊荣誉:中文核心期刊要目总览 ASPT来源刊中国期刊方阵 CJFD收录刊【关键词】海洋; 光学遥感; 中国; 【英文关键词】 Marine; Optical remote sensing; China.; 【摘要】 20世纪90年代以来,我国航天遥感事业的发展促进了海洋光学应用科学的发展,特别是通过近几年来,国家"863"高新技术计划的实施,在该方面有了新进展。文章将着重介绍光学遥感信息的大气校正、光学遥感海洋环境信息提取、光学遥感在赤潮与溢油监测等3个方面的应用科学新进展,并提出了在我国进一步深入开展海洋光学遥感应用科学技术研究的建议。 【英文摘要】 The special ocean color satellite HY-1 was in the orbit on May 15, 2002, whose main purpose is detection of marine environment of

最新整理几大中文数据库专业检索式举例电子教案

此文档收集于网络,如有侵权,请联系网站删除 几大中文数据库专业检索式举例 CNKI专业检索式 可检索字段: SU=主题,TI=篇名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一作者,AF=作者单位,CV=会议名称,CP=论文集名称, RF=参考文献,RT=更新时间,FU=基 金,CLC=中图分类号,IB=ISBN ,CF=被引频次 示例: 1)TI='生态' and KY='生态文明' and (AU % '陈'+'王' ) 可以检索到篇名包括“生态”并且关键词包括“生态文明”并且作者为“陈”姓和“王”姓的所有文章; 2)SU='北京'*'奥运' and FT='环境保护' 可以检索到主题包括“北京”及“奥运”并且全文中包括“环境保护”的信息; 3)SU=('经济发展'+'可持续发展')*'转变'-'泡沫' 可检索“经济发展”或“可持续发展”有关“转变”的信息,并且可以去除与“泡沫”有关的部分内容。 TI='精益生产' and SU=('持续改善'+'改善') and (AU % '陈'+'王' ) CNKI专业检索式: 可检索字段:题名(题名),关键词(关键词),摘要(摘要),全文(全文),作者(作者),第一责任人(第一作者),单位(作者单位),来源(来源),主题(主题),基金(基金),引文(参考文献) SU=('心跳骤停'+'心搏骤停') AND SU=('心肺复苏'+'心肺脑复苏') AND SU=('溶栓治疗'+'尿激酶'+'链激酶'+'组织型纤维蛋白酶原激活剂') 注:SU—限定范围为主题 TI—题名 KY—关键词 AB—摘要 FT—全文 AU—作者 FI—第一作者 AF—作者单位 JN—期刊名称 RF—参考文献 RT—更新时间 PT—发表时间 精品文档

检索工具分类

1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket。目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索”便搜索人工分类库,选择”网页搜索”便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有”门户化”的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的”网络门户”。(2)按照检索软件分类按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。(3)按照检索语言分类目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。2.全文数据库的检索软件(1)Alta Vista 检索引擎Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库。Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的所有特性,还允许使用布尔运算符和接近操作符、括号等,查找的结果按关键词排序。Alta Vista总能返回有用的信息,但由于没有对内容进行选择,它的”信噪比”也是最大的。使用Alta Vista检索引擎时应注意:要进行有效的检索,最好尽可能多而精确地输入描述所感兴趣的主题的词或词组。提供的词组越精确,检索结果就越好。如果你输入的词包含大写字母,则检索对大小写就比较敏感。如输入Telephone 则只检索含有这个词的内容,而输入telephone 则不论大小写都检索。如果要把一些词作为词组或一个整体来查询时,最好把它们加上双引号。如果要求特定单词包含在索引的文档中,可以在它前面加一个”+”号,如:+Telephone,并且在”+”号和单词之间不能有空格。相应的,如果要排除含有特定单词的文档,可以在它前面加一个”-”号,如-cool。进行简单查找的时候,可以在单词的末尾加一个通配符来代替任意的字母组合(最多可代替5个小写的

中文数据库信息检索

实验5中文数据库信息检索(万方学位论文数据库) 【实验目的】 熟悉万方学位论文数据库的基本情况;掌握其信息检索系统的检索方法以及检索结果的处理;掌握提高查全率和查准率的方法。 学时安排:2 学时 【实验内容】 1、查阅该数据库的检索方式及其检索流程。 2、根据自选检索课题,从上次实验本组检索获取的10篇相关论文中的作者(至少8人)出发,使用作者途径(不限定年份)利用万方数字化期刊全文数据库检索本组课题内容。分别统计每位作者的发表论文分 检索,要求写出:检索课题名称、检索分类序列、检索结果数、5—10条检索命中记录的题录信息(题名、作者、文献出处)。 【实验报告】 1、进入武汉工业学院图书馆主页,点击〖常用数据库〗中的〖万方数据资源系统〗,即可进入图5-1,然后点击〖万方学位论文数据库〗,即可开始检索历程。

2、自选检索课题,如:数据加密技术,使用万方学位论文数据库检索。 图5-2 万方学位论文数据库分类检索页 实验6外文数据库信息检索(EBSCO期刊全文数据库) 【实验目的】 熟悉EBSCO期刊全文数据库信息检索系统的基本情况,掌握外文数据库信息检索系统的检索方法以及检索结果的处理。 学时安排:2 学时

【实验准备】 1、根据在实验3、4、5中的自我选题的查询情况,选择相应的主题检索词并将其翻译成英文(至少3~5个),可以通过阅读已查中文文献中的英文摘要、英文关键词的形式获得。 2、EBSCO期刊全文数据库 (1)访问地址:https://www.360docs.net/doc/541475523.html,/ 或https://www.360docs.net/doc/541475523.html, (2)使用方法:此服务器不计国际流量,只对我校合法的IP地址开放。(3)内容介绍: 我馆情况:已经购买了其中的ASP(Academic Search Premier)和BSP 包。 学术期刊集成全文数据库(Academic Search Premier,简称ASP):ASP是当今全世界最大的多学科学术期刊全文数据库。包括有关生物科学、工商经济、资讯科技、通讯传播、工程、教育、艺术、文学、医药学等领域的7876种期刊的文摘和索引;3990种学术期刊的全文,全文最早回溯到1990年,索引和文摘最早回溯到1984年。数据每日更新。商业资源集成全文数据库(Business Source Premier,简称BSP):BSP 收录了3048种学术性商业类全文期刊,文摘和索引的收藏更超过3851种期刊。较著名的有华尔街日报(The Walls Street Journal)、哈佛商业评论(Harvard Business Review)、每周商务(Business Week)、财富(Fortune)、American Banker、Forbes、The Economist等,涉及的主题范围有国际商务、经济学、经济管理、金融、会计、劳动人事、银行等。适合高等院校经济学、工商管理、金融银行、劳动人事管理等专业使用。全文最早回溯至1990年。数据每日更新。 3、世界科学出版社全文电子期刊数据库 (1)访问地址:https://www.360docs.net/doc/541475523.html, (2)内容介绍: 资源特点:WorldSciNet为新加坡世界科学出版社(World Scientific Publishing Co.)电子期刊发行网站,该出版社委托EBSCO/MetaPress 公司在清华大学图书馆建立了世界科学出版社全文电子期刊镜像站。WorldSciNet目前提供58种全文电子期刊,涵盖数学、物理、化学、生物、医学、材料、环境、计算机、工程、经济、社会科学等领域。我馆情况:从2002年开始订阅。 资源状态:为网络资源,我校用户直接连接在清华的镜像站点使用。4、德国施普林格全文电子期刊数据库 (1)访问地址:https://www.360docs.net/doc/541475523.html, (2)使用方法:为网络资源,拥有我校合法IP的用户,直接连接施普林格在清华的镜像站点使用。 (3)内容介绍: 资源特点:德国施普林格(Springer-Verlag)是世界上著名的科技出版集团, 通过Springer LINK系统提供学术期刊及电子图书的在线服务。目前Springer LINK所提供的全文电子期刊共包含439种学术期刊(其中近400种为英文期刊),是科研人员的重要信息源。我馆情况:从2002年开始订阅。 【实验内容】

检索工具

一·检索工具的发展历程 我国检索工具的发展,经历了从完全翻译国外刊物到翻译与自编相结合,最终过渡到完全自编的过程。从单一的印刷检索工具到印刷型和电子检索数据库共同发展的局面。现在初步形成了具有特色和较完整的体系。 二·文献检索两种类型 1线索检索:通过检索工具 2事实检索:通过参考工具书 看书 三·检索工具的概念与基本特点 概念:用于报道,存储和查找文献线索的工具 四点基本特点书中原文 它是附有检索标识的某一范围文献条目的集合,是二次文献。 一般说来,检索工具应具备以下五个条件:①明确的收录范围;②有完整明了的文献特征标识;③每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识;④全部条目科学地、按照一定规则组织成为一个有机整体;⑤有索引部分,提供多种必要的检索途径。 四·检索工具的功能 1存贮功能2检索功能3报道功能 信息检索的一种类型。按照一定方式将文献组织存储在某种载体上,并利用相应的方法或手段从中找出符合用户需要的文献的过程或技术。文献检索是科学技术信息工作的重要组成部分,是科学研究的前期工作。 五·检索工具的类型 1.按出版形式和载体划分 可以分为书本式检索工具、卡片式检索工具、缩微型检索工具、机读式检索工具。

书本式检索工具 书本式检索工具具有以下优点:可以一次编成印刷分发,便于长久使用,实用价值高;体积小易于携带,使用不受时间空间限制,便于馆际互借。书本式检索工具的不足之处:出版周期长,不能随时反映最新信息;查阅不方便,书本式检索工具落后于实际发展;陈旧过时的信息无法从书本式检索工具中剔除。 单卷式检索工具 以某一学科或专题为检索内容,报道若干年内该学科领域的文献,可一期或不定期出版。特点:专业性强,文献集中,专题文献检索方便,价值也高,如"1949,1979年医学论文累积累引",按学科分班出版。 期刊式检索工具 有长期固定的刊名,定期连续出版的一种检索刊物,如美国医学索引、中文科技资料目录等。报道文献以近期为主,能及时反映新发表的科研资料。 特点:有连贯性,可长期积,卷期与卷期之间衔接,无中断及重复。 附录式检索工具 不单独出版,附于图书或论文之后,常以参考文献的形式出现,是著者著书和写文章时的参考资料,是经过精选出来的文献,有较大的实用价值,是查阅文献的方法之一。 特点:它是专题索引,同一专题,文献集中但有局限性,易漏检。 卡片式检索工具 卡片式检索工具这种卡片式检索工具具有以下优点:可以随时编辑、随时排序、随时使用,具有流水作业的性质。不足之处:例如:体积庞大,占用较大空间,排序不易,检索点少。这种工具现在基本被淘汰了。 编制者按自己的需要,把所需内容摘录在文献卡片上,分类整理排列而成。 特点:可自由组合排列,也可随时增减,逐步积累,灵活性大,根据学科发展,不断进行更新,但体积大,成本高,不便携带。 缩微式检索工具 优点是:体积小、编印速度快、发行广泛。缺点是不能随时增减、阅读需要专用阅读器,使用不方便。

利用中文数据库进行文献信息检索作业及答案

1.检索课题名称:工程机械非线性动力学特性的实验研究 2.课题分析:“工程机械”属于本课题的主体词,“非线性”是工程机械的适用范围,“动 力学特性”是工程机械的研究领域,“实验研究”不作为课题检索胡关键词使用。由此得出的检索关键词如下: 中文关键词:(1)工程机械(2)非线性(3)动力学特性 英文关键词:(1)Engineering mechanical(2)Nonlinearity(3)Dynamic characteristic 3.选择检索工具: (1)万方数据库(中国学术会议论文) (2)维普资讯(中国科技期刊数据库) (3)CNKI(中国知网期刊数据库) 4.构建检索策略:“工程机械”是课题主体词,应当优先检索,“非线性”是其次检索研 究课题的使用范围,“动力学特性”属于检索课题的领域。故制定以下检索策略:检索算法:(工程机械)*(非线性)*(动力学特性) 时间范围:2005-2014 文献范围:期刊论文、专著、会议论文等 5.简述检索策略调整的过程: (1)万方数据库(中国学术会议论文) a.使用策略“(工程机械)*(非线性)*(动力学特性)”检索式,检索范 围:题名或关键字,限定年代2005-2014年之间,检索文献类型:期刊论 文、会议论文。检索出两条内容。 (2)维普资讯(中国科技期刊数据库) a.使用原策略“(工程机械)*(非线性)*(动力学特性)”(((题名或关 键字=工程机械)*( 题名或关键字=非线性))*( 题名或关键字=动力学特 性)*全部期刊*年=2005-2014)进行检索,检索范围选择:所有专辑和全 文,日期范围选择:2005-2014,检索出1条记录。 (3)CNKI(中国知网期刊数据库) a.使用策略“(工程机械)*(非线性)*(动力学特性)”检索式,高级 检索,检索内容条件:(关键词=工程机械)*(关键词=非线性)*(关 键词=动力学特性)*(发表时间:2005-01-01—今天)*(学科领域: 基础科学、工程科技Ⅰ辑、工程科技Ⅱ辑)*(跨库搜索:期刊,国 内会议,专利)进行检索,检索出0条记录。 b.仍使用策略“(工程机械)*(非线性)*(动力学特性)”检索式,这 次使用专业检索,((TI(题名)=工程机械AND KY(关键字)=非 线性AND KY(关键字)=动力学)),并扩大了检索时间:200-01-01 —今天,学科领域原则了全选,跨库搜索也选择了全选进行检索,检 索出1条记录。 6.整理检索结果: (1)万方数据库(中文学术会议论文)检索结果(其中择优选一条): 【篇名】旋转机械系统多自由度非线性动力学数值分析 【作者】裘春航李伟东吕和祥 【中文刊名】计算力学学报 【英文刊名】CHINESE JOURNAL OF COMPUTATIONAL MECHANICS 【年、期】2005年,22(4)期 【中文关键词】转子系统、非线性油膜力、数值稳定性、非线性动力学特性

三大检索工具及相关数据库介绍

一.三大检索工具及相关数据库介绍 1.三大检索工具简介 科技部下属的“中国科学技术信息研究所”从1987 年起,每年以国外四大检索工具SCI 、ISTP 、Ei、ISR 为数据源进行学术排行。由于ISR(《科学评论索引》) 收录的论文与SCI 有较多重复,且收录我国的论文偏少因此,1993年起不再把ISR 作为论文的统计源。而其中的SCI 、ISTP 、Ei 数据库就是图书情报界常说的国外三大检索工具。 SCI ,即《科学引文索引》,是自然科学领域基础理论学科方面的重要期刊文摘索引数据库。它创建于1961 年,创始人为美国科学情报研究所所长Eugene Garfield(1925.9.15).利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自1945 年以来重要的学术成果信息;SCI 还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据? ISTP ,即《科学技术会议录索引》,创刊于1978 年,由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。从1990-2003 年间,ISTP 和ISSHP( 后文将要讲到ISSHP) 共收录了60 ,000 个会议的近300 万篇论文的信息。 Ei,即《工程索引》,创刊于1884 年,由Elsevier Engineering Information Inc. 编辑出版。主要收录工程技术领域的论文(主要为科技期刊和会议录论文) ,数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。 2.与三大检索工具相关的其它数据库介绍 SSCI,即《社会科学引文索引》,创刊于1969 年,收录数据从1956 年至今;是社会科学领域重要的期刊文摘索引数据库。数据覆盖了历史学、政治学、法学、语言学、哲学、心理学、图书情报学、公共卫生等社会科学领域。 A&HCI,即《艺术与人文科学引文索引》,创刊于1976 年,收录数据从1975 年至今;是艺术与人文科学领域重要的期刊文摘索引数据库。数据覆盖了考古学、建筑学、艺术、文学、哲学、宗教、历史等社会科学领域。 ISSHP ,即《社会科学和人文会议录索引》,创刊于1979 年,数据涵盖了社会科学、艺术与人文科学领域的会议文献。这些学科包括:哲学、心理学、社会学、经济学、管理学、艺术、文学、历史学、公共卫生等领域。 返回页首

实验2 序列查询(Entrez)、BLAST序列相似性搜索

实验二:序列查询(Entrez)、BLAST序列相似性搜索 实验目的: 1.学会用Entrez系统查找目标序列 2.学会使用BLAST在数据库中搜索相似序列 3.学会分析数据库搜索结果 实验内容: 一、Entrez Entrez是一个由NCBI创建并维护的基于Web界面的综合生物信息数据库检索系统。用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。 网址:https://www.360docs.net/doc/541475523.html,/Entrez/(或在NCBI主页默认All Databases时点击搜索框右边的Search进入)。如Figure 2.1所示: Figure 2.1 entrez 检索系统子数据库 点击搜索框右边的help按钮,即可进入Entrez帮助页面。 在搜索栏输入你要查找的关键词,点击“GO”即可开始搜索。如果输入多个关键词,它们之间默认的是“与”(AND)的关系。 Tips:搜索的关键词可以是一个单词,短语,句子,数据库的识别号,基因名字等等,但必须明确,不能是“gene”, “protein”等没有明确指向的词语。但“transcription factor”这样有一定范围的词是可以接受的。可以用你感兴趣的领域的专业术语,也可以是非专业术语,比如:h1n1,lung cancer,albinism; subtilism, peroxidase, myoglobin。  输入关键词,点击“GO”之后,每个数据库图标前方出现了数字,代表的是在相对应的数据库里搜索到的条目数。点击进入对应的数据库,可以查看搜索到的条目。如果在数据库图标前面为灰色,显示“none”,说明在对应的数据库里没有搜索到任何结果。

世界著名的四大检索工具

世界著名的四大检索工具(ISSHP,A&HCI,即《艺术与人文科学引文索引》等》)2009-09-22 16:25 一、三大检索工具及相关数据库介绍 SCI 、ISTP 、 Ei 数据库就是图书情报界常说的国外三大检索工具。 SCI ,即《科学引文索引》,是自然科学领域基础理论学科方面的重要期刊文摘索引数据库。它创建于1961 年,创始人为美国科学情报研究所所长 Eugene Garfield(1925.9.15).利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自 1945 年以来重要的学术成果信息;SCI 还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。 ISTP ,即《科学技术会议录索引》,创刊于 1978 年,由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。从 1990-2003 年间, ISTP 和 ISSHP( 后文将要讲到 ISSHP) 共收录了 60 , 000 个会议的近 300 万篇论文的信息。 Ei,即《工程索引》,创刊于 1884 年,由 Elsevier Engineering Information Inc. 编辑出版。主要收录工程技术领域的论文(主要为科技期刊和会议录论 文 ) ,数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。与三大检索工具相关的其它数据库介绍 SSCI,即《社会科学引文索引》,创刊于 1969 年,收录数据从 1956 年至今;是社会科学领域重要的期刊文摘索引数据库。数据覆盖了历史学、政治学、法学、语言学、哲学、心理学、图书情报学、公共卫生等社会科学领域。 A&HCI,即《艺术与人文科学引文索引》,创刊于 1976 年,收录数据从 1975 年至今;是艺术与人文科学领域重要的期刊文摘索引数据库。数据覆盖了考古学、建筑学、艺术、文学、哲学、宗教、历史等社会科学领域。 ISSHP ,即《社会科学和人文会议录索引》,创刊于 1979 年,数据涵盖了社会科学、艺术与人文科学领域的会议文献。这些学科包括:哲学、心理学、社会学、经济学、管理学、艺术、文学、历史学、公共卫生等领域。 二.如何利用三大检索工具等数据库检索相关主题文献 1.利用SCI、SSCI、A&HCI数据库检索相关主题文献 (1) 通过往TOPIC检索入口输入检索主题词获得相关主题文献 (2) 通过往TOPIC检索入口输入检索主题词,然后对检索结果进一步分析获得相关主题文献 (3) 通过往TOPIC和SOURCE TITLE检索入口同时输入检索主题词获得相关主题文献 例子:往TOPIC中输入"nano*",同时往SOURCE TITLE 中输入"ARTIFICIAL CELLS BLOOD SUBSTITUTES AND IMMOBILIZATION BIOTECHNOLOGY or BIO-MEDICAL MATERIALS AND ENGINEERING or BIOMATERIALS or CELLULAR POLYMERS or DENTAL MATERIALS or JOURNAL OF BIOACTIVE AND COMPATIBLE POLYMERS or JOURNAL OF BIOMATERIALS SCIENCE-POLYMER EDITION or JOURNAL OF BIOMATERIALS

NCBI中Blast种类及使用简介

NCBI中Blast种类及使用简介 NCBI中Blast种类简介 1. Blast Assembled Genomes 在一个选择的物种基因组序列中去搜索。 2.Basic Blast 2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序 2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。 2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较 2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。 2.2 Protein Blast 2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。 2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。 2.3 Translating BLAST 2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。 2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成

相关文档
最新文档