爱如生数据库与翰堂典藏数据库的对比

合集下载

三大中文数据库对比

三大中文数据库对比

❖ 检索技巧 ❖ 布尔逻辑检索:可以使用AND,OR,AND NOT三种逻辑运
算 ❖ “”:引号中作为词组进行查询如 “remote education” ❖ “*”:无限截词符如behav*可以查找behave, behavior,
behavioral
❖ “?”:有限截词符,取代一个单词中的一个字母,可以用 “n?”代替多个字符。
mechanical) ❖ 可以在篇名中或者在文摘中进行检索 ❖ su:(artificial intelligence) AND su:(machine OR
machinary OR mechanical ) ❖ su:(artificial intelligence) AND ( su:(machine) OR
关键词:设备、机械 ) ❖ 3、利用万方中国会议论文全文数据库的会议名录检索:查找有关“水处理”
方面会议名录,共有几个,摘录其中一个会议信息.指出该会议共有几篇会议论 文,并摘录其中一篇会议论文信息。 ❖ 4、利用Springer初级检索途径检索机械 (machine,machinery,machanical)的设计(design)方面的文献.要求限制在 文章的摘要(SU)字段中。 ❖ 5、利用Elsevier浏览途径查找刊物《Global Environmental Change 》, 指出该刊物全文的起始年限,刊物收录的最新数据是第几期? 摘录2003年 第13卷第3期上的一篇题录信息(指出有几篇,摘录一篇)。 ❖ 6、利用EBSCO全文数据库高级检索检索检索有关“畜禽场废水的厌氧处 理”方面的文献 ❖ 畜禽场(livestock, farm, field) ❖ 厌氧(anaerobic) ❖ 废水(wastewater)
EBSCO 数据库

国内三大数据库对比

国内三大数据库对比

西北工业大学图书馆数据库资源主要中文数据库—万方、维普、CNKI1、资源同质化分析(1)内容同类型产品数据内容存在同质化现象。

三者都是力求收录齐全,范围都涵盖自然科学、工程技术、人文科学等领域,因此不可避免地存在严重重复。

(2)产品类型除了传统的学术论文外,延伸产品也有很多重复和交叉。

比如万方的中外标准数据库与C N K I 的国家标准全文数据库、国内外标准题录数据库;2、资源差异化分析●CNKI的特色(大而全、工具书、年鉴)( 1 ) 工具书检索功能强大,涵盖范围广。

在工具书方面C N K I已经形成了另外两者无法比拟的优势。

成为能与其学术文献总库并驾齐驱的第二大主力产品。

C N K I 的工具书数据库跟其学术期刊总库一样,追求大而全,其工具书检索涵盖了汉语词典、双语词典、专科辞典百科全书、图录表谱、年鉴、标准、手册、语录、名录、医学图谱等,功能非常强大。

( 2 ) 资源综合性强,注重二次加工,提供增值服务。

( 3 ) 强大的整合能力。

纵观C N K I资源,其最值得称道的地方其实是对复杂资源强大的整合能力。

不管是哪种数据类型,C N K I 都进行了系统分类,层层细化,做到能分能总,系统有序。

●万方的特色(类型优势,尤其在医药与商务方面)( 1 ) 多元化发展,产品具有类型优势。

万方的产品类型优势很明显,中外专利、中外标准、科技成果新方志、法律法规、机构、科技名人等都是其重要的延伸产品,种类繁多。

( 2 ) 自有特色数据库。

万方自建的方志、科技视频、中国医学会期刊等数据库特色非常明显,这是另外两大数据库公司基本没有涉猎的,因此有一定的竞争力。

( 3 ) 服务企业的商务信息数据库。

与另外两大数据库比起来,万方一个很明显的特色就是有众多的服务企业的数据产品,如商务信息数据库,包括《中国企业、公司和产品数据库》、《国家新产品数据库》《百万商务通讯》、《中国高新技术企业》、《建材企业库》、《香港公司企业库》、《东南亚公司企业库》、《南韩公司企业库》、《综合经贸信息库》等。

关于古籍数字化的工作浅析

关于古籍数字化的工作浅析

关于古籍数字化的工作浅析作者:熊婷婷来源:《卷宗》2019年第20期摘要:古籍数字化是一种保护古籍的重要方法。

经过数年来的发展,从1983年的彭昆仑研制的“《红楼梦》检索系统”,到现如今的形形色色的数字资源库,甚至于立体数字化,不再局限于文本,种种迹象都表明,古籍数字化已经进入相对成熟的阶段。

但是对于个别图书馆而言,数字化的程度还相当之低,尤其需要予以重视。

关键词:古籍数字化;问题;建议众所周知,古籍数字化是一种保护古籍的重要方法。

经过数年来的发展,从1983年的彭昆仑研制的“《红楼梦》检索系统”,到现如今的形形色色的数字资源库,甚至于立体数字化,不再局限于文本,种种迹象都表明,古籍数字化已经进入相对成熟的阶段。

但是对于个别图书馆而言,数字化的程度还相当之低,尤其需要予以重视。

充分利用现有资源,丰富图书馆数字化资源,都将是必然的趋势。

1 全国古籍数字化的现状首先,从整体上讲,古籍数字化已经发展到较为成熟的阶段,基本上大部分的珍贵古籍都进行了数字化。

比如国家图书馆的中华古籍资源库,美国哈佛燕京古籍数字资源库(非我国,但资源已由国家图书馆引用),都是非常完善的古籍数字资源。

大部分图书馆也使用了这部分的数字资源库。

而有一些图书馆则是根据自己的馆藏特色进行了数字化,比如家谱的使用率高的图书馆,则是将家谱进行了数字化处理,便于公众的使用和查阅。

甚至于,浙江大学已经能够实现对实体文物的立体数字化,实现全真的数字化3D打印,基本能夠还原石窟、衣物、壁画、雕像等古代文物。

除了这些“科班”出身的图书馆,还有一些网站也分享了许多数字资源,具备强大的检索能力和使用能力,比如:国学大师网,瀚堂典藏等等。

其次,古籍的数字化与学术研究更加紧密。

除了影印古籍之外,更多的是服务于学术研究的系统。

比如潘悟云的广韵查询系统,全唐文全宋诗的检索系统,资治通鉴的检索系统等等。

有很多系统是免费开放的,也有一部分系统是需要收费的。

相较于早期开发的系统注重于查询于搜索文本内容,现今开发的系统更加智能,基本上能够实现数据的智能识别、语义联想、人物关系树等等。

《翰堂典藏》数据库实例解析

《翰堂典藏》数据库实例解析

《翰堂典藏》数据库实例解析正如传统文学作品一样,在21世纪的发展中,数据库也在改变着文学的发展方向。

早在1999年,“翰堂典藏”网站就诞生了,作为全球第一个用于收藏文学作品的专业知识库,它致力于把中国传统文学收藏在互联网上,不但实现了传统文学的新生,更是把传统文学向着网络文学的发展转移,更符合网络文学新时代的特点。

“翰堂典藏”是由中国科技信息研究所联合中国文学研究会设立的文学数据库,收录了大量中国传统文学的原文及其译文,涵盖了20世纪前的中国文化科学数据,同时也记录着文学作品的版本及其产生的历史、文学史等。

该数据库作为传统文学数据库,有着自己不同于其它数据库的特点,比如,它有更明确的分类和索引功能,可以把文学作品按照不同的类别,如作者、年代、类型等来进行检索,还可以收录一些传统语言文字,以便在数据库中检索出某个文学作品的全文内容。

从“翰堂典藏”的特点来看,其在传统文学的学术研究方面有着自己的重要性,可以作为文学材料的主要来源,可以有效帮助文学研究者快速查找出所需要的文学材料,使其在搜索的便捷性和准确性上受益匪浅。

同时,也可以方便普通读者阅读、学习传统文学作品,把文学作品转变为生动的数据,从而把传统文学进一步推向全球范围,帮助更多的文学作品被更多的人熟知,让传统文学更好地传承到后代。

因此,可以说“翰堂典藏”是作为一种十分有用的数据库,为中国传统文学提供了不可忽视的服务,它收集了众多传统文学作品,将他们转化为可用的数据,不但可以为文学研究者查找文学材料,也可以为普通读者提供更多的了解中国传统文化的资源。

未来,随着信息技术的发展,“翰堂典藏”可能会得到更多的发展,把更多的传统文学保存下来,把传统文学作品以及它们本身的历史轨迹转化为可以供研究者使用的数据库,以此来促进中国文学的发展,让更多的文学作品被更多的人所知晓,让传统文化得到更好的传承发展。

此外,也可以开发出基于“翰堂典藏”的智能文学检索系统,以便更好地满足更多人需求,让中国传统文学可以更加容易地远程阅读,让更多的文学作品被更多地被更多的人所熟悉。

中医药古籍的检索方法及其应用

中医药古籍的检索方法及其应用

中医药古籍的检索方法及其应用殷桂香【摘要】中医药古籍浩如烟海,正确、充分利用这些古籍对于中医药事业的传承和发展有着重要意义。

古籍的检索可通过字词典、书目、类书、专著及其他非医书资料等传统工具书,也可利用中医古籍数据库。

全面介绍了中医古籍检索的各类方法,并通过具体案例从古代医家资料、中医药专题资料及医史资料三方面介绍了不同中医药古籍检索方法的应用。

%The number of ancient books on traditional Chinese medicine is tremendous, it is thus of great impor-tance to make full use of them for the inheritance and development of the cause of traditional Chinese medicine. Ancient books on traditional Chinese medicine can be retrieved either by using of dictionaries, bibliographies, books arranged according to subjects, monographs, and other nonmedical materials or by using of databases of ancient books on traditional Chinese medicine. Different retrieval methods of ancient books on traditional Chinese medicine and their application were thus described in this paper.【期刊名称】《中华医学图书情报杂志》【年(卷),期】2017(026)002【总页数】4页(P75-78)【关键词】中医古籍;数据库;检索【作者】殷桂香【作者单位】上海中医药大学,上海 201203【正文语种】中文【中图分类】R2-5;G254.9根据《图书情报词典》的释义,古籍又称“古旧书”,即印刷或抄写的年代比较久远的图书。

《翰堂典藏》数据库实例解析

《翰堂典藏》数据库实例解析

《翰堂典藏》数据库实例解析《翰堂典藏》是一个针对中国数字文献的信息检索系统,于2018年首次发布,非常受欢迎。

它收集了数以万计的中国期刊、新闻报纸、专著以及图书,让使用者体验到更加便捷的检索服务。

翰堂典藏提供了多种搜索工具,可以根据标题、关键词、作者姓名等检索出数字文献资源。

此外,它还提供了许多高级检索功能,如搜索中文字词、词组搜索等,满足了使用者的多样需求。

除了搜索功能,《翰堂典藏》还支持文献下载、收藏、分享等功能,在搜索结果中,用户可以筛选出想看的文献资源,便于用户阅读、收藏和分享。

它还支持文献自动分类,结构化检索,可以按照关键词、科学分类、发表日期等多个维度进行检索,收录的资源丰富而准确,帮助用户快速索取相关文献资源。

此外,《翰堂典藏》还支持学术交流,用户可以发布评论、提问、主动对文章进行打分,以及发表文字见解和意见,以便更好的讨论研究问题。

《翰堂典藏》以其卓越的性能而受到许多学术研究者、收藏家和相关人士的欢迎。

它打破了传统的信息检索模式,实现了文献检索的数字化过程,提高了信息检索效率。

《翰堂典藏》也是国内首个实现大数据技术和机器学习技术在文献检索中的应用,大大降低了用户检索文献的成本。

《翰堂典藏》的发展为中国文学研究工作者提供了更为优质的文学研究环境。

它不仅改变了工作环境,也改变了学术研究者的学术思维,为学术研究者找到更多的学术和科研资源,让学术研究者的学术研究得到更大的支持。

因此,《翰堂典藏》受到越来越多的好评,为学术研究者注入了更多的灵感,促进了学术界的发展。

它给中国学术研究界带来了新的思路和活力,发挥了重要的作用,推动了中国文学、历史、经济等学科的发展。

《翰堂典藏》将成为中国文学研究的一个重要的变革力量,并为中国学术界的发展和发展创造有利的条件。

行业资料类数据库推荐助你快速获取行业信息

行业资料类数据库推荐助你快速获取行业信息

行业资料类数据库推荐助你快速获取行业信息在今天高速发展的信息化时代,获取准确且实时的行业信息对于企业和个人来说显得尤为重要。

市场的竞争日益激烈,行业发展变化迅速,因此,寻找一个能够提供专业、全面的行业资料的数据库成为必然选择。

本文将为大家推荐几款行业资料类数据库,帮助大家快速获取行业信息。

一、XXX数据库XXX数据库作为国内领先的行业资料数据库,提供了全面的行业分析报告、市场数据、统计数据以及行业研究等相关信息。

该数据库所收录的行业报告涵盖了国内外各行业的发展动态、市场前景和竞争格局等方面内容,帮助用户全面了解行业现状。

与此同时,XXX数据库还提供了详细的市场数据和统计数据,使用户可以直观地了解市场规模、市场份额、消费趋势等信息,为用户进行市场决策提供有力的支持。

二、YYY数据库YYY数据库是一家专业的行业资料提供商,致力于为用户提供精准的行业信息。

该数据库收录了包括行业分析报告、市场调研报告、公司研究报告在内的各类行业资料,为用户提供全面、具体的行业概况和市场状况。

同时,YYY数据库还提供了大量的行业统计数据和相关指标,帮助用户全面了解行业运营情况,以及进行市场预测和趋势分析,为企业决策提供科学依据。

三、ZZZ数据库ZZZ数据库是一家全球知名的行业资料类数据库,收录了全球范围内各行业的相关资料和信息。

该数据库不仅提供了行业报告、市场调研报告等常规资料,还提供了大量的行业数据和市场数据,用户可根据自身需求进行深度挖掘和分析。

ZZZ数据库还提供了行业动态、市场趋势等实时更新的资讯,确保用户能够及时了解行业最新动态。

四、AAA数据库AAA数据库是一家多领域行业资料数据库,拥有庞大的全球行业数据库资源。

该数据库提供了全面的行业资料和报告,用户可以轻松获取到各类行业的市场情报、竞争分析和趋势预测等信息。

不仅如此,AAA数据库还提供了行业专题研究和专家观点,帮助用户深化对行业的理解和洞察。

综上所述,以上所推荐的行业资料类数据库都拥有强大的信息资源和专业的行业分析报告。

瀚堂典藏资料库检索范例

瀚堂典藏资料库检索范例

案例三:高级检索在专题研究中的应用
总结词
高级检索功能强大,适用于专题研究中对特定条件和 要求的筛选。
详细描述
高级检索允许用户根据多个条件进行筛选,如时间范 围、作者、主题等。用户可以根据自己的需求设置多 个条件,以获取更加精准的检索结果。例如,用户可 以选择“2018年至2022年”、“作者为张三”等条 件进行检索,以获取更加符合自己需求的学术资源。
对于筛选和排序结果不满意的情况,用户可以尝试调整筛选和排序条件,或者使用不同的关键词和布 尔逻辑运算符重新进行检索。
问题三:如何利用相关推荐和相似文献?
瀚堂典藏资料库提供了相关推荐和相似文献功能,帮助用户 发现更多相关资料。相关推荐是根据用户检索的关键词和文 献内容,推荐与之相关的文献;相似文献则是根据文献之间 的相似性,推荐相似主题的文献。
瀚堂典藏资料库检索范例
目录
• 瀚堂典藏资料库概述 • 瀚堂典藏资料库检索方式 • 瀚堂典藏资料库检索技巧 • 瀚堂典藏资料库检索案例 • 瀚堂典藏资料库检索常见问题及解决方案
01 瀚堂典藏 献资源的数字化图书馆,旨在为用户 提供高效、便捷的文献检索和获取服 务。
03
XXXX年,瀚堂典藏资料库开始提供在线检索和获取服务,用户可以 通过互联网随时随地访问该平台。
04
近年来,瀚堂典藏资料库不断推出新的服务模式和技术应用,如移动 端服务、智能推荐等,以更好地满足用户需求。
02 瀚堂典藏资料库检索方式
关键词检索
总结词
简单、快速
详细描述
用户输入关键词,系统通过匹配关键词的方式检索相关资料。关键词检索是一种最常用的检索方式,适用于大多 数情况。
合理使用逻辑运算符(如AND、OR、NOT)组合关 键词,提高检索的准确性和全面性。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

爱如生数据库与翰堂典藏数据库的对比
一.简介
爱如生数据库:
爱如生数据库包括中国方志库,中国谱牒库,中国丛书库,中国类书库,中国俗文库,中国经典库,敦煌文献库,申报数据库以及《中国基本古籍库》。

各据善本,采用爱如生独有的数字再造技术制作,还原式页面,左图右文逐页对照,眉批、夹注、图表无障碍显示;毫秒级全文检索,可编辑、下载和打印。

其中,中国基本古籍库——由四个子库构成: 哲学库、史地库、文艺库、综合库,共20 大类,收录自先秦至民国历代典籍1 万种,17万卷,版本12500 个、20 万卷,全文17 亿字、影像1200万页,数据总量约320G。

翰堂典藏:
《翰堂典藏》古籍数据库是由北京时代瀚堂科技有限公司推出的核心产品,其采用基于Unicode 四字节编码和自然语言全文检索的典籍文献数字化构建。

《瀚堂典藏》古籍数据库由14 个子库构成: 小学工具、类书集成、出土文献、中医药文献、经部集成、史部集成、子部集成、集部集成、古典戏曲、古本小说、佛教典籍、道教典籍、敦煌文献、专题文献。

《瀚堂典藏》加工入库的图书自先秦至民国,从甲骨文到近代文献约有10190 种,图片数量约1200 万张,文字总量超过15 亿字,可全文检索和连续图文对照阅读的记录条目1500 万条以上,并持续定期增加中。

二.收录内容及标准
《中国基本古籍库》所收历代典籍及所附重要版本,均经严格筛选。

1.收书标准: 历代名著,各学科基本文献,有拾遗补阙意义的特殊著作;
2.选本标准: 完本而非残本、现存最早之本或晚出精刻精钞精校本;未经删削窜改之本。

《瀚堂典藏》
1.收书标准: ⑴加工小学工具类,包括古代字书、韵书等瀚堂具有加工和管理优势的图书。

这类图书是《瀚堂典藏》全库的基础;⑵由于瀚堂典藏可以依据用户的要求安排加工种类和进度,也可根据用户的科研要求调整入库品种。

2.选本标准: 尽量多收集不同版本的图书,力争收录所有公开影印出版的唐五代写本和宋元珍本。

三.检索方式
《中国基本古籍库》提供4 条检索路径,并提供模糊匹配:
1.分类检索,通过库、类、目的树形结构进行定向检索;
2.条目检索,限定书名、时代、作者、版本、篇目等条件进行目标检索;
3.全文检索,输入任意字、词或字符串进行爬梳检索;
4.高级检索,可以进行多次检索,或组合字词进行逻辑检索,或综合
选项进行关联检索,可以保存最近一次检索结果。

基本古籍库的二次检索与一般数据库的二次检索稍有不同,并不是将检索结果进行二次检索,而是将第一次检索的词与多次检索词进行组合检索。

《瀚堂典藏》的检索限定词包括全文、出处、标题、书目,有三种检索模式:
1.绝对精准模式,不对检索条件启动任何转换处理,完全按照输入词条进行检索;
2.精准模式,启动简繁体和常用异体字自动转换;
3.模糊模式,启动人工智能分词检索功能和简繁体、异体字自动转换。

在检索过程中,可以在左侧“书目树”中选择库、类、书目录,以缩小检索范围,并且可以二次检索、跨库检索,也可以选择某本书进行内容检索。

如果注册个人用户,可以保存10 次的检索式,方便读者使用。

相同:
虽然两个数据库的检索界面不同,但是检索方式基本相似,都能够对检索词进行智能模糊匹配,检索的准确率及相关率也是很高的
四.使用比较
《中国基本古籍库》
1.使用时要求必须下载安装客户端,因此可以使用一些个性化的工具,但是安装客户端比较麻烦,查看内容的时候是全屏显示,使用者要做其他操作时会略有不便
2.在使用细节方面,《中国基本古籍库》可以繁体字与简体字进行转换,这种转换虽然符合现代人的识字习惯,但是繁简要自由转换,暂时没有技术手段保证不出现错误。

3.可以将查看内容与图书原版的图像进行对比,这样就可以减少错误,同时也可以通过图书的原版图像查看到一些无法识别的字。

4.该库还自带常用字典,可查询所收录典籍中常用字的发音和释义
5.中国基本古籍库》还可以改变背景颜色、增加列线、将文字从竖排改变成横排,并且可以对原文增加标点批注以及书签,可自动收藏并分类管理以前查阅的信息,方便归纳研究。

《瀚堂典藏》
1.采用浏览器/服务器模式,对系统及浏览器无特殊要求和限定,使用时不需要安装客户端及特殊浏览器,直接使用IE 浏览器查看,比较方便。

2.可以将内容与原版进行对比查看,正文为了适应当代人的阅读习惯自动排版为横排,每周对数据更新校勘,因此差错率非常低,能控制在1 /10000 以内。

3.在查看全文的时候,自动将原版书图像与内容对照。

并且该数据库利用Unicode 四字节编码技术基本解决了生僻汉字在计算机平台上
无法录入、显示、编辑的难题,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,因此只要使用时安装宋体-扩展字符集,就可以查看到所有的生冷僻汉字,极大地方便了使用者。

这一点是其他古籍数据库无法办到的。

在原文文献下载方面
相同:《中国基本古籍库》和《瀚堂典藏》都可以检索后找到相应文献,并对其进行选择下载。

两个数据库可能是考虑到古籍资源的数据保护,所以分别对复制内容和查看内容都有所限制,对于需要下载较大内容读者来讲可能有些不方便
不同:《中国基本古籍库》每次最多只能复制200字。

《瀚堂典藏》则是开放自检索信息点上下共7 页与原版图片对照连续的文字,可以直接复制。

图片则可以查看检索信息点上下13 页的内容。

对于常用品种的古籍,开放章节内的全部内容,可以图文对照连续浏览并且复制,这些图书,在目录树中显示为绿色封皮。

五.不足
《中国基本古籍库》在查看出处方面略显不足,虽然已经在不断改进中,在6.0 版能在检索到的条目页面下显示出处,并在复制文本时提供出处复制,但也只有书名和卷数,使用者还得通过翻检补充朝代、作者、篇名、版本等信息。

另外该库在内容方面将原书序跋删去,而这些内容对使用者的研究会有很大帮助,这一不足很让人遗憾。

《瀚堂典藏》可以说是一个不断建构中的数据库资源,该库的整体架构已初步成型,部分库,如小学工具库,也已经成形较大的优势,由于古籍加工与整理具有很高的难度,其中生僻字的数字化普遍认为是难以克服的障碍。

相关文档
最新文档