数据库种类及其特点
浅析国内引文数据库的种类及特点

浅析国内引文数据库的种类及特点(全文)作者:吕润宏(漯河医学高等专科学校图书馆河南462002)摘要本文主要对我国目前引文数据库的种类进行简单的介绍和分析。
关键词引文数据库分析引文索引不同于一般概念上的索引,而是通过文献之间的引证关系去揭示科学文献之间(包括学科之间) 的内在联系。
从这种引证关系上,不但可以看出某一学科或领域的研究动态和发展趋势,而且可以看出这一学科或领域的核心作者群、高影响力作者和论文,还可以根据某一学术概念、某一方法、某一理论的出现时间、出现频次、衰减情况等,分析出学科或领域研究的走向和规律。
那么国内引文数据库到底有哪些?他们各自有何特点呢?对此,我们作一简要介绍,以歹食读者。
1《中国科学引文数据库》( CSCD )该库创建于1989 年,由中国科学院文献情报中心与中国学术期刊( 光盘版) 电子杂志社联合建设,并由清华同方光盘电子出版社正式出版。
该数据库收入我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术、环境科学和管理科学等领域出版的中英文科技核心期刊和优秀期刊近千种,其中核心库来源期刊670种,扩展库期刊为378 种,已积累从1989 年到现在的论文记录近100 万条,引文记录近400万条,内容丰富、结构科学、数据准确。
系统除具备一般的检索功能外,还提供新型的索引关系——引文索引。
使用该功能,用户可迅速从数百万条引文中查询到某篇科技文献被引用的详细情况,还可以从一篇早期的重要文献或著者姓名入手,检索到一批近期发表的相关文献,对交叉学科和新学科的发展研究具有十分重要的参考价值。
中国科学引文数据库除提供文献检索功能外,其派生出来的中国科学计量指标数据库等产品,也成为我国科学文献计量和引文分析研究的强大工具。
另外《中国科学引文数据库》网络版从2002年开始研制,与中国科学学科文献库、中国科学文献目次库集成为“中国科学文献数据库服务系统”提供统一服务。
中国科学引文数据库网络版提供两种途径的检索:来源文献检索和引文检索。
第一章_数据库系统概述

2.模式/内模式映象
模式/内模式映象定义了数据全局逻辑 结构与存储结构之间的对应关系。例如, 说明逻辑记录和字段在内部是如何表示 的
数据库中模式/内模式映象是唯一的
该映象定义通常包含在模式描述中
模式/内模式映象的用途
保证数据的物理独立性
当数据库的存储结构改变了(例如选用了另 一种存储结构),数据库管理员修改模式/ 内模式映象,使模式保持不变
1、信息(information)
定义:关于现实世界事物的存在方式或 运动状态反映的综合。
特点:
客观存在 可以感知 可存储、加工、传递和再生
2、数据(Data)
数据(Data)是数据库中存储的基本对 象
数据的定义
描述事物的符号记录
数据的种类
文字、图形、图像、声音
认 识 抽
象
把概念模型转换为某一 DBMS支持的数据模型
信息世界 机器世界
数据模型(续)
客观对象的抽象过程---两步抽象
现实世界中的客观对象抽象为概念模型;
把概念模型转换为某一DBMS支持的数据模型。
概念模型是现实世界到机器世界的一个中间层 次。
数据模型(续)
数据模型分成两个不同的层次 (1) 概念模型 也称信息模型,它是按用户的观点来 对数据和信息建模。 (2) 数据模型 主要包括网状模型、层次模型、关系 模型等,它是按计算机系统的观点对数据建模。
例:实体-“明星” (950231,刘德华,Andy,香港,27-9-1961,
天秤座,牛,174 cm, 68 kg,AB)
(4) 主键(Key)
唯一标识实体的属性集称为码,又称主键,或 关键字。
(5) 联系(Relationship)
数据库的介绍和类型

数据库的介绍和类型⼀、什么是数据库?简单的说,数据库(英⽂Dtabase)就是⼀个存放数据的仓库,这个仓库是按照⼀定的数据结构(数据结构是指数据的组织形式或数据之间的联系)来组织、存储的、我们可以通过数据库提供的多种⽅法来管理数据库⾥的数据更简单的形象理解,数据库和我们⽣活中存放杂物的仓库性质⼀样,区别只是存放的东西不同。
⼆、数据库的种类有哪些?早期⽐较流⾏的数据库模型有三种,分别为:层次式数据库、⽹络式数据库和关系型数据库。
⽽在当今的互联⽹中,最常⽤的数据库模型主要是两种,即关系型数据库和⾮关系型数据库。
1.关系型数据库介绍(1)关系型数据库由来⽹络数据库和层次数据库很好地解决了数据的集中和共享问题,但是在数据独⽴性和抽象级别上仍有很⼤⽋缺。
⽤户对这两种数据库进⾏存取时,依然需要明确数据的存储结构,⽀出存储路径。
⽽关系数据库就可以较好地解决这些问题(2)关系型数据库介绍 关系型数据库模型是把复杂的数据结构归结为简单的⼆元关系(即⼆维表格形式)。
Oracle 在数据库领域⾥上升到了霸主地位,形成每年⾼达数百亿美元的庞⼤市场,⽽MySQL也是不容忽视的数据库,以⾄于被Oracle重⾦收购MySQL 互联⽹市场 ———— Oracle 传统企业2.⾮关系型数据库的介绍 (1) ⾮关系型数据库诞⽣背景 ⾮关系型数据库也被成为NoSQL数据库,NOSQL的本意是“Not Olnly SQL” 。
指的是⾮关系型数据库,⽽不是“No SQL”的意思,因此,NoSQL的产⽣并不是要彻底地否定⾮关系型数据库,⽽是作为传统关系型数据库的⼀个有效补充。
NOSQL数据库在特定的场景下可以发挥出难以想象的⾼效率和⾼性能。
(2) 随着互联⽹Web2.0⽹站的星期,传统的关系型数据库在应付web2,0⽹站,特别是对于规模⽇益扩⼤的海量数据,超⼤规模和⾼并发的微博、微信、SNS类型的web2.0纯动态⽹站已经显得⼒不从⼼,暴露了很多难以克服的问题。
数据库模型:分析数据库模型的种类、特点和设计

数据库模型是数据库设计中的核心要素之一,它定义了数据库中数据的组织和结构。
不同的数据库模型适用于不同的应用场景,并具有各自的特点和设计原则。
在本文中,我将介绍数据库模型的种类、特点和设计方法,帮助读者更好地理解和应用数据库模型。
介绍什么是数据库模型数据库模型是对数据库中数据组织和结构的一种抽象表示。
它描述了数据库中的实体、关系、属性之间的对应关系,以及对数据进行存储、检索、修改和删除等操作的规则和约束。
数据库模型是数据库实际设计的基础,决定了数据的可靠性、稳定性和高效性。
数据库模型的重要性数据库模型对数据库的性能、扩展性和易用性有着重要影响。
一个好的数据库模型能够更好地满足应用的需求,提高数据的存储效率和操作效率,同时降低数据冗余和数据不一致性的风险。
因此,选择合适的数据库模型对于数据库设计来说非常重要。
数据库模型的分类数据库模型可以分为以下几种主要类型:层次模型、网状模型、关系模型、面向对象模型、文档模型和键值模型。
接下来,我们分别对这些模型进行详细介绍。
层次模型层次模型是数据库模型的一种最早的形式,它将数据组织成一个树状结构。
层次模型中的数据以父子关系进行组织,每个节点可以有多个子节点,但只能有一个父节点。
这种模型适用于嵌套关系比较简单的数据,例如组织机构、家族关系等。
层次模型的特点是简单直观,易于理解和操作,但对数据的表示能力有一定的限制。
网状模型网状模型是数据库模型的另一种较早期的形式,它将数据组织成一个图状结构。
网状模型中的数据以节点和边的形式表示,节点表示实体,边表示实体之间的关系。
不同于层次模型中只能有一个父节点的限制,网状模型中的节点可以有多个父节点和多个子节点。
这种模型适用于表示复杂的数据关系,例如供应链管理、电力系统等。
网状模型的特点是较好地解决了层次模型的限制,但对于数据操作的复杂性增加了一定的挑战。
关系模型关系模型是当前应用最广泛的数据库模型,它将数据以二维表的形式进行组织。
数据库复习基本知识

数据库复习基本知识1、数据库的4个基本概念:数据(描述事物的符号记录)、数据库(长期存储在计算机内、有组织的、可共享的大量数据的集合。
数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享概括的讲,数据库数据具有永久存储、有组织和可共享三个基本特点)、数据管理系统(DBMS)和数据库系统(DBS)2、数据库系统的特点:数据结构化(数据库系统实现整体数据的结构化,这是数据库的主要特征这一,也是数据库系统与文件系统的本质区别)、数据的共享性高、冗余度低且易扩充(数据共享可以大大减少数据冗余,节约存储空间,数据共享还能够避免数据之间的不相容性与不一致性)、数据的独立性高(物理独立性和逻辑独立性)、数据由数据库管理系统统一管理和控制(必须具备的4各控制功能1、数据的安全性保护2、数据的完整性检查3、并发控制4、数据库恢复)3、数据库的定义:数据库是长期存储在计算机内有组织、大量、共享的数据集合。
它可以提供各种用户共享,具有最小冗余度和较高的数据独立性。
数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
4、两大数据模型:1、概念模型(也称信息模型,主要用于数据库设计)2、数据模型(包括逻辑模型和物理模型逻辑模型主要用于数据库管理系统的实现)数据模型应满足三方面的要求:1、能比较真实的模拟现实世界2、容易为人所理解3、便于在计算机上实现<5、概念模型:它是按用户的观点来对数据和信息建模,主要用于数据库设计,从现实世界到概念模型的转换是由数据库设计人员完成的。
6、数据模型:它是对现实世界数据特征的抽象。
是用来描述数据、组织数据和对数据进行操作的。
数据模型是数据库系统的核心和基础。
包括逻辑模型(主要包括层次模型、网状模型、关系模型等。
它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现)和物理模型(对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方方法是面向计算机系统的)从概念模型到逻辑模型的转换可以有数据可设计人员完成,也可以用数据可设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要由数据库管理系统完成。
常见数据库种类及介绍

常见数据库种类及介绍常见的数据库种类包括关系型数据库、面向对象数据库、NoSQL数据库、分布式数据库等。
下面将对每种数据库进行详细介绍。
1.关系型数据库关系型数据库采用表和表之间的关系来存储数据。
它具有数据结构清晰、查询灵活、数据一致性保证等特点。
最常见的关系型数据库有MySQL、Oracle、SQL Server等。
关系型数据库适用于有明确结构和相对稳定的数据,适用于需要事务处理、复杂查询和数据关系维护的场景。
2.面向对象数据库面向对象数据库是一种以对象为中心的数据库管理系统,它将对象直接存储在数据库中,能够以对象为单位进行存储、检索和管理。
面向对象数据库适用于对象导向的编程环境,并且能够方便地存储和查询对象的相关信息。
3.NoSQL数据库NoSQL数据库(Not Only SQL)是一种给予非关系型数据库的统称。
NoSQL数据库通常采用非关系型的存储模型,如键值对、文档、列族和图等,以满足大规模数据的存储和处理需求。
常见的NoSQL数据库包括MongoDB、Cassandra、Redis等。
NoSQL数据库适用于对数据的读写频率很高、数据规模很大和扩展性要求较高的场景。
4.分布式数据库分布式数据库是将数据分布在多个计算机节点上,并且在节点之间进行数据的共享和协调管理。
分布式数据库能够提供更高的数据可用性、扩展性和容错性。
常见的分布式数据库有HBase、Bigtable、Cassandra等。
分布式数据库适用于需要处理海量数据和高并发访问的场景。
5.内存数据库内存数据库是将数据存储在计算机内存中,以提供更快的数据访问速度。
内存数据库适用于对读写性能要求较高的应用场景,如高速缓存、实时分析等。
常见的内存数据库有Redis、Memcached等。
6.图数据库图数据库是一种以图数据结构存储和查询数据的数据库系统。
图数据库适用于存储有复杂关系的数据,如社交网络关系、地理信息等。
常见的图数据库包括Neo4j、FlockDB等。
SCI、EI等各类数据库简介

EI:美国工程索引(The Engineering Index)收录文献几乎涉及工程技术各个领域。
例如:动力、电工、电子、自动控制、矿冶、金属工艺、机械制造、土建、水利等。
它具有综合性强、资料来源广、地理覆盖面广、报道量大、报道质量高、权威性强等特点。
旗下有两个数据库,核心数据库EI Compendex 和非核心数据库EI Page One。
目前,高校和科研机构多认可核心数据库。
SCI:《科学引文索引》(Science Citation Index)是由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理化学、农业、生物、兽医学、工程技术等方面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种,也是我国高校和科研机构认可度最高的检索类别。
SSCI:Social Sciences Citation Index为社会科学引文索引(Social Sciences Citation Index),为SCI 的姊妹篇,亦由美国科学信息研究所创建,是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。
1999年SSCI全文收录1809种世界最重要的社会科学期刊,内容覆盖包括人类学、法律、经济、历史、地理、心理学等55个领域。
收录文献类型包括:研究论文,书评,专题讨论,社论,人物自传,书信等。
选择收录(Selectively Covered)期刊为1300多种。
CA:美国《化学文摘》(Chemical Abstracts)1907年创刊,由美国化学会所属化学文摘服务社(CAS)编辑出版, 现为世界上收录化学化工及其相关学科文献最全面,应用最广泛的一种文献检索工具。
属于专业性很强的特色型检索种类。
CSCD:《中国科学引文数据库。
(Chinese Science Citation Database)创建于1989年,1999年起作为中国科学文献计量评价系列数据库之A辑,由中国科学院文献情报中心与中国学术期刊(光盘版)电子杂志社联合主办,并由清华同方光盘电子出版社正式出版。
国内三大中文文献数据库收录与检索方法特点和差异

国内三大中文文献数据库系统:维普、万方、中国期刊网(或称:中国知网、CNKI)都有期刊全文库,但各具特色:(1)从收录量和收录期刊起始年限上看目前,维普在收录期刊
种类和收录全文数量,以及收录期刊的起始年限上都是三者中最多和最早的一个。
CNKI正
回溯1994年以前期刊论文。
万方则注重核心期刊的收集,能收齐每期刊中的每篇文章,维
普和中国期刊网尚未做到这点。
(2)从检索功能上看维普既有菜单式傻瓜检索界面,又
有指令检索界面,适用于不同使用者。
尤其是他的指令检索界面,使用起来十分方便。
如使
用“*”代表“and”,使用“+”代表“or”。
CNKI也有菜单式和指令检索界面,其菜单式检索界面
与另外两者相比是做得最好的,加入了并列概念的选项。
CMKI和维普期刊资源整合服务平
台最有特色的是支持全文、引文和基金检索;工具书、知识元搜索;论文引证查询与分析,
万方没提供这些功能。
(3)从文献收录范围看三大中文数据库系统除提供期刊全文库外,各自还有很多核心或特色数据库,如:中国知网的优秀博硕士论文库、引文数据库、工具书、年鉴、报纸、科技报告数据库等。
万方的企业产品库、学位论文全文库、会议论文全文库、
中文电子图书库等。
另,中国期刊网和万方数据库为自然、社会科学综合性文献库,维普
期刊网则为自然学科文献库系统。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大型数据库
一、Microsoft SQL Server
适用于入门者。
1、开放性:只能在windows上运行,没有开放性,操作系统的系统的稳定对数
据库是十分重要的,Windows9X系列产品是偏重于桌面应用。
2、伸缩性:并行实施和共存模型并不成熟,很难处理日益增多的用户数和数据
卷,伸缩性有限。
3、安全性:没有获得任何安全证书。
4、性能:多用户时性能不佳
5、客户端支持及应用模式:C/S结构,只支持windows客户,可以用ADO、DAO、
OLEDB、ODBC连接
6、操作性:操作简单,但只有图形界面。
7、使用风险:完全重写的代码,经历了长期的测试,不断延迟,许多功能需要
时间来证明。
并不十分兼容。
二、Oracle
强大的功能和可配置、可管理能力。
1、开放性:能在所有主流平台上运行(包括 windows)。
完全支持所有的工业
标准。
采用完全开放策略。
可以使客户选择最适合的解决方案。
对开发商全力支持。
2、伸缩性与并行性:并行服务器通过使一组结点共享同一簇中的工作来扩展
windows NT的能力,提供高可用性和高伸缩性的簇的解决方案。
如果windows NT不能满足需要,用户可以把数据库移到UNIX中。
Oracle的并行服务器对各种UNIX平台的集群机制都有着相当高的集成度。
3、安全性:获得最高认证级别的ISO标准认证。
4、性能:性能最高,保持开放平台下的TPC-D和TPC-C的世界记录。
5、客户端支持及应用模式:多层次网络计算,支持多种工业标准,可以用ODBC、
JDBC、OCI等网络客户连接。
6、操作性:较复杂,同时提供GUI和命令行,在windows NT和unix下操作相
同。
7、使用风险:长时间的开发经验,完全向下兼容。
得到广泛的应用。
完全没有
风险。
三、IBM UDB/DB2
不管是小型商业系统,还是大的银行系统,用DB2都是可以高枕无忧的。
最近推出的新版DB2 6.1,管理和调节工具更加卓越和便于使用。
DB2 可以运行在Intel架构上,也可以运行在IBM的S/390大型计算机上。
如果你所在的行业对IBM的机器特别地称道,建议你学习IBM DB2。
1、开放性:能在所有主流平台上运行(包括windows)。
最适于海量数据。
DB2
在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。
2、伸缩性与并行性:具有很好的并行性。
DB2把数据库管理扩充到了并行的、多
节点的环境。
数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。
数据库分区有时被称为节点安全性。
3、安全性:获得最高认证级别的ISO标准认证。
4、性能:性能较高适用于数据仓库和在线事物处理。
5、客户端支持及应用模式:跨平台,多层结构,支持ODBC、JDBC等客户。
6、操作性:操作简单,同时提供GUI和命令行,在windowsNT和unix下操作相同。
7、使用风险:在巨型企业得到广泛的应用,向下兼容性好。
风险小。
四、以Java为中心的数据库-Sybase Adaptive Server Enterprise(ASE) 12.0 持多个CPU和更多的并发。
1、开放性:能在所有主流平台上运行(包括 windows)。
但由于早期Sybase
与OS集成度不高,因此VERSION11.9.2以下版本需要较多OS和DB级补丁。
在多平台的混合环境中,会有一定问题。
2、伸缩性与并行性:虽然有DB SWITCH来支持其并行服务器,但DB SWITCH在
技术层面还未成熟,且只支持版本12.5以上的ASE SERVER。
DB SWITCH技术
需要一台服务器充当SWITCH,从而在硬件上带来一些麻烦。
3、安全性:获得最高认证级别的ISO标准认证。
4、性能:性能接近于SQL Server,但在UNIX平台下的并发性要优与 SQL Server。
5、客户端支持及应用模式:C/S结构,可以用ODBC、Jconnect、Ct-library等
网络客户连接。
6、操作性:较复杂,同时提供GUI和命令行。
但GUI较差,常常无法及时状态,
建议使用命令行。
7、使用风险:向下兼容, 但是ct-library 程序不益移植。
小型数据库
Access
1、完善地管理各种数据库对象,具有强大的数据组织、用户管理、安全检查等
功能。
2、强大的数据处理功能,在一个工作组级别的网络环境中,使用Access开发
的多用户数据库管理系统具有传统的XBASE(DBASE、FoxBASE的统称)数据库系统所无法实现的客户服务器(Cient/Server)结构和相应的数据库安全机制,Access具备了许多先进的大型数据库管理系统所具备的特征,如事务处理/出错回滚能力等。
3、可以方便地生成各种数据对象,利用存储的数据建立窗体和报表,可视性好。
4、作为Office套件的一部分,可以与Office集成,实现无缝连接。
5、能够利用Web检索和发布数据,实现与Internet的连接。
Access主要适用于中小型应用系统,或作为客户机/服务器系统中的客户端数据库。
MySQL
MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。
MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。
MySQL 软件采用了双授权政策,它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL 作为网站数据库。