统一检索元数据仓储
数据仓库元数据管理

数据仓库元数据管理数据仓库元数据管理是指对数据仓库中的元数据进行管理和维护的过程。
元数据是描述数据的数据,它提供了关于数据的定义、结构、属性、关系以及数据的来源和用途等信息。
数据仓库中的元数据包括数据表、字段、索引、视图、存储过程等对象的描述信息,以及数据质量、数据血统、数据变化等相关信息。
数据仓库元数据管理的目标是保证数据仓库中的元数据准确、完整、一致和可靠。
通过对元数据的管理,可以提高数据仓库的可维护性、可扩展性和可重用性,进而提高数据仓库的价值和效用。
数据仓库元数据管理的主要任务包括元数据收集、元数据存储、元数据维护和元数据使用等。
1. 元数据收集:- 根据数据仓库的设计和需求,收集相关的元数据信息。
- 可以通过手工录入、自动抽取、数据字典等方式进行元数据的收集。
- 收集的元数据包括数据表、字段、索引、视图、存储过程等对象的描述信息,以及数据质量、数据血统、数据变化等相关信息。
2. 元数据存储:- 将收集到的元数据存储到元数据仓库中,以便后续的管理和使用。
- 元数据仓库可以使用关系型数据库、NoSQL数据库、文件系统等进行存储。
- 存储的元数据需要按照一定的结构进行组织和管理,以方便后续的检索和使用。
3. 元数据维护:- 对元数据进行定期的维护和更新,以保证其准确、完整、一致和可靠。
- 可以通过手工维护、自动抽取、数据字典同步等方式进行元数据的维护。
- 维护的内容包括元数据的新增、修改、删除等操作,以及元数据的版本管理和权限管理等。
4. 元数据使用:- 利用元数据提供的信息,支持数据仓库的各项管理和运维工作。
- 可以通过元数据进行数据质量管理、数据血统分析、数据变化跟踪等工作。
- 元数据还可以支持数据仓库的数据集成、数据查询、数据分析等应用。
数据仓库元数据管理的实施需要借助相应的工具和技术。
常用的工具包括元数据管理工具、数据建模工具、数据字典工具等。
常用的技术包括数据抽取、数据转换、数据加载(ETL)技术、数据建模技术、数据质量管理技术等。
超星发现在学术研究中的多层次应用

33万机构库
8万同义词表
3500条学科分 类表
20万刊名表
700个数据库 来源收录表
2500万学术专 业词库
重要索引库
基本检索功能
完善的高级检索和专业检索支持精准发现
1、类似于搜索引擎的自动完成功能。在一键式检索框输入检索词时,自动提示与检索词相关度最 高的词汇或者是用户的历史检索词汇
2、自动检索与检索词相关的词和与检索词同名的期刊或报纸。支持同义词、学名与俗称、简称与 全称的全覆盖检索。
• 对检索结果进行了 有效组织与揭示, 如相关度排序、分 面导航和结果精炼 以及相关资源推荐, 帮助用户发现最合 适的资源
国内主要的发现系统
超星发现系统:
• 以数十亿海量元数据记录 为基础,对复杂的异构数 据库群进行集成整合,可 以完成高效、精准的学术 资源检索,在此基础上通 过引文分析、知识关联分 析、分面聚类等功能为读 者提供具备完善的知识挖 掘与分析功能的发现系统。
检索关键词“食盐”:同时检索了“氯化钠”
检索“风心病”:同时检索了“风湿性心脏病”
检索“信息管理”:同时检索了同名期刊
词谱图:可以根据查询词展示该词语的上位词、下位词、同义词、兄弟词、相关词。
3、自动识别关键词和机构名称。在超星发现系统中可以将检索关键词和作者机构名称用空格分开, 直接进行检索,发现系统会对检索关键词相近的同义词和该机构的旧称进行组合检索
• 趋势图可以选择10、30、50年代展示,同时都可以进行数据的导出,方便用户使用。
怎样找到某研究中的高影响力学者或机构?
1)知识点关联图 查询词所关联的学科与领域,了解关系密切的相关领域,进行科研选题。
展示知识关联
2)作者关联图 可以查看作者与作者之间关联、领域与作者之间关联、机构与作者之间关联等。
中国高等教育文献保障系统

“十一五”建设面临的形势(一)
• 现状和趋势
– 数字资源日益丰富 – 资源异构性与无序化趋势增大 – 易失的原生数字资源 – 数图技术与服务理念发展迅猛 – Web2.0、Library 2.0
• 作为国家战略之一,各国都在构建国家 级资源存档体系,以此来提高整个国家 数字图书馆服务水平和长期有效性。
中国高等教育文献保障系统 (CALIS)
“十五”回顾与 “十一五”建设思路
CALIS管理中心 2007年9月27日
CALIS已投资规模
• “九五”:
– 1998年底—2001年7月 – 6200万元
• “十五”:
– 2003年底—2006年8月 – 8000万元
“九五”建设主要内容
• 纸本文献资源共享体系
联合目录
导航库
员馆馆藏
网上免费资源
CADLIS应用平台
CADLIS门户
文献检索
结算
调度
权
限
认
证
下载 文摘 引文
参
考
咨
文献传递
询
高校数字馆藏
高校纸本馆藏
三级服务架构
CADLIS门户 元数据联合仓储检索
OAI 元数据
收割
学位论文中心门户
OAI 元数据
文摘索引数据库
电子期刊数据库
电子图书和 事实型数据库
集团使用量
2003年 2004年
2005年
10,377,771 14,420,125 27,089,889
合计 51,887,785
43,222,315 51,743,226 68,210,638 163,176,179
1,575,820 23,976,688 25,552,508
国内三大中文发现系统比较分析及评价

国内三大中文发现系统比较分析及评价赵功群;王恒【摘要】从元数据资源整合、检索功能、数据挖掘服务、全文获取途径等几个方面,对中国知网学术搜索、超星发现系统、百度学术搜索三大中文发现系统的发现功能进行实证比较分析.通过数据比对,认为超星发现系统无论在资源整合还是数据挖掘等方面都具有明显的优势,其他的知识发现系统需要进一步的完善和优化,以提高知识发现系统的整体水平.【期刊名称】《图书馆研究》【年(卷),期】2016(046)006【总页数】6页(P72-77)【关键词】知识发现;超星发现系统;中国知网学术搜索;百度学术搜索【作者】赵功群;王恒【作者单位】徐州工程学院图书馆,江苏徐州221008;徐州工程学院图书馆,江苏徐州221008【正文语种】中文【中图分类】G252大数据给图书馆带来丰富资源的同时也带来了数据冗余和信息孤岛效应。
为应对大数据带来的问题,图书馆积极探索数字资源整合的途径和方法,但整合的结果较差。
近年来,数据服务提供商与图书馆合作开发知识发现系统,为用户提供一个实现各类学术资源发现与获取的一站式解决方案,以提升用户利用资源的有效性与友好性。
知识发现系统是在日益增长的海量数字资源基础之上建立的,其宗旨在于打破以往的书刊目录、文献索引和部分文献全文利用的局限,为用户提供具有完善、高效的知识挖掘与数据分析功能的知识发现系统,从而实现从资源发现到知识发现的转变[1]。
知识发现系统内建海量数据的元数据仓,整合各种图书馆资源,包括内部的、外部的、纸质的、电子的、自有的、许可的以及可自由获取的数据源,使用统一标引的数据格式,提供简单、单一的检索入口,通常是类似Google的“一框式”搜索,通过检索预先设定的元数据仓来快速返回结果,通过链接解析器链接到全文,提供分面和高级检索功能,在用户体验层面全面超越了联邦检索[2]。
目前,国内比较有代表性的知识发现系统主要有超星知识发现系统、中国知网学术搜索、百度学术搜索。
北华大学数字图书馆

北华大学数字图书馆解决方案北京万方数据股份有限公司2010/7/5目录1.概述 (5)2.需求分析 (5)2.1.资源整合 (5)2.2.学术搜索 (7)2.3.信息门户 (8)3.功能设计方案 (8)3.1.资源的前端导航 (8)3.2.统一资源检索 (9)3.2.1.简单检索 (9)3.2.2.高级检索 (9)3.2.3.二次检索 (10)3.2.4.原文资源调度 (10)3.3.知识挖掘与评价 (11)3.3.1.知识关联挖掘 (12)3.3.2.知识脉络分析 (12)3.3.3.趋势对比分析 (13)3.3.4.学者分析 (14)3.4.个性化图书馆 (16)3.4.1.个人图书馆 (16)3.4.2.机构图书馆 (19)3.5.1.机构对比分析 (21)3.5.2.人物对比分析 (22)3.5.3.机构整体分析 (22)3.5.4.项目成果分析 (23)4.后台管理 (24)4.1.特色资源加工和管理子系统 (24)4.1.1.资源数据化加工工具 (24)4.1.2.互联网信息采集工具 (24)4.1.3.文档信息采集工具 (25)4.1.4.关系型数据库转换工具 (25)4.1.5.其他格式信息转换工具 (25)4.1.6.数据库支持 (25)4.1.7.应用支持 (27)4.2.平台管理系统 (29)4.2.1.站点管理 (29)4.2.2.用户管理 (30)4.2.3.内容管理 (31)4.2.4.服务管理 (33)4.2.5.统计分析 (35)5.成功案例介绍 (37)5.1.国家工程图书馆 (37)5.3.同济大学 (40)5.4.广西科技文献共享服务平台 (40)1.概述图书馆一直以来都是科研单位和高校的文献信息中心,是学校教学与科研的重要组成部分;而图书馆的资源建设水平和信息化服务能力是衡量科研单位综合实力的标志之一。
现代化信息网络技术迅猛发展的今天,文献载体形式日益多样化,给传统图书馆注入了新的内容,数字图书馆给科研人员提供了一种在更大范围内方便获取信息的手段。
浅谈超星平台使用与改进

浅谈超星平台使用与改进第一篇:浅谈超星平台使用与改进浅谈超星平台使用与改进前言图书馆是获取知识、自主学习的最佳场所。
随着科技的发展,图书馆不是以往人们脑海里的样子。
读者可以通过超星数字图书馆在寻找书目上省去很多时间,可以毫不费力的读到自己喜欢的书,甚至可以获得更多在表面上没有的信息。
数字图书馆是数字化生存时代的重要文化基础设施。
一场图书馆的数字化变革正在进行,它将改写信息时代人们的文化生活版图。
利用超星平台能有效的获取需要的信息,提供方便快捷的检索方法,检索结果能通过文献传递的方法到达读者眼前。
传统意义上的图书馆往往坐落于文化中心,这使得偏远地区的人们想要享受图书馆的便利就不容易实现。
即使是能够方便的使用图书馆,实体图书馆的资源也往往有限,想借的书可能被人借走了。
再者,偌大的图书馆里想要找一本书也非常困难。
上述的这些困难时读者在求知过程中常常遇到的,使用超星平台,这些问题都能迎刃而解。
超星数字图书馆是一座名副其实的知识宝库,超星平台包括FULink、读秀、超星发现、超星移动图书馆。
许多珍贵的档案文献资料都可以在鼠标点动的瞬间出现在读者的眼前,除了纸质书,借助超星平台的丰富功能,读者足不出户就能读到想要的书。
1超星平台的使用 1.1 FULink平台我们常说的FULink平台是指“福州地区大学城文献信息资源共享平台”,其建设是在福建省教育厅组织领导下推进的福州地区大学新校区教学资源共建共享的一个项目。
该项目由福州大学、福建师范大学、福建农林大学、福建医科大学、福建中医药大学、福建工程学院、福建江夏学院、闽江学院等8所高校和厦门大学共同参与建设。
以文献信息的联合保障体系建设和资源共享为主要任务,整合各馆资源、发挥联合优势,为大学城共享域内的广大师生提供校际间的文献提供、文献传递、馆际互借、联合借阅等高水平便捷的信息资源“一站式”服务。
“福州地区大学城文献信息资源共享平台”中心设立在福州大学图书馆,是一个配备齐全,硬件设施强硬的图书馆。
信息资源整合与统一检索平台设计与实现

信息资源整合与统一检索平台设计与实现作者:安艳茹来源:《科技创新导报》 2014年第36期安艳茹(中航飞机西安飞机分公司陕西西安 710089)摘要:随着计算机技术、网络技术以及存储技术的飞速发展,公司的信息资源也在日益增加,众多种类的信息资源都是以一种零散的、孤立的状态存在着,相互之间缺乏联系。
针对公司目前多数IT 系统的信息资源管理分散,数据资源难于被访问和共享,服务只具备简单数据查询且资源定位能力薄弱的现状,对现有信息服务模式进行了分析,提出了基于信息资源整合和统一搜索模型,实现资源的跨库检索、统一显示和二次检索等功能来解决目前公司数据检索中遇到的种种困难。
关键词:信息服务资源整合统一搜索信息资源中图分类号:G25 文献标识码:A 文章编号:1674-098X(2014)12(c)-0242-01公司经过多年的信息化建设、创新造就了大批类型多样化、分布异构化的应用系统,这些应用系统的信息资源管理分散、共享困难,形成彼此隔离的信息孤岛。
如何集成、组织和管理众多应用系统的数字资源,统一各个资源的信息格式,屏蔽分布的各系统间的差别,为用户提供快速并发的跨库检索服务,是公司信息化建设亟待解决的问题。
1 设计思路目前公司内部已经形成了多个业务系统,包括OA系统、ERP系统、PDM系统、MES系统等,各业务系统之间在应用或数据等层面上是彼此分离的,它们分别采用了不同的数据库系统以及使用了不同的应用开发技术,各系统的业务逻辑不同且在建设上没有遵循统一的标准。
因此,首先要实现信息整合,需要灵活高效地从各个应用系统中抽取数据,填充数据,并使之与应用系统同步,完成其数据集成,其中采用的重要技术是ETL,即数据的抽取、转换和加载可以在数据集成的过程中保证数据的一致、解决数据冲突、进行有效的元数据管理等一系列问题。
其次建立统一检索平台,对不同应用系统数据源的整合,实现跨平台的无缝链接,用户只需一个检索指令,在一个统一的界面上一次查询所需信息,将不同类型、不同结构、不同环境、不同用法的各类数据库纳入统一检索系统,使用户能方便、高效地获取所需信息。
基于元数据的重庆地区电子文献资源整合研究

所 、民办 l 5 所) 、军校 3 所 、成人 高校 5 所 。本 次调查 共 统计 出 4 l 所高校 图书馆数字 资源建设情况 ,占所调查 数量
的6 o %。本 文对 4 3所公 共 图书 馆电子 文献资 源进行调查 , 共调查 出 2 9 所公共 图书馆 。所 占比例为 6 7 %。同时本文调 查了9 3 所 医院 ,其 中三 甲 医院 2 2个 ,三 乙医院 2个 ,二
u n i v e r s i y t l i b r a r y i s he t mo s t i n r e s o u l ' c _ , e 8 ,g r o s s ,a v e r a g e p o s s e s s i o n. S o he t i n t e g r a i t o n a n d s h m  ̄s o f l "  ̄ : l f o l l r c s e i s i mp e r a i t v e ,
1 重庆 地 区 电子 文献 资源 整体 现状
01 2 2年 8月 ,本 文对 重庆 6 7 所高校 图书馆 电子 文献资
源进行调查 。6 7 所 高校 的构成 为本 科院校 2 2所 ( 公办 1 5
1 . 1 资 源的不平衡 性
第一, 重庆地 区行业 间资源不 平衡 ,重庆 地 区高校 图
t a w a r e h o u s e t o r e li a z e t h e u n i i f e d a c c e 8 8 t o ̄ u I ' c e s ,8 0 a s t o a c h i e v e t h e p u o f i n t e g r a i t o n .
元数据仓储 的 “ 一站式”检索 ,实现对资源的统一访 问,从 而达到整合 目的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
资源统一检索入口
可添加各类 资源库
统一检索结果
高级检索 二次检索
资源的分类 按照主题聚类
相关检索
按照时间聚类
统一检索-展示
收藏、评论
借阅关系图
详细的资源介绍
相关资源
借阅统计图
手机二维码技术
统一检索-统计分析
时间段统计 资源访问情况
资源综合使用情况
字段定义
资源统一检索系统
•资源整合与维护 •统一检索 •个性化设置 •统计分析 •接口集成
资源统一检索功能模块
• 统一检索系统
统一检索系统:是以海量资源的整合检索为核心,以用户高质量、高效率获 取信息为目的,以统一的资源选择方式、统一的检索方式、统一的结果显示 方式为用户提供服务。
• 主要特点
基于核心元数据的整合 支持简单与复合检索 支持分布式检索资源 高效的检索调度 灵活的管理配置
金盘数字化图书馆管理平台 ➢元数据仓储管理系统 ➢统一检索平台系统
产品演示
市场部 王宇
演示产品
图书馆门户统一认
➢元数据仓储管理系统 证
➢资源统一检索平台系统
资源统一检索数据采集来自元数据仓储管理系统架构
元数据池
图书馆的各类 资源
元数据仓储管理系统——数据管理
资源分类管理
元数据添加删 除管理
元数据仓储管理系统——字段定义