非结构化数据仓储系统在图书馆视频库建设中的应用
图书馆数字化资源存储与管理技术应用

图书馆数字化资源存储与管理技术应用在当今信息技术高速发展的时代,图书馆数字化资源存储与管理技术应用已经成为图书馆发展的重要方向之一。
数字化资源的存储与管理既关系到图书馆数字化建设的效率和质量,也关系到读者信息获取的便捷程度和用户体验的提升。
本文将就图书馆数字化资源存储与管理技术应用展开论述。
一、数字化资源的存储数字化资源的存储是数字化图书馆建设的基础工作之一,也是整个数字图书馆系统的核心环节。
图书馆数字化资源的存储方式多种多样,常见的有以下几种:1. 数字化资源的本地存储:通过硬盘、服务器等设备,将数字化资源存储在图书馆内部网络中。
这种方式的优点是存取速度快、成本相对较低,同时能够满足图书馆内部资源共享的需求。
但是,这种存储方式容量有限,不适合大规模的数字资源存储。
2. 云存储技术:云存储技术是近年来兴起的一种存储方式,图书馆可以将数字化资源存储在云服务器上,通过网络进行存取。
云存储技术具有成本低、容量大、数据安全性高等优点,同时也能够实现资源的远程共享和协作。
对于容量要求较大的图书馆来说,选择云存储技术是一个不错的选择。
3. 分布式存储技术:分布式存储技术是将数字化资源分散存储在多个节点上,通过网络进行统一管理和存取。
该方式可以有效提高存储容量和存取速度,同时还能够提高系统的可靠性和容错性。
在数字化资源存储量大、访问量高的图书馆中,采用分布式存储技术是一个较为理想的选择。
二、数字化资源的管理数字化资源的管理是确保数字化资源的有效利用和长久保存的关键环节。
数字化资源的管理主要包括以下几个方面:1. 元数据管理:元数据是对数字化资源进行描述和组织的重要工具,通过对数字资源进行清晰的描述和分类,可以提高资源检索的效率和准确性。
图书馆需要建立完善的元数据体系,对数字化资源进行统一的管理和组织。
2. 数字版权管理:在数字化资源存储与管理过程中,数字版权管理是一个不可忽视的问题。
图书馆需要遵守相关的版权法律法规,建立合理的数字版权管理机制,确保数字化资源的合法使用和长期保存。
非结构化数据存储解决方案

非结构化数据存储解决方案一、背景介绍随着信息技术的快速发展,大量的非结构化数据(Unstructured Data)被不断地产生和积累,如文本、图像、音频、视频等。
这些非结构化数据的特点是数据格式不规范、数据量大、数据类型多样,传统的关系型数据库无法有效存储和管理这些数据。
因此,需要一种高效的非结构化数据存储解决方案,以满足对非结构化数据的存储、检索和分析需求。
二、解决方案概述我们提出了一种基于分布式存储和大数据技术的非结构化数据存储解决方案。
该解决方案采用分布式文件系统和分布式数据库相结合的方式,实现对非结构化数据的高效存储、检索和分析。
1. 分布式文件系统采用分布式文件系统作为底层存储层,如Hadoop分布式文件系统(HDFS)。
HDFS具有高可靠性、高可扩展性和高吞吐量的特点,能够满足大规模非结构化数据的存储需求。
2. 分布式数据库采用分布式数据库作为上层数据管理层,如HBase。
HBase是一个分布式、可扩展、面向列的NoSQL数据库,能够实现对非结构化数据的高效存储和检索。
三、解决方案的关键技术1. 数据分片对于大规模非结构化数据,采用数据分片的方式进行存储。
将数据划分为多个小块,并分散存储在不同的节点上,以实现数据的分布式存储和负载均衡。
2. 数据索引建立适当的索引结构,以提高数据的检索效率。
对于文本数据,可以采用倒排索引等技术,对关键词进行索引;对于图像、音频、视频等数据,可以采用特征提取和相似度计算等技术,进行内容检索。
3. 数据压缩对非结构化数据进行压缩,以减少存储空间和提高数据传输效率。
采用压缩算法对数据进行压缩,并在需要使用数据时进行解压缩。
4. 数据备份和容错采用数据备份和容错机制,确保数据的可靠性和高可用性。
通过数据备份,将数据存储在多个节点上,以防止节点故障导致数据丢失;通过容错机制,对节点故障进行监测和处理,以保证系统的稳定性。
四、解决方案的优势和应用场景1. 优势(1)高效存储:采用分布式存储和压缩技术,大幅减少存储空间,提高存储效率。
图书馆数字化资源存储与管理技术应用

图书馆数字化资源存储与管理技术应用随着信息技术的迅速发展,数字化资源已经成为图书馆收藏与管理的重要组成部分。
本文将探讨图书馆数字化资源存储与管理技术的应用,以分析其对图书馆服务和用户体验的影响。
一、数字化资源存储技术数字化资源的存储是图书馆数字化建设的基础,其有效的存储技术能够保证数字化资源的安全性和可靠性。
常见的数字化资源存储技术包括云存储和数据库技术。
(1)云存储技术云存储技术允许图书馆将数字化资源存储在云端服务器中,并通过网络进行管理和访问。
云存储具有容量大、可扩展性强和备份恢复方便等特点,大大提高了数字化资源的可持续保存和共享。
(2)数据库技术数据库技术是数字化资源存储的核心技术之一,通过建立数据库系统对数字化资源进行高效的管理和检索。
数据库技术的应用可以提供多样化的检索方式,方便用户快速准确地获取所需的数字资源。
二、数字化资源管理技术数字化资源管理技术主要包括数字资源的整理分类、元数据标注和版权管理等方面,以确保数字资源的有序管理和有效利用。
(1)数字资源的整理分类数字化资源的整理分类是数字化资源管理的首要任务。
通过对数字资源进行分类整理,可以使数字化馆藏有机结构化,提高资源的组织和利用效率。
(2)元数据标注元数据标注是数字化资源管理的重要环节,它用于描述和记录数字资源的相关信息。
通过元数据标注,用户可以快速准确地查找到所需资源,从而提高图书馆服务的效率。
(3)版权管理数字化资源管理中不可忽视的一部分是版权管理。
图书馆需要合法获取和使用数字资源,并对用户使用数字资源的行为进行监控和管理,以确保遵守版权法律并保护知识产权。
三、数字化资源管理技术的应用数字化资源管理技术的应用为图书馆服务和用户体验带来了诸多优势。
(1)提升图书馆服务品质通过数字化资源存储与管理技术的应用,图书馆可以实现数字资源的高效存储、准确检索和方便共享,提升了服务的质量和效率。
用户可以在任何时间、任何地点访问所需的数字资源,满足了个性化学习和研究的需求。
智能化系统在新建图书馆建筑中的应用

智能化系统在新建图书馆建筑中的应用作者:李德军来源:《现代装饰·理论》2012年第04期摘要:智能化建筑的兴起极大地促进图书馆建筑的发展,智能化设计也成为图书馆建筑的发展趋势。
图书馆建设中实施建筑智能化系统,旨在利用现代计算机技术、控制技术、通讯技术与各种机电设备的有机结合,提高建筑物运行、管理、安保和信息服务等方面的自动化程度,在为读者和工作人员提供安全、高效、舒适、便利的工作环境的同时,实现节约能耗、降低人工成本、提高管理效率的目的。
关键词:智能化,图书馆建筑,应用1.问题的提出信息时代,图书馆作为一个主要的信息资源服务公众场所,用传统的方式来实现其信息服务的职能,强化内部管理,显然已不能满足广大读者的需要,更不能适应信息社会乃至知识经济时代的发展。
由此,图书馆智能化的实施势在必行。
与其他智能建筑基本一致的,也应该具有:通信自动化系统,即CAS;建筑设备自动化系统,即BAS;比较完善的办公自动化系统,即OAS。
所以也经常把智能建筑称为3A建筑。
这三个系统都有各自独立的主控设备和网络,又有大型计算机和高速数据网络将其有机地集成在一起,通过组织、协调,不仅实现了三者各自的功能,而且发挥了三者的群体功能,这样的建筑,才是智能建筑。
2.图书馆建筑智能化的要求2.1 实施原则图书馆建筑智能化系统设计要求整体优化,既要满足功能要求,又能充分发挥各种设备的功能和作用。
系统设计要求遵循的原则有:实用性、开放性、先进性、成熟性、可靠性、可扩充性、经济性、)可管理性和便于操作性。
2.2 建设要求工程中应注意的几点是:(1)图书馆方面要与专业公司充分交流,签订供货和施工合同前的深化设计;(2)划分工程界面,特别是与被控设备的界面;(3)对信息技术产品更新换代快要有所考虑;(4)关于综合布线,这是智能建筑的重要组成部分,直接关系到图书馆智能化水平的程度。
结构化综合布线以其标准化、模块化、兼容性、先进性和灵活性的优点在图书馆建设中得到实践与运用。
非结构化数据存储解决方案

非结构化数据存储解决方案引言概述:随着信息技术的快速发展,非结构化数据的产生量不断增加,如文本、图像、音频和视频等。
这些数据不适合传统的关系型数据库管理系统进行存储和管理,因此需要寻找一种解决方案来有效地存储和处理非结构化数据。
正文内容:1. 存储介质的选择1.1 云存储云存储是一种将数据存储在云端服务器上的解决方案。
它具有高可扩展性、高可靠性和低成本的特点,能够满足非结构化数据存储的需求。
云存储提供了多种存储介质的选择,如对象存储、文件存储和块存储,可以根据不同的需求选择合适的存储介质。
1.2 分布式文件系统分布式文件系统是一种将文件分布在多个节点上的文件系统。
它通过将文件切分为多个块,并存储在不同的节点上,实现了数据的分布式存储和管理。
分布式文件系统具有高可靠性、高性能和高扩展性的特点,能够有效地存储和管理非结构化数据。
2. 数据索引和检索2.1 全文索引全文索引是一种将文本内容进行索引和检索的技术。
它通过对文本进行分词和建立倒排索引,实现了对非结构化数据的高效检索。
全文索引可以根据关键词进行检索,支持模糊查询和高级检索,能够快速定位到所需的数据。
2.2 图像识别图像识别是一种通过计算机视觉技术对图像进行分析和识别的技术。
它可以将图像中的特征提取出来,并与已知的特征进行匹配,实现对图像的分类和检索。
图像识别可以应用于图像搜索、图像标注和图像推荐等场景,能够方便地管理和检索大量的图像数据。
2.3 音频识别音频识别是一种通过声音信号处理技术对音频进行分析和识别的技术。
它可以将音频中的声音特征提取出来,并与已知的声音特征进行匹配,实现对音频的分类和检索。
音频识别可以应用于语音识别、音乐推荐和声纹识别等场景,能够方便地管理和检索大量的音频数据。
3. 数据备份和恢复3.1 冗余存储冗余存储是一种通过复制数据来提高数据的可靠性和可用性的技术。
它将数据存储在多个节点上,并定期进行数据同步,当某个节点发生故障时,可以通过其他节点上的备份数据进行恢复。
非结构化数据存储解决方案

非结构化数据存储解决方案一、背景介绍随着信息技术的快速发展,大数据成为了当今社会的热门话题。
大数据的产生和应用,给传统的数据存储和处理方式带来了巨大的挑战。
而非结构化数据的存储和管理,更是成为了一个迫切需要解决的问题。
本文将介绍一种非结构化数据存储解决方案,旨在帮助企业高效地存储和管理非结构化数据。
二、问题描述在传统的数据存储和管理方式中,结构化数据(如关系型数据库中的表格数据)可以被轻松地存储和查询。
然而,非结构化数据(如文本、图片、音频、视频等)的存储和管理却相对困难。
非结构化数据的特点是数据量大、格式复杂、内容多样,传统的存储方式无法很好地支持非结构化数据的存储和查询需求。
因此,需要一种专门的解决方案来存储和管理非结构化数据。
三、解决方案介绍1. 数据存储为了高效地存储非结构化数据,我们可以采用分布式存储系统。
分布式存储系统将数据分散存储在多个节点上,提高了数据的可靠性和可扩展性。
同时,分布式存储系统还可以通过数据冗余和数据备份来保证数据的安全性。
常用的分布式存储系统包括Hadoop HDFS、Ceph等。
2. 数据索引为了方便查询非结构化数据,我们需要建立相应的数据索引。
数据索引可以根据数据的特征和属性,对数据进行分类和组织。
常用的数据索引技术包括倒排索引、哈希索引、B树索引等。
通过数据索引,可以快速地定位和检索非结构化数据。
3. 数据处理非结构化数据的处理包括数据清洗、数据转换和数据分析等步骤。
数据清洗可以去除非结构化数据中的噪声和冗余信息,提高数据的质量。
数据转换可以将非结构化数据转化为结构化数据,方便后续的数据分析和挖掘。
数据分析可以通过统计和机器学习等方法,从非结构化数据中提取有用的信息和知识。
四、解决方案的优势1. 高效性:采用分布式存储系统,可以提高数据的读写性能,满足大规模非结构化数据的存储需求。
2. 可扩展性:分布式存储系统可以根据数据量的增长,动态地扩展存储容量,满足企业的业务发展需求。
非结构化数据库在视频检索中的应用研究

2 0 1 2 年 7月 1 9日中国互联 网络信息 中心 ( C N N I C ) 发布《 第3 0 次 中国互联网络发展状 况统计 报告 》 研究 发现 . 截至2 0 1 2年 6 月底 中国 网民数量达到 5 . 3 8 亿 … 与之相应地伴随 网络技术及应用技术的飞速 发展 . 目前互联 网用户群多集 中于使用 蕴含着海量级信息 的多媒 体数 据、 流媒 体数据 等。 由于视频数据等被广泛使用的非结构化数据 , 并 不 能用传 统二维 表所表示 的。如何有效地管理 、 利用好如此庞大信 息量 的视频 数据 已成 为一 个亟待解决 的问题 据相关统计资料表 明 . 目前 2 0 %左 有的信息有效地存 储在各种 类型的结构 化数据库 中 .但还 有 8 0 %左右 的非结构化信息分散在整个业 务过程及外部环境 中 因此 在经 历了层次型数据库 、网状型数据库 和关系型数据 库的演化发 展 后. 基于互联网的非结构化数 据库将会成 为数据库发展 的重点 、 热 点
wi t h d a t a wa r e h o u s e b a s e d o n t h e u n s t uc r t u r e d — d a t a b a s e . T h e un s t uc r t u r e d— Da t a b a s e wi l l b e a b l e t o u s e muc h mo r e ie f l d s .
1 非 结 构 化 数 据 库 研 究 及 应 用 现 状
1 . 1 研 究 现 状
1 . 2 . 2 基于 内容管理进行非结构化数据库管理 内容 管理 ( C o n t e n t M a n a g e m e n t ) 被认为是 数据管理 发展新 方 向 . 与传统关系型数据库的表单不 同.内容管理的基于数据 自 身 内容 . 通 过语义计算技术使计算机 自 动学 习理解各段信息之间联系 . 进 而执行 复杂分析操作 . 以此实现检索应用和管理非结构化数据 此种技 术在 处理复杂数据上优势无可 比拟 , 特别是针对全文信息 、 非结构化信 息 、 多媒体信息和海量信息等 。 目前应 用最为广泛的非结构化信息处理技 术是 A u t o n o m v 公 司的分析软件 . 其 核心技 术源于香农信息论 与贝叶 斯概率理论 的巧妙结合 . 实现 了对 非结构化数 据信息 ( 文 本文件或基 于语音 、 视频 的) 实际内容的基本 理解 , 并实现 管理 、 应用 和处理过程 自动化 . 以使用户能够全面了解隐藏的信息价值并对其及时做 出反应 和决策 . 从而加强对所有信息的利用 , 提高业务的价值。1 4 ]
非结构化数据存储解决方案

非结构化数据存储解决方案一、背景介绍随着信息技术的快速发展和互联网的普及,大量的非结构化数据被产生和积累,如文本、图片、音频、视频等。
这些非结构化数据的存储和管理对于企业和组织来说是一个重要的挑战。
本文将介绍一种非结构化数据存储解决方案,帮助企业和组织高效地存储和管理非结构化数据。
二、解决方案概述该非结构化数据存储解决方案基于云计算和大数据技术,采用分布式存储架构,能够实现数据的高可用性、高可扩展性和高性能。
该解决方案包括以下几个关键组件:1. 数据采集与提取:通过各种方式采集非结构化数据,如网络爬虫、传感器、移动设备等。
然后对采集到的数据进行提取和处理,将其转化为结构化数据。
2. 数据存储与管理:采用分布式文件系统和对象存储技术,将非结构化数据存储在云端。
通过数据分片和冗余备份,确保数据的可靠性和可用性。
同时,提供数据的元数据管理和索引功能,方便用户进行数据的检索和查询。
3. 数据处理与分析:通过大数据处理平台,对非结构化数据进行分析和挖掘。
利用机器学习和自然语言处理等技术,提取数据中的有用信息和知识。
同时,支持实时数据处理和批量数据处理,满足不同场景下的需求。
4. 数据安全与隐私保护:采用数据加密和访问控制技术,保护非结构化数据的安全性和隐私性。
同时,遵守相关的法律法规和隐私政策,确保数据的合规性和合法性。
三、解决方案的优势该非结构化数据存储解决方案具有以下几个优势:1. 高可用性:采用分布式存储和冗余备份机制,确保数据的高可用性。
即使某个节点发生故障,也不会影响数据的访问和使用。
2. 高可扩展性:采用分布式存储架构,支持横向扩展,可以根据实际需求动态扩展存储容量和计算资源。
3. 高性能:采用并行计算和分布式处理技术,提高数据处理和分析的效率。
同时,利用缓存和预取技术,加快数据的访问速度。
4. 灵活性:支持多种数据格式和数据源,适应不同类型和规模的非结构化数据。
同时,提供灵活的数据模型和查询语言,方便用户进行数据的操作和分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非结构化数据仓储系统在图书馆视频库建设中的应用非结构化的视频资源在建设及管理中存在诸多问题,通过对非结构化数据库的概念的阐述及对建库问题的剖析,概述了非结构化数据仓储系统建设的思路,分析了系统的特点和在视频库中的应用优势。
标签:非结构化数据数据仓储视频库资源加工高校图书馆现受数据库、搜索引擎、MOOC网站等各类资源提供商的空间挤压,使得图书馆在资源提供、信息服务上开始被读者逐步远离,工作上愈发被动,这些均促使图书馆在资源建设上必须走特色化道路,必须进一步进行资源整合。
目前很多高校馆也都在建立的各自的特色数据库,各类本地特色化视频、媒体资源,因其具备的直观、可视化优势,而备受青睐,但在视频库建设中,因涉及资源加工的环节较多,管理、建设难度较大,也给各馆的项目建设带来诸多不便,本文将通过DATATOM的DATRIX非结构仓储系统在图书馆视频库建设中的应用,对视频库的建设和管理提出新的思路。
一、“非结构化数据库”的概念结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、标准通用标记语言下的子集XML、HTML、各类报表、图像和音频/视频信息等等。
非结构化数据库主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势。
[1]二、现状及存在的问题在目前的高校教学中,除了有极少的结构化数据库系统外,还有大量的非结构化数据存在,这种非结构化数据主要是视频、图片和文档。
这种非结构化数据随着富媒体的应用场景越来越多,数据量急剧增加需要专门的处理能力来解决。
当前的现状是,除了有相应规范的电子图书管理之外,其他的非结构化数据均没有很好的管理方式,例如学生的影视作品、图画、照片、教师的各种课件和成果,时间的积累将导致这些数据越来越多,越来越难以查找,利用,对这些珍贵的资料有必要建立一套灵活的管理机制。
同时,如读者在图书馆网站的书评,读者在图书馆网站的浏览行为,甚至利用摄像头或者读者智能借阅卡跟踪读者在图书馆的行走和停留路线,从中产生的分析读者使用图书馆的状况数据。
像这样的非结构化数据,将比图书馆的结构化数据增长得更快[2],图书馆应改变原有的管理、建设方式。
以往的做法是采用数据库对不同的数据建立相应的应用系统进行管理,数据混和管理一般使用BLOB类型字段存储,主流的Oracle、MySQL、SQLServer 等关系数据库表都支持BLOB二进制字段,但这种方案在一定数据量范围内可行,当数据量扩大到一定程度后很多问题就出现了,主要如下:1.数据库的数据量的膨胀,带来检索性能的急剧下降;2.无法对非结构化数据进行有效的检索;3.数据安全度不高,一旦数据库出现故障,数据很难恢复;4.处理节点难扩展;5.存取性能低下(关系数据库都是按行存储,不适合非结构化数据这种不定长数据),并发性能不高;6.存储空间难扩展。
非结构化数据類型、容量越来越大的历史数据资源、流程越来越复杂的数据流转、性能要求越来越高的数据处理能力、越来越严格的数据访问机制,这些都形成了对用户非结构化的数据管理的巨大挑战。
如果无法更好地解决这些挑战,那么用户的数据管理将越来越被动,甚至会影响到整个业务系统的效率。
三、建设思路目前的数字图书馆系统架构几乎没有采用非关系型数据库作为其数据存储处理方式,但是有许多应用场景单纯利用现有的关系型数据库存储方式并不足以应对,因此需要提出新的架构设计方案[3]。
建立一个体系化的非结构化数据资源仓库,用户可以将所有非结构化数据(如:视频、图片、音频和任意文件类型的非结构化数据)放入仓库中进行统一的管理,一旦利用该平台进行数据管理,就类似在用户的IT环境中建立了一个大型的非结构化数据的仓库,配备简单、易用、听话的“智能机器人”来进行数据的全面管理,用户只需要不断的从应用系统中生产数据,由平台来智能化的管理、调度、记录数据,进一步合理规划IT架构。
通过非结构仓储系统就可以为用户实现数据自动化的收集、数据高效的处理、数据的智能分类、数据的安全存放、数据的多维展示、数据的权限访问、数据的行为监测和数据的挖掘分析。
所有资料库可以根据设定的规则进行数据描述,在权限许可的条件下,教师和学生可以根据任意数据描述字段进行检索、预览和下载这些非结构化数据。
非结构化数据仓储系统建设分为三个步骤:1.利用先进的技术手段建设适合非结构化数据管理的平台(软硬件一体)。
2.制定不同资料库的管理要求和标准。
3.收集录入非结构化数据(图片、音频、视频、文档和其他类型数据)并按照制定好的标准要求进行元数据信息的录入。
四、非结构化数据仓储系统的特点1.大容量在提供RAID级别数据保护后,可用容量不低于50TB,同时应支持更大容量的扩展能力。
2.高性能通过存储硬件需提供不少于400MB的对外读写带宽,以确保大并发访问的支持。
3.高安全平台必须建立在Linux或Unix平台之上,确保系统的稳定可靠;系统中无数据库,防止出现数据库崩溃导致数据描述信息的丢失;存储硬件方面应提供冗余电源、冗余风扇等硬件保护机制,并支持磁盘自动预警。
4.易维护4.1平台采用Web管理方式,没有客户端即可实现全部功能4.2采用一体化设计理念,软硬件结合,将存储、数据管理和系统设置集成在一个设备内,保证整个系统平台在性能、自动化程度、对现有应用的影响、管理和可扩展性上保持一致,避免因为系统匹配产生的问题。
5.兼容性强5.1提供Rest API、C#、C++等开放接口,未来可支持二次开发,接入其他应用系统。
5.2多文档格式支持。
支持ac3、asf、avi、flv、mk、mov、rm、rmvb、swf、wmv等视频格式预览,支持doc、docx、ppt、pptx、xls、xlsx、pdf 等多种文档预览。
6.管理便捷6.1实现非结构化数据的数据存储、数据安全、数据迁移、数据分享、数据转码、数据分类、数据查找和数据分析。
6.2系统提供内部的视频自动化转码,无需单独配置转码服务器。
6.3系统可设定文件的相应权限,至少可按照私有、公开及部分用户区分。
6.4系统支持文件类型数据的全文检索,编目信息采用文件系统的元数据结构保存。
6.5对文件数据的描述支持自动编目、自定义编目和编目模板等多种描述方式,其中编目模板可以根据需要设定字段。
6.6系统提供虚拟目录数据展现形式,可根据设定的编目项目自由组合目录结构。
6.7检索可根据任意元数據信息查询,并可添加多个编目信息进行模糊查询。
6.8平台支持非结构化数据上传后的审核,只有审核通过数据才能进入平台检索。
6.9平台支持数据收集器方式的自动上传,可过滤不需要的数据类型,自带标签。
五、非结构化数据仓储系统的在视频库建设中的应用优势1.实现资源一体化加工为视频资源提供的教师、学生审核开放用户管理、配额、权限等所有功能,并划分一部分空间,用户可将素材上传到该空间,系统会自动进行低码流的转码工作,用户只需要进行相应的编目及配套的审核工作,素材就进入了媒资库,供图书馆管理人员审核发布。
将在在线编、媒资、发布的空间全部整合到一个平台,统一实现数据安全,统一实现数据权限,统一实现流程管理。
视频数据在在线编、媒资和发布之间的交互无需通过网络,而是在内部进行数据的迁移或复制,同时,通过Web这一交互方式,就可以完成存储管理、资源加工和资源管理三大应用所有功能,大大减轻了使用的复杂度,大大提高了效率。
2.实现高效的知识管理充分利用DATRIX平台对于数据内容的管理,可以自动的将各个点收集到的数据(文本、视频、图片、音频及其他文件类数据)汇总到一个平台下统一管理。
系统将自动对相关的内容、描述信息进行,并且在内部按照各种线索组织数据。
用户可以通过各种终端访问这些收集整理的数据,可直接在Web上进行预览,来确定是否是自己所需要的数据。
数据可以通过资源树、虚拟目录、高级检索、时空化展示来找到,并且基于权限来进行预览及下载。
通过这样一个DATRIX平台的建设,用户可以将分散在各个点的非结构化数据汇总起来,并且实现内容的挖掘,将数据转化为知识分享给每个成员。
3.实现重要数据收集及长期管理所有视音频、照片图片、文档都可以单独通过WEB进行上传,也可以利用资料集的功能将相应的资料打包上传。
上传后,除了系统的自动标签外,还可以通过人工对这些资料进行无限插值的标签,以便于查找。
系统对于视频文件将自动的抓取关键帧并转低码供预览,对于文档则会进行全文索引的建立。
在DATRIX上的所有数据都可以基于权限非常方便的查找、预览、下载等各种操作,可以采用各种方式将这些数据进行展示。
4.实现数据行为审核在DATRIX平台里,所有的数据行为都会有日志予以记录,这种记录将详细到用户、应用、来源和行为类型等多项内容,按照时间轴的方式来组织每个数据独立的行为记录,可以随时按照单个数据进行审核。
同时,整个平台的审核时基于内容挖掘的,这种基于内容的行为审计,可以快速定位到相应的数据再检查其合规性,避免了大量非结构化数据的无序性为我们的审核工作带来的挑战。
图书情报工作随着知识形态的改变,为实现其职业愿景和社会职能,一直在进行着调整和突破,数字技术使知识内容进一步突破了载体的限制,进一步细粒度化和网络化,一方面向“全网域”化发展,另一方面变成了“大数据”。
这两个趋势交汇,更需要图书情报等专门机构提供更加专业的服务,更体现出图书情报机构的价值和优势[4]。
面对特色化资源建设与服务的迫切需求,面对大数据建设的纷繁无序、视频库建设的复杂性,非结构数据仓储系统的建设给图书馆视频建库工作能够提供较多的便利性,让广泛用户提供的大数据有序的聚合起来,利用智能调度引擎,可以实现非结构化数据在后台的各种处理及调用,这种调度主要是基于内容信息的调度,和之前通常的提交、标引、审核、发布的工作流有很大的区别,这是需要基于语义分析的调度方式。
通过全文识别和监测日志的高效索引,索引引擎会对数据的每个元数据属性进行多维索引,可将元数据无法描述的内容进一步的关联聚合,最终全面提升视频库建库效率及资源使用效益。
参考文献[1]百度百科.结构化数据.http:///view/2119114.htm[2]郝志刚.大数据、云计算与图书馆[J]. 新世纪图书馆,2014(6):36-39[3]兰超,张勇,邢春晓. 面向复杂数据的对象存储系统[J]. 计算机科学与探索,2014,(2):129-138[4]刘炜,夏翠娟,张春景. 大数据与关联数据:正在到来的数据技术革命[J].现代图书情报技术,2013(4):2-9作者简介:包瑞(1977-),男,新疆师范大学图书馆副馆长,硕士,副研究馆员,在核心刊物发表论文多篇,研究方向:信息技术、信息管理、数字资源建设。