大数据环境下高校图书馆非结构化数据融合分析_郭春霞

合集下载

大数据环境下高校图书馆数字资源分析系统建设——以内蒙古医科大学图书馆为例

大数据环境下高校图书馆数字资源分析系统建设——以内蒙古医科大学图书馆为例

大数据环境下高校图书馆数字资源分析系统建设——以内蒙古医科大学图书馆为例赵宏亮【摘要】阐述了大数据环境下高校图书馆建设数字资源使用分析系统的意义,以内蒙古医科大学图书馆为例,介绍了数字资源使用分析系统构建模式,对数字资源分析系统的发展趋势作了探讨.【期刊名称】《内蒙古科技与经济》【年(卷),期】2016(000)024【总页数】2页(P132-133)【关键词】大数据;高校图书馆;数字资源分析系统【作者】赵宏亮【作者单位】内蒙古医科大学图书馆,内蒙古呼和浩特010010【正文语种】中文【中图分类】G258.6;G250.76(226)作为高校图书馆的读者都是高学历用户,他们的信息化意识在不断的提升,知识服务的个性化需求必将是未来文献信息服务的趋势,但是作为高校图书馆都不了解读者检索文献信息、查阅资料等一系列行为数据,何谈未来图书馆的知识发现、智慧图书馆建设。

因此,该系统以用户查阅各类数字文献数据库、以及输入的检索词、热点词等一系列操作行为来进行统计和整理,有效分析出读者使用数字资源的具体情况,从而形成用户的行为数据为图书馆文献资源的选取提供非常有利的直观的数据依据。

现在图书馆都在打造数字图书馆、图书馆的知识发现系统以及畅想未来的智慧图书馆,这都是图书馆界针对未来发展而努力的方向。

而且借助互联网+的信息技术手段以及大数据的信息资源基础,图书馆的发展都发生了巨大变化,都在一步步克服传统图书馆的禁锢。

所以要想打破传统图书馆的壁垒发展数字图书馆、智慧图书馆必然要增强图书馆文献信息资源的挖掘能力,信息知识的再造能力。

那么,让我们从了解自身数字资源的利用情况、自己读者的行为走势开始,一步步向更高层次、更高标准的信息知识服务迈进。

2.1 系统登录模式该系统采用B/S网络结构模式,也就是在网页浏览器中直接输入系统网址访问,便可打开数字资源使用分析系统的登录界面,便于图书馆工作人员在任何时间任何地点随时查询数字资源以及各类数据的具体情况。

提升高校图书馆对非结构化数据融合分析

提升高校图书馆对非结构化数据融合分析

2.3 同型 异 源 数 据 在高 校 图书馆 中 ,对 于某一 个体 来说 ,同一
类型 的数据往往分布于相同的站点 ,但这些相 同 的数据 往往 都 由不 同 的数 据供 应 商提 供 。 当 下 在 电子 资源 方 面 ,无 论是 北 大 、清 华这 样 的名 校 ,还 是诸 如德 州 学 院 、滨 州学 院这样 的地 方 高
40
· 专 题 探讨 ·
科 技 文 献 信 息 管 理
2018年第3期
提 升 高 校 图 书馆 对 非 结 构 化 数 据 融 合分 析
马 家伟 ,郑 杨
(沈阳药科大学 图书馆 辽宁 沈 阳 110016)
摘 要 阐述 了非 结 构 化 数 据 的 涵 义 ,对 比 了非 结 构 化 数 据 与 结 构 化 数 据 的 区别 ,分 析 了 高 校 图书 馆 非 结构 化 数 据 的 类 型 及 非 结构 化 数 据 的 处 理 流 程 ,最 后 提 出 了 建设 高校 非 结 构 化 数 据 的 资 源服 务 模 式 ,以期 能 以 非 结 构 化 数 据 助 力 高校 图 书馆 的 信 息 资 源服 务 。
2 高 校 图 书 馆 的 非 结 构 化 数 据 类 校都 购 买 了大量 的 电子 资 源 ,出 于对 各 种 文 献
型 分 析
的版 权 保 护 ,很 多 期 刊库 都 与 杂 志 社签 订 了独 家 的版 权 协议 ,因此很 多高 校 为 了提升 用 户 的
关键词 非结构数据 高校 图书馆 数据处理 资源服 务 中 图分 类 号 G250.7 G258.6
在 信 息化 社会 中 ,信息 可 以分 为两 大类 ,一 处 理 ,并 将 其作 为文 本 的特 征 向量 以便 计 算 机

大数据视域下高校图书馆用户行为分析与研究

大数据视域下高校图书馆用户行为分析与研究

大数据视域下高校图书馆用户行为分析与研究【摘要】随着大数据技术的发展,高校图书馆开始利用大数据对用户行为进行分析和研究。

本文从研究背景、研究意义和研究目的入手,探讨了大数据在高校图书馆中的应用、用户行为分析方法、高校图书馆用户行为特点分析、影响用户行为的因素分析以及用户行为改进策略研究。

通过对研究成果的总结,指出了研究中存在的不足和展望,并提出了未来研究方向。

本文旨在为高校图书馆提供更有效的用户服务和管理策略,以满足不断变化的用户需求,提升用户体验和图书馆服务质量。

【关键词】大数据、高校图书馆、用户行为分析、研究、应用、方法、特点、因素、改进策略、成果总结、不足、展望、未来研究方向1. 引言1.1 研究背景现代高校图书馆作为学术信息资源的集中地,承担着为师生提供学术支持和信息服务的重要职责。

随着社会信息化和数字化的发展,图书馆信息资源愈发丰富多样,用户需求也日益多元化和个性化。

为了更好地满足用户需求,高校图书馆也需要不断探索和改进自身的服务模式和管理策略。

在这一背景下,大数据技术的应用为高校图书馆提供了全新的视角和方法,能够帮助图书馆更好地理解和分析用户行为,提高服务的质量和效率。

通过对用户在图书馆的行为进行大数据分析,可以深入了解用户对图书馆资源的利用情况,发现用户需求的潜在规律,为图书馆服务提供科学依据。

大数据分析还可以帮助图书馆发现用户行为中的问题和瓶颈,通过精细化的数据分析,指导图书馆改进服务和管理措施,提升用户体验和满意度。

本文旨在运用大数据技术,对高校图书馆用户行为进行深入分析与研究,探讨用户行为的特点、影响因素及改进策略,为高校图书馆提供更科学的管理建议和服务优化方案。

通过这一研究,将有助于推动高校图书馆信息化建设,提升服务水平,更好地满足用户需求。

1.2 研究意义高校图书馆是学校内不可或缺的重要资源,为师生提供了丰富的图书资料和学习环境。

随着大数据技术的发展和应用,高校图书馆也面临着新的挑战和机遇。

大数据时代高校图书馆数字文献资源的建设及开发利用

大数据时代高校图书馆数字文献资源的建设及开发利用

大数据时代高校图书馆数字文献资源的建设及开发利用作者:徐晓峰来源:《公关世界》2021年第08期摘要:高校图书馆数字资源建设在大数据时代面临全新的发展机遇,利用大数据技术可以提高信息传播的整体质量,为用户提供更加方便快捷的阅读体验。

但是大数据时代也面临着数据管理等一系列问题,使得大数据高校图书馆数字文献资源的建设与开发利用存在明显的问题,为此积极针对大数据时代的发展特点进行分析,总结大数据背景下高校图书馆数字文献资源的建设问题,并采取相应的优化策略,全面提升大数据数字资源的建设质量。

关键词:大数据时代高校图书馆数字文献资源建设开发利用引言高校图书馆作为学术交流的重要场所,能够促进信息资源的有效应用。

传统的高校图书馆资源管理耗时耗力、效率不高。

随着大数据技术的快速发展,通过数字资源的建设,以其占地面积小、方便管理的优势,已经逐渐成为高校图书馆文献管理的重要方式。

通过数字文献资源可以有效解决文本文献资料管理存在的诸多问题,也能够使图书资源变得更加丰富。

数字文献资源在建设与发展的过程中也面临着许多方面的问题与不足,加强对数字资源的宣传与普及,确保高校图书馆实现可持续发展。

1.大数据技术的主要概念大数据技术就是指无法被传统数据库软件工具抽象处理的数据集合。

但实际上大数据能够对数据进行海量存储,也能够保证数据元素之间结构准确,提高大数据时代高校图书馆数字资源的整体建设水平。

例如:对于用户信息通常以姓名年龄性别为主,而这些结构化的数据具有明显的相关性数据量非常小。

大数据则包含数字文本以及图像、音频、视频链接等各种信息存储方式,还需要将数字文字以及图片等非结构化数据共同存储,庞大的数据量能够对海量信息进行整合,全面提高数据处理的速度。

2.大数据的主要特征2.1信息量非常丰富在互联网信息高速发展的背景下,每天所产生的数据量非常庞大,在很大程度上方便了用户的选择,保证信息共享的整体效果。

在网络环境下,用户能够对数据信息进行自由选择,根据视频图片等多种方式,使得数据在人们日常工作中发挥应有的效果,随着数据的不断增多,数据资源的数量也得到了海量增长。

基于大数据技术的高校图书馆服务优化研究

基于大数据技术的高校图书馆服务优化研究

基于大数据技术的高校图书馆服务优化研究【摘要】本文旨在探讨基于大数据技术对高校图书馆服务的优化研究。

在将介绍背景和研究意义。

在正文中,将讨论大数据技术在高校图书馆中的应用情况,以及基于大数据技术的服务优化方法,包括用户行为分析、资源管理优化和服务个性化推荐。

在结论部分将总结研究成果,并展望未来研究方向。

通过本研究,可以更好地利用大数据技术优化高校图书馆服务,提升用户体验,并为未来相关研究提供参考和借鉴。

【关键词】大数据技术、高校图书馆、服务优化、用户行为分析、资源管理、个性化推荐、研究成果、未来研究方向1. 引言1.1 背景介绍随着信息技术的不断发展,大数据技术在各个领域得到了广泛应用,其中包括高校图书馆服务的优化。

高校图书馆是学生学习和研究的重要场所,为提升图书馆服务质量和效率,利用大数据技术对图书馆的服务进行优化显得尤为重要。

在传统的图书馆服务模式下,图书馆只能根据统计数据和用户反馈进行一般性的服务规划,难以实现个性化的推荐和精准化的资源管理。

而大数据技术的应用则可以帮助图书馆收集和分析用户行为数据,从而更好地了解用户的需求和偏好,为用户提供更加个性化的服务。

本研究旨在探讨基于大数据技术的高校图书馆服务优化方法,通过对用户行为的分析、资源管理的优化以及个性化推荐的实现,提升图书馆服务的质量和效率。

本研究将总结目前的研究成果,并展望未来在该领域的研究方向,为高校图书馆的发展提供参考和借鉴。

1.2 研究意义高校图书馆是学术研究和学习的重要场所,其服务质量和效率直接关系到师生的学习和科研成果。

随着大数据技术的不断发展和应用,将其引入高校图书馆服务优化研究中,可以为提升图书馆服务水平和用户体验带来新的思路和方法。

本研究旨在探讨基于大数据技术的高校图书馆服务优化,以改善用户体验、优化资源管理和提高服务效率为目标,具有重要的研究意义和实践价值。

通过大数据技术,可以对用户行为进行深入分析,了解用户倾向、需求和偏好,从而为图书馆提供个性化的服务和推荐。

大数据在高校图书馆管理中的应用分析

大数据在高校图书馆管理中的应用分析

大数据在高校图书馆管理中的应用分析1. 引言1.1 背景介绍现代高校图书馆作为学校教学科研和学习活动的重要支撑,承担着图书馆藏书管理、读者管理、图书馆服务优化和安全管理等重要职责。

随着信息技术的快速发展,传统的图书馆管理模式已经难以满足日益增长的需求。

在这样的背景下,大数据技术应运而生,为高校图书馆管理带来了全新的机遇和挑战。

大数据技术以其强大的数据采集、存储、处理和分析能力,能够帮助图书馆更好地管理海量图书馆藏书、优化读者服务、提高服务质量、加强安全管理等方面。

通过大数据技术,图书馆可以更准确、更高效地了解读者需求,优化服务流程,提升服务体验。

大数据技术还可以帮助图书馆进行数据挖掘和分析,发现藏书倾向、阅读习惯等信息,为图书馆决策提供科学依据。

本文旨在深入探讨大数据在高校图书馆管理中的应用情况,分析大数据技术在图书馆藏书管理、读者管理、图书馆服务优化和安全管理中的具体应用方式,旨在为提升高校图书馆管理水平、推动图书馆智能化发展提供参考和借鉴。

1.2 研究意义高校图书馆作为学术机构中重要的知识资源中心,在高等教育领域具有不可替代的地位。

随着现代信息技术的快速发展,传统的图书馆管理方式已经无法满足日益增长的管理需求。

引入大数据技术对高校图书馆管理进行优化和升级已经成为当前研究的热点之一。

研究意义在于探讨大数据技术在高校图书馆管理中的应用以及其带来的影响,有助于提高图书馆管理的效率和服务质量,满足读者个性化和智能化的需求。

通过分析大数据,图书馆管理员可以更好地了解读者借阅行为、学术研究趋势等,为图书馆资源采购和管理提供科学依据。

大数据技术还可以帮助图书馆构建更加智能化的阅读环境,为读者提供更好的阅读体验和服务。

研究大数据在高校图书馆管理中的应用具有重要的实践意义和理论意义。

深入研究大数据技术在图书馆管理中的应用,对于推动高校图书馆现代化建设,提高图书馆管理水平,促进高校信息化建设,具有重要的现实意义和战略意义。

基于大数据技术的高校图书馆服务优化研究

基于大数据技术的高校图书馆服务优化研究

基于大数据技术的高校图书馆服务优化研究随着大数据技术在各行各业的广泛应用,对于高校图书馆的管理和服务也提出了新的挑战和机遇。

高校图书馆作为学术信息资源的集中地,其服务质量对于学校教学科研和学生学习都有着重要的影响。

利用大数据技术对高校图书馆服务进行优化研究,将有助于提升图书馆服务水平,满足师生需求,推动高校信息化建设和智慧校园建设。

一、大数据技术在高校图书馆中的应用现状1.数据采集与管理高校图书馆每天都会有大量的读者借阅和查询行为产生数据,包括图书借还记录、查询记录、阅读时长等。

通过大数据技术,这些数据可以被采集、管理和分析,形成图书馆用户的行为画像,为图书馆提供更精准的服务。

2.智能推荐系统通过大数据技术,可以对读者的阅读行为和借阅偏好进行分析,建立智能推荐系统。

读者在借书、查询书籍时,系统可以根据其阅读历史和兴趣爱好,推荐相关的图书和文献,提高图书馆资源利用率。

3.服务质量评估利用大数据技术,可以对图书馆的服务质量进行评估,包括借阅速度、图书种类丰富程度、空间利用率等方面,为图书馆的运营管理提供科学依据。

二、基于大数据技术的高校图书馆服务优化策略1.个性化服务通过分析大数据,可以为不同类型的读者提供个性化的服务。

对于研究生用户,可以提供专门的学术期刊推荐服务;对于本科生用户,可以推荐与其所学专业相关的图书资料。

2.实时监控与调整借助大数据技术,可以实时监控图书馆的读者借阅情况和馆藏资源利用情况,及时调整图书位置、书籍订购和服务流程,提高服务效率。

3.资源配置优化通过大数据分析,可以对图书馆的馆藏资源进行精准定位和管理,避免资源的闲置和浪费,同时对于热门资源可以进行适度扩充和流通,以满足读者需求。

三、基于大数据技术的高校图书馆服务优化案例分析以某高校图书馆为例,利用大数据技术对图书馆服务进行优化,在用户体验、资源利用和服务效率等方面取得了显著成效。

2.实时座位监控系统图书馆引入大数据技术,利用传感器监测座位的使用情况,通过数据分析得出不同时间段和不同区域的座位利用率,进而调整座位的布局和使用规则,使得座位资源得到最大化利用。

大数据背景下高校图书馆服务创新与发展的研究

大数据背景下高校图书馆服务创新与发展的研究

2021年3月第6期总第472期内蒙古科技与经济Inner Mongolia Science Technology&EconomyMarch2021No6Total No472大数据背景下高校图书馆服务创新与发展的研究朱茂富X孙琳X高国瑞2(1.山东农业大学图书馆2山东农业大学林学院,山东泰安271000%摘要:阐述了大数据对高校图书馆服务模式创新和发展的意义,分析了大数据背景下高校图书馆服务面临的用户隐私安全、数字资源更新滞后、工作人员业务素质不高等问题,提出了通过馆藏资源的数字化、在线化服务、新媒体应用、强化人才培养来不断优化和创新图书馆服务水平的策略(关键词:大数据;高校;图书馆;服务;创新与发展中图分类号:G258.6文献标识码:A文章编号1007—6921(2021)06—0133—02随着科技水平的不断提高,大数据技术逐渐成熟,这就对每个行业的发展提出更加严格的要求+高校图书馆是大学生文化交流的主要基地,对新型现代化人才培养工作的开展具有显著的推动作用+在大数据背景下,高校图书馆的服务应不断创新和发展,将高校图书馆的作用充分体现,进而推动创新型人才的培养+1大数据对高校图书馆服务模式创新和发展的意义1.1大数据可实现高校图书馆的智能化服务信息化进程的发展,先进的网络技术手段应用在互联网中+在大数据背景下,高校图书馆也逐渐重视信息化、网络化及数字化建设,并不断加大对网络硬件设施、软件平台的投入,以实现智能化服务的图书馆+例如:部分高校图书馆使用射频识别技术$构建先进的布局模式及一体化读者管理模式+读者通过一卡通进入图书馆后,可在任一平台和阅览室进行还书、借书等操作m+1.2大数据可增加高校图书馆的数字信息资源馆藏数字信息资源信息量大、时效性强、种类多等特点+高校研究人员可利用其内部的数据库资源查询研究方向、研究进展等+在大数据背景下,可将云计算、物联网等技术应用于高校图书馆中,不断丰富馆藏数字信息资源,从而实现图书馆服务的创新和发展+1.3大数据可提高高校图书馆工作人员专业素质大数据背景下,高校图书馆工作人员需要统筹规划经费使用,推动数字化馆藏的建设方+工作人员在管理过程中需要使用科学、高效的现代化管理手段,这就对其专业素养要求较高+工作人员需要具有较高的数据素养、信息素养、外语水平以及丰富的知识结构,来实现对数字资源的深度开发+2大数据背景下高校图书馆服务创新与发展所面临的问题2.1用户隐私的保护问题大数据背景下高校图书馆在给用户提供服务的过程中获取到用户的隐私数据,根据用户的数据提供用户关注和偏好的服务⑶+但是在这一过程中对用户的隐私也造成了一定的侵犯,如何安全有效的使用、存储用户的隐私数据,是图书馆信息化建设过程中必须要考虑到的一个重点问题+用户隐私数据的保护对工作人员的专业素养是一种考验+2.2数字资源更新滞后在大数据背景下网络已经全覆盖,用户可利用移动终端设备从网络中获取海量数据,而很多信息资源是高校图书馆所没有的+高校图书馆的主要用户群体是教师和大学生,他们已经习惯利用互联网和移动终端来获取所需要的信息+但是,若高校图书馆内的数字网络信息资源不能及时更新,数据信息缺乏后台支撑,就难以满足用户的需求+长此以往,高校图书馆的用户数量就会逐渐降低+2.3工作人员业务素质不高高校图书馆的主要用户群体是教师和学生,工作人员的业务素质是影响高校图书馆生存的主要条件之一+对工作人员来讲,首要条件是过硬的专业知识,同时也要具备技术开发能力和计算机软件的使用能力+工作人员能够对数字资源进行有效的整合、分析及数字化交互式的信息管理,能够为用户开展针对性的服务和设置高效的访问入口等+但是$目前部分高校图书馆的工作人员缺乏上述专业素养,给高校图书馆的现代化建设带来困难+3大数据背景下高校图书馆服务创新和发展策略3.1馆藏资源的数字化随着数字图书馆的发展,高校图书馆馆藏资源的数字化已经初显成效+数字资源经信息数据化的处理后可通过新媒体被用户使用+高校图书馆传统的组织模式难以适应现阶段用户的需求,而网络信息技术的发展迫使高校图书馆进行服务创新的改变来满足用户对信息资源的深度需求⑷。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据环境下高校图书馆非结构化数据融合分析郭春霞【摘 要】大数据环境下,高校图书馆非结构化数据蕴含的信息越来越多,其对图书馆的数据挖掘和学科服务具有重要的支撑作用。

文章对高校图书馆的非结构化数据特性进行分析,将其分为同型异源数据、异型异源数据、同型同源数据三种,构建了非结构化数据的融合分析流程,适合高校图书馆非结构数据的挖掘和管理。

【关键词】高校图书馆 非结构化数据 数据清洗 数据监护DOI:10.15941/ki.issn1001-0424.2015.05.005Abstract:In big data environment,information in university library unstructured data becomes more than ever,which is of great importance for library data mining and library subject service.This arcticle analyzes the features ofuniversity library unstructured data,which is divided into same type of different source,different type of differentsource and same type of same source.The unstructured data fusion analysis process is constructed,which issuitable for university library unstructured data mining and management.Key words:university library unstructured data data cleaning data curation1 引言数据之于科学的重要性,就像语言之于文学,音符之于音乐,色彩、形状之于美术一样,离开数据,就没有科学可言[1]。

2011年Science杂志《聚焦数据管理》的专辑中提出了“数据就是金矿”、“科学就是数据,数据就是科学”的说法。

数据在当今社会,已经被看作是一项重要的资产,它改变着组织决策的模式,所以有效收集、分析大数据,运用各种方法挖掘大数据,使数据的价值最大化,已经成为衡量一个组织竞争力的重要标志[2]。

2004年,世界进入web2.0时代,Facebook、Twitter等社交工具的涌现,使每一个网民都好比一个信息碎片的传播和生产者,不断地制造数据,然后聚集整合,像核弹蘑菇云一样,引发了人类历史上迄今为止最庞大的数据爆炸,引领着人类进入大数据时代[3]。

IDC(国际数据公司)认为大数据时代是数字宇宙时代,他们在2012年的研究报告中指出,2011年全球复制和创建的数据总量为1.8ZB(1ZB=10亿TB),认为到2020年,全球数据总量将达35ZB[4]。

对于大数据的定义,比较典型的描述是由NSF(美国国家科学基金会)提出的:大数据是指“由科学仪器、传感设备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集”[5]。

高校是一个自然科学和社会科学相融合的交叉地,学校的教师、学生来自各种学科和专业,换句话说,高校是各专业、各学科融合最广泛、最复杂的地方。

无论是高校的学术研究还是从校园广泛应用的社交媒体,无论是宏观层面的学术研究还是微观方面的学术研究,无论是微博、微信、QQ等社交媒体,还是图片、视频等数据资源,都被师生广泛地利用和传播。

而高校图书馆作为高校中记录、储存、传播、应用人类文明与数据的机构,需要处理的数据也在呈指数增长,尤其伴随着社交媒体、移动智能终端、无线网络等技术的普及,结构化与半结构化的数据都在飞速增长,图书馆也进入到了“大数据”时代[6]。

目前全世界的数据大约有75%都是非结构化数据,大数据环境下,高校图书馆无论是从时间维度,还是空间维度都面临着前所未有的挑战,尤其是非结构化数据对图书馆的学科服务和数据挖掘具有重要的支持作用。

如何将高校用户利用图书馆过程中产生的非结构化的多源数据进行融合,已经成为高校图书馆工作中一个不容忽视的环节。

对这些数据,需要在充分搜集多种来源信息的基础上,运用多种方法进行综合分析与判断。

只有这样,才能更加全面地了解学科领域的变化和师生不断变化的需求,以期为高校图书馆科学的判断、决策提供更有力的数据支撑。

因此,笔者对高校图书馆的非结构化数据进行分析并分类,挖掘其中蕴含的有价值的情报和知识,对其进行整合、分析、推送,促使高校图书馆在大数据的背景下,充分发挥高校图书馆的作用,使其价值最大化。

2 高校图书馆的非结构化数据特性涂子沛把大数据分为结构化数据和非结构化数据2大类,他认为大数据=结构化数据+非结构化数据。

也有学者认为大数据=结构化数据+半结构化数据+非结构化数据。

无论哪种划分方式,都表明数据与数据之间的划分不再依靠单一的标准,数据与数据之间,彼此交叉,彼此融合。

本文主要探讨高校用户在利用图书馆的过程中产生的非结构化数据,如通过微信、QQ、博客等社交工具产生的数据。

这些数据之间的结构、性质不完全一样,没有系统、整齐的结构,这部分数据的处理,与结构严整的数据相比,困难许多。

图1为高校图书馆的非结构化数据来源。

图1 高校图书馆的非结构化数据来源2.1 非结构化数据生产主体明确在高校图书馆中,非结构化数据的生产主体非常明确,主要为高校教师、在校大学生及图书馆员,学校社会读者数量较少,并且这部分用户利用图书馆资源的频率远远低于前者,在此忽略。

由此可见,从用户的角度,对图书馆员、高校教师与在校大学生三者之间进行有效的数据需求分析、信息行为分析以及相关非结构化数据产生规律的分析,就可了解非结构化数据在高校中发展的规模、质量,经过分析,可得出用户当前需求。

2.2 非结构数据的数量与质量较高由于高校图书馆用户的信息素养水平较高,在这个社交媒体风行的时代,专业学者之间、教师与学生之间、跨领域、跨学科之间均可通过QQ、Blog、微博、微信、在线咨询台等方式随时产生新的信息与数据,这些数据在数量方面呈指数增长。

用户在特定主题、时间、成员、交流进度等情景进程的驱动下,成员之间交流的瞬间会迸发出许多新的想法或观点,这些想法和观点有可能是某种大课题研究的雏形或者是核心思想,对学科发展具有巨大的学术价值和文献价值,这也是本论文研究的核心价值所在。

2.3 非结构数据的加工难度较大非结构化数据的基本特征是数据格式多元化,尤其是利用网络平台传播的数据,其中蕴含着大量高价值的信息。

许多数据是即时产生,有些数据是零次性的,有些是灰色数据,利用计算机和数据库技术对其实施流程化、规模化管理非常困难。

3 高校图书馆的非结构化数据类型分析笔者将高校图书馆的非结构化数据源划分为以下几种类型:同型异源数据、异型异源数据、同型同源数据,如图2所示。

3.1 同型异源数据对于高校图书馆某个体来说,同一类型的数据一般分布在相同的站点,但却由不同的数据商提供。

每个高校图书馆,都购买了大量的电子资源,北京大学、清华大学中外电子资源就有上百个,即使如滨州学院、德州学院图2 高校图书馆的非结构化数据类型等地方高校,购买的电子资源也达20多个,加上试用的电子资源,有50个以上。

由于许多期刊库与杂志社签订了独家版权协议,许多大学图书馆为了提高期刊论文的查全率,提高用户的满意度,会同时购买多个电子期刊库,如中文期刊论文数据一般会同时购买万方数据、重庆维普、清华同方,外文期刊库购买如EBSCO、Springerlink、ELSEVIER等。

每个高校图书馆都会有大量馆藏文献,馆藏文献的数据可以根据用户的借阅信息来调阅,这部分数据的整合,相对来说要容易许多,本文不做讨论。

3.2 异型异源数据传统的十大文献信息源在大数据环境下,已经不是人们查阅信息的全部资源。

相反,越来越多的一次文献、零次文献开始成为新的数据源,如人们在使用Facebook、微信、微博、QQ、MSN、Twitter等社交媒体时产生的数据。

这些数据或许成为技术创新的雏形,或许成为新的思想火花,恰恰是这些数据,更具有启发性和参考性。

3.3 同型同源数据由于不同的教师、学生查阅资料不一样,检索词不一样,即使是相同的数据库,检索历史、浏览历史、近期关注的各种数据也会产生差异,而这部分检索历史、浏览历史,以及近期关注的数据,都可以转化为图书馆的有效数据。

通过整理,我们可以了解到近期学校教师、学生都在关注哪些方面,从而判断现有数据库中此类资源中文有多少、英文有多少,馆藏文献有多少,我们还需要购买哪些图书或订阅相关的专业期刊。

我们可以针对高校用户的浏览记录,关注学科动态,来确定部分用户的需求,从而调整图书馆的藏书结构乃至其他馆藏资源。

4 高校图书馆的大数据分析大数据背景下,高校图书馆只有对大量的用户进行数据收集、挖掘、分析才能对图书馆下一步的决策提供参考,才能更好地满足高校师生的需求。

在大数据战略下,有专家提出了正向思维模式,认为大数据的情报咨询流程分为四步:第一步为收集数据,第二步将收集的数据进行量化分析,第三步通过量化分析,找出数据之间的相互关系,最后一步提出优化方案[7]。

笔者认为,作为高校图书馆,由于用户身份简单,主要为高校教师和在校大学生,所以图书馆的相关部门如参考咨询部、信息技术部等,可以对用户利用图书馆的过程进行数据收集———数据清洗———数据融合分析,最后提出推荐方案。

4.1 数据收集传统意义上,高校图书馆的数据收集工作,主要依靠图书馆文献借还记录、电子文献资源访问日志,学生阅读记录等。

但是随着社交媒体的广泛传播,高校教师、大学生每人至少拥有2个即时网络社交工具,促使非结构化数据量飞速增长,与结构化数据相比,其比重越来越高,传统意义上的数据收集只能是大数据的冰山一角。

越来越多的高校图书馆开始关注非结构化数据的收集,但非结构化数据的收集由于其本身的特性,存在一定的难度。

现在国外开始研究利用数据监护(Data Curation)技术,对高校图书馆的数据进行收集监护,它是一个动态收集数据的过程,需要不断地补充和更新。

数据监护可以从数据产生之初对其进行管理和统计,为将来的知识挖掘提供资源,更好地满足用户的需求和利用[8]。

国外许多图书馆已充分意识到数据监护技术在大数据时代的重要性,尤其是美国高校图书馆,他们现在开始将图书馆服务的范围拓展到数据阶段,成为科学研究和学术交流的新阶段,而我国图书馆在这方面则显得相对滞后[9]。

实践方面,我国高校图书馆几乎没有开展与数据监护相关的服务,2001年底,科技部开始启动数据共享工程,将数据资源的整合、科学数据共享推上了一个新的阶段[10]。

相关文档
最新文档