4网络信息资源管理
★ 第六章 网络信息资源管理

★课前索引【本章提要】本章主要讲解了网络信息资源这种重要而又独特的信息资源的管理。
在介绍网络信息资源类型和特点的基础上,从多个层次对网络信息资源的组织进行了探讨,并着重对网络信息资源的检索进行了详细论述。
介绍了网络信息检索的过程、网络信息检索的工具,并对搜索引擎这一众所周知的最常用网络检索工具进行了多角度探讨。
在此基础上,本章从检索技术的角度,对网络检索技术做了较大篇幅的讨论,并结合常用的搜索引擎进行了案例分析。
本章最后对网络信息资源的评价进行了研究。
【学习目标】1、网络信息资源的类型及特点;2、网络信息资源组织的方法;3、网络信息检索的过程;4、网络信息检索的工具;5、搜索引擎的基本概念、类型及其作用;6、网络信息资源的评价。
【学习指南】本章的重点是第1节、第3节、第4节。
【预习思考题】1、网络信息资源主要有哪些类型?2、和传统信息资源相比,网络信息资源具有什么特点?3、目前网络信息资源的组织主要有哪些方法?4、请简述网络信息检索的过程。
具体的网络信息检索技术主要有哪些?5、网络信息检索的工具有哪些?6、搜索引擎主要有哪些类型?各类搜索引擎各有什么特点?7、网络信息资源评价主要从哪几个方面进行考虑?◇第一节网络信息资源概述本节内容一、网络信息资源类型二、网络信息资源的特点一、网络信息资源的类型★网络信息资源的分类有多种标准,根据不同的分类标准,可以将网络信息资源分为不同的类型。
第一,网络信息资源从内容范围上可以分为五个大类:学术信息,教育信息,政府信息,文化信息,有害和违法信息等。
第二,按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等。
第三,依据信息源的信息内容则可将网络信息资源分为以下类型:一是联机数据库,即各类数据库是联机存储电子信息源的主体。
二是联机馆藏目录。
三是电子图书。
四是电子期刊。
五是电子报纸。
六是软件与娱乐游戏类。
七是教育培训类。
八是动态性信息。
第四,如果认为网络中的信息存取方式所要达到的功能是在简单地模拟和再生人类信息传播方式的话,那么参照非网络环境中信息存取方式的方法对网络信息资源进行归类,主要有六种网络信息资源的类型。
论网络信息资源管理文献综述

论网络信息资源管理随着计算机技术和现代通讯技术的发展人类已经步入以数字化和网络化为特征的知识经济时代,为了保持我国的国际竞争能力,特别是提高我国的创新能力,我们政府特此制定了由“知识成产系统,技术生产系统,知识传播系统和只是应用系统”4个良性循环的子系统所形成的国家创新体系中的知识传播系统,已经被纳入国家创新体系当中。
经过100多年的发展,信息管理的过程已经经历了传统管理时期,技术管理时期,信息资源管理时期,现在正逐渐向“网络信息资源管理”阶段演进。
这种演进和发展对信息管理工作模式和服务模式势必造成巨大的变化,产生新的社会需求,而网络信息资源管理正式这种新需求下的产物。
1. 网络信息资源含义在探讨网络信息资源的含义之前,我们首先应明确对信息资源(IR)概念的理解。
目前关于信息资源的含义有很多中不同的解释,但归纳起来主要有两种:一是侠义的理解,认为信息资源就是指文献资源或者数据资源,或者各种媒介和形式的信息的集合,包括文字,声像,印刷品,电子信息,数据库等,。
这都是限于信息本的身。
而是广义的理解,认为信息资源是信息活动中各种要素的总称,这既包含恶劣信息本身,也包含了信息相关的人员,设备,技术和资金等各种资源。
随着互联网发展进程的加快,信息资源网络化成为一大潮流,与传统的细细资源相比,网络信息资源在数量,结构,分布和传播的范围,载体形态,内涵传递手段,等方面都显示出新的特点。
这些新的特点赋予了网络信息资源新的内涵。
作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质,光介质以及各类通讯介质上的。
并通过计算机网络通讯方式进行传递信息内容的集合。
简言之,网络信息资源就是通过计算机网络可以利用的各种信息资源的总和。
目前网络信息资源以因特网信息资源为主,同时也包括其他没有;连入因特网的信息资源。
2. 网络信息资源的特点2.1存储数字化信息资源由纸张上的文字变为磁性介质上的电磁信号或者光介质上的光信息,是信息的存储和传递,查询更加方便,而且所存储的信息密度高,容量大,可以无损耗地被重复使用。
信息技术——信息资源管理

信息技术——信息资源管理在当今数字化的时代,信息技术以惊人的速度发展,深刻地改变着我们的生活和工作方式。
其中,信息资源管理作为信息技术领域的重要组成部分,对于组织和个人有效地获取、利用和保护信息资源具有关键意义。
信息资源,简单来说,就是各种各样有价值的信息。
它可以是企业的财务数据、客户资料,也可以是科研机构的研究成果、实验数据,甚至是我们个人的照片、文档、社交网络信息等。
这些信息资源在数量上不断增长,种类日益繁多,来源也越来越广泛。
如果不能对其进行有效的管理,就会像身处一个堆满杂物却没有条理的仓库,难以找到所需的东西,甚至可能会因为混乱而丢失重要的信息。
那么,信息资源管理究竟是什么呢?它是指对信息资源进行规划、组织、控制和协调的一系列活动,以确保信息资源能够得到充分的开发和利用,从而为组织和个人创造价值。
这包括了对信息的收集、存储、加工、传递、利用和销毁等全过程的管理。
在信息资源管理中,首先要做的是明确信息需求。
只有清楚地知道自己需要什么样的信息,才能有针对性地去收集和整理。
比如,一家企业要开发一款新产品,就需要了解市场需求、竞争对手的情况、相关技术的发展趋势等信息。
这就需要企业的相关人员与各个部门进行沟通,确定具体的信息需求,然后制定相应的信息收集计划。
信息的收集是获取信息资源的重要环节。
这可以通过多种途径来实现,比如内部的业务系统、员工的报告和反馈,以及外部的市场调研、行业报告、网络搜索等。
但在收集信息时,要注意信息的准确性、完整性和及时性。
不准确或不完整的信息可能会导致决策的失误,而不及时的信息则可能失去其价值。
收集到的信息需要进行合理的存储和组织。
这就像是给物品分类存放,以便于查找和使用。
现在,随着信息技术的发展,我们有了各种各样的信息存储方式,如数据库、文件系统、云存储等。
在选择存储方式时,要考虑信息的特点、使用频率、安全性等因素。
同时,还要建立良好的信息分类体系和索引,以便能够快速准确地找到所需的信息。
网络信息资源管理

第六章网络信息资源管理第一节网络信息资源概述●网络作为继报纸、广播、电视之后的第四大媒体,具备这三类媒体的许多优点,也自有其独特性。
●网络信息资源的分类网络信息资源按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等。
依据信息源的信息内容则可将网络信息资源分为以下类型:一是联机数据库,二是联机馆藏目录,三是电子图书,四是电子期刊,五是电子报纸,六是软件与娱乐游戏类,七是教育培训类,八是动态性信息。
如果从科学的正式交流渠道与非正式交流渠道的思想出发,网络信息资源可以分为稳定的信息资源和不稳定的信息资源两类。
●网络信息资源的特点网络信息资源作为一种新型的信息源,它有自己不同于其他传统信息资源的特点:第一,以网络为传播媒体。
第二,以多媒体为内容特征。
第三,以超文本形式组织信息。
第四,传播方式的多样性、交互性。
第五,变化更新快。
第二节网络信息资源的组织●网络信息资源的组织网络信息资源的组织是指对网上的各种概念、数据(包括声音、图像、软件等)、事实、文献等,通过分析、标引(分类的和语词的)、著录(信息特征的描述)、链接(把相关的信息加以联系)、排序、存储等手段,形成一个有序的、便于用户理解和查询的信息系统的过程。
●网络信息资源组织的重要性网络信息资源的特点决定了人们查找利用它们十分困难,而且也使组织网络信息资源变得十分必要,原因主要表现在以下三个方面:一是在Internet上存在着大量可获得的有价值、可利用的信息。
二是为了检索的便易,这些资源需要组织。
三是为了方便人们对网络信息资源进行管理与控制。
●网页的链接结构网页的链接结构通常可以分为两种基本形式:树状结构(层级结构)和网状结构(平级结构)。
●文件的组织在网络信息资源中,文件的组织通常有以下方法:一是将文件分级存放;二是按文件所属的栏目进行存放。
●Internet常用的网络信息资源的组织方法目前Internet上最为通用的网络信息资源的组织方法有以下几种:一是主题树方式;二是文件组织方式;三是数据库组织方式;四是网络信息指引库;五是超媒体组织方式。
网络信息资源开发与管理复习提纲

网络信息资源开发与管理复习提纲第一章1、信息资源的构成:(1)信息内容。
人类感知、识别并表达的事物状态,以及再现的客观事物状态,是人类获取信息的本质内容。
(2)信息内容的表达和组织方式。
包括信息表达的符号和方式以及信息组织的方法和过程。
它们是关系到人类能否如实地反映和揭示客观事物的状态及变化,以及他人能否获取到所需信息内容的主要因素。
(3)信息表达所依附的载体和传递的媒介。
包括信息表达符号赖以存在的“载体”和与之相适应的传播设备及手段。
它们是关系到已表述和组织的信息能否得到及时而有效利用的主要因素。
2、网络信息资源:它是以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通信介质上的,并通过计算机网络进行传递信息内容的集合。
简言之,网络信息资源就是可以通过计算机网络利用的各种信息资源的总和。
3、网络信息资源按信息资源的媒体形式分类:(1)文本信息。
这是最为基本的一种媒体存储形式。
(2)图片信息。
指GIF、JPEG等文件格式存储的信息。
(3)音频信息。
主要指W A V、AIFF、MIDI、MP3等文件格式存储的信息。
(4)视频信息。
主要指以Quick Time、A VI以及MPEG等形式存储的信息。
(5)三维虚拟影像。
信息模型是以VRML组织,以立体三维形式呈现的信息。
4、按网络信息资源层次分类:(1)指示信息。
指示信息单元的地址,如一个超文本链接等。
指示信息由信息的实际地址和有关信息的标识、注解等内容构成。
(2)信息单元。
可以指信息表达的最小信息单元,如文献的某一行、某一段等,一个信息单元由一个文本组成,该文本可以具有或不具有的特定的指示信息。
(3)信息集合。
指相互关联的信息集合,是由若干相关信息及其中特定的信息单元和指示信息组成的,如网页、数据库的记录等,文献由若干信息以及一些指定的指示信息构成。
(4)信息资源系统。
指一组相关的、经过标引和建立了交互参见的信息资源的集合。
郑州大学现代远程教育《网络信息资源管理》课程考核要求答案

(一)名词解释(每小题4分,共24分)1、网络信息资源管理答:系统的管理思想和方法,是基于信息技术的,包括对信息活动要素的规划、组织、控制和协调,以实现资源的最佳配置和提高信息资源的开发利用水平。
2、网络信息过滤答:网络信息过滤是根据一定的标准运用一定的工具从动态的网络信息流中选取用户需要的信息或剔除用户不需要的信息的方法和过程。
3、数据挖掘答:数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。
它是数据库知识发现中的一个步骤。
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
4、推送服务答:推送服务中推送技术的基础思想是将浏览器主动查询信息改为服务器主动发送信息。
5、Web2.0答:Web2.0 是相对于Web1.0 的新的时代。
指的是一个利用Web的平台,由用户主导而生成的内容互联网产品模式,为了区别传统由网站雇员主导生成的内容而定义为第二代互联网,即web2.0,是一个新的时代。
6、网络信息资源评价答:网络信息资源评价主要可分为定性与定量两种方法。
对这两种方法和基于元数据的网络信息资源进行了评述,并探讨定性评价中的问题,如评价标准、评价过程等。
(二)简答题(每小题8分,共56分)1、网络信息资源按照时效性可分为哪些类型?答:动态信息、电子报纸、电子期刊、电子图书、联机馆藏目录、联机数据库等2、网络信息污染有哪些?答:信息超载或信息过剩、信息垃圾、计算机病毒3、网络信息的中观组织模式有哪些?答:网上二次信息资源组织模式、网上三次信息资源组织模式4、网络信息检索效果评价指标有哪些?答:查全率和查准率查全率=检索到的文献/数据库中所有文献*100%查准率=检索到的相关文献/检索到的所有文献*100%5、网络信息过滤的作用是什么?答:阻值“信息超载”、“不良信息”和垃圾信息的侵害6、数据挖掘的实现过程是什么?答:关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组;第二阶段再由这些高频项目组中产生关联规则7、网络用户个性化信息的获取方式有哪些?答:网络用户静态个性化信息的获取方式有1.直接浏览:1.在地址栏输入网址打开2.通过收藏夹打开3.通过桌面快捷方式打开4.通过分类目录打开5.通过网址导航打开6.通过其他链接打开2.搜索引擎:Google、百度、雅虎、Bing、搜狗、SOSO、其他搜索工具3.订阅或定制:RSS订阅、邮箱订阅、定制网站、其他订阅方式网络用户动态个性化信息的获取方式有信息推送:(1)频道式推送(RSS)(2)邮件式推送(3)网页式推送(4)专用式推送(5)智能拉出式(6)提要式推送(7)客户代理式推送(8)服务器推送网络数据库提醒服务:RSS、电子邮件、网页定制和专用软件的方式个性化推荐:1.基于内容的推荐 2. 基于协同过滤的推荐 3.基于用户统计信息的推荐(三)主观论述题(共20分)1、谈谈学习这门课的收获有哪些?(不少于200字)。
网络信息资源管理ppt课件

页面指向另一个页面的超链接。 • 网页排序!! Google
12
3)Web日志挖掘
• Web日志(使用记录)挖掘是从Web服务器上 的日志中分析Web站点的使用情况,发现用户
的访问模式。
• Internet的用户一旦连接到一个在线的服务 器上,就在这个服务器上留下了一个“脚
•
结构挖掘
•
日志挖掘
9
1)Web内容挖掘
• Web内容挖掘是从Web文档内容或其描述 中抽取知识的过程。
• • Web内容挖掘包括: • 基于Web文档的文本挖掘(Text Mining) • 基于Web的多媒体数据挖掘(Multimedia
Data Mining)• IRM是三种基本信息管理模式的集约化,
即信息资源的技术管理、信息资源的经济 管理和信息资源的人文管理。 • 它们分别对应不同的背景,即信息技术、 信息经济和信息文化,三者的集成构成 IRM的三维构架。
17
讨论题
• 在抑制论文抄袭过程中,技术手段、人 文手段和经济手段哪一种更有效?
• 01班观点:技术手段更有效 • 02班观点:人文手段更有效 • 03班观点:经济手段更有效
印”,这就是服务器上的日志文件。它包括
所请求的URL,发出请求的IP地址和时间戳。
• 对Web服务器的页面布局进行改进;
• 为用户提供最受欢迎的站点列表,帮助用户
导航。
13
4)移动终端的挖掘
• 面对庞大的手机用户群体,再加上手机短信广 告所具有的覆盖面广、指向性强、成本低,接 收率几乎百分之百,发布速度快等其他媒体难
用户真正感兴趣的信息,尽量屏蔽那些
浅谈网络信息资源管理

科技创新导报 Sce c a d in e n Te h oo I ov to He ad c n lgy nn a in r l
15 7
Q: 塑
Sci ce en and Tech nol ogy nnov i Her d I at on al
管 理 科 学
浅 谈 网络 信 息 资 源 管 理 ①
李 燕 ( 甘肃政法 学 院计 算机学 院 兰 州 7 0 7 3 0 0)
摘 要: 本文在介 绍 了网络 信息资 源含 义和特 点的基础上 , 阐述 了罔络 信息资 源管理技术 的特点 、 内容核 心和 理论核 心, 出要 应对 网络 指 信 息资源管理 技术 的挑 战, 把握 网络 信 息资源管 理技术 带来 的机遇 。 关键词 : 网络信 息资 源管理 网络信 息资源管理技 术 中图分类号 : 0 G2 3 文 献标 识 码 :A 文章编号 : 6 4 9 X( 0 ) ab 一0 7 -0 1 7 —0 8 Z 1 O ( ) 1 5 1 O 的表现 形式 , 图文并茂 。 使之表现 更直观形 象 , 更 有吸 引力 。 其次 是具 有超文 本链 接 功能 , 可 方便 快捷 地获 取所需 的更 多信 息 。 () 询方便 。 4查 只要 用 户有 电话和 电脑 , 就 可 以 自由方便 地在 自己家里 查 阅网络 信息 资 源 , 网络信息资源检索利用超文本链接 , 并且 构 成 立 体 网状 文 献 链 , 把 不 同 国 家 、 同地 能 不 区 、 种服 务 器 、 种 网页 、 种 不 同文 献都 各 各 各 通过结 点链接起 来 , 以使查 阅者在 浩瀚的信 息 1网络信 息资源含义 海洋 中快捷 、 准确 地得 到 所需 的 有关 信 息 。 随着互联 网发展进程 的加快 , 信息资源 网 () 5交互功能 强。 网络信息资 源强大的交互 络化 成为 一大潮 流 。 与传 统的 信息 资源相 比 , 功能 , 以形成 广泛 的论 坛氛 围 。 关专 家可 可 有 网络 信 息 资源 在 数 量 、 构 、 结 分布 和 传 播 范 以就某一 专题开设 电子论坛 , 网上直接 反馈读 围 、 体 形 态 、 涵 、 递 手 段 等 方 面 都 显 者信 息 , 与 交流 讨论 。 载 内 传 参 作者 、 出版 者 和读 者 示 出新 的特点 , 这些 新的特 点赋予 了网络信息 可以通 过 网络直 接进 行沟 通等 。 资源 新的 内 涵。 为知识 经济 时代 的产物 , 作 网 络信 息资源也称 虚拟信息 资源 , 它是 以数字化 3网络信息 资源管理 的理论核心是 “ 三维 形式 记录 的 , 以多媒 体形 式表达 的 , 存储 在 网 结构 论” 络计算机 磁介质 、 介质以及 各类通讯 介质上 光 2 世 纪9 年 代初 , 0 0 卢泰 宏教 授提 出 , M I R 的, 并通过 计算机 网络通讯方 式进行传递 的信 ( 信息资 源管理) 是三种基本 信息管理模 式的集 息 内容的集 合 。 简言 之 , 网络信 息资 源就是 指 约化 , 即信息 资源 的技 术管 理 、 息 资源 的经 信 通过 计算机 网络 可以 利用 的各 种信 息资源 的 济 管理和信 息资源 的人文管理 , 它们分 别对应 总和 。 前 网络信息 资源以 因特 网上的信 息资 不 同 的背景 , 目 即信 息技 术 、 息 经济和 信 息文 信 源为主 , 同时也 包括其 他没有联人 因特 网的信 化 , 三者的集 成构成 IM的 三维构架 。 R 息资源 。 从技术 角度来看 , 人们 除 了利 用信息科学 的原 理研究 解决大 系统 的稳定性 、 网络结 构的 2网络信息资源管理的特点 有序 性和高速率 传输 中的各种 问题外 , 要是 主 网络 信 息资源 是 电子 出版发 展到 高级 阶 用 情报学 的 理论 方法研 究高 速信 息 网络上 的 段的产 物 。 与传 统信息 资源 管理 不同 , 网络信 信息组 织方法和 信息服 务模式 , 探索各种适 合 息资源管理通过 计算机技 术、 通信技 术及 多媒 网络特 点的信 息系统 、 信息媒介 和利用 方式 。 体技 术相互融 合而形成 网络发布 、 询与存取 查 从 经济角度来 看 , 高速信 息 网络是 一个 巨 利用。 网络信 息资源 管理 的 出现 , 使人类 信息 大的 社会 经济 系统 , 这个 系统 将计 算机 网 、 通 资源 管理的开 发利 用进入 了新的时 代。 作为一 信 网、 息资 源 网、 信 信息 生产者 ( 供者 )信息 提 、 种 新 的信 息 资源 管理 形 式 , 有 以下 五 大特 消费者 ( 户) 为一 个有机 整体 , 它 用 融 从根本 上改 点。 变 了人 类信息的生 产 、 配、 分 流通和利 用模式 , () 1时效性 。 由于 网络信息 资源 管理从本质 引起 了整个 信息产 业革命 , 必要按 照经济规 有 上改变 了信息 的创造交流和获 取的方式 , 因此 律、 遵循 经济法则 、 运用经济杠 杆 , 网络 信息 对 时效性是过去传统的文献信息资源管理不可比 活动进行 经济管理 , 使网络信 息资源实现 最优 拟的。 而且在网络资源出版的过程中 , 读者和编 配置 , 得最大 限度 的利用 , 获 发挥 最佳效 益 。 者可不受时 间和地域 的限制 即时交流 , 而使 从 从人 文 角度来 看 , 们试 图通 过政 策 、 人 法 内容更加新颖 、 及时 。 规、 伦理道德 的相互协 调 , 将行政 手段 、 制手 法 () 2信息容 量大。 网络信息 资源载体的基 本 段和精 神文 明的力量结 合起来 , 现高速信 息 实 物 理单 元是计 算机 、 算机记 录 , 计 存储 与处 理 网络资 源的规 范化和有 序化管理 , 形成有机体 文献的物理 载体主要是 磁盘 、 光盘 和半导体 芯 系和健 康的 网络文化 , 以保证高速 信息 网络有 片等 , 些 载体 与传统 文献 载体 相比 , 有 信 序运行 。 这 具 息存储量 大、 存取 方便 、 记录和输 出的格式 转变 在 网络信 息资源的 管理实践 中 , 这三大 管 容易等优点 , 它可以使 网络信息资 源不受版 面 理模 式相 辅相 成 , 有机地 结 合在 一起 。 网络 信 约束, 最大 限度地报道 信息 内容 。 息资 源在 我们 的社 会发 展 中将 日益 占据 主导 () 3多功能 。 网络信 息资源管理具 有多样化 地位 , 信息资 源的管理水 平将直 接影响到 网络 随着计算机 技术和现 代通信技 术的发展 , 人类 已经步 入以数 字化 和 网络化 为特征 的知 识经济时代 , 息资源管 理 , 信 经过 多年的发展 , 现 正 逐 渐 向 “ 络 信 息 资 源 管 理 ” 段 演 网 阶 进 。 种 演进 和 发 展对 信 息管 理 工 作模 式和 这 服务模 式势必会 带来 巨大 的变化 , 产生 新的社 会需 求 , 而网络信 息资源管 理正是这种 新需求 下的产物 。 ①基 金 项 目: 肃 政 法 学 院 科 研 资 助 青 年 项 目 。 甘 作 者 简 介 : 燕 (9 0 ) , 肃 政法 学 院 计 算 机科 学 学 院 讲 师 。 李 18~ 女 甘 它 的合理利用 , 只有对 网络信息 资源进行有 效 管理 , 才能使 网络信息环 境变为 有序的信 息空 间, 实现信 息资 源效用 的最大 优化 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)网络信息资源管理现存问题
• • • • • 网络信息资源缺乏有效的组织和管理 网络信息资源的法制不健全 标准不够统一 技术管理水平有待提高 网络信息资源管理人才短缺
16
(2)三维结构论
• 网络信息资源管理的理论核心是“三维结 构论”。
• IRM是三种基本信息管理模式的集约化, 即信息资源的技术管理、信息资源的经济 管理和信息资源的人文管理。
• 对Web服务器的页面布局进行改进; • 为用户提供最受欢迎的站点列表,帮助用户 13 导航。
4)移动终端的挖掘
• 面对庞大的手机用户群体,再加上手机短信广 告所具有的覆盖面广、指向性强、成本低,接 收率几乎百分之百,发布速度快等其他媒体难 以比拟的优势,利用手机短信作为广告媒体成 为广告商难以抗拒的诱惑。 • 针对短信数据挖掘的应用主要有两方面,分别 是挖掘用户兴趣技术和垃圾短信过滤技术。
• 根据Web挖掘的数据对象将Web挖掘分为三 类:
•
内容挖掘
网页正文抽取
•
•
结构挖掘
日志挖掘
9
1)Web内容挖掘
• Web内容挖掘是从Web文档内容或其描述 中抽取知识的过程。 •
• Web内容挖掘包括:
• 基于Web文档的文本挖掘(Text Mining) • 基于Web的多媒体数据挖掘(Multimedia Data Mining)。
18
4 网络信息资源管理
•引导案例:许经理的任务
• 2003年5月的一天,正是“非典”肆虐,很多 企业正常业务大受影响的时候,X集团业务发 展部经理许宏涛接到一个任务,
• 问题:该如何完成老总交给的任务呢?
1
• 这个时代,网络信息资源异常丰富,„„ • 但要完成许经理的任务又并非容易„„
ቤተ መጻሕፍቲ ባይዱ
2
网络信息资源的特点
10
实例:Web正文信息抽取
• 最重要的Web文本挖掘 • 与传统的规范化文档相比,网页文档在写作 上更加随意,内容组织上更加松散。 • 需要抽取文档的正文信息 • 可再选取一定数量最能代表文档内容的句子 组成文摘
有兴趣的同学可 做深入研究
11
2)Web结构挖掘
• Web结构挖掘主要是通过对Web站点的超链接
• 它们分别对应不同的背景,即信息技术、 信息经济和信息文化,三者的集成构成 IRM的三维构架。
17
讨论题
• 在抑制论文抄袭过程中,技术手段、人 文手段和经济手段哪一种更有效? • 01班观点:技术手段更有效 • 02班观点:人文手段更有效 • 03班观点:经济手段更有效
作业:分组讨论下一章引导案例
• • • • • • •
(1)数量庞大,增长迅速 (2)内容丰富,覆盖面广 (3)传输速度快 (4)共享程度高 (5)使用成本低 (6)变化频繁 (7)质量良莠不齐
3
从Web1.0到Web2.0
• Web2.0是相对Web1.0的新的一类因特网应用的统 称。 • Web1.0的主要特点在于用户通过浏览器获取网页 上的信息,类似于图书馆; • 而Web 2.0则类似一个庞大的社交沙龙,在用它来 获得信息的同时可以参与到会话中。 • 它的精髓是“以人为本”。
他意识到商务智能或许能帮上忙,于是他向信息中 心专家求教,又向高级顾问委员会求教。
• 知识点:搜索引擎,商务智能
• 问题:1.知识通能解决许宏涛的问题吗?
• 2.为什么听了几位专家顾问的观点,许宏涛心中 有数了?
6
• 网络信息资源成为当代社会信息资源需 求的主要类型。 • 网络上存储和传输的信息是海量和形式 多样的。 • 没有相应的信息资源开发活动,人们几 乎不可能从茫茫的信息汪洋中取其所需。
结构进行分析、变形和归纳,将Web页面进 行分类,以利于信息的搜索。 • Web不仅由页面组成,而且还包含了从一个 页面指向另一个页面的超链接。
• 网页排序!!
12
3)Web日志挖掘
• Web日志(使用记录)挖掘是从Web服务器上 的日志中分析Web站点的使用情况,发现用户 的访问模式。 • Internet的用户一旦连接到一个在线的服务 器上,就在这个服务器上留下了一个“脚 印”,这就是服务器上的日志文件。它包括 所请求的URL,发出请求的IP地址和时间戳。
布置下次的讨论
14
精准营销结构图
4.4 网络信息资源综合管理
• 如同现实空间的信息资源一样,网络空 间中的信息资源也始终面临着信息混乱、 信息污染、信息犯罪、信息开发和利用 低效率等问题。
• 网络信息资源管理的目的是为了综合治 理网络空间存在的问题,以便更好地开 发和利用网络信息资源。
15
• 从信息资源的视角:
• Web2.0是一个集各个领域、各个主体的各类信息 资源为一体的、供网络用户利用并满足其信息需 4 求的数据资源网。
个体性、草根性、社会性、互动性、聚合性
特性
5
4.2 网络信息资源过滤与挖掘
• 引导案例:X集团的搜索引擎
P163
• 案例描述:引导案例中的许经理接到老总的任务,
7
(1)网络信息的过滤
• 因特网上如潮水般涌来的在线电子文档 往往使用户感到十分的茫然。 • 所谓的“信息过载”问题。
• 为了能够满足用户个人的需求,提供给 用户真正感兴趣的信息,尽量屏蔽那些 无用的信息,于是信息过滤技术应运而 生。
8
(2)Web挖掘
• Web挖掘(Web mining)就是利用数据挖掘 技术从Web文件和Web活动中筛选感兴趣 的、潜在的有用模式和隐藏的信息。