分类目录用户研究综述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分类目录用户研究综述

1.分类目录研究现状

1.1分类目录的功能和优势

网络分类目录是应用分类的方法对巨大的网络资源进行组织和揭示的有效

手段。它可以提供浏览方式的信息查询途径,具有直观、易检的优点。分类目录的使用,可以使得用户更易查找到所需信息。

分类检索是以分类目录浏览方式提供信息查询途径, 一般称为网络分类目录。由专家选取一些网页, 以某种分类方法进行组织, 建立主题树分层目录, 并将采集、筛选后的信息分门别类地放人各大类或子类下面, 用户通过层层点击, 随着范围的缩小与查询专指度的提高, 最终满足用户的查询需求。网络分类目录在检索方面有以下优势:

1.分类浏览方式直观。在检索目的不明确、检索词不确定时, 分类浏览方式更有效率, 适合网络新手。

2.检准率高。网络分类目录由人工抓取、标引, 网页学术性强, 检索效果好。另一方面用户参与程度高, 在分类目录的指导下, 逐步明确用户的检索需求, 检索目的性更强更明确, 检索效率提高。尽管网络分类目录较检索法具有一定的优势, 但是, 要提高检全率、检准率, 采用科学的分类方法是至关重要的。分类标准是提供优质检索服务的重要保障。

1.2 中文搜索引擎分类目录状况

目前中文搜索引擎有70多种。其中, 只有“网络指南针”是采用《中图法》建立网络目录的。目前也只有两级类目的框架、内容不够丰富, 其他的中文搜索引擎都是自编的网络分类目录。由于缺乏统一的网络信息分类标准, 各搜索引擎的分类体系无法兼容, 用户检索需要适应各个搜索引擎不同的网络分类方法。例如, 搜狐的分类目录包括18个大类.

从这些搜索引擎网站分类目录状况可以得出以下结论:

1.网上搜索引擎应用的分类方法较文献分类法检索有其优越性。

2.在分类体系上, 采用以主题、事物为主的聚类方法, 替代了以学科为中心的聚类方法。即围绕某一主题、某一事物集中关于这一主题、这一事物的相关信息。例如, 在“雅虎”分类目录中查找“因特网”方面的信息,进人“电脑与因特网”

下的“因特网”二级目录即可获得有关该方面的所有网站信息。显然, 这种按主题、事物聚类的方法, 对于用户按类检索特定主题特定事物的信息更方便直接。直接用自然语言中的语词作为信息查询和检索的标识。由于搜索引擎分类目录没有严密的体系结构和人为标记符号,而采用的是超文本链接技术,使得类目设置较为灵活,一方面同一事物可以在多个类目下重复列出,另一方面可以根据需要随时添加新的类目, 例如较“雅虎”在“政府与政治”类目下设“十六大”二级类。

3.类目设置体现了以用户为中心,以人为本的理念。网络搜索引擎不刻意追求理论上的严谨性,体系上的科学性以及结构上的严谨性类目设置以尽量适合用户需求为目的,大多根据信息量与特定信息的被访问率来确定类目的序列顺序及类目级别。类目名称多是学科名词与主题词相结合的产物。这种列类顺应了网络信息的特征。自然语言作为类目名称迎合了绝大多数网络信息用户的需要,直观易懂。如与经济学有关的内容在中文雅虎、搜狐等搜索引擎中都采用“商业与经济”、“金融与投资”等老百姓常用的语言,日常热点的“娱乐”、“健康”、“旅游”等占明确的一级类目,充分体现了网络分类目录自由灵活的特点。

1.3 搜索引擎分类目录不足之处

1.不同的搜索引擎分类方法不同,缺乏统一的分类标准,分类体系无法兼容, 令用户无所适从。例姐“图书馆”在雅虎中被列在“参考资料”类下,而在搜狐中“参考资料”则列在“教育与培训”类下,“图书馆”属于三级类目。这种分类标准不统一的情况,造成用户使用不同的搜索引擎感到无所适从,影响检索效率。

2.分类体系缺乏科学性。网络信息分类体系与学科及知识之间缺乏必要的内在联系。往往为了迎合大众口味生造类目, 破坏了知识体系的完整性。

3.类目划分标准模糊,类名表述不统一。如雅虎中的“人文与艺术”与“社会文化”、“社会科学”概念兼容,且为并列关系,不遵循学科之间关系,类目划分随意性大, 用户很难区别它们之间的划分标准,检索极为不便。

4.类目设置方面。类目的设置忽视知识体系的完整性关联性、逻辑性,导致类目之间逻辑关系混乱。首先, 大类设置不科学。由于搜索引擎分类人员缺乏必要的学科分类知识,只是为一般用户的使用而设计,例如网易共设18个大类,将“情感绿洲”“少儿乐园”等列为基本大类,而“哲学”、“社会科学”却在大类中没有位

置。这种大类设置方法, 对于科学研究人员从学科角度检索非常不便。其次, 类目设置不够全面, 涵盖面窄。目前, 搜索引擎类目最多也只有几百个, 难以反映学科发展全貌。、系统性。体现在网络信息的分类体系对知识以及学科覆盖不到位, 用户使用网络分类门录进行检索时常感到部分信息难于归类。

2.用户研究现状

2.1网络目录的分类

通常采用2种方法,一是套用成熟的、权威的图书资料分类法,一是自行设计分类法。

图书分类法:

1.杜威十进制分类法DDC

DDC首创于1876年,1996年发行第21版。DDC是世界上使用最广泛的图书分类法,现有一百多个国家的图书馆使用DDC,被翻译成30多种语言。网络上的分类目录利用DDC作为分类体系始于1995年。现已有多个网站的目录以DDC 为分类体系,这些网站以图书馆和大学为主。利用DDC比较成功的综合性网络目录有加拿大图书馆的“Canadian Information by Subject”。较好的专题性网络目录有英国Wales Aberystwyth大学Thomas Parry图书馆的“PLCK”,是针对图书情报学资源。另有一些特色站点是,“GNOSIS”、“CyberDewey”、“WWLib”、“Sized”等。

2.国际十进分类法UDC

UDC由6万多个类目构成,并提供多种复分表,在满足文献资料细分方面有独到优势,它具有分面组配分类法的一些特点,通过符号组配可以获得概念的组合,因此,这种分类法较适合机检。一些网站目录利用了UDC的这些优点,建立起了自己的分类系统。例如,“BUBL Subject Tree”,覆盖了英国国内综合性网上资源;“GERHARD”,这个项目于1996年在德国Olden Burg大学图书馆开始研究,目标是建立全德国网上资源的检索和浏览工具,它利用了自动分类技术,网页由机器人程序自动采集,凡匹配UDC类目的网页,由计算机建立索引,并自动生成目录树;NISS,综合性网络目录,类目前标有UDC分类号;SOSIG,一个有关社会科学的网络目录,它只选用了UDC的社会科学部分的分类号,共有26个类号。

相关文档
最新文档