网络信息资源检索与利用第二次作业

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《网络信息资源检索与利用》课程实验第2次实验报告

实验内容及基本要求:

实验项目名称:网络搜索引擎的应用

实验类型:验证

每组人数:1

实验内容及要求:

1.请分别针对网络资源目录使用的分类方法进行举例。

2.在 yahoo 的分类目录中找到一条路径指向网站论文:

/Summer98/koumoutsakos.pdf。

3.在新浪网的分类目录中找到一条路径指向学校的网站:

4.在 sohu 的分类目录中找到一条路径指向网页:/newbook/

5.请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

6.请了解 google 和 baidu 在进行关键词检索中语法的异同,并说明这两者在针对某一主题进

行检索时检索结果的差异以及对检索意图理解准确度的差异。

实验结果:

1.请分别针对网络资源目录使用的分类方法进行举例。

(1)主题分类法

(2)学科分类法

(3)图书分类法

(4)分面组配法

2.在 yahoo 的分类目录中找到一条路径指向网站论文:

/Summer98/koumoutsakos.pdf。

3. 在新浪网的分类目录中找到一条路径指向学校的网站:

4. 在 sohu 的分类目录中找到一条路径指向网页:/newbook/

5. 请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

(一) Yahoo( )

Yahoo 是世界上最著名的网络资源目录。Yahoo 的魅力,就在于它的可浏览式等级主题目录。Yahoo 按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,成为

网络检索工具的佼佼者和等级式风络资源目录的典型代表。Yahoo 采用多标准高类、多维展开的方式,能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,保证了从不同的路径,为检索相同内容的不同用户提供服务。对于交替类目,Yahoo 利用了符号“@”来表示,起到了类似于相关参照的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其他分支中。

(二) Open Directory()

Open directory 是手工编辑的目录导航式搜索引擎,它由四万多名志愿者编辑标引加工数据

并组织类目,自称为世界上最权威的人工编辑的搜索引擎。大多数志愿者都对自己负责的部

分相当感兴趣,有的就是该领域的专家权威,因此Open directory 中有不少分类的内容,特

别是一些边缘学科或冷门学科,要比Yahoo 提供的全面得多,有的甚至在Yahoo 中根本找不到对应的分类。Open Directory - 开放目录专案提供了一种以互联网自我组织与管理的方

式进行发展用来满足快速增长的网站数量。随着互联网的增长,网民数量也随之增加。这些网民能够编辑管理一小部分网站,并且提供负责更多的编辑工作,整理清除没有用的信息内容,只保留最好的内容。

Open directory 也提供关键词检索,分为简单检索和高级检索。在简单检索中,支持布尔逻

辑检索。在高级检索中提供了相关的选择,包括选择只检索类目、只检索站点等。同时它还提供了与其他搜索引擎的链接。

Open directory 是一个非常有前景的网络资源目录,它可无限扩展的编辑人员,为其今后的

发展注入了极大的活力,它的资源收录的增长速度,内容的更新频次,都是其他网络资源目

录所无法比拟的。同时,它详尽的类目体系,开放的管理体制,都形成了其独用的特色,成

为用户获取网络信息资源的重要门户网站。

(三)搜狐( )

搜狐的网络资源目录堪称是我国第一部系统的网站分类法,对其他中主文网络资源目录的发

展起到了积极的促进作用。搜狐网络资源目录的分类体系的编制,基本上坚持了在符合科学

性原则的前提下,充分考虑网站资源和用户的查询习惯的原则。在搜狐的分类体系结构中包

括18 个大类,涵盖了 50000 多个不同层次的子类目,形成了一个十分庞大的树状结构,几

乎涉及所有的行业或者领域。它采用了“纵向成枝、横向成网”、“主题法与分面组配法结合”

的分类方式,根据网站的主题,首先把网站分为18 个大类,再按细分主题层层分下去。然

后,再根据不同用户的使用习惯,以及不同的分类标准,把不同类目下“相关”的类目“链接”

起来,从而形成搜狐的“网状”分类体系。搜狐的网站分类法以主题分类为主设立了娱乐休闲、

工商经济、电脑网络、分司企业、教育培训、文学、艺术、体育健身、新闻媒体、卫生健康、科学技术、生活服务、旅游交通、社会文化、政法军事、社会科学、个人主页17 个大类,

另外结合分面组配的方法设立“国家与地区”类目,把其他 17 个大类下的所有网站又按所属

地域进行分类,因为大多数网站都具有地域性,也便于用户直接查找。搜狐的网站资源目录

同样是按照信息所属的类别,层层点击查找信息,所以用目录时首先要考虑清楚想要查找的

信息属于哪个类别。

6.请了解 google和 baidu 在进行关键词检索中语法的异同,并说明

这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理

解准确度的差异。

百度搜索引擎使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性

的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。

百度搜索引擎的特点

1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的

相关文档
最新文档