信息组织与存储考试

合集下载

信息组织复习资料

信息组织复习资料

信息组织复习资料1.文献著录标准:名解:国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。

目前国际上影响最大,使用最广泛的著录标准有ISBD和AACR.2.文献标引:信息资源的标引,也称文献标引,是指分析文献的内容属性以及相关外表属性,并用特点语言表达分析出的属性或特征,从而赋予文献检索标识的过程。

两个环节:1.主题分析2.转换标识3.先组式语言,后组式语言:依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言、散组式语言。

先组式语言是指标识在编表时(标引前)就已组合好,标引或检索时不必或较少进行组配的标引语言;后组式语言是指标识主要供组配使用。

而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言;散组式语言是指标识主要供组配使用,而且标引时就要表达主题概念的若干个标识组配在一起的标引语言。

4.信息组织的阶段及划分?按职能把信息组织的发展分为三个阶段 a.清册职能时期 b.查检职能时期 c.组织职能时期按组织对象把信息组织的发展分为三个阶段 a.文献组织阶段 b.信息组织阶段c.知识组织阶段。

5.语义信息组织方法:(1)分类组织法(2)主题组织法语用信息组织方法:(1)权重值组织法(2)概率组织法P24判断目前的组织方法属于语义还是语用组织方法。

6.网络信息环境对传统信息组织方式的冲击主要体现在以下方面:(1)信息量剧增以及信息传递速度的加快(2)信息种类增多,数据库成分复杂化,过去主要适用于文本信息的信息组织方法已不敷使用(3)用户成分发生很大变化,用户要求信息组织方式的透明化,易用化。

(4)网络信息资源共享要求信息组织标准化、兼容化。

7 .a.一次信息:①超文本方法②自由文本方法③主页方式b.二次信息:①搜索引擎方法②主题树方法8.主题树方法组织信息资源的优点:a.主题树屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面b.信息检索由用户按照规定的范畴分类系,逐级查看,按图索骥,目的性强,查准率高.c.采用树型目录结构诅咒信息资源,具有严密的系统性和良好的可扩充性.9.下位类:经过一次划分所形成的一系列概念称为子类或下位类上位类:被划分的类称为母类或上位类。

信息组织试题及参考答案

信息组织试题及参考答案

信息组织试题库一、名词解释1.情报检索语言2.信息揭示3.仿分4.倒排文档5.八分法6.信息描述7.层累制8.分类9.UDC10. 信息组织11. 信息标引12. XML13. 关键词法14. 词族索引15. 等级体系分类法16. 语法信息组织法17. 模糊检索18. 多元搜索引擎19. EI Village20. 超媒体存取21. 虚拟图书馆22. 文献分类23.MARC24. SGML25. 文献标引26. 主题词法27. ISBDs28. 顺排文档29. 引证关系组织法30. 双位制(百分法)31. 信息存储32. 双关索引33. 范畴索引34. 组配分类法35. 语义信息组织法36. 书次号37. 文献检索38. 超文本存取技术39. 信息检索工具40. 文献序号索引41. 引文索引42. 题内关键词索引43. DIALOG44. 基本索引字段45. KWOC Index46.PB报告47.分析标引48.类49.概念组配50.主题词款目51.部分标引52.词族53.族首词54.超级组配55.款目主题词56.词间相容关系57.基本部类58.类系59.标识60.专类附表61.情报检索62.二次文献63.报导性文摘64.图书分类65.题录66.PRECIS67.多向成族68.主题法69.标引70.类名71.类目72.类目表73.类列74.基本大类75.基本序列76.简表77.详表78.复分表79.通用附表80.上位类下位类81.同位类82.交替类目83.参见类目84.标记制度85.单纯号码86.混合号码87.顺序制88.分类法索引89.分析分类号90.分类索书号91.单元词法92.经典类符93.著者区分号94.分类互见标引95.相关索引96.叙词法97.小数制98.DDC99.国家档案全宗100.著录项目101.全宗卷102.归档103.档案保管期限表104.目录学105.目录工作106.提要107.分类编排法108.专题书目109.篇目索引110.图书馆111.公共图书馆112.图书馆管理1.仿分以某一类的子目作为复分依据的方法叫仿照复分,简称仿分。

信息技术考试题目及答案

信息技术考试题目及答案

信息技术考试题⽬及答案信息技术培训测试题⼀、判断题(⼤题总分19分,每题1分,共19⼩题)1.交互式电⼦⽩板的⼏何作图功能地主要特点是作图规范,且学⽣易操作A. 正确B. 错误答案:A解析:2.资源要保证按时接收,按时分类整理,并进⾏保存和应⽤A. 正确B. 错误答案:A解析:3.百宝箱中要使⽤的图形(即放在信封下的图形)要设计为拖动副本A. 正确B. 错误答案:A解析:4.为了检测学习者的认知结构以及知识间的关系,最常使⽤的软件是概念图软件A. 正确B. 错误答案:A解析:5.在灵活性⽅⾯,交互⽩板⽐PPT强⼤A. 正确B. 错误答案:A解析:6.Flash是⼀个⽮量动画软件。

A. 正确B. 错误答案:A解析:8.⽹络学习空间只属于技术领域范畴的概念A. 正确B. 错误答案:B解析:9.MOODLE平台可以协助学⽣进⾏⾃主学习与独⽴探索A. 正确B. 错误答案:A解析:10.微课能解决学习者的实际问题A. 正确B. 错误答案:A解析:11.教师应改变观念,调整⾃⼰的教学⽅式,将课堂教学由“教”为主转向以“学”为主A. 正确B. 错误答案:A解析:12.学习⼩组长的学习能⼒就是⼀个班级的学习能⼒,学习⼩组长的学习⽔平就是⼀个班级的学习⽔平,更是⼀个教师的教学⽔平。

A. 正确B. 错误答案:A解析:13.防护罩也是监控系统中最常⽤的设备之⼀A. 正确B. 错误答案:A解析:解析:15.中⼩学教师信息技术能⼒提升⼯程应充分考虑培训主体庞⼤,充分考虑教师群体间的差异性A. 正确B. 错误答案:A解析:16.学科教学⼯作坊不是聚焦⼀个学科的主题。

A. 正确B. 错误答案:B解析:17.教师的专业性指的是教师作为专业⼈员所表现出来的主要特征A. 正确B. 错误答案:A解析:18.在⽹络学习环境中,学⽣的学习材料仅为书本和教师提供的扩展资料A. 正确B. 错误答案:B解析:19.中⼩学的微课⼀般控制在10分钟以内,⾼校微课⼀般控制在15分钟以内。

信息组织与知识管理考核试卷

信息组织与知识管理考核试卷
1.以下哪些是信息组织的主要方法?()
A.分类法
B.标签法
C.数据挖掘
D.数据分析
2.知识管理的目的包括以下哪些?()
A.提高工作效率
B.促进知识创新
C.降低运营成本
D.减少员工培训
3.以下哪些工具可以用于知识共享?()
A.企业内部论坛
B.社交媒体
C.即时通讯软件
D.传统的邮件系统
4.以下哪些是知识管理的核心环节?()
2.隐性知识是难以明确表达的个人经验,显性知识是可以明确表达和共享的知识。通过实践社区、导师制度和经验交流会议等方式可以管理和共享这两种知识。
3.知识检索在信息爆炸时代至关重要,通过使用关键词优化、智能搜索算法和用户行为分析等方法可以提高检索效率。
4.知识共享计划可以包括定期的知识交流会、内部在线论坛和最佳实践文档共享。挑战可能包括文化阻力和技术限制,应对策略可以是培训和激励措施,以及投资于知识管理系统。
B.知识分析师
C.知识工程师
D.知识用户
16.以下哪些方法可以帮助组织管理隐性知识?()
A.故事分享
B.实践社区
C.专家系统
D.知识地图
17.以下哪些因素可能影响信息的组织和检索效率?()
A.信息量
B.信息质量
C.检索系统的复杂性
D.用户的信息素养
18.以下哪些是知识管理系统的关键功能?()
A.知识存储
B.知识检索
C.知识共享
D.知识评估
19.以下哪些技术可以帮助实现信息的快速传播?()
A.社交媒体
B.移动应用
C.电子邮件
D.传统邮政服务
20.以下哪些方法可以用来评估知识管理的成效?()
A.员工满意度调查

信息考试题及答案

信息考试题及答案

信息考试题及答案一、选择题(每题2分,共20分)1. 什么是信息?A. 知识B. 消息C. 数据D. 以上都是2. 信息时代的特点是什么?A. 信息量少B. 信息传播速度快C. 信息获取困难D. 信息不可靠3. 以下哪个不是信息处理的步骤?A. 收集B. 存储C. 分析D. 销毁4. 信息安全包括哪些方面?A. 数据保密性B. 数据完整性C. 数据可用性D. 所有选项5. 什么是数字签名?A. 一种加密技术B. 一种认证技术C. 一种压缩技术D. 一种传输技术6. 以下哪个不是信息传播的媒介?A. 报纸B. 电视C. 互联网D. 电话7. 信息过载是指什么?A. 信息量太少B. 信息量适中C. 信息量过多D. 信息质量差8. 什么是大数据?A. 非常大的数据集B. 非常小的数据集C. 非常复杂的数据集D. 非常精确的数据集9. 信息素养是什么?A. 信息获取能力B. 信息分析能力C. 信息应用能力D. 所有选项10. 什么是人工智能?A. 模拟人类智能的计算机系统B. 增强人类智能的计算机系统C. 替代人类智能的计算机系统D. 所有选项二、简答题(每题5分,共30分)1. 请简述信息的定义及其重要性。

2. 解释什么是信息不对称,并举例说明其在日常生活中的影响。

3. 描述信息时代对个人和组织的影响。

4. 阐述信息安全的重要性及其基本措施。

三、论述题(每题25分,共50分)1. 论述信息时代下,个人如何提升自身的信息素养。

2. 论述大数据时代对企业决策的影响及其应对策略。

四、案例分析题(共30分)某公司最近遭受了网络攻击,导致客户信息泄露。

请分析该事件的原因,并提出相应的预防措施和应对策略。

答案:一、选择题1-5:D, B, D, D, B6-10:D, C, D, A, A二、简答题1. 信息是数据经过加工处理后,能够对决策产生影响的数据。

信息的重要性在于它是决策的基础,是知识经济时代的核心资源。

武汉大学《信息检索》试卷及答案(两套)

武汉大学《信息检索》试卷及答案(两套)

三.选择填空(4 x 5分=20分)1.C,d,g,I,j 2.a,b,e,g,h3.c,d,e,g, h4.c,d,f,g此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。

1.下列中不能用于查找期刊论文引用信息的有:a. SSCIb. CSSCIc. Journal Citation Reportd. Ulrich’s International Directory of Periodicalse. SCIf. A&HCIg. ProQuest Digital Dissertationsh. Web of Knowledgei.VIP Chinese Scientific Journal Databasej.Chinese Enterprises and Companies Database2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有:a. LISAb. ISAc. BAd. CAe. Web of Knowledgef. Eig. SSCIh. SCIi. ProQuest Digital Dissertations3.下列中可用于查找机构信息的有:a. ProQuest Digital Dissertationsb. Ulrich’s International Directory of Periodicalsc.Chinese Enterprises and Companies Databased. Founda tion Directorye. Peterson’s Gradlinef. Who is Whog. World of Learningh. Encyclopedia of Associations4.下列中可用于查找期刊论文信息的有:a. ProQuest Digital Dissertationsb. Ulrich’s International Directory of Periodicalsc. ABI/INFORMd. Elseviere. Journal Citation Reportf. Chinese Academic Journal Fulltext Databaseg. OCLC Electronic Collections Online武汉大学信息管理学院2008-2009学年度第二学期《信息检索》考试试卷(A)答案一、名词解释(5x4=20分)1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

图书馆职称考试——信息组织

图书馆职称考试——信息组织

信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织(P6):信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。

信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。

对信息的描述与揭示以及序化是信息组织的中心内容。

信息组织首先是实现对信息的规范控制,包括对信息形式特征的描述和对其主题内容特征的揭示,在此基础上,采取适当的集成方式予以信息整合,建立有序化的信息系统,实现信息的有效检索和利用。

因此,信息组织是一个信息增值过程。

2.针对传统文献,信息描述(P6)就是文献的描述性编目,或称著录。

机读目录中各字段也是对信息资源的特征描述。

元数据是对网络信息的特征描述。

信息描述是信息组织的重要环节和前提。

广义的信息描述包括信息标引。

信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。

从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。

信息通过特征描述和内容揭示,获得了表示信息的标识,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。

信息系统组织是把经描述和标引的信息实体和信息记录组织成一个有序的系统。

3.信息组织方法(P7):(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。

文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。

信息组织的本质是信息内容的组织(包含大量非文本信息)。

(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法、代码组织法、地序组织法、时序组织法等。

语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。

信息组织期末复习整理资料 最终完整版

信息组织期末复习整理资料 最终完整版

信息组织复习资料第一章信息组织引论1、信息组织:信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。

组织信息的目的是为了检索信息、利用信息。

2、信息组织的诞生与发展:(1)按职能划分信息组织发展阶段1)清册职能时期2)查检职能时期3)组织职能时期(2)按组织对象划分信息组织发展阶段1)文献组织阶段2)信息组织阶段3)知识组织阶段3、信息组织的理论基础(P8)1)系统论a)系统是处于一定相互关系中并与环境发生关系的各组成部分的总体b)整体大于部分之和2)耗散结构理论a)一种自组织结构b)系统内各组成部分有强烈的相互作用c)相互影响、制约,与环境发生交互d)使自身保持稳定,动态有序的活结构3)协同论a)海尔曼·哈克4、信息组织的方法基础(P9)1)语言学a)一种符号系统(形式和内容)b)词(词组)词形、发音、语义、语用2)逻辑学a)形式逻辑b)数理逻辑c)辩证逻辑3)知识分类学a)信息资源的知识分类b)知识分类体系(图书馆图书分类)5、自动分类标引(P15):是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。

分为:1)自动归类自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。

自动归类根据使用的技术通常分为基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)。

2)自动聚类自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定为一类,设法使各类中包含的对象大体相等。

一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。

6、自动主题标引技术(P16):自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括1)自动抽词标引:是指直接从原文中抽取词或者短语作为标引词来描述信息资源的主题内容。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、名词解释1、著录:在编制文献目录时,对文献信息的各种特征进行分析、选择和记录的过程。

也就是说,按照一定的条例或标准,将文献的内容特征(分类、主题)、外表特征(题名、著者、来源出处、出版地、出版者、出版时间等)和物质特征(文献类型、页册数、图表、开本、装订、价格等)加以描述,并记录于目录载体上的工作称为文献信息著录。

2、标题法:标题(标题词)是主题标目的简称,英文名称为Subject Heading,是将通用语言中事物现成的“名”经过词汇控制而成的一种文献主题标识。

标题法是用规范化了的自然语言的语词做标识,直接表达文献的主题内容,通过参照系统揭示各主题之间的各种关系而按字顺排列的主题标识系统。

3、单元词法:单元词又称元词,是从文献中抽取出来并经过控制处理的,能表达文献主题最小、最基本的在概念上不能再分解的,并能独立描述文献所论及或涉及的事物——主题的词汇单位。

4、叙词法:所谓叙词,是取自自然语言,经过规范化处理的,以基本概念为基础的表达文献信息主题的词或词组,我国称为主题词。

5、关键词法:关键词是指在文献的标题、摘要或正文中出现的、对文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。

不做规范化处理或极少规范化处理,文献中现成的词汇,非控制语言,能由计算机进行自动抽词进行标引6、DDC:杜威十进分类法,DDC是用传统的学科来分类,总共以10个主要的学科(main classes)来涵括所有的知识体系,每个大类下细分10类(divisions),接着又再分成10小类(sections)。

DDC中每个学科都会给予特定范围的数字来表示,DDC除了主要的分类表外,另有六个复分表10、信息组织:本质:信息组织是序化信息的一种信息管理活动概念:人们根据信息本身的特点,运用适宜的工具和方法,依据一定的标准和规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。

11、UDC:又称为通用十进制分类法。

国际通用的多文种综合性文献分类法。

1905,比利时目录学家保罗·奥特勒在杜威《十进分类法》基础上编制首先将全部科学知识分为10类,用数字0-9加以分类,每大类又可以添加新的数字0-9,并以此再进行细分。

10.受控语言:是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。

11.自然语言:通常是指一种自然地随文化演变的语言,它是一种由人蓄意为某些特定目的而创造的语言,如英语、汉语等。

二、简答题:1、信息自动聚类的原理1、信息自动聚类的方法和原理自动聚类是指从待分对象中提出特征,再将提出的全部特征进行比较,并根据一定的原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。

一般是在语词共现的基础上,通过词频统计、相似性比较,将相关文献聚集在一起。

自动聚类可以分为基于语词特征的自动聚类和基于非语词特征的自动聚类基于语词特征的自动聚类通过标引词描述文献主题,如果描述文献内容的词汇相同或相近,就把这些文献归为一类。

两篇文献所拥有的共同标引词越多,说明这两篇文献的距离越近,通过计算两篇文献的相似度,生成待进行聚类分析的文献集基于非语词特征的自动聚类文献分类还可以在非语词特征的基础上形成,尤其是基于各种形式的引文链接1)利用直接引文进行文献聚类(A、X、Y;因为X、Y都引用了A,这三者及有可能涉及共同的主题领域)2)运用“引文耦合”原则进行文献聚类(文献X、Y紧密连接是因为它们都引用了文献A、B、C;Z和X、Y连接不是太紧密)3)利用共同被引进行文献聚类(A、B、C共同被X、Y引用)2、切分标记法的过程和原理以下是他的原理过程见书本切分标记法是将能够断开词和词组或表示汉字之间联系关系的汉字集合组成字典,这个字典称为切分标记字典。

切分标记字典中包括的内容有:标点符号、表示汉字之间联系关系的汉字(如词首字、词尾字、不能构词的单字或非用字和条件字)。

切分方法无须构造词典,它根据仿读思路,用字典和模式实现汉子自动标引。

具体切分过程为:用切分标记先将文本分割成词组或短语,再将它们按一定的分解模式分割成单词或专用词。

3、正向最大匹配法原理先说说什么是最大匹配法:最大匹配是指以词典为依据,取词典中最长单词为第一个次取字数量的扫描串,在词典中进行扫描(为提升扫描效率,还可以跟据字数多少设计多个字典,然后根据字数分别从不同字典中进行扫描)。

例如:词典中最长词为“中华人民共和国”共7个汉字,则最大匹配起始字数为7个汉字。

然后逐字递减,在对应的词典中进行查找。

正向即从前往后取词,从7->1,每次减一个字,直到词典命中或剩下1个单字。

4、逆向匹配法原理逆向即从后往前取词,其他逻辑和正向相同。

三、论述题1、信息标引的类型作用通过标引人员把文献和文献用户联系起来,使用户能在大量的文献中,全面、准确、迅速地查找到特定的文献。

信息标引所用的检索语言主要是分类语言和主题语言,因此信息标引就有分类标引和主题标引两种类型。

以及解释。

见书本分类标引的作用:揭示每种书、每篇文章的内容性质,形式体裁,立场观点和读者用途把相同的文献聚集在一起,把不同性质的文献区分开来根据各类文献之间的关系组成一个系统主题标引的作用:主题标引的目的是建立主题检索系统。

以主题标引为基础的主题检索是用户查找、检索文献的重要途径。

主题检索以其直观、专指以及特性检索之特点必将在资源的发现与检索中发挥越来越大的作用。

2、自然语言检索系统在网络信息组织中的应用自然语言检索:全文检索,搜索引擎.首先得益于数字化文本,全文信息源。

全文检索系统是从全文数据库中,通过各种逻辑关系,允许用户使用自然语言进行检索,直接获取原文中的信息。

核心技术:高效索引。

以关键词的形式与索引数据库进行匹配,包括字符串检索、截词检索、位置检索等技术。

搜索引擎的检索思想源起于全文信息检索理论,一般以词为单位。

通过计算机程序扫描每个网页中的每个词,建立词索引。

网络检索工具的近十年的发展,搜索引擎已融合了多种技术完善自身检索能力:智能扩展技术、自动反馈技术、个性化检索、关联检索、检索结果组织等。

3 搜索引擎的工作原理和类型搜索引擎工作原理SEO是对网站开展针对搜索引擎的优化工作,因此了解搜索引擎的工作原理有利于优化工作的开展。

搜索引擎通过一个称之为Spider的程序从一个网页或多个网页出发,逐步遍历网上的文件。

Spider首先解析网页的HTML代码,查找该页面内的超链接,然后根据链接搜索网页,并建立关键字与其所在位置的对照表。

搜索引擎为搜索到的网页建立索引并存入数据库中。

当用户输入要搜索的关键字时,搜索引擎根据输入的关键字从数据库中查找匹配的网页,并将结果返回给用户。

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

纯技术型的全文索引搜索引擎定义:它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut 等,国内著名的有百度(Baidu)。

它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

原理:通过“蜘蛛”(Spider)程序、或爬虫(Crawler)、或“机器人”(Robot)程序,到各个网站收集、存储信息,并建立索引数据库供用户查询。

包括搜索引擎优化、关键词广告、竞价排名、固定排名、基于内容定位的广告等多种形式。

目录索引搜索引擎利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。

目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。

用户完全可以按照分类目录有针对性地逐级查询找到自己所需要的信息,不依靠关键(Keywords)进行查询。

目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。

目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。

其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。

国内的搜狐、新浪、网易搜索也都属于这一类。

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。

著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。

在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo3、复分表在信息分类中运用加上书本上的复分表:在编表时可以把这些相同的子目汇集起来,配以号码,编列成表,附在详表的后面,作为有关类目进一步区分的共同子目,这种表成为复分表或共同区分表复分表按其应用范围,可以分为通用复分表,适用于类目表的任何一级类目;另一种是专类复分表,只适用于某一大类或专门学科。

此外,类目中某些被仿分的子目,也起着专类复分表的作用。

/***利用复分表处理共性区分问题的作用是(1)缩小类目篇幅(2)加强类表的伸缩性(3)增强类表的规律性4、信息标引的方式依揭示文献内容的方式分:整体标引、全面标引、对口标引、综合标引、分散标引、分析标引、互见标引依标引深度分:深标引、浅标引依所用标引与主题概念的对应性分:专指标引、组配标引、上位标引、依附标引、暂定标引依组配标识是否组合分:先组标引、后组标引依所用标识受控程度分:受控标引、自由标引、混合标引依标引的自动化程度分:人工标引、自动标引、半自动标引依标引的实施方式分:独立标引、统一标引、联合标引、在版标引四、分析网络信息数据挖掘结合自己的理解,详细分析网络信息组织的难点并分析如何对网络信息进行重组和深度挖掘?怎样实现个性化主动网络信息服务?网络信息组织的难点:1)海量网络信息以及信息生产、传播速度的加快,对传统信息加工方式提出了挑战。

相关文档
最新文档