信息著录与信息标引

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息著录与信息标引

当今我们正处于一个信息爆炸的时代。此时信息呈现出几大特点,一是数量多,增长快,尤其是在网络环境下,这一特点表现得更加突出。例如清华同方的《中国期刊全文数据库》,通过对2006年11月28~30日3天该数据库公布的新增论文数量的统计,平均每天增长23228篇。由此可见,网络环境下,文献信息资源的数量非常庞大且增长速度惊人。[1]二是新词层出不穷,据中国语言文字工作委员会做过的一个保守统计,平均每年产生800多个新词语。

[2]在这种资源种类纷繁复杂,标准不一,十分不方便用户使用的情况下。要有一个方法来描述信息资源是非常必要的,否则,用户在未浏览完信息而只看其外在形式的情况下,是无法了解信息的概况,以判断信息资源是否符合自己的需要的。

因此,信息的著录就显得尤为重要。著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。[3]有了信息的著录,用户就可以在未读过文献的情况下,浏览信息著录的结果——款目或目录来对文献信息进行大致了解。随着信息数量的急剧增多,信息著录的标准化和自动化也越来越成为信息著录的发展方向,其将使得用户在使用信息的款目和目录时更加地快捷和准确。由此我国也在2004年出版了最新的《新编中国机读目录格式使用手册》,下面就以其为范例对什么是信息著录进行一个解释。

由于《新编中国机读目录格式使用手册》设置了184个字段,我们将主要介绍其数据字段区的常用字段。如美国作家丹·布朗的小说《数字城堡》,我们要著录这本文献,首先是其001记录控制号:0120********

其中0表示受编文献为普通图书,1表示受编文献语种为中文,20**为编目的年(由编目时间决定),******为编目流水号(视具体编目时的顺序决定)。

其次为010国际标准书号和011国际标准连续出版物号字段:010##$a7-02-004814-5$dCNY25.00(由于其不是连续出版物,所以不用011国际标准连续出版物号字段)

其中010##表示这是010字段,$a7-02-004814-5表示其ISBN号,$dCNY25.00表示其定价为人民币25元。

再次为102出版或制作国别字段:102##$aCN$b110000

102##表示从这里开始后面为102字段,$aCN表示这本文献是中国出版的,$b110000则表示具体的出版地点是北京。

然后是200题名与责任说明字段:2001#$a数字城堡$d DIGITAL FORTRESS$f(美)丹·布朗著$g朱振武[等]译$zeng

2001#表示的意思同上,但其中的1表示其题名“数字城堡”将作为检索本文献时的检索点,接着$a数字城堡是指其题名,$dDIGITAL FORTRESS是与前一项并列的英文题名,$f(美)丹·布朗著$g朱振武[等]译则是其作者和翻译者的名字,最后$zeng是指其并列的题名是用英文写的。

210出版发行等字段:210##$a北京$c人民文学出版社$d2004

210##意思同上,$a北京是出版发行者的地址,$c人民文学出版社是出版发行者的名称,$d2004是出版发行的日期。

………

以上就是一些简单的信息的著录,有了这些著录,我们将能较准确地确定信息的一些特

征。通过这些特征我们将能清楚地分辨不同的信息,不至于把相似甚至不同的信息混淆起来而难以检索到有用的信息,用户也将能快速准确地知道一份信息是否符合自己的需要。

现在信息已经按照统一的标准著录起来了,只要找到著录的款目用户将可以知晓信息的概况以为己所用,但用户还需要通过一定的方式来查找到所需学科资料的款目或目录,这就不得不提到信息标引。信息标引,原来多称文献标引,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。[4]标引主要分为分类标引和主题标引。分类标引实质上就是对文献进行分类。[5]有名的《中国图书馆分类法》就是运用分类标引的例子。其包括“马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类。

具体如下:A 马克思主义、列宁主义、毛泽东思想、邓小平理论 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济G 文化、科学、教育、体育H 语言、文字I 文学J 艺术K 历史、地理N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、劳动保护科学(安全科学)Z 综合性图书

由此可以看出,其是用英文字母给不同的分类分别做代号,要查找经济方面的图书资料就只要到F大类下面去找,其下面的资料都是关于经济的,用户可以自己选取自己需要的资料,这样就极大的方便了用户。

主题标引则是用受控的自然语言语词来表达所要标引的主题概念。如国务院公文主题词表:

……

05.财政、金融(57个)

05A财政预算决算核算收支财务会计税务税率审计债务积累经费集资收费资金基金租金拨款利润补贴折旧费附加费固定资产

05B金融银行货币黄金白银存款贷款信贷贴现通货膨胀交易期货利率利息贴息外汇外币汇率债券证券股票彩票信托保险赔偿信用社现金留成流动资金储蓄费用侨汇折旧率

……

那么按照上表,我们在遇到有关美元、日元、欧元等其他国家或地区的货币资料时就应该用外币这个主题词来标引,而不是用其他的自然语言来标引。这样用户在搜索资料时,只要输入外币这个主题词,就可以得到有关其他各个国家货币的资料。因此如果使用了主题标引,用户在搜索时只要明白自己所要找的是哪方面的资料,就可以搜索到此方面的许多资料,然后再慢慢挑选,这是极为方便和容易的,可以满足不是很专业的用户的检索需求。所以今后我们的信息标引也应该朝着通俗易懂、标准化和自动化方向发展,以更好地满足用户的要求。

[1] 刘竟朱书梅侯汉清网络环境信息标引的测评与比较研究. 中国图书馆学报(双月刊),2008(1)

[2] 同上

[3] 马费成胡翠华陈亮信息管理学基础[M]. 武汉:武汉大学出版社,2002

[4] 同上

[5] 同上

10级图书馆学

相关文档
最新文档