国外Folksonomy语义丰富研究综述

合集下载

国内外词汇语义学研究述评

国内外词汇语义学研究述评
主要构 成 元 素 :语 音 、词 汇 和 语 法 。结 构 主义语 言学 把 语 音 视 作 最 初 的 着 眼 点 ,而
词汇 语 义 学 ( 1 e x i c a l s e m a n t i c s ) 是
生 成主 义 语 言 学 则 把 研 究 范 畴 主 要 限定 为 语 法层 面 ,在 语 言 学 研 究 的相 当 长 一 段 时 间里 ,词 汇 得 到 学 术 关 注 程 度 较 低 。令 人 欣 喜 的是 ,2 O世 纪 下 半 叶 以来 ,这 个 现 象 逐 渐得 到改 观 ,学 界 对 词 汇 的 关 注 度 大 为
讨词汇 意 义 的分 支 领 域 ”
( R i c h a r d s&
S c h m i d t 2 0 0 2 :3 0 7 ) 。词 汇 语 义 学 经历 了一 段 悠长 的发 展历程 。“ 词 汇 语 义学 作 为 一 门 学 科始 于 1 9世 纪初 期 ,但 这并 不 意 味 着 在 这之前 就不 讨 论 词 义 问题 ” ( G e e r a e r t s
2 4 8 ) 。
在 上世 纪末 就 指 出 : “ 过去的 1 0年 是 词 汇
语 义 学迅 速 发 展 的 一个 时 期 ” 。进 入 2 1世
纪 以来 ,词 汇 语 义 学 逐 渐 成 为 语 言 学 界 的

个 热点话 题 ,在 国 内外 范 围 内取 得 了数
在词 汇范 畴 ,意义 则 是 最 核 心 的 要 素 。 “ 语 言 中词 汇 的功能 就是 表 达 意 义 ” ( Ha l l i —
42
外语 与翻译
2 0 1 4年第 4期 ( 总第 8 3期 )
2 .研 究 对象

基于在线词表的folksonomy语义关联识别方法研究

基于在线词表的folksonomy语义关联识别方法研究

基于在线词表的folksonomy语义关联识别方法研究魏来2012-10-22 10:12:07 来源:《图书情报工作》(京)2011年5期【英文标题】On Folksonomy Semantic Association Identify Method Based on Online Thesaurus【作者简介】魏来,女,1976年生,讲师,东北师范大学计算机科学与信息技术学院博士研究生,发表论文15篇(长春130117)。

【内容提要】在研究现有folksonomy语义关系发现与识别的基础上,提出基于在线词表的folksonomy语义关联识别的总体思路和方法步骤,重点研究folksonomy语义关联识别的具体规则,制定基于在线词表的直接关联关系识别规则和非直接包含/同源关系识别规则,并利用开放教育领域的在线词表ERIC作为语义基础进行实证研究。

The paper bases on the research of discovering and identifying folksonomy semantic association, puts forward the methods, implement process and identify rules based on online thesaurus, especially semantic association identify rules. At last, the paper processes an experiment based on online thesaurus ERIC.【关键词】folksonomy/语义关联/语义识别/在线词表Folksonomy/Semantic association/Semantic identify/Online thesaurusfolksonomy是Web2.0社会性软件工具应用的典型代表,Thomas Vander Wal 于2004年首次提出并将其定义为:使用人们自己的词表描述网络资源的机制[1]。

Folksonomy理论研究及应用前景

Folksonomy理论研究及应用前景
这 3个 词 语 使 用 频 率 最 高 , 么这 3 词 语 就 组 成 该 作 品 在 那 个
有 限 范 围 内 ( sr~ sr ) F 1sn m 。 U elU e5 的 0k0 0 v
V ne l “ l” “aoo " 合 成 “ oko o v , 为 ad r Wa 将 f k 和 txnmy组 o F lsn m ”作
由社 会 性 书 签 最 具 特 色 的 自定 义 标 签 ( a ) 能 衍 生 而 来 , Tg功 是 We20的 重要 范 畴和 典 型 的技 术 应 用 之 一 。 b.
T g 中国 文 学 十 八 春 a4
T g 张爱玲 a5
文学
十八春
爱情
中国文学
2 F lsn my的涵 义 ok o o
描 述 d 1c . r美 味 书 签 ) Fik( 亮 图片 夹 ) 个 网 站 eii0 ( . ou 和 l r闪 c 两
所发展出的信息架构的术语 。 Fl : o 意思 是广 大成 员 、 k 人们 , 达 了 F lsn m 表 oko o v作 为
We20环境 下 社 会 化 软 件 (oil o w r) 大众 性 。 会 性 b. Sca Sf a 的 t e 社 软 件 是 指 任 何 支 持 群 体 交 流 的 软 件 , 核 心 内涵 在 于互 联 网 其

随着 以 Bo ( l 博客 )S S 社会性 网络 服务 )R S聚 合 、 g 、N ( 、S
B o m r( ok ak 社会 性书签 ) 等社会 性服 务为代表 的新一代互 联
网 ( b .) 术 的 广 泛 应 用 ,种 “ 民织 网 ” 新 形 态 互 we2 技 0 一 全 的

国内外三语习得研究综述与分析论文

国内外三语习得研究综述与分析论文

国内外三语习得研究综述与分析论文国内外三语习得研究综述与分析论文一、研究背景长期以来,语言学界将多语研究的重点聚焦于双语研究。

然而,科学技术和社会的快速发展使人们的交流需求增强,这种交流可能是跨区域、跨语言、跨文化的。

在此背景下,多语研究的必要性和重要性日益凸显。

三语习得研究作为近年来国际和国内研究的一个新领域,引起了国内外学者的广泛关注。

本文通过对国内外有关三语习得的文献进行梳理,剖析了国内外三语习得研究现状及其特点,并通过对比国内外研究成果,对三语习得后续研究的发展做出展望。

二、国外三语习得研究综述国外的三语习得研究肇始于Hoffman和Thomas的研究。

Hoffman 的著作Language Acquisitionin Two Trilingual Children 是三语习得研究的典型作品。

Hoffman 在此研究中主要从语言学、社会学和心理学这三方面跟踪调查两个从小同时学习德语和西班牙语的小孩的语言发展与习得。

在此期间,Cenoz,Gorter,Kemp &Jorda 等学者对三语习得研究的发展做出了巨大贡献。

Cenoz & Gorter探究了在巴斯克语、英语和西班牙语三语环境下写作技能的培养,并用不同方法来探究这三种语言之间的联系与交互。

语言学家Kemp给多语现象下了定义,他所提及的影响元语言意识的变化因素为三语习得研究带来了新的视野,包括语言习得者同时掌握的`两门语言,学习者的读写能力、成熟度、学校教育等因素。

Jorda基于言语行为和语用能力的分析,阐述了三语语用意识的产生以及影响。

语言学家De Angelis 探究了习得的语言之间的距离、近因的使用、语言习得的顺序、文本的形式和对目标语与源语言的熟练程度。

三、国内三语习得研究综述与国外的三语习得研究相比,国内的三语习得研究直到20 世纪90 年代中后期才开始,起步较晚。

从已有的三语教育研究成果可知,国内三语研究对象主要针对少数民族,尤其是少数民族学生。

Folksonomy在高校图书馆OPAC中的应用

Folksonomy在高校图书馆OPAC中的应用

科技情报开发与经济SCI-TECH INFORMATION DEVELOPMENT&ECONOMY2010年第20卷第5期如今Web2.0“以人为核心”的思想已经逐步渗透到人们的生活。

2005年国内外纷纷掀起Web2.0相关议题与应用的信息潮流,其中指出:Web2.0的核心精神为关注使用者层面,强调“使用者可以控制自己所拥有的资料”,这种理念也成为Folksonomy受到重视的主要原因。

Folksonomy是由社会性书签服务中最具特色的自定义标签(Tag)功能衍生而来,它的概念出现晚于应用,这种现象源于一些社会化网络软件。

其中最著名的有分享书签网站()、相片分享网站(Flickr)、目标分享网站(43-Things)等。

它们都巧妙地将Tag功能运用其中,配合他们独特的易用性,一定程度上引起了Tag以及Folksonomy的流行。

1理论基础由于成本和效益的因素,过去人们只能关注重要的人或重要的事。

如果用正态分布曲线来描述这些人或事,人们只能关注曲线的“头部”,而长尾理论认为应该更加关注处于曲线“尾部”,需要更多精力和成本才能关注到的大多数人或事。

长尾理论与图书馆有很好的适应性。

图书馆的文献资源利用率遵循著名的“二八原则”,即80%的用户使用图书馆资源总量的20%,绝大多数馆藏资源没有被有效利用。

根据长尾理论可知,要让所有东西都能被使用者找到,也就是使所有文献都有可能被读者利用,这将有助于80%的书籍的使用。

Folksonomy的兴起和迅猛发展在信息内容的增长、信息的传播、信息提供与信息需求的匹配等方面为长尾的显现提供了驱动力,这种驱动力也将促使信息服务领域中传统二八定律向现代长尾分布的转变。

2国内外现状调查显示,目前国内外图书馆OPAC采用Folksonomy相对较少,总体上仍属于试验性探索服务阶段,实质性应用极少,因此要对这些应用进行认真细致的分析研究。

而图书馆恰恰可以利用Folksonomy的理念和技术,串联起内容、技术和用户,实现互动,给图书馆网络信息服务注入新鲜力量,达到以用户为中心的终极目标。

Folksonomy

Folksonomy

鬆散、未事先製定
大眾化、與個人背景、社會文化相關、共享 相當主觀,品質參差不齊 較具彈性、易變動 品質不一 成本低、瀏覽 貼近使用者,不需訓練
架構嚴謹、事先製定
放諸天下皆準的知識體系 具權威性 較精確 品質高 成本高、檢索率高 接受訓練後使用
有效組織資訊,方便再擷取利用
Folksonomy使用的索引方式
Folksonomy的應用(3)
Folksonomy的應用(4)
Folksonomy的應用(5)
Folksonomy的應用(6)
Folksonomy的應用(7)
Folksonomy的應用(8)
Folksonomy的應用(9)

標籤雲(Tag Clouds)
Folksonomy的優點
總 數
a+c
b+d
a+b+c+d

精確率= a /a+b = 檢索所得之相關筆數 / 檢索所得之所有書目筆數 回收率= a /a+c = 檢索所得之相關筆數 / 資料庫中所有相關筆數 (為未知數) 雜訊比= b /b+d =檢索出之不相關筆數 / 資料庫中所有不相關筆數

標記的選擇

由使用者提供,貼近使用者認知 對於網路資源的瞭解不夠全面、對標記詮譯太過主觀
由使用者下標記,個人文化背景、知識領域、知識水準的參差不齊

標記的品質


隨著標記數量愈來愈多,若能有效利用,將有助於品質的改善 其資訊關聯性是隱性,需要使用者自己發掘

資訊關聯的創造

Folksonomy對圖書資訊服務的影響與應用(2)
Folksonomy的發展(1)

关于Folksonomy的基本架构及其功能模式的研究

关于Folksonomy的基本架构及其功能模式的研究
刘 娟 凤
( 中国农业大 学 图书馆 ,北京 109) 0 13
[ 摘 要)对 Fl oo y o s m 网格 架构和互联关 系 kn 进行 了剖析 ,利用基于互联 关系的共现分析的原理 ,探讨 了其信息 自 组化 管理
的基本功能模 式。以期有助于 Flsnm o oo y的深度 开发和应用。 k [ 关键词】Flm o ;网络结构 ;网络性质 o nmy k
[ e od ]Fl oo y e o t c r;ntokp pre K yw rs o snm ;nt r sut e ewr m els k wk r u i 步入互联 网 w b . e20时代 ,为满足用户在 网际环境下 参 管理和检索 ,对上传或需 要备档 的资源 ,基于用 户对资 源
21 年 3 01 月 第 3 卷第 3 1 期

现 代 情 报
Ju lo o ma fMoe Ifr t n d m noma o i
Ma . 2 1 r , 01
V 13 Nl 3 0. 1 0 .
业 务 研 究 ・
关 于 Flsnm o oo y的基 本 架构 及 其功 能模 式 的研 究 k
Fl oo y收藏保存 ,加 入系统供其他用户共享。标 引过程 o snm k
涉及用户 ,标签和资源三元组 要素 。三元组元 素 间因多 向
连接而形成为一个 复杂 的交互 作用 的信 息网格 :用户 在共 享相 同的标签和/ 或资源 中与其他人产生间接的联系 ;标签 因标记 同一资源对 象而发生关 联 ;资源 因同一标 签标 注而 被聚类。随着协 同标引过程的进行 ,系统不断生成并扩大 ,
的理解 ,用 自由语 言 作 为标 签 ,对 资源 进 行标 注,并 由

卡明斯诗歌“orounDmoon”的多模态功能解读

卡明斯诗歌“orounDmoon”的多模态功能解读

0 . 引言 卡明斯 ( e � e � cum m i n gs) ,生于 189 4 年, 卒于
( 王红阳 , 信息交际纳入分 析框 架 ( 辛志 英,2 008 ) " 2 007 ; 张旭红 , 2 01 0) � 回顾视觉诗的研究历程, 多模态话语分析理论越
19 6 2 年, 美国 诗人 � 画家 � 卡明斯 创作 的很 多诗歌, 来越受青睐, 相信将逐步成为视觉诗分析的主流 � 针 "在结构 和技巧上明显地 带有现代主义倾 向 " ( 王红 对这样的情况, 本文以卡明斯的"o ( rounD ) m oo n" 为 2 007 ) �"语法变异 " , "书写变异 " "独特的形象 例, 阳, 和 尝试以多模态话语分析为理论框架对之做出解读 � 设计 "( 徐艳萍, 杨跃,2 005) 是卡明斯诗歌的主要特 点� 卡明斯的诗歌, 亦诗亦画 , 可读可赏, 卡明斯由此 2. 系统功能语言学框架内的多模态话语分析 成为二十世纪视觉诗的代表诗人� 兴起于上世纪 9 0 年代的多模态话语分析理论, 为 视觉诗的研究"提供 了一套同时分析视 � 听和文字互相兼容的系统研究体 " ( , 2 010 ) � 系 张旭红 1. 视觉诗 1 .1 视觉诗的定义 2 .1 韩礼德的纯理功能思想 "韩礼德系统功能语法的核心内容是关于语言的 ( 王红阳 ,2 007 ) � 韩礼 德 ( 1 9 9 4 ) 指 纯理功能思 想 " 出, 语言在人们的社会生活中主要有三大作用 , 即概念 � �" 功能 人际功能和语篇功能 概念功能是代表或 反 映或解释世界的功能, 人际功能是交际参与者分配角 色和对语篇作出判断的功能, 语篇功能是用各种语言 手段将语篇中的各个句子连接成一篇连贯的文章的功 ( 方琰 , 2 005) � 能" 2 .2 模态 � 多模态和多模态语篇 模态指的是"交 流的 渠道 和媒介 , 包 括语 言� 技
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

国外Folksonomy语义丰富研究综述魏来2012-12-25 10:12:42 来源:《情报资料工作》2010年03期【英文标题】Review of the Research of Semantic Enrichment of Folksonomy Abroad(Academy of Computer Sciences and Information technology Northeast Normal University, Changchun, 130117)(National Science Library, Chinese Academy of Science, Beijing, 100080)【作者简介】魏来,女,1976年生,东北师范大学传媒科学学院讲师,中国科学院国家科学图书馆博士研究生。

东北师范大学计算机科学与信息技术学院长春130117中国科学院国家科学图书馆北京100080【内容提要】文章对国外folksonomy语义丰富的理论与实证研究进行了全面的梳理,从folksonomy的聚类、推荐、关联和实证四个方面探讨folksonomy 语义丰富的方法和途径,优化网络信息资源组织。

The paper comprehensive researches the theory and practice of folksonomy semantic enrichment, including folksonomy clustering, suggesting, relating and practicing.【关键词】folksonomy/语义丰富/语义folksonomyfolksonomy/semanticenrichment/semantic folksonomyFolksonomy由Thomas Vander Wal于2004年首次提出[1],是Web2.0社会性软件工具应用的典型代表。

目前,已经在各种社会性网站上广泛应用,如社会性书签服务[2],flickrt[3],社会性编目网站标注服务librarything[4],BibSonomy[5]等。

Folksonomy作为一种自底向上的公众分类方法,能够作为集体智慧的体现,提供流行的、反映用户兴趣的标签,具有简单、丰富、流行和多样的特点。

但随着标签数量的增加,folksonomy的进一步应用出现了一些制约因素,如标签的歧义,平面延展的标签结构,标签之间的语义关系等,这些问题会制约标签进一步使用。

解决这些问题的主要方法是为folksonomy提供一定的语义关系,即folksonomy语义丰富。

WellerK于2007年指出folksonomy能够从现有的知识组织系统中获得标签控制和语义关系的构建原则,同时提供有用的语义丰富知识组织系统,改进现有的分类法、叙词表或本体[6]。

国外研究人员对该领域的研究较为活跃,本文从folksonomy语义丰富的几个核心问题——聚类、推荐、关联及实证出发,探寻国外folksonomy语义丰富的主要方法和途径。

1 Folksonomy的标签聚类研究相同或相似标签能够通过一定的聚类方法聚集在一起,形成基于用户兴趣的标签集合。

根据标签聚类目的,标签聚类方法可分为相同标签聚类和相似标签聚类两种。

1.1 相同标签的聚类方法相同标签聚类方法的目的是将意义相同或描述主题相同的标签聚类(如“folksonomy”和“folksonomies”),主要有三种方法。

(1)词根还原方法(Stemming algorithms)。

词根还原方法是从单词中抽取词根聚类相同词根标签的方法。

如“links”和“linked”经过词根还原算法都聚类在“link”标签下。

Hend S等人在文献[7]中使用了词根还原算法标准化处理标签,将相同词根的标签聚集在一起。

(2)字符串距离测度方法(String distance metrics)。

字符串距离测度方法是测度标签字符串之间区别的方法。

最常用的是Levenshtein算法,即计算两个字符串之间的编辑距离,这个“距离”是从源字符串变换到目标字符串需要进行的删除、插入和替换的最少次数。

L.Specia和E.Motta在文献[8]中使用了Levenshtein算法,从形态学上聚合词形与语义相同的标签。

(3)在线资源探测方法(Exploiting on line resources)。

使用在线资源如Word Net,google等进行标签控制,如标签的拼写,单复数和词形规范等,同时找出相同标签集合中有代表性的标签。

L.Specia和E.Motta在文献[8]、Van Damme C.等人在文献[9]中建议使用在线资源检验标签的方法聚类相同标签。

1.2 相似标签的聚类方法1.2.1 标签的相似性测度方法标签相似性测度是进一步处理标签数据的基础,通过标签的相似性计算能够聚类相似标签进而推断标签之间的语义关联。

Cattuto、Markines等人在文献[10-13]中提出了不同的folksonomy标签相似性测度的方法。

(1)基于folksonomy三元组结构的相似性测度。

Mika在文献[12]中中将folksonomy作为来自社区的语义结构,建议通过揭示标签之间的语义关系构建folksonomy本体,利用folksonomy的三元组结构{用户,标签,资源}通过资源的共现来建立标签之间的关系,通过计算标签共现的次数计算标签之间的相似性。

(2)Jaccard index相似性测度。

Beglman等人在文献[13]中使用Jaccard index相似性测度方法,采用标准化的共现方法测度标签的相似性。

具体的算法为:其中,A是使用标签a标注的文档集,B是使用标签b标注的文档集。

(3)分布式聚类和余弦相似性测度。

Markines在文献[11]中提出了基于三个不同向量空间背景的测度方法,其中Tag-TagContext为每一个标签向量同其他标签向量共现;Tag-Resource Context为标签t标注资源的频次;Tag-User Context为用户u使用标签t的频次,使用余弦相似性算法计算标签相似性。

(4)folksonomy内部相似性测度评价框架和互信息测度(MutualInformation Measure)。

互信息是信息论中的一种信息度量,指两个事件集合之间的相关性。

Markines等人在文献[11]中提出了基于互信息测度的相似性测度方法,并提出不同测度类型的评价框架,包括标签之间的测度及被标注资源的测度方法。

1.2.2 相似标签的聚类方法(1)谱平分聚类方法(Spectral Bisection Clustering)。

基于Laplace特征值的谱平分聚类方法根据Laplace图谱的次小特征值和第三小特征值对应的特征向量,构成聚类样本并显示出来。

Begelman等人在文献[13]中发现标签同时出现的频率会在一个临界点变化显著,可以根据这个临界点确定两个标签之间是否相关,使用谱平分聚类算法对标签进行了聚类分析,从Raw-Suar网站抽取30000个标签进行试验。

(2)文档向量空间聚类方法(Vector Space Model)。

文档向量空间聚类方法是计算文本之间距离或相关度的方法。

HeymannP在文献[14]中,使用向量空间聚类方法。

从网站搜集60000个标签,根据标签的向量相似度确定相关标签,将相关标签连接成无权重的无向图,采用相关算法将无向图转换为层次结构的分类树。

Daniel Ramage、YusefHassan-Montero和VíctorHerrero-Solana等人在文献[15-16]中,使用kmeans聚类方法扩展向量空间模型。

Miranda Grahl等人在文献[17]中,使用k-means聚类算法和folkrank排序算法构建了数据的三个等级概念结构。

(3)共现聚类方法(Co-occurrence Clustering)。

Cattuto等人在文献[18]中指出标签共现可以用语义描述,标签的相似性被认为是标签之间的一种语义关系,可通过标签之间的相对共现进行评价,能够揭示协作标注系统中的语义关系,如标签之间的同形异义、同义和等级关系等。

P.Schmitz在文献[19]中使用基于包容算法的模型,抽取标签的共现关系,聚类标签并发现相关标签。

Begelman 等人在文献[13]中将标签作为一个无向图,将标签共现频次作为向量,并赋予标签共现的值,来完善标签聚类的结果。

X.Wu等人在文献[20]中基于标签、资源和用户的共现,生成语义关联的标签组。

从目前国外研究进展来看,以上几种标签聚类方法都被普遍的采用,并通过具体的数据来检验聚类的效果。

其中,共现聚类方法应用最多,同时共现聚类方法能够同其他的方法结合使用,以优化聚类的结果,发现与识别标签之间的语义关系。

2 Folksonomy标签推荐方法研究标签推荐能够为用户提供与关键词匹配良好的资源,标签推荐方法的目标是通过有效的解决标签缺少等级结构问题来处理标签服务中出现的各种问题[21],对标签推荐方法的研究包括定量分析和推荐算法两个方面。

2.1 定量分析E.H.Chi和T.Mytkowicz在文献[22]中评价了早期delicious数据有效导航的价值,指出标签随着时间增加,top标签不能支持随时间变化的有效导航。

R.Li 等人在文献[23]中探索了标签共现网络,提出ELSABer标注空间浏览方法,即基于相似性和语义等级发现标签子集的方法,实现语义浏览、层次浏览和有效浏览。

E.Santos-Neto等人在文献[24]中研究了Citelike和Bibsonomy服务,探索促进导航的模式。

2.2 推荐算法(1)K-way算法。

在文献[13]中使用k-way方法代替spectral clustering,该方法实现了更好的聚类质量,并且比spectral clustering方法易于使用,效果更好。

(2)向量空间算法与TP-IDF算法。

文献[25]中扩展了推荐资源内容的选择,分析了标签描述博客内容的有效性,通过构建标签向量空间,有效的分类博客内容。

(3)基于相似性的folkrank算法。

Hotho等人在文献[26]中提出了folkrank 算法,用于排序和关联folksonomy元素。

其指导思想是被重要用户使用重要标签标注的资源也是重要的,folkrank算法的目的是计算一个给定标签的相关标签的排序列表。

(4)基于启发式规则和深度句法分析的等级分类体系。

Eric Tsui等人在文献[27]中提出了基于启发式规则和深度句法分析的方法,处理核心的分类数据集,生成等级的结构促进用户信息导航行为并体现个性化特征,获取的标签能够整合到分类体系中,以自动的方法完成分类等级构建的过程。

相关文档
最新文档