我国图书馆微博研究综述

2012年10月湖北第二师范学院学报

Oct．2012第29卷第10期

Journal of Hubei University of Education

Vol．29

No.10

我国图书馆微博研究综述

王树芳

(黄冈师范学院图书馆，湖北黄冈438000)

摘

要：本文梳理了近几年我国图书馆微博研究的文章，从微博的特征、图书馆微博的类型、微博在图书馆中的应用、图书馆微博应用现状调查、国外图书馆微博研究、图书馆微博存在的问题及对策等方面进行综述，以促进我国图书馆微博研究的进一步发展。

关键词：图书馆微博;微博应用;研究综述收稿日期:2012－07－27

中图分类号：G205

文献标识码：A

文章编号：1674-344X （2012）10-0129-04作者简介:王树芳(1969－)，女，江苏邳州人，助理馆员，研究方向图书馆管理与服务。

微博，即微博客（Micro-blog ）的简称，是一个基于

用户关系的信息分享、传播以及获取平台，具有共享性、互动性、即时性等特点，一经推出就受到网民的强烈推崇，用户数呈现爆发式增长，社会各界都把微博作为宣传推广和信息交流的平台加以应用。我国图书馆界也探索把微博应用到图书馆信息服务中去，而微博在图书馆信息服务中的应用，将深刻影响图书馆的服

务理念、

服务内容、服务手段、服务效率。随着微博在图书馆服务中应用的发展，图书馆微博研究也引起了研究者的广泛关注，近两年研究图书馆微博的论文快速增长。笔者文章利用文献调查法，对我国研究图书馆微博的文献进行梳理，以期在一定程度上反映我国图书馆微博研究的主要内容及现状，为今后图书馆微博的研究打下基础。

一、研究概述

国外最早推出的微博是Twitter ，国外图书馆微博

的应用和研究稍早于国内，

其取得的理论成果和实践经验也多于国内，国外有关图书馆微博研究多从图书馆服务的推广、信息交流平台的应用、社交网络服务应用等方面展开。

关于国内图书馆微博的应用与研究，笔者通过梳理近几年（从微博出现的2006年到2012年8月）发表的我国图书馆微博研究的论文，试图勾画出大致的轮

廓。笔者通过中国知网中的《中国期刊全文数据库》

、《中国博士学位论文全文数据库》、《中国优秀硕士论

文全文数据库》

、《中国重要会议论文全文数据库》、《中国重要报纸全文数据库》进行论文调查统计，以题名为检索项，以“图书馆”为第一检索词进行模糊检

索，然后以“微博”为第二检索词在检索结果中再进行

模糊检索，共检索出以图书馆微博为研究主题的论文105篇（检索时间为2012年8月7日），其中中国期刊

网全文数据库102篇，

中国博士学位论文全文数据库0篇，中国优秀硕士学位论文全文数据库0篇，中国重

要会议论文全文数据库0篇，中国重要报纸全文数据

库3篇。下面对论文发表年度分布情况列表统计并作分析：

表1

图书馆微博研究论文年度分布表年份2006200720082009201020112012数量

从表1可以看出，我国图书馆微博研究起步于2009年。李华、赵文伟的《微博客：图书馆下一个网络新贵工具》是最早发表的图书馆微博研究论文，在这

篇文章中，

研究者主要结合微博客的代表———Twitter ，对微博客的概念、起源与发展进行了概述，对国内外著

名的微博客网站与影响，

微博客在政界、企业、科技、新闻报道等社会各界的应用进行罗列与说明，作者对微

博客在图书馆中的应用前景进行分析。［1］

2010年发表的研究图书馆微博论文11篇，不少研究者开始关注这

一话题，

到2011年和2012年上半年，研究图书馆微博的论文开始出现井喷，分别为55篇和38篇，表明图书馆微博研究开始成为图书馆界研究的新的增长点。同时由于微博出现时间比较短，在图书馆服务中的应用

还处在探索阶段，

以图书馆微博作为主题进行研究的博士和硕士论文还没有出现，除了少数高校图书馆微

博立项的课题，

还没有国家和省级立项课题，图书馆微博研究还有待进一步深入，获得更多研究者的关注。

二、研究内容

梳理近几年我国图书馆微博研究的文献，可以看出有关图书馆微博研究主要集中在以下几个方面：

1．微博的特征

关于微博的特征，研究者在研究图书馆微博时，基

本都有论述。归纳研究者的观点，

微博的特征表现为·

921·

数据挖掘研究现状综述

数据挖掘引言数据挖掘是一门交叉学科，涉及到了机器学习、模式识别、归纳推理、统计学、数据库、高性能计算等多个领域。所谓的数据挖掘（Data Mining）指的就是从大量的、模糊的、不完全的、随机的数据集合中提取人们感兴趣的知识和信息，提取的对象一般都是人们无法直观的从数据中得出但又有潜在作用的信息。从本质上来说，数据挖掘是在对数据全面了解认识的基础之上进行的一次升华，是对数据的抽象和概括。如果把数据比作矿产资源，那么数据挖掘就是从矿产中提取矿石的过程。与经过数据挖掘之后的数据信息相比，原始的数据信息可以是结构化的，数据库中的数据，也可以是半结构化的，如文本、图像数据。从原始数据中发现知识的方法可以是数学方法也可以是演绎、归纳法。被发现的知识可以用来进行信息管理、查询优化、决策支持等。而数据挖掘是对这一过程的一个综合性应用。

目录引言 (1) 第一章绪论 (3) 1.1 数据挖掘技术的任务 (3) 1.2 数据挖掘技术的研究现状及发展方向 (3) 第二章数据挖掘理论与相关技术 (5) 2.1数据挖掘的基本流程 (5) 2.2.1 关联规则挖掘 (6) 2.2.2 .Apriori算法：使用候选项集找频繁项集 (7) 2.2.3 .FP-树频集算法 (7) 2.2.4.基于划分的算法 (7) 2.3 聚类分析 (7) 2.3.1 聚类算法的任务 (7) 2.3.3 COBWEB算法 (9) 2.3.4模糊聚类算法 (9) 2.3.5 聚类分析的应用 (10) 第三章数据分析 (11) 第四章结论与心得 (14) 4.1 结果分析 (14) 4.2 问题分析 (14) 4.2.1数据挖掘面临的问题 (14) 4.2.2 实验心得及实验过程中遇到的问题分析 (14) 参考文献 (14)

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.360docs.net/doc/fd3354480.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

GIS技术的研究现状及未来发展趋势.

GIS 技术的研究现状及未来发展趋势摘要:GIS 是随着计算机技术发展而形成的一门新兴技术,其应用程度和范围也随之渗透、延伸,得到了人们的广泛关注。该文综述了地理信.息的发展现状,从多个角度分析当前 GIS 技术发展存在的不足,并在此基础上研究分析了 GIS 技术的未来发展趋势。关键词:GIS 研究现状发展趋势 0 引言随着计算机技术的飞速发展、空间技术的日新月异及计算机图形学理论的日渐完善, GIS(Geographic Information System技术也日趋成熟,并且逐渐被人们所认识和接受。近年来, GIS 被世界各国普遍重视,尤其是“数字地球”概念的提出,使其核心技术 GIS 更为各国政府所关注。目前,以管理空间数据见长的 GIS 已经在全球变化与监测、军事、资源管理、城市规划、土地管理、环境研究、农作物估产、灾害预测、交通管理、矿产资源评价、文物保护、湿地制图以及政府部门等许多领域发挥着越来越重要的作用。当前 GIS 正处于急剧发展和变化之中,研究和总结 GIS 技术发展,对进一步开展 GIS 研究工作具有重要的指导意义。因此,本文就目前 GIS 技术的研究现状及未来发展趋势进行总结和分析。 1 GIS 研究现状及其分析 1.1 GIS研究现状世纪 90年代以来,由于计算机技术的不断突破以及其它相关理论和技术的完善, GIS 在全球得到了迅速的发展。在海量数据存储、处理、表达、显示及数据共享技术等方面都取得了显著的成效,其概括起来有以下几个方面 [1]:①硬件系统采用服务器 /客户机结构,初步形成了网络化、分布式、多媒体 GIS ; ②在 GIS 的设计中, 提出了采用“开放的 CIS 环境” 的概念, 最终以实现资源共享、数据共享为目标; ③高度重视数据标准化与数据质量的问题, 并已形成一些较为可行的数据标准; ④ 面向对象的数据库管理系统已经问世, 正在发展称之为“对象 --关系 DBMS (数据库

国内微博研究现状综述_王莹莉

国内微博研究现状综述＊王莹莉　张　敏【摘　要】本文采用文献计量和社会网络分析方法，从时间分布、期刊分布、作者分布以及研究主题等方面，对微博研究现状进行统计分析。目前，微博研究在传播特征及运作机制上已有一定基础，但对于微博发展至关重要的用户交互行为，基于用户关系的信息组织和聚合共享，以及如何引导和规范集体智慧方面，还尚未形成系统的研究框架。【关键词】微博　研究现状　文献计量　统计分析Ａｂｓｔｒａｃｔ：Ｕｓｉｎｇ　ｔｈｅ　ｍｅｔｈｏｄｓ　ｏｆ　ｂｉｂｌｉｏｍｅｔｒｉｃｓ　ａｎｄ　ｓｏｃｉａｌ　ｎｅｔｗｏｒｋ　ａｎａｌｙｓｉｓ，ｔｈｅ　ａｒｔｉｃｌｅ　ｍａｋｅｓ　ａ　ｓｔａｔｉｓｔｉｃａｌａｎａｌｙｓｉｓ　ｏｎ　ｔｈｅ　ｒｅｓｅａｒｃｈ　ｓｔａｔｕｓ　ｏｆ　ｍｉｃｒｏｂｌｏｇｓ　ｆｒｏｍ　ｔｈｅ　ａｓｐｅｃｔｓ　ｏｆ　ｔｉｍｅ　ｄｉｓｔｒｉｂｕｔｉｏｎ，ｊｏｕｒｎａｌ　ｄｉｓｔｒｉｂｕｔｉｏｎ，ａｕｔｈｏｒｄｉｓｔｒｉｂｕｔｉｏｎ　ａｎｄ　ｒｅｓｅａｒｃｈ　ｔｏｐｉｃｓ．Ａｔ　ｐｒｅｓｅｎｔ，ｔｈｅ　ｒｅｓｅａｒｃｈ　ｏｎ　ｍｉｃｒｏｂｌｏｇｓ　ｍａｉｎｌｙ　ｆｏｃｕｓｅｓ　ｏｎ　ｔｈｅ　ｃｏｍｍｕｎｉｃａｔｉｏｎｆｅａｔｕｒｅｓ　ａｎｄ　ｏｐｅｒａｔｉｏｎ　ｍｅｃｈａｎｉｓｍ，ｒａｔｈｅｒ　ｔｈａｎ　ｏｎ　ｕｓｅｒｓｉｎｔｅｒａｃｔｉｏｎｓ，ｉｎｆｏｒｍａｔｉｏｎ　ｏｒｇａｎｉｚａｔｉｏｎｓ　ａｎｄａｇｇｒｅｇａｔｉｏｎ　ｓｈａｒｉｎｇ，ａｎｄ　ｇｕｉｄａｎｃｅ　ａｎｄ　ｒｅｇｕｌａｔｉｏｎｓ　ｏｆ　ｔｈｅ　ｃｏｌｌｅｃｔｉｖｅ　ｗｉｓｄｏｍｓ．Ｋｅｙ　ｗｏｒｄｓ：ｍｉｃｒｏｂｌｏｇ　ｒｅｓｅａｒｃｈ　ｓｔａｔｕｓ　ｂｉｂｌｉｏｍｅｔｒｉｃｓ　ｓｔａｔｉｓｔｉｃａｌ　ａｎａｌｙｓｉｓ１　前言作为Ｗｅｂ２．０时代新兴起的一类开放式互联网应用，微博是一种非正式的迷你型博客。在维基百科中，它被描述为“一种允许用户及时更新简短文本（通常少于１４０字）并可以公开发布的博客形式。它允许任何人阅读或者只能由用户选择的群组阅读”。［１］自２００７年以来，微博以便捷的发布方式，即时、畅通的交流模式以及低门槛的平台设计等优势在全球得到了迅速的普及和发展，中国互联网络信息中心（ＣＮＮＩＣ）发布的《第２８次中国互联网络发展状况统计报告》指出，截至２０１１年６月底，微博用户数呈现“爆发”式增长，半年增幅高达２０８．９％，从２０１０年底的６　３１１万增至１．９５亿，成为用户增长最快的互联网应用模式［２］。随着微博用户的迅猛增长，微博研究日益受到学者关注。本文基于２００７～２０１１年有关微博研究论文的统计分析，从文献增长、期刊分布、作者分布以及主题分布等方面进行全面剖析，揭示当前微博研究状况及存在问题。２　数据选取与处理方法本文数据来源于ＣＮＫＩ《中国期刊全文数据库》，以“微博”为检索词，限定关键词字段，检索出关于微博研究的论文共５３２篇（截至２０１１年８月２５日），剔除不相关及重复文献后，最后用于统计分析的有效文献为４８７篇。笔者利用Ｅｘｃｅｌ对检索结果进行分类汇总，转化为规范化的易处理格式，并建立相应的数据库，然后结合文献计量学和社会网络统计分析方法，对所检索论文的年代、期刊、作者和主题等方面进行分析，最后利用Ｕｃｉｎｅｔ软件进行可视化展示，得出相关结论。３　统计结果分析３．１　论文的年代分布对某一学科或领域的论文年度发文量进行统计分析，可以了解该学科或领域研究的发展历程和研究热度，揭示研究的纵向规律［３］。近年来我国微博研究的年度发文量如表１所示。＊本文为国家社会科学基金项目“网络学术社区的信息聚合与共享模式研究”（项目编号：１１ＣＴＱ０３８），西南大学中央高校基本科研业务费专项资金项目“面向一体化虚拟学习环境的信息资源整合与协同服务机制研究”（项目编号：ＳＷＵ０９０９５０７）的研究成果。

数据挖掘研究现状及发展趋势

数据挖掘研究现状及发展趋势摘要：从数据挖掘的定义出发，介绍了数据挖掘的神经网络法、决策树法、遗传算法、粗糙集法、模糊集法和关联规则法等概念及其各自的优缺点；详细总结了国内外数据挖掘的研究现状及研究热点，指出了数据挖掘的发展趋势。关键词：数据挖掘；挖掘算法；神经网络；决策树；粗糙集；模糊集；研究现状；发展趋势 Abstract：From the definition of data mining，the paper introduced concepts and advantages and disadvantages of neural network algorithm，decision tree algorithm，genetic algorithm，rough set method，fuzzy set method and association rule method of data mining，summarized domestic and international research situation and focus of data mining in details，and pointed out the development trend of data mining. Key words：data mining，algorithm of data mining，neural network，decision tree，rough set，fuzzy set，research situation，development tendency 1引言随着信息技术的迅猛发展，许多行业如商业、企业、科研机构和政府部门等都积累了海量的、不同形式存储的数据资料[1]。这些海量数据中往往隐含着各种各样有用的信息，仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息，迫切需要能自动地、智能地将待处理的数据转化为有价值的信息，从而达到为决策服务的目的。在这种情况下，一个新的技术———数据挖掘(Data Mining，DM)技术应运而生[2]。数据挖掘是一个多学科领域，它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新技术的研究成果，其应用非常广泛。只要是有分析价值的数据库，都可以利用数据挖掘工具来挖掘有用的信息。数据挖掘典型的应用领域包括市场、工业生产、金融、医学、科学研究、工程诊断等。本文主要介绍数据挖掘的主要算法及其各自的优缺点，并对国内外的研究现状及研究热点进行了详细的总结，最后指出其发展趋势及问题所在。江西理工大学

开题报告--微博营销

毕业设计（论文）开题报告

1 选题的背景和意义微博，即微博客(MicroBlog)的简称，是一个基于用户关系的信息分享、传播以及获取平台，用户可以通过WEB、WAP以及各种客户端组件个人社区，以140字左右的文字更新信息，并实现即时分享。微博是继视频网站、社交网站之后新兴的开放互联网社交服务。 1.1 选题的背景微博是一种新兴的传播媒介，他是随着互联网通讯技术的发展而发展的。微博营销是相继微博媒介发展后的产物。微博营销与传统的营销相比有相似之处，但也有许多不一样的地方。我们主要是找出微博营销中的口碑营销，他与传统营销的差异，并在这基础上将微博口碑营销做全方面的研究。随着一些商家借助微博实行营销成功以后，越来越多的人将眼光关注到了微博这个具有潜力的媒介，企图通过微博增长企业的业绩。因此，从目前来看对微博口碑营销的一些问题的探讨是极其迫切和重要的。我们应该在了解成功案例的同时，将他们的经营以理论的方式汇集成有价值的文献，供其他企业借鉴。 1.1.2 理论意义微博营销伴随着微博媒介的发展而发展。但是，对于微博营销的研究尤其是具体某一方面的研究内容较少。本文希望通过对微博营销中的其中一种营销方式—口碑营销结合案例作详细的了解和分析。提出微博口碑营销的多种有意义的方式，为企业运用微博作口碑营销的研究提供些理论上的依据。 1.1.3 实践意义本文希望通过对微博营销中的经典案例进行分析，提出一些微博口碑营销的实际有效的方式。将微博口碑营销更好的运用到其他企业的网络营销之中，为企业的发展提供一个有效的渠道。并通过这些渠道，提升企业的知名度。或者，在与消费者的互动和有效沟通中，了解企业在消费者心目中的形象，且能快速直接的得到消费者对企业的意见和建议，有利于企业更好的发展。 1.2 国内外研究现状及发展趋势国外对于微博应用于企业营销的案例起初是用于名人营销，比如美国最大的微博Twitter 在美国奥巴马竞选总统的时候发挥了重大的作用，可以说奥巴马的总统竞选从一部分功劳还要归功于微博。而亚洲国家比如日本等领导人也都在微博上注册了自己的账号，以期望同民众拉近距离。微博企业营销在国外的也发展的比中国要早一些。

文本情感分类研究综述

Web文本情感分类研究综述王洪伟/刘勰/尹裴/廖雅国 2012-9-27 14:55:59 来源：《情报学报》(京)2010年5期【英文标题】Review of Sentiment Classification on Web Text 【作者简介】王洪伟，男，1973年生，博士，副教授／博士生导师，研究方向：本体建模和情感计算，E-mail:hwwang@https://www.360docs.net/doc/fd3354480.html,。同济大学经济与管理学院，上海200092；刘勰，男，1985年生，硕士研究生，研究方向：数据挖掘与情感计算。同济大学经济与管理学院，上海200092；尹裴，女，1986年生，硕士研究生，研究方向：商务智能。同济大学经济与管理学院，上海200092；廖雅国，男，1954年生，博士，教授，研究方向：人工智能与电子商务。香港理工大学电子计算学系，香港【内容提要】对用户发表在Web上的评论进行分析，能够识别出隐含在其中的情感信息，并发现用户情感的演变规律。为此，本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务：主客观分类、极性判别和强度判别，对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状，并指出今后的研究方向。

Analyzing the users' reviews on the Web can help us to identify users' implicit sentiments and find the evolution laws of their emotion. To this end, this paper is a survey about the sentiment classification on the Web text. We divided the process of classification into three categories:subjective and objective classification,polarity identification and intensity identification and respectively summarize the resent research achievements in these fields. We also sorted the methods of polarity identification into two types: one is based on the emotional words with semantic characteristics, while the other statistic methods of natural language processing. What is more, the choice of corpus and potential research problems are discussed. At last, this paper summarized the status quo of application and pointed out the direction of future research. 【关键词】Web文本/情感分类/综述/主观性文本Web texts/Sentiment classification/Survey/Subjective text 随着互联网的流行，Web文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Web2.0技术的发展，网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感，比如对某部大片的影评，对某款手机的用户体验等，其中蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘，获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentiment analysis)，就是确定说话人或作者对某个特定主题的态度。其中，态度可以是他们的判断或者评估，他们（演说、写作时）的情绪状态，或者有意（向受众）传递的情感信息。因此，情感分

空间聚类的研究现状及其应用_戴晓燕

空间聚类的研究现状及其应用＊戴晓燕1　过仲阳1　李勤奋2　吴健平1 (1华东师范大学教育部地球信息科学实验室　上海　200062) (2上海市地质调查研究院　上海　200072) 摘　要　作为空间数据挖掘的一种重要手段,空间聚类目前已在许多领域得到了应用。文章在对已有空间聚类分析方法概括和总结的基础上,结合国家卫星气象中心高分辨率有限区域分析预报系统产品中的数值格点预报(HLAFS)值,运用K-均值法对影响青藏高原上中尺度对流系统(MCS)移动的散度场进行了研究,得到了一些有意义的结论。关键词　空间聚类　K-均值法　散度 1　前言随着GPS、GI S和遥感技术的应用和发展,大量的与空间有关的数据正在快速增长。然而,尽管数据库技术可以实现对空间数据的输入、编辑、统计分析以及查询处理,但是无法发现隐藏在这些大型数据库中有价值的模式和模型。而空间数据挖掘可以提取空间数据库中隐含的知识、空间关系或其他有意义的模式等[1]。这些模式的挖掘主要包括特征规则、差异规则、关联规则、分类规则及聚类规则等,特别是聚类规则,在空间数据的特征提取中起到了极其重要的作用。空间聚类是指将数据对象集分组成为由类似的对象组成的簇,这样在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大,即相异度较大。作为一种非监督学习方法,空间聚类不依赖于预先定义的类和带类标号的训练实例。由于空间数据库中包含了大量与空间有关的数据,这些数据来自不同的应用领域。例如,土地利用、居住类型的空间分布、商业区位分布等。因此,根据数据库中的数据,运用空间聚类来提取不同领域的分布特征,是空间数据挖掘的一个重要部分。空间聚类方法通常可以分为四大类:划分法、层次法、基于密度的方法和基于网格的方法。算法的选择取决于应用目的,例如商业区位分析要求距离总和最小,通常用K-均值法或K-中心点法;而对于栅格数据分析和图像识别,基于密度的算法更合适。此外,算法的速度、聚类质量以及数据的特征,包括数据的维数、噪声的数量等因素都影响到算法的选择[2]。本文在对已有空间聚类分析方法概括和总结的基础上,结合国家卫星气象中心高分辨率有限区域分析预报系统产品中的数值格点预报(HLAFS)值,运用K-均值法对影响青藏高原上中尺度对流系统(MCS)移动的散度场进行了研究,得到了一些有意义的结论。 2　划分法设在d维空间中,给定n个数据对象的集合D 和参数K,运用划分法进行聚类时,首先将数据对象分成K个簇,使得每个对象对于簇中心或簇分布的偏离总和最小[2]。聚类过程中,通常用相似度函数来计算某个点的偏离。常用的划分方法有K-均值(K-means)法和K-中心(K-medoids)法,但它们仅适合中、小型数据库的情形。为了获取大型数据库中数据的聚类体,人们对上述方法进行了改进,提出了K-原型法(K-prototypes method)、期望最大法EM(Expectation Maximization)、基于随机搜索的方法(ClAR ANS)等。 K-均值法[3]根据簇中数据对象的平均值来计算 ——————————————— ＊基金项目:国家自然科学基金资助。(资助号: 40371080) 收稿日期:2003-7-11 第一作者简介:戴晓燕,女,1979年生,华东师范大学地理系硕士研究生,主要从事空间数据挖掘的研究。 · 41 · 2003年第4期上海地质 Shanghai Geology

微博现状讲解

北京航空航天大学微博分析 1 综述随着网络的快速发展和普及。微博作为一个信息分享、获取以及传播的平台，以其快速传播、实时搜索等特点，已成为当代人们抒发情感，分享信息，获取资源必不可少的工具。本文主要对近两年国内微博信息搜索发展和应用情况进行分析。 2 微博使用现状 2.1 微博使用情况根据中国物联网信息中（CNNIC）公布的《第35次中国互联网发展状况统计报告》，截止2014年12月，我国网民规模6.7亿，使用微博用户2.49亿，网民使用率38.4%，相较2013年底下降7.1%（如图 2-1所示）。而CNNIC《第35次中国互联网发展状况统计报告》中“2013年-2014年中国网民各类互联网使用过的使用率统计表”（如表1所示）显示同为交流沟通类应用中即时通信应用使用率增长率10.4%，微博应用使用率下降11.4%，电子邮件应用下降 2.9%，由以上数据不难看出微博、电子邮件等交流沟通类应用使用率出现下降的主要原则在于其在即时通信上的劣势导致。图2-1 2013年-2014年微博客/手机微博客用户国模及使用率（数据来源：CNNIC）

北京航天航空大学表 1 2013年-2014年中国网民各类互联网使用过的使用率统计 2.2 微博信息检索 2.2.1 微博信息检索概况尽管2013年-2014年网民对微博的使用率存在下降的趋势，但微博自身快速传播、实时搜索等特点依然使微博在信息检索中存在一定优势。根据中国物联网信息中（CNNIC）发布的《2014年中国网民搜索行为研究报告》，截止2014年6月，95.4%的搜索用户通过综合搜索网站搜索信息，除此之外搜索用户在购物网站、视频网站、资讯类网站、微博上进行搜索的比例分别达到78.5%、75.2%、57.2%和57.1%（如图 2-2所示）。而随着手机的快速发展，网民从PC 端向手机端持续转移，更多的人使用手机进行搜索，而用户实际微博搜索的比率则为58.1%高于PC端48.8（如图2-3所示）。

情感计算综述

情感计算综述控制工程1102班李晓宇 2111103172 摘要：情感计算是人工智能的一个分支。情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境，并使计算机具有更高的、全面的智能。本文分别从情感计算的研究历史、应用前景、研究内容和理论框架来阐述情感计算，以便使更多的人了解情感计算。关键字: 情感计算；情感识别；情感理论框架 Summary of Affective Computing Abstract：Affective computing is a branch of artificial intelligence. The aim of affective computing is to give computers to recognize, understand, adapt to people's emotional expression and the ability to establish harmonious human environment, and to have higher computer, full of intelligence.This paper explain affective computing through the study of history of affective computing ,applications in the future, research content and theoretical framework, so that more people understand the affective computing. Key word: Affective computing; emotion recognition; the theoretical framework of emotional 1、引言情感计算的概念是在1997年由MIT媒体实验室Picard教授提出，她指出情感计算是与情感相关，来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究，提出了对情感计算的定义：“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境，并使计算机具有更高的、全面的智能”。在较长一段时期内，情感一直位于认知科学研究者的视线以外。直到20世纪末期，情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论，关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点，情感计算（ affective computing ）也成为一个新兴研究领域。众所周知，人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中，计算机是否能够体会人的喜怒哀乐，并见机行事呢？情感计算研究就是试图创建一种能感知、识别和理解人的情感，并能针对人的情感做出智能、灵敏、友好反应的计算系统，即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。 2、研究现状让计算机具有情感能力首先是由美国MIT大学Minsky教授（人工智能创始人之一）提出的。他在1985年的专著《The Society of Mind》中指出，问题不在于智能机器能否有任何情感，而在于机器实现智能时怎么能够没有情感。从此，赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT 媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著《Affective Computing》中提出并给出了定义，即情感计算是关于情感、情感产生以

数据挖掘算法综述

数据挖掘方法综述 [摘要]数据挖掘（DM，DataMining）又被称为数据库知识发现（KDD,Knowledge Discovery in Databases）,它的主要挖掘方法有分类、聚类、关联规则挖掘和序列模式挖掘等。 [关键词]数据挖掘分类聚类关联规则序列模式 1、数据挖掘的基本概念数据挖掘从技术上说是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识的过程。这个定义包括好几层含义: 数据源必须是真实的、大量的、含噪声的、发现的是用户感兴趣的知识, 发现的知识要可接受、可理解、可运用, 并不要求发现放之四海皆准的知识, 仅支持特定的发现问题, 数据挖掘技术能从中自动分析数据进行归纳性推理从中发掘出潜在的数据模式或进行预测, 建立新的业务模型帮助决策者调整策略做出正确的决策。数据挖掘是是运用统计学、人工智能、机器学习、数据库技术等方法发现数据的模型和结构、发现有价值的关系或知识的一门交叉学科。数据挖掘的主要方法有分类、聚类和关联规则挖掘等 2、分类分类（Classification）又称监督学习（Supervised Learning）。监

督学习的定义是：给出一个数据集D，监督学习的目标是产生一个联系属性值集合A和类标（一个类属性值称为一个类标）集合C的分类/预测函数，这个函数可以用于预测新的属性集合（数据实例）的类标。这个函数就被称为分类模型（Classification Model），或者是分类器（Classifier）。分类的主要算法有：决策树算法、规则推理、朴素贝叶斯分类、支持向量机等算法。决策树算法的核心是Divide-and-Conquer的策略，即采用自顶向下的递归方式构造决策树。在每一步中，决策树评估所有的属性然后选择一个属性把数据分为m个不相交的子集，其中m是被选中的属性的不同值的数目。一棵决策树可以被转化成一个规则集，规则集用来分类。规则推理算法则直接产生规则集合，规则推理算法的核心是Separate-and-Conquer的策略，它评估所有的属性-值对（条件），然后选择一个。因此，在一步中，Divide-and-Conquer策略产生m条规则，而Separate-and-Conquer策略只产生1条规则，效率比决策树要高得多，但就基本的思想而言，两者是相同的。朴素贝叶斯分类的基本思想是：分类的任务可以被看作是给定一个测试样例d后估计它的后验概率，即Pr（C=c j︱d），然后我们考察哪个类c j对应概率最大，便将那个类别赋予样例d。构造朴素贝叶斯分类器所需要的概率值可以经过一次扫描数据得到，所以算法相对训练样本的数量是线性的，效率很高，就分类的准确性而言，尽管算法做出了很强的条件独立假设，但经过实际检验证明，分类的效果还是

针对微博用户信息的数据挖掘分析

针对微博用户信息的数据挖掘分析数据挖掘什么是数据挖掘？百度百科上定义，数据挖掘是“一种透过数理模式来分析企业内储存的大量资料，以找出不同的客户或市场划分，分析出消费者喜好和行为的方法”。简单来说，就是通过一定的分析，找出大量的数据中隐藏的一些特殊的相关性或者规律，并由这些规律挖掘出一些事物的特性。数据挖掘被广泛运用于企业的运营和发展中，企业常常通过对源自客户的大量的数据的分析，以获取客户的特性，由此尽可能应和客户的需求，从而能够在市场上博取更多消费者的青睐，以更具竞争力。分类分析、聚类分析和关联分析是数据挖掘的三大主要任务。在本项目中，重点运用到了聚类分析，并辅以关联分析。聚类分析主要任务是确立某一个对象属性作为标准（如空间坐标、时间等），然后根据数据对象在该属性上的相近程度或密集程度，将数据对象分成不同的簇，使得相比之下在同一个簇中的对象具有很高的相似性，并由此导出规则；而关联分析则是根据对象的属性，得出对象与其他对象之间隐含的关联，并得出规律，以便达到以下目的：给出某一个对象的某一种属性，便可知道该种情况包含了其他哪些对象的哪些属性。聚类和关联分析在文章接下来会有更加详细的描述异常分析、特异群组分析和演变分析是数据挖掘的另外三大任务，在这里我们不作详细描述。微博数据分析网络社交平台已经是现代人的生活中不可缺少的一部分，脸书、推特、人人、QQ、微博、微信等等类似的社交平台层出不穷，而这样的社交平台中无疑蕴含着大量的信息。企业可以分析这些数据，大致提取出用户的特征和生活规律，了解客户的需求，以便更好的利用这个平台，扩展业务，从而获取更大的盈利。对这些企业来说，这无疑是一个巨大的商机。本项目的工作 “基于空间轨迹和发博特点的微博用户特征数据分析”的主要任务是通过分析微博用户所发过的大量的微博中的时间及空间坐标，来得出用户的工作地/居住地、活动性、消费水平（消费偏好）、职业、亲子状况（孩子年龄）等特征及偏好，并最终提取出上述各种属性的关系，运用关联分析勾画出该用户的立体形象。下面，本文将对用户的活动性（及工作地/居住地）这一属性的分析及其相对应的数据挖掘分析，及其后续改进工作进行重点描述，并对关联规则的初步应用简要提及。 1、用户活动性、工作地/居住地我们用活动性来衡量一个用户的活跃程度，即判断该用户是尝尝四处奔波，还是喜欢老

微信营销文献综述终审稿)

微信营销文献综述文稿归稿存档编号：[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

精准营销新渠道—微信营销文献综述一、摘要微博营销方兴未艾，微信又迅速成为众品牌商除官方微博外另一互联网营销热地。自2012年8月18日微信公众平台正式上线后，媒体、品牌商及名人使用更多的手段向他们的粉丝推送各种信息，微信的营销效果越来越不可忽视。微信营销，逐渐蔓延至国内的各个行业销售领域之中，并为改变现有的营销模式发挥着重要的作用。本文是对前人有关微信营销研究进行的归纳总结，经过分析说明，总结有关学者对微信营销的研究成果。对微信营销的模式，利弊，前景以及微信营销存在的问题和对策进行综述，并提出自己的思考方向。二、主题 1.微信营销模式的诞生近几年来，虽然国内的各个企业在电子营销方面都的带了大幅度的提升但那是其依旧会受到社会环境的影响和制约。当企业在市场销售过程中产生风险的时候，那么因为风险而产生的费用就会得到提升，而产品的销售也会一同受到影响，这对企业而言是十分危险的。怎样采用较小的投资方式获得较大的销售回报，也成为了企业所需要考虑的关键问题，微信的出现则是成为了解决企业营销模式的灵丹妙药。微信公众平台进行传播的主要方式就是二维码，二维码的出现对于国内外的众多企业而言是一个具备创造性的变革，其也为营销广告和媒体传播行业等带来了新的发展动力。在市场竞争日益激烈的今天，微信、二维码这些成本低、见效快的网络营销方式很快被众多企业所采用。

从目前开通微信企业来看，他们会把经销商拉到微信阵营来，企业可以让一些骨干员工参与，组建起一支企业的微信大军。从发布的信息来看，主要以品牌信息、行业资讯、企业活动、官方网站、促销活动等，其实都是为企业宣传、品牌塑造、资讯推送搭建了良好平台。 2.关于微信营销模式的探讨 (1)关于微信营销模式被人们所熟知的是以下四种模式： (2)LBS+“查看附近的人”功能，挖掘潜在客户群，开拓企业销售新渠道； (3)O2O+“二维码扫描”功能，助推品牌病毒式传播，打通企业线上和线下的关键入口； (4)微信公众平台+“朋友圈”新功能，打造全新社交关系链，开创企业口碑宣传新方式； (5)互动式推送微信，通过一对一的推送，品牌可以与“粉丝”开展个性化的互动活动，提供更加直接的互动体验。张莉（2013）在分析企业微信的营销应用时，认为对企业来说，微信营销的以上的营销模式必须区别使用，对于不同的企业不同的产品服务，要采用不同的营销方式，如O2O+扫描二维码模式适用于餐饮，娱乐等产品或服务与用户紧密相联系的企业；她还指出微信营销的营销成本低，潜在客户多等优势。3.关于微信营销的定义与传统模式的对比微信营销是网络经济时代企业对的创新，是伴随着的产生的一种网络营销方式，微信不存在距离的限制，用户注册微信后，可与周围同样注册的“”形

文献综述_数据挖掘

数据挖掘简介数据挖掘的任务数据挖掘的任务就是从实例集合中找出容易理解的规则和关系。这些规则可以用于预测未来趋势、评价顾客、评估风险或简单地描述和解释给定的数据。通常数据挖掘的任务包括以下几个部分: 数据总结目的是对数据进行浓缩，给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值，或者用直方图、饼图等图形方式表示。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。数据泛化目前主要有两种技术:多维数据分析方法和面向属性的归纳方法。多维数据分析方法是一种数据仓库技术，也称作联机分析处理(OLAP，onLineAnalysisProeess)。数据仓库是面向决策支持的、集成的、稳定的、不同时间的历史数据集合。决策的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作，这类操作的计算量特别大。因此一种很自然的想法是，把汇集操作结果预先计算并存储起来，以便于决策支持系统使用。存储汇集操作结果的地方称作多维数据库。多维数据分析技术已经在决策支持系统中获得了成功的应用，如著名的SAS数据分析软件包、Businessobject公司的决策支持系统Businessobjeet，以及IBM公司的决策分析工具都使用了多维数据分析技术。采用多维数据分析方法进行数据总结，它针对的是数据仓库，数据仓库存储的是脱机的历史数据。为了处理联机数据，研究人员提出了一种面向属性的归纳方法。它的思路是，直接对用户感兴趣的数据视图(用一般的SQL查询语言即可获得)进行泛化，而不是像多维数据分析方法那样预先就存储好了泛化数据。方法的提出者对这种数据泛化技术称之为面向属性的归纳方法。原始关系经过泛化操作后得到的是一个泛化关系，它从较高的层次上总结了在低层次上的原始关系。有了泛化关系后，就可以对它进行各种深入的操作而生成满足用户需要的知识，如在泛化关系基础上生成特性规则、判别规则、分类规则，以及关联规则等。数据挖掘的分类数据挖掘所能发现的知识有如下几种: .广义型知识，反映同类事物共同性质的知识; .特征型知识，反映事物各方面的特征知识; .差异型知识，反映不同事物之间属性差别的知识; .关联型知识，反映事物之间依赖或关联的知识; .预测型知识，根据历史的和当前的数据推测未来数据; .偏离型知识。揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现，随着概念树的提升，从微观到中观再到宏观，以满足不同用户、不同层次决策的需要。例如，从一家超市的数据仓库中，可以发现的一条典型关联规则可能是“买面包和黄油的顾客十有八九也买牛奶”，也可能是“买食品的顾客几乎都用信用卡”，这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。数据挖掘的方法数据挖掘并非一个完全自动化的过程。整个过程需要考虑数据的所有因素和其预定的效用，然后应用最佳的数据挖掘方法。数据挖掘的方法很重要。在数据挖掘的领域里.有一点已经被广泛地接受，即不管你选择哪种方法，总存在着某种协定。因此对实际情况，应该具体分析，根据累积的经验和优秀的范例选择最佳的方法。数据挖掘中没有免费的午餐，也没

微博营销研究文献综述 2

学年论文题目微博营销研究文献综述_ 二级学院管理学院专业市场营销班级 11级市场2班学生姓名陈小东学号11108990802 指导教师李巍成绩时间 2015年1月

微博营销研究文献综述摘要：自从2006年twitter的诞生，再到如今的FACEBOOK、新浪微博、腾讯微博，微博的发展脚步从未停止，人们对微博的利用开发也从未停止。微博草根性很强，且广泛分布在桌面、浏览器、移动终端等多个平台上，有多种商业模式并存，或形成多个垂直细分领域的可能。营销嗅觉灵敏的企业当然不会放过这个微博这个全世界最便捷的传播工具的营销机会。随着科技的进步，手机移动应用的普及，微博用户将持续的增长，在不久的未来微博营销将以更低的成本为企业带来更大的收益。本文从微博营销的含义、特点基本概述讲解入手，再分析微博营销的优势，然后指出微博营销的发展趋势，最后做出总结。通关这几个方面对微博营销模式进行研究。关键词：微博；营销；网络；发展趋势；企业一、引言微型博客，是基于用户关系的信息分享、传播、获取的平台，是个人化的社会媒体。用户写微博的方式，通过web，wap以及手机客户端，即时通讯等，发布的字数是140字左右的文字更新信息，可即时的推送到粉丝那里。在国外，微博的鼻祖——Twitter早就成为了营销推广的一种重要手段，据一组调查数据显示，世界100强大企业中就有73家在Twitter上安了家。作为较早进驻Twitter进行品牌营销的企业，戴尔可以称得上是这个领域的高手。据悉，从2007年3月开始使用Twitter企业平台进行营销以来，戴尔已获得了超过700万美元的销售收入。目前戴尔已在Twitter 建立了35个帐号，并依功能分成了六大类，每个账号皆由专人负责管理，像一个一对多的在线客服窗口，让客户能得到丰富而实时的讯息。另外一些知名企业，如全球最大的电子消费品零售商百思买、福特汽车、可口可乐、星巴克和肯德基等，也纷纷在Twitter上开辟营销试验田，并且有所斩获。09年8月“新浪微博”的推出，使中国也陷入微博热中，与国外相比，目前中国企业的微博营销仍处于始发阶段，还不够成熟，需要更系统的方法论的引导，也需要在实践中探寻更多的经验。