ACM SIGKDD数据挖掘及知识发现会议
ACM简介及使用指南

可在文章的 标题、文
摘、评论中 检索
在作者给出的 文章关键词中
检索
4.1 高级检索
可进行作者、编 辑、指导者、评
论者检索
作者所属的 机构检索
按照出版物 类别检索
ACM计算机分 类体系CCS
按照会议相 关信息检索
ISSN/ISBN/D OI检索
4.1 高级检索
通过出版社或出版物检索
通过会议信息检索文章
• ACM Digital Library - 全文数据库,收录ACM的所有出 版物,包括:
期刊、杂志和会报53种; 近300个会议,4000多卷会议录; 超过40万多篇全文,及“在线计算机文献指南”数据库 中230多万条文摘题录信息; 37种SIG时事通讯 ACM附属机构出版物 ACM口述历史访谈录
1. ACM出版社
• 1.3 Meeting --每年主办150多场会议,其中会议内容包括 计算机图像处理、数据通信、知识发现和数据挖掘、软件 工程、人机交互以及信息安全,每场会议都会出版相关会 议录。
• 1.4 Special Interest Groups -- 根据计算机领域的每项专 业设有37个特别兴趣组(SIGs),针对其不同的研究方向有 64种相应的出版物。
内容大纲
• 1. ACM出版社 • 2. ACM数据库内容 • 3. ACM数据库品质 • 4. ACM平台
3. ACM数据库品质
根据2014年的JCR报告数据,在计算机科学与软件工程领域收录的 104本期刊中,ACM是最大期刊来源出版社,且这17本ACM期刊 的总引文量40513篇,占该领域总引文量的27.8%。
文章相关信息:文摘、作 者、参考文献等
4.2.3 作者信息
工作经历
从统计学习到社交网络--数据挖掘及知识发现国际会议KDD2013纪实

绍了微软新研发的大规模数据分析平台R E E F 。 如
今, 传 统 的 Ma p R e d u c e 不 适 合 运行 机 器 学 习 中的
互 联 网挖 掘
推 荐 系统
3 - 2 %
2 . 7 %
l 7 . 1 %
2 5 . 7 %
很多迭代算法已成为共识;Ap a c h e Ha d o o p 项目
已变成 了 “ 社 交媒 体 、 社 区发 现 ”。 D B L P 论 文数 据挖 掘 中几个重 要 的组成 部 分:大数 据 、产业 统 计分 析 。 据库显示 , 2 0 0 5 年 的 会 议 论 文 大 多 涉及 分类 、 聚 化 、优 化方 法 、
表1 K D D 2 O 1 3 论文主题 .提交比锄与接收率
之间插入了一 个中间层Y A R N, 实现集群系统资源
的 调 度 和 管理 。 R E E F 搭 建 在Y A R N 之 上 。用来 提
2 2
Ne ws 资讯 I R e p o f 报道
供编写机器学 习库所需要的更加抽象的语义。
第二个K e y n o t e 是 由 大家 热 切 期 盼 的 斯 坦 福 大 学 教授 、 C o u  ̄ e r a 网站 联 合 创始 人An d r e w N g 主讲。
提 出的 “ 下 一 代 Ha d o o p ”在 HD F S 和Ma p R e d u c e
概 率 方法
大数据
2 . 5 %
2 . 4 %
2 4 . 5 %
2 9 . 4  ̄ / o
用户建模
总 计
1 . 7 %
1 O 0 %
CS国际顶级会议

UAI (1-): 名字叫&uot;人工智能中的不确定性&uot;, 涉及表示\推理\学习等很多方面, AUAI(Association of UAI) 主办, 每年开.
The Second Class:
AAMAS (2+): agent方面最好的会议. 但是现在agent已经是一个一般性的概念, 几乎所有AI有关的会议上都有这方面的内容, 所以AAMAS下降的趋势非常明显.
现在是加拿大温哥华; 而且它是年底开会,会开完后第2年才出论文集, 也就是说, NIPS'05的论文集是06年出. 会议的名字是&uot;Advances in Neural Information Processing Systems&uot;, 所以, 与ICML\ECML这样的&uot;标准的&uot;机器学习会议不同, NIPS里有相当一部分神经科学的内容, 和机器学习有一定的距离. 但由于会议的主体内容是机器学习, 或者说与机器学习关系紧密, 所以不少人把NIPS看成是机器学习方面最好的会议之一. 这个会议基本上控制在ichael Jordan的徒子徒孙手中, 所以对Jordan系的人来说, 发NIPS并不是难事, 一些未必很强的工作也能发上去, 但对这个圈子之外的人来说, 想发一篇实在很难, 因为留给&uot;外人&uot;的口子很小. 所以对Jordan系以外的人来说, 发NIPS的难度比ICML更大. 换句话说,ICML比较开放, 小圈子的影响不象NIPS那么大, 所以北美和欧洲人都认, 而NIPS则有些人(特别是一些欧洲人, 包括一些大家)坚决不投稿. 这对会议本身当然并不是好事, 但因为Jordan系很强大, 所以它似乎也不太care. 最近IMLS(国际机器学习学会)改选理事, 有资格提名的人包括近三年在ICML\ECML\COLT发过文章的人, NIPS则被排除在外了. 无论如何, 这是一个非常好的会.
KDD-Cup(数据挖掘与知识发现竞赛) 介绍

n
The goal – to design models to support website personalization and to improve the profitability of the site by increasing customer response. Questions - When given a set of page views,
n
ROBOCUP
n
2
About ACM KDDCUP
n n
ACM KDD: Premiere Conference in knowledge discovery and data mining ACM KDDCUP:
n
Worldwide competition in conjunction with ACM KDD conferences. showcase the best methods for discovering higher-level knowledge from data. Helping to close the gap between research and industry Stimulating further KDD research and development
Year
97 98
99 24
2000 2005 2011 30 32 1000+
4
Submissions 16 21
Algorithms (up to 2000)
5
KDD Cup 97
8
KDDCUP 1998 Results
$70,000 $65,000 $60,000 $55,000 $50,000 $45,000 $40,000 $35,000 $30,000 $25,000 $20,000 $15,000 $10,000 $5,000 $100%
CS专业重要国际学术会议

IEEE International Conference on Data Mining
ICDM
IEEE数据挖掘国际会议
48.
IEEE International Conference on Multimedia & Expo
ICME
IEEE多媒体国际会议暨展览会
49.
International Conference on Machine Learning
35.
International Conference on Extending Database Technology
EDBT
扩展数据库技术国际会议
36.
International Conference on the Theory and Applications of Cryptographic Techniques
NSDI
USENIX网络系统设计与实现会议
62.
USENIX Symposium on Operating Systems Design and Implementation
OSDI
USENIX操作系统设计与实现会议
63.
International Conference on Parallel Architectures and Compilation Techniques
CVPR
IEEE计算机视觉与模式识别会议
32.
International ConferenceonDatabase Systems for Advanced Applications
DASFAA
数据库系统先进应用的国际会议
33.
European Conference on Computer Vision
2014 sigkdd test of time award -回复

2014 sigkdd test of time award -回复什么是SIGKDD?SIGKDD 是国际数据挖掘和知识发现协会(The Association for Computing Machinery Special Interest Group on Knowledge Discovery and Data Mining)的缩写。
该协会成立于1995年,是一个致力于促进数据挖掘和知识发现相关研究和应用的学术组织。
SIGKDD 的标志性活动是每年举办的KDD(Knowledge Discovery and Data Mining)国际会议,会议上邀请行业的专家学者分享最新的科研成果和技术应用。
SIGKDD 还设立了“测试时间奖”(Test of Time Award),旨在回顾和表彰在数据挖掘和知识发现领域具有深远影响的经典研究成果。
该奖项由KDD 国际会议的组委会挑选,并在每年的会议上颁发。
2014年,SIGKDD的测试时间奖颁发给了一篇题为《乳腺癌语义分类的新方法》(A New Method for Breast Cancer Semantic Classification)的论文。
这篇论文由Marina Meilă和Jianbo Shi 于2000年发表在KDD 会议上。
本文提出了一种基于图论的方法,用于对乳腺癌病人的组织样本进行语义分类。
这项工作在当时引起了巨大轰动,并对乳腺癌研究和诊断领域产生了重要影响。
论文的作者Marina Meilă是一位来自华盛顿大学的教授,她在图论和机器学习方面有着丰富的研究经验。
与之合作的作者Jianbo Shi 则是康奈尔大学的计算机科学教授,他在计算机视觉和图像分析领域享有盛誉。
论文的核心创新在于将图论方法引入乳腺癌语义分类的任务中。
该方法首先将组织样本图像转换为图结构,其中图的节点表示样本的局部区域,边表示不同区域之间的关系。
然后,利用图的拓扑和边缘特征,通过图分割算法将图像分割为不同的区域。
国际数据挖掘与知识发现大会

由 ACM 数据挖掘及知识发现专委会负责协调筹 评审。主会期间,除了学术研究论文,SIGKDD 还
办。会议内容涵盖数据挖掘的基础理论、算法和实 设有面向工业和政府应用的专题研讨会以及工业应
际应用。SIGKDD 的发展历史可以追溯到 1989 年 用博览的邀请报告会。此次大会的主题是“大数据
开始组织的一系列关于知识发现及数据挖掘的研讨 挖掘”,邀请了相关领域的知名专家作大会主旨报
2013 年 8 月 11~14 日,第 19 届知识发现与数 瑟鲁萨米 (Ramasamy Uthurusamy) 博士和芝加哥大
据挖掘大会 (ACM Conference on Knowledge Discov- 学的罗伯特·格洛斯曼 (Robert L. Grossman) 教授, ery and Data Mining, SIGKDD 2013 [1]) 在美国芝加哥 程序委员会主席由来自德克萨斯奥斯丁大学的因德
论大数据,分别关注大数据分析框架和大数
据分析算法。
在 大 数 据 分 析 框 架 的 研 讨 会 中, 来 自
伯克利大学的论文提出结合中央处理器、图
形处理器以及全新的算法设计来提高大数
据挖掘能力。基于名为“BID”的大数据处
图2 SIGKDD 2013研究热点图
理引擎开发了用于矩阵计算的 BIDMat 工
社交网络分析依然是今年 SIGKDD 大会上最热 生注册,他的愿望是给世界上的每个人提供高质量、
的话题,有 4 个直接相关的研讨会,15 篇口头报告 免费的在线课程。在主题报告中,吴恩达介绍了
论文,20 多篇海报论文。总的来说,社交网络分析 Coursera 最新的在线授课平台,包括视频内容、互
的任务变得更加细化,其中 3 个最热的话题是 :网 动练习、实时反馈、自动改作业和小组改作业以及
(会议管理)数据挖掘主要会议

一流的:数据库三大顶级会议SIGMOD,VLDB,ICDE,数据挖掘KDD,实际相关的还有机器学习ICML,还有信息检索的SIGIR;数据库的理论会议PODS,但它是理论的会议所以和咱们就不大相关了二流的:EDBT,ICDT,CIKM,SDM,ICDM,PKDD,还有ECML欧洲的机器学习会议(这个应该是1.5档的,比一般的二流好),这些会也不好中,中了也会会觉得不一定爽,你可能觉得再以努力就上一流了,哈哈。
还有一些会,俺就懒得列了!下面是很早以前AI版的一个帖子,写得还不错,看看吧,哈哈————————————————————————————————————有些人的工作很原创,每年总有一些很新颖的东西。
有的人文章很多,但主要都是follow别人的工作。
Database领域有不少papermachine。
有的地方,整个group就是一个大的papermachine。
个人感觉数据库研究者倾向于把数据挖掘看作一个数据库的子领域,因而对数据挖掘的会议rating较低。
然而对其他背景的人而言,数据挖掘是相对独立的一个新兴领域,因而对其会议rating比较高。
SIGMOD:97分,数据库的最高会议,涉及范围广泛,稍偏应用(因为理论文章有PODS)。
没说的,景仰如滔滔江水。
这个会议不仅是double-blind review,而且有rebuttal procedure,可谓独树一帜,与众不同。
VLDB:95分,非常好的数据库会议。
与SIGMOD类似,涉及范围广泛,稍偏应用。
从文章的质量来说,SIGMOD和VLDB难分伯仲,没有说谁比谁更高。
他们的范围也几乎一样。
不少牛人都认为,今年的rebuttal procedure其实并不怎么成功。
投稿太多,很难做到每一篇都公平公正。
很多rebuttal没人看。
double-blind是把双刃剑。
这几年来每年都有人冒充牛人的风格来投稿,有的还真进去了。
反而VLDB的审稿质量一直很高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ACM SIGKDD数据挖掘及知识发现会议1清华大学计算机系王建勇1、KDD概况ACM SIGKDD国际会议(简称KDD)是由ACM的数据挖掘及知识发现专委会[1]主办的数据挖掘研究领域的顶级年会。
它为来自学术界、企业界和政府部门的研究人员和数据挖掘从业者进行学术交流和展示研究成果提供了一个理想场所,并涵盖了特邀主题演讲(keynote presentations)、论文口头报告(oral paper presentations)、论文展板展示(poster sessions)、研讨会(workshops)、短期课程(tutorials)、专题讨论会(panels)、展览(exhibits)、系统演示(demonstrations)、KDD CUP赛事以及多个奖项的颁发等众多内容。
由于KDD的交叉学科性和广泛应用性,其影响力越来越大,吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的专家、学者。
KDD可以追溯到从1989年开始组织的一系列关于知识发现及数据挖掘(KDD)的研讨会。
自1995年以来,KDD已经以大会的形式连续举办了17届,论文的投稿量和参会人数呈现出逐年增加的趋势。
2011年的KDD会议(即第17届KDD 年会)共收到提交的研究论文(Research paper)714篇和应用论文(Industrial and Government paper)73篇,参会人数也达到1070人。
下面我们将就会议的内容、历年论文投稿及接收情况以及设置的奖项情况进行综合介绍。
此外,由于第18届KDD年会将于2012年8月12日至16日在北京举办,我们还将简单介绍一下KDD’12[4]的有关情况。
2、会议内容自1995年召开第1届KDD年会以来,KDD的会议内容日趋丰富且变的相对稳定。
其核心内容是以论文报告和展版(poster)的形式进行数据挖掘同行之间的学术交流和成果展示。
KDD录用的论文以研究论文为主、辅以一定数量的应用论文,以及少量的系统演示论文。
依附于KDD年会的KDD CUP竞赛也是会议的一项重要内容。
此外,会议还包括特邀主旨报告(keynote presentations)、辅导报告(tutorials)、专题讨论(panels)、研讨会(workshops)以及工业实践及展览(Industrial practice expo track)等内容。
1.研究主题(Research Track)每年的KDD年会结束后不久,来年的会议组织者会发布论文征文通知。
征文通知中会列出论文的各种投稿要求,包括会议感兴趣的主题、评价标准以及格式等。
从KDD’12官方网站的征文通知[5]可以了解到,KDD’12感兴趣的研究类主题主要包括关联分析(association analysis)、分类与回归分析算法(classification and regression methods)、半监督式学习(semi-supervised learning)、聚类(clustering)、因式分解(factorization)、迁移学习和多任务学习(transfer and multi-task learning)、特征选择(feature selection)、社会网络(social networks)、图数据挖掘(mining of graph data)、时空数据分析(temporal and spatial data analysis)、可扩展性(scalability)、隐私保护(privacy)、安全性(security)、可视化(visualization)、文本分析(text analysis)、万维网挖掘(Web mining)、移动数据挖掘(mining mobile data)、推荐系统(recommender systems)、生物信息学(bioinformatics)、电子商务1注:本文的一个缩短版本(参见以下链接:/wangjy/CCCF_KDD.pdf)发表于《中国计算机学会通讯》2011年的第12期。
(e-commerce)、在线广告(online advertising)、异常检测(anomaly detection)、以及针对大数据的知识发现(knowledge discovery from big data)等。
论文的评价标准主要包括新颖性(novelty)、技术质量(technical quality)、影响力(potential impact)、论文表达的清晰度(clarity of writing)等指标。
会议期间,KDD研究论文报告按照主题会被分成了若干个分会(session),被录用论文的作者在相应的分会做报告。
以KDD 2011[6]为例,该年会的分会主题包括分类(Classification)、矩阵分解(Matrix factorization)、图分析(Graph analysis)、Web用户建模(Web user modeling)、用户建模(User modeling)、在线数据和数据流(Online data and streams)、文本挖掘(Text mining)、隐私保护(Privacy)、社会网络(Social networks)、理论(Theory)、频繁集(Frequent sets)、非监督式学习(Unsupervised learning)、图挖掘(Graph mining)、可扩展性(Scalability)和可预测建模(Predictive modeling)。
2.应用主题(Industrial and Government Track)应用主题类论文的发表和作者的与会报告是KDD年会的重要组成部分,也是KDD相对于很多其他会议的特色之一。
由于数据挖掘的广泛应用性,应用主题类论文受到数据挖掘研究人员和开发者的重视。
相对于很多其他会议,KDD应用主题类论文的征文启事和录取更为规范。
从KDD’12官方网站的征文通知[5]可以看出,该年会的企业及政府应用主题征求描述针对企业和政府部门数据挖掘解决方案的论文投稿,并特别欢迎某些在数据挖掘技术应用过程中能够促进某些实际问题的理解或提出新的挑战性研究问题的论文。
KDD应用主题类论文涉及的应用领域主要包括电子商务、医疗、国防、公共政策、财务、工程、环境、制造业、电信、政务等。
被KDD录用的应用主题类论文又被分为以下3大类:●对企业、政府或其他机构带来实际价值的数据挖掘系统●对企业、政府或其他用户(例如科学研究或医疗行业)带来显著价值的知识发现●有潜力带来价值的前沿应用和技术3.KDD CUP竞赛KDD CUP是ACM SIGKDD[1]组织的有关数据挖掘和知识发现领域的年度赛事。
作为KDD年会的重要组成部分,自1997年以来已经连续举办了15届,目前是数据挖掘领域最有影响力的赛事。
通常每年在KDD会议网站上会公布当年的KDD CUP主题及各个子任务、数据集、考核指标等。
全世界的数据挖掘参赛者在规定时间内提交解决方案和结果。
优胜者名单会在KDD CUP网站公布,并在会议期间颁奖。
纵观历年的KDD CUP赛事,我们不难发现其主题的多样性。
往届的KDD CUP任务涉及到面向利润(升力曲线)优化的直接营销、计算机网络入侵检测、在线零售网站点击流分析、分子生物活性和现场蛋白质预测、生物医学文档和基因角色分类、网络挖掘与用户日志分析、粒子物理学和同调蛋白质预测、互联网用户搜索查询分类、基于图像数据的肺栓塞检测、客户推荐、乳腺癌、客户关系预测、学生成绩评估、以及基于雅虎音乐数据集的音乐推荐等众多领域。
在往届的KDD CUP竞赛中,某些华人组成的参赛队伍也曾取得了不俗的成绩。
例如,KDDCUP 史上首次包揽了全部子项目冠军的团队就来自香港科大,其队员包括Dou Shen(沈抖)、Rong Pan、Jiantao Sun、Junfeng Pan、Kangheng Wu、Jie Yin、Qiang Yang(杨强)。
4.系统演示(Exhibit and Demo Track)KDD会议设有一个系统演示分会场,用于让数据挖掘研究人员或从业者以交互的方式向与会者展示他们所开发的数据挖掘软件系统(或组件)的设计理念、实现技巧以及功能等。
5.工业实践展(Industry Practice Expo Track)工业实践展是KDD从2011年开始新增加的一部分会议内容,主要由特邀报告和专题讨论组成。
其主要目的是召集一流的业界或政府部门的数据挖掘实践者和与会者共享他们的一些有关数据挖掘应用的体会和经验。
6.专题研讨会(Workshops)同其它会议类似,KDD也设有专题研讨会,其目的是就某些热门或前沿主题让数据挖掘研究人员有机会来交流新颖的研究想法。
KDD’11[6]共设了16个主题研讨会。
7.专题讨论会(panels)KDD专题讨论会是就数据挖掘领域的某个重要的话题邀请几个相关的知名专家阐述自己的观点,并通过与参会者的互动来对该话题开展深入的研讨。
KDD’11[6]的专题讨论主题为“来自数据挖掘竞赛的经验教训”(Lessons Learned from Contests in Data Mining)。
8.短期课程(tutorials)每年的KDD年会都会就几个数据挖掘主题邀请这些领域的知名专家细致地讲解与该主题相关的问题、研究背景、主要的解决方案等内容。
通常每个课程的时间是半天或一天。
9.特邀主题报告(keynote presentations)每年的KDD年会都会邀请在某些数据挖掘领域做出卓越成绩的专家学者做主题报告。
以KDD’11[6]为例,会议共邀请了4位特邀主题发言人,他们分别是:美国斯坦福大学电子工程系教授Stephen Boyd、Google公司研究主管Peter Norvig、美国加州大学圣克鲁兹分校分子生物工程系教授David Haussler以及加州大学洛杉矶分校计算机系教授Judea Pearl。
表1、2003-2011年期间KDD研究论文投稿及录取情况(注:自2007年以来论文不再区分长、短文,表中2007年以后的长、短文对应的分别是长报告和短报告)3、 历年论文投稿及接收情况我们对2003年以来KDD 的研究类论文和应用类论文的投稿、录取率等进行了统计(注:数据来自历年KDD 会议的论文集)。
发现研究类论文的投稿量呈现逐年增加的趋势,而论文总的录取率(即包括长、短文所有被录取论文的录取率)相对稳定,基本在17%至19%左右徘徊。
具体的分析结果见表1。
相对于研究类论文,应用类论文的投稿量少且相对稳定,其录取率相对更高,基本在30%左右。