周志华：数据挖掘与机器学习

合集下载

南京大学周志华老师的一个讲普适机器学习的ppt【精品-ppt】

与人工智能乃至计算机科学中很多其他分支学科相比，机器学习还非常年轻、很不成熟
以Tom Mitchell的经典教科书（McGraw Hill出版社，1997）为例，很难看到基础学科（例如数学、物理学）教科书中那种贯穿始终的体系，也许会让人感到这不过是不同方法和技术的堆砌
历史回顾(2)
主要范式的发展：
一方面可以促进和丰富ML本身的发展，另一方面可以促进使用ML技术的学科领域本身的发展
作为“应用基础”，与“ML应用”有根本的区别： • 基础性：不是直接做应用，而是做“更广泛的应用” 或“更成功的应用”所需要的方法和技术
• 广泛性：重点不是去解决单一应用所面临的问题，而是要解决众多应用领域所面临的共性问题
2004
例子2：不平衡数据
医疗：以乳腺癌诊断为例，“健康人”样本远远多于
“病人”样本
金融：以信用卡盗用检测为例，“正常使用”样本远远
多于“被盗用”样本
传统的ML技术基本上只考虑平衡数据如何处理数据不平衡性？
在教科书中找不到现成的答案
例子3：可理解
医疗：以乳腺癌诊断为例，需要向病人解释“为什么做
医疗：以乳腺癌诊断为例，“将病人误诊为健康人的代
价”与“将健康人误诊为病人的代价”是不同的
金融：以信用卡盗用检测为例，“将盗用误认为正常使
用的代价”与“将正常使用误认为盗用的代价”是不同的
传统的ML技术基本上只考虑同一代价
如何处理代价敏感性？
在教科书中找不到现成的答案，例如：
Tom Mitchell, Machine Learning, McGraw-Hill, 1997 Nils J. Nilsson, Introduction to Machine Learning, draft 1996 -

机器学习7周志华ppt课件.ppt

七、贝叶斯分类器
1
1
贝叶斯决策论 (Bayesian decision theory)
概率框架下实施决策的基本理论给定 N 个类别，令 λij 代表将第 j 类样本误分类为第 i 类所产生的损失，则基于后验概率将样本 x 分到第 i 类的条件风险为：
贝叶斯判定准则 (Bayes decision rule) ：
10
xi 的“父属性”
关键是如何确定父属性
10
两种常见方法
? SPODE (Super-Parent ODE)：假设所有属性都依赖于同一属性，称为“超父” (Super-Parent)，然后通过交叉验证等模型选择方法来确定超父属性
? TAN (Tree Augmented na?ve Bayes)：以属性间的条件 ”互信息 ”(mutual information)为边的权重，构建完全图，再利用最大带权生成树算法，仅保留强相关属性间的依赖性
20
EM算法
如何处理“未观测到的”变量？
例如，西瓜已经脱落的根蒂，无法看出是“蜷缩”还是“坚挺”, 则训练样本的“根蒂”属性变量值未知未观测变量 ? 隐变量(latent variable)
EM(Expectation-Maximization) 算法是估计隐变量的利器
令 X 表示已观测变量集， Z 表示隐变量集，欲对模型参数21 做极大似然估计，则应最大化对数似然函数
13
? 训练样本非常充分 ? 性能可能提升
? 有限训练样本 ? 高阶联合概率估计困难
考虑属性间的高阶依赖，需要其他办法
13
贝叶斯网（Bayesian network; Bayes network）
亦称“信念网” (brief network )

机器学习知识点总结周志华

机器学习知识点总结周志华一、引言随着计算机技术的不断发展，机器学习作为一种重要的人工智能技术，被广泛应用于各个领域。

机器学习旨在让计算机通过学习能够自动地从数据中识别模式、进行预测和决策，从而实现智能化的任务处理。

本文将对机器学习的相关知识点进行总结，包括基本概念、常见算法、应用领域以及发展趋势等内容。

二、机器学习基础知识1. 机器学习概念机器学习是一种通过数据和统计方法使计算机系统具有学习能力的技术。

它可以帮助计算机利用数据进行自动学习，从而提高计算机处理任务的智能化水平。

机器学习的应用范围非常广泛，包括自然语言处理、计算机视觉、数据挖掘、推荐系统等领域。

2. 机器学习的分类根据学习方式的不同，机器学习可以分为监督学习、无监督学习、半监督学习和强化学习等不同类型。

通过不同的学习方式，使得机器学习可以应用于各种不同类型的问题。

3. 监督学习监督学习是机器学习中最常用的一种学习方式，它通过已有的标记数据来进行学习，从而能够进行预测和分类等任务。

监督学习包括分类和回归两种类型，用于解决各种实际问题。

4. 无监督学习无监督学习是一种用于无标记数据的学习方式，它可以帮助计算机从数据中发现模式和结构，并进行聚类和降维等任务。

无监督学习的应用非常广泛，包括数据挖掘、图像处理等领域。

5. 强化学习强化学习是一种通过与环境进行交互学习，从而使智能体能够选择行动以最大化预期奖励的学习方式。

强化学习可以应用于自动控制、游戏策略等领域。

6. 机器学习的评估机器学习的评估是非常重要的一部分，它可以帮助我们评价模型的性能，并进行模型的选择和改进。

常用的评估指标包括准确率、精确率、召回率、F1值等。

三、常见机器学习算法1. 线性回归线性回归是一种用于建立输入特征和输出标记之间线性关系的算法，它可以帮助预测连续性变量的数值。

线性回归的模型包括简单线性回归和多元线性回归，可以通过最小二乘法等方法进行参数学习。

2. 逻辑回归逻辑回归是一种用于建立输入特征和输出标记之间的概率关系的算法，它可以进行二分类和多分类任务。

数据挖掘顶级期刊简介

顶级会议第一KDD 第二SIAM ICDM中国计算机学会推荐国际学术刊物(数据库、数据挖掘与内容检索)序号刊物简称刊物全称出版社网址1 TODS ACM Transactions on Database Systems ACM /tods/2 TOIS ACM Transactions on Information andSystems ACM /pubs/tois/3 TKDE IEEE Transactions on Knowledge and Data Engineering IEEE Computer Society /tkde/4 VLDBJ VLDB Journal S pringer-Verlag/dblp/db/journals/vldb/index.html二、B类序号刊物简称刊物全称出版社网址1 TKDD ACM Transactions on Knowledge Discovery from Data ACM/pubs/tkdd/2 AEI Advanced Engineering Informatics Elsevier/wps/find/journaldescription.cws_home/622240/3 DKE Data and Knowledge Engineering Elsevier/science/journal/0169023X4 DMKD Data Mining and Knowledge DiscoverySpringer/content/100254/5 EJIS European Journal of Information Systems The OR Society/ejis/6 GeoInformatica Springer /content/1573-7624/7 IPM Information Processing and Management Elsevier/locate/infoproman8 Information Sciences Elsevier /locate/issn/002002559 IS Information Systems Elsevier/information-systems/10 JASIST Journal of the American Society for Information Science and TechnologyAmerican Society for Information Science and Technology /Publications/JASIS/jasis.html11 JWS Journal of Web Semantics Elsevier /locate/inca/67132212 KIS Knowledge and Information Systems Springer /journal/1011513 TWEB ACM Transactions on the Web ACM /三、C类序号刊物简称刊物全称出版社网址1 DPD Distributed and Parallel Databases Springer/content/1573-7578/2 I&M Information and Management E lsevier /locate/im/3 IPL Information Processing Letters Elsevier /locate/ipl4 Information Retrieval Springer /issn/1386-45645 IJCIS International Journal of Cooperative Information Systems World Scientific/ijcis6 IJGIS International Journal of Geographical Information Science Taylor & Francis/journals/tf/13658816.html7 IJIS International Journal of Intelligent Systems Wiley/jpages/0884-8173/8 IJKM International Journal of Knowledge Management IGI/journals/details.asp?id=42889 IJSWIS International Journal on Semantic Web and Information Systems IGI/10 JCIS J ournal of Computer Information Systems IACIS/web/journal.htm11 JDM Journal of Database Management IGI-Global/journals/details.asp?id=19812 JGITM Journal of Global Information Technology Management Ivy League Publishing/bae/jgitm/13 JIIS Journal of Intelligent Information Systems Springer/content/1573-7675/14 JSIS Journal of Strategic Information Systems Elsevier/locate/jsis中国计算机学会推荐国际学术刊物(数据库、数据挖掘与内容检索)一、A类序号刊物简称刊物全称出版社网址1 TODS ACM Transactions on Database Systems ACM /tods/2 TOIS ACM Transactions on Information andSystems ACM /pubs/tois/3 TKDE IEEE Transactions on Knowledge and Data Engineering IEEE Computer Society /tkde/4 VLDBJ VLDB Journal S pringer-Verlag/dblp/db/journals/vldb/index.html二、B类序号刊物简称刊物全称出版社网址1 TKDD ACM Transactions on Knowledge Discovery from Data ACM/pubs/tkdd/2 AEI Advanced Engineering Informatics Elsevier/wps/find/journaldescription.cws_home/622240/3 DKE Data and Knowledge Engineering Elsevier/science/journal/0169023X4 DMKD Data Mining and Knowledge DiscoverySpringer/content/100254/5 EJIS European Journal of Information Systems The OR Society/ejis/6 GeoInformatica Springer /content/1573-7624/7 IPM Information Processing and Management Elsevier/locate/infoproman8 Information Sciences Elsevier /locate/issn/002002559 IS Information Systems Elsevier/information-systems/10 JASIST Journal of the American Society for Information Science and TechnologyAmerican Society for Information Science and Technology /Publications/JASIS/jasis.html11 JWS Journal of Web Semantics Elsevier /locate/inca/67132212 KIS Knowledge and Information Systems Springer /journal/1011513 TWEB ACM Transactions on the Web ACM /三、C类序号刊物简称刊物全称出版社网址1 DPD Distributed and Parallel Databases Springer/content/1573-7578/2 I&M Information and Management E lsevier /locate/im/3 IPL Information Processing Letters Elsevier /locate/ipl4 Information Retrieval Springer /issn/1386-45645 IJCIS International Journal of Cooperative Information Systems World Scientific/ijcis6 IJGIS International Journal of Geographical Information Science Taylor & Francis/journals/tf/13658816.html7 IJIS International Journal of Intelligent Systems Wiley/jpages/0884-8173/8 IJKM International Journal of Knowledge Management IGI/journals/details.asp?id=42889 IJSWIS International Journal on Semantic Web and Information Systems IGI/10 JCIS J ournal of Computer Information Systems IACIS/web/journal.htm11 JDM Journal of Database Management IGI-Global/journals/details.asp?id=19812 JGITM Journal of Global Information Technology Management Ivy League Publishing/bae/jgitm/13 JIIS Journal of Intelligent Information Systems Springer/content/1573-7675/14 JSIS Journal of Strategic Information Systems Elsevier/locate/jsis一、以下是一些数据挖掘领域专家牛人的网站，有很多精华，能开阔研究者的思路，在此共享：1.Rakesh Agrawal主页：/en-us/people/rakesha/ 数据挖掘领域唯一独有的关联规则研究的创始人，其主要的Apriori算法开启了这一伟大的领域。

机器学习（周志华）——学习笔记1

机器学习（周志华）——学习笔记1看了绪论，第⼀感觉就是“机器学习其实就是挑西⽠”/惊讶/惊讶机器学习致⼒于研究如何通过计算的⼿段，利⽤经验来改善系统⾃⾝的性能。

在计算机系统中，“经验”通常以“数据”形式存在，因此，机器学习所研究的主要内容，是关于在计算机上从数据中产⽣“模型”（model）的算法，即“学习算法”（learning algorithm）。

有了学习算法，我们把经验数据提供给它，它就能基于这些数据产⽣模型；在⾯对新情况时，模型就会给我们提供相应的判断。

机器学习就是研究学习算法的学问。

模型：泛指从数据中学得的结果。

部分⽂献中，模型指全局性结果（例如⼀棵决策树），⽽模式指局部性结果（例如⼀条规则）2017.04.20更⼀、基本术语数据集（data set）：记录的集合⽰例（instance）/样本（sample）：每条记录是关于⼀个事件或对象的描述，由于属性可以张成⼀个空间，每个对象可以在空间中找到⾃⼰的坐标位置，空间中每⼀个点⼜对应⼀个坐标向量，所以每⼀个⽰例也称为特征向量（feature vector）属性（attribute）/特征（feature）：反应事件或对象在某⽅⾯的表现或性质的事项属性值（attribute value）：属性上的取值属性空间（attribute space）/样本空间（sample space）/输⼊空间：属性张成的空间样例（example）：⼜有了标记信息的⽰例，这⾥的标记即label，也就是我们常说的标签。

所有标记的集合，也称为“标记空间”（label space）或“输出空间”分类（classification）:预测的是离散值回归（regression）：预测的是连续值学习（learning）/训练（training）：从数据中学得模型的过程。

训练过程总使⽤的数据称为“训练数据”（training data），其中每⼀个样本称为“训练样本”（training sample），训练样本组成的集合称为“训练集”（training set）测试（testing）：学得模型后，使⽤其进⾏预测的过程，被预测的样本称为“测试样本”（testing sample）泛化（generalization）能⼒：学得的模型适⽤于新样本的能⼒⼆、假设空间归纳（induction）与演绎（deduction）是科学推理的两⼤基本⼿段。

周志华机器学习 Chap01绪论

- 书页数量大，且分布在多处 - 部分损毁较严重，字迹模糊 - 需要大量掌握古文字的专业人才近年来，古文献的数字化浪潮给自动文学修复提供了机会
例如：古文献修复（文化）
以色列特拉维夫大学的学者将机器学习用于自动的书页拼接
已确定相邻
已确定不相邻
分类模型
判断是否相邻
相邻专家确认
在Cairo Genizah测试数据上，系统的自动判断精度超过 93% 新完成约 1,000 篇Cairo Genizah文章的拼接 (对比：过去整个世纪，数百人类专家只完成了几千篇文章拼接)
自动鉴定
分类模型待鉴定画作
特有“笔迹”
真迹 + 赝品
Kröller Müller美术馆与Cornell等大学的学者对82幅梵高真迹和6幅赝品进
行分析，自动鉴别精度达 95%
[C. Johnson et al., IEEE-SP, 2008]
Dartmouth学院、巴黎高师的学者对8幅勃鲁盖尔真迹和5幅赝品进行分析，
查询 PubMed 以获取候选摘要
人工找出值得全文审读的文章
[C. Brodley et al., AI Magazine 2012]
“文献筛选”的故事
在一项关于婴儿和儿童残疾的研究中，美国Tufts医学中心筛选了约 33,000 篇摘要
尽管 Tufts医学中心的专家效率
Cairo Genizah - 19世纪末被发现 - 超过300,000个片段 - 散布于全球多家博物馆
高水平专家的大量精力被用于古文献修复
[L. Wolf et al., IJCV 2011]
例如：古文献修复（文化）一个重要问题：
原书籍已经变成分散且混杂的多个书页，如何拼接相邻的书页？

人工智能与机器学习书籍推荐清单

人工智能与机器学习书籍推荐清单人工智能和机器学习是当今科技领域的热门话题，而深入了解和学习这些领域的知识是非常重要的。

在这篇文章中，我将向大家推荐一些优秀的人工智能与机器学习书籍，帮助读者更好地理解和应用这些技术。

1.《统计学习方法》- 李航这本书是机器学习领域的经典之作，涵盖了从基础的数学知识到各种常见机器学习算法的原理和应用。

通过学习本书，读者可以建立起对机器学习方法的基本理论和应用技巧的扎实基础。

2.《机器学习》- 周志华周志华教授是机器学习领域的知名专家，他的这本书以清晰简明的语言，系统性地介绍了机器学习的方法和算法。

书中既有理论解释，也有实际案例分析，可以帮助读者更好地掌握机器学习的核心概念和应用技巧。

3.《深度学习》- Ian Goodfellow、Yoshua Bengio、Aaron Courville深度学习是人工智能领域的重要分支，对于理解和应用深度学习技术，这本书是非常好的指南。

作者是深度学习领域的三位权威专家，他们从基础的神经网络开始介绍，逐步深入探讨了深度学习的各个方面，包括卷积神经网络、递归神经网络等。

4.《模式识别与机器学习》- Christopher M. Bishop这本书是模式识别和机器学习领域的经典之作，作者是知名的计算机科学家Christopher M. Bishop教授。

书中详细介绍了模式识别的基础概念和数学原理，同时还涵盖了许多常见的机器学习算法和技术，如支持向量机、高斯过程等。

5.《计算机视觉：算法与应用》- Richard Szeliski计算机视觉是人工智能领域的重要研究方向，该书对计算机视觉的算法和应用进行了详细介绍。

作者是Microsoft Research Asia的研究员Richard Szeliski，他在计算机视觉领域经验丰富，书中涵盖了图像处理、特征提取、物体识别等多个领域的内容。

在选择适合自己的书籍时，读者可以先根据自己的背景和兴趣选择适合的入门书籍，然后逐步深入学习，选择更加专业和深入的教材。

人工智能课程大纲

人工智能课程大纲一、课程简介人工智能作为一门前沿的学科，其应用范围广泛，影响深远。

本课程旨在引导学生全面了解人工智能的基本概念、方法和应用领域，培养学生运用人工智能技术解决实际问题的能力。

二、课程目标1. 理解人工智能的基本概念和原理；2. 熟悉人工智能的核心技术和算法；3. 掌握人工智能在各个领域的应用案例和发展趋势；4. 培养学生运用人工智能技术解决实际问题的能力；5. 培养学生的团队协作和创新能力。

三、教学内容1. 人工智能概述- 人工智能的定义与发展历程- 人工智能的应用领域和挑战2. 机器学习与数据挖掘- 监督学习、无监督学习和强化学习的基本概念- 常用的机器学习算法和数据挖掘技术- 数据预处理和特征工程3. 深度学习与神经网络- 神经网络的基本原理与结构- 深度学习算法及其应用场景- 深度学习框架的使用和模型优化方法4. 自然语言处理与人机对话- 语言模型与文本分类技术- 机器翻译和文本生成- 人机对话系统的设计与实现5. 计算机视觉与图像处理- 图像特征提取与图像分类- 目标检测和图像分割- 图像生成与风格转换6. 智能推荐与个性化推荐- 推荐系统的原理与算法- 协同过滤与内容推荐- 个性化推荐系统的构建与优化7. 人工智能伦理与社会影响- 人工智能的伦理问题与挑战- 人工智能在社会中的应用与风险- 人工智能的未来发展与应对策略四、教学方法与评价方式1. 教学方法- 讲授理论知识，结合案例分析和实例讲解 - 引导学生自主学习和独立思考- 设计实践项目，培养实际操作能力- 进行小组讨论和课堂展示2. 评价方式- 课堂参与和讨论表现- 作业和实践项目的完成情况- 期末考核和论文撰写成果五、参考书目1.《机器学习》- 周志华2.《深度学习》- 邱锡鹏3.《自然语言处理综论》- 陆海英4.《计算机视觉：算法与应用》- Richard Szeliski5.《推荐系统实践》- 王喆六、备注事项1. 课程期限为一学期，每周两次课程，每次两小时；2. 学生需要具备基本的数学和编程基础；3. 课程设置了实验室实践环节，学生需进行相关实验和项目设计。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

机器学习与数据挖掘周志华南京大学计算机软件新技术国家重点实验室，南京210093“机器学习”是人工智能的核心研究领域之一，其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能，因为众所周知，没有学习能力的系统很难被认为是具有智能的。

目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”[1]。

事实上，由于“经验”在计算机系统中主要是以数据的形式存在的，因此机器学习需要设法对数据进行分析，这就使得它逐渐成为智能数据分析技术的创新源之一，并且为此而受到越来越多的关注。

“数据挖掘”和“知识发现”通常被相提并论，并在许多场合被认为是可以相互替代的术语。

对数据挖掘有多种文字不同但含义接近的定义，例如“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程”[2]。

其实顾名思义，数据挖掘就是试图从海量数据中找出有用的知识。

大体上看，数据挖掘可以视为机器学习和数据库的交叉，它主要利用机器学习界提供的技术来分析海量数据，利用数据库界提供的技术来管理海量数据。

因为机器学习和数据挖掘有密切的联系，受主编之邀，本文把它们放在一起做一个粗浅的介绍。

1 无处不在随着计算机技术的飞速发展，人类收集数据、存储数据的能力得到了极大的提高，无论是科学研究还是社会生活的各个领域中都积累了大量的数据，对这些数据进行分析以发掘数据中蕴含的有用信息，成为几乎所有领域的共同需求。

正是在这样的大趋势下，机器学习和数据挖掘技术的作用日渐重要，受到了广泛的关注。

例如，网络安全是计算机界的一个热门研究领域，特别是在入侵检测方面，不仅有很多理论成果，还出现了不少实用系统。

那么，人们如何进行入侵检测呢？首先，人们可以通过检查服务器日志等手段来收集大量的网络访问数据，这些数据中不仅包含正常访问模式还包含入侵模式。

然后，人们就可以利用这些数据建立一个可以很好地把正常访问模式和入侵模式分开的模型。

这样，在今后接收到一个新的访问模式时，就可以利用这个模型来判断这个模式是正常模式还是入侵模式，甚至判断出具体是何种类型的入侵。

显然，这里的关键问题是如何利用以往的网络访问数据来建立可以对今后的访问模式进行分类的模型，而这正是机器学习和数据挖掘技术的强项。

实际上，机器学习和数据挖掘技术已经开始在多媒体、计算机图形学、计算机网络乃至操作系统、软件工程等计算机科学的众多领域中发挥作用，特别是在计算机视觉和自然语言处理领域，机器学习和数据挖掘已经成为最流行、最热门的技术，以至于在这些领域的顶级会议上相当多的论文都与机器学习和数据挖掘技术有关。

总的来看，引入机器学习和数据挖掘技术在计算机科学的众多分支领域中都是一个重要趋势。

机器学习和数据挖掘技术还是很多交叉学科的重要支撑技术。

例如，生物信息学是一个新兴的交叉学科，它试图利用信息科学技术来研究从DNA到基因、基因表达、蛋白质、基因电路、细胞、生理表现等一系列环节上的现象和规律。

随着人类基因组计划的实施，以及基因药物的美好前景，生物信息学得到了蓬勃发展。

实际上，从信息科学技术的角度来看，生物信息学的研究是一个从“数据”到“发现”的过程，这中间包括数据获取、数据管理、数据分析、仿真实验等环节，而“数据分析”这个环节正是机器学习和数据挖掘技术的舞台。

正因为机器学习和数据挖掘技术的进展对计算机科学乃至整个科学技术领域都有重要意义，美国NASA-JPL实验室的科学家2001年9月在《Science》上专门撰文[3]指出，机器学习对科学研究的整个过程正起到越来越大的支持作用，并认为该领域将稳定而快速地发展，并将对科学技术的发展发挥更大的促进作用。

NASA-JPL实验室的全名是美国航空航天局喷气推进实验室，位于加州理工学院，是美国尖端技术的一个重要基地，著名的“勇气”号和“机遇”号火星机器人正是在这个实验室完成的。

从目前公开的信息来看，机器学习和数据挖掘技术在这两个火星机器人上有大量的应用。

除了在科学研究中发挥重要作用，机器学习和数据挖掘技术和普通人的生活也息息相关。

例如，在天气预报、地震预警、环境污染检测等方面，有效地利用机器学习和数据挖掘技术对卫星传递回来的大量数据进行分析，是提高预报、预警、检测准确性的重要途径；在商业营销中，对利用条形码技术获得的销售数据进行分析，不仅可以帮助商家优化进货、库存，还可以对用户行为进行分析以设计有针对性的营销策略；……。

下面再举两个例子。

公路交通事故是人类面临的最大杀手之一，全世界每年有上百万人丧生车轮，仅我国每年就有约10万人死于车祸。

美国一直在对自动驾驶车辆进行研究，因为自动驾驶车辆不仅在军事上有重要意义，还对减少因酒后、疲劳而引起的车祸有重要作用。

2004年3月，在美国DARPA（国防部先进研究计划局）组织的自动驾驶车辆竞赛中，斯坦福大学的参赛车在完全无人控制的情况下，成功地在6小时53分钟内走完了132英里（约212公里）的路程，获得了冠军。

比赛路段是在内华达州西南部的山区和沙漠中，路况相当复杂，有的地方路面只有几米宽，一边是山岩，另一边是百尺深沟，即使有丰富驾驶经验的司机，在这样的路段上行车也是一个巨大的挑战。

这一结果显示出自动驾驶车辆已经不再是一个梦想，可能在不久的将来就会走进普通人的生活。

值得一提的是，斯坦福大学参赛队正是由一位机器学习专家所领导的，而获胜车辆也大量使用了机器学习和数据挖掘技术。

Google、Yahoo、百度等互联网搜索引擎已经开始改变了很多人的生活方式，例如很多人已经习惯于在出行前通过网络搜索来了解旅游景点的背景知识、寻找合适的旅馆、饭店等。

美国新闻周刊曾经对Google有个“一句话评论”：“它使得任何人离任何问题的答案之间的距离只有点击一下鼠标这么远”。

现在很少有人不知道互联网搜索引擎的用处，但可能很多人并不了解，机器学习和数据挖掘技术正在支撑着这些搜索引擎。

其实，互联网搜索引擎是通过分析互联网上的数据来找到用户所需要的信息，而这正是一个机器学习和数据挖掘任务。

事实上，无论Google、Yahoo还是微软，其互联网搜索研究核心团队中都有相当大比例的人是机器学习和数据挖掘专家，而互联网搜索技术也正是机器学习和数据挖掘目前的热门研究话题之一。

2 雄关漫道机器学习是人工智能研究发展到一定阶段的必然产物。

从20世纪50年代到70年代初，人工智能研究处于“推理期”，人们认为只要给机器赋予逻辑推理能力，机器就能具有智能。

这一阶段的代表性工作主要有A. Newell和H. Simon的“逻辑理论家”程序以及此后的“通用问题求解”程序等，这些工作在当时取得了令人振奋的成果。

例如，“逻辑理论家”程序在1952年证明了著名数学家罗素和怀特海的名著《数学原理》中的38条定理，在1963年证明了全部的52条定理，而且定理2.85甚至比罗素和怀特海证明得更巧妙。

A. Newell和H. Simon因此获得了1975年图灵奖。

然而，随着研究向前发展，人们逐渐认识到，仅具有逻辑推理能力是远远实现不了人工智能的。

E.A. Feigenbaum 等人认为，要使机器具有智能，就必须设法使机器拥有知识。

在他们的倡导下，20世纪70年代中期开始，人工智能进入了“知识期”。

在这一时期，大量专家系统问世，在很多领域做出了巨大贡献。

E.A. Feigenbaum作为“知识工程”之父在1994年获得了图灵奖。

但是，专家系统面临“知识工程瓶颈”，简单地说，就是由人来把知识总结出来再教给计算机是相当困难的。

于是，一些学者想到，如果机器自己能够学习知识该多好！实际上，图灵在1950年提出图灵测试的文章中，就已经提到了机器学习的可能，而20世纪50年代其实已经开始有机器学习相关的研究工作，主要集中在基于神经网络的连接主义学习方面，代表性工作主要有F. Rosenblatt的感知机、B. Widrow的Adaline等。

在20世纪6、70年代，多种学习技术得到了初步发展，例如以决策理论为基础的统计学习技术以及强化学习技术等，代表性工作主要有A.L. Samuel的跳棋程序以及N.J. Nilson的“学习机器”等，20多年后红极一时的统计学习理论的一些重要结果也是在这个时期取得的。

在这一时期，基于逻辑或图结构表示的符号学习技术也开始出现，代表性工作有P. Winston的“结构学习系统”、R.S. Michalski等人的“基于逻辑的归纳学习系统”、E.B. Hunt等人的“概念学习系统”等。

1980年夏天，在美国卡内基梅隆大学举行了第一届机器学习研讨会；同年，《策略分析与信息系统》连出三期机器学习专辑；1983年，Tioga出版社出版了R.S. Michalski、J.G. Carbonell和T.M. Mitchell主编的《机器学习：一种人工智能途径》[4]，书中汇集了20位学者撰写的16篇文章，对当时的机器学习研究工作进行了总结，产生了很大反响a；1986年，《Machine Learning》创刊；1989年，《Artificial Intelligence》出版了机器学习专辑，刊发了一些当时比较活跃的研究工作，其内容后来出现在J.G. Carbonell主编、MIT出版社1990年出版的《机器学习：风范与方法》[5]一书中。

总的来看，20世纪80年代是机器学习成为一个独立的学科领域并开始快速发展、各种机器学习技术百花齐放的时期。

R.S. Michalski等人[4]中把机器学习研究划分成“从例子中学习”、“在问题求解和规划中学习”、“通过观察和发现学习”、“从指令中学习”等范畴；而E.A. Feigenbaum在著名的《人工智能手册》b中[6]，则把机器学习技术划分为四大类，即“机械学习”、“示教学习”、“类比学习”、“归纳学习”。

机械学习也称为“死记硬背式学习”，就是把外界输入的信息全部记下来，在需要的时候原封不动地取出来使用，这实际上没有进行真正的学习；示教学习和类比学习实际上类似于R.S. Michalski等人所说的“从指令中学习”和“通过观察和发现学习”；归纳学习类似于“从例子中学习”，即从训练例中归纳出学习结果c。

20世纪80年代以来，被研究得最多、应用最广的是“从例子中学习”（也就是广义的归纳学习），它涵盖了监督学习（例如分类、回归）、非监督学习（例如聚类）等众多内容。

下面我们对这方面主流技术的演进做一个简单的回顾。

在20世纪 90年代中期之前，“从例子中学习”的一大主流技术是归纳逻辑程序设计（Inductive Logic Programming），这实际上是机器学习和逻辑程序设计的交叉。

它使用1阶逻辑来进行知识表示，通过修改和扩充逻辑表达式（例如Prolog表达式）来完成对数据的归纳。

这一技术占据主流地位与整个人工智能领域的发展历程是分不开的。