989423-人工智能基础-第六章

合集下载

人工智能与机器学习基础知识解析

人工智能与机器学习基础知识解析第一章：人工智能的发展历程人工智能是计算机科学的一个重要分支，专注于构建智能机器，使其能够模拟和执行人类智能任务。

其起源可以追溯到20世纪50年代，随着计算机技术的发展和对人类智能的探索，人工智能逐渐发展成熟。

在过去几十年中，人工智能经历了起伏不定的发展阶段，如今正处于一个快速发展的时期。

第二章：人工智能的分类与应用领域人工智能可以分为弱人工智能和强人工智能。

弱人工智能是指只能解决特定领域问题的人工智能系统，如机器翻译、语音识别等；而强人工智能是指能够像人类一样思考和解决复杂问题的智能系统。

人工智能在许多领域都有广泛的应用，包括医疗、金融、交通、农业等。

第三章：机器学习的基本概念与原理机器学习是人工智能的重要组成部分，是使计算机能够从数据中学习并自动改善性能的一种技术。

机器学习的基本原理是通过给计算机提供大量数据和相应的标签，让计算机能够自动发现数据中的模式和规律，从而实现预测和决策。

第四章：监督学习与无监督学习监督学习是一种机器学习方法，通过给计算机提供已知标签的训练数据，让计算机能够学习出一个预测函数，从而对未知数据进行预测。

常见的监督学习算法包括决策树、朴素贝叶斯、支持向量机等。

而无监督学习是一种机器学习方法，它从没有标签的数据中自动发现出模式和规律。

常见的无监督学习算法包括聚类、降维等。

第五章：深度学习与神经网络深度学习是一种机器学习方法，它模仿人类大脑的结构和功能，通过构建多层神经网络来提取和学习数据中的特征。

深度学习在图像识别、自然语言处理等领域取得了重大突破。

神经网络是深度学习的基本组成单元，它由许多神经元和连接它们的权重参数构成，通过反向传播算法来优化这些权重参数。

第六章：优化算法与模型评估在机器学习中，优化算法用于寻找最优的模型参数，以最大限度地减少预测误差。

常见的优化算法包括梯度下降法、牛顿法等。

模型评估是用于评估机器学习模型性能的一种方法，常见的评估指标包括准确率、精准率、召回率等。

第6章机器学习

维数灾难问题
15
人工智能原理与应用
第六章机器学习
机器学习的难题(2)
训练数据问题
– PU 学习问题:只有正例和未标记数据的学习问题，从仅部分标记的正例和其它的未标记数据上学习最优分类器
16
人工智能原理与应用
第六章机器学习
机器学习的难题(3)
结构输出问题
17
人工智能原理与应用
第六章机器学习
34
人工智能原理与应用
第六章机器学习
• 标定的训练数据 • 训练过程：根据目标输出与实际输出的误差信号来调节参数 • 典型方法
– 全局：BN(贝叶斯网络), NN,SVM, Decision Tree – 局部：KNN(K-th Nearest Neighbor )、CBR(Case-base reasoning)
能否更“准”？
如果能，会从哪儿来？
人工智能原理与应用
第六章机器学习
挑战(2)：速度
共性问题：几乎所有的领域，都希望越快越好
加快速度也是永远的追求
“训练速度” vs. ―测试速度
训练速度快的往往测试速度慢：k近邻
测试速度快的往往训练速度慢：神经网络
人工智能原理与应用
第六章机器学习
挑战(2)：速度（续）
第六章机器学习
为什么需要机器学习？
• 美国JPL实验室的科学家在《Science》（ 2001年9月）上指出：机器学习对科学研究的整个过程正起到越来越大的支持作用， ……，该领域在今后的若干年内将取得稳定而快速的发展 • Machine learning forms the core of may present-day AI applications

人工智能基础知识与Python实践指南

人工智能基础知识与Python实践指南第一章：人工智能基础知识概述在进入Python实践之前，我们先来了解一些人工智能的基础知识。

人工智能是指让机器具备类似于人类的智能行为和思维能力的一门科学。

它是计算机科学、神经科学、认知科学、心理学等多个学科的交叉融合。

人工智能包括机器学习、深度学习、自然语言处理等领域，广泛应用于图像识别、语音识别、自动驾驶等众多领域。

第二章：机器学习基础机器学习是人工智能的核心技术之一，它通过让机器从数据中学习并改进性能，实现任务自动化。

在机器学习中，数据被划分为训练集和测试集，训练集用于构建模型，测试集用于评估模型的性能。

机器学习中常用的算法包括线性回归、逻辑回归、决策树、支持向量机等。

Python是机器学习的常用编程语言，它具有丰富的机器学习库和工具，如Scikit-learn、TensorFlow、PyTorch 等。

第三章：深度学习基础深度学习是机器学习的一个重要分支，它模拟人脑神经网络的结构和功能，通过多层次的神经元网络进行学习和预测。

深度学习广泛应用于图像识别、自然语言处理等领域。

在深度学习中，常用的神经网络模型包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。

Python中的深度学习框架有Keras、TensorFlow、PyTorch等，它们提供了方便易用的接口和工具，简化了深度学习的开发过程。

第四章：自然语言处理基础自然语言处理是人工智能中的重要研究方向，它涉及文本分析、语言理解、机器翻译等任务。

自然语言处理的基础是文本预处理，包括文本清洗、分词、词干提取等操作。

在Python中，有一些常用的自然语言处理库，如NLTK、SpaCy等。

另外，Word2Vec、BERT等模型是自然语言处理中常用的深度学习模型，它们可以进行词向量的表示和语义分析。

第五章：Python实践指南Python是人工智能领域中最流行的编程语言之一，它具有简单易学、开发效率高等优点。

人工智能第六章6.1-6.2

句的基例）的集合。因为T’中失效点的个数有限，所以S’
是有限集合。
任取S’的一解释I’，则I’是S的某个解释I的子集，
而解释I是T中一个分枝，又因S恒假，所以，I弄假S，即
I弄假S 中某子句的某个基例，亦即I弄假S’中子句C’，故
I弄假S’。因为I’I,且I’是S’的解释,故I’弄假S’．由I’的任
其中P(x1，…，xn)是出于S的所有n元符号，t1，…，tn是S的H域中的元素． l 定（基例） S是子句集，C是S中的一个子
句．用S的H域中元素代替C中所有量所得到的
2
基子句称子句C的基例。
8/22/2023
H解释
定（子句集的H解） S是子句集，H是S的H域，I*是S在H上的一个解．称I* S的一个H解，如果I* 足如下条件：
结论
l）子句 C的基例 C’被解释 I满足，当且仅当
C’中的一个基文字L’出现在 I中．
2）子句C被解释I满足，当且仅当
C的每一个基例都被I满足．
3）子句 C被解释 I弄假，当且仅当
至少有一个C的基例C’被I弄假。
4）子句集S不可满足，当且仅当
对每个解释I，至少有一个S中某个子句C的基例C’被I
弄假。
I2* ={ ～P(a), ～Q(a), R(a), P(f(a)), ～Q(f(a)), ～R(f(a)), …
}
4
8/22/2023
二、Herbrand解释与普通解释的关系
l 子句集S的H解释是S的普通解释。 l S的普通解释不一定是S的H解释：普通解释不
是必须定义在H域上，即使定义在H域上，也不一定是一个H解释。 l 任取普通解释I，依照I，可以按如下方法构造S 的一个H解释I*，使得若 S在 I下为真则 S在I* 下也为真。

989420-人工智能基础-AI-7(本)

不利于人们从自然思维的角度组织问题的求解和提供问题求解所需的知识—— 归结演绎并非人类的自然思维方式。
基于规则的演绎推理
保留蕴涵式，将其作为推理规则，用于直接推导目标公式，符合人的自然思维方式，通过规则（作为启发式知识）更有效地引导演绎推理过程，比归结反演更为有效的推理技术，广泛地应用于许多问题求解任务中。
规则演绎的分类：
正向演绎——从事实出发，应用规则不断推导出中间结果作为新的事实，直至推导出目标公式。
逆向演绎——从目标公式出发，逆向应用规则不断推导出子目标，直至所有子目标就是给定的事实为止。换言之，目标公式通过逆向推理找到了支持其成立的所有依据。
主要内容：
·基于规则的正向演绎推理
·基于规则的逆向演绎推理
2.4 基于规则的演绎推理
总体描述
规则演绎将求解问题所需的知识分为二类：
规则——表示为蕴涵式，作为启发式知识（表示应用域中存在的规律和法则），引导演绎推理过程。
事实——表示为非蕴涵形式的合适公式，作为应用规则进行推理时参考的有关问题状态和环境的知识。
规则演绎的任务——从给定的事实（即问题的状态和环境知识）和规则，证明某个目标公式成立。
目标公式: Terrier(z)∨Noisy(z1) 解图置换：S = {Fido/z1, Fido/y, Fido/z, Fido/x}
解图置换的合一复合处理：（1）设解图置换中元素形如 ti/vi(i = 1, 2, …, n), ti 指示置换项，而 vi 指示变量。（2）建立两个分别由 ti 和 vi 构成的表达式（i = 1, 2, …, n）： U1 = (v1, v2, …, vn) U2 = (t1, t2, …, tn) (3) 检查 U1 和 U2 能否合一，若不能合一，则该置换是不一致的，进而解图是不一致的；若能合一，则建立起使 U1 和 U2 合一的置换，称为解图置换 S 的合一复合，进而解图是一致的。表 2.3 给出若干解图置换的合一复合例。

人工智能第六章PPT课件

1
2 21
P(1) P(2) Q(1, 1) Q(1, 2) Q(2, 1) Q(2, 2)
TFF
T
F
T
指定 a对应1得H解释：
I1*＝｛P(a), ～Q(a, a), P(f(a, a)), ～Q(a, f(a, a)), ～Q(f(a, a), a), ～Q(f(a, a), f(a, a)), …｝
I*＝｛～P(a), Q(a, a), P(f(a, a)), ～Q(a, f(a, a)),
Q(f(a, a), a), ～Q(f(a, a), f(a, a)), …｝
10
9/29/2020
例
S={P(x), Q(y, f(y, z))}
令S的一个解释I如下:
D={1, 2} f(1, 1) f(1, 2) f(2, 1) f(2, 2)
指定 a对应2得H解释：
11
I2*＝｛～P(a), Q(a, a), P(f(a, a)), ～Q(a, f(a, a)), Q(f(a, a), a), ～Q(f(a, a), f(a9,/2a9)/2)0, 2…0 ｝
对应于I的H解释I*
定义（对应于I的H解释I*）设I是子句集S在区域D上的解释。 H是S的H域。
其中f(t1，…，tn)是出现在S中的所有n元函数符号，
tj Hi-1，j＝1，…，n．
称Hi为S的i级常量集，H 称为S的Herbrand域，
1
简称S的H域。 9/29/2020
例 S＝｛P(f(x)，a，g(y)，b)｝
H0 ={a, b} H1 ={a, b, f(a), f(b), g(a), g(b)} H2＝{a, b, f(a), f(b), g(a), g(b), f(f(a)), f(f(b)), f(g(a)), f(g(b)), g(f(a)), g(f(b)), g(g(a)), g(g(b))}

学习人工智能的基础知识

学习人工智能的基础知识第一章：人工智能的定义与发展概况人工智能（Artificial Intelligence，简称AI）是计算机科学与技术的一个分支领域，旨在开发智能化机器和软件系统。

人工智能领域的发展经历了几个阶段，包括符号主义、连接主义和深度学习。

在人工智能的发展过程中，经常使用的技术包括机器学习、自然语言处理、计算机视觉和专家系统等。

第二章：机器学习的基础知识机器学习是人工智能领域中的一个重要分支，通过让机器从大量数据中学习规律和模式，从而实现自主的学习和决策能力。

机器学习的主要算法包括监督学习、无监督学习和强化学习。

监督学习是通过已经标记好的数据进行学习；无监督学习是从未标记的数据中学习；强化学习是通过与环境的交互来学习。

第三章：自然语言处理的基础知识自然语言处理（Natural Language Processing，简称NLP）是人工智能领域中的一个重要研究方向，旨在让计算机理解和处理人类语言。

自然语言处理的关键技术包括词法分析、句法分析、语义分析等。

其中，词法分析主要涉及分词、词性标注和命名实体识别等；句法分析主要涉及句法关系和句法树的构建；语义分析主要涉及情感分析和语义角色标注等。

第四章：计算机视觉的基础知识计算机视觉（Computer Vision）是人工智能领域中的一个关键领域，旨在使机器能够理解和解释视觉信息。

计算机视觉的核心技术包括图像特征提取、目标检测和图像分类等。

图像特征提取是将图像转化为机器可识别的信息；目标检测是在图像中定位和识别目标；图像分类是将图像分类为不同的类别。

第五章：专家系统的基础知识专家系统（Expert System）是人工智能领域中的一种基于知识和推理的计算机程序，模拟了人类专家的决策和问题求解过程。

专家系统的主要组成部分包括知识库、推理引擎和用户接口。

知识库是存储和管理领域知识的数据库；推理引擎是根据知识库中的规则和事实进行推理和决策；用户接口是用户与专家系统进行交互的界面。

989427-人工智能基础-绪论

• 60年代初麦卡锡提出了alpha-beta修剪算法，大大提高了机器下棋水平。 • 下棋程序水平的快速提高：
• 1966年——C级专业棋手水平， • 1982年——大师级， • 1985年——美国的Hitech，特级大师水平， • 1988年——由卡内基-梅隆大学的两个学生设计的程序“DeepThought”在美国
基于知识的（Knowledge Based, KB）系统、机器学习和知
规划和配置、
机器感知（机器视觉、语言理解）。
• 80年代以专家系统为核心发展起来的人工智能和知识工程技术，给AI转变为生产力做好了技术和社会准备
• 进入九十年代，人工智能加速了其实用化进程：
1.3 人工智能研究的成果
1 国际象棋 • 国际象棋是典型的适合于AI技术解决的问题
• 50年代AI研究形成时期，其就是AI研究的主要对象之一， • 著名的老一辈AI学者像西蒙（Simon）、纽厄尔（Newell）和肖（shaw）， • 不少AI问题求解技术来源于下棋程序的研究，如状态空间搜索方法。
的一次锦标赛中胜了最高级棋手。 • 1997年——由IBM公司研制的超级计算机“DeepBlue”，在与卡斯帕罗夫的六
盘对弈中，取得三胜二和一负的战绩。
• 下棋需要高级的智能，其进展可视为人工智能研究的重大成就。
1.3 人工智能研究的成果
2 口语识别 • 口语识别是长期以来AI要解决的困难问题，
1 形成期（1956-1961）
这一时期，基于前人数学逻辑和形式推理方面取得的成果，建立在卡内基-梅隆大学、麻省理工学院和IBM公司的研究组开始了AI的早期研究工作。这个时期的成果主要是定理证明程序、GPS（General Problem Solving）、下棋程序、 LISP语言和模式识别系统等。这些早期成果充分表明，AI作为一门新兴的学科正在茁壮成长。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

分析学习（analytic learning）学习方法——从一个或少数几个实例出发，运用领域知识进行分析。分析学习的目标是改善系统的性能，而不是新的概念描述。主要特征：推理策略主要是演绎，而非归纳；使用过去的问题求解经验（实例）指导新的问题求解；产生能更有效地运用领域知识的搜索控制规则。基于解释的学习——实现分析学习的主要方式。
结果改变了系统的知识演绎闭包。采用演绎策略的学习，所学的知识仍能被原有系统的知识库所蕴涵, 即所
学的知识未能改变系统的演绎闭包。
6.2 示例学习
归纳学习——从教师或环境提供的事例中抽象出结论（对于概念的泛化描述）的知识获取过程。
归纳推理的理论——研究如何运用各种推理技术，在符号表示的空间中进行启发式搜索。
基本方法——通过与环境的试探性（trial and error）交互来确定和优化动作的选择。
分类总结
学习的基本策略（推理）分为归纳、类比和演绎三种。最基本的学习策略只有归纳和演绎。类比策略可看成是归纳和演绎策略的综合。采用归纳策略所学习的知识超过原有系统知识库所能蕴涵的范围, 即所学
学生从观察的事例或经验数据中归纳出规律或定理；难度最大，但也最具有创造性的一种学习形式；经验发现——从经验数据中发现规律和定律，重新发现理想气体定律、
能量守恒定律、欧姆定律等。知识发现——从已观察到的事例或已知数据中发现知识(一般是产生式
规则)。
2 基于所获取知识的表示形式分类
主要表示形式：
符号学习应用技术蓬勃发展：分析学习（特别是解释学习），遗传算法的成功，加强学习方法的广泛应用。
基于计算机网络的各种自适应、具有学习功能的软件系统的研制和开发：将机器.1.3 机器学习分类
n
1 基于所用的基本学习策略分类
分类标准——学生实现信息转换所需的推理多少和难易程度，依从简单到复杂，从少到多的次序分类。
神经元模型的研究未取得实质性进展，并在60年代末走入低谷：
明斯基（Minsky）等人以批评的观点编写的很有影响力的《感知机》一书。
机械学习的成功激励了研究者们继续进行机器学习的探索性研究：
死记式学习，一种最简单、最原始的学习方法；通过记忆和评价外部环境提供的信息来达到学习的目的；塞缪尔（A.L.Samuel）于50年代末设计的跳棋程序；随着使用次数的增加，积累性记忆有价值的信息，很快达到大师级水平。
• 代数表达式参数
• 决策树
• 形式文法
• 产生式规则
• 形式逻辑表达式
• 图和网络
• 框架和模式
• 计算机程序和其它的过程编码
• 神经网络
多种表示形式的组合；
知识表示形式的精细程度：
泛化程度高的粗粒度符号表示——决策树、形式文法、产生式规则、形式逻辑表达式、框架和模式等；
泛化程度低的精粒度亚符号(sub-symbolic)表示——代数表达式参数、图和网络、神经网络等。
价；根据评价值（适应度）对个体进行选择、交换、变异等遗传操作，得到新的群体。
联接学习
典型的联接模型——人工神经网络，由称为神经元的一些简单计算单元以及单元间的加权联接组成。
加强学习（reinforcement learning）
学习目标——寻找一个合适的动作选择策略，使产生的动作序列可获得某种最优的结果（如累计立即回报最大）。
以不断地增加。学生把知识转换成内部可使用的表示形式，并将新的知识和原有知识有机
地结合为一体；学生有一定程度的推理能力。 FOO程序——玩一种称为“红心”（俗称赶猪牵羊）的扑克牌游戏：接受打牌取胜的建议，导出遵从这些建议的可执行过程。 3）演绎学习(Learning by deduction) 学生所用的推理形式为演译推理——从公理出发，经过逻辑变换推导出结论。学习方法——宏操作(macro-operation)学习、知识编辑和组块(Chunking) 技术。
第六章机器学习
人工智能领域的研究核心之一：
学习能力是智能体应具有的基本特性，机器学习作为提高机器智能的重要手段，
在认知科学、心理学、教育学、哲学以及其它相关领域中受到广泛注意。在智能的网络信息服务和网络数据的挖掘中扮演重要的角色；
因特网的发展，网络中的信息急剧增长。
本章主要内容：
机器学习概论，示例学习，基于解释的学习，遗传算法（略），加强学习（略），基于范例的学习（略），知识发现与数据挖掘。
6.1 机器学习概论
机器学习的基本概念、发展历史和分类 6.1.1 机器学习的基本概念学习是人类智能的主要标志和获取知识的基本手段。不同学派对机器学习的定义：
6.1.2 机器学习的发展历史
1 通用的学习系统研究（５０年代中叶开始）主流方式——构造没有或者只有很少初始知识的通用系统，主要技术——神经元模型以及基于该模型的决策论和控制论；
数值和统计方法的范畴。
以感知机为代表的早期神经网络（神经元模型）：
通过监督（有教师指导的）学习来实现神经元间连接权的自适应调整，产生线性的模式分类和联想记忆能力。
4 综合考虑学习系统的知识表示、基本学习策略和历史渊源等因素分类
类比学习遗传算法（genetic algorithm）
模拟生物繁殖的突变、交换和达尔文的自然选择（在每一生态环境中适者生存）。基本方法：
把问题可能的解编码为一个向量（称为个体），向量的每一个元素称为基因；利用目标函数（相应于自然选择标准）对群体（个体的集合）中的每一个个体进行评
3 基于知识的各种学习系统研究
７０年代中期不再局限于构造概念学习系统和获取上下文知识结合了问题求解中的学习、概念聚类、类比推理及机器发现的工作。工作特点：
基于知识的方法——强调应用面向任务的知识和指导学习过程的约束。开发各种各样的学习方法——示例学习、示教学习、观察和发现学习、
常用推理技术：
泛化(generalizing) 特化(specializing) 转换(transforming) 知识表示的修正和提炼(correcting & refining)
主要内容：
学生将已知事例分类，并为每一类建立一般性概念描述；依据是否采用渐近方式而分为：
概念形成——学生将依次出现的事例分类，产生概念描述，并且构造一个关于类的层次结构；
概念聚类——学生对一次性给出的事例分类，产生每一类的概念描述；再用这些概念描述指导进一步分类，直到结果满意为止。
机器发现(machine discovery)
推算出节点n的得分。死记式学习——让下棋程序死记住这样推出的得分，以备重用于后继
的下棋过程：加速对于最深层节点的评价，起到加大搜索深度的作用。
节点得分的积累性记忆和搜索深度的不断增大，使得下棋程序的水平能很快提高。
1 基于所用的基本学习策略分类
2）示教学习(Learning from instruction或Learning by being told) 教师以某种形式（教导和建议）提出和组织知识，以使学生拥有的知识可
1 基于所用的基本学习策略分类
6)归纳学习(Learning from induction) 基本方法：
由教师或环境提供某概念的一些实例或反例，学生通过归纳推理得出该概念的一般描述。分类：示例学习(learning from examples)
有教师指导的归纳学习，由教师明确划分正例和反例集；只有正例，无反例：
6.1.1 机器学习的基本概念
准确、完整地给出机器学习的定义很困难：现有定义——从不同的侧面来阐述学习，定义不完整；完整的学习定义——应追求从内部到外部，从动机到效果的统一；不必刻意追求形式化的定义。
迪特里奇（Dietterich）学习模型：环境——向系统的学习部件提供某些信息，学习——利用这些信息修改知识库，增进执行部件的效能；执行——根据知识库完成任务，同时把获得的信息反馈给学习部件。
系统性能改善——学习是使系统做一些适应性变化，从而系统在下一次完成同样的或类似的任务时比前一次更有效；西蒙（H.A.Simon）：认为学习就是行为的改变，只强调效果，忽视动机。
知识获取——学习是知识的获取；强调知识获取而忽视行为效果，学习是知识的增长。
知识表示改善——学习是构造或修改所经历事物的表示；迈克尔斯基（R.S.Michalski）：强调学得的任何知识都必须以某种形式来表示和存贮，而且系统性能的改善可视为这种表示的目的和结果。
类比学习、基于解释的学习。具有生成和选择学习任务的能力——应用启发式知识于学习任务的生
成和选择，包括提出收集数据的方式、选择要获取的概念、控制系统的注意力等。
4 联接学习和符号学习的深入研究
八十年代后期联接学习和符号学习的深入研究导致机器学习领域的极大繁荣
神经网络的研究重新迅速崛起，并在声音识别、图象处理等诸多领域得到很大成功。
1）机械学习(Rote learning) 学习者无需任何推理或其它的知识转换，直接吸取环境所提供的信息。塞缪尔的跳棋程序
作有限深度（例如3层）的搜索，静态评价函数——计算从节点n可到达的最深层（第3层）节点的得分
（棋势）， min-max搜索技术——搜索从节点n到第3层棋盘状态的最佳路径，并
3 基于学习系统的应用领域分类
主要的应用领域：——专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图象识别、故障诊断、自然语言理解、机器人和博弈等。
任务类型集中于两个范畴——分类和问题求解。
4 综合考虑学习系统的知识表示、基本学习策略
和历史渊源等因素分类
经验性归纳学习(empirical inductive learning)。相当于基于学习策略分类中的归纳学习，采用一些数据密集的经验方法对例子进行归纳学习，例子和学习结果一般都采用属性、谓词、关系等符号表示。