人工智能考试必备知识点
人工智能知识点总结

CHW:一、概论1.人工智能是由计算机科学、控制论、信息论、神经生理学、心理学、语言学等构成。
2.智能科学研究智能的基本理论和实现技术,是由脑科学、认知科学、人工智能等学科构成的交叉学科。
3.认知(cognition)是和情感、动机、意志等相对的理智或认识过程。
认知科学是研究人类感知和思维信息处理过程的科学,包括从感觉的输入到复杂问题求解,从人类个体到人类社会的智能活动,以及人类智能和机器智能的性质。
思维是客观现实的反映过程,是具有意识的人脑对于客观现实的本质属性、内部规律性的自觉的、间接的和概括的反映。
智能是个体认识客观事物和运用知识解决问题的能力。
4.人类思维的形态:感知思维、形象思维、抽象思维、灵感思维。
5.神经网络基本特点:①以分布式方式存储信息。
②以并行方式处理信息。
③具有自组织、自学习能力。
符号智能:以知识为基础,通过推理进行问题求解。
也即所谓的传统人工智能。
计算智能:以数据为基础,通过训练建立联系,进行问题求解。
人工神经网络、遗传算法、模糊系统、进化程序设计、人工生命等都可以包括在计算智能6.符号智能与计算智能区别:符号智能就是传统人工智能,以知识为基础,通过推理求解问题;计算智能以数据为基础,通过训练建立联系,进行问题求解。
人工神经网络,遗传算法、模糊等都是计算智能。
7.非单调推理:一个正确的公理加到理论中,反而使得所得结论变无效。
如封闭世界假设CWA,限定逻辑;定性推理:把物理系统分成子系统,对每个子系统之间的作用建立联系,通过局部因果性的行为合成获得实际物理系统的功能;不确定性推理:随机性、模糊性、不确定性。
如DS证据、模糊集、粗糙集、贝叶斯。
8.知识、知识表示及运用知识的推理算法是人工智能的核心,而机器学习则是关键问题。
机器学习的研究四个阶段:①无知识的学习:主要研究神经元模型和基于决策论方法的自适应和自组织系统。
②符号概念获取:给定某一类别的若干正例和反例,从中获得该类别的一般定义。
人工智能复习资料整理(修正版-如发现计算错误请指出)

一、填空题(40分)1.人工智能的主要学派:(1)符号主义:又称逻辑主义、心理学派或计算机学派,其原理主要是为物理符号系统假设和有限合理性原理。
(2)连接主义:又称仿生学派或生理学派,其原理主要是为神经网络及神经网络间的连接机制与学习算法。
(3)行为主义:又称进化主义或控制论学派,其原理为控制论及感知-动作型控制系统。
2.人工智能三个基本问题:知识获取、知识推理、知识利用。
3.常用的知识表示方法包括:状态空间法、问题归纳法、谓词演算法、语义网络法、框架表示法、本体表示法、过程表示法和神经网络表示法。
4.机器学习分为:监督学习、无监督学习、强化学习。
5.遗传算法基本操作分为:选择、交叉和变异。
6.产生式系统的构成分为:规则库、综合数据库和推理机。
7.问题状态空间包含的三种说明集合分别为:初始状态集(S)、操作符集合(F)、以及目标状态集合(G)。
8.可信度方法中,不精确推理规则的一般形式为:IF E THEN H (CF(H,E)),其中(CF(H,E))是该规则的可信度,称为可信度因子或规则强度。
(1)当证据E的可信度CF(E)的取值范围与CF(H,E)相同,即-1 ≤ CF(E)≤ 1;(2)当证据以某种程度为真时,CF(E) > 0(3)当证据肯定为真时,CF(E) = 1(4)当证据以某种程度为假时,CF(E) < 0(5)当证据肯定为假时,CF(E) = -1(6)当证据一无所知时,CF(E) = 09.用产生式方法表示张和李是同学关系:(classmate,Zhang,Li)10.模糊集合表示,例如有一组数据:85,90,82,70,98,模糊集合表示为:11.自然语言理解过程的层次有:语音分析、句词分析、语义分析。
12.人工生命研究实例有:人工脑、计算机病毒、计算机进程、细胞自动机、人工核苷酸。
13.计算智能涉及神经计算、模糊计算、进化计算、粒群计算、自然计算、免疫计算和人工生命等研究领域。
人工智能期末考试重点

人工智能:Artificial Intelligence,简称AI,主要研究如何使用人工的方法和技术,使用各种自动化机器或智能化机器模仿、延伸和扩展人的智能,实现某些机器的智能行为。
传统划分①符号主义学派②联结主义学派③行为主义学派现代1.符号智能流派2.计算智能流派3.群体智能流派人工智能的基本技术:1知识表示技术2知识推理、计算和搜索技术3系统实现技术。
符号智能的表示是知识的表示,运算是基于知识表示的推理或符号操作,采用搜索方法进行问题求解,一般在问题空间上进行,计算智能的表示是对象表示,运算时给予对象的表示的操作或计算,采用搜索方法进行问题求解,一般是在解空间上进行。
人工智能的研究领域:定理证明、专家系统、模式识别、机器学习、计算智能、自然语言处理、组合调度问题。
应用领域:难题求解、自动定理证明、自动翻译、智能管理、智能通信、智能仿真等。
人工智能的主要研究途径与方法:1功能模拟。
符号推演2结构模拟。
神经计算3行为模拟。
控制进化人工智能的研究目标及其意义:1目标:远期目标是要制造智能机器,即探索智能的基本机理,最终制造出和人有相似或相近智力和行为能力的综合智能系统;近期目标是实现机器智能,即研究如何使用现有的计算机具备更高的智能,在一定领域或在一定程度上去完成需要人的复杂脑力劳动才能完成的工作。
2意义:普遍的计算机智能低下,无法满足社会需求;研究AI是当前信息化社会的迫切需求;智能化是自动化发展的必然趋势;研究AI,对人类自身的智能的奥秘也提供有益的帮助。
人工智能的基本内容:1从人工智能的定义出发包括(感知与交流的模拟,记忆,联想,计算,思维的模拟,输出效率或行为模拟2从知识工程的角度出发包括(知识的获取,知识的处理以及知识的运用)人工智能诞生1956年夏,达特莫斯大学的研究会,麦卡锡提议正式采用了“AI”术语。
发展:推理期,知识期,学习期AI的现状与发展趋势:1多种途径齐头并进,多种方法协作互补2新思想、新技术不断涌现,新领域新方向不断开拓3理论研究更加深入,应用研究愈加广泛4研究队伍日益壮大,社会影响越来越大。
人工智能考试必备知识点

人工智能考试必备知识点第三章约束推理约束的定义:一个约束通常是指一个包含若干变量的关系表达式,满足的条件。
贪心算法:贪心法把构造可行解的工作分阶段来完成。
在各个阶段,选择那些在某些意义下是局部最优的方案,期望各阶段的局部最优的选择带来整体最优。
回溯算法:有些问题需要彻底的搜索才能解决问题,然而,彻底的搜索要以大量的运算时间为代价,对于这种情况可以通过回溯法来去掉一些分支,从而大大减少搜索的次数第四章定性推理定性推理的定义是从物理系统、生命系统的结构描述出发 , 导出行为描述 , 以便预测系统的行为并给出原因解释。
定性推理采用系统部件间的局部结构规则来解释系统行为态的变化行为只与直接相邻的部件有关第六章贝叶斯网络贝叶斯网络的定义:贝叶斯网络是表示变量间概率依赖关系的有向无环图,这里每个节点表示领域变量,表示变量间的概率依赖关系,同时对每个节点都对应着一个条件概率分布表 (CPT) 该变量与父节点之间概率依赖的数量关系。
条件概率:条件概率:我们把事件B 已经出现的条件下,事件 A 发生的概率记做为并称之为在B 出现的条件下 A 出现的条件概率,而称 P(A)为无条件概率。
贝叶斯概率:先验概率、后验概率、联合概率、全概率公式、贝叶斯公式先验概率:先验概率是指根据历史的资料或主观判断所确定的各事件发生的概率,验证实,属于检验前的概率,所以称之为先验概率后验概率:后验概率一般是指利用贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率进行修正后得到的更符合实际的概率联合概率:联合概率也叫乘法公式,是指两个任意事件的乘积的概率,或称之为交事件的概率。
贝叶斯问题的求解步骤定义随机变量、确定先验分布密度、利用贝叶斯定理计算后验分布密度、利用计算得到的厚颜分布密度对所求问题作出推断贝叶斯网络的构建为了建立贝叶斯网络,第一步,必须确定为建立模型有关的变量及其解释。
为此,需要:(1) 确定模型的目标,即确定问题相关的解释; (2) 确定与问题有关的许多可能的观测值,并确定其中值得建立模型的子集; (3) 将这些观测值组织成互不相容的而且穷尽所有状态的变量。
ai总结试卷知识点

ai总结试卷知识点一、人工智能的基本概念1. 人工智能的定义和特点人工智能是指利用计算机技术模拟人类智能的能力,包括感知、认知、学习、推理、规划和行动等方面。
具有智能的特点,如自主性、学习能力、推理能力、语言能力等。
2. 人工智能的分类根据不同的方法和技术,人工智能可以分为强人工智能和弱人工智能。
强人工智能是指具有人类智能水平的人工智能系统,能够思考、学习和创造;弱人工智能则是指专门针对某一领域或任务的人工智能系统,无法与人类智能相提并论。
二、人工智能的技术原理1. 机器学习机器学习是一种基于数据的自动化学习方法,通过训练数据和算法的迭代优化,使计算机系统能够从中提取知识、模式和规律。
常见的机器学习方法包括监督学习、无监督学习和强化学习。
2. 深度学习深度学习是一种基于人工神经网络的学习方法,具有多层次的表示和抽象特征提取能力。
它能够处理大规模的数据,并在图像识别、语音识别、自然语言处理等领域取得了显著的成果。
3. 自然语言处理自然语言处理是指通过计算机技术处理和理解自然语言的能力,包括文本分析、语义理解、机器翻译等。
它是人工智能技术的重要应用领域之一,已经在搜索引擎、智能对话系统等方面得到了广泛应用。
4. 强化学习强化学习是一种基于奖励信号进行学习的方法,通过试错和反馈机制,使智能体在与环境的交互中学习并优化策略。
它在游戏、机器人控制、自动驾驶等领域具有重要应用价值。
5. 人工智能的伦理和安全问题随着人工智能技术的发展,一些伦理和安全问题也愈发突出。
包括数据隐私保护、算法歧视、自动化生产带来的社会影响等。
需要制定相关政策和法规来保障个人权益和社会稳定。
三、人工智能的应用领域1. 医疗健康领域人工智能技术在医疗影像诊断、药物研发、健康管理等方面得到了广泛应用,能够提高诊断精度和治疗效果,促进健康产业的发展。
2. 金融领域人工智能技术在风险管理、信用评估、市场预测等方面具有重要作用,能够提高金融机构的运营效率和风险控制能力。
人工智能考试复习资料

人工智能第一章1、智能(intelligence )人的智能是他们理解和学习事物的能力,或者说,智能是思考和理解能力而不是本能做事能力。
2、人工智能(学科)人工智能研究者们认为:人工智能(学科)是计算机科学中涉及研究、设计和应用智能机器的一个分支。
它的近期主要目标在于研究用机器来模仿和执行人脑的某些智力功能,并开发相关理论和技术。
3、人工智能(能力)人工智能(能力)是智能机器所执行的通常与人类智能有关的智能行为,这些智能行为涉及学习、感知、思考、理解、识别、判断、推理、证明、通信、设计、规划、行动和问题求解等活动。
4、人工智能:就是用人工的方法在机器上实现的智能,或者说,是人们使用机器模拟人类的智能。
5、人工智能的主要学派:符号主义:又称逻辑主义、心理学派或计算机学派,其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
代表人物有纽厄尔、肖、西蒙和尼尔逊等。
连接主义:又称仿生学派或生理学派,其原理主要为神经网络及神经网络间的连接机制与学习算法。
行为主义:又称进化主义或控制论学派,其原理为控制论及感知—动作模式控制系统。
6、人类认知活动具有不同的层次,它可以与计算机的层次相比较,见图人类 计算机认知活动的最高层级是思维策略,中间一层是初级信息处理,最低层级是生理过程,即中枢神经系统、神经元和大脑的活动,与此相对应的是计算机程序、语言和硬件。
研究认知过程的主要任务是探求高层次思维决策与初级信息处理的关系,并用计算机程序来模拟人的思维策略水平,而用计算机语言模拟人的初级信息处理过程。
7、人工智能研究目标为:1、更好的理解人类智能,通过编写程序来模仿和检验的关人类智能的理论。
2、创造有用和程序,该程序能够执行一般需要人类专家才能实现的任务。
一般来说,人工智能的研究目标又可分为近期研究目标和远期研究目标两种。
两者具有不可分割的关系,一方面,近期目标的实现为远期目标研究做好理论和技术准备,打下了必要的基础,并增强人们实现远期目标的信心。
《人工智能》复习要点

名词解释5X6分/简答题5X10分/论述题1X20分一、选择题1.下列哪个不是人工智能的研究领域( D )A.机器证明B.模式识别C.人工生命D.编译原理2.人工智能是一门( C )A.数学和生理学B.心理学和生理学C.语言学D.综合性的交叉学科和边缘学科3.神经网络研究属于下列( B )学派A.符号主义B.连接主义C.行为主义D.都不是4.(A->B)∧A => B是( C )A.附加律B.拒收律C.假言推理5.命题是可以判断真假的( D )A.祈使句B.疑问句C.感叹句D.陈述句6.MGU7.8.9.10.11.12.13.15.16.17.A.用户B.综合数据库C.推理机D.知识库18.产生式系统的推理不包括( D )A.正向推理B.逆向推理C.双向推理D.简单推理19.子句~P?Q和P经过消解以后,得到( B )A. PB. QC.~PD.P?Q20. 反演归结(消解)证明定理时,若当前归结式是( C )时,则定理得证。
A.永真式B.包孕式(subsumed)C.空子句21. 谓词逻辑下,子句, C1=L∨C1‘, C2= ? L∨C2‘,?若σ是互补文字的(最一般)合一置换,则其归结式C=( A )A.C1’σ∨C2’σB.C1’∨C2’C.C1’σ∧C2’σD.C1’∧C2’22.A?(A?B)?A 称为(),~(A?B)?~A?~B称为( C )A.结合律B.分配律C.吸收律D.摩根律23. 如果问题存在最优解,则下面几种搜索算法中,( A )必然可以得到该最优解。
A.广度优先搜索B.深度优先搜索C.有界深度优先搜索D.启发式搜索24.AI的英文缩写是(A)A)Automatic Intelligence B)Artifical IntelligenceC)Automatice Information D)Artifical Information25. 从已知事实出发,通过规则库求得结论的产生式系统的推理方式是( A )A.正向推理B.反向推理C.双向推理26.1997年5月,着名的“人机大战”,最终计算机以3.5比2.5的总比分将世界国际象棋棋王卡斯帕罗夫击败,这台计算机被称为( A )A.深蓝B.IBMC.深思D.蓝天27.人工智能的含义最早由一位科学家于1950年提出,并且同时提出一个机器智能的测试模型,请问这个科学家是( C )A.明斯基B.扎德C.图林D.冯.诺依曼二、填空题综合数据库,知识库和推理机。
人工智能基础必背知识点大全

人工智能基础必背知识点大全
人工智能(Artificial Intelligence,简称 AI)是指通过模拟人的思维过程和智能行为,以及具备类似人类研究、推理和创新等能力的一门科学和技术。
下面是人工智能基础知识点的大全,供参考:
1. 人工智能基本概念
- 人工智能的定义和基本原理
- 强人工智能和弱人工智能的区别
- 人工智能的发展历程和应用领域
2. 机器研究
- 机器研究的基本概念和分类
- 监督研究、无监督研究和强化研究的区别
- 常见的机器研究算法和模型
3. 神经网络
- 神经网络的基本原理和结构
- 前馈神经网络和反馈神经网络的区别
- 深度研究和卷积神经网络的概念及应用
4. 自然语言处理
- 自然语言处理的基本任务和方法
- 词法分析、句法分析和语义分析的概念和技术
- 常见的自然语言处理工具和框架
5. 计算机视觉
- 计算机视觉的基本任务和技术
- 物体检测、物体识别和图像分割的概念和方法
- 常见的计算机视觉算法和应用案例
6. 专家系统
- 专家系统的基本原理和结构
- 规则推理和知识表示的概念和方法
- 常见的专家系统开发工具和应用领域
以上是人工智能基础必背的知识点大全,希望能为你提供一些帮助和参考。
如有任何疑问,请随时向我提问。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章约束推理约束的定义:一个约束通常是指一个包含若干变量的关系表达式,用以表示这些变量所必须满足的条件。
贪心算法:贪心法把构造可行解的工作分阶段来完成。
在各个阶段,选择那些在某些意义下是局部最优的方案,期望各阶段的局部最优的选择带来整体最优。
回溯算法:有些问题需要彻底的搜索才能解决问题,然而,彻底的搜索要以大量的运算时间为代价,对于这种情况可以通过回溯法来去掉一些分支,从而大大减少搜索的次数第四章定性推理定性推理的定义是从物理系统、生命系统的结构描述出发,导出行为描述, 以便预测系统的行为并给出原因解释。
定性推理采用系统部件间的局部结构规则来解释系统行为, 即部件状态的变化行为只与直接相邻的部件有关第六章贝叶斯网络贝叶斯网络的定义:贝叶斯网络是表示变量间概率依赖关系的有向无环图,这里每个节点表示领域变量,每条边表示变量间的概率依赖关系,同时对每个节点都对应着一个条件概率分布表(CPT) ,指明了该变量与父节点之间概率依赖的数量关系。
条件概率:条件概率:我们把事件B已经出现的条件下,事件A发生的概率记做为P(A|B)。
并称之为在B出现的条件下A出现的条件概率,而称P(A)为无条件概率。
贝叶斯概率:先验概率、后验概率、联合概率、全概率公式、贝叶斯公式先验概率:先验概率是指根据历史的资料或主观判断所确定的各事件发生的概率,该类概率没能经过实验证实,属于检验前的概率,所以称之为先验概率后验概率:后验概率一般是指利用贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率进行修正后得到的更符合实际的概率联合概率:联合概率也叫乘法公式,是指两个任意事件的乘积的概率,或称之为交事件的概率。
贝叶斯问题的求解步骤定义随机变量、确定先验分布密度、利用贝叶斯定理计算后验分布密度、利用计算得到的厚颜分布密度对所求问题作出推断贝叶斯网络的构建为了建立贝叶斯网络,第一步,必须确定为建立模型有关的变量及其解释。
为此,需要:(1)确定模型的目标,即确定问题相关的解释;(2)确定与问题有关的许多可能的观测值,并确定其中值得建立模型的子集;(3)将这些观测值组织成互不相容的而且穷尽所有状态的变量。
这样做的结果不是唯一的。
第二步,建立一个表示条件独立断言的有向无环图第三步指派局部概率分布 p(xi|Pai)。
在离散的情形,需要为每一个变量 Xi 的各个父节点的状态指派一个分布。
第七章归纳学习归纳学习是符号学习中研究得最为广泛的一种方法。
给定关于某个概念的一系列已知的正例和反例,其任务是从中归纳出一个一般的概念描述。
归纳学习能够获得新的概念,创立新的规则,发现新的理论。
它的一般的操作是泛化和特化泛化用来扩展一假设的语义信息,以使其能够包含更多的正例,应用于更多的情况。
特化是泛化的相反的操作,用于限制概念描述的应用范围。
用程序语言描述定义上述内容的过程就是归纳学习程序,用于书写归纳程序的语言称为归纳程序设计语言, 能执行归纳程序,完成特定归纳学习任务的系统叫做归纳学习系统。
归纳学习系统可独立,也可嵌入另一较大的知识处理系统。
一般归纳程序的输入是科学实验中个别观察对象(过程)的描述, 输出是一类对象的总体特征描述或几类对象的分类判别描述。
与演绎相对照, 归纳的开始前提是具体事实而不是一般公理,推理目标是形式化解释事实的似然一般断言和预见新事实。
归纳推理企图从给定现象或它的一部分的具体观察推导出一个完整的、正确的描述。
归纳的两个方面⎯⎯似然假设的产生和它的有效性(真值状态的建立),只有前者对归纳学习研究具备基本意义, 而假设有效性的问题是次要的,因为假定所产生的假设由人类专家判断, 由已知的演绎推理和数理统计的方法测试。
归纳学习可以分为实例学习、观察与发现学习。
实例学习, 又叫概念获取, 它的任务是确定概念的一般描述,这个描述应能解释所有给定的正例并排除所有给定的反例。
这些正反例由信息源提供。
信息源的来源非常广泛,可以是自然现象,也可以是实验结果。
实例学习是根据教师给以分类的正反例进行学习,因此是有教师学习。
观察与发现学习又称描述的泛化。
这类学习没有教师的帮助,它要产生解释所有或大多数观察的规律和规则。
这类学习包括概念聚类、构造分类、发现定理、形成理论等。
观察与发现学习是由未经分类的观察学习,或由系统自身的功能去发现,因此是无教师学习。
因为归纳推理是从有限的、不完全的知识状态推出完全的知识状态,故归纳推理本身就是一种非单调推理。
但归纳推理本身又无法验证新知识正确与否, 而非单调逻辑则为我们处理非单调归纳知识提供理论基础。
归纳原理的基本思想是在大量观察的基础上通过假设形成一个科学理论。
所有观察都是单称命题,而一个理论往往是领域内的全称命题,从单称命题过渡到全称命题从逻辑上来说没有必然的蕴涵关系,对于不能观察的事实往往默认它们成立。
我们把归纳推理得到的归纳断言作为知识库中的知识使用,而且做为默认知识使用, 当出现与之矛盾的新命题时, 可以推翻原有的由归纳推理得出的默认知识, 以保持系统知识的一致性。
单个概念的归纳学习的一个通用定义是:(1) 给定由全体实例组成的一个实例空间,每个实例具有某些属性。
(2) 给定一个描述语言,该语言的描述能力包括描述每一个实例(通过描述改实例的属性来实现)及描述某些实例集,称为概念。
(3) 每次学习时,由实例空间抽出某些实例,称这些实例构成的集合为正例集。
再由实例空间抽出另外一些实例,称这些实例为反例集。
(4) 如果能够在有限步内找到一个概念A,它完全包含正例集,并且与反例集的交集为空7.2.1 归纳学习的一般模式为了较具体地刻画概念的归纳学习,这里给出归纳学习的一般模式。
给定:① 观察语句集(事实)F:这是有关某类对象中个别具体对象的知识或某一对象的部分特征的知识。
② 假定的初始归纳断言(可空):是关于目标的泛化项或泛化描述。
③ 背景知识:背景知识定义了在观察语句和所产生的候选归纳断言上的假定和限制,以及任何有关问题领域知识。
有关问题领域知识包括特化所找归纳断言的期望性质的择优标准。
描述符定义域是描述符所能取值的集合。
如人的体温在 34 C∼ 44 C 之间,则描述符“体温”只能在这个范围内取值。
描述符类型则是根据描述符定义域元素之间的关系决定的。
根据描述符定义域的结构,有三种基本类型:(1) 名称性描述符。
这种描述符的定义域由独立的符号或名字组成,即值集中值之间没有结构关系。
例如水果、人名等。
(2)线性描述符。
该类描述符值集中的元素是一个全序集。
例如,资金、温度、重量、产量等都是线性描述符。
表示序数、区间、比率和绝对标度的变量都是线性描述符的特例。
将一个集合映射成一个完全有序集的函数也是线性描述符。
(3) 结构描述符。
其值集是一个树形的图结构,反映值之间的生成层次。
在这样的结构中,父节点表示比子节点更一般的概念7.3 偏置变换。
所谓偏置,是指概念学习中除了正、反例子外,影响假设选择的所有因素。
这些因素包括:①描述假设的语言。
②程序考虑假设的空间。
③按什么顺序假设的过程。
④承认定义的准则,即研究过程带有已知假设可以终止还是应该继续挑选一个更好的假设。
采用偏置方法,学习部分选择不同的假设,会导致不同的归纳跳跃。
偏置有两个特点:(1) 强偏置是把概念学习集中于相对少量的假设;反之,弱偏置允许概念学习考虑相对大量的假设。
(2) 正确偏置允许概念学习选择目标概念,不正确偏置就不能选择目标概念7.4 变型空间方法变型空间(Version Space)方法以整个规则空间为初始的假设规则集合 H。
依据训练例子中的信息,它对集合 H 进行泛化或特化处理,逐步缩小集合 $H$。
最后使 $H$收敛为只含有要求的规则。
由于被搜索的空间 H 逐步缩小,故称为变型空间消除候选元素的两种改进算法冲突匹配算法:它用于学习“参数化结构表示”所表达的概念。
在上述的修改 S过程中,总是对 S作尽量少的泛化,以便覆盖新的正例。
如果描述形式为谓词表达式,则这个过程相当于寻找最大的公共子表达式,这只需要去掉最少的合取条件。
最大的合一泛化:这个算法用于寻找谓词表达式的最大的合一泛化。
它类似于冲突匹配算法,但是它使用的表示语言允许在匹配中多对一的参数联系。
变形空间方法的两个缺点(1) 抗干扰能力差。
所有数据驱动方法(包括变型空间方法)都难以处理有干扰的训练例子。
由于算法得到的概念应满足每个训练例子的要求,所以一个错误例子会造成很大影响。
有时错误例子使程序得到错误概念,有时得不到概念,这时 H 成为空集。
Mitchell(1978)提出的解决方法是保存多个 G 和 S 集合。
例如,S0 符合所有正例,S1 符合除一个正例外其它的正例,S2 等类似。
如果 G0 超过 S0,则 H0 为空集。
这说明没有任何一个概念符合全部例子.于是程序去找 G1 和 S1,以便得到 H1。
如果 H1 也空,则找 H2。
(2) 学习析取概念。
变型空间方法不能发现析取的概念。
有些概念是析取的。
例如,PARENT 可能是父亲,也可能是母亲。
这表示为PARENT(x)=FATHER(x) ∨ PARENT(x)=MOTHER(x),由于集合 G 和集合 S的元素都是合取形式,所以上述算法找不到析取概念。
7.5 AQ 归纳学习算法1969 年, Michalski 提出了 AQ 学习算法, 这是一种基于实例的学习方法。
AQ 算法生成的选择假设的析取, 覆盖全部正例, 而不覆盖任何反例。
它的基本算法如下:算法 7.3 简单的 AQ 学习算法。
(1) 集中注意一个实例(作为种子);(2) 生成该实例的一致性泛化式(称作 star);(3) 根据偏好标准, 从 star 选择最优的泛化式(假设)。
如果需要, 特化该假设;(4) 如果该假设覆盖了全部实例, 则停止; 否则选择一个未被假设覆盖的实例,转到(2)。
7.6 CLS 学习算法CLS 算法的主要思想是从一个空的决策树出发,通过添加新的判定结点来改善原来的决策树,直至该决策树能够正确地将训练实例分类为止。
7.5 ID3 算法(1)选出整个训练实例集 X 的规模为 W 的随机子集 X1(W 称为窗口规模,子集称为窗口)(2)以使得(7.29)式的值最小为标准,选取每次的测试属性形成当前窗口的决策树;(3)顺序扫描所有训练实例,找出当前的决策树的例外,如果没有例外则训练结束;(4)组合当前窗口的一些训练实例与某些在(3)中找到的例外形成新的窗口,转(2)。
为了在步骤(4)建立新的窗口, Quinlan 试验了两种不同的策略:一个策略是保留窗口的所有实例,并添加从步骤(3)中获得的用户指定数目的例外,这将大大扩充窗口;第二个策略是相当于当前决策树的每一个叶结点保留一个训练实例,其余实例则从窗口中删除,并用例外进行替换。