机器学习的研究与应用新进展

合集下载

机器学习研究现状与发展趋势

机器学习研究现状与发展趋势

机器学习研究现状与发展趋势摘要:机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。

机器学习是关于理解与研究学习的内在机制、建立能够通过学习自动提高自身水平的计算机程序的理论方法的学科。

近年来机器学习理论在诸多应用领域得到成功的应用与发展,已成为计算机科学的基础及热点之一。

采用机器学习方法的计算机程序被成功用于机器人下棋程序、语音识别、信用卡欺诈监测、自主车辆驾驶、智能机器人等应用领域,除此之外机器学习的理论方法还被用于大数据集的数据挖掘这一领域。

实际上,在任何有经验可以积累的地方,机器学习方法均可发挥作用。

机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。

这些研究目标相互影响相互促进。

本文主要叙述了1.机器学习的研究现状,包括定义,应用领域,研究意义,发展史,系统结构,和对其进行各种角度的分类.2.机器学习的发展趋势。

引言:按照人工智能大师西蒙的观点,学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高。

西蒙对学习给出的定义本身,就说明了学习的重要作用。

机器能否象人类一样能具有学习能力呢?1959年美国的塞缪尔(Samuel)设计了一个下棋程序,这个程序具有学习能力,它可以在不断的对奕中改善自己的棋艺。

4年后,这个程序战胜了设计者本人。

又过了3年,这个程序战胜了美国一个保持8年之久的常胜不败的冠军。

这个程序向人们展示了机器学习的能力,提出了许多令人深思的社会问题与哲学问题。

什么叫做机器学习?至今,还没有统一的“机器学习”定义,而且也很难给出一个公认的和准确的定义。

机器学习技术的发展现状和未来趋势

机器学习技术的发展现状和未来趋势

机器学习技术的发展现状和未来趋势随着科技的不断进步,机器学习技术逐渐走入了人们的视野。

作为人工智能的重要组成部分,机器学习技术在各个领域都取得了突破性的进展。

本文将从机器学习技术的现状和未来趋势两方面进行探讨。

一、机器学习技术的现状当前,机器学习技术已经广泛应用于图像识别、语音识别、自然语言处理等领域。

在图像识别方面,机器学习技术借助深度学习算法,能够准确识别出复杂的图像,这在医学影像诊断、无人驾驶等场景中起到了重要作用。

在语音识别方面,机器学习技术可以通过对大量数据的学习,实现对人类语言的准确理解,进而进行语音识别和语音合成。

在自然语言处理方面,机器学习技术可以帮助机器理解和生成人类语言,使得机器可以理解和应对自然语言的交互。

此外,机器学习技术在推荐系统、金融风控等领域也发挥着重要作用。

推荐系统利用机器学习技术对用户的行为进行分析,能够准确地推荐用户感兴趣的内容,提升用户体验。

金融风控利用机器学习技术对大量的金融数据进行分析和建模,能够快速准确地评估用户的信用风险,保障金融机构的安全。

二、机器学习技术的未来趋势随着人们对机器学习技术的深入了解和应用需求的不断增长,机器学习技术在未来呈现出一些明显的发展趋势。

首先,在算法层面上,深度学习仍然是机器学习技术的重要发展方向。

当前的深度学习算法已经取得了许多令人瞩目的成果,但在模型的解释性和实际应用中仍然存在一定的局限性。

未来,人们需要进一步研究改进深度学习算法,提高其模型的可解释性和实用性。

同时,强化学习作为一种特殊的机器学习方法,也将继续受到关注,并在自动控制、游戏策略等方面得到广泛应用。

其次,在硬件层面上,人们对机器学习计算资源的需求也越来越高。

传统的计算机硬件在处理大规模数据集和复杂模型时往往效率低下。

因此,未来将有更多的工作关注于针对机器学习的硬件优化,例如量子计算、神经芯片等新兴技术将为机器学习的发展提供更强大的计算能力。

此外,在应用层面上,机器学习技术将广泛渗透到各个领域。

机器学习技术的现状与发展

机器学习技术的现状与发展

机器学习技术的现状与发展机器学习是一种能够通过大量数据自主学习并提高预测精度的人工智能技术。

随着数据的爆炸式增长,机器学习技术在各个领域得到了广泛应用,从语音识别、自然语言处理到图像分类等,都展现出了非凡的潜力。

本文将从机器学习技术的现状和未来发展两个方面来谈论机器学习技术的前景。

一、机器学习技术的现状1.机器学习技术已在实际应用中发挥重要作用机器学习技术已成为解决实际问题的有力工具。

在各个领域,机器学习技术已经被广泛运用,比如广告推荐、购物推荐、人脸识别、机器翻译、智能客服等。

同时,在金融、医疗、教育等领域也得到了广泛的应用。

例如,银行可以使用机器学习技术精准识别欺诈交易,保护客户的资金安全;医院可以运用机器学习技术做出更加准确的诊断和治疗计划;教育行业可以使用机器学习技术分析学生的学习数据,预测学生的学习方向,提供更优化的教学方案。

这些实际应用展示出机器学习技术的强大功能。

2.机器学习技术在深度学习的推动下不断演进深度学习是一种机器学习的分支,其基础是神经网络。

近年来,深度学习技术飞速发展,不断推动着机器学习技术的应用。

深度学习技术极大提高了数据处理的效率和准确性,使得机器学习技术具备了更广泛的应用前景。

例如,在语音识别和自然语言处理两个领域,深度学习的应用几乎已经接近人类水平。

3.机器学习技术面临的挑战机器学习技术未来的发展还面临一些技术问题。

其中最重要的问题是如何解决机器学习算法的可解释性。

尽管机器学习技术已经在许多领域取得了显著的成果,但其内部运作机制依然不为人类所理解,因此无法解释算法的结果。

这就带来了难以信任和可控的问题,也限制了机器学习技术的应用范围。

二、机器学习技术的未来发展1.应用领域的拓展随着科技的不断进步,机器学习技术的应用领域也在不断拓展。

人工智能技术的发展和深度学习的突破,使得机器学习技术能够重塑传统行业,并在新兴领域创造出新的商业模式。

例如,在智慧城市领域,机器学习技术可以被应用于城市交通、公共服务、安全防范等方面。

新型机器学习技术的创新与应用

新型机器学习技术的创新与应用

新型机器学习技术的创新与应用一、引言近年来,随着人工智能技术的快速发展,机器学习技术作为其中的一个重要分支逐渐得到了广泛的应用。

新型的机器学习技术如深度学习、强化学习等,不断创新并不断拓展应用领域。

本文将从新型机器学习技术的创新与应用两个角度进行分析并进行相应的探讨。

二、新型机器学习技术的创新1. 深度学习深度学习技术是近年来机器学习技术中的重要分支,其主要运用多层神经网络模型进行模型的训练和优化。

深度学习的主要优势在于其有很强的复杂性处理能力,且提高了模型的精度。

在自然语言处理、语音识别等领域,深度学习技术已经得到了广泛的应用。

2. 强化学习强化学习是一种以试错为主要手段的学习方法,其主要特点是通过多次试错来提高机器的决策水平。

近年来,在游戏、机器人等领域,强化学习技术已经获得了广泛的应用。

在自动驾驶等领域,强化学习技术也成为了热门研究方向。

3. 迁移学习迁移学习技术主要是将一个领域中的知识应用到另一个领域中,以提高机器学习的效率和准确性。

近年来,在自然语言处理、计算机视觉等领域,迁移学习技术已经被广泛采用,并取得了不错的研究成果。

4. 对抗性学习对抗性学习技术是一种通过对抗互动来提高模型鲁棒性的方法。

在计算机视觉、机器翻译等领域,对抗性学习技术已经成为了热门研究方向。

三、新型机器学习技术的应用1. 自然语言处理自然语言处理是机器学习技术应用的一个热门领域,其涵盖了文本分析、情感分析、机器翻译等方面。

在这一领域,深度学习技术和迁移学习技术已经成为了研究热点,并取得了不错的研究成果。

2. 计算机视觉计算机视觉是机器学习技术应用的另一个重要领域,其涵盖了图像处理、目标检测等方面。

在这一领域,深度学习技术和对抗性学习技术已经成为了热门研究方向,并取得了不俗的研究成果。

3. 智能交互智能交互是机器学习技术应用的重要方向之一,其主要涵盖了语音识别、语音合成等方面。

在这一领域,深度学习技术和强化学习技术已经得到了广泛应用,并快速获得了研究进展。

机器学习与深度学习的应用与探索

机器学习与深度学习的应用与探索

机器学习与深度学习的应用与探索机器学习和深度学习是现代计算机科学领域中的热门话题。

它们的应用范围广泛,可以用于图像识别、自然语言处理、计算机视觉等领域。

本文将深入探讨机器学习和深度学习的应用,并提供一些它们的相关资源和学习材料。

一、机器学习的应用机器学习指的是一种可以使计算机系统自动学习和适应的技术。

在过去的几年中,机器学习在各种领域中的应用已经得到了越来越多的关注和发展。

下面是一些机器学习的应用案例。

1. 智能家居智能家居是人类社会向智能化迈进的一个重要标志。

智能家居系统是一个通用的家庭控制中心,它可以通过各种传感器来自动控制温度、照明、安全等功能。

2. 自然语言处理自然语言处理(NLP)是人工智能(AI)的一个重要分支,它的目的是让计算机理解和处理自然语言。

自然语言处理可以用于构建聊天机器人、语音识别、自动翻译等。

3. 图像识别图像识别是机器学习应用的另一种方式。

它能够识别图像中的对象、场景和图案等,有效地支持自动分类和智能推理的应用。

二、深度学习的应用深度学习是机器学习的一个重要分支,用于构建深度神经网络模型,这些模型可以自动学习来执行复杂的任务。

深度学习广泛应用于视频和图像分析、自然语言处理和语音识别等:1. 用于智能驾驶系统深度学习在智能驾驶系统中的应用日益广泛。

它可以帮助汽车识别出其他车辆、行人和障碍物,并提供智能导航和自动驾驶功能。

2. 用户推荐深度学习也可以用于用户推荐系统。

通过分析用户的历史记录和个人喜好,深度学习可以为用户推荐最相关的商品和服务。

3. 语音识别深度学习也可以应用于语音识别。

通过分析大量的语音数据,深度学习可以创建高度准确的语音识别模型。

三、机器学习和深度学习资源机器学习和深度学习是现代计算机科学领域中的重要学科。

以下是一些有益的资源,可以帮助你更深入地学习它们:1. KaggleKaggle是一个为机器学习、数据科学和计算机视觉专业人士提供的一个机会,让他们分享他们的算法,建立自己的模型,并在竞赛中得到高分。

机器学习的发展现状及未来趋势

机器学习的发展现状及未来趋势

机器学习的发展现状及未来趋势近年来,机器学习领域迅速发展,引起了全球范围内的广泛关注。

机器学习是一种数据驱动的方法,通过计算机系统从大量数据中学习并改进自身的性能,从而使之能够进行自主决策和预测。

随着计算能力的不断提高和数据的爆炸性增长,机器学习的应用领域也日益广泛,包括医疗诊断、智能驾驶、金融预测等等。

在机器学习的发展过程中,深度学习技术起到了关键的作用。

深度学习是一种基于神经网络的机器学习方法,其核心思想是通过多层次的抽象和表示来解决复杂的问题。

深度学习在图像识别、语音识别等领域取得了重大突破,极大地提高了精度和效率。

以计算机视觉为例,深度学习使得计算机能够实现准确地识别和分类图像,甚至能够生成逼真的图像。

未来,机器学习的发展将主要面临两个方面的挑战。

首先,随着机器学习应用的深入,对数据隐私和安全性的要求也越来越高。

当前,机器学习的训练通常需要大量的数据,这就需要用户将个人信息和敏感数据上传到云端进行处理。

然而,数据泄露和隐私侵犯的风险也相应增加。

因此,未来的研究重点之一是如何在保证数据安全和隐私的前提下进行机器学习。

其次,机器学习的模型可解释性也是当前的一个热点问题。

传统的机器学习模型往往是黑盒子,即其决策过程对用户来说是不可理解的。

而在一些应用场景中,模型的可解释性是非常重要的。

例如,在医疗诊断领域,医生需要了解模型是如何做出诊断决策的,这样才能更好地与模型进行协同工作。

因此,未来的机器学习研究需要关注如何提高模型的可解释性,使其更加透明和可信。

此外,机器学习的未来还将面临着一些伦理和社会问题。

例如,自主驾驶技术的应用在提高交通效率的同时也引发了道德和安全的争议。

当自动驾驶汽车面临道路危险时,应该如何权衡人员安全和他人安全之间的冲突?这是一个令人深思的问题,需要机器学习领域与其他相关领域的专家共同研究和解决。

总之,机器学习在过去几年取得了巨大的突破,但仍然存在一些挑战。

随着技术的不断发展和创新,机器学习的应用领域和影响力将会更加广泛。

机器学习的现状与发展趋势

机器学习的现状与发展趋势

机器学习的现状与发展趋势机器学习是一种人工智能领域的重要技术,它通过使计算机具备从数据中学习和改进的能力,将人工智能应用于各个领域。

本文将介绍机器学习的现状,并探讨其未来的发展趋势。

一、机器学习的现状1.1 定义与分类机器学习是一种通过训练计算机模型来实现任务的方法。

根据学习方式的不同,机器学习可以分为监督学习、无监督学习和强化学习等。

监督学习通过给计算机提供标签数据来进行训练;无监督学习在没有标签数据的情况下,从数据中发现模式和结构;强化学习则通过奖励和惩罚来指导计算机进行决策和学习。

1.2 应用领域机器学习已经广泛应用于各个领域,包括自然语言处理、计算机视觉、智能推荐、金融风控、医学诊断等。

在自然语言处理中,机器学习被用于实现语音识别和机器翻译等任务;在计算机视觉领域,机器学习则能够实现目标检测和图像分类等功能。

1.3 现有技术与算法目前,机器学习领域存在着多种成熟的技术和算法,比如线性回归、逻辑回归、决策树、支持向量机和神经网络等。

这些技术和算法基于数学和统计理论,可以对数据进行建模和预测。

二、机器学习的发展趋势2.1 深度学习的兴起深度学习是机器学习的一个重要分支,它通过构建多层神经网络来实现学习和推理。

由于深度学习具备强大的模型拟合能力和自动特征提取能力,它在计算机视觉和自然语言处理等领域取得了重大突破。

未来,深度学习有望在更多领域发挥作用。

2.2 强化学习的发展强化学习是机器学习的一个重要方向,它通过模仿人类学习的方式,让计算机根据环境的反馈来改进决策策略。

强化学习在机器人控制、自动驾驶等领域具备广阔的应用前景。

2.3 结合其他技术未来,机器学习有望与其他技术相结合,实现更加复杂和智能的应用。

比如,结合物联网技术可以实现智能家居和智慧城市;与区块链技术结合可以提升数据的隐私性和安全性。

2.4 倫理和合规性的考慮机器学习发展的一个重要方向是倫理和合规性的考虑。

由于机器学习技术的广泛应用,涉及到数据隐私、算法公平性等重要问题。

机器学习的发展

机器学习的发展

机器学习的发展机器学习是人工智能领域的一个重要分支,它通过让计算机从数据中学习并自动改进算法,以实现更准确的预测和决策。

随着数据量和计算能力的不断增加,机器学习在各个领域的应用也变得越来越广泛。

本文将介绍机器学习的历史发展、应用领域和未来趋势。

一、机器学习的历史发展机器学习的概念可追溯到20世纪50年代,当时科学家们开始研究如何让计算机从数据中学习。

最早的机器学习算法是基于统计学理论的,如线性回归和最大似然估计等。

但受限于当时的计算资源和数据量,机器学习的进展非常有限。

随着计算机性能的提高和互联网的普及,机器学习进入了一个全新的发展阶段。

1990年代,支持向量机(SVM)和决策树等算法出现,并在模式识别、自然语言处理等领域取得了重要突破。

2000年代以后,随着深度学习算法的兴起,机器学习取得了更大的进展。

深度学习以神经网络为基础,通过多层次的神经元网络模拟人脑的运作方式,实现了更复杂的学习和推理能力。

二、机器学习的应用领域机器学习算法在各个领域中都有广泛的应用,以下是几个典型的应用领域:1. 图像识别:机器学习在图像识别领域取得了巨大的突破。

通过训练神经网络模型,计算机可以自动识别图像中的对象、场景和特征,广泛应用于人脸识别、目标检测、自动驾驶等领域。

2. 自然语言处理:机器学习在自然语言处理领域也有重要应用。

通过训练语言模型和深层神经网络,计算机可以理解和生成自然语言,实现机器翻译、语音识别、智能对话等功能。

3. 推荐系统:机器学习为推荐系统的发展提供了强大的支持。

通过分析用户的历史行为和偏好,机器可以预测用户的需求,并向其推荐个性化的产品和服务,提升用户体验和销售效果。

4. 医疗诊断:机器学习在医学领域的应用也逐渐增多。

通过分析患者的病历数据和医学影像,机器可以辅助医生进行疾病诊断和治疗方案制定,提高诊断准确性和治疗效果。

三、机器学习的未来趋势随着人工智能技术的不断进步,机器学习在未来将继续发展壮大。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第10章机器学习研究与应用新进展徐从富李石坚王金龙(浙江大学人工智能研究所,杭州 310027)2005年10月7日第一稿2006年10月16日第二稿10.1 机器学习研究与应用综述10.1.1 机器学习的发展概况机器学习(Machine Learning)不仅是人工智能的一个核心研究领域,而且已成为整个计算机领域中最活跃、应用潜力最明显的领域之一,它扮演着日益重要的角色。

近年来,欧美各国都投入了大量人财物进行机器学习的研究和应用,Intel、IBM、波音、微软、通用电器等大型公司也积极开展该领域的研究和开发,而且已有不少研究成果进入产品。

美国航空航天局JPL实验室的科学家们在2001年9月出版的《Science》上撰文指出:“机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展。

”此外,机器学习研究的热门程度还可以从该领域的国际权威期刊《机器学习研究学报》(Journal of Machine Learning Research,简称JMLR)的影响因子(Impact factor)看出,据美国科学引文检索公司(ISI)统计,2004年该学报的影响因子已达到5.952,这是除了《ACM计算综述》(ACM Computing Survey)以外影响因子最高的计算机类期刊。

需要特别说明的是,《ACM计算综述》每年只发表12篇世界级权威计算机专家关于某个研究方向最新研究进展的综述文章,一般并不发表研究论文,2004年其影响因子为10.037。

1997年Tom M. Mitchell在“Machine Learning”一书中给出了机器学习的经典定义——“计算机利用经验改善系统自身性能的行为。

”还有人认为,机器学习是“神经科学(含认知科学)+数学+计算”的有机结合,数学则填补了神经科学与计算之间的鸿沟。

与很多新兴学科一样,机器学习也是一个多学科交叉的产物,它吸取了人工智能、概率统计、神经生物学、认知科学、信息论、控制论、计算复杂性理论、哲学等学科的成果。

实践证明,机器学习在很多应用领域发挥了重要的实用价值,特别是在数据挖掘、语音识别、图像识别、机器人、车辆自动驾驶、生物信息学、信息安全、遥感信息处理、计算金融学、工业过程控制等领域取得了令人瞩目的成果。

一般来说,机器学习的研究起点最早可追溯到19世纪末的神经科学,特别是James发现了神经元是相互连接的现象。

随后,在20世纪30年代,McCulloch 和Pitts发现了神经元的“兴奋”和“抑制”机制,20世纪中叶,Hebb发现了“学习律”,等等。

在上述神经生物学研究成果的基础上,机器学习的发展大致可分为两条重要主线。

一条主线是:以Barlow提出的功能单细胞假设为依据,Rosenblatt于1956年提出了感知器,在随后的近30年时间里,Samuel等人提出的“符号机器学习”方法一直处于主导地位,1969年Minsky开始研究线性不可分问题,1986年Rumelhart提出了著名的后向传播(BP)神经网络,20世纪90年代Vapnik等人提出了针对有限样本的统计学习理论和支持向量机(SVM),等等。

另一条主线是:以Hebb提出的神经集合体假设为依据,1960年Widrow提出了Madline以解决平凡解问题,1984年Valiant提出了PAC,1990年Schapire 提出了弱学习定理,1995年Freund和Schapire提出了AdaBoost算法,在上述研究成果的基础上,逐渐形成了泛化理论。

需要说明的是,在符号机器学习方面,1959年Solomonoff关于文法归纳的研究应该是最早的符号机器学习,Samuel将学习限制在结构化数据,由此学习演变为约简算法,这是现代符号机器学习的基础。

如果将每条规则理解为一个分类器,符号机器学习是也可算作是Hebb路线的产物。

此外,1967年哥德尔从数学上证明了符号机器学习是不可能完全实现的。

10.1.2 机器学习的研究内容一般来说,一个典型的机器学习系统(如图10.1所示)都包括下面4个程序模块:(1) 执行系统(Performance System)。

其主要功能是用学会的目标函数来解决给定的任务。

(2) 鉴定器(Critic)。

它以解答路线或历史记录作为输入,输出目标函数的一系列训练样本。

(3) 泛化器(Generalizer)。

它以训练样本作为输入,产生一个输出假设,作为它对目标函数的估计。

它从特定的训练样本中泛化,猜测一个一般函数,使其能够覆盖这些样本以及样本之外的情形。

(4) 实验生成器(Experiment Generator)。

它以当前的假设(即当前学到的目标函数)作为输入,输出一个新的问题供执行系统去探索。

设计一个机器学习系统通常要解决如下几方面的问题:(1)选择训练经验。

它包括:如何选择训练经验的类型,如何控制训练样本序列,以及如何使训练样本的分布与未来测试样本的分布相似等子问题。

(2)选择目标函数(Target function)。

不难发现,所有的机器学习问题几乎都可简化为学习某个特定的目标函数的问题,而且这样的简化对解决实际问题是非常有益的,因此,目标函数的学习、设计和选择是机器学习领域的关键问题。

(3)选择目标函数的表示。

对于一个特定的应用问题,在确定了理想的目标函数后,接下来的任务是必须从很多(甚至是无数)种表示方法中选择一种最优或近似最优的表示方法。

图10.1 一个典型的机器学习的基本组成模块Tom M. Mitchell认为,机器学习致力于解决的主要问题有:(1) 存在什么样的算法能从特定的训练样本中学习一般的目标函数?如果提供了充足的训练样本,在什么条件下会使特定的算法收敛到期望的函数?哪个算法对哪些问题的性能最好?(2) 多少训练样本是充足的?怎样找到假设的置信度与训练样本的数量及提供给学习器的假设空间特性之间的一般关系?(3) 学习器拥有的先验知识是怎样引导从样本进行泛化的过程的?当先验知识仅仅是近似正确的,它们会有帮助吗?(4) 关于选择有效的后续训练经验,什么样的策略最好?这个策略的选择将如何影响学习问题的复杂性?(5) 怎样把学习任务简化为一个或多个函数逼近问题?也就是说,系统试图学习哪些函数?这个过程本身能否自动化?(6) 学习器怎样自动地改变表示法来提高表示和学习目标函数的能力?10.1.3 研究现状与发展趋势显然,任何一个没有学习能力的系统都很难被认为是一个真正的智能系统,但随着机器学习研究及应用的不断发展,尽管“学习机制”还是研究动力之一,然而,“烦恼的网络”危机使得更为重要的推动力来自“有效利用”信息。

当前,很多传统领域借用机器学习来提高研究水平,应用驱动的机器学习方法层出不穷,特别是基于机器学习的数据分析方法已成为解决复杂问题的关键技术之一,因此,当前机器学习的角色也逐渐发生了转变,已发展到一个新阶段。

主要体现在:(1)主方向的改变。

当前机器学习领域的主流不再是单纯地做“会学习的机器(人)”,而是越来越朝着智能数据分析的方向发展,并已成为智能数据分析技术的一个重要源泉。

目前,机器学习主要用于智能数据分析的典型任务——预测,例如,天气预报、网络入侵检测、生物信息学中的基因组和蛋白质组的结构分析等。

(2)侧重点的改变。

传统的机器学习强调“学习本身是目的”,上一阶段的研究几乎完全局限于人工智能这一领域本身,主要关注人工智能对人类学习能力的追求;而当前的机器学习更强调“学习本身是手段”,它已经开始广泛进入计算机科学的不同领域,甚至其它学科,并已成为一种支持技术和服务技术。

(3)应用面的改变。

近年来,文本与图像占信息的绝大数,在文本分析与自然语言理解上,数据资源建设逐渐完善,人们关注的焦点是机器学习及其在这些数据资源上的深层次应用。

当前,针对信息的复杂多样性,涌现出很多新的机器学习方法。

比如:可用于特征抽取的流形机器学习,即稀疏数据的非线性处理方法;改善机器人适应环境变化性能的增强学习;可用于药物设计的多实例学习和半监督学习;广泛用于搜索引擎的Ranking学习;能够快速过滤海量数据的数据流(Data stream)学习;等等。

虽然这些新的机器学习方法仍处于探索和实验观察阶段,但是,它们已充分表明基于机器学习的数据分析方法越来越成为解决复杂问题的关键。

因此,现阶段机器学习研究不应再过多地强调模拟人的学习能力,应该把机器学习真正当成一种支持技术(也就是说,它是一种重要手段而非目的),考虑不同领域甚至不同学科对机器学习的需求,找出其中迫切需要解决的共性问题,并进行深入研究,有人把这种视角下的机器学习称为“普适机器学习”(Pervasive Machine Learning,简称PML)。

中科院自动化研究所模式识别国家重点实验室的王珏教授等人认为,目前机器学习领域存在的主要理论问题有:z统计类机器学习需要满足独立同分布条件,这样的要求太过苛刻。

z没有一般的指导原则来寻找问题线性表示的空间。

z没有好的方法来支持信息向符号的映射。

z机器学习没有一劳永逸的解决方案。

z领域知识与数据分析不可避免。

南京大学计算机软件新技术国家重点实验室的周志华教授等人认为,今后10年间机器学习领域存在5个挑战性问题:(1)泛化能力。

这是一个共性问题,几乎所有的领域都希望越准越好,提高泛化能力是机器学习领域永远追求的目标。

目前泛化能力最强的技术有:支持向量机(SVM),其产生途径是从理论(特别是统计学)到实践;集成学习(Ensemble learning),其产生途径则是从实践到理论。

(2)速度。

这也是一个共性问题,几乎所有的领域都希望越快越好,加快速度也是机器学习领域永远追求的目标。

目前,机器学习领域最关心的一个问题是“训练速度”与“测试速度”之间的关系,以及如何使这两者之间不发生矛盾。

例如,k近邻方法的训练速度快,但其测试速度往往比较慢;而神经网络恰恰相反;等等。

(3)可理解性。

绝大多数领域都希望有“可理解性”,例如,在医疗诊断中需要向病人解释“为什么做出这样的诊断”,信用卡盗用检测时需要向保安或公安部门解释“为什么这是正被盗用的卡”,等等。

而目前功能强大的机器学习技术几乎都是(或基本上是)“黑盒子”,如神经网络、支持向量机、集成学习等。

最近,Tom M. Mitchell在他的著作“Machine Learning”新增一章可理解的Naïve Bayes(朴素贝叶斯)方法和Logistic Regression(回归)模型是有重要意义的。

(4)数据利用能力。

传统的机器学习技术都是对有“标记”的数据(是指带有事件所对应的结果的数据)进行学习,然而,随着Internet的出现和数据收集能力的不断提高,绝大多数领域都将面临大量未标记的数据,如医学图像、垃圾邮件等;同样地,大多数领域也都会遇到“坏”数据(是指那些含有大量噪音、属性缺失、不一致的数据);此外,还有一类“不平衡”数据也经常碰到,比如,乳腺癌诊断中的“健康人”样本就远多于“病人”样本,信用卡盗用检测中的“正常使用”样本就远多于“盗用”样本。

相关文档
最新文档