主动学习研究综述_龙军
低年级小学生主动学习的特点及策略研究报告

低年级小学生主动学习的特点及策略研究报告江西省九江市双峰小学方青学习是一个复杂的思维过程,是需要眼、耳、口、手、脑的密切配合才能完成的。
学习更是一个自主的过程,是任何人不能代替的。
我们进行了深入的调查研究,针对当前各学段的学生自主学习的情况,尤其是低年级小学生是否能够自主学习的情况收集了大量的信息。
他们会在什么情况下主动学习呢?他们主动学习有什么特点呢?对不够主动学习的同学有什么应对的策略呢?笔者在深入的调查和个案收集中有了如下的发现:一、哪些是“我要学”的原动力小学低年级,是一个人接受正规学习的开始,伴随他们的九年义务教育和三年高中学习被称为十二年的基础教育。
在此期间若学会了自主学习,就能为人生的发展开拓一片天空。
因此,低年级作为基础教育的基础,在培养小朋友主动学习的习惯上就显得更重要了。
低年级的孩子就象一张白纸,俗话说得好,一张白纸能画最新最美的图画。
在老师指导下、家长的教育下、个体的努力下,如果能充分利用他们的兴趣,作为向导,在学习的旅途上主动去跋涉、攀登就能到达理想的彼岸。
然而让学习在各种好奇、兴趣的陪伴下,在一个个动力的驱使下,他们会产生强烈的“我要学”的愿望。
于是就有了发自内心的需要,“我要学”!成为自主学习的一个原动力。
低年级同学主动学习情况怎样?具有哪些特点呢?从我们调查的数据和事例来看,小学低年级同学自主学习虽比起中高年级来,还是初体验,但是有了这样好的开始,应该能继续做得更好。
那么低段自主学习有哪些特点呢?从下面统计表图(一)中的数据和信息就可以看出:一年级二年级激趣语言8986表扬语言5037大家鼓励4467新颖奖励8280源自兴趣3230父母启发8679父母激励8650表(一)在学校:受到教师激趣语言的刺激、表扬语言的刺激、同学们鼓励语言的刺激、个体对学习材料的兴趣、对学习情景的兴趣、都是自主学习的动力。
在学校老师激趣的语言占到了86%-89%、新颖的奖励占到了80%-82%。
主动学习研究综述_龙军

基于池的算法大多可以通过调整以适应基于流
的情况.但由于基于流的算法不能对未标注样例逐 一比较 , 需要对样例的相应评价指标设定阈值 , 当提 交给选择引擎的样例评价指标超过阈值 , 则进行标 注.但这种方法需要针对不同的任务调整阈值 , 所 以难以作为一种成熟的方法投入使用.
主动学习在降低样本复杂度方面比传统被动学 习具有优势 , 近年来取得较大 的发展 , 但就现状而 言 , 仍然存在很多值得深入研究的问题.
1 样本复杂度
首先关注的是在理论上 , 主动学习能在多大程 度上降低样本复杂度.当前已经有 了很多研究 , 但
收稿日期 :2007-07-10 基金项目 :国家自然科学基金项目(60603015 , 60603062);湖南省自然科学基金项目(06jj30035)
Q BC 算法[ 2] 也曾用于解决基于流的主 动学习 问题.样例以流的形式连续提交给选择引擎 , 选择 引擎选择那些委员会(此处委员会只由两个成员分 类器组成)中的成员分类器预测不一致的样例进行 标注.
Saunier 等人[ 26] 试图用基于流的主动学习算法 处理道路交叉点的冲撞风险 评估问题.但他指出 , 由于面对的问题中请求人类专家对样例进行标注的
Q BC 算法[ 2] 从版 本空间中随机选择若干假设 构成一个委员会 , 然后选择委员会中的假设预测分 歧最大的样例进行标注.评价 分歧度有如下标准 : 投 票 熵[ 7] 、Jensen-Shannon 分 歧 度[ 19] 、 K ullbackLeibler 分歧度[ 20] 等.Fruend 等人[ 2] 给出了 Q BC 方 法的严格理论证明.为了优化委员 会的构成 , 增强 其多样性 , Q Bag[ 17] , QBoost[ 17] 和 A ctive Decorate[ 18] 算 法分 别采用 Bagging , AdaBoost 和 Decorate 等 成熟 的分类器集成算法从版本空间中产生委员会.
信息技术教学中学生主动学习方式建构

信息技术教学中学生主动学习方式建构初探吴琼(四川省内江市第六中学,四川内江641000)摘要:针对当前学生学习信息技术的方式存在以下一些问题:主动性、积极性差,探究学习能力不够,合作学习的意识不强等,结合教学实践,提出从心理上消除学生对老师的“迷信盲从”,让他们敢于质疑、敢于探究;利用各种教学资源及借助工具软件,给学生提供有助于发现问题的感性材料,唤醒学生主动发现、解决问题的意识,培养学生探究知识的能力;激励肯定,让学生养成不断追问的习惯等四条措施建构学生主动学习方式,以提升学生的学习能力。
关键词:建构;自主;合作;探究;主动学习方式国家颁布的《基础教育课程改革纲要》明确提出了转变学生学习方式的任务,要求新课程“注重培养学生的独立性和自主性,引导学生质疑、调查、探究,在实践中学习,促进学生在教师的指导下主动地、富有个性地学习”,该纲要还把“以学生发展为本”作为新课程的基本理念,提出了“要改变课程实施过于强调接受学习、死记硬背、机械训练的现状,倡导学生主动参与、乐于探究、勤于动手,培养学生搜集和处理信息的能力、获取新知识的能力、分析和解决问题的能力以及交流与合作的能力”。
这是实施新课程最为核心和最为关键的环节。
但我们在信息技术课堂的教学实践中发现学生的学习方式存在以下一些问题。
1学生学习信息技术的主动性、积极性差我们在指导学生进行研究性学习和科技创新实践的过程中发现,尽管学生信息技术考试成绩比较好,但许多同学综合运用信息技术的能力还比较差,分析其原因,主要是学生“学法”问题占很大因素,尽管在我们教学中普遍采用了讲解、演示等诸多形式,但学生听后、看后,机械地完成老师布置的作业,即学生只有被动的学习方式,没能发挥学生的主动性、积极性。
2学生的探究学习能力不够我们在信息技术教学中发现大部分学生只掌握教师课堂教学内容或教材上的知识,继而他们会觉得信息技术缺乏新鲜感,不想学,没有继续深入继续探究的习惯和能力。
小学语文自主合作探究学习方式的研究论文

小学语文自主合作探究学习方式的研究论文标题:小学语文自主合作探究学习方式的研究摘要:本研究旨在探索小学语文自主合作探究学习方式的有效性以及对学生学业发展的影响。
通过文献综述和实证研究,将分析自主合作探究学习的理论基础、教学原则、实施策略及其对学生语文学习的作用。
研究将探讨自主合作探究学习在小学语文教育中的嵌入性,并通过对学生学业发展的量化数据分析,验证自主合作探究学习的效果。
结果表明,自主合作探究学习方式能够提高学生的语文学习能力和深入理解能力,对学生学业发展具有积极影响。
关键词:自主合作探究学习、小学语文教育、学业发展、效果验证引言:自主合作探究学习作为一种以学生主动参与、合作与探究为核心的学习方式,逐渐受到教育界的重视。
在小学语文教育中,如何引导学生自主合作探究,激发学生学习兴趣,提高学生的语文学习能力,是当前关注的热点问题。
本文通过对已有文献进行综述分析和实证研究,旨在探究小学语文自主合作探究学习方式的有效性以及对学生学业发展的影响。
一、自主合作探究学习的理论基础和教学原则自主合作探究学习是以构建知识体系、培养自主思考和合作精神为目标的学习方式。
其理论基础主要包括建构主义理论和社会交往理论。
自主合作探究学习的教学原则是激发学生自主性、创造性、合作性,鼓励学生探究的探索精神和问题解决的能力。
二、自主合作探究学习在小学语文教育中的嵌入性在小学语文教育中,将自主合作探究学习嵌入教学实践,可以通过以下策略实施:提供具有激发思考的教材,构建任务型教学,引导学生团队合作和进行小组讨论,鼓励学生自主提问、探究和解决问题。
三、自主合作探究学习对学生学业发展的影响通过对学生学业发展的量化数据分析发现,自主合作探究学习方式对学生的语文学习能力和深入理解能力有积极影响。
学生通过自主合作探究学习,能够培养问题意识和解决问题的能力,提高阅读理解和写作水平,增强语文学习的兴趣和主动性。
结论:综上所述,自主合作探究学习方式在小学语文教育中具有重要的教育价值。
学会主动学习,激发主体意识,提升信息素养

学会主动学习,激发主体意识,提升信息素养主动学习是在教育教学过程中,学生在学习时表现出的自觉性、积极性,独立性特征的总和,是从事创造性学习活动的一种心理能动状态。
而信息技术作为一门知识更新速度极快的学科,将在很长一段时间内处于知识发展高速度与高淘汰并存的状态,作为一名信息技术教师,应将教学中由单纯的技能训练上升到主动学习方式的培养,教会学生主动学习,打造良好学习的平台,全面提高学生的信息素养。
一、创设主动学习的情境良好的信息技术氛围是学生有效学习的前提,和谐的师生情感、宽松愉快的课堂氛围,能最大限度地发挥学生的学习潜能。
鉴于小学生的年龄特点和认知特点,兴趣成为教学活动中最有效的切入点。
作为教师可以抓住学生的兴趣,为他们创设主动学习的情境,给学生营造良好的信息技术环境,激发学生主动地去学习,主动地去探究和创新。
在教学flash的形状渐变动画内容时,我首先为孩子播放提前制作好的“灰太狼和喜羊羊”动画片:在片中,喜羊羊学得了一项新本领,能像孙悟空一样,会72般变化,一会儿变成可爱的美羊羊,一会儿变成搞笑的灰太狼,一会儿红脸、一会儿大笑……动人的场景让学生沉浸在无限的乐趣中,好多同学更是跃跃欲试,想赶快作出效果来。
用这样的情景创设,充分调动了同学们参与课堂的积极性。
在课堂中,学生目标明确,能够积极参与、主动思考、探索实践,自主学习的意识浓郁,效果显著。
二、激发主动学习的动机学生是课堂教学的主体,强烈的学习动机是保障持续主动学习的动力源泉,教师要把课堂交给学生,积极成为学生学习的组织者、引导者和知识的建构者,要让学生在课堂上充分发挥自我,表现自我,激发他们的学习动机,才能使学生更主动地去学习、去创新,真正转变为学习过程中的主体,成为教学活动的积极参与者。
如在上六年级的《网游是非》一课时,我通过创设情境引导学生分配家长与学生这两个对立角色,并以网游这样的形式提出问题,让学生根据问题主动去学习和探索,充分发挥了学生的主体作用。
集体教学中促进幼儿主动学习的策略研究_个人教学研究工作总结

集体教学中促进幼儿主动学习的策略研究_个人教学研究工作总结集体教学中促进幼儿主动学习的策略研究《幼儿园工作规程》明确指出:“幼儿园的教育活动应是有目的、有计划引导幼儿生动、活泼、主动学习的活动,是多种形式的教育过程。
”“组织活动应根据不同的教育内容,充分利用周围环境的有利条件,积极发挥幼儿感官作用,灵活地运用集体或个别活动的形式,为幼儿提供充分活动的机会,注重活动的过程,促进每个幼儿在不同水平上得到发展。
”现代教育观、课程观使我们认识到,如何在幼儿园的教育教学活动中实施主体性教育,发挥幼儿在教育活动中的主体性,已成为促进幼儿全面发展的关键。
我们认为,在幼儿园的教学活动中,教师可从以下几方面入手,发挥幼儿的主体性。
一、奠定幼儿的主体地位,师生资源共享课程发挥幼儿的主动性,首先教师要在头脑中确立幼儿的主体地位,幼儿是一个发展的无声的主体。
任何外在教育环境都必须通过幼儿主体的不懈努力,就可以实行教育环境功能的转变,最终全面落实至推动幼儿发展上,因此教师必须践行恰当的儿童观、教育观,把幼儿放在主动发展的边线上,变小思索教师如何教会思索幼儿如何学。
教师在挑选教材内容时,可以适度地使幼儿参予,非政府幼儿探讨,介绍幼儿的偏好,有的放矢地挑选教材的内容,调动幼儿的积极性,使幼儿更主动地参予教学过程,更好地参予教学过程,更好地资金投入至教学活动中来:比如:在《有价值的植物》这一主题中,孩子们在介绍了一些植物特征后,教师急于地非政府幼儿谈谈心得,并期望老师再教导哪些内容?这时,幼儿七嘴八舌地各抒己见,大多幼儿整体表现出与保健茶存有浓郁的兴趣,于是老师就特意根据幼儿的意愿深入细致非政府了一个关于《保健茶》的主题活动,使幼儿介绍各种保健茶的功效和酿制过程。
活动之前设计了调查表,使幼儿介绍各种中草药的特性,和哪种中草药酿制成保健茶合适,这样孩子们研习得更为主动。
只有师生资源共享的活动,就可以并使幼儿沦为自学的主人,就可以对幼儿的发展存有真正的促进价值。
语文教学与学生主动学习意识的培养

语文教学与学生主动学习意识的培养作者:农金华来源:《中学语文·大语文论坛》2008年第08期【摘要】语文教学的精神内核是学生通过自觉自主地学习,全面提高听说读写的能力。
教师应在教学过程中创设良好的学习氛围,培养学生主动学习的意识。
【关键词】语文教学自主学习主动意识学习是人在生活过程中获得个体经验的过程,是信息的输入、输出与反馈调节的动态过程,是预备处理新情况的过程。
语文教学的精神内核是强调学生在明确学习任务的基础上,自觉、自主地学习,并努力使自己完成学习任务,从而使知识与能力协调发展,并有效的促使语文教学活动产生质的飞跃,创造出良好的大语文学习氛围。
语文教学主动学习意识的培养表现为教师与学生的双向互动性,即教师首先了解学生知识和能力的状况,科学合理地制定语文教学目标。
其次是引导学生,把外在的学习目标化为内在的学习目标,然后组织学生自己进行新知识的学习,使学生通过自己的努力获取新知识和在学习新知识的过程中及时“内化”知识,形成和发展学习能力。
我想,主动学习意识的培养和能力的提高,可在以下几个教学环节去实现。
首先,教师创设问题情境。
问题情境是教学目标的具体化,它往往能够激活学生强烈的好奇心和探索欲望。
所创设的问题情境越新颖,越具有对比度,学生的思维越灵活、敏捷,并具有深刻性和批判性。
《荷塘月色》一课中,笔者先引导学生欣赏二胡曲《二泉映月》,然后品味李白的《静夜思》和俄国诗人叶赛宁的《月夜》,最后回到朱自清的《荷塘月色》里。
经过一番酝酿后,笔者就三个问题让学生讨论:1.李白在月光如霜的深夜里,有一种什么样的情结挥之不去?2.俄国诗人叶赛宁在“银色的光焰”下,向大地深情诉说什么?3.朱自清笔下的月光为什么那么淡,那么朦胧?学生有的想象李白诗中的乡思情怀;有的想象俄罗斯的静谧草原、河流和燃烧的月光,以及诗人浓烈的情思;有的神往朱自清幽静朦胧的月光荷塘,神往古老而新鲜的采莲盛况,同时他们将诗人内心的月光与情感区分比较,明确作者的思想感情和他们生活的时代、环境密切相关。
课堂学习主动探究策略

课堂学习主动探究策略作者:沈凌来源:《小学科学·教师版》2020年第08期近年来,传统的“手把手”教学模式,已经被许多教师所摒弃,在这种传统式教学方法中,学生在学习中只能一味地“听”,无法参与其中,被动接受知识和技能,无法成为课堂学习的主人,仅仅是一个“看客”。
当今,教育界凸显一个热门话题——发挥学生主观能动性。
学生是学习的主人,教师只是起着主导作用,不能主次不分。
学生是语文学习的主人,教师应运用恰当的教学策略引导学生在语文学习中进行主动探究,促使其在预习中积极主动地参与语文学习探究。
要想一堂课朝气蓬勃、活力四射,让学生成为学习的主体,主动参与课堂中来,教师的观念就必须与时俱进,符合新课标的“学生发展为本”。
一、在预习中实施主动探究策略预习是学习的好习惯,不能成为一种搬运的模式。
教师想要让预习事半功倍,一开始,就要教给学生正确预习的方法,让学生“按图索骥”。
当学生充分了解了预习的重要性,会在课前自觉进行预习,直至养成动脑预习的好习惯。
这学期开学第一课,我便用《窃读记》来进行辅导预习。
《窃读记》这篇课文开始预习,我会要求学生把课文读通、读顺,至少有感情地大声地朗读三遍新课。
尤其是新课中的生字,要先注音,并观察字形,边读边理解字义,如“炒”“踮”“惧”,非常容易分辨出来的形声字——左形右声,那么就能清楚“炒”字跟火有关系,表示用火来加热弄熟食物,“踮”字与足有关系,提起脚跟,用脚尖着地,“惧”与心情有关系,害怕、恐惧。
然后再边默读课文,边思考,边做批注,哪里还有疑义,哪里还有问题,做好预习笔记。
学生善于在预习中提出问题,说明学生开始由学“答”转向“问”了。
在课前进行有效的预习,学生在新课学习过程中才会更有效、更灵活、更主动,也是培养学生课堂自主阅读、探究合作能力的前提。
二、在激发情感中实施主动探究策略情感投入对于课堂学习起着至关重要的作用。
在课堂教学中,我会积极创造一个充满情感的教学环境,调动学生的情感因素。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机研究与发展ISSN 1000-1239 CN 11-1777 T PJournal of Computer Research and Development 45(Suppl .):300~304,2008 收稿日期:2007-07-10 基金项目:国家自然科学基金项目(60603015,60603062);湖南省自然科学基金项目(06jj30035)主动学习研究综述龙 军 殷建平 祝 恩 赵文涛(国防科学技术大学计算机学院 长沙 410073)(jdragon nudt @hotmail .com )A Survey of Active LearningLong Jun ,Yin Jianping ,Zhu En ,and Zhao Wentao(School of Computer Science ,National University of Defense Technology ,Changsha 410073)Abstract Recently ,active learning has become a hotspot of the research in machine learning .The technology efficiently reduces the sample complex throug h actively selecting the instance to learn .Introduced in this paper is the latest research progress of active learning ,including sample complex ,sample selection methods and real w orld application .Finally ,the open problems remained in active learning are pointed out .Key words active learning ;instanc e selection摘 要 近年来,主动学习成为机器学习领域的研究热点.这一技术通过主动选择要学习的样例从而有效地降低学习算法的样本复杂度.介绍当前主动学习的研究进展,包括主动学习的样本复杂度,样例选择算法和实际应用,最后指出主动学习领域中还保留的开放问题.关键词 主动学习;样例选择中图法分类号 TP18 传统监督学习问题中,学习算法以外界给定的已标注样例集作为训练集进行训练,从中归纳出模型.而在很多的现实应用中,对样例集进行标注代价昂贵、枯燥乏味或是异常困难,而获取未被标注的样例则相对容易.例如,针对基因序列测试,要标注一段基因序列需要进行代价昂贵的实验,相反,获取基因片段代价则相对小得多.面对这种情况,传统的监督学习方法(即被动学习)构建正确率满足要求的分类器将十分困难.因此,主动学习方法被提出以有效地处理这类问题.在主动学习中,学习器能够主动地选择包含信息量大的未标注样例并将其交由专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样可以有效地降低构建高性能分类器的代价.主动学习方法一般可以分为两个部分:学习引擎和选择引擎.学习引擎负责维护一个基准分类器,并使用监督学习算法对系统提供的已标注样例集进行学习从而使该分类器的性能提高;而选择引擎负责运行样例选择算法选择一个未标注的样例并将其交由人类专家进行标注,再将标注后的样例加入到已标注样例集中.学习引擎和选择引擎交替工作,经过多次循环,基准分类器的性能逐渐提高,当满足预设条件时,整个过程终止.主动学习在降低样本复杂度方面比传统被动学习具有优势,近年来取得较大的发展,但就现状而言,仍然存在很多值得深入研究的问题.1 样本复杂度首先关注的是在理论上,主动学习能在多大程度上降低样本复杂度.当前已经有了很多研究,但总的来说,这方面的研究仍然还没有达到成熟.根据PAC理论,为获取期望错误率小于ε的分类器,传统监督学习算法的样本复杂度为O1εln 1ε,主动学习需要获得比这更低的样本复杂度才有实际意义.当前已获得的成果包括以下几类:①样例集中无噪声的问题;②样例集中存在噪声的问题;③主动学习在何种情况下不能有效降低样本复杂度的问题.对问题①,Cohn等人[1]给出了一种最简单的情况,即确定单位线段上的0-1分界线问题.他指出,为了使期望错误率小于ε,在采用二分搜索并且样例均匀分布的情况下,主动学习算法的样本复杂度为O ln 1ε.Fruend等人[2]对更复杂的情况作了分析.他将问题抽象如下:假设空间中包含的都是齐次线性分界面,同时样例均匀分布于R d上的单位球面,而且假设空间中存在完美分类器(即与所有样例一致). Fruend等人[2]证明,QBC算法能够只需要Od log dε次标注就可以学习到一个错误率小于ε的分类器,而对应的学习线性分界面的监督学习算法则需要Ψ(dε)的样本复杂度.Fruend等人的这一结果是历年来能取得的最好的样本复杂度结果.对问题②,Kaariainen[3]证明当噪声率为η时,样本复杂度的一般下界为Ψη2ε2.更进一步,Kaaria inen假定当假设空间中性能最好的分类器的错误率至多为β>0时,为使错误率小于ε,主动学习的样本复杂度下界为Ψβ2ε2log(1δ),其中δ为可靠性参数(表示学习以1).Balcan等人[4]则提出一种主动学习算法,该算法在未标注样例集包含噪声的前提下,针对Fruend 等人[2]所描述的问题情况,可以获得样本复杂度为O d2log1ε的一般上界.对问题③,Dasgupta[5]证明,当假设空间包含非齐次线性分界面,则存在一些目标假设,使得无论怎样使用主动学习算法,达到小于ε的错误率的一般下界为Ψ1ε.同时,Dasgupta等人[6]还证明,在样2 样例选择算法根据获得未标注样例的方式不同,可以将主动学习算法分为两种类型:基于流的和基于池的.基于流(stream-based)的主动学习[2,7-8]中,未标注的样例按先后顺序逐个提交给选择引擎,由选择引擎决定是否标注当前提交的样例,如果不标注,则将其丢弃.而基于池(pool-based)的主动学习[9-11]中则维护有一个未标注样例的集合,由选择引擎在该集合中选择当前要标注的样例.以下分别介绍.2.1 基于池的样例选择算法基于池的样例选择算法是当前研究得最为充分的.按照选择的标准不同可以分为以下几类:基于不确定度缩减的方法、基于版本空间缩减的方法、基于未来泛化错误率缩减的方法和其他方法.分别介绍如下:1)基于不确定度缩减的方法这类方法选择那些当前基准分类器最不能确定其分类的样例进行标注.这种方法以信息熵作为衡量样例所含信息量大小的度量,而信息熵最大的样例正是当前分类器最不能确定其分类的样例.从几何角度看,这种方法优先选择靠近分类边界的样例,所以又可以称为最近边界方法.这种方法可以应用于任何形式的基准学习器,如logistic reg ression[9]、隐马尔可夫模型[12]、支撑向量机[13-14]以及归纳逻辑编程[15]等.它在大多数问题上能取得比随机选择更好的性能,但有可能采集到孤立点.2)基于版本空间缩减的方法这类方法选择那些训练后能够最大程度缩减版本空间的样例进行标注.在二值分类问题中,这类方法选择的样例总是差不多平分版本空间,其思想来源于二分搜索.这包括QBC[16],SG-net[1],QBag[17],QBoost[17]和Active Deco rate[18]等.QBC算法[2]从版本空间中随机选择若干假设构成一个委员会,然后选择委员会中的假设预测分歧最大的样例进行标注.评价分歧度有如下标准:投票熵[7]、Jensen-Shannon分歧度[19]、Kullback-Leibler分歧度[20]等.Fruend等人[2]给出了QBC方法的严格理论证明.为了优化委员会的构成,增强其多样性,QBag[17],QBoost[17]和Active Dec orate[18]算法分别采用Bagging,AdaBoost和Decorate等成熟的分类器集成算法从版本空间中产生委员会.3)基于泛化误差缩减的方法301龙 军等:主动学习研究综述这类方法试图选择那些能够使未来泛化误差最大程度减小的样例.其一般过程为:首先选择一种损失函数用于估计未来错误率,然后将未标注样例集中的每一个样例都作为下一个可能的选择,分别估计其能给基准分类器带来的误差缩减,选择估计误差缩减最大的那个样例进行标注.当前针对不同的基准分类器提出相应的算法,如朴素贝叶斯[21]、贝叶斯网络[22]、最近邻算法[23]等.这种方法直接针对分类器性能的最终评价指标,理论上具有很好的效果,但计算量较大,同时损失函数的精度对性能的影响也至关重要.4)其他方法包括各种难以归入以上分类的主动学习算法,包括COMB[24]、多视图(view)主动学习[11]、预聚类主动学习[25]等.COM B算法[24]组合3种不同的主动学习器,迅速切换到当前性能最好的学习器从而使选择样例尽可能高效.多视图主动学习[11]用于学习问题为多视图学习的情况,选择那些使不同视图的预测分类不一致的样例进行学习.其中,视图是指样例中足够做出分类判断的特征集合.这种方法对处理高维的主动学习问题非常有效,但不适用于低维问题.预聚类主动学习[25]认为基于不确定度缩减的方法会忽略样例的先验分布,而样例的分布恰恰有可能蕴涵丰富的信息.因此,首先运行聚类算法,然后选择样例时优先选取最靠近分类边界的样例和最能代表聚类的样例(即聚类中心).2.2 基于流的样例选择算法基于池的算法大多可以通过调整以适应基于流的情况.但由于基于流的算法不能对未标注样例逐一比较,需要对样例的相应评价指标设定阈值,当提交给选择引擎的样例评价指标超过阈值,则进行标注.但这种方法需要针对不同的任务调整阈值,所以难以作为一种成熟的方法投入使用.QBC算法[2]也曾用于解决基于流的主动学习问题.样例以流的形式连续提交给选择引擎,选择引擎选择那些委员会(此处委员会只由两个成员分类器组成)中的成员分类器预测不一致的样例进行标注.Saunier等人[26]试图用基于流的主动学习算法处理道路交叉点的冲撞风险评估问题.但他指出,由于面对的问题中请求人类专家对样例进行标注的代价小,所以可以直接让人类专家标注每一个提交的样例,然后再对这些样例进行选择性的学习.不同于Freund等人[2]的工作,Cesa-Bianchi等人[27]针对的问题为:流中的样例独立同分布(不要求均匀分布)地取自R d上的单位球面,其标注由一个二值线性概率函数生成且线性系数未知.他提出的算法维持一个对当前训练集的最小平方估计,该估计随着算法迭代的进行而逐步更新,当新样例自流中提交给选择引擎时,计算对新样例的最小平方估计的边缘值,当该边缘值小于一个阈值时,标注该样例,而该阈值随着算法迭代的进行逐步调整. Cesa-Bianchi等人[27]证明,随着提交给选择引擎的样例增多,该算法需要标注的样例呈对数级地减少.3 应 用当前,主动学习已逐步投入具体的应用,其中包括文档分类及信息提取、图像检索、入侵检测、Web 分析和视频分析等广大领域的实际问题.1)文档分类及信息提取由于文档分类和信息提取任务中对人类专家的依赖很重,需要枯燥乏味的大量劳动,所以这一领域较早地刺激了主动学习方法的出现[9-10,15,21,28].这一应用涵盖的面也很广,基于池的主要样本选择算法基本上都涉及到了.但相关的研究大多集中在2001年以前,近年来较少涉及.Lew is等人[9]以贝叶斯方法作为基准学习器,使用基于不确定度缩减的样例选择算法进行文本分类.M cCallum等人[10]将EM算法同基于QBC方法的主动学习结合.EM算法能够有效地利用未标注样例中的信息提高基准分类器的分类正确率,而QBC算法能迅速缩减版本空间,这两种技术的结合经实验证明是相当有效的.Roy等人[21]使用贝叶斯方法作为基准学习器,采用基于泛化误差缩减的样本选择算法处理文本分类.该算法使用损失函数评估每个样例可能导致的未来泛化误差的缩减,选择能引起未来泛化误差缩减最大的样例进行标注. Tong等人[28]则使用支撑向量机作为基准学习器,采用最近边界方法作为样例选择算法.2)图像检索相对于文本,图像中蕴含的信息量更大.因此图像检索也是主动学习的一个重要应用领域[29].Tong等人[29]使用支撑向量机为基准学习器的主动学习算法来处理图像检索.该算法采用最近边界方法作为样例选择算法,同时将图像的颜色、纹理302计算机研究与发展 2008,45(增刊)等提取出来作为部分特征进行学习.3)入侵检测由于入侵检测系统较多地依赖于专家知识和有效的数据收集,所以有研究者采用主动学习算法降低这种依赖性.Almgren等人[30]以支撑向量机作为基准学习器,采用最近边界方法作为样例选择算法.Almg ren 等人针对1999年KDD入侵检测数据竞赛的样例集做了测试,实验结果表明,采用主动学习算法可以大幅度降低需要标注的样例集.其他还有一些针对Web信息提取[11]、可视目标检测[31]、信息检索[32]、基因序列分析[33]和道路安全评估[26]的研究.4 开放问题目前对于以下情况的研究还很少[34]:1)学习器不知道样例如何分布的情况;2)低误差率情况下的均匀或任意分布的有高样本复杂度边界的高效学习算法;3)空间和时间复杂度不能随着可见样例和错误上升而上升的情况;4)针对其他概念类或者一般概念类的学习问题.对主动学习的现实应用进一步的研究可以包括:1)同具体应用领域的先验知识结合,研究更加高效的主动学习算法,以减少标注样例的代价.2)结合代价敏感学习及不平衡数据集学习等技术,有效处理实际问题域真正关注的问题,而非仅仅以提高分类正确率为惟一标准.参考文献[1]D Cohn,Atlas R Ladner.Improving general ization with activelearning.M achine Learning,1994,5(2):201-221[2]Y Freund,H S Seung,E S hamir,et a l.Selective s ampl ingusing the query by committee algorithm.M achine Learning,1997,28(2-3):133-168[3]M Kaariainen.Active learning in the non-real izable case.In:Proc of the17th Int'l Conf on Algorithmic Learning T heory.Berlin:S pringer,2006.63-77[4]M-F Balcan,A Beygelzimer,J Langford.Agnostic activelearning.In:Proc of the23rd Int'l C onf on M achine Learning.San Francisco,CA:M organ Kaufmann,2006[5]S Dasgupta.Coarse sampl e complexity bounds for activelearning.In:Proc of Advances in Neural Information Process ingSystems.C ambridge,M A:M IT Press,2005[6]S Dasgupta,A T Kalai,C M onteleoni.Analysis of perceptron-based active learning.In:Proc of the18th Annual Conf onLearning Theory.Berlin:S pringer,2005[7]I Dagon,S mittee-bas ed s ampl ing for trainingprobabilistic cl ass ifiers.In:Proc of the12th Int'l Conf onM achine Learning.San Francisco,CA:M organ Kaufmann,1995.150-157[8]S Arganmon-Engelson,I mittee-based sampl eselection for probabil istic class ifiers.Journal of ArtificialIntell igence research,1999,11:335-360[9]D D Lewis,W A Gail.A sequential algorithm for training textclassifiers.In:Proc of the17th ACM Int'l Conf on Researchand Development in Information Retrieval.Berlin:Springer,1994.3-12[10]A K M cCallum,K Nigam.Employing EM in pool-based activelearning for text classification.In:Proc of the15th Int'l Confon M achine Learning.San Francisco,CA:M organ Kaufmann,1998[11]I M usl ea,S M inton,C A Knoblock.Active l earning w ithmultiple view.Journal of Artificial Intel ligence R esearch,2006,27:203-233[12]T Shcheffer,S W robel.Active learning of partially hiddenM arkov models.In:Proc of the ECM L PKDD-2001.Berlin:Springer,2001[13]G Schohn,D Cohn.Less is more:Active l earning w ith supportvector machines.In:Proc of the17th Int'l Conf on M achineLearning.S an Francisco:M organ Kaufmann,2000.839-846 [14]C Campbell,N C ristianini,A Smola.A query learning w ithlarge margin class ifiers.In:Proc of the17th Int'l Conf onM achine Learning.San Francisco:M organ Kaufmann,2000.111-118[15]C Tohompson,M E Califf,R M ooney.Active learning fornatural language parsing and information extraction.In:Proc ofthe16th Int'l Conf on M achine Learning.S an Francisco:M organ Kaufmann,1999.406-414[16]H S Seung,M Opper,H Sompolinsky.Query by committee.Annual Workshop on Com putational Learning Theory,Pittsbu rgh,Penns ylvania,United S tates,1992[17]N Abe,H M amitsuka.Query learning strategies using boostingand bagging.In:Proc of the15th Int'l Conf on M achineLearning.S an Francisco:M organ Kaufmann,1998.1-10 [18]P M el ville,R J M ooney.Divers e ensembles for active learning.In:Proc of the21th Int'l C onf on M achine Learning.SanFrancisco:M organ Kaufmann,2004[19]P M elville,S M Yang,M Saar-Tsechansky,et al.Activelearning for probabil ity estimation using Jensen-Shannondivergence.The16th European Conf on M achine Learning,Porto,Portugal,2005[20]F Pereira,N Tishby,L Lee.Distributional clustering of Englishw ords.In:Proc of the31st ACL.M orristow n,NJ,USA:Association for Computational Linguistics,1993303龙 军等:主动学习研究综述[21]N Roy,A M cCallum.Toward optimal active learning throughsam pling estimation of error reduction.In:Proc of the18thInt'l Conf on M achine Learning.S an Francisco,CA:M organKaufmann,2001.441-448[22]S Tong,D Koll er.Active learning for parameter estimation inBayesian netw orks.In:Proc of Advances in Neural InformationProcessing Systems.Cambridge,M A:M IT Press,2000.647-653[23]M Lindenbaum,S M arkovitch,D Rus akov.Sel ective s ampl ingfor nearest neighbor classifiers.M achine Learning,2004,54(2):125-152[24]Y Baram,R El-Yaniv,K Luz.Online choice of active learningalgorithm.In:Proc of the20th Int'l Conf on M achineLearning.San Francisco:M organ Kaufmann,2003[25]H T Nguyen,A Smeulders.Active learning us ing pre-cl ustering.T he21st Int'l Conf on M achine Learning,Banff,Canada,2004[26]N S aunier,S M idenet,A Grumbach.S tream-based learningthrough data s election in a road safety appl ication.In:Proc of16th Eu ropean Conf of Artificial Intelligence.Amsterdam:IOSPress,2004.107-117[27]N Cesa-Bianchi,A Conconi,C Gen tile.Learning probabil isticlinear-th res hold classifiers via selective sampling.In:Proc of the16th COLT.Berlin:S priniger,2003[28]S Tong,D Koll er.Support vector machine active learning withapplications to text class ification.Journal of M achine LearningResearch,2001,2:45-66[29]S Tong,E Chang.S upport vector machine active learning forimage retrieval.In:Proc of the9th AC M Int'l M ultimediaConf.New York:ACM Press,2001.107-119[30]M Almgren,E Jons ing active learning in intrusiondetection.In:Proc of the17th IEEE Computer SecurityFoundations Workshop.Washingion,DC:IEEE ComputerSociety Press,2004[31]Y Ab ram s on,Y Freund.Active l earning for visual objectdetection.h ttp:ww Dienst UI2.0Describencstrl.ucs d-cse CS2006-0871,2006[32]C Zhang,T Chen.An active learning framew ork for content-based information retrieval.IEEE Trans on M ultimedia,2002,4(2):260-268[33]R S ingh,N Palmer,D Gifford,et al.Active learning forsampling in time-s eries experiments w ith application to geneexpression anal ysis.The22nd Int'l Conf on M achine Learning,Bonn,Germany,2005[34]C M onteleoni.Efficient algorithm s for general active learning.The19th Annual Conf on Learning Theory,Pittsbu rgh,PA,USA,2006 龙 军 男,1978年生,博士研究生,主要研究方向为主动学习、安全. 殷建平 男,1964年生,教授,主要研究方向为计算理论、机器学习、无线传感器网络. 祝 恩 男,1976年生,讲师,主要研究方向为指纹识别. 赵文涛 男,1975年生,副教授,主要研究方向为计算机网络.304计算机研究与发展 2008,45(增刊)。