基于路径选择的层次多标签分类

合集下载

人工智能之模式识别_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

人工智能之模式识别_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

人工智能之模式识别_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.采用非线性激活函数可以实现感知器解决非线性分类问题。

参考答案:错误2.下列关于最大池化的说法中错误的是?参考答案:LeNet采用的是最大池化方法3.填充树法由顶向底的方法和由底向顶填充相反。

参考答案:正确4.语言可以是无限的但是句子必须是有限的。

参考答案:正确5.文法是由下列哪些参数构成的?参考答案:起始符S_终止符V_T_非终止符V_N_产生式P6.感知器算法应用什么方法求解准则函数的最优值?参考答案:梯度下降法7.下列关于对比散度算法的说法中错误的是?参考答案:深度信念网中多层受限玻尔兹曼机同时通过对比散度算法完成预训练8.下列选项中,属于模式识别系统的环节是?参考答案:分类器训练_模式采集_分类决策_预处理与特征生成9.分类器函数的VC维h越大,将使下列选项中的哪些数据发生变化?参考答案:置信风险越大_结构风险越大_分类器泛化能力越差10.利用SVM将低维空间中的非线性问题映射到高维空间,存在哪些问题?参考答案:不确定需要映射到多少维的空间上,非线性问题才会转化为线性问题_如何找到合适的映射函数φ_增加计算量,可能会因为维数灾难无法解决11.本课程中介绍的与句法模式识别相关的基本概念有?参考答案:字母表_句子(链)_文法_语言12.下列选项中属于贝叶斯分类器的特点的是?参考答案:分类决策存在错误率_先验概率已知,以新获得的信息对先验概率进行修正13.贝叶斯分类器的训练,是从样本集数据中估计出____。

参考答案:类条件概率_先验概率14.下列选项中属于特征降维的优点的是?参考答案:降低模式识别任务的复杂度_提升分类决策的正确率_用更少的代价设计出更加优秀的模式识别系统15.下列说法中正确的是?参考答案:聚类结果受特征选取和聚类准则的影响_数据聚类没有预先分好类的样本集_聚类结果受各特征量纲标尺的影响_数据聚类没有已知的分类决策规则16.设计一个组合分类器需要满足什么要求?参考答案:每个基分类器的训练集和训练结果要有差异_组合分类器需要重点考虑方差和偏差_基分类器的分类正确率大于50%17.下列选项中属于决策树分类器的特点的是?参考答案:需选择分支后两个子节点纯度最高的特征作为一个节点的测试特征_速度快,分类决策规则明确_未考虑特征间的相关性_有监督学习方法18.下列选项中属于Adaboost算法的特点的是?参考答案:异常数据(离群点)影响大_不易实现并行化训练_只能解决二分类问题_算法的组合过程能减小偏差19.下列选项中属于反馈型神经网络的是?参考答案:Hopfield网络_受限玻尔兹曼机20.调节以下哪些部分可以对神经网络的性能造成影响?参考答案:权值_激活函数_隐层单元_阈值21.下列选项中关于前馈网络和反馈网络的说法中正确的是?参考答案:前馈网络输出不作用在网络的输入中_前馈网络为静态网络_反馈网络下一时刻的输出与上一时刻的输出有关_反馈网络为动态网络22.下列选项中属于BP网络的不足的是?参考答案:容易陷入局部极小值_全连接网络计算大_隐层神经元数量难以确定_无法做到深度很深,会产生梯度消失23.下列选项中属于深度学习的特点的是?参考答案:需要大量样本进行训练_逐层抽象,发现数据集的特征_是层数较多的大规模神经网络_需要大规模并行计算能力的支持24.利用链式求导法则需要哪些信息?参考答案:损失函数与网络输出向量之间的函数关系_激活函数输出对净激励的导数25.深度信念网不能用于图像识别的原因是?参考答案:深度信念网为一维向量输入,不能直接用于二位图像_需要进行认知-重构的双向计算,学习速度不够快_受限玻尔兹曼机的层间全连接,权值数量太多26.Jp作为类内、类间可分性的概率距离度量时应该满足下列选项中哪些条件?参考答案:当两类完全不可分时,Jp等于0_当两类完全可分时,Jp取得最大值27.特征选择的算法包括以下哪些?参考答案:分支定界法_顺序后退法_穷举法_顺序前进法28.特征降维的方法包括特征选择和特征提取。

融合多尺度通道注意力的开放词汇语义分割模型SAN

融合多尺度通道注意力的开放词汇语义分割模型SAN

融合多尺度通道注意力的开放词汇语义分割模型SAN作者:武玲张虹来源:《现代信息科技》2024年第03期收稿日期:2023-11-29基金项目:太原师范学院研究生教育教学改革研究课题(SYYJSJG-2154)DOI:10.19850/ki.2096-4706.2024.03.035摘要:随着视觉语言模型的发展,开放词汇方法在识别带注释的标签空间之外的类别方面具有广泛应用。

相比于弱监督和零样本方法,开放词汇方法被证明更加通用和有效。

文章研究的目标是改进面向开放词汇分割的轻量化模型SAN,即引入基于多尺度通道注意力的特征融合机制AFF来改进该模型,并改进原始SAN结构中的双分支特征融合方法。

然后在多个语义分割基准上评估了该改进算法,结果显示在几乎不改变参数量的情况下,模型表现有所提升。

这一改进方案有助于简化未来开放词汇语义分割的研究。

关键词:开放词汇;语义分割;SAN;CLIP;多尺度通道注意力中图分类号:TP391.4;TP18 文献标识码:A 文章编号:2096-4706(2024)03-0164-06An Open Vocabulary Semantic Segmentation Model SAN Integrating Multi Scale Channel AttentionWU Ling, ZHANG Hong(Taiyuan Normal University, Jinzhong 030619, China)Abstract: With the development of visual language models, open vocabulary methods have been widely used in identifying categories outside the annotated label. Compared with the weakly supervised and zero sample method, the open vocabulary method is proved to be more versatile and effective. The goal of this study is to improve the lightweight model SAN for open vocabularysegmentation, which introduces a feature fusion mechanism AFF based on multi scale channel attention to improve the model, and improve the dual branch feature fusion method in the original SAN structure. Then, the improved algorithm is evaluated based on multiple semantic segmentation benchmarks, and the results show that the model performance has certain improvement with almost no change in the number of parameters. This improvement plan will help simplify future research on open vocabulary semantic segmentation.Keywords: open vocabulary; semantic segmentation; SAN; CLIP; multi scale channel attention 0 引言識别和分割任何类别的视觉元素是图像语义分割的追求。

分类预测的算法

分类预测的算法

分类预测的算法分类预测算法是一种常见的机器学习算法,它在数据分析和预测中具有广泛应用。

分类预测算法的目的是在给定数据集的情况下,将其分成多个类别或标签,以便对未来的数据进行准确预测。

本文将介绍一些常见的分类预测算法,并提供一些应用示例和实践指南。

一、常见分类预测算法1.决策树算法决策树算法是一种常见的分类预测算法。

它使用树形结构来表示所有可能的决策路径和结果。

在分类问题中,决策树通过将数据分成不同的区域来确定最终分类结果。

它的优点是易于实现,并且能够处理各种不同的数据类型。

2.支持向量机算法支持向量机算法是一种基于统计学的分类预测算法。

它尝试找到一条最优直线或超平面,将不同的数据点分为两个或更多个类别。

它的优点是具有良好的鲁棒性和分类性能。

3.朴素贝叶斯算法朴素贝叶斯算法是一种概率分类预测算法。

它使用贝叶斯公式来预测未来的数据。

该算法假设所有特征之间相互独立,从而简化了计算难度。

它还可以有效地处理大型数据集。

4.神经网络算法神经网络算法是一种基于生物神经系统工作原理的分类预测算法。

它使用大量的神经元来模拟人脑的功能,对多维数据进行复杂的分类和预测。

该算法的优点是可以从数据中自动学习特征,并且适用于大型高维数据集。

二、分类预测算法的应用示例分类预测算法在实际应用中有很多应用场景,以下是一些示例:1.医疗诊断预测分类预测算法可以用于医疗领域中的疾病预测和诊断。

例如,可以使用朴素贝叶斯算法来预测患有特定疾病的人的概率。

医生可以根据预测结果为患者进行进一步的检查和治疗。

2.金融风险分析分类预测算法可以用于金融领域中的风险分析。

例如,可以使用支持向量机算法来预测贷款违约的风险。

这种预测可以帮助银行减少贷款违约的风险,保护自身的财产安全。

3.商品推荐分类预测算法可以用于电子商务平台中的商品推荐。

例如,可以使用神经网络算法来分析用户的浏览和购买历史,预测用户感兴趣的商品类型,并将相关商品推荐给用户。

三、分类预测算法的实践指南在使用分类预测算法时,以下是一些实践指南:1.选择合适的算法不同的分类预测算法适用于不同类型的数据集。

高职文化的生成-制约因素及路径选择

高职文化的生成-制约因素及路径选择

高职文化的生成:制约因素及路径选择摘要:在追求高职教育可持续发展的今天,高职文化的生成成为人们不断反思的焦点之一,因此要探寻高职文化的立足之基和凝练之途。

其路径选择在于:遵循经济社会发展规律,寻求高职文化不断生长的空间;凝练高职理念,彰显以技术文化为内核的高职文化;在尊重生命成长的高职文化生成中凸显技术人文特色;在遵循技能人才成长规律的校企合作中实现校企文化的互鉴互济。

关键词:高职文化;内涵;制约因素;路径选择一、高职文化的内涵高职文化是一种独特的学校文化,它是以社会文化为背景,以校园为主要活动空间,以学校师生员工为主体,以独特的高职学校生活方式为特征,经过师生的传承和创造,不断孕育并形成的独特办学理念、价值方式、道德规范、历史传统、组织制度、物质环境等精神和物质成果,是学校精神和生命力的象征,在高职人才培养和生存发展中发挥着统领作用。

高职文化具体可分为精神文化、制度文化、物质文化、行为文化等层次。

其中,精神文化是核心,物质文化是基础,制度文化是保障,行为文化是方式。

高职文化的独特性在于:除具有一般大学文化的“自由独立、崇尚理性、人文关怀”基本特点外,还表现为“职业情怀、务实致用、能力为本、开放协作”的独特内涵[1],表现出高等性、职业性、技术性、实践性和开放性等交相融合的特征。

在实际运用中,我们至少需要把握以下3个问题:其一,高职文化不等同于高职校园文化。

一般情况下,高职校园文化主要指学生的课外活动、社团组织、第二课堂和校园氛围等内容,较多停留在空间活动层面;而高职文化除此之外,还包括课程文化、管理文化、教师文化、学生文化、历史传统、院校精神等内容,涉及历史、心理、制度等层面,内涵更为丰富。

其二,要在社会的整全视野中看待高职文化。

高职文化作为社会文化中的一种亚文化,与政治、经济及文化的发展密切联系。

其三,要从与企业文化对接、碰撞、交融中推动高职文化的生成和发展,但绝不能用企业文化替代高职文化。

陈向明:初识扎根理论,再识“一切都是数据”

陈向明:初识扎根理论,再识“一切都是数据”

陈向明:初识扎根理论,再识“⼀切都是数据”初识“扎根理论”最早接触“扎根理论”这个概念是在1988年,当时我刚开始在哈佛⼤学读博⼠,质性研究课程的必读书中就有Glaser和Strauss的《扎根理论之发现:质性研究的策略》 (1967) (以下简称《扎根理论之发现》) 以及Strauss和Corbin的《质性研究基础——扎根理论的程序和⽅法》 (1990)。

我虽然做了⼏项质性研究课题,也对原始资料进⾏了系统的编码和理论建构,但对“扎根理论”这个概念及其使⽤⽅法并⽆清晰的理解和应⽤能⼒。

1995年,我回到北京⼤学教质性研究这门课,在教学和做实证研究(empirical research)的过程中,也经常提到“扎根理论”这个概念,但应⽤它的范围⽐较窄,基本停留在⾃下⽽上开放编码的层次。

⾃2011年起,我和⼏位同事⼏乎每年都在北京⼤学开设“质性研究⽅法与社会科学研究”暑期学校。

课程开到⼀定阶段之后,⼤家感觉内容需要聚焦,于是决定先对扎根理论进⾏系统的介绍和操练,因为它相⽐质性研究中的其他路径(民族志、现象学、个案研究、叙事探究、话语分析等)更为基础,更容易上⼿,也更好教。

为了获得对扎根理论基本⼀致的认识,我们教学团队组织了⼀个⼩型读书会,系统地研读扎根理论的经典著作,包括了解Glaser与Strauss之间的学术之争以及Charmaz对⾃⼰的两位⽼师的超越。

⾄此,我们感觉对扎根理论终于有了⼀个⽐较全⾯、系统的了解。

扎根理论可以被定义为:⼀套逻辑⼀致的“发现”理论的资料收集和分析程序(Glaser and Strauss,1967),是能够捕捉和概念化社会环境中潜在模式的⼀种研究路径(approach)。

其要义可以被总结为:研究的⽬的是⽣成理论,⽽理论必须来⾃经验资料(empirical data);研究是⼀个针对现象系统地收集和分析资料,从资料中发现、发展和检验理论的过程;研究结果是对现实的理论呈现,通过系统的资料收集和分析程序⽽发现的理论被称为“扎根理论”(Glaser and Strauss,1967)。

年国家开放大学电大《物流信息技术》题库及答案

年国家开放大学电大《物流信息技术》题库及答案

年国家开放大学电大《物流信息技术》题库及答案1.20世纪80年代,各国相继制定广各自行业或间家EDI标准,其中(美国)制定的ANSI_12国家标准最具代表性。

2.3G 物流配送监控的功能一般包括(车辆跟踪、路线的规划和导航、指挥调度、信息查询、紧急救援)。

3.3G 物流配送系统可以实现对车辆等物流配送工具的即时监控和调度。

其中 3G 指的是(GPS、GIS、GSM)。

4.DSS 是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决半结构化和非结构化决策问题的信息系统。

5.EDI(语义语法)标准是 EDI 技术标准的核心。

6.EDI 不同用户的计算机应用系统之间通过通信网络直接进行电子报文的互相交换与传递。

这种方式称为(直接方式)。

7.EDI 的标准包括 EDI(网络通信标准、处理标准、联系标准、语义语法标准)等。

8.EDI 的关键技术有(通信技术、标准化技术、安全保密技术、计算机数据处理技术 9.EDI 就像我们今天使用电话一样,成为未来人们工作中不可缺少的重要工具。

10.EDI 涉及各部门和各行业,它并非只是简单地在两个贸易伙伴之间的通信,也不只是自己业务部门之间的通信,而是必须把相应的业务,例如,海关、商检、金融、保险、交通运输部门联在一个 EDI 网络之内。

11.EDI 是一套报文通信工具,它利用计算机的数据处理和通信功能,将交易双方彼此往来的文档(如询价单或订货单等)转成标准格式,并通过通信网络传输给对方。

12.EDI 网络的拓扑结构分为(集中式、分布式、分布集中式)。

13.EOS 推广的关键因素包括(商品数据库、企业公共代码、商品代码、公共数据库、EOS 增值网支持服务)。

14.EOS 系统是(许多零售店+许多批发商)组成的大系统的整体运作方式。

15.EOS 系统有利丁提高企业物流信息系统的效率,使各个业务信总子系统之间的数据交换更加便利和迅速,丰富企业的经营信息。

物联网技术概论智慧树知到答案章节测试2023年

物联网技术概论智慧树知到答案章节测试2023年

第一章测试1.下面不属于电子钱包的是 A:支付宝花呗 B:支付宝 C:微信零钱 D:银行信用卡答案:D2.能够实现身临其境的技术是 A: AR B: 均不是 C: VR D: VR和AR 答案:D3.基于RFID技术的唯一编码方案,即产品电子编码(Electronic ProductCode,EPC)是由如下结构的哪家最早提出 A:麻省理工学院 B:西安交通大学 C:斯坦福大学 D:哈佛大学答案:A4. 2009年8月7日,温家宝总理在无锡微纳传感网工程技术研发中心视察并发表重要讲话,提出了 A:感知中国 B:物联中国 C:工业4.0 D:中国制造2025 答案:A5. 2015年3月5日,李克强总理在全国两会上作《政府工作报告》时首次提出 A:中国制造2025 B:感知中国 C: 工业4.0 D:物联中国答案:A6.下面不属于大数据的5V特点的是 A:Variety(多样) B:Velocity(高速)C:Volume(大量) D:Verifiable(可验证)答案:D7.RFID系统中,无源标签的能耗从何而来 A:磁场 B:电池 C:振动 D:光照答案:A8.中国智能制造的典型创新性成果包括 A:空中造楼机 B:隧道掘进机 C:穿隧道架桥机 D:其它选项都是答案:D9.云计算的三种部署形式,下面不属于的是 A:混合云 B: 公有云 C:私有云 D:服务云答案:D10.云计算按服务类型可以分为三类,下面不属于的是 A:平台即服务PaaS B:应用即服务(AaaS) C:软件即服务SaaS D:基础设施即服务IaaS 答案:B第二章测试1.下面不属于物联网3C融合技术范畴的是 A: communication B: commerceC: computing D: control 答案:B2.物联网常用的短距离无线通信技术包括 A:ZigBee B:WiFi C:GPS D:RFID 答案:A3.物联网工程专业的核心知识体系中,下面不属于“计算与平台”的是 A:云计算 B:分布式计算 C:机器学习 D:并行计算答案:C4.在信息大类招生环境下,“物联网技术原理”课程覆盖的知识领域通常不包括A:标识与感知 B:概念与模型 C:通信与定位 D: 安全与隐私答案:D5.下面不属于物联网感知技术的是 A:二维码 B:蓝牙 C:GPS D:摄像机答案:B6.下面不属于物联网通信技术的是 A:RFID标签技术 B:传感网技术 C:互联网技术 D:微波通信技术答案:A7.目前流行的智能手机的计步功能主要通过如下传感器实现 A: 光 B: 温度 C: 声音 D:加速度答案:D8.支付宝地铁支付主要是基于____技术实现的。

【计算机研究与发展】_多属性_期刊发文热词逐年推荐_20140727

【计算机研究与发展】_多属性_期刊发文热词逐年推荐_20140727

推荐指数 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2007年 序号 1 2 3 4 5 6 7 8 9
科研热词 移动agent 控制关系 拍卖 市场分析 安全 多属性拍卖 多agent系统 knn agent
2005年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
科研热词 路由算法 路径表达式 访问控制 角色匹配 规范化 联合授权 群通信 群体对抗 索引 时态数据库 时态函数依赖(tfd) 数据库设计 搜索 对等网络 学习速率 多级交换网络 函数依赖(fd) 再励学习 兴趣域 元数据 信任管理 xml mas dtd 3d torus
2011年 科研热词 推荐指数 互信息 2 集对分析 1 隐藏数据库 1 隐私 1 链接重要性 1 道路网络 1 语义相似度 1 背景知识攻击 1 线性多秘密共享方案 1 类标号关系 1 空间数据库 1 科研合作网络 1 概率数据库 1 条件随机场 1 机器学习 1 机会网络 1 最优路径查询 1 无线传感器网络 1 数据融合 1 数据提取 1 数据挖掘 1 数值型敏感属性 1 应用π 演算 1 并发进程 1 密钥策略属性基加密 1 安全性分析 1 多类标号分类 1 多属性最近邻查询 1 多属性值接口 1 基于身份的加密 1 基于社会上下文的路由 1 同质性攻击 1 可信计算 1 可信平台模块 1 双线性对 1 动态链接预测 1 功能性函数 1 功能加密 1 分簇算法 1 关键字可搜索的公钥加密算法 1 信誉度 1 信息抽取 1 不确定性数据 1 top-k元组 1 l-多样性 1 k-匿名 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2017-11-04摇摇摇摇摇摇修回日期:2018-03-13摇摇摇摇摇摇网络出版时间:2018-05-16基金项目:2015年教育部-中国移动科研基金项目(5-10);江苏省自然科学基金面上项目(BK20171447);江苏省高校自然科学研究面上项目(17JKB520024)

作者简介:张春焰(1992-),男,硕士,研究方向为数据挖掘;李摇涛,通讯作者,博士,美国佛罗里达国际大学正教授,研究方向为数据挖掘、机器学习和信息检索及生物信息学等。网络出版地址:http://kns.cnki.net/kcms/detail/61.1450.TP.20180515.1645.016.html

基于路径选择的层次多标签分类张春焰,李摇涛,刘摇峥(南京邮电大学计算机学院,江苏南京210046)

摘摇要:多标签分类为每一个实例分配多个标签,当这些标签存在一种预定义的层次化结构时,该机器学习任务称为层次多标签分类(HMC)。传统的分类问题(二分类和多标签分类)往往会忽略各标签之间的结构关系,而层次多标签分类充分考虑标签集之间的层次结构关系,并以此来提高分类的效果。层次多标签分类是输出结构化预测结果的分类任务,其中类标签被组织成某种预定义(树形或者有向无环图)的结构,并且一个实例可以属于多个类。在HMC中有基于全局标签集的分类方法和基于单个标签的局部分类方法。全局方法将整个问题作为一个整体来处理,但往往会随着数据集的增长而出现性能瓶颈,而局部方法将问题分解为基于单个标签的二分类方法,但未充分考虑层次结构信息,并且无法处理预测节点终止于层次标签树内节点的分类问题。在分类阶段,修剪掉概率较低的分支,达到预测标签不一定到达叶子节点的目的。基于路径选择的层次多标签分类充分考虑修剪后的层次标签树从根节点出发的所有可能路径,结合各节点的预测概率值和节点所在的层次来选出得分最高的标签路径。该方法和现有的层次多标签分类方法在三种不同的数据集上进行实验对比,结果表明该方法在处理层次较深且叶子节点稠密的层次结构时获得了较好的结果。关键词:层次多标签分类;多标签学习;路径选择;层次分类;文本分类;层次标签树;剪枝中图分类号:TP181摇摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇文章编号:1673-629X(2018)10-0037-07doi:10.3969/j.issn.1673-629X.2018.10.008

HierarchyMulti-labelClassificationBasedonPathSelection

ZHANGChun-yan,LITao,LIUZheng(SchoolofComputerScience,NanjingUniversityofPostsandTelecommunications,Nanjing210046,China)

Abstract:Multi-labelclassificationassignsmorethanonelabelforeachinstancewhenthelabelsareorderedinapredefinedstructure.Thetaskiscalledhierarchicalmulti-labelclassification(HMC).Traditionalclassificationproblems(binaryclassificationandmulti-la鄄belclassification)tendtoignorethestructuralrelationshipbetweenthelabels,andhierarchicalmulti-labelclassificationtakesfullaccountofthehierarchicalrelationshipbetweenthelabelsets,thusimprovingtheclassificationeffect.HMCisataskofstructuredoutputpredic鄄tionwheretheclassesareorganizedintoahierarchyandaninstancemaybelongtomultipleclasses.Thehierarchystructurethatorgani鄄zesthesetofclassescanassumetheformofatreeorofadirectedacyclicgraph(DAG).InHMCthereareglobalandlocalapproaches.Globalapproachestreattheproblemaswholebuttendtoexplodewithlargedatasets.Localapproachesdividetheproblemintolocalsub鄄problems,butusuallydonotexploittheinformationofthehierarchy.Thehierarchicalmulti-labelclassificationbasedonpathselectionstudiestheproblemthattheclassificationlabeldoesnotreachtheleafnodeofthelabeltree.Intheclassificationphase,thebrancheswithlowprobabilitytooccurarepruned,performingnon-mandatoryleafnodeprediction.Thismethodevaluateseachpossiblepathfromtherootofthehierarchy,takingintoaccountthepredictionvalueandthelevelofthenodes,selectingoneormorelabelpathswhosescoreisaboveathreshold.Ithasbeentestedinthreedatasetswithtreehierarchystructuredhierarchiesagainstanumberofstate-of-the-artmethods.Theexperimentshowsthatthismethodcanobtainsuperiorresultswhendealingwithdeepandpopulatedhierarchies.Keywords:hierarchicalmulti-labelclassification;multi-labellearning;pathselection;hierarchicalclassification;textclassification;hier鄄archicallabeltree;pruning

第28卷摇第10期2018年10月摇摇摇摇摇摇摇摇摇摇计算机技术与发展COMPUTERTECHNOLOGYANDDEVELOPMENT摇摇摇摇摇摇摇摇摇摇Vol.28摇No.10Oct.摇20180摇引摇言层次分类(hierarchicalclassification,HC)问题是分类问题的一个分支,在层次分类问题中类别是不相交的,而是以分层结果组织的。在该情况下,一个样本会与给定的类别标签及该标签的父标签相关联,而组织类的层次结构可以采用树或者有向无环图(directedacyclicgraph,DAG)的形式。存在复杂HC问题的子集,其中每个样本可以与类层次结构中的多个路径相关联,即层次多标签分类(HMC)[1-3]。典型的HMC问题是文本分类[4-6]和生物信息学任务,如蛋白质功能检测[7-8]、图像分类[9-12]等。HMC算法一般通过优化局部或者全局的损失函数来选择层次标签树上一条或者多条路径以标示实例[13]。执行局部学习的算法尝试挖掘类层次结构的区域特征,然后将预测结果进行组合得到最终分类结果。而基于全局的方法往往由单个分类器组成,并且能够一次性找出实例相关联的类标签。传统的分类任务主要解决的是一个样本e只会对应于单个标签y沂L的问题,其中L是标签的集合,标签的数量大于等于二,即通常所说的多类分类。然而,有些分类问题会更加复杂,因为一个样本可以对应多个标签。一个多标签数据集D由N个样本组成,每一个样本会对应一个标签集合Y,其中Y沂L。当这些标签之间存在某种预定义的结构(树形或者有向无环图)时,该任务称为层次多标签分类。树形结构与有向无环图的主要区别在于图形结构中一个节点可以有多于一个的父节点,为了简化问题,文中只考虑树形层次结构。基于局部分类方法,在层次结构中的每一个标签节点训练一个分类器的基础上提出新的HMC方法,通过分解问题来达到层次多标签分类。对比之前的层次多标签分类方法,该方法的主要改进有以下几点:·为层次树的节点加权,使得每个节点标签分类错误的权重随着层次标签树层次的下降而衰减。·通过组合各节点的概率值和节点在路径中的位置,对所有可能的预测路径进行打分,从而选出最佳路径,即预测标签集。·通过在寻找最优的预测路径之前对层次树进行裁剪,解决预测路径不在层次树叶子节点终止的层次多标签分类任务,即最具体的类别并未到达叶子节点。对层次标签树进行裁剪可以抛弃那些在真实标签集中不大可能出现的分支,减少了计算量和潜在的错误。1摇相关工作在HMC任务中,属于某个类的示例自动属于这个类的所有超类(层次约束)。这里有两种预测结果[1]:强制性叶节点预测,返回的是从根节点到叶子节点的完整路径;非强制性叶节点预测,预测出来的路径可能未到达叶子节点。HMC根据其用于解决分类问题的探测策略进行

分类,其中比较常见的方法为:直接法、全局法、自顶向下。直接法的分类策略借鉴于传统的多标签分类,只能预测层次树中的叶子节点,预测出一个叶子节点则到达该叶子节点路径上的所有节点都被标记为正,该方法有一个显著的缺点是完全忽略了标签之间的层次关系。然而,这种简单的分类策略必须解决的是,需要训练一个分类器来区分一个庞大的目标标签集(所有叶子节点),并且没有利用标签集提供的层次关系。当然,这种方法只能预测层次树中的叶子节点,所以对于非强制性叶节点的数据集也就无能为力。全局方法对标签集中的所有类学习一个单一的模型来预测层次树中的所有类,例如,对于一个深度为3的二叉树,总共有14个非叶子节点和叶子节点,所以基于全局的分类方法需要训练一个针对14个标签的分类器。该分类算法生成的模型在一次运行期间考虑了类层次结构上所有的类标签。基于全局方法的主要限制是随着数据集的增大,模型会过于复杂并且训练模型会花费大量时间。该方面已有不少研究成果,Vens[13],Blockeel

相关文档
最新文档