音乐流派分类特征算法

合集下载

基于算法的音乐流派自动识别研究

基于算法的音乐流派自动识别研究

基于算法的音乐流派自动识别研究随着互联网技术的日益发展和音乐产业的不断成熟,音乐流派自动识别技术已经成为了一个备受关注的研究领域。

尤其是在音乐推荐和分类方面,这项技术已经被广泛应用。

本文将探讨基于算法的音乐流派自动识别研究的技术背景、目前研究状况以及未来的发展趋势。

一、技术背景人们在享受音乐的过程中,常常需要对音乐流派进行分类,而音乐流派可以根据不同的音乐元素进行划分。

比如,摇滚乐、古典音乐、流行音乐、电子音乐等音乐类型,它们的音乐元素各不相同。

在理解音乐或者寻找自己喜欢的音乐风格时,对音乐流派的理解和分类显得尤为重要。

传统的音乐分类方法需要依赖专业的音乐人士进行听辨、识别和分类,这种方法需要大量时间和精力,并且难以实现规模化的音乐分类。

而基于算法的音乐流派自动识别技术则可以解决这个问题,它可以对海量的音乐进行自动分类和标记,使音乐分类的过程更加高效和自动化。

二、目前研究状况目前,基于算法的音乐流派自动识别技术已经得到了广泛的应用。

从技术上来说,音乐流派自动识别技术主要包括两个方面:音乐特征提取和音乐分类模型。

1. 音乐特征提取音乐特征提取是指将原始的音频信号转换为一组可以表达音乐信息的数字特征。

这些数字特征包括音高、节奏、频谱、能量、谐波等等。

对于不同的音乐流派,其特征也有所不同。

因此,特征提取的质量和准确度对于音乐流派自动识别来说至关重要。

目前,常用于特征提取的算法包括短时傅里叶变换(Short-time Fourier transform,STFT)、小波变换(Wavelet)和梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs)等。

2. 音乐分类模型音乐分类模型是指基于特征提取的数字特征,通过机器学习算法进行分类。

机器学习算法可以根据不同的音乐特征进行分类,如支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、神经网络(Neural Network)等。

流行音乐的几种风格特点

流行音乐的几种风格特点

流行音乐的几种风格流行乐(pop music)流行乐(pop music)是属于流行音乐(Popular music)其中的一个音乐流派,从中期作为替代软摇滚,后来借贷20世纪50年代开发的摇滚音乐发展。

它有一个向商业唱片的焦点,并利用诸如多技术革新多轨录音和数字采样制作其他形式的影响最新变化对现有的主题。

虽然流行音乐(pop music)固定音乐风格仍然相当稳定,但流行音乐(pop music)也吸纳了流行音乐(Popular music) 大部分音乐流派音乐风格,(流行音乐(pop musi c)与流行音乐(Popular music)其他音乐流派如摇滚、Hiphop、乡村乐、民谣、爵士乐等拥有相对稳定音乐风格相比,(pop music)是一种非固定音乐风格流派,即使不是流行音乐(pop music)固定音乐风格,如拥有摇滚乐、Hiphop、乡村乐、民谣、爵士乐多种音乐风格的歌手也可以归类为为流行音乐(pop music)歌手。

术语“流行曲”是第一个被记录在1926年用在一首乐曲,具有流行的上诉“感”。

在20世纪50年代开始“一词流行音乐”已被用来形容一个独特的风格,针对青年市场,往往被视为一种替代软摇滚的特点。

新格罗夫音乐词典和音乐家定义为“从50年代末已用于向中央和长期流行最广为流传的各种流行音乐...20世纪80年代涌现出像迈克尔杰克逊、王子、麦当娜优秀流行音乐家,不仅商业成就出众而且拥有极高音乐造诣,彻底改变了流行乐坛。

杰克逊著名公益音乐、呼吁世界和平、种族团结,麦当娜以女权、性解放,对当今流行音乐主题以及全球流行文化产生巨大影响。

迈克尔杰克逊开创现代MTV,打破白人垄断的流行音乐界,把当时还处于亚文化黑人音乐推向主流世界,为后代的黑人艺人铺下了光明大道。

在那个黑人和白人观众都只知道坚守着自己一贯的聆听习惯而不肯相互欣赏的年代,是杰克逊让这些坚守自己小圈子的人们走到了一起。

他的音乐和唱腔,不仅影响流行歌手、同时也影响无数摇滚、R&B、hip hop艺术家。

音乐曲风的分类

音乐曲风的分类

音乐曲风的分类1.R&B(Rhythm and Blues)起源于20世纪,B.P.M约在80至100拍,中文翻译成:“节奏布鲁斯或节奏蓝调”。

它原是一种在黑人生活圈中流行的音乐。

最早R&B是Bl-ues和Jazz的混合体,是从较慢的舞蹈转向节奏舞蹈的雏形音乐。

R&B重点体现了显著的节奏或节拍,另外它的旋律也交代的很清晰,往往听罢给人留下深刻印象。

由于人们优越的物质生活条件以及复古风潮的影响;目前R&B已成为流行乐坛的宠儿,当然现代的R&B又混入了其他音乐的一些元素2.Neo-flok新民谣译音:列尔-佛洛克顾名思义,新民谣当然就是将原本的民谣,加上新的唱腔及新的构成方式,这种风格因TheCranberries(小红莓)的出现而大肆走红。

3.Soul灵魂乐译音:手和节奏蓝调类似的一种风格,主要特色为常使用大量的转音,声音高亢而旋绕,或再加以多部和声,造成一张温暖且浪漫的音网,柔畅谐调交迭盘旋的声音,使得乐器似乎是多馀的。

代表团体为All 4 One、BoysⅡMan。

但K-Ci&jojo有崛起之势。

4.Rap绕舌乐基本上有押韵有节奏用念就念完的「歌」,我们通称Rap(我是不这麽认为啦!),台湾在L.A.BOYZ引进后也大大风行过,因Rap的类型之多,不及备载,只简单说明之,最近在排行榜上大多为Gangsta rap(黑帮绕舌),内容大多和毒品及青少年帮派有关,歌词的脏话也不胜枚举,因此,通常Rap的专辑都会贴上一张由〈美国净化摇滚歌词委员会〉所颁发的黑白贴纸,上面写著「PARENTAL ADVISORY EXPLICIT LYRICS」—父母的忠告歌词明确。

目前最有名的就是Puff Daddy。

4.Hip Hop极炫的街头装。

十几岁的少年,像风一样擦身而过,超炫的身影在钢铁的车流中显得格外轻盈,他们就是滑板车一族。

随着滑板车的风靡,这些街头运动除了给我们的身体以轻盈的借口、飞的感觉外,也使新人类的着装时尚开始与风行20年不衰的国际街头文化接轨了,这就是“HIP-POP”。

音乐流派的多种机器学习模型分类比较

音乐流派的多种机器学习模型分类比较
音乐流派的多种机器学习模 型分类比较
基本内容
基本内容
随着数字技术和大数据的快速发展,机器学习已经在各个领域展现出了巨大 的潜力和价值,包括音乐分类。音乐流派识别是音乐信息检索和推荐系统的重要 部分,它帮助我们根据音乐作品的风格和特征进行分类。本次演示将比较几种主 流的机器学习模型在音乐流派分类任务上的表现。
4、神经网络(Neural Networks)
4、神经网络(Neural Networks)
神经网络是一种模拟人脑工作机制的算法,通过模拟神经元之间的连接和信 号传递过程进行学习和预测。在音乐流派分类中,神经网络可以具有非常复杂的 结构和强大的表示能力,从而在处理复杂的音乐特征和非线性关系时表现出色。 全连接神经网络(Fully Connected Neural Networks, FCNNs)和卷积神经网 络(Convolutional Neural Networks, CNNs)
4、神经网络(Neural Networks)
已被广泛应用于音乐分类任务。另外,循环神经网络(Recurrent Neural Networks, RNNs)和长短期记忆网络(Long Short Term Memory, LSTM)也常 被用于处理时间序列的音乐特征。
5、深度学习(Deep Learning)
5、深度学习(Deep Learning)
深度学习是神经网络的延伸和发展,通过构建多层神经网络进行学习和预测。 在音乐流派分类中,深度学习模型如自动编码器(Autoencoders)、限制玻尔兹 曼机(Restricted Boltzmann Machines, RBMs)和生成对抗网络 (Generative Adversarial Networks, GANs)等已被用于提取音乐特征或者生 成新的音乐作品。深度学习模型通常需要大量的数据和计算资源,但是它们的性 能通常优于传统的机器学习方法。

音乐流派与歌手介绍大全

音乐流派与歌手介绍大全

音乐流派与歌手介绍大全音乐是人类文化的一部分,通过声音和旋律传达情感和思想。

在音乐的世界中,有许多不同的流派和歌手,每一种都有自己独特的特点和风格。

本文将为您介绍一些流行的音乐流派,并介绍一些代表性的歌手。

一、流行音乐(Pop Music)流行音乐是最受欢迎和广泛传播的音乐类型之一。

它通常以简单的旋律、易上口的歌词和多样化的风格而闻名。

在国际流行音乐界,许多年轻的歌手和组合都崭露头角。

例如,美国的泰勒·斯威夫特(Taylor Swift)以其甜美的声音和动听的歌曲而闻名,她的歌曲《Love Story》和《Bad Blood》都获得了广泛的认可。

二、摇滚乐(Rock Music)摇滚乐音乐有着强烈的节奏感和个性化的演唱风格。

它通常由吉他、贝斯、鼓和键盘等乐器组成。

摇滚乐起源于20世纪50年代的美国,现在已经成为全球最受欢迎的音乐流派之一。

在摇滚乐界,有许多具有代表性的歌手,比如英国的皇后乐队(Queen)和美国的布鲁斯·斯普林斯汀(Bruce Springsteen)。

三、爵士乐(Jazz Music)爵士乐作为一种传统的美国音乐形式,以其独特的和弦进行和即兴演奏而受到广泛喜爱。

它融合了非洲、欧洲和拉丁美洲的音乐元素,创造出愉悦而富有活力的音乐体验。

在爵士乐的历史上,有许多伟大的表演者,如美国的迪克西兰德(Dixie Land)、迈尔斯·戴维斯(Miles Davis)和埃拉·费茨杰拉德(Ella Fitzgerald)等。

四、电子音乐(Electronic Music)电子音乐是主要通过电子合成器和电脑技术制作的音乐类型。

它的特点是节奏感强烈、律动感强,并且常常被用在舞蹈俱乐部和派对中。

瑞典的阿维奇(Avicii)是电子音乐领域的重要代表人物之一,他的歌曲《Wake Me Up》和《Levels》都在世界范围内取得了巨大的成功。

五、嘻哈音乐(Hip Hop Music)嘻哈音乐起源于美国的黑人社区,通过饶舌和说唱方式传递社会信息和反抗精神。

音乐欣赏之旅认识不同音乐流派

音乐欣赏之旅认识不同音乐流派

音乐欣赏之旅认识不同音乐流派音乐欣赏之旅:认识不同音乐流派音乐是一种全球通用的语言,它能够超越国界和语言的限制,让人们产生情感共鸣。

在当今多元化的音乐世界中,各种流派展现出不同的风格、节奏和情绪。

本文将带领读者进行一次音乐欣赏之旅,介绍不同的音乐流派,让我们共同领略音乐的魅力。

1. 古典音乐古典音乐源于欧洲,具有丰富的历史背景和经典组曲。

它以交响乐、协奏曲、室内乐等形式呈现。

古典音乐注重和声,曲调优美,展现出深沉和庄重的艺术风格。

在欣赏古典音乐时,我们可以感受到一种高雅和内敛的氛围,它能够激发人们的情感和想象力。

2. 流行音乐流行音乐是一种大众化的音乐形式,主要以歌曲为主,包括摇滚、流行、嘻哈等多种风格。

流行音乐通常采用简单明快的旋律和朗朗上口的歌词,以引发听众的共鸣和情感共振。

它具有极高的流行性和活力,有着广泛的社会影响力。

3. 爵士乐爵士乐起源于非洲裔美国人的音乐传统,与布鲁斯和迪克西兰德乐有着密切的关系。

爵士乐融合了非洲音乐、欧洲古典音乐和拉丁音乐的元素,以其独特的即兴演奏和复杂的节奏而闻名。

爵士乐充满了热情、自由和个性化的特点,展现出音乐家的艺术表达和技巧。

4. 乡村音乐乡村音乐发源于美国南方农村地区,具有朴实、质朴和情感真挚的特点。

乡村音乐多以吉他、琴弦乐器和口琴为主,歌词通常讲述生活故事和情感抒发。

它带给人们一种宁静和温暖的感觉,使人们回归自然,感受到生活的纯粹和美好。

5. 摇滚音乐摇滚音乐是一种强烈而激动人心的音乐形式,它的特点在于电吉他和强节奏的鼓点。

摇滚音乐宣泄了青年的激情和对社会现象的批判,追求自由和反传统。

它具有强大的音量和能量,能够唤醒人们内心深处的激情和冲动。

6. 电子音乐电子音乐利用电子设备和音效器材创造出各种特殊的音效和节奏。

它注重音乐的律动感和迷幻效果,常用于舞蹈派对和夜店场合。

电子音乐富有现代感和科技感,它能够激发人们的热情和舞动欲望。

7. 民族音乐民族音乐是各个国家和地区特有的传统音乐形式,展现了不同文化背景和历史传承。

音乐流派介绍与欣赏大全

音乐流派介绍与欣赏大全音乐是人类普遍喜爱的艺术形式,通过声音和节奏的组合,使人们得到情感的升华和思想的启迪。

在音乐的世界中,有众多的流派,每个流派都有独特的风格和特点。

本文将为你介绍一些主流的音乐流派,以及如何欣赏它们。

流行音乐(Pop Music)流行音乐是指受大众群体喜爱并广泛传播的音乐风格。

它通常采用简单易懂的旋律、直接流畅的歌词和节奏明快的编曲。

流行音乐的魅力在于其吸引人的旋律和朗朗上口的歌词,使人们很容易跟唱和跳动。

古典音乐(Classical Music)古典音乐是欧洲音乐传统中最重要的流派之一。

它强调作曲家自由创作,注重音乐结构和技巧的完美性。

古典音乐通常包含交响乐、协奏曲、室内乐等形式,擅长表达复杂的情感和哲学思考。

欣赏古典音乐时,可以关注音乐的构成和演奏家的技巧,体验它的严谨和典雅。

摇滚音乐(Rock Music)摇滚音乐是二十世纪中叶发源于西方的一种音乐流派。

它以强烈的电吉他、重拍和激情四溢的表演为特点。

摇滚音乐通常能唤起人们的激情和反叛精神,有力地表达了年轻一代的追求自由和真实的态度。

爵士音乐(Jazz Music)爵士音乐是美国黑人创造的一种音乐风格,充满了即兴表演和复杂的和声。

它融合了非洲民族音乐和欧洲古典音乐的元素,具有充满活力和动感的特点。

爵士音乐的欣赏需要一定的耳朵和品味,它能带给人们激情和无限的想象力。

流行电子音乐(EDM)流行电子音乐是近年来非常流行的一种音乐风格。

它通过电子乐器和合成器创造出丰富多样的声音效果,节奏明快且富有张力。

流行电子音乐适合欢快的舞蹈和派对氛围,常被用作夜店和音乐节的背景音乐。

民族音乐(Folk Music)民族音乐是各个国家和地区的传统音乐风格,通常代表着当地的文化和历史。

它包含了各自特定的节奏和调式,表达了民间故事和情感。

欣赏民族音乐时,我们可以通过了解这个民族的历史和文化背景来更好地理解它的内涵。

世界音乐(World Music)世界音乐是综合了多个地区和文化特色的音乐风格。

音乐流派种类

0="Blues";布鲁斯1="ClassicRock";经典摇滚2="Country";乡村3="Dance";舞曲4="Disco";迪斯科5="Funk";疯克6="Grunge";垃圾乐7="Hip-Hop";西哈8="Jazz";爵士9="Metal";金属10="NewAge";新世纪音乐12="Other";其他13="Pop";流行14="R&B"RB15="Rap";饶舌17="Rock";摇滚19="Industrial";工业金属20="Alternative";另类21="Ska";ska22="DeathMetal";死亡金属26="Ambient";氛围流行27="Trip-Hop";triphop28="Vocal";人声29="Jazz+Funk";爵士疯克31="Trance";trance32="Classical";古典33="Instrumental";纯乐器演奏34="Acid";酸性35="House";house舞曲36="Game";游戏乐39="Noise";噪音乐41="Bass";贝斯42="Soul";灵魂乐43="Punk";朋克44="Space";太空乐46="InstrumentalPop";器乐流行47="InstrumentalRock"器乐摇滚49="Gothic";哥特50="Darkwave";暗潮51="Techno-Industrial"技术工业摇滚; 52="Electronic";电子乐53="Pop-Folk";流行民谣54="Eurodance";欧洲舞曲55="Dream";梦幻流行56="SouthernRock";南方摇滚57="Comedy";喜剧乐59="Gangsta";绑匪乐60="Top40";顶级4061="ChristianRap";基督饶舌62="Pop/Funk";流行/朋克63="Jungle"丛林乐64="NativeAmerican";美国土著乐66="NewWave";新浪潮音乐68="Rave";锐舞71="Lo-Fi";低保真73="AcidPunk";酸性朋克74="AcidJazz";酸性爵士78="Rock&Roll";摇滚79="HardRock";硬摇滚/* Extended genres */80="Folk";民谣81="Folk-Rock";民谣摇滚82="NationalFolk";民谣83="Swing";摇摆乐86="Latin";拉丁乐88="Celtic";凯尔特音乐91="GothicRock";哥特摇滚92="ProgessiveRock";激进摇滚95="SlowRock";慢摇96="BigBand";大乐队97="Chorus";合唱99="Acoustic";不插电音乐103="Opera";歌剧104="ChamberMusic";室内音乐112="Club";俱乐部乐Tango";探戈RhythmicSoul";节奏灵魂乐Freestyle";自由乐"PunkRock";朋克摇滚"Euro-House";欧洲house DanceHall";舞厅乐Drum&Bass";鼓与贝丝Hardcore";硬核Terror";恐怖Indie";独立音乐BritPop";英式摇滚"Beat";打击乐"ChristianGangstaRap";基督绑匪饶舌乐"HeavyMetal";重金属"BlackMetal";黑金。

音乐曲库风格流派分类


PART 02
音乐风格流派概述
REPORTING
WENKU DESIGN
音乐风格的定义与特点
音乐风格定义
音乐风格是指音乐作品在旋律、节奏 、和声、音色等方面的整体表现特征 ,反映了不同地域、民族、历史时期 的音乐文化传统和审美取向。
音乐风格特点
各种音乐风格具有独特的旋律形态、 节奏型态、和声构造和音色运用,形 成了丰富多样的音乐表现手法和情感 表达方式。
就。
常见乐器
古典主义音乐中常见的乐器包括 钢琴、小提琴、中提琴、大提琴
等。
浪漫主义音乐
风格特点
浪漫主义音乐起源于19世纪的欧洲,以个性化和情感表达为特点。 它追求音乐的自由、激情和个性化,强调音乐与情感的紧密联系。
代表人物
舒伯特、肖邦、李斯特、瓦格纳等是浪漫主义音乐的代表人物,他 们的作品充满了浪漫主义的情感色彩和个性化表达。
20世纪70年代中期发展起来的 一种摇滚乐,属于后朋克范畴 ,进入80年代以后开始流行。 其代表人物有性手枪、冲撞等 。
是摇滚乐的一个分支,起源于 20世纪的英国和美国。它的分 类包括黑金属、死亡金属、激 流金属、新金属、厄运金属、 华丽金属、重金属、工业金属 等类型。
流行歌曲
流行歌曲
指那些结构短小、内容通俗、形式活泼、情感真挚,并被广大群众所喜爱,广泛传唱或欣赏,流行一时的甚至流传后 世的器乐曲和歌曲。
1 2 3
相互影响
不同的音乐风格流派之间相互影响、借鉴和融合 ,共同推动了音乐艺术的发展和创新。
多样性
音乐风格流派的多样性反映了人类文化的多元性 和音乐艺术的包容性,使得音乐艺术更加丰富多 彩。
传承与发展
音乐风格流派在传承历史文化遗产的同时,也不 断吸收新的元素和创意,实现自身的创新和发展 。

音乐的风格与流派分析

音乐的风格与流派分析音乐作为一种艺术形式,具有丰富多样的风格和流派。

不同的音乐风格和流派代表着不同的文化背景、情感表达和创作风格。

在这篇文章中,我们将探讨一些常见的音乐风格和流派,以及它们的特点和影响。

一、古典音乐古典音乐是西方音乐的一种重要流派,具有丰富的历史和文化背景。

它起源于欧洲,经历了巴洛克、古典和浪漫三个时期的演变。

古典音乐以其严谨的结构、优雅的旋律和复杂的和声而闻名。

著名作曲家如巴赫、莫扎特和贝多芬等都为古典音乐作出了重要贡献。

古典音乐的演奏通常使用交响乐团或室内乐团,以及管弦乐器和声乐。

二、流行音乐流行音乐是当代最受欢迎的音乐风格之一。

它的特点是简单易懂的歌词、流行的旋律和多样化的节奏。

流行音乐通常通过广播、电视和互联网传播,受到大众的喜爱。

流行音乐的风格多种多样,包括摇滚、流行、嘻哈、电子等。

著名的流行音乐艺术家如迈克尔·杰克逊、碧昂斯和艾德·希兰等都在流行音乐领域取得了巨大的成功。

三、爵士音乐爵士音乐是美国独有的音乐流派,起源于20世纪初的黑人社区。

它以其复杂的和声、即兴演奏和独特的节奏感而闻名。

爵士音乐通常使用乐队演奏,包括钢琴、贝斯、鼓和各种铜管乐器。

爵士音乐的代表人物包括路易·阿姆斯特朗、埃拉·费茨杰拉德和迪克西兰德等。

爵士音乐对于现代音乐的发展产生了深远的影响,尤其是对摇滚乐和流行乐的影响。

四、民族音乐民族音乐是各个国家和地区独有的音乐形式,代表着不同的文化和传统。

每个国家和地区都有自己独特的民族音乐,如中国的古筝、印度的印度古典音乐和非洲的部落音乐等。

民族音乐通常通过传统的乐器演奏,以及特定的歌词和舞蹈形式表达。

民族音乐在保护和传承文化遗产方面起着重要的作用,也为世界音乐的多样性做出了贡献。

五、电子音乐电子音乐是近代发展起来的一种音乐风格,以电子乐器和电子设备的使用为特点。

它的特点是节奏强烈、声音效果丰富和创新性强。

电子音乐通常在夜店、音乐节和电影配乐中广泛应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音乐流派分类中特征选择算法研究甄超郑涛许洁萍中国人民大学 信息学院计算机系,北京100872摘 要:在音乐流派的自动分类中引入特征选择环节,不但可以降低特征向量的维数,还可以减少特征向量中的无关和冗余特征,从而提高分类器的工作效率。

本文中我们实现了两种全新的特征选择算法,他们的核心思想是在特征选择的过程中考虑特征间的相互影响以及每个特征对于分类准确率的贡献度。

第一个算法称为基于特征贡献度的特征选择算法(CBFS),该算法通过增减特征的方式计算每个特征对于分类准确率的贡献度,最后选择贡献度比较大的特征作为分类特征子集。

第二个算法称为基于特征间相互影响的前向特征选择算法(IBFFS),它是对原始前向特征选择算法的改进。

IBFFS扩大了前向特征选择的搜索空间,尝试了更多的特征组合,而且没有增加时间复杂度。

最后,我们使用流派数据集George 2002[1]进行实验,两种算法分别得到了81.66%和80.63%的准确率,要明显高于使用其他特征选择算法所得到的分类准确率,由此验证了这两种新特征选择算法的有效性。

关键词:特征选择;CBFS;IBFFS;1.引言随着互联网上音乐资源的迅速增长,使得用来处理音乐数据库的各种多媒体应用系统受到了越来越多的关注,对于音乐数据库进行自动分析是音乐信息检索系统的一个重要组成部分。

目前绝大多数的音乐数据库除了可以根据音乐的名称或者艺术家的名字来建立索引以外,还可以利用音乐的流派信息来建立索引以便于高效的组织海量的音乐数据[2],因为流派是对音乐最为常见的描述信息之一,同时也被人们最为广泛的使用。

音乐流派可以被定义为用于识别音乐风格的类别标签。

对于互联网上的音乐资源来说,流派信息就显得更为重要了,因为音乐流派往往是用户为进行音乐检索而输入的关键词,为此音乐网站就可以根据流派信息来组织存储各种音乐资源。

此外,绝大多数的音乐网站还可以根据用户对特定音乐流派的偏好程度进行相似歌曲的推荐。

目前,绝大多数的音乐网站都是人工地对音乐进行流派分类。

其中,最为成功的就是潘多拉网站聘请音乐专家所进行的“音乐染色体工程(Music Genome Project)”[3]。

虽然人工地对音乐进行流派分类取得了一定的成功,但是这样做既消耗了大量的人力成本,同时也消耗了大量的时间和金钱成本。

而且不同的音乐流派之间并没有严格的边界进行划分,从而导致不同的音乐专家对于音乐流派的理解也是各不相同的,所以当他们对同一段音乐进行标注时很有可能会得到不同的结果。

而更为严重的问题是,如今互联网上音乐资源规资助项目:国家自然科学基金(60873098)联系作者:许洁萍,E-mail:xjieping@多媒体学术会议模的增长是十分迅速的,如果对音乐流派还是仅仅依靠人工标注的话,显然已经不能满足现实的需求。

因此,我们需要一种全新的对音乐进行流派分类的方法。

这就是所谓的自动的音乐流派分类方法。

这种方法借助于计算机的计算能力,从符号化的音频文件 (也就是midi[4]、wav或者mp3[5]格式的文件) 中提取相应的声学特征然后根据这些特征对音乐进行流派分类。

在研究的初期,自动的音乐流派分类方法通常包括以下两个步骤:(1) 基于短时音频帧的特征提取过程,在这个过程中一些描述音乐音色、节奏和音高的底层特征将被计算出来 (2) 使用各种模式识别及分类算法对特征向量进行处理,从而对音乐进行自动的流派分类。

但是随着研究的不断深入,研究学者就发现为了更全面的反映音乐的各种属性,导致从音频文件中提取出的声学特征往往可以达到上百维,如果将这些特征全部引入模式分类的话,很有可能会引起维数灾难,从而影响分类的准确率。

而且在这上百维特征中,既包含相关特征,又存在大量的无关和冗余特征,它们的存在严重地影响了分类器的性能。

因此,我们在对音乐进行特征提取之后引入特征选择环节。

特征选择就是从输入的特征集合中选择使某种评估标准最优的特征子集。

经过特征选择之后,不仅可以降低特征向量的维数还可以去除一些无关和冗余特征,从而提高分类器的工作效率。

因此,特征选择环节对于音乐流派的自动分类有着极其重要的作用,文章[6]通过大量的实验数据有效地验证了这一结论。

2.实验数据2.1 数据集为了将我们的实验结果与前人的研究成果进行比较,我们选取George Tzanetakis等人所使用的数据集George 2002[1]。

在其中我们选取8个音乐流派,分别是Blues(Bl)、Classical(Cl)、Country(Co)、Jazz(Ja)、Metal(Me)、Pop(Po)、Reggae(Re)和Rock(Ro),其中每个流派由100个音乐片段组成,每个片段的长度为30s。

2.2 特征提取根据George Tzanetakis等人的研究结果,对于特征提取过程来讲最常用的声学特征包含三大类,分别用来表示音乐的音色、节奏和音高内容[1]。

在本实验中我们根据开源软件jAudio[7]对上述三类声学特征的数学定义,自己开发特征提取系统对音乐片段进行特征提取以提高特征提取的速度与精度。

实验中我们所用到的声学特征主要包括频谱中心值、衰减截止频率、Mel 倒谱系数、线性预测系数、最强节拍力度等共78维特征。

3.特征选择我们将提出两种全新的特征选择算法,这两种算法分别是基于特征贡献度的特征选择算法(CBFS)和基于特征间相互影响的前向特征选择算法(IBFFS)。

这两个特征选择算法分别第五届和谐人机环境联合学术会议 中国西安考虑了每个特征对于分类准确率的贡献度以及特征之间的相互影响,它们都是利用后续分类算法的错误概率作为自己的评估标准,因此都属于封装器式的特征选择算法。

在本文中,我们选用的分类器是支持向量机(Support Vector Machine)。

3.1 基于特征贡献度的特征选择算法(CBFS: Contribution Based Feature Selection)基于特征贡献度的特征选择算法就是通过增减特征的方法来计算每一个特征的贡献度。

这里的贡献度是某个特征相对于分类准确率而言的。

在本文中,特征f i 的贡献度C(i)可以根据下面的公式(1)计算得到:()[(,)(1,)][(,)(,1)]j i j iC i R i j R i j R j i R j i ≥<=−++−−∑∑ (1)在公式(1)中,R(i,j)表示以第i 维到第j 维特征作为分类特征集合时所得到的分类准确率。

由此,我们可以说某个特征的贡献度就是用包含此特征的集合进行分类所得到的准确率减去用该集合去除该特征再进行分类所得到的准确率。

例如,以第1维特征F1至第3特征F3为分类特征集合的准确率R(1,3)减去以F1至F2为分类特征集合的准确率R(1,2),就可以得到在以F1至F2为分类特征集合时第3维特征F3对分类的贡献。

将所有可能顺序组合的F3的贡献求和,就得到本文中定义的第3维特征F3的贡献度。

根据公式(1),我们对前面所提出的78维声学特征分别计算其贡献度如图1所示:图1 78维特征贡献度分布图从图中我们可以清楚地看到特征的贡献度有正负之分,还可以为零。

当一个特征的贡献度大于0时,意味着将该特征加入到分类特征集合后,往往会对分类准确率有促进作用,在绝大多数情况下会使分类准确率提高。

特征的贡献度越大就说明加入该特征后分类准确率提高的就越多。

反之,如果一个特征的贡献度为负值,则说明加入该特征后会使分类的准确率有所下降。

当计算出所有特征的贡献度之后,我们就按照贡献度的取值对特征进行降序排列。

然后按照公式(2)选择特征子集用于分类。

多媒体学术会议{ f i | C( i ) > ξ and f i F}∈ (2)其中,F 代表全部特征集合,f i 代表第i 维特征。

也就是说我们要选择那些贡献度大于阀值ξ的特征构成分类特征子集。

加入贡献度大于0的特征往往会使分类准确率提高,因此我们就取阀值ξ=0,即选择所有贡献度大于0的特征作为特征子集用于分类。

当然,在这里我们也不能忽视奇异点的存在,也就是说在某种特殊的情况下加入一个贡献度大于0的特征反而会使分类准确率降低。

为此,我们将根据特征的降序排列,以特征个数递减的方式,对实验数据进行循环测试,即第一次取全部78维特征进行分类,第二次取贡献度排序靠前的77维特征,以后依次递减,计算每次的得到的分类准确率,选取其中最大值为最终结果,此时对应的特征集合就作为分类特征子集。

经过试验验证我们发现在绝大多数情况下,选择所有贡献度大于0的特征作为分类特征子集是可以达到最高的准确率的,因此我们就近似的将阀值定为0。

3.2 基于特征间相互影响的前向特征选择算法(IBFFS)基于特征间相互影响的前向特征选择算法是对原始的前向特征选择算法(FFS)的改进。

原始的前向特征选择算法采用了类似于贪心算法的思想,通过这种特征选择算法我们可以得到近似的最优特征子集,之所以选择近似的最优解,是因为我们无法承受完全穷举所带来的时间复杂度。

但是前向特征选择算法在降低时间复杂度的同时,也使我们放弃了一些可能比最终结果更好的特征组合。

也就是说,根据算法的要求,当我们向得到的N 维最优特征集合加入一个新的特征时,并不能保证新得到的(N+1)维特征子集也是最优的。

我们提出的基于特征间相互影响的前向特征选择算法,使得经过前向搜索后新加入的特征不仅能够保证使分类准确率达到最高,而且新特征的选择是基于某种事先计算好的规则,从而使得新特征的选择更具有方向性。

与传统的前向特征选择算法相比,该算法使得新选入特征子集的特征更为合理,扩大了前向搜索的空间,尝试了更多的特征组合,但是在时间复杂度方面与原始的前向特征选择算法基本一致。

在IBFFS 算法中新入选的特征要遵循某种事先计算好的规则,这里用到的规则就是不同特征之间对分类准确率的相互影响。

为了得到不同特征之间的相互影响,首先我们选用所有的两两特征组合进行分类并得到相应的分类准确率。

以我们的实验为例,当我们得到使用两两特征组合的分类准确率时,就可以构造一个大小为78*78的矩阵R,如图2所示: 1234567891010.2310.3160.2690.3500.3590.4220.3630.3500.3590.42220.3160.2060.3190.2660.3310.3340.3630.3250.3340.34730.2690.3190.2280.3810.3970.4440.3690.3060.3810.41940.3500.2660.3810.2440F F F F F F F F F F F F F F .3030.3340.3590.3220.3560.37550.3590.3310.3970.3030.3410.3590.4380.4280.3880.42260.4220.3340.4440.3340.3590.3130.4720.4160.3780.39170.3630.3630.3690.3590.4380.4720.3250.4340.4630.47580.3500.3250.3F F F F 060.3220.4280.4160.4340.2220.3910.38490.3590.3340.3810.3560.3880.3780.4630.3910.3250.419100.4220.3470.4190.3750.4220.3910.4750.3840.4190.319F F 图2 特征两两组合分类准确率矩阵第五届和谐人机环境联合学术会议 中国西安在这里我们只选取了矩阵R 的一部分。

相关文档
最新文档