音乐哼唱检索技术在WEB上的应用

合集下载

Web of science检索报告实例

Web of science检索报告实例

Web of science检索报告学院: 体育与教育学院专业年级:应用心理学学号:姓名:课题:音乐治疗在心理健康教育中的应用检索词:music;mental health一、该课题的综述文献经用web of science检索该课题相关的文献,总共检索出90篇相关文献。

截图为:其中参考文献最多的两篇论文分别为:文献2和文献4,引用的参考文献分别为155篇,134篇。

文献名及引用的参考文献截图为:二、 本课题相关的高影响力的论文将检索结果页面的排序方式调成被引频次(降序)排列,前面2篇文章引用频次最高,引用次数分别为76和61:本课题高热点论文是三、本课题相关的研究机构、著者从以上作者的精炼情况可以得出,有1个著者发表的论文数量为9篇,有2个著者发表的论文数量为6篇,有1个著者发表的论文数量为5篇,有5个著者发表的论文数量为3篇,有1个著者发表的论文数量为2篇。

名称分别为:四、本课题在不同学科的分布情况用截图表示为:主要涉及到康复学(23篇),精神病学(19篇),音乐学(15篇),临床心理学(13篇),护理学(11篇)等领域。

五、本课题研究发展趋势:从分析检索报告页面对该课题进行多方面(包括年代、国家地区、研究方向等)分析,截图如下:通过阅读所查2篇综述性论文,得知该课题的研究概况:音乐治疗起源于被诊断患有精神疾病的人,但却缺乏对音乐疗法影响的定量研究,且精神病与成人音乐疗法没有单一的、明确定义的模型。

通过阅读所查2篇高影响力(高热点)论文,得知该课题的热点是研究者们通过设计训练方法,可以用来改善心理健康和教育方案的疗效试验。

被试分别有学龄前儿童(正常人群)及妇女痴呆症患者(异常人群)。

通过阅读所查2篇高产出研究人员的论文,得知该著者的研究方向是音乐学、心理学和康复学,论文集中发表于Journal of music therapy和Arts in psychotherapy上。

通过对该课题的发表年度、著者、研究机构、研究方向(学科)、国家/地区等分析,得知本课题研究时间不是很长,从近10年开始有相关研究可以体现,2007年有3篇论文,2008年开始增多,有11篇论文,可见2008年是本研究的一个转折点。

搜索引擎在面向Web的数据挖掘中的应用

搜索引擎在面向Web的数据挖掘中的应用


要:本文通过对数据挖 掘技术 的分析 ,主要讨论 了搜 索 f 擎的技术及其在 网络信 息挖掘 中的应 用
关键 宇: 索引擎:数据挖掘 搜
中图分类号 : 34 G 5
引言
ቤተ መጻሕፍቲ ባይዱ
文献标识码 :A
文章编号 :1 7 — 7 2 (0 6I — 0 3 0 6 1 4 9一2 0 )2 05 — 3
么”规则进行寻找和推导 。
目前, 数据挖掘技术正处在发展当中。 数据挖掘涉及到 数理统计、 模糊理论 、 神经网络和人工智能等多种 技术, 技 术含量 比较高, 实现难度较大 。 然而 , 据挖掘 技术 与可视 数 化技术 、 地理信息系统 、 统计分析系统相结合, 以丰富数 可 据挖掘技术及工具的功能与性能。 1 网络信息挖掘及其分类 .3
随着网络信息资源 的急剧增长 , 人们越来越多地 关注如 何快速有效地从海量的网络信息中, 抽取出潜在的、 有价值 的信息, 使之有效地在管理和决策 中发挥作用 搜索 引擎技 术解决了用户检索网络信息的困难, 以一定的策略在互联网 中搜索、 发现信息,对信息理解、 提取, 组织和处理,并为 用户提供检索服务。 目前搜索引擎技术正成为计算机科学界 和信息产业界争相研究、 开发的对象。 本文旨在探讨搜索引
出数据的属性模型。 ②关联模型 主要是描述了一组数据项 目的密切度或关系, 通过挖掘数据派生关联规则, 了解客户 的行为 ③顺序模型 主要用于分析数据仓库中的某类与时 间相 关的数据,并发现某一时间段内数据的相 关处理模型 。 它是一种在关联模型 中增加了时间属性 的特定的关联模型 。 ④聚簇模型。 主要用于当要分析的数据缺乏描述信息或无法 组织成任何分类模式时, 按照某种相近程度度量方法将用户 数据分成互 不相 同的一些分组 。进而,通过采用聚簇模型, 根据部分数据发现规律,找出对全体数据的描述。 擎技术在网络信息挖掘方面的应用。 122数据挖掘 采用的典型实现方法 .. 1 数据挖掘 针对上述应用类型, 数据挖掘领域提出了多种实现方式 ii什么是数据挖掘 . 与算法。 这里仅讨论几种常见的典型的实现方法 :①神经网 数据挖掘是指从大型数据库的数据中提取人们感兴趣的 络。 它建立在 可以 自 习的数学模型 的基础之上, 以对大 学 可 知识, 而这些知识是隐含的, 事先未知的、 潜在的有用信息。 量复杂的数据进行分析, 并完成极为复杂的模式抽取 及趋 势 原始数据 可以是结构化 的, 如关系型数据库 中的数据 也可 分析 它可以很容易解决上百个参数的问题。 神经网络常用 以是半结构化的,如文本、图形、 图像数据; 甚至是分布在 于两个问题:分类和回归。 ②决策树。 是通过一系列规则对 网络上的异构型数据。 引 擎 在 面 向 、, 的 数 据 挖也可 的 应 用 数据挖掘的方法可以是数学的, 掘 中 搜 索 ^O 数据进行分类 。 采用决策树 , 可以将 数据 规则可视化,其输 以是非数学 的;可 以是演绎 的, 也可 以是归纳的。 掘出来 挖 出结果也容易理解。 决策树方法精确度比较高, 构造过程简 的信息可以被用于信息管理、 决策支持、 过程控制等,还可 单, 因此比较常用。 其缺点是很难基于多个变量组合发现规 用于数据自身的维护。 因此, 数据挖掘是一门广义的交叉学 则 ; 同决策树分支之间的分裂也不平滑。 不 ③遗传算法 。 基 科, 它汇聚了不同领域 的研 究者 , 尤其 是数 据库 、 人工智 能、 于进化理论,并采用遗传结合、 遗传变异,以及自然选择等 数理统 计、 可视化 、 并行计算 等方面 的学者和工程 技术人 员。 设计方法的优化技术。④近邻算法。 将数据集合中的每一个 目前, 国内从事数据挖掘研究的人员主要在大学, 也有 记录进行分类的方法 。⑤规则推导 。 对数据中的 “ 如果 一 那 部分在研究所或公司。 所涉及的研究领域很多, 一般集中于

互联网小工具推荐便捷的在线音乐识别工具

互联网小工具推荐便捷的在线音乐识别工具

互联网小工具推荐便捷的在线音乐识别工具现如今,互联网为我们的生活带来了许多便利和乐趣。

其中,音乐被广大用户所喜爱和追捧。

然而,有时候我们在听到一首陌生的歌曲时,想要了解其相关信息,却不知道去哪里获取。

幸运的是,有一些在线音乐识别工具能帮助我们轻松解决这个问题。

本文将为你推荐几款实用方便的在线音乐识别工具。

一、Shazam首先介绍的是Shazam,这是一款功能强大的在线音乐识别工具。

它可以帮助用户迅速识别正在播放的歌曲,并提供歌曲的详细信息,如歌曲名称、歌手、专辑、发行年份等。

使用Shazam时,只需将手机或电脑的麦克风对准正在播放的歌曲,点击识别按钮即可获取信息。

同时,Shazam还提供了与社交媒体的连接功能,用户可以将他们喜欢的歌曲分享到社交平台上,与好友们一起欣赏和讨论。

二、SoundHound与Shazam类似的还有SoundHound,这是另一款值得推荐的在线音乐识别工具。

与Shazam相比,SoundHound在识别准确性和识别速度上表现出色。

用户只需启动该应用,点击识别按钮,并让手机麦克风接收音乐,SoundHound就能快速识别出歌曲的相关信息。

与此同时,SoundHound还具备一些其他功能,如歌词显示、MV观看和歌曲点播等。

三、百度音乐识别作为中国最大的搜索引擎之一,百度也推出了自己的音乐识别工具,即百度音乐识别。

这款工具具有极高的识别准确度,可以识别大量的中文和外语歌曲,为用户提供全面的歌曲信息。

用户只需打开百度音乐识别应用,点击识别按钮,在手机麦克风接收音乐后,该工具会立即显示和播放音乐的相关信息。

此外,百度音乐识别还与百度云音乐进行了整合,用户可以直接在应用中收听歌曲。

四、GeniusGenius是一款非常特别的音乐识别工具,它不仅可以识别歌曲,还能提供歌词、解读和背后故事。

当你对一首歌曲的歌词感到好奇时,只需使用Genius的音乐识别功能,它会立即为你提供详细的歌词内容。

一个基于哼唱的音乐检索系统

一个基于哼唱的音乐检索系统
中 国西部 科技 2 1 年0 月 ( 0 1 2 上旬 ) 1 卷第0 期总 第2 7 第 0 4 3 期

个基于哼唱的音乐检索系统
鲁 帆 王 民
( 西安 建 筑 科 技 大 学信 控 学 院 计 算 机 应 用 专 业 , 陕 西 西 安 7 0 5 ) 1 0 5

要 :本文在 分析 了音 乐哼唱检 索 系统原理 结构 的基础上 ,采用 头尾 浮动的D w匹配算 法,设计 了一 个通过哼 唱旋律 T
3 特征的提取 3 1哼唱信号的特征提取 .
本 系 统 采 用 音 高 序 列 作 为 旋 律 的特 征 ,音 高是 由基 频
值 得 到 的 。本 文 采 用 中心 消 波 自相 关 提 取 基 频 的方 法 。处
算 法 ( T )可 以有 效 地解 决 两段 旋 律在 时 间上 的对 齐 问 DW
从音 乐数据库 中搜 索 出所 需歌 曲的哼 唱检 索 系统。提 出 了一 种混合 匹配的方法。 关键词 :哼唱检 索 ;D W;音 高轮 廓 ;旋律 匹配 T
D : 1 .9 9 Jin1 71 5 62 1 .401 OI 5 6 / .s.6 —6 9 . 0 0 . 0 s 1 1
Absr c : i ri l r t n l z d t e p i cp e a d s r c u e o u i u mi g r ti v ls s e , e s d a DTW t a tTh s a t e f s l a a y e h rn i l n tu t r fm sc h m c i y n e re a y t m t n u e h
mac n lo i m ih f cu tsi e in n n n Asar s l aQ u r — y H u thig ag rt wh c u t a e n b gn i ga d e d. e ut ey B — mm ig s se whc l wsy u t h l , n y tm ihal o o o

musicgen 详解

musicgen 详解

musicgen 详解MusicGen详解MusicGen是一种创新型的音乐生成技术,它利用深度学习算法和人工智能技术,能够自动生成新颖且与众不同的音乐作品。

本文将详细介绍MusicGen的原理、应用以及未来的发展趋势。

一、MusicGen的原理与技术MusicGen的核心原理是基于序列生成模型,通过训练神经网络模型来学习音乐片段的独特特征,并根据这些特征生成全新的音乐作品。

具体来说,MusicGen采用循环神经网络(Recurrent Neural Network,简称RNN)作为核心模型,利用记忆单元的状态传递和循环连接的方式,实现对音乐序列的建模和生成。

MusicGen的训练过程可以分为两个关键步骤。

首先,需要准备大量的音乐数据集,包括各种风格、乐器和音符的组合等。

然后,通过输入这些音乐数据集来训练MusicGen模型,使其能够捕捉到音乐的结构、旋律和节奏等关键特征。

训练完成后,MusicGen就能够根据给定的输入音符序列,生成具有类似风格和特征的全新音乐作品。

二、MusicGen的应用场景1. 音乐创作助手:MusicGen可以作为音乐创作过程中的辅助工具,帮助音乐人们快速生成创作灵感,并且不断提供新颖的音乐构思。

音乐人们可以通过与MusicGen进行交互,快速生成满足自己需求的音乐片段,从而缩短创作周期,提高音乐的创作效率。

2. 影视配乐生成:MusicGen可以根据影视作品的风格和情感需求,生成与之相匹配的配乐。

通过输入一段影视片段,MusicGen可以分析片段的氛围、节奏和情感,进而生成与之相适应的背景音乐或主题曲。

这项技术使得影视制作中的配乐环节更高效、个性化,并能够有效提升观众的观影体验。

3. 游戏音乐生成:MusicGen可以为游戏开发人员提供定制化的游戏音乐生成方案。

游戏音乐在传达游戏氛围和情感方面起着至关重要的作用,而MusicGen可以通过学习游戏音乐的特征和风格,生成符合游戏情景需求的背景音乐和音效,使玩家更加沉浸于游戏的世界之中。

互联网小工具推荐在线音乐识别工具

互联网小工具推荐在线音乐识别工具

互联网小工具推荐在线音乐识别工具互联网小工具推荐:在线音乐识别工具在如今数字化时代,互联网已经成为了人们生活中不可或缺的一部分。

随着科技的迅猛发展,许多小工具应运而生,为我们的生活提供了便利与娱乐。

其中,在线音乐识别工具就是一款备受欢迎的工具。

这些工具能够准确识别出我们听到的音乐,为我们提供了更好的音乐体验,并且方便我们获取更多关于音乐的信息。

本文将会为大家推荐几款值得一试的在线音乐识别工具。

一、ShazamShazam可以说是音乐识别工具中的佼佼者。

它的识别速度快、准确度高,能够在几秒钟之内识别出你正在播放的歌曲。

这款工具支持多平台使用,无论是iOS、安卓还是电脑,只要连接到互联网就能使用。

而且,Shazam还提供了歌曲的歌词、艺术家的相关信息、发布专辑等更多的功能。

你可以通过Shazam轻松地发现新歌曲,了解更多有关你喜欢的音乐的信息。

二、SoundHound与Shazam类似,SoundHound也是一款出色的在线音乐识别工具。

它不仅可以识别歌曲,还能够识别用户通过唱歌或是哼曲的方式传达的信息。

这让它在一些特殊场合或是没有歌曲播放的情况下仍然能够发挥作用。

此外,SoundHound还具备了歌曲识别后的相关搜索功能,可以查找歌曲的歌词、视频、艺术家的其他作品等。

因为其多功能和使用便捷性,SoundHound也是广大音乐爱好者们的首选工具之一。

三、MusixmatchMusixmatch是一款专注于歌词的在线音乐识别工具。

这款工具不仅能够识别歌曲,并显示歌曲的歌词,而且还能够根据你的喜好推荐类似的歌曲。

此外,Musixmatch还提供了歌手的简介、专辑信息以及相关的推荐歌单等功能。

它不仅让你能够更好地欣赏音乐,还能够满足你的好奇心、提供更好的音乐推荐。

四、GeniusGenius是一款集音乐和文化的在线识别工具。

除了能够识别歌曲之外,它还提供了关于歌曲背后的故事和更多的文化信息。

Genius的特点是用户可以通过该平台与其他音乐爱好者交流、分享自己对音乐的理解和感受。

音乐检索器的设计与实现

音乐检索器的设计与实现
本篇论文将讨论音乐检索器的设计与实现。

第一部分,介绍音乐检索器的起源及发展。

随着数字化时代的到来,传统的音乐检索方式已经无法满足用户需求,因此,音乐检索器
应运而生。

从最初简单的歌曲名称检索到后来的歌曲解析、音频特征
提取和相似度计算等技术的应用,音乐检索器不断地发展和完善。

第二部分,探讨音乐检索器的设计与原理。

音乐检索器的设计应
基于歌曲的特征提取和相似度计算。

先通过歌曲解析,将歌曲转换为
音频数据,再进行特征提取。

常用的特征有频率、振幅和声谱等,通
过这些特征,可以计算出歌曲的相似程度。

在设计过程中,还需要考
虑用户界面的设计和交互方式等因素。

第三部分,介绍音乐检索器的实现过程。

在实现过程中,需要用
到音频处理和机器学习等相关技术。

根据选取的特征,采用不同的算
法进行相似度计算。

例如,使用欧几里得距离或余弦相似度等。

同时,利用机器学习的方法,可以通过训练数据提高检索器的准确性和效率。

第四部分,讨论音乐检索器的应用和发展趋势。

除了传统的歌曲
搜索和识别功能,音乐检索器还可以实现音乐推荐、歌曲信息查询和
音乐多维度分析等功能。

未来,随着人工智能和大数据技术的不断发展,音乐检索器也将不断完善和发展,实现更多的人机交互和智能化
功能。

综上所述,音乐检索器是一个不断发展和完善的产品,需要多个
领域的知识和技术的结合,才能实现高效、准确和可靠的音乐检索与
分析功能。

希望本篇论文对读者有所启发和帮助。

哼唱识曲 原理

哼唱识曲的原理主要是通过提取哼唱的旋律,与曲库中所有歌曲的旋律进行检索匹配,从而找出相似度最高的歌曲。

这个过程涉及到音频信号处理、模式识别、机器学习等多个领域的知识。

具体来说,哼唱识曲的实现过程大致可以分为以下几个步骤:
1.音频信号预处理:首先对输入的哼唱音频进行预处理,包括降噪、去混响、分帧等操作,以便后续的信号分析和处理。

2.特征提取:对预处理后的音频信号进行特征提取,提取出与歌曲旋律相关的特征,如音高、音强、音色等。

3.匹配检索:将提取出的特征与曲库中的歌曲特征进行匹配检索,找出相似度最高的歌曲。

这个过程通常会使用一些机器学习算法,如K最近邻算法、支持向量机等。

4.结果输出:根据匹配结果,输出最相似的歌曲信息,如歌曲名称、演唱者等。

需要注意的是,哼唱识曲的准确率受到多种因素的影响,如哼唱者的演唱风格、语速、音准等。

因此,在实际应用中,需要根据具体情况对算法进行优化和调整,以提高识别准确率。

一种基于Python的音乐检索方法的研究

出了“听歌识曲”。

这个应用在国内众多的音乐类APP火热上线,受到社会媒体及大众的一致好评,比如网易云音乐,QQ音乐。

用户可以通过这个功能识别当前环境里播放器里播放的音乐或别人哼唱的悦耳的音乐,从而第一时间留住音乐,丰富自己的最爱乐库。

21世纪随着大数据数字化经济的发展,2008年,shazam率先在iOS和Android上发布了APP,并且用最快的速度以领头羊的身份整合了iTunes/Amazon MP3store 歌曲购买服务,2013年,shazam被国外媒体评价为年度十大最受欢迎的手机应用,由此听歌识曲迎来了一波火热狂潮,音乐检索也成为各大网络科技公司的重要项目之一。

1 音乐检索的研究现状音乐检索按搜索的目标分类,大致可以分为两类,一种是检索乐谱,另外一种是检索音频。

检索乐谱是把音乐转化成字符串的形式,而检索音频是将一段音频分割成小段,提取每一小段的听觉感知特征,通过比较特征序列来检索。

音频的处理比字符串的效率高了许多。

尤其是在复杂环境下采用声纹能够出其不意,达到事倍功半的效果。

声纹是提取我们所需音乐的基频然后采用动态时间规整比较两个基频序列的相似度[1]。

2 音乐检索的意义及目的音乐检索具有重大意义。

作为一种重要的媒体资源,音乐的检索对于音乐数据库和数字图书馆建设有着非常重要的意义。

网络上多媒体资源量非常巨大,人们需要高效的搜索引擎从浩如烟海的数据中找出需要的音乐资源。

另外,音乐检索在卡拉oK检索以及辅助视频检索等方面都有广阔的研究前景和巨大的应用价值。

所以不论从科技发展还是从大众的娱乐的角度去看,音乐检索的意义深厚而且未来的任务次应用在KTV 里的点唱系统中,可以使点歌更加简便快捷,而不需要层层的选择。

大大减少了失误的效率,提高速度,方便娱乐消遣;另外,哼唱检索技术应用于现有的音乐设备上,如MP3、音乐手机等,可以提供更加自动化及直观的搜寻。

3 音乐检索的研究方法音乐检索的方法有很多,如基于文本的检索,基于哼唱的检索,基于发音的检索,基于指纹的音乐检索等等,下面针对其中的基于哼唱的音乐检索和基于指纹的音乐检索方法进行展开说明[3][4][5]。

互联网小工具推荐在线音乐识别软件

互联网小工具推荐在线音乐识别软件在今天的数字化时代,互联网成为了我们生活中不可或缺的一部分。

通过互联网,我们可以享受到各种各样的便利,其中之一就是在线音乐识别软件。

这些小工具可以帮助我们快速准确地辨识出歌曲信息,满足我们对音乐的需求。

本文将为大家推荐几款优秀的互联网小工具,供大家参考。

1. ShazamShazam是一款非常著名的在线音乐识别软件。

只需将手机麦克风对准正在播放的歌曲,Shazam便能够迅速识别出歌曲的名称、演唱者和专辑等相关信息。

此外,Shazam还提供了与歌曲关联的音乐视频、歌词和相关的推荐歌曲等功能,让用户能够更加全面地了解和欣赏音乐作品。

2. SoundHoundSoundHound是另一款备受欢迎的在线音乐识别工具。

它不仅支持通过麦克风识别正在播放的歌曲,还可以通过用户输入歌曲的部分歌词或者是哼唱的方式来辨识出歌曲信息。

此外,SoundHound还可以提供歌曲的实时歌词显示和一些有趣的音乐挑战游戏,让用户的音乐体验更加丰富多彩。

3. MusixmatchMusixmatch是一款专注于提供歌词服务的在线音乐识别软件。

通过Musixmatch,用户可以识别歌曲并且即时显示其歌词。

此外,Musixmatch还支持歌词翻译功能,允许用户一边欣赏音乐,一边学习外语。

它还可以与各种音乐应用程序和流媒体平台进行集成,提供更加便捷的音乐体验。

4. GeniusGenius是一个专注于提供歌曲解析和歌曲背后故事的在线音乐识别工具。

它不仅能够识别歌曲,还可以提供歌曲的详细解释、背后故事以及歌曲中的名言和流行语等。

用户可以通过Genius深入了解歌曲的创作背景,增加对音乐的理解和欣赏。

综上所述,互联网小工具中的在线音乐识别软件给我们的音乐体验带来了很大的便利。

无论是在咖啡厅、购物中心还是电影院里听到一首好听的歌曲,只需要打开这些小工具,我们就可以迅速地了解到这首歌曲的信息,并更加深入地欣赏和学习其中的精髓。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第25卷第12期 计算机应用与软件Vo l 25N o .122008年12月 Co m puter App lications and So ft w are Dec .2008音乐哼唱检索技术在WEB 上的应用张 晶1 周明全2 耿国华1 王小凤11(西北大学可视化技术研究所 陕西西安710127)2(北京师范大学信息科学与技术学院 北京100875)收稿日期:2007-07-30。

国家自然科学基金项目(60203011)。

张晶,硕士生,主研领域:多媒体技术与图形图像处理。

摘 要 将基于内容的哼唱检索技术用于W EB 上。

首先阐述了音乐检索现状,并对基于内容的音乐检索过程进行了详细地分析,然后介绍了W EB 的相关技术,提出了将音乐检索技术用于W EB 的思路,最后对全文归纳总结,并对进一步的工作进行了展望。

关键词 音乐检索 哼唱检索 特征提取 W EBTHE TECHNOLOGY OF MUSI C QUERY BY HU MM ING BASED ON WEBZhang Ji n g 1 Zhou M i n gquan 2 G eng Guohua 1 W ang X i a ofeng11(Instit u te of Vis ua liza ti on T ec hnology ,N orthw estUniversit y,X i an 710127,Shaanxi ,Ch i na )2(C olle g e of Informa tion S cie n c e and T ec hnology ,B eiji ng N orma l Un i v e rsit y ,B eiji ng 100875,China )Ab stract In the paper ,the query by hu mm i ng technology based on content was app lied to the W eb .The act ua lities ofm usi c retr i eva lw erediscussed ,and the process of content based m usi c re trieval w as ana l y zed i n deta i.l T he co rre lated techno l ogy o fm us i c retrieva l based on W eb was i ntroduced ,and the t hought of usi ng the techno l ogy of music query on W eb w as proposed .In t he end ,we su mm arized t he who le expression i n the pape r and took the expecta tion o f the future w ork .K ey words M usi c re trieval Q ue ry by hu mm i ng F eature ex trac ti on W eb0 引 言随着计算机技术的高速发展和互联网的蓬勃发展,网络中的信息和数据呈爆炸式增长。

这样,计算机用户在处理信息时所面临的主要问题,已经从早期的信息匮乏转变为如何从海量信息中快速合理地检索出所需要的信息。

当前,多数搜索引擎仅能对文本进行检索,对图片、声音、视频这些以二进制编码的多媒体数据无能为力,而后者目前增长非常迅猛。

传统的基于文本检索方式已经越来越无法满足用户新的需求,因此,对多媒体数据进行内容检索具有重要的实用价值。

基于内容的音乐检索是对音乐数据从内容本身进行检索的一种方法。

目前,网络中进行音乐检索都是通过音乐的元数据(M e tadata)如歌名、歌手、歌词等进行的。

当用户没有歌曲的元数据信息时,如果能够记忆起歌曲的某些片断,那么通过哼唱方式就可以找到目标歌曲。

它可以带给用户更新的体验。

基于W EB 的音乐哼唱检索将使用户通过互联网来体验这种新的检索技术,这样,用户就可以通过个人电脑、无线设备(手机)等终端来进行访问。

1 国内外现状分析目前国内外对于基于内容的音乐检索的研究已经被大量提出。

1995年,G h i as [1]等展示了首个QB H 系统,此系统将歌曲转换为音调轮廓信息进行匹配,利用三个字符S same 、U up 、D down 来表示音乐的旋律轮廓,将音乐的旋律转换成字符串,使用了字符串匹配的相似度方法进行检索。

至此以后,对于基于内容的音乐检索的研究如雨后春笋般地发展起来。

国内中国科学院声学研究所在哼唱检索方面开展了工作,另外如浙江大学、上海交通大学、西北大学等也在基于内容音乐检索方面开展了研究工作。

基于内容的音乐哼唱检索技术以其独特的体验方式,已经被越来越多的人所关注。

2 基于内容的音乐哼唱检索基于内容的音频检索,是指通过音频特征分析,对不同音频数据赋以不同的语义,使具有相同语义的音频在听觉上保持相似,其中基于内容的音乐检索是具有较高实用价值的一个部分。

基于内容的音乐检索是根据音乐的内容特征来进行检索,也就是根据音乐的旋律、节奏等音乐特征进行检索。

基于内容的音乐哼唱检索是基于内容的音乐检索一部分。

其将检索的数据源缩小为用户的哼唱,通过接收用户哼唱的旋律,对接收的音乐旋律进行内容的描述,即提取特征,然后与数据库中的特征进行相似度匹配,最后将搜索结果集返回。

第12期张晶等:音乐哼唱检索技术在W EB 上的应用37图1说明了基于内容的音乐哼唱检索的具体流程。

图1 音乐哼唱检索流程图2.1 哼唱片断进行预处理因为语音信号是一种非平稳时变信号,其中浊音部分在一段相对短的时间内可以认为是准周期的,因此语音信号处理中通常采取短时处理技术[2]。

这样,就可以将平稳过程的处理方法和理论引入到语音信号的短时处理中,每个短时的语音段称为一个分析帧。

分析帧既可以是连续的,也可以采用交叠分帧的方法,一般帧长取10~30m s 。

通常我们采用一个长度有限的窗函数来截取语音信号形成分析帧。

较常用到的窗函数是矩形窗和汉明窗,它们的表达式如下(其中N 为帧长):矩形窗:w (n)=1 0 n(N -1)else汉明窗:w (n )=0.54-0.46cos [2 !n /(N -1)] 0n(N -1)0 e lse窗形的选择对音乐信号分析来说是比较重要的。

矩形窗具有较高的频谱分辨率,但其频谱泄漏大。

汉明窗具有更平滑的低通特性,能够在较高程度上反映短时信号的频率特性。

一般在计算短时能量和平均幅度时通常使用矩形窗。

为了方便后面的基音提取工作,我们在设计过程中采用矩形窗对输入的信号进行分帧。

2.2 基音提取当发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为∀基音周期(p itch)#,其倒数称为∀基音频率#。

基音周期是语音信号中的重要参数之一,它在语音识别、语音合成和语音编码中有广泛的应用。

语音信号是短时平稳的,常用的短时基音周期估计方法有基于短时平均幅度差函数(AM DF )的基音周期估计方法和基于短时自相关函数的周期估计方法。

我们采用AM DF 的基音周期估计方法。

AM DF 法的思想是:如果信号是一个标准的周期函数,那么不同周期段的对应信号之差为零。

浊音是一个准周期信号,在一帧语音内基音周期近似恒定,那么不同基音周期段的对应信号之差应该很小;但清音因其接近于随机噪声而不具备上述特点[3]。

而且,AM DF 函数只需要加、减和取绝对值运算,运算量较之短时自相关函数大大下降。

音乐信号中基音的变化同音乐文件中的音调变化具有相对应性。

所以音乐信号中的基音的提取对于音乐音调特征的提取具有重要的意义。

2.3 旋律提取音乐的旋律是由一系列能反映该音乐主题的音符组成,能够充分显示音乐的内容特征[4]。

在一段旋律中,各个音符以一种含义丰富的形式连接在一起。

在音乐的所有特征中,旋律最能打动人,最能直接唤起人们的情感。

所以说,音乐的旋律是音乐的灵魂。

我们需要将用户输入的旋律片断,通过分析处理,得到计算机可以识别的一种旋律轮廓的表达方式,从而实现检索功能。

要得到旋律的轮廓,首先需要求得一个旋律片段的基音序列,对基音序列按照基音值的不同,进行分段,相同的值分为一段,然后对所得到的基音序列进行合并处理,并得到新基音段的基音值。

因为音调之间的变化可以反映音乐旋律上的变化,所以,我们将最后得到的基音序列的差值按照顺序排列起来,就得到了音调的旋律轮廓[5]。

假设求得了一个旋律片段的基音序列L m ,m 为序列长度。

对L m 按值大小进行分段以后得到的序列为L n ,其值大小记为L n ,n 为基音段总个数(1 n m )。

设阈值P,对任意段L i (1i n),记 Lef t =L i -L i-1,R i ght =L i -L i+1,令函数f (L i )表示段L i 的长度,则:若 L e f t >P 且 R ight <P,则L i 和L i+1合并;若 L e f t <P 且 R i ght <P,则L i 和L i+1合并;反之,则L i 和L i-1合并。

合并后产生的新基音段基音值大小按照以下方法计算:记进行合并的两段为L i 和L j ,合并后新段为L t ,则:若f (L i )=f(L j ),L t =(L i +L j )/2;若f (L i )>f(L j ),L t =L i ;反之,L t =L j 。

L n 经上述操作后记为L w ,各段值为L w ,w 为当前基音段总个数(1 w n)。

对L w 中任意连续段L i 、L i+1(1 i <n),定义其连续递增序列为 L i (1 i <w ),并记 L i =L i+1-L i 。

这样, L i 就是音调的轮廓序列。

2.4 查询匹配并返回结果集得到音调的轮廓序列 L i 以后,再根据标准音调差值图或表,就可以将其转换为旋律轮廓。

然后,将此轮廓序列与数据库中存储的所有歌曲的旋律轮廓特征进行比较,选取相似度较高的歌曲为检索结果,并返回给用户。

至此,基于内容的音乐哼唱检索过程就结束了。

3 基于W EB 的音乐哼唱检索随着Interne t 网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,基于网络的应用越来越多,网络信息量不断以几何级数爆炸式增长,网上的多媒体信息急剧增加。

互联网上的多媒体信息以图像、音频、视频为主。

为了使用户能够方便地使用哼唱进行音乐检索,如果我们可以利用W EB 技术在网络上实现音乐检索功能,这样,用户就可以利用互联网随时随地的进行搜索了。

相关文档
最新文档