谱线的识别
乐谱数字化的新途径――计算机光学乐谱识别技术

乐谱数字化的新途径――计算机光学乐谱识别技术摘要计算机光学乐谱识别(Optical Music Recognition,OMR)是计算机技术在音乐领域的发展和应用,它利用图像处理、模式识别、文档图像分析等相关技术,把乐谱图像自动转化成通用的数字音乐格式。
OMR技术为纸质乐谱数字化提供了一个智能、高效的新途径,在计算机音乐、计算机辅助音乐教学、数字音乐图书馆等众多领域有着广泛的应用前景。
关键词: 光学乐谱识别,数字化,数字音乐图书馆1 问题的提出信息技术改变着社会生产和人类生活的各个方面,人类社会正在步入一个数字化时代。
现代计算机科学与音乐艺术的结合产生了计算机音乐,它的出现不仅体现了计算机技术的一次革命,而且给人类的音乐活动带来了生产方式的根本变革,人们对音乐的创作、演奏、传播从传统的手工作业方式一跃而为高科技方式。
乐谱的发明是人类音乐史上的里程碑,它的出现使人们可以在一个相对标准的平台上进行音乐的交流和传承。
古往今来的优秀音乐作品大都以纸质乐谱的形式保留下来,直至今天,纸质乐谱仍是表达和描述音乐作品的主要载体。
基于以上的时代背景与事实,那些长期涉足于计算机音乐的人士便迫切地提出了这样一个问题:让“纸质乐谱进入计算机,计算机读懂乐谱”,能够实现吗?在计算机音乐发展的近几十年中,各种音序编辑软件层出不穷,如Encore、Cakewalk等,这类软件的出现告诉人们,“乐谱进入计算机”已经不成为问题。
然而,利用音序编辑软件进行乐谱数字化是一种纯手工人的方式,即手工录入――校对—―修改的方法,录入人员必须具有一定的音乐专业知识,而且输入工作量大、效率低。
因此,在纸质乐谱数字化的进程中,不可避免地产生了低速的音乐信息输入与高速信息处理之间的矛盾。
于是,一些计算机学者和专家们开始寻求一条纸质乐谱数字化的新途径,力图突破纯手工的乐谱数字化瓶颈,自动完成乐谱向数字音乐的智能转化,即实现真正意义的“计算机读懂乐谱”。
原子吸收 特征谱线

原子吸收谱线是指在原子吸收光谱中所观察到的特征性谱线,这些谱线对应于原子在吸收光时特定能级之间的跃迁。
原子吸收谱线的特征取决于原子的能级结构和电子跃迁过程。
每个元素都有独特的原子能级结构,因此其吸收谱线也是独特的,可用于元素的鉴定和定量分析。
以下是一些常见的原子吸收谱线类型:
1. 基态至激发态跃迁谱线:这些谱线对应于原子中的电子从基态跃迁到激发态。
它们通常出现在可见光或紫外光区域,例如氢的巴尔末系列(Balmer series)谱线。
2. 激发态至基态跃迁谱线:这些谱线对应于原子中的电子从激发态跃迁回基态。
它们通常出现在可见光或近红外光区域,例如钠的黄线双线(D-line)谱线。
3. 多电子跃迁谱线:当涉及到多个电子的跃迁时,会引发更复杂的谱线结构。
例如,过渡金属元素常常显示出多个吸收峰,对应于不同的电子跃迁。
4. 超精细结构谱线:原子的超精细结构是由于核自旋、电子自旋和
电子轨道运动相互作用引起的。
这些相互作用会导致谱线的进一步分裂,形成超精细结构谱线。
需要注意的是,原子吸收谱线的位置和强度可以受到多种因素的影响,包括温度、气体压力、电磁辐射源的特性等。
因此,在实际的原子吸收光谱分析中,需要考虑这些因素,并与标准参考数据进行比较和分析。
一种DEMON信号线谱识别方法

一种DEMON 信号线谱识别方法朱文亚 陆佶人(东南大学无线电工程系,江苏 南京 210096 ) A detection method Of DEMON signal line spectrumZhu Wen-ya Lu Ji-ren (Department of Radio Engineering, Southeast University, JiangSu NanJing 210096,China) 1: 概况 水声目标的螺旋桨空化,柴油机活塞调制等会使宽带噪声产生幅度调制,而通过对解调谱的处理得出的离散线谱,可以得出水声目标的一些重要特征.通过水听器得到的数据一般经过以下过程:带通滤波,绝对值检波,直流分量的滤除,低通滤波,抽样,背景均衡处理,线谱识别和多时刻数据复合处理.本文讨论背景均衡以后的几个部分.2:背景均衡处理和线谱识别2.1 背景均衡经过前面处理的数据包含有宽带背景噪声,在低信噪比的水声解调谱情况下会对检测产生很大影响,通过背景均衡处理可以消除宽带噪声,提高检测的检测率.由于目标是提取解调谱中的线谱部分,由线谱的特点,并考虑到以后要对数据进行峰值门限处理和谱宽门限处理,使用改进的滑动窗拟合算法可以得出较好的背景连续谱,因而可以得出较好的线谱识别结果。
算法步骤如下:(1).设定滑动窗长2k+1,滑动步长step ,每滑动一次,取其中step 个点作为平滑值, step值一般取为窗长的1/4以下。
由于拟合时,取拟合点居于拟合窗中间比拟合窗边缘效果好,对数据进行增补处理,设定处理数组。
假设原数据为:(0),(1)()x x x n iii .处理数组则为: ()(1),(0),(1)(),(1)(1),(),(1)().x k x x x x k x k x n x n x n x n k +−−−iii iii iii iii(2).拟合估计背景时,由于线谱值比原背景值大很多,拟合后会导致附近点的背景值拟合值偏大,所以应抑制这种影响.进行如下滑动窗预处理可减少线谱对背景估计的影响:搜索所有滑动窗内局部最大值点,可计算得窗内局部最大值点的均值为x ,若()x k 为极大值点,且()x k x gate >+(gate 为宽谱判别峰值门限,对归一化谱可取0.3),则依次判断x(k)周围值是否满足上式.假设判别结果为()(),(0,0)x k i x k j i j −+>>iii ,作如下预处理: ()((1)())/2,,1,,1x k p x k p x k p p i i −=−−+−=−iii()(()(1))/2,,1,,1x k q x k q x k q q j j +=++++=−iii()((1)(1))/2x k x k x k =−++。
激光诱导击穿光谱元素谱线自动识别方法研究

基金项 目:国家 自然科 学基 金项 目(0 0 O 8 ,国家重 大科技专 项 ( o 8 xo 5 7 0 9 X04 0 ,中 国科学 院 知识 创新 工程 重大 项 目 6981 ) 2 0 z 7 2 ,2 0 Z 7 2 )
(z ̄l w 6 1 和安徽 省科技计划项 目(8 H3 18 ) kc y 0— ) 0 0 3 b 5 1资助
Fi 1 Ex rm e ald v c g. pe i nt e ie
2 相 似性测度 与光谱模拟
相 似性 测度 的表示形式很 多,可 以归结为两矢 量问的距
确定峰“ ” 从 N S 1, IT库中查询到峰“” 1 可能为 F 34 0 9 e I: 4 . 9
n K I :3 4 0 5 n l m, I 4 . 0 l ,Ti T I:3 3 9 n ,Al 4 . 3n ] I:3 3 9 5 4 . 3
光器 , 脉宽为 6n , 冲重复频率为 1 2 , 冲能量 5 s 脉 - 0Hz 脉 o mJ ;光谱 仪 ( en pi 2 0 +) Oca o t sHR 0 0 测量 波长 范 围:3 0 c 0 ~ 5 0nn 0 r,分辨率 0 1nn . I,两个 聚焦镜均为石英透镜 ,样 品台
光谱学 与光谱分析
2 1
由步进 电机控制其转动 , 首先通过计算机控制光 谱仪使其 向 激光器发送 兀 L信号令 激 光器 出光 , 光经 过全反镜 垂直 激
入射到聚焦镜 , 再经聚焦镜聚焦作用 到样 品上 , 产生 的激光
式 。当考虑到谱线叠 加和 LB I S光谱 的连 续背景 辐射 时 , 谱
谱线库 中强度 比较大 的谱线 的方法对谱线进 行归属识别 ; 亓
乐谱识别问题数学建模

乐谱识别问题数学建模
乐谱识别是指利用计算机技术对乐谱进行分析和识别的过程,其在音乐信息处理和音乐学研究领域具有重要意义。
数学建模在乐谱识别问题中扮演着关键的角色,它涉及到多个方面的数学原理和方法。
首先,乐谱识别涉及到图像处理和模式识别领域的数学建模。
在乐谱识别中,乐谱图像需要经过数字化处理,然后利用数学模型和算法进行特征提取和模式匹配,以识别出乐谱中的音符、节拍和乐谱结构等信息。
这涉及到数字信号处理、图像处理、模式识别和机器学习等数学原理和方法。
其次,乐谱识别还涉及到音符和音乐符号的数学建模。
音乐符号包括音高、音长、节拍等信息,需要通过数学模型进行表示和分析。
例如,音符的音高可以通过频率和波形的数学模型进行表示,音符的音长可以通过时域和频域的数学模型进行描述,节拍可以通过节拍模型和拍子模型进行建模。
此外,乐谱识别还需要考虑到音乐理论和数学之间的关系。
音乐理论中的调性、和声、旋律和节奏等概念可以通过数学模型进行
表达和分析,从而帮助乐谱识别系统理解和分析乐谱中的音乐信息。
总之,乐谱识别问题涉及到图像处理、模式识别、信号处理、
数学建模和音乐理论等多个领域的知识,需要综合运用数学建模的
方法和技术来解决。
通过合理的数学建模,可以更准确、高效地识
别乐谱中的音乐信息,为音乐信息处理和音乐学研究提供重要支持。
五线谱识别方法

五线谱识别方法
五线谱识别是指通过技术手段自动识别和提取五线谱中的音符信息。
以下是一些五线谱识别的方法:
1. 图像处理和计算机视觉:
-使用图像处理技术,如边缘检测、二值化等,将五线谱图像转换为计算机可处理的形式。
-利用计算机视觉算法来检测五线谱中的线条和音符。
2. 深度学习和神经网络:
-使用深度学习模型,如卷积神经网络(CNN)来学习五线谱图像的特征。
-利用神经网络对五线谱的线条、符号等进行分类和识别。
3. 光学字符识别(OCR):
-将五线谱图像看作文本,应用OCR技术进行字符的提取和识别。
-针对音符、符号等特殊元素,设计专用的OCR模型。
4. 音符特征提取:
-通过数学算法和信号处理技术,提取五线谱中音符的时值、音高等特征。
-使用模式识别技术来匹配这些特征,从而实现音符的识别。
5. 机器学习方法:
-基于机器学习算法,如支持向量机(SVM)、随机森林等,对五线谱图像进行分类。
-使用已标注的训练数据集,训练模型以识别音符、休止符等元素。
6. 结合规则和语境信息:
-利用五线谱中的规则信息,如音符排列、音程规则等,结合上下文语境进行识别。
-基于音乐理论的知识,提高对音符和其他符号的正确性。
以上方法常常会结合使用,形成一个综合的五线谱识别系统。
这需要在实际应用中根据具体需求和场景进行合理选择和优化。
乐谱图像中的音符识别方法

乐谱图像中的音符识别方法第36卷V oL36第9期No9计算机工程ComputerEngineering2010年5月May2010人工智能及识别技术?文章编号:1000—_3428(2010)09—_o163—_o5文献标识码:A中图分类号:TP18乐谱图像中的音符识别方法刘晓翔(暨南大学珠海学院计算机科学与技术系,珠海519070)摘要:面向多声部乐谱,实现基于结构模式的音符识别方法.在音符基元抽取阶段,提出基于游程分析的符干,符头,符梁3类基元抽取算法,具有较好的抗相交和抗粘连干扰能力.在音符结构分析阶段,采用"作用场"描述音符基元关系,将音符分为6类子结构,可缩小基元搜索范围.在此基础上细分音符结构,遵循关键子结构优先定位原则实现音符基元重组,可降低分析复杂度且具有良好的基元冗余排错能力.实验结果表明,该方法能快速准确识别多声部乐谱中的音符,在音符排列密集,结构复杂时适应能力较强.关健诃:光学乐谱识别;音符识别;基元抽取;结构分析NoteRecognitionMethodinMusicScoreImageLIUXiao.xiang(DepartmentofComputerScienceandTechnology,ZhuhaiCollegeofJinanUniversity,Zhuhai519070)[Abstract]Thispaperrealizesnoterecognitionmethodbasedstructuremodeformulti-voice musicscore.Intheprocedureofprimitiveextraction, threekindsofalgorithmsbasedonrun—lengthcodingareproposedrespectivelyforextractingstem,noteheadandbeam,theyhavebet terabilityforresolvetroublesomeanti-intersectionandanti—conglutination.Intheprocedureofstructureanalysis,interactionfieldisintroducedtodescrib etheassociationrelationshipofprimitives,andnoteisdividedtosixkindsofsubstructurestoreduc eprimitivesearchingrange.Itsubdividesnote structurebasedonaforesaidprocedure,noteprimitiveisrealizedrecombinationwhichfollo wstheprincipleofgivingprioritytothekeysubstructure,itcanreduceanalysiscomplexityandhaswellabilityofprimitiveredundancyd ebugging.Experimentalresultsshowthatthismethod carlrecognizenoteinmulti—voicewithhighaccuracyandefficiency,andpowerfuladaptability,ithasgoodadaptabilityatt hesituationofnotesintensivearrangementandcomplicatedstructure.[Keywords]opticalmusicscorerecognition;noterecognition;primitiveextraction;structur eanalysis1概述光学乐谱识别技术是对乐谱文档的扫描图像加以处理,分析,识别,最终获得乐谱图形及音乐语义的数字表达.乐谱中的音符用于记录音高与音长(时值),相对于乐谱其他图形和符号,具有重要的语义信息,在数量上也占绝大多数.因此,音符识别是乐谱识别的核心与关键.音符形态千变万化,其多样性和多态性特点决定了音符识别难以采用常规符号(如文字),需要将所有形态模式作为一个模式类逐一识别.对于这种情形,识别的要求不是分类而是描述与分析,即根据音符基元的属性和关系按一定规则分析音符的结构和语义信息,相应研究方法为结构模式识别, 由音符基元抽取和音符结构分析2个部分组成.现有音符基元抽取方法有:投影法,骨架化,模板匹配,数学形态学等【lJ.音符结构分析常见的方法有:基于串文法J 匹配和基于图文法的匹配_jJ.然而上述方法表现出以下共同局限性:(1)基元抽取算法抗噪声,粘连等干扰能力较差,难以适应复杂,密集版面的多声部乐谱;(2)音符基元关系描述过于刚性,对音符中不精确的位置关系表达不足;(3)缺乏对音符结构特征细化的区分,识别时没有"重点",造成效率低和排除基元冗余错误能力弱.针对上述局限性,提出基于游程分析的基元抽取算法和基于"作用场"的音符结构分析方法.2预处理预处理阶段的重要任务是谱线的定位和删除,目的是获取谱线的位置,线宽和间距以及消除谱线对音符的叠加和相交干扰.乐谱文档在扫描过程中,由于人为因素和扫描仪走纸的机械误差影响,生成的图像普遍存在一定角度的倾斜,倾斜变形不仅让谱段的分析与删除过程变得困难,同时给后续的音符识别带来负面影响,因此在谱线删除之前,要引入一个乐谱图像倾角的自动检测与校正算法满足系统的实际应用需要.在倾斜校正环节,采用文献[4]提出的基于交叉相关性的乐谱变形校正和谱线定位方法,该方法利用"化整为零,相关计算"的思想,对传统水平投影方法做了改进,能够自动校正乐谱图像的小角度倾斜,弯曲变形,同时能精确计算谱线的各项参数.在谱线删除环节,采用文献[5]提出的基于图段拓扑关系的谱线删除方法,该方法通过相邻图段的拓扑关系进行谱段判断,能有效克服谱线的"过删除"现象,保障音符的完整性不遭破坏.基金项目:广东省自然科学博士科研启动基金资助项目(7300090); 暨南大学引进人才科研启动基金资助项目(510061)作者简介:刘晓翔(1977一),男,讲师,博士,主研方向:图形图像处理,图纸识别与理解收稿日期:2009—11-23E-mail:************.cn163—3基元抽取3.1符干抽取符干为连接符头与符梁/尾的垂线,是音符的基本骨架.常见的投影法,骨架化和数学形态学方法等符干抽取方法对粘连和相交敏感,不利于处理音符复杂密集的多声部乐谱.遵循人工识图"逐步求精"的原则,本文提出一种"粗看垂直游程,细看水平游程"的符干抽取算法.该算法注重垂直和水平游程编码在信息表达上的互补性,能实现一次性快速准确抽取垂线,同时避开因粘连,相交干扰引起的多段合并问题.算法具体描述如下:Stepl沿垂直方向扫描,对乐谱图像(算法中的图像均指谱线删除后的图像)进行垂直游程编码,若黑像素游程中长度超过一定阈值(2倍谱线间距),则标记该游程为"种子游程".Step2沿水平方向扫描,对图像进行水平游程编码,检索出"种子游程"中像素点所在的水平游程,获得"种子游程"左右边界的轮廓点.Step3若"种子游程"轮廓点满足以下条件,则确定该游程为候选符干.条件1(线宽约束)点两侧的轮廓点之间的距离小于一定闽值(2倍谱线线宽).条件2(对称性约束)轮廓点对相对于"种子游程"左右对称.条件3(一致性约束)同时满足条件1,条件2的轮廓点必须连续且达到一定长度(1.5倍谱线线宽).Stepl强调符干整体上的垂向连续性,相当于从全局"粗看" 保证抽取结果的完整性;Step2,Step3考察符干左右边界的轮廓细节特征,相当于局部"细看"确保抽取结果的正确性.3.2符头抽取符头用于记录音符的音高,分为实心符头与空心符头2类.空心符头构成的音符结构相对简单(无符梁,全音符无符干),谱线删除后自然分离,本文仅讨论实心符头的抽取方法. 符头抽取的策略可分为2类:(1)根据符头的直观形象设计模板进行匹配;(2)先分割出潜在的符头连通域,再根据连通域特征进行筛选.考虑到模板匹配的效率瓶颈,本文采用第2类方法.第2类方法的主要困难是粘连切分问题,密集和声音中的符头粘连现象不可避免.人工读谱时会利用符头的环境特征,结合音符特定先验知识对粘连做出准确切分.音符特定先验知识指的是乐谱记写规范,规定:符头中心位于谱线上或谱线问,符头两侧至少有一符干与之相连.可见,利用已有谱线,符干信息,可为粘连符头提供切分依据.本文符头抽取步骤如下:Stepl沿水平方向扫描,对图像进行水平游程编码,删除长度小于一定闽值(3倍谱线问距)的水平黑像素游程.该步骤删除符头与符梁的连接部分,实现符头与符梁的分离. Step2对图像进行连通城标识,对于每一个连通域,若宽度大于一定阈值(3倍谱线间距),且上下任何一条边缘线接近直线,则删除该连通域.其目的是去除具有明显符梁特征的连通域,避免符梁经过下一步的切分后误识为符头.Step3以符干为切分线,切分所有连通域,以谱线或谱线间线为切分线切分高度大于一定阈值(2倍谱线间距)的连通域.Step4通过长,高和面积3个指标检测切分后的连通域一164一是否具备符头特征(符头连通域长约为1.5倍谱线间距,高为1倍谱线间距,像素面积与连通域包围框面积比约为0.8).上述算法可归结为:符头/符梁分离一删除符梁一沿符干切分一沿谱线切分一连通域特征检测.该算法可快速准确地分离出具备符头特征的块状基元,同时对粘连符头有较理想的切分结果.3.3符粱抽取符梁是以拍子为单位分音群连写的横线,仅出现在组合音符中,图形上表现为有一定厚度,相互平行的水平或小角度倾斜直线.符梁抽取的传统方法是图纸识别中的直线检测算法,运用此类方法时,符梁会因与符干相交而被分为多段, 下一步的搜索,拼接操作繁琐且耗时,且难以处理符梁粘连的情况.由于符梁的语义信息(音符时值)仅取决于符梁的个数,与其直线参数无关,因此本文抽取符梁采取避开直线检测的策略,以单符梁或粘连符梁形成的块状连通域为目标, 然后根据连通域厚度计算符梁个数.实现步骤与实心符头类似,具体步骤如下:Stepl同抽取符头的Stepl,分离符头与符梁.Step2通过厚度,长度,边缘线的直线度检测图像中的连通域是否具备符梁特征.连通域厚度不小于2倍谱线厚度,长度不小于谱线间距,符梁上下边缘线中至少一条接近直线. Step3计算音符符梁个数.符梁连通域厚度除以单符梁厚度即为符梁个数.由于不同出版商使用的符梁厚度标准不同,单符梁厚度无法使用固定阈值,因此给出一种通过统计垂直游程长度频数自动计算单符梁厚度的方法:(1)对分割出的符梁图像进行垂直方向的游程编码.(2)统计游程编码中游程随长度变化的频数,生成频数直方图,选取直方图中最大峰值对应的游程长度作为单符梁厚度.(3)如果频数直方图中出现多个峰值,则表示符梁存在上下粘连的情况,此时选取最左端峰值对应的游程长度作为单符梁厚度.音符中还有一类基元"符尾",它与符梁的语义功能相同,但仅用于独立音符,多声部乐谱数量较少.由于符尾尺寸相对固定其形态无明显几何特征,因此通常采用模板匹配或光学字符识~lJ(OpticalCharacterRecognition,OCR)方法识别之, 本文不再赘述.4音符结构分析4.1基于"作用场"的音符基元关系描述判别基元之间的关系是结构分析的重要前提.现有音符基元关系描述方法普遍过于刚性和几何化,将位置关系归结为几种固定类型,使用固定的阈值进行判别.这种方法对音符中的连续或不精确的位置关系表达不足,造成对复杂环境适应性弱,容错性差J.为克服这个缺陷,本文受模糊集理论思想的启发,结合物理学中的"作用场"概念,提出基于"作用场"的音符基元关系描述方法.定义1(音符基元作用场)设F代表音符基元作用场,F是一个四元组<l,v2,Fh,>,即F=<V1,,,>,其中,,为作用体,代表产生作用场的2个音符基元对象,对象属性包括基元包围框数据,校验位及其相关的作用场队列;为水平方向作用势;为垂直方向作用势.根据作用体的不同,音符作用场分为"符干一符头作用场" 与"符干一符梁作用场".定义中的作用势是一标量值,由以基元空间位置(坐标)为自变量的势函数决定.表1给出了"符干符头垂直方向作用势"的函数定义.另外3个不同基元和方向的势函数定义与之类似,此处从略.其中,stem表示符于基元;nh表示符头基元;space表示当前基元所属五线谱的谱线问距,gap=qmce/2;TOP,BOT分别为基元连通域包围框的上下边界.表1中厂的变化趋势说明如下:符头远离符十时(区间I,区间9),不产生作用场;随着符头逐渐接近符干端点(区问2,区间8),{厂l逐渐增大;当符头与符干重叠到一定程度(区间3, 区间7),达到最大值1;随着符头逐渐离开符十两端进入符干内部(区间4,区间6),逐渐减小;当符头到达符干腹部区域(区间5),减小到最小值0;0时符头靠近符_f上方;0时符头靠近符十卜方.表l符千-符头垂直方向作用势基于"作用场"的音符基元关系描述方法具有如下优势:(1)距离能够直观,连续地表示基元之间的关系.势函数是距离的函数,通过势函数描述基元问的关系,能达到鲁棒性和精确性的统一,对于复杂的数据环境有良好的适应能力.(2)从势函数定义可以看出,作用场携带有知识.具有正确音符结构的基元之间拥有较大的作用势,而非特征结构的作用势相对较小或不产生作用场.因此,作用场在很大程度上揭示了音符结构的内在特征,为一步的音符结构细分提供了极大方便.(3)在作用场的"吸引"下,离散基元聚合成若干组基元集群,而基元集群包含了潜在的音符对象.因此,音符结构分析时只需在基元集群这个"小环境"内进行搜索和判断, 不必遍历所有基元,从而降低搜索空间,提高效率.4.2音符子结构定义及其特征分析本文将音符细分为6类子结构:主音符结构,和声结构,反向和声结构,主符梁结构,符梁中音符结构和副符梁结构. 前3类为独立音符子结构,后3类为组合音符子结构,任何形式的音符均可由这6类结构组合而成.定义2(主音符结构,主符头,主音符作用场)设符干基元stem与符头基元"^的作用场为.n,fsn=<stem,nh肪>. 若fh×>0,则stem与组合成为主音符结构,"称为主符头,fsn称为主音符作用场.主音符结构是构成所有音符的必要成分,每个独立音符有且仅有一个主音符结构,该结构中的符干与符头具有稳定的位置关系,见图l(a).定义3(和声结构,和声符头,和声作用场)设为主音符作用场,.rt=<stem.nh:>,另有一符头基元'与stem 的作用场为',J,kn':<stem,nh'''>.若.'=0锄×'>O,则与stem组合成和声结构,"'称为和声符头,fsn'称为和声作用场,见罔1(b).和声结构依附于主音符结构,是音符中常见但非必要的结构成分.一个音符可以拥有多个和声结构,该结构中的符头相对于符干的纵向位置不稳定.若符干连接有符梁,和声符头与符梁垂向距离需大于谱线问距.符千朝I肺<0A,()符干朝Fo(a)主青符结构和声头I\.Il(b)和声结构和声符头\I+_{符头(c)反向和声结构图1独立音符子结构定义4(反向和声结构,反向和声符头,反向和声作用场)没fsn为一主音符作用场,H=<steln,nh>,另有一符头基元"'与stem的作用场为','=<stem,nh'1『7j''>.若,'=0/\×'<0,则月矗'与stem组合成为反向和声结构,'称为反向和声符头,'称为反向和声作用场.反向和声结构依附于主音符结构或和声结构,是音符中少见且非必要的成分,一个音符可以拥有多个反向和声结构, 其位置靠近和声符头或主符头,见图1【c).定义5(主符梁结构,主符梁,主符梁作用场)设stem为一主音符作用场的符千作用体,另有一符梁基元beam与~'tem 的作用场为6,fsb:<stem,beam>.若/77≠O,则stem与beam组合构成主符梁结构,beam称为主符梁,6称为主符梁作用场.主符梁结构是构成所有组合音符的必要成分,任何一个组合音符左右两端各有一个主符梁结构,符梁与符干具有稳定的位置关系,见图2(a).主0≠I】符粱_纛符符梁.t—剐.(a)主符梁结构(b)符梁中音符结构(c)副符梁结构图2组合音符子结构定义6(符梁中音符结构,符梁中音符作用场)设stem为一主音符作用场的符干作用体,beam为一主符梁作用场中的符梁作用体,beam与.~'tem的作用场为6,/;s'b=<stem,beam, >.若=O/\擘0,则stem与beam组合构成符梁中音符结构,Jsb称为符梁中音符作用场.符梁中音符结构依附于主音符结构和主符梁结构,是组合音符中常见但非必要的结构成分.一个组合音符可以拥有多个中符梁音符结构,该结构中符干与符梁的横向位置不稳定,见图2(b).定义7(副符梁结构,副符梁,副符梁作用场)设stem为一主音符作用场的符干作用体,另有一符梁基元beam与stem 的作用场为fsb,b=<stem,beam:/77,>.若=0,则beam与stem组合构成副符梁结构,beam称为副符梁,fsb称之为副165—符梁作用场.副符梁结构依附于主符梁结构和主音符结构,是组合音符中少见且非必要的成分.一个组合音符可以拥有多个副符梁结构,符梁的纵向和横向位置均不稳定,但符梁间距小于谱线间距,见图2(c).上文针对符尾基元的相关结构进行定义,符尾依附于符干末端,可将它看成一种特殊的符头基元,与符干构成主音符结构,其识别方法亦同主音符结构.表2从基元关系稳定性,结构间依附性,关键程度3个方面对音符子结构进行评述.表2音符予结构评述4.3音符结构分析现有音符结构分析方法大多采用二阶段模式.首先分析符干与符头,识别出独立音符,然后分析符干与符梁,识别出组合音符J.二阶段模式未对音符结构进行细分,识别过程无"重点".而人工读谱是一个"先全局,再局部,后细节"的逐步求精过程,并按关键程度从高到低的顺序分析候选基元的结构匹配条件.以表2内容为依据,确定关键结构优先定位的音符结构分析工作流程,如图3所示.册图3音符结构分析工作流程每个音符虫的结构确定如下:Stepl对于每个候选音符基元(作用体),初始化其作用场队列,计算垂直,水平方向作用势,校验位设为Unchecked. Step2根据定义2搜索"主音符作用场",设置其相应符干,符头的校验位为Checked.Step3根据定义5搜索"主符梁作用场",若其符干的校验位为Checked,则设置其符梁校验位为Checked.Step4若某符梁作用体的校验位为Checked,根据定义6搜索该符梁的"符梁中音符作用场".Step5若某符干作用体的校验位为Checked,根据定义3判断该符干是否存在"和声作用场",若存在,则设置其和声符头的校验位为Checked.Step6若某符干作用体的校验位为Checked,根据定义4判断该符干是否存在"反向和声作用场",若存在,则设置其反向和声符头的校验位为Checked.Step7若某符梁作用体的校验位为Checked,根据定义7判断该符梁是否存在"副符梁作用场",若存在,则设置其副符梁的校验位为Checked.在结构分析完成后,音符语义确定如下:Stepl将每一个校验位为Checked的符干标记为一个"发音单元".Step2找出该符干的作用场队列中所有校验位为Checked的符头与符梁/尾.Step3由符头所处的谱线位置确定音高,若存在多个符头,则该"发音单元"为和声音符,主符头与和声符头同属一个发音单元(同时发音).Step4由符梁/尾的个数确定发音单元的时值.音符结构细分,关键结构优先定位具有如下优势:(1)减小复杂音符的识别难度,降低因不必要判断而付出的开销,提高识别效率.如,如果符干上未搜索到主符头(符干校验位为Unchecked),则直接判定为"伪符干",无需再判断该符干附近的其他基元.(2)关键,稳定的结构识别准确性通常较高,优先识别能减少先识别次要结构引起的误识,还能指导后续复杂结构的分析,排除候选基元中的冗余.以图4为例,其中一个符梁的特征与符头相似,基元抽取阶段会出现冗余(既是符头候选又是符梁候选).若采用传统二阶段模式的音符结构分析方法,则独立音符首先被识别,该符梁将被误识为符头.本文方法优先确定较稳定的主符梁结构,主符梁对后续和声结构中符头的位置产生约束,当符头与主符梁的间距小于谱线间距时即可判断该符头为"伪符头",从而避免误识.,.图4符粱误识为符头的情况5实验评测应用本文方法开发智能光学乐谱识别系统(IntelligentOpticalMusicRecognitionSystem,~OMRS).将IOMRS与现今流行的2款商业乐谱识别软件SharpEye2.68和SmartScore XPro进行对比评测,其音符识别效率和正确性都较高.测试谱例来源文献[7】,谱例均为多声部钢琴谱,音符类型丰富且乐谱内容复杂程度不一.评测方法:无论何种形态音符,均以识别出的发音单元为评测对象,若音符发音单元中符头个数,位置以及符梁/尾个数全部正确,则该音符识别正确.表3为3个系统在InterCore63001.86GHzPC机上的实测结果,包括8个谱例的详细数据和总平均数据,其中,扫描分辨率为150dpi;图像尺寸1200x1600像素;C为正确识别数;F为错误识别数;M为漏识数;发音单元总数:c;识别率=C/T.表3IOMRS,SmartScore,SharpEye测试结果测试项发元SmartScoreSharpEye伽∞m舯鹕㈣㈨O00O0328O000●25279906387OO22444伽m=呈啪拍"㈣㈨呲呱000O02240OO2238798052O50O22454圮8273369O346009898888"99999990111O200●O2278795424001245579907657OO●,r24:,2345678例例例例例例例例谱谱谱谱谱谱谱谱随着谱例音符数的增加,音符排列越密集,音符结构越复杂.由表1可知,谱例1~谱例8,SmartScore与SharpEye的识别率呈较明显的下降趋势,IOMRS保持相对稳定的识别率,IOMRS的平均识别率为98.65%优于SmartScore的98.00%与SharpEye的98.28%;IOMRS的单幅处理时间为0.5s-0.7s优于SmartScore的2s-3s与SharpEye的3s-4s.图5为表中谱例8(局部),图6在[MORS下的音符识别结果,识别结果全部正确.图5多声部乐谱谱例(局部).…b一.一..[[I一}一一一图6对图5的音符识别结果图7和图8分别为该谱例在SmartScore和SharpEye下的识别结果,SmartScore显示有10处音符识别错误,SharpEye 显示有7处音符识别错误.图7SmartScore识剐结果图8SharpEye识别结果6结束语在音符基元抽取阶段提出算法借鉴人工读谱的"逐步求精"和"先验知识引导"思想.在音符结构分析阶段提出音符基元关系描述方法能够直观,精确地描述基元关系.在此基础上实现关键结构优先识别的音符结构分析方法,该方法能够减少将次要结构先分析引起的误识.实验测试结果表明, 本文方法的音符识别性能达到目前优秀商业乐谱识别系统的水平.下一步的研究方向是将本文方法扩展应用到自然手写乐谱的脱机和联机识别中.参考文献[1]GeorgeSE.VisualPerceptionofMusicNotation:On—lineandOff-lineRecognition[M].[S.I.】:IRMPress,2004【2]BainbridgeD,BellTC.AMusicNotationConstructionEnginefor OpticalMusicRecognition[J]2003,33(2):173—200.[3]FahmyH.AGraph-rewritingPapadigmforDiscreteRelaxation: ApplicationtoSheet—musicRecognition[J].InternationalJournalof PatternRecognitionandArtificialIntelligence,1999,12(6): 763—799.[4]刘晓翔,张树生.乐谱图像倾角快速检测方法[J].计算机工程, 2004,3O(2):33—35.[5】刘晓翔,张树生.乐谱图像中谱线的检测与删除方法研究[JJ. 中国图象图形:A版,2003,8(增刊1):657-661[6]RossantBlochIRobustandAdaptiveOMRSystemIncluding FuzzyModeling,FusionofMusicalRules,andPossibleError Detection[J].EURASIPJournalonAppliedSignalProcessing,2007.(1):815-841.[7]许民.理查德?克莱德曼经典通俗钢琴曲[M].长春:长春出版社,1995.编辑陆燕菲~】67—。
基于谱线特征的调制方式自动识别方法

- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谱线的识别
我选做实验的名称是“氢光谱与类氢光谱”,就是测量氢与类氢元素的光谱并对光谱加以分析。
在这个实验中我在谱线的识别方面进行了一些研究。
原理:
由于该实验要求我们计算钠原子光谱各个线系的量子缺损,因此首先我所要做的就是把各个线系的谱线分开来。
我通过查找相关资料获得了钠原子光谱的详细信息(见附录1),这里面包括了多少纳米的波长(理论值)对应的哪一种跃迁也就是对应哪一个谱线系。
因此我现在所要做的就是将实验所测得的波长与我所查找到的理论值一一对应起来。
这里需要说明的是:对于查找到的理论值,我只承认它的准确性,但不承认它的完备性。
也就是说可能理论值给出的钠原子谱线并不完全,但是只要理论值中出现的波长,我都认为它是正确的。
图1:钠灯的光谱图
(a)(b)
(c)(d)
(e)(f)
图2:钠灯光谱图的放大图
如图1所示是实验所测得的钠灯的光谱图。
虽然谱线波长的数值都已经标在了坐标轴上,然而这些数据却是不能直接使用的。
因为光谱仪在运转的过程中,由于电机运转不可避免的会产生误差,而且这种误差会随着电机运转距离的增长而变大。
显然将实验值和理论值直接一一比对比较困难而且会产生较大误差的。
因此我采用以下办法来查找与实验值对应的理论值。
首先我们先把钠灯所具有的谱线绘成一张表,见附录2的“谱线波长实验值”这一列。
另外由于理论值所测定的波长非常的详细,有的甚至能给出相邻仅仅0.00036nm的两根谱线,而我们实验室光谱仪所能测量的最小波长差为0.01nm,也就是说诸如上面相邻仅0.0036nm的两根谱线从实验测得的谱线上看来其实是一条,这还不包括出射缝的大小对于分辨能力的限制。
因此为了便于与实验值更好的核对,我将理论值做了如下处理:将理论值中相邻波长小于0.01nm的两根(或更多)谱线用它们的平均值代替见附录2的“谱线波长理论值”这一列。
虽然经过以上处理,但是我们还是很难看出实验值与理论值有什么相似之处,这主要是由于上面所说的光谱仪运转误差较大的缘故。
如实验测得的钠的黄双线的平均波长为592.55nm,而理论值给出的波长为589.294nm,可见光谱仪运转所造成的误差足有几个纳米
的量级。
为此我对数据进行如下的处理:我将实验测得的相邻的两根谱线的波长相减,求出了相邻谱线的波长间隔。
另外我把理论值也做这样的处理,见附录2的“相邻谱线波长间隔”这一列。
我们注意到当波长间隔比较小的时候,实验值和理论值没有什么相似之处。
这其实还是由于光谱仪运转的误差所造成的影响。
如果不存在这种影响的话,即使光谱仪没有调零,实验值和理论值的波长间隔应该是完全符合的(这里未涉及实验值和理论值波长有缺失的情况)。
但是当波长间隔比较大的时候,实验值和理论值是有很大的共性的。
这主要是由于光谱仪从前一个谱线波长运转到某一个谱线中所产生的误差比其从头运转到该谱线的误差要小。
也就是说:看波长间隔时,仪器运转的误差的影响将比纯粹看波长要小。
而较大的波长间隔将这种误差的影响降得更低了。
因此我们很容易的发现实验值与理论值波长间隔中的对应关系。
(见附录3)
既然波长间隔的对应关系能够确定,那么波长的对应关系也就能够确定下来,继而也就能通过附录1中理论值波长对应的组态得到实验值波长所属的组态了。
(见附录4)
优点:
从原理中我们看到:这种方法能够比较方便的确定波长间隔较大的谱线的对应关系。
同时它对理论值的要求也不是很高,只需要理论值波长是准确的就可以了,而对理论值是否给出谱线的强度,以及理论值的完备性都没有很高的要求。
不足:
这种方法对于波长间隔较小的谱线是比较束手无策的,如钠原子414.98nm到455.59nm 的谱线对应关系难以确定,因此我没有给出。
来源:/db/ 附录2:实验值与理论值比较
注:从谱线414.98nm到455.59nm之间的实验值波长间隔比较小且混乱,因此较难定出比较确切的对应关系。
附录4:实验值波长对应的理论值波长及所属的组态。