MP3文件格式解析
decodeaudiodata 可以解析的格式

解读编码音频数据(decodeaudiodata)的可解析格式1. 介绍编码音频数据(decodeaudiodata)是一种用于处理和解析音频文件的重要技术,它可以将音频文件转换为计算机可以识别和处理的数字数据。
而decodeaudiodata可以解析的格式,涵盖了多种音频编码格式,每种格式都有其特定的特点和用途。
本文将针对decodeaudiodata可解析的格式展开深入探讨,从不同角度对其进行全面评估,并结合个人观点和理解进行分析。
2. 可解析的格式在实际应用中,decodeaudiodata可以解析的格式包括但不限于以下几种:2.1 WAV格式:WAV是一种无损音频文件格式,它能够提供较高的音频质量和音频数据的完整性。
由于其广泛应用于Windows系统中,WAV格式的音频文件在解析时具有较高的兼容性。
2.2 MP3格式:MP3是一种有损音频文件格式,它具有较小的文件大小和较高的音频压缩比。
在解析时,decodeaudiodata可以对MP3格式进行快速、高效的解码,满足对音频文件的高质量解析需求。
2.3 FLAC格式:FLAC是一种无损音频文件格式,它能够实现对音频数据的无损解析和还原,保证了音频质量的高保真性。
当处理对音频质量要求较高的应用场景时,decodeaudiodata对FLAC格式的解析具有很大的优势。
3. 深度评估在实际应用中,根据不同音频文件的格式特点和解析需求,对decodeaudiodata可解析的格式进行深度评估具有重要意义。
在解析过程中,需要综合考虑音频数据的质量、文件大小、解析速度和兼容性等因素,选择合适的解析格式以满足具体的应用需求。
3.1 音频质量:对于对音频质量要求较高的场景,如专业音乐制作、音频处理等领域,FLAC格式的解析具有明显优势,能够保证音频数据的高保真性和完整性。
而对于一般的音频播放和传输场景,MP3格式可以满足基本的音频质量需求。
3.2 文件大小:在有限的存储空间和带宽条件下,对音频文件进行解析时需要考虑文件大小对解析效率和速度的影响。
歌曲格式英文缩写的含义

MP3全称是Moving Picture Experts Group Audio Layer Ⅲ。
简单的说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer 3,所以人们把它简称为MP3。
MP3是利用MPEG Audio Layer 3 的技术,将音乐以一比十一甚至一比十二的压缩率,压缩成容量较小的文件,换句话说,能够在音质损失很小的情况下把文件压缩到更小的程度。
而且还非常好的保持了原来的音质。
正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。
每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。
使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
MP3编码质量分为固定码率(CBR),平均码率(ABR)和动态码率(VBR)。
补充:最高比特率320K,高频部分一刀切是它的缺点。
音质不高!WMA全称是Windows Media Audio,是微软力推的一种音频格式。
WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到一比十八,生成的文件大小只有相应MP3文件的一半。
这对只装配32M的机型来说是相当重要的,支持了WMA和RA格式,意味着32M的空间在无形中扩大了2倍。
此外WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
补充:128kbps为wma最优压缩比,128kbps wma=192kbps mp3。
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。
WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
常见的文件头格式

常见的文件头格式文件头格式,也称为文件标记或文件签名,是一种用于标识文件类型的数据结构。
在计算机科学中,不同的文件类型由不同的文件头格式来标识。
常见的文件头格式有许多种,下面是一些常见类型的文件头格式:1. 文本文件:UTF-8:通常以 EF BB BF 开头。
UTF-8 是一种可变长度字符编码,用于表示 Unicode 字符。
UTF-16:通常以 FE FF 开头。
UTF-16 是一种 Unicode 字符编码。
ISO-8859-1:也称为 Latin-1,通常以 00 开头。
它是一种用于西欧语言的字符编码。
2. 图片文件:JPEG:以 FF D8 FF 开头。
JPEG 是一种常见的图像文件格式。
PNG:以 89 50 4E 47 0D 0A 1A 0A 开头。
PNG 是一种无损压缩的位图图形格式。
GIF:以 47 49 46 38 或 47 49 46 39 开头。
GIF 是一种基于 LZW 算法的连续色调无损压缩格式。
3. 音频文件:MP3:不同的编码可能有所不同,但常见的以 FF FB 开头。
MP3 是一种音频压缩格式。
WAV:通常以 52 49 46 46 开头。
WAV 是 Windows 操作系统下的音频文件格式。
4. 视频文件:AVI:通常以 52 49 46 46 开头。
AVI 是 Microsoft 开发的音频视频交错格式。
MP4:以 66 FF FF 或 00 FF FF 开头。
MP4 是一种音频和视频封装格式,常用于数字媒体播放。
5. 压缩文件:ZIP:以 50 4B 03 04 或 50 4B 05 06 开头。
ZIP 是用于数据压缩的归档文件格式。
RAR:以 52 61 72 开头。
RAR 是用于数据压缩的归档文件格式,由 WinRAR 公司开发。
6. 可执行文件:PE (Windows 可执行文件):通常以 4D 5A 开头。
PE 是 Microsoft Windows 可执行文件的格式。
常用文件格式知识点小结

常用文件格式知识点小结一、知识概述《常用文件格式知识点小结》基本定义:常用文件格式就是电脑存储设备中用来保存不同类型信息的特定格式,是数据和文件的容器。
这些格式让电脑能够识别、存储和管理文件。
重要程度:在我们日常工作和学习中,几乎每天都要和不同的文件格式打交道。
懂得这些格式不仅能帮我们高效地管理和查找文件,还能避免因格式不匹配而导致的各种问题。
前置知识:在使用文件格式之前,你需要了解一些基础的电脑操作知识,比如如何打开文件夹、如何重命名文件等。
应用价值:不同的文件格式适用于不同的场景,比如Word文档适合编辑和排版文字,JPEG图片格式则适合保存和传输图像。
选对格式,能大大提高工作效率。
二、知识体系知识图谱:文件格式是计算机科学中的基础知识之一,和操作系统、文件管理等知识点紧密相连。
关联知识:文件格式的选择往往与文件内容、大小、用途等因素有关,同时也影响着文件的可读性和兼容性。
重难点分析:重难点在于了解不同文件格式的特点和适用范围,以及如何在不同场景下选择合适的文件格式。
考点分析:在考试中,常会考查对各种文件格式的基本认识和实际应用能力。
三、详细讲解概念辨析:文件格式就像文件的“身份证”,它告诉电脑这个文件该如何被读取和显示。
特征分析:不同格式的文件有不同的特点,比如PDF格式不易被篡改,适合保存正式文档;MP3格式则专门用于音频数据的压缩存储。
分类说明:文件格式大致可以分为文档格式(如Word、PDF)、图像格式(如JPEG、PNG)、音频格式(如MP3、WAV)、视频格式(如MP4、AVI)等。
应用范围:选择文件格式时,要考虑它的兼容性、编辑性以及传输效率。
四、典型例题例题一《图片格式转换》题目内容:有一张BMP格式的图片,需要将其转换为JPEG格式以节省存储空间。
解题思路:选择合适的图片编辑或转换工具,进行格式转换。
详细解析:首先,找到支持格式转换的软件,比如Picasa或Photoshop;然后,将BMP格式的图片导入软件;接着,选择JPEG作为输出格式;最后,保存转换后的文件。
lrc格式 MP3格式

lrc格式MP3格式什么是lrc格式?lrc是英文lyric(歌词)的缩写,被用做歌词文件的扩展名。
以lrc为扩展名的歌词文件可以在各类数码播放器中同步显示。
大部分MP3显示歌词的方法使用的是lrc格式的歌词文件,也是当前网络上最流行的一种歌词格式。
我在网上找到了“迷你歌词(MiniLyrics)”这个软件。
这个软件是winamp的一个插件,使用它之前需要在你的系统上安装winamp,这个大家应该都有吧?没有?也行我有下载地址:winamp,然后再安装迷你歌词(MiniLyrics),用winamp播放歌曲时,迷你歌词(MiniLyrics)会同时运行,并自动去它的服务器下载正在播放的歌曲的LRC歌词文件,通常只有1-2K,非常小巧,对网络速度基本上没有要求。
我们需要的正是它下载的这个LRC格式的歌词文件,默认下载LRC 文件的路径在MiniLyrics的安装目录Download下,大家也可以修改成你想要的路径。
还要注意一个问题:在电脑上一定先要把下载的LRC歌词文件名改成跟相应的MP3音频文件名相一致(当然扩展名不一致了),然后将你要的歌词文件复制到MP3播放器中,LRC文件和相应的MP3文件必须放在在同一个目录下,例如七里香.mp3对应的一定要是七里香.lrc,我的地盘.mp3对应的一定要是我的地盘.lrc。
因为迷你歌词下载的有可能是类似的名称,如果不是一模一样有可能造成不能播放!还要注意的是歌词文件中的歌词字数应该不超过500 字!同步显示歌词时常见问题解答:1)同步显示歌词有的可以、有的不可以我想可能是以下几个原因:首先要保证LRC文件的版本是1.0的;其次歌词字数可能太多,最好不要超过500字;再有LRC文件歌词对应的显示时间不准确,请用歌词力量等软件编辑。
2)串词现象(是指在播放一首歌曲时却同步显示另一首歌曲的歌词):我估计是MP3文件名字和对应的LRC文件名字起的有问题,如果闪存中有一名歌手的几首歌曲,命名时最好不要加上歌手的姓名等除歌名外的其他信息,比如你的闪存中有周杰伦的“我的地盘”和“七里香”,最好不要把MP3文件命名为周杰伦-我的地盘.mp3、周杰伦-七里香.mp3,而把相应的LRC文件命名为周杰伦-我的地盘.lrc、周杰伦-七里香.lrc,这样系统容易混淆歌曲及其对应的歌词文件,发生串词现象。
音频文件格式全介绍

音频文件格式全介绍作者:苏信时间:2021年7月本文已经刊登于《新电脑》2021年7月号,请勿转载.自从PC支持多以来,陆陆续续地出现了许多音频格式.这些格式既有流行的也有不那么流行的,它们的,本文向你一一道来。
主流目前的主流音频格式其实不少。
不同的格式有自己的用途,比如大家都应该很熟悉的MP3格式就是用于聆听用途的。
下面我们逐一介绍:存在便是永恒—WW是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
不客气地说,它实际上是Apple电脑的AIFF格式的克隆。
通常我们使用W格式都是用来保存一些没有压缩的音频,但实际上W格式的设计是非常灵活(非常复杂)的,该格式本身与任何数据都不冲突,换句话说,只要有软件支持,你甚至可以在W格式里面存放图像。
之所以能这样,是因为W文件里面存放的每一块数据都有自己的标识,通过这些标识可以告诉用户究竟这是什么数据。
在WINDOWS平台上通过ACM(Audio press ion Manager)结构及相应的驱动程序(在这里通常称为CODEC,编码/),可以在W文件中存放超过20种的压缩格式,比如ADPCM、G、CCITT G。
711、G.723等等,当然也包括MP3格式。
图表-使用音频编辑软件WeCN()列出Windows安装了的ACM驱动信息虽然W文件可以存放压缩音频甚至mp3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。
目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。
这些软件包括:Sound Forge,Cool Edit Pro, WeLab等等。
由于W的支持实在是太广泛了,可以说,即使Windows退出历史舞台,W格式也不会.老当益壮– mp3第二个要提到的就是改变了世界的mp3了。
这个比喻相信大家都**意。
计算机中的常见文件格式及其应用
计算机中的常见文件格式及其应用在计算机领域,文件格式是指对数据在存储介质上进行组织和编码的方式。
常见的文件格式多种多样,每种格式都有其独特的应用领域和特定的文件扩展名。
本文将介绍一些常见的计算机文件格式,包括其应用场景和特点。
一、文本文件格式1. TXT(纯文本文件):- 文件扩展名:.txt- 应用场景:存储适合于在文本编辑器中编辑和查看的纯文本信息,如代码文件、配置文件、日志文件等。
- 特点:不包含任何格式化信息,只包含文本字符。
大小小、结构简单,易于编辑和传输。
2. CSV(逗号分隔值文件):- 文件扩展名:.csv- 应用场景:存储结构化的表格数据,常用于电子表格软件导出和数据交换。
- 特点:每行代表一个数据记录,用逗号或其他分隔符分隔字段值,可以通过各种软件进行打开和处理。
3. JSON(JavaScript对象表示法):- 应用场景:存储和传输结构化的数据,常用于Web应用程序中的数据交换和配置文件。
- 特点:使用简洁的文本表示数据,易于解析和生成,支持多种编程语言。
二、图像文件格式1. JPEG(联合图像专家组):- 文件扩展名:.jpg、.jpeg- 应用场景:存储照片和其他真实场景的图像,在Web页面和数字设备上广泛应用。
- 特点:支持高压缩比,图像质量可调节,但会有一定损失。
适用于彩色图像。
2. PNG(可移植网络图形):- 文件扩展名:.png- 应用场景:存储透明效果较好的图像,如Logo、图标等,常用于Web设计和电子出版。
- 特点:支持无损压缩,不会损失图像质量。
透明度通道能够显示图像的透明效果。
3. GIF(图形交换格式):- 应用场景:存储简单的动画图像和低分辨率的图像,常用于社交媒体和网页表情等。
- 特点:支持动画效果,可以设置透明色,但色彩显示较为有限。
三、音频文件格式1. MP3(MPEG音频层3):- 文件扩展名:.mp3- 应用场景:存储音频信息,广泛用于音乐播放器和网络音乐服务。
ncmmp3格式
NCMmp3格式
NCM格式是网易云音乐的专属音乐格式,将音乐以特殊的编码方式加密在ncm文件中。
如果想要将ncm格式转换为MP3格式,可以按照以下步骤进行:方法一:使用嗨格式视频转换器
1.打开嗨格式视频转换器,选择【音频转换】功能。
2.点击【添加文件】或【添加文件夹】,将需要转换的ncm文件添加到
软件中。
3.在右侧设置中选择需要转成的格式,这里点击选择“MP3”格式。
4.点击软件界面右上角的【全部转换】按钮,等待转换完成。
5.转换完成后,点击右侧的“打开文件”便可以看到转换好的MP3文件。
方法二:使用审查元素或检查界面
1.进入审查元素或者检查界面之后,先点击【Network】,再点击【Media】,
然后按快捷键“F5”进行刷新。
2.等几秒钟,在下面的位置就会出现正在播放的音乐文件,在文件上
点击鼠标右键,然后点击【Open in new tab】。
以上两种方法都可以将NCM格式转换为MP3格式,可以根据个人需求选择合适的方法进行操作。
音频文件格式
音只有256个级别,16位声卡有65536个高低音级别。
6
声道数
❖ 声道数就是声音录制时的音源数量或回放时相应的扬声器 数量。
❖ 单声道(Mono)、立体声(Stereo)、3D 环绕声 (3D Surround)、虚拟环绕声(Virtual Surround )
15
MPEG
• MPEG的全名为Moving Pictures Experts Group/Motin P ictures Experts Group,中文译名是动态图像专家组
• MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPE G-4、MPEG-7及MPEG-21等。该专家组建于1988年, 专门负责为CD建立视频和音频标准,而成员都是为视频、 音频及系统领域的技术专家。及后,他们成功将声音和影 像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压 缩编码标准,并制定出MPEG-格式,令视听传播方面进 入了数码化时代.
• 标准格式化统的一W类型AV标文识件和coCmD.m格ic式ro一so样ft.w,a也ve是fo4rm4.1K的取样 频率,16位量化数字,因-au此d在io 声音文件质量和CD相差无
几!
开发者 Microsoft & IBM
• WAV打开工具是WINDOWS的媒体播放器。
格式
音频编码
延伸自 RIFF
(Digital Rights Management)方案加入防拷贝保护 • WMA还支持音频流(Stream)技术,适合在网络上在线
播放 • 同一格式,音质好的可与CD媲美,压缩率较高的可用
于网络广播
常用音频文件格式
常用音频文件格式1、cd——*.cda文件——基本无损——不能直接拷贝即我们通常所说的CD音轨,是我们所熟悉的CD音乐光盘中的文件格式。
标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。
CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。
一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短。
在电脑上看到的“*.cda文件”都是44字节长,不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用Windows Media Player/格式工厂把CD格式的文件转换成WAV。
2、wav、wave格式——波形文件——基本无压缩WAV是波形文件,可直接存储声音波形,还原的波形曲线十分逼真。
WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式,是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。
但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。
声音文件质量和CD相差无几。
能够真实记录自然声波形,基本无压缩,数据量大。
3、mp3格式——音频压缩技术——占用空间小MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3,简称为MP3。
它被设计用来大幅度地降低音频数据量。
利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。
用MP3形式存储的音乐就叫作MP3音乐,能播放MP3音乐的机器就叫作MP3播放器。
最高参数的MP3(320Kbps)的音质较之CD的,FLAC和APE无损压缩格式的差别不多,其优点是压缩后占用空间小,适用于移动设备的存储和使用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11-10 2 sampling_frequency, 00 – 44.1KHz, 01 – 48KHz
10 – 32 KHz, 11 –保留
9 1 padding_bit,1意味着帧里包含padding位,仅当采样频率为44.1KHz时发生。
8 1 private_bit
当144 * Bitrate / SamplingRate不能被8整除,则加上相应的paddingBit.
B,MAIN_DATA:
MP3的granule包含18 * 32个subband采样。每个数据帧含有两个granule的数据,其内容结如下:
- main_data_end pointer
- side info for both granules (scfsi)
在二进制文本编辑器里我们还可看到一个字符串“LAME”,并且后面清楚地跟着版本号。这就是20个字节的Zone B初始LAME信息,表示该文件是用LAME编码技术。接下来一直到该帧结束就是Zone C-LAME标签。
3,相关资料
×Mp3 Info Tag rev 1 specifications - draft 0
A,帧头结构如下:
位置长度描述
(BIT)(BITS)
————————————————————————————
31-19 12 Frame sync(0xFFF)
18/17 2 Layer, 00 – reserved, 01 – Layer III
10 – Layer II, 11-Layer I
16 1 protection_bit, 0意味着受CRC保护,帧头后面跟16位的CRC。
00-no emphasis, 01 – 50/15 microsec. Emphasis
10 – reserved, 11 – CCITT J.17
1)无论帧长是多少,每帧的播放时间都是26ms
2)数据帧大小:
FrameSize = 144 * Bitrate / SamplingRate + PaddingBit
char Album[30]; /*专集*/
char Year[4]; /*出品年代*/
char Comment[28]; /*备注*/
char reserve; /*保留*/
char track;; /*音轨*/
char Genre; /*类型*/
其实,关于最后31个字节还存在另外一个版本,就是30个字节的Comment和一个字节的Genre.
I, ID3V2
ID3V2到现在一共有四个版本,但流行的播放软件一般只支持第三版,既ID3V2.3。每个ID3V2.3的标签都一个标签头和若干个标签帧或一个扩展标签头组成。关于曲目的信息如标题、作者等都存放在不同的标签帧中,扩展标签头和标签帧并不是必要的,但每个标签至少要有一个标签帧。标签头和标签帧一起顺序存放在MP3文件的首部。
C,LAME标签帧
可是,当你真的打开一个MP3文件的时候,你会发现,很奇怪,很多时候第一个数据帧的帧头后面的32个字节居然都为0,这是为什么呢,这么奇怪的解码信息该如何解释?找到MP3 INFO TAG REV SPECIFICATION的网站,我才明白,原来第一帧并不是真正的数据帧,而是LAME编码的标志帧。
×MP3文件格式
×MP3 SPEC-IS0 11172-3 AUDIO PART
这里要解释的一个概念就是位流――bitstream。我们平常接触到的数据都是整数,最小的单位就是byte后者char。虽然我们也会用一个字节里的不同位来表示不同的含义,但总的来说,我们在出来数据的时候还是把它当作一个个字节看待。但对MP3这种数据格式来说,这是行不通的。在解码时,它的数据输入就是一个个比特流。其中一个或几个比特会是你的采样数据或者信息编码。你需要从整个MAIN_DATA里提取你所需要的以BIT为单位的参数和输入信号,从而进行解码。所以我们需要一个子程序,getbit(n),也就是从缓冲中提取所需要的位,并形成一个新的整数,作为我们的输出。
2,MP3文件格式
用一个二进制查看器(比如Ultra-Edit)打开一个MP3文件,就能看到一大堆看似杂乱无序的数据。但只要用心了解就会知道,其实,这一切都是有规律可循的。
MP3文件是由帧(frame)构成,帧是MP3文件的最小组成单位。每帧都包含帧头,并可以计算帧的长度。根据帧的性质不同,文件主要分为三个部分,ID3v2标签帧,数据帧和ID3v1标签帧。并非每个MP3文件都有ID3v2,但是数据帧和ID3v1帧是必须的。ID3v2在文件头,以字符串“ID3”为标志,包含了演唱者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量。ID3v1在文件结尾,以字符串“TAG”为标记,其长度是固定的128个字节,包含了演唱者、歌名、专辑、年份等信息。
7-6 2 mode, 00-stereo, 01-joint stereo(intensity stereo and/or ms_stereo)
11- dual_channel, 11 – single_channel
5-4 2 mode_extension,在Layer III中表示使用了哪一种joint stereo编码方式。
有了上述的这些信息,我们就可以自己写代码,从MP3文件中抓取信息以及修改文件名了。但是,如果真的想写一个播放软件,还是需要读它的数据帧,并进行解码。
III,数据帧
数据帧往往有多个,至于有多少,由文件大小和帧大小来决定。每个帧都有一个四字节长的帧头,接下来可能有两个字节的CRC校验,其存在由帧头中的具体信息决定。接着就是帧的实体数据,也就是MAIN_DATA了。
标签头
长度为10个字节,位于文件首部,其数据结构如下:
char Header[3]; /*字符串"ID3" */
char Ver; /*版本号ID3V2.3就记录3 */
char Revision; /*副版本号此版本记录为0 */
char Flag; /*存放标志的字节,这个版本只定义了三位,很少用到,可以忽略*/
char Size[4]; /*标签大小,除了标签头的10个字节的标签帧的大小*/
标签大小为四个字节,但每个字节只用低7位,最高位不使用,恒为0,其格式如下:
0xxxxxxx 0xxxxxxx 0xxxxxxx 0xxxxxxx
计算公式如下:
ID3V2_frame_size = (int)(Size[0] & 0x7F) << 21
TYER:年份
TCON:类型
COMM:备注,格式:“eng\0备注内容”,其中eng表示所使用的语言
帧大小为四个字节所表示的整数大小。
II, ID3V1
其数据结构如下:
char Header[3]; /*标签头必须是"TAG"否则认为没有标签*/
char Title[30]; /*标题*/
char Artist[30]; /*作者*/
这里又要牵涉到两个概念:CBR和VBR。CBR表示比特率不变,也就是每帧的长度是一致的,它以字符串“INFO”为标记。VBR是Variable BitRate的简称,也就是每帧的比特率和帧的长度是变化的,它以字符串“Xing”为标记。同时,它还存放了MP3文件里帧的总个数,和100个字节的播放总时间分段的帧的INDEX,还有其他一些参数,这被称为Zone A,传统Xing VBR标签数据,共120个字节。
MP3的音频质量取决于它的Bitrate和Sampling frequency,以及编码器质量。MP3的典型速度介于每秒128到320kb之间。采样频率也有44.1,48和32 kHz三种频率,比较常见的是采用CD采样频率——44.1kHz。常用的编码器是LAME,它完全遵循LGPL的MP3编码器,有着良好的速度和音质。
MP3
1,MP3简介
MP3是今天一种常见的音乐格式,但恐怕除了工作要求之外,有兴趣对此进行研究的人恐怕不多。所以,当我打算做MP3解码方面的工作时,在找资料时也颇费了一番周折,同时也觉得很有趣。所以想在这里分享一下自己的心得,做一个总结性的介绍。这样有兴趣的同志也可以对此有一个大概了解,尽快入门。
MP3是MPEG-1 Audio Layer 3的简称,是当今比较流行的一种数字音频编码和有损压缩格式(有Layer 3,也必然有Layer1和Layer2,也就是MP1和MP2,但不在本文讨论范围之内)。MP3技术的应该可以用来大幅度的降低音频文件存储所需要的空间。它丢掉脉冲编码调制(PCM)音频数据中对人类听觉不重要得数据,从而达到了较高的压缩比(高达12:1-10:1)。简单地说,MP3在编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成有较高压缩比的MP3文件,并使压缩后的文件在回放时也能够达到比较接近原音源的效果。
-ide info granule 2
- scalefactors and Huffman code data granule 1
- scalefactors and Huffman code data granule 2
主要数据里包含了scalefactors, Huffman encoded data和ancillary information。其内容不再详叙,可以参考MP3 SPEC-IS0 11172-3 AUDIO PART。我们一般用的都是立体声,scfsi的长度为32个字节。
| (int)(Size[1] & 0x7F) << 14
| (int)(Size[2] & 0x7F) << 7
| (int)(Size[3] & 0x7F) + 10;
标签帧