语谱图

语谱图
语谱图

基于信号分析与处理的语谱图显示

1 语谱图

语音的发音过程中, 声道通常都是处于运动状态的, 因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多, 因此一般可以假定它是短时平稳的, 每一时刻我们都可以用这时刻附近的一短段( 例如15ms) 语音信号分析得到一种频谱。对语音信号连续地进行频谱分析就可以得到一种二维图谱, 其横坐标表示时间, 纵坐标表示频率, 而每像素的灰度值大小反映相应时刻和相应频率的信号能量密度。这种时频图称为语谱图( Sonogram 或Spectrogam), 这种反映语音信号动态频谱特性的时频图在语音分析中有重要实用价值, 被视为可视语言。从语谱图上不仅能看出任一时刻发音器官的共振峰特征,而且可以看出语音的基音频率, 是否清音、爆破音等。语谱分析在语音识别、合成及编码中很有意义。

1.1 语谱图的产生基理

语音信号是一种典型的非平稳信号, 但是其非平稳性是由发音器官的物理运动过程而产生的, 此过程与声波振动的速度相比较缓慢, 可以假定在10~30ms这样的短时间内是平稳的。傅立叶分析是分析线性系统和平稳信号稳态特性的强有力的手段, 而短时傅里叶分析, 也叫时间依赖傅立叶变换, 就是在短时平稳的假定下, 用稳态分析方法处理非平稳信号的一种方法。

设离散时域采样信号为x(n), n=0,1,?,N- 1, 其中n 为时域采样点序号, N 是信号长度。然后对信号进行分帧处理, 则x(n)表示为xn(m), n=0,1,?,N- 1, 其中n 是帧序号, m 是帧同步的时间序号, N 为帧长( 一帧内的采样点数) 。信号{x(n)}短时傅里叶变换为:

其中{w(n)}为窗序列, 则信号x(n)的离散时域傅里叶变换(DTFT) 为:

采用离散傅里叶变换(DFT)得:

则P(n,k)是二维的非负实值函数, 并且不难证明它是信号x(n)的短时自相关函数的傅里叶变换。用时间n 作为横坐标, k 作纵坐标, 将P(n,k)的值表示为灰度级所构成的二维图像就是语谱图。通过变换10log10(P(n,k))能得到语谱图的dB 表示。

2.1 用于短时频谱分析的功能函数

1) 分帧加窗函数: 下面程序中采用的是hanning窗。根据要求还可选用hamming(N),blackman(N)及bartlett(N), 其中N 为窗长( 帧长) 。

2) 快速傅里叶变换函数: fft(s)。s 为加窗后的一帧信号。因为实时信号FFT 的频域样值关于中点(即采样频率的1/2)对称, 所以fft(s)给出的矩阵数据只有前半部分有用。3) 复数取共扼函数: conj(z)。

2.2 伪彩色映射和语谱图显示的功能函数

1) 伪彩色映射函数: colormap(MAP)。其中MAP 是所采用的伪彩色映射矩阵, 默认值为JET, 可以通过MAP=colormap 获得当前的伪彩色映射矩阵, 它可以是一个任意行的矩阵, 但其必须有且只有三列, 并分别表示红色、绿色和蓝色的饱和度。

2) 频谱图显示函数: imagesc(t, f, L)。当数据比例映射使用整个色域时使用该函数, 其它情况下与image()函数作用相同。其中t 是时间坐标, f 是频率坐标,L 则是从功率谱值经伪彩色映射后的彩色电平值。

3 流程图及实现程序

3.1流程示意图:

3.2源程序:

function sogram(Winsiz,Shift,Base,Mode,Gray)

Winsiz=1024;

Shift=64;

Base=0;

Mode=1;

Gray=64;

[Sg,Fs]=wavread('E:\大家好.wav');

n=floor((length(Sg)-Winsiz)/Shift)+1;

A=zeros(Winsiz/2+1,n);

for i=1:n

n1=(i-1)*Shift+1;

n2=n1+(Winsiz-1);

Sg=Sg(:,1);

s=Sg(n1:n2);

s=s.*hanning(Winsiz);

z=fft(s);

z=z(1:(Winsiz/2)+1);

z=z.*conj(z);

z=10*log10(z);

A(:,i)=z;

end

L0=(A>Base);

L1=(A

B=A.*L0+Base*L1;

L=(B-Base)./(max(max(B))-Base);

y=[0:Winsiz/2]*Fs/Winsiz;

x=[0:n-1]*Shift;

if Mode==1

colormap('default');

else

mymode=gray;

mymode=mymode(Gray:-1:1,:);

colormap(mymode);

end

imagesc(x,y,L);

axis xy;

3.3 程序中参数说明

Wavnam: 定义待分析信号的路径及文件名。语音信号由计算机声卡录制, 以.wav 格式存储。程序中wavread(Wavnam)读入的语音信号样值赋给矩阵Sg, 也即待分析信号x(n), 采样频率赋给Fs。Winsiz: 定义帧长, 一般应取2 的幂次, 其目的是适合FFT 的要求。通过对Winsiz 的选值可实现宽带频谱或窄带频谱的选择。Shift: 定义帧移值。一般此值小于或等于Winsiz。Shift 值越小, 时域分辨率越高。Base: 基准电平值。注意, 此值的设定需根据实际经验, 可以通过在多次运行此程序中给出不同的Base 值, 观察所获得的频图的视觉和分辨率效果, 选择一个合适的Base 值, 如果没有特别要求, 可取默认值Base=0。Mode: 定义显示模式。1 伪彩色映射, 0 为灰度映射。上述程序中, 伪彩色映射采用默认值' default' 也即jet, 可选的其它映射还有: bone, cool , copper, flag, hot,hsv, pink, prism。Gray: 灰度显示层数, 当Mode=0 时有效, 且Gray 只能在1~64 间取值, 为了获得较好灰度显示效果, 一般取值64。

4 语谱图显示与分析

语谱图中的花纹有横杠、乱纹和竖直条等。横杠是与时间轴平行的几条深黑色带纹, 它们是共振峰。从横杠对应的频率和宽度可以确定相应的共振峰频率和带宽。在一个语音段的语谱图中, 有没有横杠出现是判断它是否是浊音的重要标志。竖直条( 又叫冲直条) 是语谱图中出现与时间轴垂直的一条窄黑条。每个竖直条相当于一个基音, 条纹的起点相当于声门脉冲的起点, 条纹之间的距离表示基音周期。条纹越密表示基音频率越高。

此图为‘大家好’的语谱图显示。Winsiz=1024,Shift=64, Base=0, Mode=1, Gray=64。此图为灰度映射图, 且窗长较短, 可以获得较高的时间分辨率。

结论:本文叙述了语谱图的产生, 以及如何在MATLAB中编程绘出它的伪彩色图及灰度图的方法。当Mode=1时为伪彩色映射,Mode=0时为灰度映射。语谱图的高度表示其频率,宽度表示采样点长度。通过计算机声卡, 可以很方便的完成语音录制, 又由于MATLAB有很丰富的功能函数和方便的绘图功能, 通过编程很容易在普通PC 机上快速实现语谱图显示, 为进一步语音信号处理提供便利条件。

若干图类的谱特征问题研究

若干图类的谱特征问题研究 设G是一个简单图,M=M(G)是按照某种规定所定义的与G相联系的图矩阵, 把利用M的特征值来刻画图G的组合结构的理论称为图谱理论(M-谱理论).定义det(xI-M)为图G的M-特征多项式,其中I为单位矩阵.M-特征多项式的特征根称为图G的M-特征值,由G的所有M-特征值构成的多重集称为M-谱,简记为 SpecM(G).图G的最大M-特征值称为M-谱半径.关于图矩阵M具有相同谱的图称为M-同谱图,与G图M-同谱但不同构的所有图称为图G的M-同谱类.如果G不存在M-同谱但非同构的图时,则称G是由M-谱确定的.即对任意的图 H,SpecM(H)=SpecM(G)蕴含着H~=G,简记为DMS-图.特别地,当M等于邻接矩阵A、拉普拉斯矩阵L=D-A和无符号拉普拉斯矩阵Q=D+A时,便是图G的A-谱、L-谱以及Q-谱的相关概念,这里D为G的度对角矩阵.图的谱特征问题主要考虑图矩阵 的谱性质和谱刻画问题.从目前的研究状况来看,图矩阵主要包括关联矩阵、邻接矩阵、拉普拉斯矩阵、无符号拉普拉斯矩阵、距离矩阵、标准拉普拉斯矩阵、Seidel 矩阵、广义邻接矩阵等.对于谱性质而言,谱半径及其相关参数的研究一直是图谱问题研究的重要组成部分.同时,第二大、第三大特征值以及某些图矩阵的最小、次小特征值也是比较热门的研究课题.谱刻画问题主要是通过某些谱特性来刻画具有这种谱特性的图,其中谱确定问题是谱刻画中十分棘手的问题之一,也是整 个图谱问题研究的核心问题.从已知的DMS-图来看,谱确定的研究主要集中在三 类图上.第一类是结构相对简单,对称性较好的图;第二类是至多含有四种不同度数的非正则图;第三类是能被度序列唯一确定其形状的图.然而,对于上述三类图而言,要判断任意给定的图是否是DMS-图也是一个相当困难的问题.本文主要借 助于图结构、组合理论、矩阵理论、闭道数公式、特征多项式、特征向量、特征

语音信号的频域分析

实验二:语音信号的频域分析 实验目的:以MATLAB 为工具,研究语音信号的频域特性,以及这些特性在《语音信号处理》中的应用情况。 实验要求:利用所给语音数据,分析语音的频谱、语谱图、基音频率、共振峰等频域参数。要求会求取这些参数,并举例说明这些参数在语音信号处理中的应用。 实验内容: 1、 语音信号的频谱分析 1.1加载“ma1_1”语音数据。基于DFT 变换,画出其中一帧数据(采样频率为8kHz ,帧长为37.5ms ,每帧有300个样点)的频域波形(对数幅度谱)。 load ma1_1; x = ma1_1 (4161:4460); plot (x) N = 1024; k = - N/2:N/2-1; X = fftshift (fft (x.*hann (length (x)),N)); plot (k,20*log10 (abs(X))), axis ([0 fix(N/2) -inf inf ]) 已知该帧信号的时域波形如图(a )所示,相应的10阶LPC 谱如图(b )所示。 问题1:这帧语音是清音还是浊音?基于DFT 求出的对数幅度谱和相应的LPC 谱相比,两者有什么联系和区别? 问题2:根据这帧基于DFT 的对数幅度谱,如何估计出共振峰频率和基音周期? 问题3:时域对语音信号进行加窗,反映在频域,其窗谱对基于DFT 的对数幅度谱有何影响?如何估计出窗谱的主瓣宽度? 1.2对于浊音语音,可以利用其频谱)(ωX 具有丰富的谐波分量的特点,求出其谐波乘积谱: ∏ ==R r r X HPSx 1)()(ωω 式中,R 一般取为5。在谐波乘积谱中,基频分量变得很大,更易于估计基音周期。

免费的谱图数据库

免费的谱图数据库20个 ★★★★★ 【名称】ChemExper化学品目录CDD (包括MSDS、5000张红外谱图) 【资源简介】 The database contains currently more than 70 000 chemicals, 16000 MSDS, 5000 IR spectra and more than 20 suppliers. It is the only chemical database that lets you SUBMIT your own data! 【检索途径】 You can find a chemical by its molecular formula, IUPAC name, common name, CAS number, catalog number, substructure or physical characteristics 【地址】http://www.chemexper.be/ 【名称】https://www.360docs.net/doc/a11246892.html, (NMR谱图数据库及NMR谱图预测) 【资源简介】 This is a web-based approach implementing a new java applet that enables to assign a chemical structure to the corresponding NMR spectrum by simply drawing lines between atoms and automatically characterized signals. This NMR predictor allows to predict the spectrum from the chemical structure based on Spinus (Structure-based Predictions In NUclear magnetic resonance Spectroscopy), which is an on-going project for the development of structure-based tools for fast prediction of NMR spectra developed by Gasteiger (http://www2.chemie.uni-erlangen.de/services/spinus/index.html). SPINUS - WEB currently accepts molecular structures via a Java molecular editor, and estimates 1H NMR chemical shifts. 【地址】https://www.360docs.net/doc/a11246892.html,/ 【名称】BioMagResBank (BMRB): 多肽、蛋白质、核酸等的核磁共振数据存储库 【资源简介】 Introduction BioMagResBank (BMRB) is the publicly-accessible depository for NMR results from peptides, proteins, and nucleic acids recognized by the International Society of Magnetic Resonance and by the IUPAC-IUBMB-IUPAB Inter-Union Task Group on the Standardization of Data Bases of Protein and Nucleic Acid Structures Determined by NMR Spectroscopy. In addition, BMRB provides reference information and maintains a collection of NMR pulse sequences and computer software for biomolecular NMR. Access to data in BMRB is free directly from its web site (URL https://www.360docs.net/doc/a11246892.html,) and ftp site (https://www.360docs.net/doc/a11246892.html,) and will remain so as public funding permits. The concept of a biomolecular NMR data bank developed under a five-year research grant awarded to the University of Wisconsin-Madison from the National Library of Medicine, National Institutes of Health. This grant was phased out after that period, and a Request for Applications was issued by the NIH for future support of this activity. BMRB at t he University of Wisconsin-Madison won this competition, has been supported since 1 September 1996 by the National Library of Medicine, NIH under grant 1 P41 LM05799. The current award for five years expires on 31 August 2004.

第二章 语音信号处理基础知识

第二章语音信号处理基础知识 1、语音信号处理? 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。 2、语音信号处理的目的? 1)如何有效地,精确地表示、存储、传递语音信号及其特征信息;2)如何用机器来模仿人类,通过处理某种运算以达到某种用途的要求,例如人工合成出语音,辨识出说话人、识别出说话内容等。 因此,在研究各种语音信号处理技术之前,需要了解语音信号的基本特性,同时,要根据语音的产生过程建立实用及便于分析的语音信号模型。 本章主要包括三方面内容:语音的产生过程、语音信号的特性分析以及语音信号生成的数学模型。 第一部分内容语音的产生过程,我们要弄清两个问题:1)什么是语音?2)语音的产生过程? 3、什么是语音? 语音是带有语言的声音。人们讲话时发出的话语叫语音,它是一种声音,由人的发音器官发出且具有一定的语法和意义。语音是声音和语言的组合体,所以对于语音的研究包括:1)语音中各个音的排列由一些规则控制,对这些规则及其含义的研究成为语言学;2)对语音中各个音的物理特征和分类的研究称为语音学。 4、语音的产生 语音的产生依赖于人类的发声器官。人的发音器官包括:肺、气管、喉、咽、鼻、口等。 ◆喉以上的部分称为声道,其形状随发出声音的不同而变化; ◆喉的部分称为声门。 ◆喉部的声带是对发音影响很大的器官。声带振动产生声音。 ◆声带开启和闭合使气流形成一系列脉冲。

每开启和闭合一次的时间即振动周期称为基音周期,其倒数为基音频率,简称基频。基频决定了声音频率的高低,频率快则音调高,频率慢则音调低。 基音的范围约为70 -- 350Hz,与说话人的性别、年龄等情况有关。 人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 人的说话的过程: 1)想说阶段:人的说话首先是客观事实在大脑中的反映,经大脑的决策产生了说话的动机; 接着说话神经中枢选择适当的单词、短语以及按照语法规则的组合,以表达想说的内容和情感。 2)说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,使得舌、唇、鄂、声带、肺等部分的肌肉协调地动作,发出声音。与此同时,大脑也发出一些指令给其他有关器官,使之产生各种动作来配合言语的效果,如表情、手势、身体姿态等。经常有些人说话时会手舞足蹈。另外,还会开动“反馈”系统来帮助修正语音。 3)传送阶段:说出的话语是一连串声波,凭借空气为媒介传送到听者的耳朵。有时遇到某种阻碍或其他声响的干扰,使声音产生损耗或失真。 4)接收阶段:从外耳收集的声波信息,经过中耳的放大作用,达到内耳。经过内耳基底膜的振动,激发器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。 5)理解阶段:听觉神经中枢收到脉冲信息后,经过一种至今尚未完全了解的方式,辨认说话人及听到的信息,从而听懂说话人的话。 再开始介绍语音信号的特性之前,我们先了解一下语音和语言的定义。 5、语言 是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等不同层次的单位,以及词法、句法、文脉等语法和语义内容。语言学是语音信号处理的基础。例如,可以利用句法和语义信息减少语音识别中搜索匹配范围,提高正确识别率。 6、语音学 Phonetics是研究言语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类问题。现代语音学发展成为三个分支:发音语音学、声学语音学以

色谱分析谱图

A5000气相色谱工作站分析报告 样品信息: 样品名称: 乙酸乙酯、甲苯盲样样品编号: 样品来源: 省职防院邮寄采样人: 稀释倍数: 0.0 样品量: 0.0 含量单位: 取样时间: 仪器条件: 仪器名称: 气相色谱仪柱子型号: FFAP 检测器: FID 积分参数: 最小值: 10.00 漂移: 0.02 mV/min 噪声: 0.05 mV 最小峰宽: 2.00 S 相对窗宽: 5% 计算方式: 峰面积 色谱条件: 柱箱温度: 50 (℃)程序升温载气流速: 30 (ml/min) 检测器温度: 130 (℃)空气流速: 300 (ml/min) 气化室温度: 200 (℃)氢气流速: 30 (ml/min) 谱图: 分析结果: 定量方法:外标法 序号组分名保留时间峰面积峰高含量峰型 1 二硫化碳 3.91 9726895 366254 9726895 BB 2 乙酸乙酯0.00 0 0 0.000000 BB

3 甲苯0.00 0 0 0.000000 BB 谱图: 分析结果: 定量方法:归一法 序号组分名保留时间峰面积峰高含量峰型 1 二硫化碳 3.87 9287219 363551 9287219 BB 2 乙酸乙酯 5.40 67436 4449 25.265 BB 3 甲苯8.2 4 63476 13403 8.777 B B 谱图:

分析结果: 定量方法:外标法 序号组分名保留时间峰面积峰高含量峰型 1 二硫化碳 3.88 9515607 362744 9515607 BB 2 乙酸乙酯 5.42 68086 4510 25.508 B B 3 甲苯8.25 58293 13600 8.061 BB 谱图: 分析结果: 定量方法:外标法 序号组分名保留时间峰面积峰高含量峰型 1 二硫化碳 3.88 9231735 354067 9231735 BB 2 乙酸乙酯 5.41 67415 4556 25.256 B B 3 甲苯8.25 59548 13601 8.235 BB 谱图:

语音信号采集与时频域分析正文

第一章引言 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和频域等处理方法。语音信号可以认为在短时间内(一般认为在 10~30ms 的短时间内)近似不变,因而可以将其看作是一个准稳态过程, 即语音信号具有短时平稳性。任何语音信号的分析和处理必须建立在“短时”的基础上, 即进行“短时分析”。 时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时能量,短时平均过零率,短时自相关函数等。 频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。主要分析的特征参数:短时谱、倒谱、语谱图等。 本文采集作者的声音信号为基本的原始信号。对语音信号进行时频域分析后,进行加白噪声处理并进行了相关分析,设计滤波器并运用所设计的滤波器对加噪信号进行滤波, 绘制滤波后信号的时域波形和频谱。整体设计框图如下图所示: 图1.1时频域分析设计图 图1.2加噪滤波分析流程图

第二章 语音信号时域分析 语音信号的时域分析可直接对语音信号进行时域波形分析,在此只只针对语音信号的短时能量、短时平均过零率、短时自相关函数进行讨论。 2.1窗口选择 由人类的发生机理可知,语音信号具有短时平稳性,因此在分析讨论中需要对语音信号进行加窗处理进而保证每个短时语音长度为10~30ms 。通常选择矩形窗和哈明窗能得到较理想的“短时分析”设计要求。两种窗函数的时域波形如下图2.1所示: sample w (n ) sample w (n ) 图2.1 矩形窗和Hamming 窗的时域波形 矩形窗的定义:一个N 点的矩形窗函数定义为如下 {1,00,()n N w n ≤<=其他 (2.1) 哈明窗的定义:一个N 点的哈明窗函数定义为如下 0.540.46cos(2),010,()n n N N w n π-≤<-??? 其他 = (2.2) 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图2.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;哈明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用哈明窗,在计算短时能量和平均幅度时通常用矩形窗。表2.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。

谱图

质谱 36、正丁基苯(MW=134)的质谱裂解产生m/z134, m/z105,m/z92,m/,91(基峰),m/ z,78和m/z65等峰,试写出上述碎片离子产生的开裂途径。 CH 2-CH 2-CH 2-CH 3 37、在某烯的质谱图上,m/z83及m/z57处有两二个强峰,试判断该烯的结构是(A )还是(B )。 A B 38、某化合物结构可能是(A )或(B ),质谱上有m/z97及m/z111离子峰,试推测该化合物结构。 1.某化合物的质谱图如下,请写出主要碎片离子的裂解过程(8分) 31 42 CH 3(CH 2)3CH 2OH M=88 29 55 70 2.化合物F[CH 3SCH 2CH(OH)CH 3]的质谱如下,解释其主要碎片离子。(14分) CH 3-CH-CH=CH-CH 2-CH-CH 2-CH 3 CH 3CH 3CH 3-CH 2-CH-CH=CH-CH 2-CH-CH 3 CH 3CH 3

3.N,N-二乙基乙酰胺的质谱图如下,解释其主要碎片离子。(14分) 紫外

1、某化合物的紫外光谱有B吸收带,还有λ=240nm,ε=13×104及λ=319nm,ε=50两个吸收带,此化合物中含有什么基团?有何电子跃迁? 红外 1.某化合物的红外光谱图如下,试问: (1)该化合物是脂肪族还是芳香族? (2)是否为醇、醛、酮、酸? (3)是否含有双键或叁键? 2.计算某化合物的分子式为C5H10O2,红外光谱图如下,推断其化合物的结构式,并写出推断过程。(7分) 3、某未知物分子式为C7H6O2 ,其红外谱图如下,推测其结构。(7分)

实验一显示语音信号的语谱图

实验一显示语音信号的语谱图 一、实验目的 综合信号频谱分析和滤波器功能,对语音信号的频谱进行分析,并对信号含进行高通、低通滤波,实现信号特定处理功能。加深信号处理理论在语音信号中的应用;理解语谱图与时频分辨率的关系。二、实验原理 语谱图分析语音又称语谱分析,语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优点,明显的显示出语音频谱随时间的变化情况。语谱图实际上是一种动态的频谱。窄带语谱图有良好的频率分辨率及较差的时间分辨率;而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。 三、实验内容 实验数据为工作空间ex3M2.mat中数组we_be10k是单词“we”和“be”的语音波形(采样率为10000点/秒)。 1、听一下we_be10k(可用sound) 2、使用函数specgram_ex3p19.显示语谱图和语音波形。对比调用参数窗长20ms(200点)、帧间隔1ms(10点)和参数窗长5ms(50点)、帧间隔1ms(10点);再对比窗长>20ms或小于5ms,以及帧间隔>1ms时的语谱图说明宽带语谱图、窄带语谱图与时频分辨率的关系及如何得到时频折中。 3、生成高通和低通滤波器,观察其频谱;对语音信号we_be进行滤波,听一下对比其效果。

四、实验结果 实验程序 语谱图和语音波形

低通滤波器频谱

高通滤波器频谱 结论:1、因频率分辨率随窗口宽度的增加而提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,但时间分辨率提高。由以上图可知:窄带语谱图有良好的频率分辨率及较差的时间分辨率,而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。窄带语谱图中的时间坐标方向表示的基因及其各次谐波;而宽带语谱图给出语音的共振峰平率及清辅音的能量汇集区。 2、因加窗的目的是要限制分析的时间以使其中的波形特性没有显著变化,因此想要得到时频折中,选用的窗函数应尽量满足a、频率分辨率高b、卷积后其他的频率成分产生的频谱泄露少。海明窗在频率范围中的分辨率高,具有频谱泄露少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。

k线图谱大全(一)

k线图谱大全(一) 按:任何人进入股市后,掌握技术、熟悉技术,无可非议。但是,技术掌握得差不多了,必须要培养自己的投资风格向价值分析转变,这样能够避免我们不被技术因素约束而看不到更深层次的问题。 投资者投资水平,投资境界的最后晋级依靠的不是技术,而是心态、修养和综合素质。 ----------------------------------------------------------------------------- -- 1、十字星:见顶十字星,中继十字星

十字:十字有见顶的十字和中继的十字,要注意区分 心理意义:十字的出现表明原有趋势已经进入一种不确定的状态,其后趋势需要后续K线来确认。2、吞没K线:看涨吞没 看涨吞没形态:形态特征:两个颜色相反的K线,后K线包住前K线 确认原则: 1、第二天的实体必须完全包住前一天的K线实体 2、上涨或下跌已经形成趋势,即使趋势是短暂的 3、颜色相反,例外的情况是被吞没的实体是一个十字信号或实体非常小。 意义解析: 1、前一天的K线小于今天的已经表明趋势在转弱,而随后的包住它的K线,说明新的走势力量很强

2、在发生吞没当天,如果量放大明显,会增加新趋势继续的可能性 3、如果大实体能够吞没好几天的实体,表明反转的力量会很强。 4、如果实体能够将前一天的阴影也包住的话,反转的可能性会更大 5、第二天的开盘价离前一天越远,强反转的可能就越大 3、急跌后的反弹形态:千里冰封k线图谱 千里冰封k线图谱是急跌后的反弹形态,短线可以快进快出,搏取差价。4、急跌后的反弹形态:龙宫探宝k线图谱 龙宫探宝k线图谱是急跌后的反弹形态,短线可以快进快出,搏取差价。5、急跌后的反弹形态:春光半露k线图谱 春光半露k线图谱是急跌后的反弹形态,短线可以快进快出,搏取差价。6、低位大幅震荡形态:天堑通途k线图谱

实验三 语音信号的频域分析

实验三语音信号的频域分析 一、实验名称语音信号的频域分析 二、实验目的 1)掌握傅里叶分析原理,利用Matlab软件估计短时谱、倒谱。 2)借助频域分析方法所求得的参数分析语音信号的基音周期或共振峰。 三、实验设备 Matlab 软件计算机 四、实验步骤 1、语音信号短时谱的求取。 用Matlab软件读取语音文件h.wav数据,取N=256点,求取其短时频谱,记录频谱图,并判断该帧语音是清音还是浊音。 用Matlab软件读取语音文件u.wav数据,取N=256点,求取其短时频谱,记录频谱图,并判断该帧语音是清音还是浊音。 参考程序: clear a=wavread('h'); subplot(2,1,1); plot(a);title('original signal'); grid N=256; k=hamming(N); for m=1:N b(m)=a(m)*k(m); end y=20*log(abs(fft(b,1024))); pinlv=(0:1:255)*8000/512;%点和频率的对应关系 subplot(2,1,2); y1(1:256)=y(1:256); plot(pinlv,y1);title('短时谱'); xlabel('频率/Hz') ylabel('对数幅度/dB') grid

2、语音信号的语谱图。 语音信号的语谱图,即水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短时谱。生成hubeis.wav语音文件的语谱图。

参考命令: >> [x,fs,nbits]=wavread('hubeis'); >> specgram(x,512,fs,100); 3、倒谱分析 浊音信号的倒谱中存在着峰值,它的存在位置正好是该帧语音的基音周期。清音信号的倒谱中不存在峰值,利用这一特点可以分辨清音与浊音,并可估计浊音的基音周期。分别计算语音文件“h”及“u”的倒谱,并判断哪个是清音,哪个是浊音,若为浊音请估计它的基音周期。 参考程序: clear a=wavread('h'); N=300; h=hamming(N); for m=1:N b(m)=a(m)*h(m); end d=rceps(b); d=fftshift(d); plot(d);title('h 加汉明窗时的倒谱')

有机波谱分析谱图特征总结

峰区 波数(cm –1 ) 键的振动类型 区别醇、酚、酸: 1.酸( ):νO-H ,3000,宽谱带,散谱 νO-H ,≈3500,强、宽峰 νC-O ,≈1230 νC-H ,3100-2700,多谱带 芳环骨架振动,1600-1450,3、4条谱带 叔,νC-O ,1150-1200 仲,νC-O ,1125-1150 伯,νC-O ,1050 第一峰区:(4000-2500) X —H 的伸缩振动 O —H 、 N —H 、 C —H 。 3750~3000 νOH, 游离,≈3700 缔合,≈3500,特点:峰强而宽 νNH,3500-3150,特点:弱尖峰 区别胺: 伯,3500-3100,2/3条 仲,3400 1条 叔,无 3300~3000 不饱和:>3000 ν≡CH,3300,谱带尖锐 ν=CH ,3100-3000 νAr —H ,3100-3000,多谱带 极少数可到2900cm –1 3000~2700 饱和:<3000 νC —H,>2900 νC —H (-CHO),2850-2720,双谱带 νS —H ,2600-2500,谱带尖锐 —CH 3,2960-2870 —CH 2-,2920-2850 第二峰区:(2400-2100) 叄键、累积双键 2400~2100 νC≡N ,2250-2240 νC≡C ,2200-2100 ν—C≡C—C≡C — 苯环特征吸收 2. 酚 3.醇 区别酰胺: 伯,3300、3150,双峰 仲,3200 1条 叔,无

图2: 氢谱 常见类型结构的质子化学位移:其他振动: [CH 2]n : CH 2平面摇摆振动,800~700,弱吸收带。 N<4,向高波波数移动。 RR'CH ═C H 2(同碳),895~885,1条(890) R CH ═C H R'(顺), 830~750,1条(800) 芳烃: ???见图2 单取代:740 ,690, 2条 邻二取代:740 , 1条 间二取代:860 ,770,,700,3条 对二取代:810, 1条 -COOH 12~10 -CHO 10~9 ArOH 8~4

语音信号的滤波与频谱分析

生物医学信号处理大作业 题目:语音信号的滤波与频谱分析 学生姓名 学院名称精密仪器与光电子工程 专业 学号

一、实验目的 语音信号的滤波与频谱分析 录制自己的一段语音:“天津大学精密仪器与光电子工程学院生物医学工程X班XXX, College of precision instrument and opto-electronics engineering, biomedical engineering”,时间控制在15秒到30秒左右;利用wavread函数读入语言信号,记住采样频率。 二、实验过程 (1)求原始语音信号的特征频带:可以分别对一定时间间隔内,求功率谱(傅里叶变换结果取模的平方)并画出功率谱。 (2)根据语音信号频谱特点,设计FIR或IIR滤波器,分别画出滤波器幅频和相频特性曲线。说明滤波器特性参数。用设计的滤波器对信号滤波,画出滤波后时域波形。用sound函数回放语音信号。 (3)求出特征频段语音信号随时间变化的曲线(每隔0.05秒求一次功率谱,连接成曲线)。 (4)选做:语谱图:横轴为时间,纵轴为频率,灰度值大小表示功率谱值的大小。(提示,可以采用spectrogram 函数)

(1)读入语音文件并画出其时域波形和频域波形,实现加窗fft并求出其功率谱。 clc clear all; close all; [x,Fs,bits]=wavread('C:\Users\刘冰\Desktop\数字信号处理\liubing'); x0=x(:,1); %将采集来的语音信号转换为一个数组 sound(x0,Fs,bits); y=fft(x); figure;plot(x,’b’);title('原始语音信号时域波形'); y1=fft(x0); y1=fftshift(y1); d = Fs/length(x); figure;plot([-Fs/2:d: Fs/2-d],abs(y1),’b’);title('原始语音信号的频域信号'); % 画出原始语音信号的频谱图

各种仪器基本原理及谱图表示方法

紫外吸收光谱UV 分析原理:吸收紫外光能量,引起分子中电子能级的跃迁 谱图的表示方法:相对吸收光能量随吸收光波长的变化 提供的信息:吸收峰的位置、强度和形状,提供分子中不同电子结构的信息 荧光光谱法FS 分析原理:被电磁辐射激发后,从最低单线激发态回到单线基态,发射荧光 谱图的表示方法:发射的荧光能量随光波长的变化 提供的信息:荧光效率和寿命,提供分子中不同电子结构的信息 红外吸收光谱法IR 分析原理:吸收红外光能量,引起具有偶极矩变化的分子的振动、转动能级跃迁 谱图的表示方法:相对透射光能量随透射光频率变化 提供的信息:峰的位置、强度和形状,提供功能团或化学键的特征振动频率 拉曼光谱法Ram 分析原理:吸收光能后,引起具有极化率变化的分子振动,产生拉曼散射 谱图的表示方法:散射光能量随拉曼位移的变化 提供的信息:峰的位置、强度和形状,提供功能团或化学键的特征振动频率 核磁共振波谱法NMR 分析原理:在外磁场中,具有核磁矩的原子核,吸收射频能量,产生核自旋能级的跃迁 谱图的表示方法:吸收光能量随化学位移的变化 提供的信息:峰的化学位移、强度、裂分数和偶合常数,提供核的数目、所处化学环境和几何构型的信息 电子顺磁共振波谱法ESR 分析原理:在外磁场中,分子中未成对电子吸收射频能量,产生电子自旋能级跃迁 谱图的表示方法:吸收光能量或微分能量随磁场强度变化 提供的信息:谱线位置、强度、裂分数目和超精细分裂常数,提供未成对电子密度、分子键特性及几何构型信息 质谱分析法MS 分析原理:分子在真空中被电子轰击,形成离子,通过电磁场按不同m/e分离 谱图的表示方法:以棒图形式表示离子的相对峰度随m/e的变化 提供的信息:分子离子及碎片离子的质量数及其相对峰度,提供分子量,元素组成及结构的信息 气相色谱法GC 分析原理:样品中各组分在流动相和固定相之间,由于分配系数不同而分离 谱图的表示方法:柱后流出物浓度随保留值的变化 提供的信息:峰的保留值与组分热力学参数有关,是定性依据;峰面积与组分含量有关 反气相色谱法IGC

语音识别基础讲义02

第二章语音的特征 2.1发音的生理机构与过程 2.1.1 发音的生理机构 人的发音生理机构见图2.1。如图所示, 发音器官主要由以下三个部分所构成: (1)主声道:一般将声门(声带开口处) 以上,经咽喉、口腔(舌、唇、腭、 小舌)的管道称为主声道。 (2)鼻道:经小舌和鼻的管道称为鼻道。 鼻道只有在发音时通过小舌下才被 打开。小舌上抬时鼻道将被关闭。 (3)次声门系统:经肺、支气管和气管 的管道称为次声门系统。 图2.1 发音器官示意图 2.1.2 语音的产生过程 语音的产生过程可分为音源产生、声道调音和向外辐射三个阶段。 音源可分为声带音源和非声带音源两大类,非声带音源又可分为噪声音源和爆破音源。声带振动周期称为基本周期(Fundamental Period),其倒数称为基本频率(Fundamental Frequency)。男性的基本频率一般为50~250Hz,女性的基本频率一般为100~500Hz。当发音的基本周期随时间变化时,便可感知重音和语调(Intonation)。音源波由基波及其谐波成分构成。 声道调音(Articulation)指为了发出各种各样的声音,需要诸如舌、口唇、腭等的器官对声道形状进行的调整。有了不同的声道形状,就能给出声道的不同的传递特性,并由于声道腔的共鸣作用,使得语音能量按频率发生强弱变化。声道腔共鸣特性反映在其频率特性上,便有一系列共振峰的出现,这些共振峰所对应的频率称为共振峰频率(Formant)。 根据产生的音源不同大致可形成以下三种语音: (1)浊音(V: V oiced speech)的产生 音源是位于声门处的准周期空气脉冲序列。空气从肺部排出形成空气流,空气流经过声带时,如果声带是绷紧的,则将在声门处产生出一个准周期性脉冲气流。即声带产生弛张振动,形成周期性地开启和闭合。声带启开时空气流从声门喷射出来,形成一个脉冲,声门闭合时相应于脉冲序列的间隙。该空气脉冲流通过声道后最终从嘴唇辐射出声波,这便是浊音语音。 (2)清音(U: Unvoiced speech)的产生 音源是位于声道的某个收缩区的湍流(类似噪音)。如果声带是完全舒展开来的,则肺部发出的空气流将不受影响地通过声门。空气通过声门后,如果声道某个部位发生了收缩,形成了一个狭窄的通道,则当空气流到达此处时将被迫以高速气流冲过收缩区,并在附近产生出空气湍流。这种湍流空气通过声道后便形成所谓的清音(也称摩擦音)。 (3)爆破音(P: Plosive speech)的产生 音源是位于声道某个闭合点处建立起来的气压,其具有突然释放的特性。声带状态同湍流音源一样,但当空气通过声门后,如果声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,一旦闭合点突然开启便会让气压快速释放,经过声

语谱图

基于信号分析与处理的语谱图显示 1 语谱图 语音的发音过程中, 声道通常都是处于运动状态的, 因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多, 因此一般可以假定它是短时平稳的, 每一时刻我们都可以用这时刻附近的一短段( 例如15ms) 语音信号分析得到一种频谱。对语音信号连续地进行频谱分析就可以得到一种二维图谱, 其横坐标表示时间, 纵坐标表示频率, 而每像素的灰度值大小反映相应时刻和相应频率的信号能量密度。这种时频图称为语谱图( Sonogram 或Spectrogam), 这种反映语音信号动态频谱特性的时频图在语音分析中有重要实用价值, 被视为可视语言。从语谱图上不仅能看出任一时刻发音器官的共振峰特征,而且可以看出语音的基音频率, 是否清音、爆破音等。语谱分析在语音识别、合成及编码中很有意义。 1.1 语谱图的产生基理 语音信号是一种典型的非平稳信号, 但是其非平稳性是由发音器官的物理运动过程而产生的, 此过程与声波振动的速度相比较缓慢, 可以假定在10~30ms这样的短时间内是平稳的。傅立叶分析是分析线性系统和平稳信号稳态特性的强有力的手段, 而短时傅里叶分析, 也叫时间依赖傅立叶变换, 就是在短时平稳的假定下, 用稳态分析方法处理非平稳信号的一种方法。 设离散时域采样信号为x(n), n=0,1,?,N- 1, 其中n 为时域采样点序号, N 是信号长度。然后对信号进行分帧处理, 则x(n)表示为xn(m), n=0,1,?,N- 1, 其中n 是帧序号, m 是帧同步的时间序号, N 为帧长( 一帧内的采样点数) 。信号{x(n)}短时傅里叶变换为: 其中{w(n)}为窗序列, 则信号x(n)的离散时域傅里叶变换(DTFT) 为: 采用离散傅里叶变换(DFT)得: 则P(n,k)是二维的非负实值函数, 并且不难证明它是信号x(n)的短时自相关函数的傅里叶变换。用时间n 作为横坐标, k 作纵坐标, 将P(n,k)的值表示为灰度级所构成的二维图像就是语谱图。通过变换10log10(P(n,k))能得到语谱图的dB 表示。

数字语音处理复习题分析

第一章绪论 1.语音信号处理是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性的学科。p1d3 2.语音信号处理的应用技术列举:语音编码、语音识别、语音合成、说话人识别和语种辨识、语音转换和语音隐藏(语音信息伪装、语音数字水印技术)、语音增强等p4d3 3.当前语音信号处理应用的3个主流技术:矢量量化技术、隐马尔可夫模型技术、人工神经网络技术。p4d3 第二章语音信号处理基础知识 1.语音是组成语言的声音,是声音(Acoustic)和语言(Language)的组合体。p5d2 2.语音的基本声学特性包括音色,音调,音强、音长。p7d2 音色:也叫音质,是一种声音区别于另一种声音的基本特征。 音调:是指声音的高低,它取决于声波的频率。 音强:声音的强弱,它由声波的振动幅度决定。 音长:声音的长短,它取决于发音时间的长短。 3. 说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。p7d3 4.任何语言都有语音的元音(V owel)和辅音(Consonant)两种音素。p7d3 8.当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过,这种音称为元音。p7d3 9.呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为辅音。p7d3 7.发辅音时由声带是否振动引起浊音和清音的区别,声带振动的是浊音,声带不振动的是清音。p7d3 8.元音构成音节的主干(因为无论从长度还是能量看,元音在音节中都占主要部分。)p7d3 9.元音的一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。p7d5 16.人类的声道和鼻道可以看作是非均匀截面的声道管,声道管的谐振频率称为共振峰频率(共振峰)。p7d5 10.汉语音节一般由声母、韵母和声调三部分组成。汉语普通话中有6000多个常用字,每个汉字是一个音节。p10d6 10. 发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为基音周期(pitch),其倒数成为基音频率。 11.汉语是一种声调语言,声调的变化就是浊音基音周期(或基音频率)的变化。p14d5 13. 无论是单音节语音还是连续语音,其中浊音段的基因频率是随时间而变化的,基因频率的不同轨迹成为声调。p9d11 14. 当两个响度不同的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象成为掩蔽效应。 15.语音信号的生成模型可由激励模型、声道模型和辐射模型三个子模型构成,三者是串联(串联/并联)的关系。p21-26 16.语音信号激励模型一般分为浊音激励和清音激励,发浊音时激励模型为脉冲波。p21d6 17.语音信号激励模型一般分为浊音激励和清音激励,发清音时激励信号通常被模拟为随机白噪声。p22d2

氢谱谱图解析步骤

谱图的解析 NMR谱法一般经历如下的步骤进行谱图的解析: ★与IR法相同,首先尽可能了解清楚样品的一些自然情况,以便对样品有一些大概的认识; 通过元素分析获得化合物的化学式,计算不饱和度Ω; ★根据化学位移值确认可能的基团,一般先辨认孤立的,未偶合裂分的基团,即单峰,即不同基团的1H之间距离大于三个单键的基团及一些活泼氢基团,如甲基醚、甲基酮()、甲基叔胺()、甲基取代的苯等中的甲基质子及苯环上 的质子,活泼氢为―O―H,,-SH等;然后再确认偶合的基团。从有关图或表中的δ可以确认可能存在的基团,这时应注意考虑影响δ的各种因素如电负性原子或基团的诱导效应、共轭效应、磁的各向异性效应及形成氢键的影响等; ★根据偶合裂分峰的重数、偶合常数,判断基团的连接关系。先解析一级光谱,然后复杂光谱。 进行复杂光谱解析时,应先进行简化; ★根据积分高度确定出各基团中质子数比,印证偶合裂分多重峰所判断的基团连接关系; ★通过以上几个程序,一般可以初步推断出可能的一种或几种结构式。然后,反过来,从可能的结构式按照一般规律预测可能产生的NMR谱,与实际谱图对照,看其是否符合,从而可以推断出某种最可能的结构式。 例某化合物的化学式为,IR谱表明有一很强的吸收峰,NMR谱如下,试确定其结构。 解:

有三组峰,相对面积为2:1:3,若分别为2、1、3个,则总数为6,为分子式12个的一半,因此分子可能有对称性; IR显示~1750cm

-1有一强峰,应有存在,且分子中有4个O,则可能有2个; 处有一组三重峰,可能为-CH ,且受裂分,而处有一组四重峰,与 3 是典型的组分;而δ较大,可能为的组分;处有一单峰,相对面积为1,则是一个与碳基相连的孤立(不偶合)的,可能为 所以可能有 的结合。而此结合的、O的数目为分子式的一半,而C原子数一半多半个原子。因此可以推测出整个分子的中间C原子为对称的结构,可能为 验证:以炔可能结构,推测其NMR谱,与实验谱图比较,结果相符合。是否可能为 (请思考) (二)定量分析 NMR图谱中积分曲线的高度与引起该共振峰的氢核数成正比,这不仅是结构分析的重要参数,而且是定量分析的依据。 用NMR 技术进行定量分析的最大优点是,不需要有被测物质的纯物质作标准,也不必绘制校准曲线或引入校准因子,而只要与适当的标准参照物(不必是被测物质的纯物质)相对照就可得到被测物质的量,对标准物的基本要求是其NMR 谱的共振峰不会与试样峰重叠。 常用的标准物为有机硅化合物,其质子峰大多在高场,便于比较,为六用基环三硅氧烷和六甲基环三硅胺等。

语音信号实验

实验一语音信号的短时分析 一、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号短时分析的意义,短时时域分析的基本方法。 2.进一步理解和掌握语音信号短时平均能量函数及短时平均过零数的计算方法和重要意义。 二、实验设备 1.PC机; 2.MATLAB软件环境。 三、实验内容 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依据曲线对该语音段进行所需要的分析,并作出结论。 6.改变窗的宽度(帧长),重复上面的分析内容。 四、实验原理及方法 一定时宽的语音信号,其能量的大小随时间有明显的变化。其中清音段(以清音为主要成份的语音段),其能量比浊音段小得多。短时过零数也可用于语音信号分析中,发浊音时,其语音能量约集中于3kHz以下,而发清音时,多数能量出现在较高频率上,可认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数,因而,对一短时语音段计算其短时平均能量及短时平均过零数,就可以较好地区分其中的清音段和浊音段,从而可判别句中清、浊音转变时刻,声母韵母的分界以及无声与有声的分界。这在语音识别中有重要意义。 五、预习和实验报告要求 1.预习课本有关内容,理解和掌握短时平均能量函数及短时平均过零数函数

的意义及其计算方法。 2.参考Matlab有关资料,设计并编写出具有上述功能的程序。 六、上机实验报告要求 1.报告中,实验目的、实验原理、实验步骤、方法等格式和内容的要求与其它实验相同。 2.画出求得的曲线,注明语音段和所用窗函数及其宽度。阐述所作分析和判断的过程,提出依据,得出判断结论。 七、思考题 1.语音信号短时平均能量及短时平均过零数分析的主要用途是什么? 2.窗的宽度(帧长)的改变,对他的特性产生怎样的影响? 八、程序说明 Matlab编程实验步骤: 1.新建M文件,扩展名为“.m”,编写程序; 2.选择File/Save命令,将文件保存在F盘中; 3.在Command Window窗中输入文件名,运行程序; Matlab部分函数语法格式: 读wav文件:x=wavread(`filename`) 数组a及b中元素相乘: a.*b 创建图形窗口命令:figure 绘图函数:plot(x) 坐标轴:axis([xmin xmax ymin ymax]) 坐标轴注解:xlabel(`…`) ylabel(`…`) 图例注解:legend( `…`) 一阶高通滤波器:y=filter([1-0.09375],1,x) 分帧函数:f=enframe(x,len,inc) x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为n×len的一个矩阵,每一行都是一帧数据。

相关文档
最新文档