智能门锁答辩

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

400
500
600
700
Mel倒谱系数的提取方法

一 预加重处理,将语音信号 s (n) 通过一个高通滤波器

2 n s (n, m) s(n, m)[0.54 0.46 cos( )] n 1
'

s (n, m) 二 加汉明窗,第m帧语音信号为 ' 加汉明窗处理后的信号 s (n, m) 为
1.314682
1.267624 1.576756 1.326203 1.249460
报警
报警 报警 开门 报警
不足与改进

本次课程设计选择的是基于特定人的语音识别 算法,识别率有点低!
可以改用基于VQ的说话人识别系统,不仅可 以辨别语音,还可以实现说话人身份的辨别


后续会将VQ的程序调试出来
总结
1
1.2
1.4
300
200
振幅
100 0 0
0.5
1 频 率 / (Hz)
1.5
2
2.5 x 10
4
端点检测
端点检测
1
语音信号
0 -1
0.5
1
1.5
2
2.5
3
3.5
4
Байду номын сангаас
4.5
5
5.5 x 10
4
短时能量
20 10 0 100 200 300 400 500 600 700
50
过零率
0
100
200
300
H ( z) 1 az
1
n 0,1,..., 。 N 1

2 nk s(k , m) s (n, m) exp( j ) N n 0
N '
三 进行FFT变换,进行FFT变换后语音信号第m帧的频谱为:
对语音信号的频谱取模平方得到语音信号的功率谱
四 三角滤波器组进行滤波,对语音信号的功 率谱,用依照Mel频率平均分布的三角波滤波 器组进行滤波。得到一组系数m1,m2,…。 五 利用离散余弦变换DCT对上面得到的系数 进行计算,求得L阶的MFCC参数 Cl, l 1, 2, L 。其中p是上一步中三角滤波 p 器的个数。 1
张晶晶2
焦蒙恩1 焦蒙恩2 王秋晨1 王秋晨2
1.135904
1.302577 1.704187 1.431436 1.255805
0.919146
1.080446 1.586372 0.944333 1.081598
1.067532
1.068104 1.063397 0.747802 0.761864
本次课程设计,着实锻炼了我们的能力,从一 点一滴的找程序,调程序到自己编程序,实现 了由量到质的飞跃! 这个过程真的是太艰难了,幸亏我们有着永不 言弃的精神,昂扬的斗志,最终战胜了困难, 顺利完成了课程设计! 最后感谢大家的测试和老师的指导!

MFCC特征提取
DTW特征匹配
识别
实验条件
模板语音用手机上自带的 录音机录制,为mp3格式 格式工厂软件将语音转换 成wav格式 测试文件用电脑自带声卡 录制 采样频率44100Hz,采样 位数16位,单通道
时频域分析
时域图 0.4 0.2
振幅
0 -0.2 -0.4
0
0.2
0.4
0.6 0.8 时 间 / (s) 频域图

Cl log(mk ) cos[l (k ) ] 2 p k 1
DTW算法
找到一个时间规整函数j=w(i),将 测试矢量的时间轴i非线性映射到 参考模板的时间轴j上。 I 函数w满足: D min d [ X i , Yw(i ) ]
d ( X i , Y j ) ( xin y jn )
智能语音识别门锁
学生姓名:王玉玲 指导教师:侯海燕
设计要求 设计方法 设计思路 设计流程 设计效果 不足与改进 设计总结
设计要求

录音,门锁数据库中至少有3人以上的声音
能够实现对数据库中不同人的语音进行识别 对数据库之外的人的声音能够识别不通过 运用GUI设计一个智能门锁界面



设计方法


n 1 N 2
d ( X i , Y j ) ( xin y jn ) 2
n 1
N
w(i )
i 1
D是处于最优时间规整情况下两矢量 的距离。
设计效果1
设计效果2
识别结果
模板 距离 王玉玲 袁安琪 曾梓琳 张晶晶 识别

测试者 王玉玲1 王玉玲2 曾梓琳1 曾梓琳2 袁安琪1 袁安琪2 张晶晶1 1.101906 1.002261 1.131035 1.301476 0.855237 1.434391 1.062420 0.844177 0.862157 0.784781 0.940021 0.703739 1.083300 1.161514 0.703260 0.832811 0.668368 0.631587 0.840009 0.726672 1.427023 1.171531 1.214258 1.257515 1.303376 1.138163 1.398542 0.000000 开门 报警 开门 开门 开门 开门 开门

特征参数:MFCC、短时能量、短时过零率 识别算法:模板匹配方法(DTW) 矢量量化(VQ) 隐马尔可夫模型(HMM) 高斯混合模型(GMM) 人工神经网络模型(ANN) 支撑向量机(SVM)
设计思路
识别
录音
提取 特征
设计流程
声音录入,MP3转WAV 时域分析,频域分析 语音端点检测
相关文档
最新文档