基于说话人识别的门禁系统及DSP实现

基于说话人识别的门禁系统及DSP实现
基于说话人识别的门禁系统及DSP实现

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

第1章绪论

随着科学技术的不断发展, 安全防范技术的应用已深入到各个领域中去, 过去采用的单一的防范手段, 已经不能满足现代化管理的要求。当今世界安全防范技术现代化发展的方向是将图像监控、周界报警、门禁系统、室内防盗报警等, 经电脑管理中心综合在一起, 形成一个现代化、多功能、全天候的动态综合管理系统。作为智能弱电系统中的一种安防系统, 门禁系统集自动识别技术和现代安全管理措施为一体, 涉及光电、电子、机械、计算机、通讯、生物技术等诸多新技术, 体现了现代智能化管理的要求。因此, 它是新型现代化安全管理系统, 是解决重要部门出入口实现安全防范管理的有效措施, 因而应用广泛。实际上, 门禁系统就是在建筑物内外的出入口通过持有非接触式卡片来对人或物的进出实施放行、拒绝、记录等操作的智能化管理系统, 为大门门禁控制、考勤管理、智能楼宇系统、高安全性出入口管理、证券交易管理等安全, 方便地实施出入控制。门禁控制系统有时也称为出入监察智能系统, 其功能是有效地管理门的开启与关闭、保证授权出入门人员的自由出入、限制未授权人员的进入、对暴力强行进入门行为予以报警。同时可对出入人员与出入分类管理, 对出入和出入区域分类管制, 对出入人员代码、出入时间、出入门号码进行登录与存储。在数字化网络化飞速发展的今天, 门禁技术也得到了迅猛的发展。门禁系统早已超越了单纯的门道及钥匙管理, 已逐渐发展成为一套完整的出入管理系统。它在工作环境安全、人事考勤管理等行政管理工作中发挥着巨大的作用。并且, 在该系统的基础上增加相应的辅助设备,还可以进行电梯控制、车辆进出控制, 物业消防监控、保安巡检管理、餐饮收费管理等, 从而真正实现区域内一卡智能管理。综合集成计算机、通讯、自动识别、机械工程和安全管理系统等相关技术的门禁系统有效地解决了重要部门和场所的安全访问控制问题,已得到广泛的应用,成为日常工作和生活中的电子门卫。

随着科学技术的发展,综合应用语音识别、指纹识别、虹膜识别、红外(热)感应等最新生物识别技术,结合电磁锁等技术的门禁系统已广泛吸引了人们的注意,并将逐步成为门禁系统发展的主流与最终目标之一。利用语音识别技术来实现门禁系统不用像其他方式一样需要触摸,具有方便、安全、准确、信息完整、独立性强、反应速度快等优点。因此,基于语音识别技术的门禁系统有着非常独特的优势和发展前景。

1.1说话人识别概述

1.1.1说话人识别的原理

说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对个人特

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊征的分析和识别,从而达到对说话人进行辨认或者确认的目的。说话人识别并不注意语音信号的语义内容,而是希望从语音信号中提取出个人的特征,即根据语音判别说话人是谁。语音信号既载有说话人的语言信息,同时也载有说话人本身的特征信息。每个人发音器官都有自己的特征,说话时也都有自己的特殊语言习惯。在分析语音信号时,可以提取说话人的个人特征,从而有可能识别说话人是谁。说话人识别分为与文本相关的说话人识别和与文本无关的说话人识别。无论是与文本有关的说话人识别还是与文本无关的说话人识别,其基本原理都是为每一说话人建立一个能够描述这一说话人个性特征的模型。在目前话音特征与说话人个性特征还未很好地从语音特征中得到分离的情况下,为每一说话人建立的说话人模型实际是说话人的语音特征的模型。在进行说话人辨认时,取与测试音匹配距离最小的说话人模型所对应的说话人作为说话人辨认的结果,在进行说话人确认时,用测试音的模型与所声称的说话人的模型进行比较,若匹配距离小于一个规定的域值,则该说话人得到确认。由此可以看出,说话人辨认和说话人确认在本质上并没有什么差别。因此,若要实现说话人的识别,需解决以下几个基本问题:

1、对语音信号的预处理和特征提取;

2、说话人模型的建立和模型参数的训练;

3、测试音与说话人模型的匹配距离计算。

为了对说话人个性特征描述的一致起见,常将每一说话人的模型结构取得相同,不同的只是模型中的参数,通过用训练语音对模型进行训练得到。示意图如下所示

图1-1说话人识别的原理框图

1.1.2说话人识别的应用领域

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

说话人识别有其广泛的应用领域并具有与其它模式识别方式相比独特的优势。它的应用领域包括以下几个方面:考勤系统;语音电话拨号,提供主叫方的身份信息;电话银行,进行身份确认;安全控制;司法系统;军队和国防。说话人识别与其它模式识别相比所具有的优势:获取方便;获取成本低,使用简单;适合远程登陆;辨认和确认的算法复杂度低;配合其它措施可提高识别准确率;不涉及隐私。也正是因为说话人识别广泛的应用领域和独特的优势,所以说话人识别具有很高的研究价值。

1.2 DSP的应用前景

随着信息和计算机技术的飞速发展,信号处理理论和方法的不断更新、完善,通信、工业过程控制、军事、图形/图像处理等需要处理的数据量越来越大,对实时性和精度的要求越来越高。低档的微处理器已经不能满足要求,高性能的数字信号处理器(DSPS)的出现,软件和开发工具的完善,价格的大幅度下降,使得DSPS的应用前景越来越广阔。语音信号处理的算法尽管能在任何处理器上实现,然而并不是所有处理器都能够快速有效的完成这些任务,只有在专门的DSPS才能获得最大的速度和效率。自80年代以来,DSPS发展突飞猛进。DSPS运算的速度和计算能力,已经达到实时信号处理的要求。实时是指在实际运算中,输出的速度跟得上采样点输入的速度。对于某些运算(如滤波),这意味着每当接收到一次新的输入采样点时,就能产生一个新的输出。目前在语音信号处理的实际应用中,例如,语音信箱、声码器、语音识别、说话人识别、语音增强、语音综合以及文本转换等都可以应用数字信号处理器DSP实现,DSP也可以实现对视频和音乐的实时检测、处理。DSP 的发展可以说是日新月异, 它是未来数字化世界的源泉。

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

第2章方案论证与比较

2.1 说话人识别方案的论证

方法一:概率统计方法语音中说话人信息在短时间内较为平稳,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。

方法二:动态时间规整方法(DTW)说话人信息不仅有稳定因素(发声器宫的结构和发声习惯),而且有时变因素(语速、语调、重音和韵律)。将识别模板与参考模板进行时间对比,按照某种距离测度得出两模板间相似程度。常用的方法是基于最近邻原则的动态时间规整(DTW)。

方法三:矢量量化方法(VQ)矢量量化最早是用于聚类分析的数据压缩编码技术。Helms首次将其用于说话人识别,他把每个人的特定文本训练成码本,识别时将测试文本按此码本进行编码,以量化产生的失真度作为判决标准。Bell实验室的Rosenberg 和Soong用矢量量化进行了孤立数字文本的说话人识别研究,得到了较好的识别结果。

方法四:马尔可夫模型方法(HMM),隐马尔可夫模型是一种基于转移概率和输出概率的随机模型,最早在CMU和IBM被用于语音识别。它把语音看成由可观察到的符合序列组成的随机过程,符号序列则是发声系统状态序列的输出。在使用隐马尔可夫模型识别时,为每个说话人建立发声模型,通过训练得到状态转移概率矩阵和符号输出概率矩阵。识别时计算未知语音在状态转移过程中的最大概率,根据最大概率对应的模型进行判决。对于与文本无关的说话人识别一般采用各态历经型HMM;对于与文本有关的说话人识别一般采用从左到右型HMM。HMM不需要时间规整,可节约判决时的计算时间和存储量,在目前被广泛应用。

方法五:人工神经网络方法(ANN)人工神经网络在某种程度上模拟了生物的感知特性,它是一种分布式并行处理结构的网络模型,具有自组织和自学习能力、很强的复杂分类边界区分能力以及对不完全信息的鲁棒性,其性能近似理想的分类器。

将五种方法进行对比,方法一不用对特征参量在时域上进行规整,比较适合与文本无关的说话人识别,方法二受外界干扰因素大,方法四训练时计算量较大,方法五训练时间长,动态时间规整能力弱,而方法五的网络规模随说话人数目增加时可能大到难以训练的程度,利用矢量量化的说话人识别方法的判断速度快,而且识别精度也不低。所以选择方法三。

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊2.2 语音的采集和处理方案论证

方法一:ARM TrustZone技术可识别系统的安全码和数据,硬件能清楚区分安全信息和非安全信息。该区分能力可令安全码和数据在操作系统中安全而有效地同时运行,并不需要牺牲任何系统性能,也不会受病毒侵害。

方法二:DSP芯片制造商,目前有模拟器件(AD),德州仪器(TI),摩托罗拉(Motorola)等。目前,国内自主研发了DSP汉芯二号、汉芯三号,依赖国外进口的局面被打破了。在这些DSP厂商中以TI公司的市场份额最大,产品最全,目前,TI

的DSPS产品中,C2000系列主要有C24X和C28X。C5000系列主要C54X和C55X 两个子系列。C6000系列有C62X,C64X,C67X子系列,其中C67X为浮点系列DSP。在C64X子系列中TMS320DM642为多媒体处理平台,可实现多路音频、视频的同时采集和处理。

两种方法都是语音采集和处理的方法,但是方法一成本太高,基于实际考虑选择方法二。

2.3 控制部分方案论证

方法一:FPGA采用Altera公司的Flex10k系列芯片。芯片利用开发软件Max

+plusII将各个模块用VHDL语言描述并输入,由软件自动编译、综合、布局和布线,生成编程用的数据文件,加载到FPGA的配置存储单元。对FPGA芯片进行配置可有多种模式,当系统上电时,单片机自动将存在其内部的配置数据送到FPGA 内部存储单元中。

方法二:AT89C51是一种带4K字节闪烁可编程可擦除只读存储器(FPEROM一Flash Programmable and Erasable Read Only Memory)的低电压,高性能CMOS8位微处理器,俗称单片机。该器件采用ATMEL高密度非易失存储器制造技术制造,与工业标准的MCS-51指令集和输出管脚相兼容,由于将多功能8位CPU和闪烁存储器组合在单个芯片中,ATMEL的AT89C51是一种高效微控制器。

经过对比,方法一硬件结构和语言使用复杂,而AT89C51芯片却可以为很多嵌入式控制系统提供了一种灵活性高且价廉的方案。因此,选择方法二。

2.4 显示部分方案论证

方法一:LED数码管的结构简单, 分为七段和八段两种形式, 也有共阳和共阴之

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊分。以八段共阴管为例, 它有8个发光二极管(比七段多一个发光二极管, 用来显示SP, 即点) , 每个发光二极管的阴极连在一起,这样, 一个LED 数码管就有1根位选线和8 根段选线, 要想显示一个数值, 就要分别对它们的高低电平来加以控制。一般的显示电路由多个数码管构成, N 个数码管可以构成N 位LED显示器, 共有N 根位选线和

8N 根段选线。

方法二:液晶显示器都是数字式的,不像阴极射线管彩显采用模拟接口。也就是说,使用液晶显示器,显卡再也不需要像往常那样把数字信号转化成模拟信号再行输出了。晶显示器通过显示屏上的电极控制液晶分子状态来达到显示目的,即使屏幕加大,它的体积也不会成正比的增加,而且在重量上比相同显示面积的传统显示器要轻得多。其功耗主要消耗在其内部的电极和驱动IC上,因而耗电量比传统显示器也要小得多。

在单片机系统中, 常用LED数码管来显示各种数字或符号。而本设计中要显示数字和字符,所以选择方法二。

2.5 接口部分方案论证

方法一:利用NPN、发光二极管电感等,自己搭建电路,其方法简单,器件容易购买到。

方法二:利用MAX232芯片,次芯片是美信公司专门为电脑的RS-232标准串口设计的接口电路,使用+5v单电源供电。内部结构基本可分三个部分:第一部分是电荷泵电路。由1、2、3、4、5、6脚和4只电容构成。功能是产生+12v和-12v两个电源,提供给RS-232串口电平的需要。第二部分是数据转换通道。由7、8、9、10、11、12、13、14脚构成两个数据通道。其中13脚(R1IN)、12脚(R1OUT)、11脚(T1IN)、14脚(T1OUT)为第一数据通道。8脚(R2IN)、9脚(R2OUT)、10脚(T2IN)、7脚(T2OUT)为第二数据通道。TTL/CMOS数据从T1IN、T2IN 输入转换成RS-232数据从T1OUT、T2OUT送到电脑DP9插头;DP9插头的RS-232数据从R1IN、R2IN输入转换成TTL/CMOS数据后从R1OUT、R2OUT输出。第三部分是供电。15脚DNG、16脚VCC(+5v)。用法简单快捷。

基于方法一需要自己搭建电路,此过程可能会给电路带来不稳定因素的原因,选择方案二。

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

第3章硬件系统设计

3.1 系统概述

整个系统分为3大部分:语音采集部分、DSP处理部分、控制一显示部分。简单框图如下

在DSP处理部分本系统采用合众达公司的SEED-VPM642/Vl.1型(大学基本配置方案)开发板作为主处理器。此开发板配置了四路语音输入和四路语音输出的接口,利用其中的一路语音输入,外接一个无源麦克风作为语音采集设备,通过DSP的编程实现语音采样率的设定,数据缓冲区的管理,最终对语音数据进行处理和分析输出识别结果。由于DSP板无法提供控制按键和结果显示功能,本文自行开发了一个控制显示板来实现控制和显示功能。控制——显示板上需配置一片单片机,LCD液晶显示器,功能按钮,RS232串口。控制——显示部分通过串口与DSP板通信。控制一显示板向DSP板发送控制信息,控制DSP板的动作(识别、训练和模板擦除)。DSP 板把程序的运行状态和识别结果通过串口发送给控制一显示板,然后在LCD上显示。从中可以看到,DSP承担着三种任务:语音的采集控制、同步信号提取、语音的分析和识别,而单片机主要完成对整个系统的控制以及处理结果的显示。

3.1.1 语音采集部分

语音的采集是系统运行的第一步,也是整个系统关键的一步。SEED-VPM642提供了麦克风输入口,可接麦克风现场录音,由于麦克风输入口提供的功率不大,驱动能力有限,本文采用了耳机上自带的麦克风来进行语音输入,效果良好。为了保证系统的输入正常和便于检测,本文在录音的同时把语音通过语音输出口回放出来。可通过音箱或耳机收听。模拟语音通过DSP开发板上的音频解码芯片TLV320AIC23B进行A/D、D/A转换。TLV320AIC23B(以下简称AIC23B)是TI推出的一款高性能立体声音频Codec芯片,内置耳机输出放大器,支持MIC和LINEIN两种输入方式(二选一),并且输入和输出具有可编程增益调节。AIC23B的模数转换(ADC)和数模转换(DAC)部件高度集成在芯片内部,采用了先进的Sigma-delta过采样技术,可以在8K

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊到96K采样率范围内提供16位、20位、24位、32位采样,ADC和DAC的信噪比分别可以达到90dB和100dB。同时,AIC23B还具有很低的能耗,回放模式下功率仅为23mW。

3.1.2 DSP处理部分

系统的处理部分选用合众达公司的SEED-VPM642开发板作为主处理器。它是一款专为各种视频应用而开发的PCI插卡或带10/100M以太网接口的独立的模板。其上包含:专用于数字媒体应用的高性能32位定点DSPTMS320DM642,其工作主频高达720MHZ,处理性能可达5760MIPS,可实时实现多路数字视频/音频的编码运算,如:MPEG4、H.264、G.729等多路视/音频接口;4路PAL/NTSC制标准复合或Y/C 模拟视频输入,1路PAL/NTSC制标准复合或Y/C模拟视频输出,4路标准的Microphone输入或Audio Line In立体输入,4路标准的Audio Line Out立体声输出;2路可编程切换的RS232/RS422/RS485异步接口,8路数字输入、8路数字输出,用于云台控制和环境监控;标准的ATA硬盘接口,实现数字视频录像机功能;高速数据传输接口;标准的32位、33MHz、支持主/从模式的PCI2.2总线或10/l00M以太网接口,方便实现数字视频服务器功能;实时时钟,为数字视频/音频提供实时基信号;软/硬件加密功能,更好地保护产品开发者的知识产权。SEED-VPM642的主要技术指标如下:

1、主处理器:TMS320DM642,工作频率高达720MHz,处理能力可达5760MIPS SDRAM:4MX64位,工作时钟133MHz

2、Flash:4M*8位,70ns(20年数据保存,1000000次擦写)

3、视频输入:4通道,DB-26连接器,PAL/NTSC标准模拟视频信号

4、视频输出:1通道,DB-26连接器,PAL/NTSC标准模拟视频信号

5、音频输入:4通道,DB-26连接器,Microphone输入、或Line In输入,支持8kHz-

96KHz@16/21/24/32位采样

6、音频输出:4通道,标准3.5mm Audio Jack连接器,Line Out输出

7、异步串口:2通道,DB-26连接器,RS232/RS422/RS485可编程配置,

8、数字I/O:8路开入、8路开出,DB-26连接器

9、PCI接口:32位、33MHz,支持主/从模式的PCI2.2标准

10、ATA接口:带围墙的40-芯IDC针式插座,实现ATA的PI04.0传输方式

11、工作温度:0-70℃

12、机械尺寸:标准PCI半长卡(175mm*107mm)

3.1.3 控制——显示部分

本部分由AT89C51芯片及其外围电路完成。其框图如下

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊

┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

图3-2 控制显示框图

AT89C51是一个功能强大性价比很高的一款芯片,在嵌入式控制应用中得到了广泛的应用,它的特点有:

1、兼容MCS-51微控制器。

2、4KBFlash存储器,支持在系统编程ISP,1000次擦写周期。

3、128xsbit片内RAM。

4、全静态时钟0-24MHz

5、三级程序加密

6、32个可编程1/0端口。

7、2个16位定时/计数器。

8、6个中断源

9、可编程串口通信信道。

10、低功耗支持Idle和Power-down模式。

3.2 硬件电路设计

3.2.1 DSP接口电路设计

由于串口通信方便且稳定性高等优点,本文采用串口实现DSP开发板与控制显示板的通信。在SEED-VPM642上配置有二个通用异步串口,接口标准可由软件配置为RS232/RS422/RS485,它采用TL16C752B通用异步收发器UART,其上包含二路相互独立的异步收发器,接收和发送各带64字节FIF0,并各自带有Modem接口信号,最高传输速率可达1.5Mbps。

TL16C752B采用8位异步并行存储器接口,并采用+3.3V电源供电,可以与

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊TMS320DM642的外部存储器接口(EMIFA)直接连接。TL16C752B每个通道包含18个寄存器,通过地址A2-A0及寄存器位对它们进行寻址,A、B二通道分别由片选信号选通,本系统采用A通道。SEED-VPM642将TL16C752B配置在DM642的CEI

空间,A通道所占地址范围为:0x90080000-0x90080007。在本设计中,TL16C752B

图3-3 DSP接口电路

如图所示,TL16C752的X1与X2外接振荡电路,TXA接转换电路的TXD,RXA 接转换电路的RXD,D0~D7接DSP的D0~D7,A0~A2接DSP的A0~A2,

-

-

-

-

-

-

-

-

B

CSA/与DSP的

-

-

-

CS相连,

-

-

-

-

ICR与DSPD的---RE相连,-----ICW与DSP的----WE相连,INTB/A接DSP 的INT1,两个芯片的复位电路相连,至此电路连接完成。

3.2.2 串行接口电路设计

本文采用RS-232串行接口标准。RS-232是PC机与通信工业中应用最广泛一种串行接口,是低速率串行通信中增加通信距离的单端标准。典型的RS-232信号在正负电平之间摆动,在发送数据时,发送端驱动器输出正电平范围是+5~+lV;负电平范围是-5~-15V。当无数据传输时,线上为TTL,从开始传送数据到结束,线上电平从TTL电平到RS-232电平再返回TTL电平。接收器典型的工作电平范围是+ 3~+12V 与-3~-12V。由于发送电平与接收电平的差仅为2~3V,所以其共模抑制能力差,再加上双绞线上的分布电容,其传送距离最大约15m,最高速率为20kbit/s。RS-232是为点对点(即只用一对收、发设备)通信而设计,所以RS-232适合本地设备之间的通信。由于TTL电平与标准的RS-232并不兼容,需要加上电平转换IC(在本文中采用MAX232芯片)方可与RS232接口相连。电路图如下

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

图3-4 串行口接口电路

如图MAX232芯片是美信公司专门为电脑的RS-232标准串口设计的接口电路,使用+5v单电源供电。1脚和3脚之间接一个10uF的电容,4脚和5脚之间接一个10uF的电容,2脚通过一个10uF的电容接5V电压,6脚通过10uF电容接地,其11脚和12脚与单片机的10脚和11脚相连,至此完成电平转换电路。

3.2.3 单片机串行通信接口设计

AT89C51单片机通过管脚RXD(串行数据接收端)和管脚TXD(串行数据发送端)与外界通信。SBUF是串口缓冲寄存器,包括发送寄存器和接收寄存器。它们有相同的名字和地址空间,但不会出现冲突,因为一个只能被CPU读出数据,另一个只能被CPU写入数据。单片机接口电路图如下

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

图3-5 单片机最小系统电路

89C51的19和18脚与两个33uF的电容和一个11.095MHz的晶振构成一个振荡电路,9脚外接一个手动上电复位电路,使能端通过一个电阻接到5V电源上。至此,单片机最小系统电路完成。

3.2.4 LCD电路设计

液晶显示器LCD体积小,重量轻,功耗极低,应用十分广泛。本文采用的是北京精电篷远的MDLS2046点阵字符液晶显示模块。它由TN型液晶显示器、CMOS驱动器和CMOS控制器组成,模块内集成有字符发生器和数据存贮器,采用单一5

+V 电源供电。MDLS2046有16条引脚,本文用14条,现分别介绍:

1、VSS:地线输入端。

2、VDD:+5V电源输入端。

3、VO:液晶显示面板亮度调节,通过0~10Ω

K的电阻接到+5V和地之间起调节作用。

4、RS:寄存器选择信号输入线,低电平选通指令寄存器,高电平选通数据寄存器

5、R/W:读/写信号输入线,低电平为写入,高电平为读出。

6、E:片选信号输入线,高电平有效。

7、D0-D7:数据总线。

┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

J1LCD

图3-6 LCD接口电路

如上图,在硬件设计电路中,LCD的8位数据线与单片机的P0口相连,中间接了一片74LS245总线收发器作为数据线的中继。RS接单片机的P2.0;R/W接P2.1;E 接P2.2;至此LCD与单片机的硬件连接全部完成.

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

第4章软件实现

4.1 DSP的软件实现

系统的软件开发环境是TI公司推出的一个集成性DSPs软件开发工具CCS(Code Composer Studio)。在一个开放式的插件(plu-in)结构下,CCS内部集成了以下软件工具:C6000代码产生工具(包括C6000的C编译器、汇编优化器、汇编器和连接器);软件模拟器(Simulator);实时基础软件DSP/BIOS;主机与目标机之间的实时数据交换软件RTDX;实时分析和数据可视化软件。在CCS下,可以对软件进行编辑、编译、调试、代码性能测试(profile)和项目管理等所有工作。除此之外,它还提供了实时分析和数据可视化功能,大大降低了DSP系统的开发难度。该软件支持汇编语言、C语言和C++语言,由于C语言在工业控制中的重要地位,CCS软件对C语言程序进行了很好的代码优化处理,使C语言执行效率得到很大的提高。系统的软件流程如下所示。

┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 装 ┊ ┊ ┊ ┊ ┊ 订 ┊ ┊ ┊ ┊ ┊ 线 ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊

整个系统工作在对串口的查询方式下,如串口有输入即根据输入进行处理。另外,语音的采集也采用查询方式。 4.1.1 FLASH 引导的实现

引导程序(也称 Boot Loader 程序)的设计是开发DSP 应用系统必须做的最后一步

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊工作。在DSP的应用中,系统上电后需要将用户程序从FLASH存储器加载到高速数据存储器中运行。这就需要给通过JTAG口调试通过的应用程序添加一个引导代码,然后将生成的目标文件进行格式转换使其能在线烧写,将转换过的文件利用FLASH 烧写程序通过JTAG口在线烧写到FLASH中。

本文实现了自引导程序的编写、文件格式转换、命令文件的编写以及在线烧写的步骤和方法。从而整个系统可脱机运行,实现了真正的嵌入式开发。

4.1.2 FLASH的在线引导

对于DSP芯片来说,它的内部ROM空间是有限的,生产商在这个小容量的ROM 中固化了一些程序和查找表,当上电复位后,程序指针自动指向ROM中的一个称为Boot的小程序,这个程序会根据环境选用相应的Boot Loader方法将外部FLASH中的程序搬移到DSP片上的RAM中或片外的SDRAM中,并将程序指针移到执行程序的第一行处。而TMS320C64XDSP这个过程稍有不同,芯片上的ROM中的Boot Loader程序会把FLASH中第一个lK字节的程序搬移到DSP内部的RAM中,然后程序指针指向此lK字节的程序开始执行。而用户的应用程序一般都要大于1K字节,所以这lK字节的程序一般为用户自己开发的引导程序,通过执行此引导程序把用户应用程序搬移到RAM中,程序指针跳转到程序入口处,开始执行用户应用程序。4.1.3存储器配置文件

完成FLASH的自举引导,首先要修改一下工程中的命令文件(.cmd)。命令文件就是指导连接器如何将程序各段分配到相应的RAM中。编写命令文件时,有一点需要注意,那就是在很多情况下需要对某段说明两个不同的地址:加载地址和运行地址。加载地址决定了二进制程序代码的存储位置和程序的引导地址,但在运行过程中对于该段的任何引用则是以它的运行地址作为参考的。因此,当用户对某段分别说明了加载地址和运行地址时,只有将该段从加载地址复制到运行地址上,该段才可以被访问。

4.1.4用户引导代码的编写

完成存储器配置文件后就要编写用户引导代码。DSP加电复位后,片上的ROM 程序从CEI空间(本工程中CEI空间映射到FLASH上,首地址为0x90000000)拷贝IK 数据(用户引导代码)到RAM的0地址处然后从0地址处开始执行指令。

4.1.5 .OUT文件到.Hex文件的转换

完成存储器配置文件的设置和用户引导程序的编写后,在CCS中设置Release

版本即发行版,通过编译连接生成.out文件。由于.out是COFF格式,FLASH不支持这种格式,所以不能直接写入FLASH。必须对.out进行格式转换,形成数据文件即.hex 文件,最后用FLASH烧写程序把转换好的.hex文件烧写到FLASH中。格式转换工具为T1提供的hex6x,具体步骤如下:

1.建立一个文件夹例如converter

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊

2.\ti\e6000\egtools\bin目录下的hex6x可执行文件考到converter文件夹内。

3.把需转换的.out文件也拷贝到converter文件夹内。

4.在converter文件夹内建立一个xx..out文件同名的xx.cmd批处理文件。

5.在操作系统(WinXP)的命令行提示符中把converter目录设置成当前目录,敲入hex6x xx.cmd即可生成.hex文件。

4.1.6 FLASH的烧写

FLASH烧写需保证DSP板通过JTAG口与计算机连接正常。利用TI公司提供的一个名为FlashBurn的插件程序,先擦除FLASH中的全部内容,然后根据插件程序的图形界面进行相应的配置即可烧写。

4.2控制——显示板软件设计

控制——显示板的软件设计分为3部分:串口中断编程,键盘键值扫描,LCD 写数据及写控制命令。程序流程图如图4-5。

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊

┊┊┊┊┊┊┊┊┊4.2.1.串口程序设计

串口初始化。向串口控制与状态寄存器(SCON)写入0x40,选择工作方式1,初始化波特率发生器,波特率选择9600,与DSP开发板匹配。禁止Tl中断,允许串口中断,开中断,允许接收,串行口初始化完毕。

串口数据收发采用中断方式。采用4号中断,3号寄存器。程序流程图如图5-6所示。

图4-5 控制——显示板程序流程

┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊

线┊┊┊┊┊┊┊┊┊┊┊┊┊4.2.2 键盘程序设计

键盘的程序设计完全由键盘的硬件设计原理决定。键盘与单片机的P1口相连,以检测按键S1,S2,S3为例来说明一下按键程序设计的原理。首先向Pl口写入0xf7,那么P13为0,其余为1,分别检测P10,P11,P12的值,如果P10为0,说明P10与P13短接,由此可知S2按下;如果P11为0,说明S3按下;如果P12为0,说明S4按下。另外,本文在键盘扫描程序中设计了一个消抖子程序,用来防止键盘抖动。4.2.3 LCD程序设计

LCD程序设计分为两方面,写控制指令,写数据。

1、液晶显示模块指令系统。

运行时间(250KHz):1.64ms

功能:清DDRAM和AC值

指纹门禁系统管理系统设计毕业论文

指纹门禁系统管理系统设计毕业论文 目录 第一章绪论 (1) 1.1引言 (1) 1.2研究背景及意义 (1) 1.3本文的结构 (2) 第二章系统硬件设计 (3) 2.1系统的硬件结构 (3) 2.1.1 系统硬件设计综述 (3) 2.1.2 硬件系统元器件概述 (4) 2.2主控芯片硬件设计 (5) 2.2.1 AT89C52介绍 (5) 2.2.2 主要功能特性 (5) 2.2.3 管脚说明 (6) 2.2.4 主控芯片模块设计 (8) 2.3指纹识别模块的硬件设计 (9) 2.3.1 指纹识别模块 (9) 2.3.2 电平信号转换 (10) 2.3.3 稳压器 (10) 2.3.4 数据接收设置 (12) 2.4LCD液晶显示器模块硬件设计 (13) 2.4.1 LCD模块 (13) 2.4.2 接口电路设计 (14) 2.5时钟/日历芯片模块硬件设计 (15) 2.5.1 时钟/日历芯片元器件 (15) 2.5.2 接口电路设计 (16) 2.6E2PROM的读写程序模块硬件设计 (17) 2.6.1 元器件参数 (17) 2.6.2 元器件工作分配 (18) 2.6.3 接口电路设计 (19) 2.7键盘输入模块的硬件设计 (20) 2.8电机正反转电路设计 (21) 2.9紧急复位电路设计 (22) 第三章系统软件设计 (24) 3.1系统软件结构 (24) 3.1.1 系统功能 (24) 3.1.2 系统职能模块 (24) 3.1.3 系统软件流程 (25)

3.2显示程序软件设计 (26) 3.2.1 显示器的读写时序及初始化 (26) 3.2.2 显示程序设计 (27) 3.3键盘输入模块软件设计 (29) 3.4串行E2PROM的读/写程序模块软件设计 (31) 3.4.1 I2C总线协议 (31) 3.4.2 I2C总线写入程序 (31) 3.4.3 I2C总线读程序 (32) 3.5时钟/日历模块软件设计 (34) 总结 (39) 结论 (39) 感悟 (39) 致谢 (40) 参考文献 (40) 附录A: 系统硬件图 (42) 附录B: 系统程序 (44) 附录C: 系统调试图 (51) 附件毕业论文光盘资料

语音信号的提取与识别技术——说话人识别系统的研究

毕业设计说明书 语音信号的提取与识别技术 ——说话人识别系统的研究 作者:学号: 学院(系): 专业: 指导教师: 评阅人: 20**年6月

中北大学 毕业设计(论文)任务书 学院、系: 专业: 学生姓名:学号: 设计(论文)题目:语音信号的提取与识别技术 起迄日期: 20**年2月15日~20**年6月21日 设计(论文)地点: 指导教师: 系主任: 发任务书日期:20**年2月15日

毕业设计(论文)任务书 1.毕业设计(论文)课题的任务和要求: 1.了解声音信号的特征参数,及现阶段研究处理方法。以现阶段信号处理领域比较活 跃的语音信号为具体研究对象,进行相关知识的了解与学习。 2.学会在语音信号处理中使用MATLAB软件工具。 3.针对基本的个别个体的特定声音进行与信识别研究。 4.根据研究情况利用MATLAB语言进行相关算法的实现。 2.毕业设计(论文)课题的具体工作内容(包括原始数据、技术要求、工作要求等): 1.查阅相关资料,利用已学的相关知识进行消化和理解。 2.了解现阶段的语音处理情况,分析研究相关的产品。 3.研究学习基本的识别处理方法。 4.学习相关信号处理软件。。 5.对软件的学习达到能对基本的算法进行软件的处理。 6.完成毕业设计论文。

毕业设计(论文)任务书 3.对毕业设计(论文)课题成果的要求〔包括毕业设计(论文)、图纸、实物样品等): 1、毕业论文一份; 2、英文文献1份,相应的中文译文1份。 4.毕业设计(论文)课题工作进度计划: 起迄日期工作内容 2006年 2月15日~ 3月31日4月 1日~ 5月31日6月 1日~ 6月20日6月20日~ 6月21日系统学习,查阅资料,作开题报告;英文资料翻译; 撰写毕业论文; 论文答辩。 学生所在系审查意见: 系主任: 年月日

说话人识别研究综述_王书诏

图1说话人识别系统框图 识别 训练 输入语音 预处理 特性 提取 相似性准则 判决 模型存储 模型产生 文章编号:1002-8684(2007)01-0051-05 说话人识别研究综述 王书诏,邱天爽 (大连理工大学电子与信息工程学院,辽宁大连116023) 【摘 要】说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。详细介绍了说话人识别的基本 原理,从特征提取、模型训练和分类等几个方面就近年的主要研究情况进行综述和评价,并在此基础上探讨了研究难点和发展前景。 【关键词】说话人识别;特征提取;模型训练;分类【中图分类号】TN912 【文献标识码】A SurveyonSpeakerRecognitionWANGShu-zhao,QIUTian-shuang (DepartmentofElectronicEngineering,DalianUniversityofTechnology,DalianLiaoning116023,China)【Abstract】Speakerrecognitionisanimportantpartofthespeechsignalprocessing.Itisoneofthecurrentresearch hotspots.Theprinciplesofthespeakerrecognitionareintroducedindetail.Thelatestdevelopmentintheareasofthefeatureextraction,modeltrainingandclassificationisreviewedandthetrendandrubsarealsodiscussed. 【Keywords】speakerrecognition;featureextraction;modeltraining;classification ?综述? 1 引言 说话人识别作为生物认证技术的一种,是根据语 音波形中反映说话人生理和行为特征的语音参数自动鉴别说话人身份的一项技术[1]。因此,需要从各个说话人的发音中找出说话人之间的个性差异,这涉及到说话人发音器官、发音通道和发音习惯之间等不同级别上的个性差异。说话人识别是交叉运用心理学、生理学、语音信号处理、模式识别、统计学习理论和人工智能的综合性研究课题。 说话人识别根据实现的任务不同,可分为说话人辨认(speakeridentification)和说话人确认(speaker verification)两种类型[2];说话人识别根据系统对待识别语音内容的不同,又可分为与文本有关(text-dependent)和与文本无关(text-independent)两种方式[3] 。 2说话人识别的基本理论与前期处理 2.1 语音产生模型[4] 语音信号可以看成是激励信号UG(n)经过一个线性系统H(z)而产生的输出[4] 。其中,声道模型H(z)为 离散时域的声道传输函数,通常可用全极点函数来近似。不同的说话人其声道形状是不同的,因此具有不同的声道模型。H(z)表示为 H(z)=1A(z) = 11-p i=1!aiz -i (1) 其中p为全极点滤波器的阶数;ai(i=1,2,…,p)为滤波器的系数。p值越大,则模型的传输函数和实际声道传输函数的吻合程度就越高,当然p值也不能取得太大,一般情况下,p的取值范围为8~12[4]。 2.2说话人识别基本原理 图1为说话人识别系统框图。和语音识别系统一 样,建立和应用这一系统可分为两个阶段:训练阶段和识别阶段。在训练阶段,系统的每个使用者说出若干训练语句,系统据此建立每个使用者的模板或模型参量参考集;而在识别阶段,待识别说话人语音中导出的参量要与训练中的参考参量或模板加以比较,并且根据一定的相似性准则形成判断。 2.3预处理[5] 通常,输入的语音信号都要进行预处理,预处理过 程的好坏在一定程度上也影响系统的识别效果。一般 Voicetechnolog Y 语音技术

基于指纹识别的门禁系统设计

基于指纹识别的门禁系统设计 摘要:为了更好地服务于实验室管理,提高高校实验室的智能化管理,设计并实现 了一种采用嵌入式技术的基于单片机的指纹门禁系统,给实验室管理者和学生提 供了便利。 关键词:指纹识别;门禁系统;嵌入式技术;单片机 随着社会的进步,人们安全意识的提高,高安全的门禁系统成为社会工作、生活环境中重要的环节。但传统的门禁系统由于鉴别方式、速度和性能等方面的限制, 很难满足安全可靠和网络化的控制需求。同时,随着识别技术和网络技术的飞速 发展,门禁系统也得到了飞跃式的发展,出现了基于指纹识别的门禁系统。这种系 统具有安全性、方便性和易管理性等特点。对于高校而言,实验室是教师科研、 学生科学实验的重要场所,承担实践能力、创新能力和工程应用能力培养的重要 任务。为提高高校实验室的智能化管理,开发设计一种指纹门禁系统,下面将对本 系统的设计以及实现进行介绍。 1.系统方案设计 系统由控制模块、指纹传感器模块、显示模块、电磁锁控制模块和报警模块 等组成.控制模块选用的是STC 公司生产的基于MCS-51 内核的8 位微控制器 STC89C52,指纹传感器模块选用的是FPM10A 光学指纹传感器采集及识别指纹信息,显示模块用于实时显示系统的状态信息,电磁锁控制模块用于控制门的开关 状态,报警模块则用于提示管理员门禁系统故障或者无关人员企图进入限制区域,系统结构框图如图1 所示 图1 系统结构框图 2.系统硬件电路设计 2.1 系统电路原理图设计 系统选用的控制器是宏晶科技推出的新一代具备高速、低功耗和超强抗干扰 特点的STC89C52单片机,是系统的控制核心.根据系统工作需要设计的外围电路 有时钟电路、复位电路、指纹模块电路、报警电路、液晶显示电路和控制电路等 部分组成. 2.2 FPM10A 光学指纹传感器 光学指纹传感器是利用光的折射和反射原理,通过CMOS 或者CCD 的光学器 件采集到不同明暗程度的图片信息,完成指纹数据的采集[1].本系统选用的光学指纹传感器模块的型号是FPM10A,该传感器模块有VCC(接3.6V-5.5V)、GND (电源地)、TXD、RXD 和NC 等五个端口,采用半双工异步串行通讯,TXD 为串 口的数据发送端,RXD 为串口的接收端,其默认波特率为57600bps,也可根据实 际需要通过命令设置为9600~115200bps. 传感器模块的TXD 和RXD 端口分别与STC89C52 单片机的P30 (RXD)和P31(TXD)相连进行数据传输,传输的帧格式如图2 所示. 图2 FPM10A 传输的帧格式 2.3 电磁锁 电磁锁是利用电生磁的工作原理,当有电流通过硅钢片时会产生强大的磁力 吸附固定在门框或墙体的铁板从而实现锁门的效果[2].当门禁系统识别到有进入实验室权限的人员时电磁锁电源断开,即可进入实验室,否则无法进入实验室.本系

基于说话人声音识别的技术研究语音识别技术

基于说话人声音识别的技术研究语音识别技术基于声音的说话人身份识别技术研究 通信1203班 成员:艾洲、刘安邦、汪中日 余文正、王玉贵、宁文静 xx-12-28 项目背景 伴随着全球化、网络化、信息化、数字化时代的到来,我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。 在生物学和信息科学高度发展的今天,根据人体自身的生 理特征(指纹、虹膜…)和行为特征(声音…)来识别身份的生物技术认证作为一种便捷、先进的信息安全技术已经在现实生活中得到广泛的应用,它是集光学、传感技术、红外扫描和计算机技术于一身的

第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。 而语音是人的自然属性之一,由于说话人发声器官的生理 差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能。 设计总体框架 1.语音库的建立 2.声音样本采集 2.1 特征参数提取 2.2 识别模型建立 3.语音识别测试 梅尔倒谱系数(MFCC)简述

在话者识别方面,最常用到的语音特征就是梅尔倒谱系数(MFCC)。因为,根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度,得出从200Hz到5000Hz的语音信号对语音的清晰度影响最大。 所以,人们从低频到高频这一段频带内按临界带宽的大小由密到疏安排一组带通滤波器,对输入信号进行滤波。将每个带通滤波器输出的信号能量作为信号的基本特征,对此特征经过进一步处理后就可以作为语音的输入特征。由于这种特征不依赖于信号的性质,对输入信号不做任何的假设和限制,又利用了听觉模型的研究成果。因此,这种参数比基于声道模型的“线性预测系数LPC”相比更好,更符合人耳的听觉特性,而且当信噪比降低时仍然具有较好的识别性能。 MFCC倒谱特征提取流图 1. 预加重 预加重处理其实是将语音信号通过一个高通滤波器:式中μ的值介于0.9-1.0之间,我们通常取0.97。预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用

指纹识别门禁系统产品合作协议

指纹识别门禁系统产品合作协议 甲方:××科技发展有限公司 住所地: 法定代表人: 联系电话: 乙方:××电子信息技术有限公司 住所地: 法定代表人: 联系电话: 鉴于乙方拥有指纹识别门禁系统产品完整的所有权和知识产权、且至本协议签定之日未与任何他方就本产品、知识产权有任何形式的合作,乙方也未以任何方式生产和销售本产品;

甲、乙双方经协商一致,在平等、自愿的基础上,就合作生产、销售由乙方自主研制的指纹识别门禁系统产品项目达成本协议,以资共信守。 1.合作内容 本项目合作的内容为:生产、销售由乙方自主研制的指纹识别门禁系统产品。首批生产套(其中银行指纹识别联动门禁系统套),以后批产品生产量根据市场销售情况待定。 2.合作期限 年月日--年月日,共捌年。 3.合作体制 在甲方框架内成立由乙方组建,甲方派员监督的指纹识别产品项目部,其权限为负责本项目产品的生产、销售及售后服务。项目部设立独立帐户,实行独立核算。 4.知识产权的使用 4.1本项产品的生产、销售可使用乙方提供的中文:××;英文:的注册商标。也可以使用甲方所提供的商标及冠名。

5.权益平衡 自本协议签定之日起,乙方不得独立或以任何方式与第三方合作生产、销售指纹识别门禁系统产品。 甲方从合作之日起,按月向乙方提供资金万元,持续时间不超过个月,且该资金纳入本项目产品的生产总成本。 6.甲方职责 6.1提供本合同项目生产、销售及售后服务的所需资金,前期投入不低于人民币万元(以后根据市情况待定)的基本运作资金,在本协议签定生效后的十个工作日内存入开列的指纹产品项目部的独立帐户内,实行专款专用,保证该资金的投放与生产、销售及售后服务的进程同步,并即时派出财务人员管理并建立独立的帐目,及时制作月报及年报等财务文件交双方备案。 6.2提供本项目产品必需的生产场地(-标准厂房)。 6.3监督本项目产品的生产、销售及售后服务的全过程。 6.4与乙方共同制定项目产品的销售计划、共同进行本项目产品的销售及售后服

说话人识别系统~

燕山大学 专业综合训练说明书 题目:说话人识别系统的设计 学院(系): 年级专业: 学号: 学生姓名: 指导教师: 教师职称:

燕山大学专业综合训练任务书 院(系):电气工程学院基层教学单位:仪器科学与工程系学号学生姓名专业(班级) 题目说话人识别系统的设计 训练内容 应用矢量量化法构建说话人识别系统,编写程序,实现对信号处理方法和仿真实验相结合的全面综合训练。 训练要求1.熟练掌握说话人特征参量及特征参数的提取方法。 2.熟练掌握Matlab编程方法。 3.掌握GUI的设计方法。 4.掌握模式匹配方法 5.完成系统构建,编写程序,实现对说话人身份的鉴别。 工作计划 第一周第二周第三周第四周 检索、查阅资料, 学习基础知识,构 建说话人识别整体 系统。 学习矢量量化法编写程序。 程序调试与撰写报 告。 参 考 资 料 Matlab方面资料、语音信号处理方面资料 答疑地点A203-1 答疑时间周六晚19点至22点;周日晚19点至22点。 指导教师签字基层教学单位主任签字 Tel:130******** 2012 年8月27日

目录 第1章摘要 (3) 第2章前言 (4) 第3章说话人识别系统设计相关知识 (5) 3.1 说话人识别基本原理 (5) 3.2 设计要求 (5) 3.3 结构设计 (5) 第4章设计方案 (7) 4.1 预处理模块 (7) 4.2 特征参数 (13) 4.3 训练模型 (17) 4.4 识别模型 (21) 第5章实验结果 (22) 第6章应用程序 (25) 心得体会 (28) 参考文献 (29)

说话人识别系统属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数识别说话人身份的技术。它是指通过说话人的语音来自动识别说话人的身份。目前,与文本无关的说话人识别的常用方法有很多,本文应用的是基于非参数模型的矢量量化VQ(VectorQuantization)方法。VQ在孤立词语音识别系统中得到了很好的应用,特别是有限状态矢量量化技术,对于语音识别更为有效。基于VQ的孤立词语音识别系统具有分类准确,存储数据少,实时响应速度快等综合性能好的特点。借助MATLAB工具,设计基于VQ码本训练程序和识别程序,识别特定人的语音。其系统处理过程主要是先对语音进行预加重、端点检测、分帧、加窗处理四个部分的处理,然后提取特征矢量参数(采用MFCC系数),然后对模版语音用矢量量化方法进行训练得到语音模版,最后用测试语音测试系统性能。其中系统的设计要分为预处理模块、特征提取模块、训练模块和识别模块等,各个部分结合在一起实现说话人识别功能。 关键词:训练,说话人识别, VQ ,MATLAB

指纹门禁系统方案

指纹门禁考勤系统解决方案 考勤门禁系统产品选用应把“可靠性”放在第一位。指纹产品杜绝代打卡,误报率降为最低。指纹考勤门禁系统产品将长期使用,人事管理对一个公司占着很重要的地位.... 一、系统概述 现代企业管理是一个追求高效益、高速发展的管理时代。继2003年的下半年指纹认证市场的迅猛发展,2004年第一季度,中国生物认证市场增长速度倍增。指纹认证技术在中国市场的应用,从1993年到现在以十几个年头了,到现在基本与国际水平同步,中国市场指纹识别的应用中,指纹门禁的应用又异军突起。从技术的层面看,指纹门禁属于高端产品,质量要求较高,国内相关厂商通过多年的磨练,使得产品性能完善,占领了很大部分的份额和地位。中控指纹门禁系统是利用生物识别技术、计算机技术,集成门禁,考勤门禁,门禁管理和人事管理软件组成的门禁考勤门禁系统。工作人员不必保管和携带各种证件如纸卡或IC卡等等,只要轻轻一按手指就可完成身份识别以达到开门,考勤门禁的目的。确保门卫的安全,考勤门禁的公正,记录的统计,数据的准确。指纹的唯一性彻底根除冒名顶替,虚假信息对我们带来的不必要麻烦,只需有资格的人轻轻按下手指,月底管理人员操作电脑轻轻松松打印进出资料。门禁管理,人

事考勤门禁报表,考勤门禁管理全部电脑化,确保门禁考勤门禁管理的公正、公平、科学、准确。 二、产品概述 1.指纹识别 生物识别是当今最先进和最可靠的识别技术之一,它是利用人体的固定生理特征作为确认身份的一种识别技术,指纹是常用的一种,它通过对分杈形、尾端形、岛形、复合形,左斗纹、右斗纹、左箕纹、右箕纹、三角区与中心点位置的鉴别对比来确定指纹是否出自同一人。 2.指纹算法是依据指纹特征辩识需求、按计算机程序设计规律建立的、指纹识别与判定规则的数学模型描述。 Biokey算法是一种快速、准确的1:N指纹识别算法,在使用Biokey 进行指纹识别时(2000-6000枚指纹),不需要对指纹通过姓名、PIN 等预先分类就可以在1-5秒(以下测试都在Pentium III 900MHz+ 128MB内存环境下进行)内轻松完成。经过Biokey算法的不断升级改

指纹门禁系统详细设计说明书

1 指纹门禁系统详细设计说明书 一、引言 1. 编写目的: 为了使开发人员在完成概要设计说明书的基础上完成概要设计规定的各项模块的具体实现的设计工作。 2. 背景: 本项目名称定为:基于指纹的存包系统.分为四个子功能模块:指纹信息管理模块、更新模块、查询模块和数据导入/导出模块。 3. 定义: 本系统是基于指纹的存包系统,它是为了方便广大客户的存包而开发的。它采用了先进的指纹技术,不但使用方便,而且安全可靠。 4.系统功能简介: 本系统主要用大型超市、购物广场、政府部门机关、国家机密文件保护。它的安全 性能高,特别适用于高机密文件的保存。 5.参考资料: 本次详细设计主要参考以前的几个阶段,如需求分析、总体设计两个阶段的设计。 软件工程 高等教育出版社 二、程序系统的结构: 1. 软件描述: 基于指纹的存包系统可以实现指纹提取、存取包、显示信息、管理员查询、经理查询,可实现顾客指纹信息存储、管理员信息存储、可统计日人流量、月人流量、对存包柜的管理。服务器采用windows SQL Server 。客户端采用windows xp 操作系统、浏览器采用IE6.0。 2. 软件结构: 1) 总体结构: 2)控制面板模块: 控制面板 主控模块 指纹核对 人流量统计 控制面板 传感器 指纹采集 用户登录 管理员登录 指纹信息管理 存包柜控制 管理员信息 用户信息 分机信息

A.指纹核对模块: B.人流量统计: C.指纹信息管理模块:指纹核对 存包 取 包人流量统计 日人 流量 累加 月 人 流 量 累 加 按 指 纹 信 息 统 计 指纹信息管理 指 纹 输 入 时 间 指 纹 类 型 2

指纹识别门禁系统的设计与实现

目录 摘要 ............................................... 错误!未定义书签。ABSTRACT ........................................... 错误!未定义书签。第一章绪论 ........................................ 错误!未定义书签。 论文的背景及意义............................... 错误!未定义书签。 识别技术简介................................... 错误!未定义书签。 指纹特点 ................................... 错误!未定义书签。 指纹特征 ................................... 错误!未定义书签。 指纹应用系统简介 ........................... 错误!未定义书签。 指纹取像技术及其特点....................... 错误!未定义书签。第二章指纹门禁系统的总体设计 ...................... 错误!未定义书签。 系统功能....................................... 错误!未定义书签。 系统性能指标................................... 错误!未定义书签。 系统硬件结构................................... 错误!未定义书签。 系统软件结构................................... 错误!未定义书签。第三章指纹门禁系统的硬件设计 ...................... 错误!未定义书签。 SPCE061A单片机介绍............................. 错误!未定义书签。 SPCE061A单片机的主要性能................... 错误!未定义书签。 指纹识别模块OM-20的管脚说明及性能指标...... 错误!未定义书签。 SPCE061A单片机与指纹识别模块OM-20的接口电路设计错误!未定义书 签。 SPCE061A单片机与液晶显示模块SPLC501的接口...... 错误!未定义书签。第四章指纹门禁系统的软件设计 ...................... 错误!未定义书签。 指纹处理模块................................... 错误!未定义书签。 指纹识别模块OM-20通讯协议.................. 错误!未定义书签。 登记指纹模板程序设计....................... 错误!未定义书签。

声纹识别

声纹识别系统 摘要 本文首先通过用层次分析法(AHP )构建了影响声纹识别的八大因素,并将其进行量化处理,得到了合理的权重比。同时构建Mel 倒谱系统提取说话人的主要特征倒频谱(MFCC 参数),利用提取的 MFCC 参数训练话者的 GMM (高斯混合模型),得到专属某话者的 GMM 声纹模型。接着通过语音数据对构建的声纹识别模型进行评价。发现得到的模型虽然可以接受,但其准确率不是很高。为了使模型的精确率提高,我们通过利用改进的K-means 算法来将模型进行调整。 问题一: 我们通过层次分析发得出语者的声学特征在语音识别中所占的权重最大,而且限于目前的技术,我们最终将能描绘语者声道结构的Mel 倒频谱系数作为语音的特征向量,该方法能很好的模拟人耳对不同频率的感知特性,具有很好的稳定性和准确度。然后我们利用matlab 编程将提供的语音数据的MFCC 系数提取出来作为声纹识别系统的训练样本。 问题二:基于高斯混合模型(GMM),我们用EM 算法来估计GMM 中的未知参数,由K-means 算法来得到EM 算法的初始值,通过不断地迭代EM 算法更新GMM 模型中的权重(w ),均值(u)和方差矩阵,直到最终使 ()*()P X P X λλε-<,ε取10-5。 问题三: 根据问题一的MFCC 模型和问题二的GMM 模型,利用matlab 编程,用样本语音数据去训练GMM 模型得到样本库,让后用未知的测试语音样本利用模式匹配法去与样本语音库进行匹配,得到一系列的匹配概率,概率最大者对应的语者为测试语音的主人。我们得出的结论是EM 算法的初值对最终的识别率有很大影响,用来确定GMM 初始值的K-means 算法有比较大的误差,需要改进。 问题四: 基于问题三的测试和查阅的相关资料,我们认为传统的K-means 算法忽略特征矢量各维分量对识别的影响,因而无法得到令人满意的识别结果。由数理统计知,方差是用来衡量样本数据的离散程度的。如果特征矢量的分布稀疏,则它的方差就会很大,反之,那些分布较集中的矢量方差比较小。为此,本文提出了基于方差的加权几何距离,在聚类过程中,对特征矢量的各分量按方差大小进行加权,加权因子为矢量方差的倒数。 关键字:声纹识别 层次分析法(AHP ) 美尓倒频谱系数(MFCC ) 高斯混合模型(GMM ) 期望值最大化算法(EM ) K-means 算法

基于单片机的指纹识别门禁系统设计说明

摘要 人们在生活中需要安全的门禁设施,来保证自己的财产安全,各种各样的门禁系统随之而生。但随着数字化和网络化的不断发展,以前的门禁方式在鉴别方式、速度和性能方面越来越不能满足人们的需要,比如射频卡、数字密码等方式,其安全性不够高。在新的方式开发的过程中,由于人的身体特点具有不可复制性,所以人们把目光转移到这上面来,开始了生物识别的门禁系统的开发。指纹识别作为生物特征识别,它是独特的,它的特点是不易伪造,以为它的这些特点目前已被广泛应用于安全访问。 对于企业来说,办公楼的安全性和规性就显得尤为重要,对于进入楼的人员需要严格的管理,并且需要的楼层也需要限制人员的进入。指纹识别技术正好可以解决这个问题,每个人的指纹就相当于每个人的身份标识,对指纹的识别和管理,就能够实现对人员的管理。本文设计的系统是基于单片机的指纹识别门禁系统,它是在指纹识别技术的基础上加以开发扩展得来的,主要目的是加强人员的出入管理和提高门禁的安全性。整个门禁系统主要包括上位机和下位机两部分,对于下位机,单片机作为主体,另带多个子模块,包括指纹识别模块、液晶显示模块、网络模块、继电器和蜂鸣器等;对于上位机,主要负责用户信息的管理,并且通过网络模块,对多个下位机行进远距离控制。 论文基于对指纹识别技术和指纹识别系统的发展研究的意义的分析,介绍了指纹识别门禁系统总体框架,阐述了各子模块的硬件和软件资源。论文首先简要介绍了指纹识别算法,重点介绍了指纹识别模块(FM-180)的使用方法,包括它的硬件连接和软件指令的使用方法。在此基础上,设计了以STC89C52单片机为核心的指纹识别门禁系统,指纹识别模块负责识别指纹,并传输给单片机结果,单片机根据结果来控制液晶显示和蜂鸣器的声音提示,再控制继电器的开闭,单片机还能通过网络模块与上位机实现远程通讯。之后,介绍了软件部分的设计,包括单片机、液晶屏、指纹识别模块和上位机的软件设计。系统测试部分,通过对系统的模型样机的测试表明,系统能够完成基本功能并具有较好的稳定性,初步达到了预期的设计目标。在论文最后,做出了简单的总结与期望。 关键词:指纹识别;门禁;单片机 WORD版本.

语音信号的提取与识别技术(说话人识别系统)的研究

语音信号的提取与识别技术 摘要 语音识别(Speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术.说话人识别是语音识别的一种特殊方式.本论文中,将主要介绍说话人识别系统.说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文通过分析语音特征参数的特点和说话人识别的基本方法,提出了以美尔倒谱差分和线性预测差分为特征,通过动态时间归整算法来识别的文本相关说话人辨认系统。 关键词: 语音识别, 说话人识别, 线性预测倒谱,美尔倒谱系数,动态时间归整

The pick-up of speech signal and speech recognition Abstract Speech Recognition is a kind of technology that is using computer to transfer the voice signal to an associated text or command by identification and understand. Speaker recognition is a kind of special way of V oice-identifications. The paper is going to introduce speaker recognition. Speaker recognition is the process of automatically recognizing who is speaking on the basis of individual information include in speech signals. It has well application prospects in many fields. By analyzing speech characteristic parameters and the basis methods of speaker recognition, we choose MFCC and LPCC's difference to be the speech characteristic parameters. Using DTW to recognize text-dependent speech, we have developed a speaker identification system in this paper. Key words:V oice-Identification, Speaker-identification LPCC,MFCC, Dynamic Time Warping

说话人识别算法研究

说话人识别算法研究 傅庚申 殷福亮 (大连理工大学 电信学院 信号与信息处理专业 116023) 摘要: 说话人识别是根据从说话人所发出的语音中提取出信息判断说话人身份的过程。HMM能有效的用概率统计的方法描述时变语音信号。本文用HMM实现了一个说话人识别的系统。并在详细分析系统各部分关键算法的基础上,比较了MFCC和LPCC两种特征参数的性能。 关键词:说话人识别;Mel频标倒谱参数;矢量量化;隐含马尔可夫模型 分类号:TN912.34 Study on Speaker Identification Algorithm Fu Gengshen, Yin Fuliang School of Electronic and Information Engineering, Dalian University of Technology, Dalian, P.R.China, 116023 Abstract: Speaker identification can be made according to the information distilled from the voice of the speaker. Using probability method, HMM can effectively describe the real-time audio signal. This paper realizes a HMM-based speaker identification system. Based on the analysis of the key algorithms of the system in detail, the performances of MFCC and LPCC are compared. Key words: Speaker identification, Mel Frequency Cepstrum Coefficient (MFCC), Vector Quantization, Hidden Markov Model (HMM) 1 引言 说话人识别可以看作是语音识别的一种。它和语音识别一样,都是通过对所收到的语音信号进行处理,然后据此做出判断,不同之处在于说话人识别希望从语音中提取不同说话人的特征,加以利用;而语音识别则力图减少同一语音对于不同说话人的差别。说话人识别是通过对说话人语音信号的分析和特征提取,确定说话人是谁。随着技术的不断发展,说话人识别的应用领域正在不断扩大,主要方面有:说话人核对、声控电子密码锁、司法取证、医学应用等。 说话人识别的方法和技术在近十几年来得到了迅速的发展。说话人模型从单模板模型到多模板模型,从模板模型到VQ模型、高斯混合模型、隐含马尔科夫模型,到人工神经网络模型,识别环境从无噪声环境下少数说话人的识别到复杂噪声环境下大量说话人的识别,所采用的识别技术从仅涉及动态规划到涉及统计信号处理、最优估计理论、矢量量化与编码、模糊系统理论与方法、灰色系统分析、人工神经网络等多学科和领域的发展。 本文用HMM实现了一个说话人识别的系统。并在此基础上比较了MFCC和LPCC 两种特征参数的性能。

指纹门禁考勤方案

指纹门禁考勤方案 一. 系统概述 现代企业管理是一个追求高效益、高速发展的管理时代。继2003年的下半年指纹认证市场的迅猛发展,2004年第一季度,中国生物认证市场增长速度倍增。指纹认证技术在中国市场的应用,从1993年到现在以十几个年头了,到现在基本与国际水平同步,中国市场指纹识别的应用中,指纹门禁的应用又异军突起。从技术的层面看,指纹门禁属于高端产品,质量要求较高,国内相关厂商通过多年的磨练,使得产品性能完善,占领了很大部分的份额和地位。 中控指纹门禁系统是利用生物识别技术、计算机技术,集成门禁,考勤门禁,门禁管理和人事管理软件组成的门禁考勤门禁系统。工作人员不必保管和携带各种证件如纸卡或IC卡等等,只要轻轻一按手指就可完成身份识别以达到开门,考勤门禁的目的。确保门卫的安全,考勤门禁的公正,记录的统计,数据的准确。指纹的唯一性彻底根除冒名顶替,虚假信息对我们带来的不必要麻烦,只需有资格的人轻轻按下手指,月底管理人员操作电脑轻轻松松打印进出资料。门禁管理,人事考勤门禁报表,考勤门禁管理全部电脑化,确保门禁考勤门禁管理的公正、公平、科学、准确。 二.产品概述 1.指纹识别 生物识别是当今最先进和最可靠的识别技术之一,它是利用人体的固定生理特征做为确 认身份的一种识别技术,指纹是常用的一种,它通过对分杈形、尾端形、岛形、复合形,左斗纹、右斗纹、左箕纹、右箕纹、三角区与中心点位置的鉴别对比来确定指纹是否出自同一人。 2.指纹算法 指纹算法是依据指纹特征辩识需求、按计算机程序设计规律建立的、指纹识别与判定规则的数学模型描述。 Biokey算法是一种快速、准确的1:N指纹识别算法,在使用Biokey进行指纹识别时(2000-6000枚指纹),不需要对指纹通过姓名、PIN等预先分类就可以在1-5秒(以下测试都在Pentium III 900MHz+ 128MB内存环境下进行)内轻松完成。经过Biokey算法的不断升级改进,2004版的最新算法在指纹识别1:N的基础上,增加了1:1的比对方式,对提高指纹识别率和识别速度做了更进一步的提高。 三.设计目标 本方案多次参与并指导了多个企业人事考勤门禁系统工程的建设,从实践中吸取了丰富的经验与教训,根据客户不同的实际要求,系统总体方案设计目标满足以下几点: 1.可靠性高 考勤门禁系统产品选用应把“可靠性”放在第一位。指纹产品杜绝代打卡,误报率降为最低。指纹考勤门禁系统产品将长期使用,人事管理对一个公司占着很重要的地位,在各种复杂的用户环境中长期正常运行的考验。可靠性较高的产品可有效地降低系统的维护费用,而且易于管理,避免发生各种纠纷事件。 现在市场上指纹考勤门禁系统参差不齐,很多产品既不正规,又存在许多隐患,指纹考勤门禁机识别度不高,误叛率高,指纹识别度差,打卡费事费时间,引起员工不愉快,刷卡数据丢失,软件不成熟,达不到公司考勤门禁要求,技术不过关,不能帮助企业解决具体问题。

F18指纹门禁方案

指纹门禁考勤 系 统 方 案 中控科技 https://www.360docs.net/doc/013951627.html,

目录 一、门禁概述 二、方案设计 1目标点设置 2管理模式 3产品选型 4光学独立型指纹门禁考勤方案设计 1) 产品简述 2) 产品视图 3) 实施网络图 4) 安装示意图 5)检测报告 6) 工程预算 三、售后服务 四、培训计划 五、附件产品彩页

一、门禁综述 在高科技的今天,门禁系统已成为安全防范系统中极其重要的一部分,在一些发达国家中,门禁系统正以远远高于其它类安防产品的进度迅猛发展;门禁系统之所以能在众多安防产品中脱颖而出,根本原因是因为其改变了以往安防产品如闭路监控,防盗报警等被动的安防方式,以主动地控制替代了被动监视的方式,通过对主要通道的控制大大地防止了罪犯从正常通道的侵入,并且可以在罪案发生时通过对通道门的控制限制罪犯的活动范围制止犯罪或减少损失。 近年来,门禁系统由于其自身的优势,已在国内悄然兴起,包括邮电系统,供电系统,银行系统,住宅小区,度假村等各种类型的场所都已有使用门禁系统的范例,通过这套系统的使用极大地提高了管理者的工作效率和管理区域内的安全程度。 现在比较常用门禁系统主要有生物识别(指纹、掌形、虹膜等)和以射频卡系统为代表的系统,虽然传统的以射频卡为代表的门禁系统能取到一些作用,但从本质上来说,是检验人持有的“物”,而不是验证其本人。只要“物”的有效性得到确认,则持有该“物”的人就被认为是合法者。所以这种以“物”认人的办法的问题是显而易见的。一是“物”的遗失将使合法的人得不到合法的验证;二是“物”被盗用将反使非法的人得到合法的验证。 随着生物识别技术的不断发展,价格不断的下降,人们越来越信赖以自己本身,别人无法代替的特征来证明自己的身份。通过这套门禁系统,贵公司可以实现对人员权限的明确限定,无论是内部人员或外部人员,都可以通过对权限的设置清楚的界定可以自由出入的范围,并对人员的进出情况进行纪录,以备查询,极大的解放了人员管理的压力,并可达到在提高安全度的情况下节约人力的效果。

vq说话人辨识MATLAB程序

Train.m function code = train(traindir, n) % Speaker Recognition: Training Stage % % Input: % traindir : string name of directory contains all train sound files % n : number of train files in traindir % % Output: % code : trained VQ codebooks, code{i} for i-th speaker % % Note: % Sound files in traindir is supposed to be: % s1.wav, s2.wav, ..., sn.wav % Example: % >> code = train('C:\data\train\', 8); k = 16; % number of centroids required for i = 1:n % train a VQ codebook for each speaker file = sprintf('%ss%d.wav', traindir, i); disp(file); [s, fs] = wavread(file); *********************************************************** MFCC.m function r = mfcc(s, fs) % MFCC % % Inputs: s contains the signal to analize % fs is the sampling rate of the signal % % Output: r contains the transformed signal % % %%%%%%%%%%%%%%%%%% % Mini-Project: An automatic speaker recognition system % % Responsible: Vladan V elisavljevic % Authors: Christian Cornaz

指纹识别门禁系统概述

指纹识别门禁系统概述 导读:随着科技以及社会经济的发展,我国生物识别技术已经取得了长足的发展,今日小编就和大家聊一聊指纹识别门禁系统。 随着科学技术的不断进步,人们对现代化办公和生活场所提出了更高层次的安全管理需求,普通的门锁系统和手工出入管理已经不符合现代人的实际需求。由于安防业的智能化和网络化,为顺应智能楼宇、智能小区的发展,门禁系统也必须实现更可靠、更安全和更方便的智能系统。现代门禁系统综合利用了传感技术、数字信息处理、计算机技术、多媒体技术和网络技术,以实现门禁系统信息的采集、传输和处理。 目前智能门禁管理系统已广泛用于工厂、学校、写字楼宇、物业小区、商店、金融系统、电信系统、军事系统、宾馆等多种场合,大大提高了整体的工作效率、保障了系统安全,智能、安全和高效的现代化门禁系统已经成为社会发展的必然趋势,同时它也是现代化建筑的一个重要组成部分。 传统的机械钥匙、用户ID+密码以及智能卡等的保护措施存在着丢失、遗忘、复制以及被盗用的隐患,在这种情况下,最新发展的生物识别技术为上述方法的不足提供了一个很好的解决方案。由于指纹识别门禁系统具有唯一性、不变性和贴身性的特点,成为了众多生物识别技术中备受青睐的一个。且随着生物识别技术和计算机技术的飞速发展,指纹识别门禁系统算法已达到迅速、准确和可靠的水平,已越来越多的应用在现代智能门禁系统的前端信息采集部分。 目前使用较多的是指纹单机门禁系统,其采集、处理和识别都在一个控制系统中完成,只适用于小系统和安装位臵集中的单位,且通信线路专用,安装好后不易于更换管理中心的位臵。在大系统和安装位臵分散的单位,单机门禁系统必然耗费较大且效率不高。因此有必要采用TCP/IP的网络型门禁控制系统,实现网络控制和远程控制。 系统采用指纹采集作为门禁系统的前端部分,由于指纹识别门禁系统具有唯一性、不变性和贴身性的特点,使它成为一种安全有效的身份验证方法。另外,系统采用基于TCP/IP 协议的网络型门禁控制器是通过局域网传递数据的,管理中心随时可以变更,不需要重新布线,很容易实现网络控制和远程控制,并且指纹的处理和识别可以在运算速度更快的管理中心实现,这样控制器功能简单,而且多个控制器可以连接到一个服务器,提高了门禁系统控制和管理的效率。 指纹门禁系统的发展象征着我国在生物识别技术领域的进步,他也将是未来门禁系统的发展趋势。

相关文档
最新文档