基于深度学习的口红识别器的设计与实现_本科毕业设计(论文)

合集下载

基于深度学习的虹膜识别系统设计与实现

基于深度学习的虹膜识别系统设计与实现

基于深度学习的虹膜识别系统设计与实现随着科技的迅猛发展和人工智能的普及,生物识别技术作为一种高效、准确的身份验证方法,得到了越来越广泛的应用。

虹膜识别作为一种独特的生物特征识别技术,因其高安全性和准确性而备受关注。

本文旨在介绍基于深度学习的虹膜识别系统的设计与实现。

1. 引言虹膜识别技术利用眼球中的虹膜作为独特的认证特征,可以通过对虹膜图像的采集和分析来完成身份验证。

与传统的生物识别技术相比,虹膜识别具有不可伪造性、高精确性和高鲁棒性等优点,因此广泛应用于金融、安防、边境管理等领域。

2. 虹膜图像采集虹膜图像采集是虹膜识别系统的关键步骤之一,其目的是获取高质量的虹膜图像以供后续处理和特征提取。

采集设备通常是一种非接触式的眼球拍摄设备,通过红外光或可见光照射眼睛,从而获取高清晰度和高对比度的虹膜图像。

采集过程需要确保环境光源充足、图像清晰,并通过眼球追踪技术实时控制视野和焦距,提高采集成功率。

3. 虹膜图像预处理虹膜图像预处理是为了增强图像质量、减小光照和噪声的影响,提高后续特征提取和匹配的准确性。

常见的预处理技术包括图像增强、灰度均衡化、噪声抑制和边缘检测等。

预处理后的虹膜图像应具有高对比度、清晰的纹理和丰富的细节信息。

4. 虹膜特征提取虹膜特征提取是虹膜识别系统的核心步骤,旨在从预处理后的虹膜图像中提取出独特的特征向量,用于后续的识别和匹配。

深度学习技术在虹膜特征提取中取得了显著的进展。

常用的深度学习模型包括卷积神经网络(CNN)、循环神经网络(RNN)和自编码器等。

这些模型能够自动学习虹膜图像中的抽象特征,提高分类和匹配的准确性。

5. 虹膜识别与匹配虹膜识别与匹配是虹膜识别系统的最终目标,旨在将从虹膜图像中提取出的特征向量与已知的虹膜数据库进行比对,实现身份验证或识别。

常用的虹膜匹配算法包括传统的相似性度量方法和基于深度学习的特征对比方法。

前者基于特征向量之间的相似度进行匹配,常用的相似性度量方法包括欧氏距离、余弦相似度和相对匹配窗口等;后者利用深度学习模型学习到的特征向量进行匹配,可以提高匹配的准确性和鲁棒性。

基于深度学习的唇语识别系统设计与实现

基于深度学习的唇语识别系统设计与实现

基于深度学习的唇语识别系统设计与实现摘要:唇语是一种通过观察口唇运动来理解和解读语言的技巧。

本文介绍了一个基于深度学习的唇语识别系统的设计与实现。

该系统利用深度学习算法提取和分析视频中的唇部运动信息,通过训练模型来识别不同的唇语信息。

实验结果表明,该系统能够准确地识别出唇语,并具有良好的实时性能。

1. 引言唇语是一种通过观察口唇运动来理解和解读语言的技巧,对于听力障碍者和语言学习者具有重要的意义。

传统的唇语识别方法通常基于人工设计的特征提取算法,但这些方法在复杂的环境中往往表现不佳。

近年来,深度学习技术的快速发展为唇语识别提供了新的解决方案。

2. 系统设计本文设计了一个基于深度学习的唇语识别系统。

系统包括以下几个步骤:首先,从视频中提取唇部运动信息;然后,利用卷积神经网络(CNN)对唇部图像进行特征提取;接着,通过循环神经网络(RNN)学习序列信息;最后,利用Softmax分类器对不同的唇语进行识别。

3. 系统实现为了实现唇语识别系统,我们使用了一个包含大量不同唇语的数据库进行训练。

在训练阶段,我们采用了批量梯度下降(Batch Gradient Descent)算法对模型进行优化。

在测试阶段,我们通过计算模型输出的概率分布来判断输入的唇语。

4. 实验结果我们对该系统进行了大量的实验。

实验结果表明,该系统在不同的噪声环境下都能够准确地识别唇语,并具有良好的实时性能。

与传统的唇语识别方法相比,基于深度学习的系统在准确性和鲁棒性方面都有显著提升。

5. 结论本文设计并实现了一个基于深度学习的唇语识别系统。

该系统使用深度学习算法从视频中提取唇部运动信息,并通过训练模型来识别不同的唇语。

实验结果表明,该系统具有良好的识别准确性和实时性能,为唇语识别技术的发展提供了新的思路和方法。

总之,基于深度学习的唇语识别系统在实践中展现出了巨大的潜力。

未来,我们可以进一步改进系统的性能,提高唇语识别的准确性和鲁棒性,以便更好地满足听力障碍者和语言学习者的需求。

基于唇语识别的身份认证论文设计

基于唇语识别的身份认证论文设计

基于唇语识别的身份认证论文设计摘要:随着科技的发展,传统的身份认证方法逐渐被破解和模仿,因此寻找一种更加安全和可靠的身份认证方法变得尤为重要。

本论文设计了一种基于唇语识别的身份认证系统,该系统利用唇语的生物特征进行身份识别和验证,具有较高的准确性和安全性。

1.引言身份认证是在各个领域中都广泛应用的技术,例如银行业务、互联网支付和移动设备解锁等。

然而,传统的身份认证方法(如密码、指纹识别等)存在一些问题,容易被破解和模仿。

因此,本论文提出了一种基于唇语识别的身份认证方法,利用唇语的生物特征来进行身份识别和验证。

2.相关工作本章将综述唇语识别领域的相关研究和方法。

包括唇语定义、唇语特征提取、唇语识别算法等。

通过对相关工作的研究,为后续设计提供基础理论支持。

3.唇语数据集的构建本章将介绍如何构建唇语数据集。

首先,需要收集一组具有不同性别、年龄和人种的志愿者进行唇语数据采集。

然后,利用合适的设备和软件进行唇语信号的录制和处理。

最后,对数据集进行标注和预处理,为后续的模型训练做准备。

4.唇语特征提取本章将介绍唇语特征提取的方法。

根据前期的研究成果,可以选择合适的特征提取算法,比如Gabor小波变换和主成分分析等。

通过将唇语信号转化为特征向量,可以减小唇语信号的维度并提取出关键的特征。

5.唇语识别算法设计本章将介绍唇语识别算法的设计。

可以选择传统的机器学习算法(如支持向量机、随机森林等)或深度学习算法(如卷积神经网络、长短时记忆网络等)。

通过训练和验证模型,可以实现对唇语信号的识别和身份验证。

6.实验和结果分析本章将介绍实验的设计和结果分析。

通过使用构建的唇语数据集和设计的唇语识别算法,进行实验并评估系统的准确性和性能。

分析实验结果,讨论系统的优缺点,并提出改进和未来研究的方向。

7.结论本章将总结全文的研究工作,并对基于唇语识别的身份认证方法进行总结和展望。

强调该方法的优点,例如准确性、安全性和用户友好性,并指出一些可改进的地方。

基于深度学习的唇语识别研究

基于深度学习的唇语识别研究

基于深度学习的唇语识别研究一、引言唇语是一种通过观察嘴唇的形态和运动来理解对方语言的非语言交流方式。

唇语识别可以将嘴唇形态和运动转化为文字或语音信号,从而帮助听力受限人士更好地理解对话内容。

基于深度学习的唇语识别技术已经广泛应用于理解口音、识别语音、人脸识别等领域,它的应用前景十分广泛。

二、唇语识别的技术原理唇语识别的技术原理是将视频中的唇形动作转化为可供计算机理解的数字信号,通过这个信号识别出每个唇形动作的含义。

传统的唇语识别方法主要是通过手工提取唇形特征,并使用模板匹配、HMM等算法进行分类。

这种方法的缺点是需要手动设计和选择特征,且对唇形变化的鲁棒性差。

深度学习的出现使得唇语识别技术有了长足的进步,主要是通过将唇形动作转化为图像或者序列信号,并应用神经网络进行训练和识别。

下面分别介绍两种类型的唇语识别技术。

1. 基于图像的唇语识别基于图像的唇语识别技术主要是将视频的每一帧图像作为输入,使用卷积神经网络(CNN)进行训练和识别。

训练数据一般是由许多人不同发音方式的训练集组成,而测试数据则是从视频中提取的嘴唇运动图像。

这种方法的主要优点是训练和推理容易,并且精度较高。

但是它对于光线和嘴唇颜色的不一致性较敏感。

2. 基于序列的唇语识别基于序列的唇语识别和基于图像的唇语识别类似,不同之处在于它是将输入序列作为输入,而不是单个图像帧。

在这种方法中,输入序列包含许多时间步骤,每个时间步骤是来自视频中的一个嘴唇运动图像。

该序列被馈送到循环神经网络(RNN)中,RNN的输出是一个分类结果,表示当前嘴唇动作所代表的信息。

这种方法对于光照、嘴唇颜色以及嘴唇形变等方面具有较好的鲁棒性,但是训练和推理复杂度较高。

三、基于深度学习的唇语识别应用基于深度学习的唇语识别技术已经广泛应用于实际场景。

下面列举一些应用:1. 帮助聋哑人士交流唇语识别可以将人们的嘴唇动作转化为对应的语言和文字信息,从而使听力障碍的人们能够更好地与别人进行交流。

基于深度学习的唇语识别数据库构建和算法研究

基于深度学习的唇语识别数据库构建和算法研究
深度学习的算法离不开大量的数据,但是目前学术界的开源数据集都是基于英 语的,为了给未来中文唇语识别提供良好的基础,本课题的第一个工作即构建了第 一个开源的开放场景下的中文唇语识别数据库 LRW-1000,并提出了唇语识别数据库 构建的完整流程和算法细节,这也是目前以分类为目标的、涵盖类别最多的、说话 人对象最多的词级唇语识别数据库;同时,本课题从唇语识别任务的难点出发,提 出了一个新的唇语识别算法模型结构,它通过改进现有的特征提取器 DenseNet,强 化模型的短时依赖的建模能力,同时学习到 multi-scale 的特征可以对分辨率的变化 拥有更好的鲁棒性。并且考虑到不同文本内容与面部不同区域关联程度的差异性, 本课题引入了一个全新的注意力机制来辅助网络学习这种相关性,让网络能够更好 的关注最明显相关的区域。
硕士学位论文
基于深度学习的唇语识别 数据库构建和算法研究
A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree for the Master of Engineering
Database Construction and Algorithm Research of Visual Speech Recognition Based on Deep Learning
在仅使用图像信息的基础上,本课题提出的方法在目前主流唇语识别数据库 LRW 和 GRID 都取得了最好结果:在 LRW 上的分类准确率为 82.73,超过当前最好 的结果 1.43%;在 GRID 上的 wer 为 12.8%,超过当前最好的结果 9.2%。同时,对 于自建的中文数据集 LRW-1000,本课题提出的算法在性能上也要优于当前的主流模 型。

基于深度学习的读唇技术研究

基于深度学习的读唇技术研究

基于深度学习的读唇技术研究随着人工智能的进步和不断开发,基于深度学习的读唇技术也逐渐成为热门话题。

这项技术能够识别和解释人们的嘴唇动作,从而使台词的辅助观看变得更加简单。

对于聋人来说,这项技术具有非常重要的意义。

但是这项技术还处于初期探索阶段,尚需更多投入和研究。

一、传统的读唇技术在了解深度学习读唇技术之前,我们可以简单了解一下传统的读唇技术。

传统的读唇方法是利用特殊的摄像机或者摄像机附着的耳朵,通过观察嘴唇动作并结合上下文还原出发音。

这种方法可以结合语音识别程序,达到更准确的结果。

但是这种方法仍然存在很多的限制。

例如,环境噪声、拍摄角度、发音变化,都能影响它的准确性。

二、深度学习读唇技术的原理深度学习的读唇技术则能很好地解决传统方法存在的问题。

在深度学习算法中,唇形和音频波形之间的关系被建立在神经网络模型中。

这样一来,当模型被训练完成后,它就能够通过视觉输入预测音频信息,达到较高的准确性。

深度学习读唇技术的训练过程是通过给神经网络输入一组嘴唇运动的视频和相应的音频,让神经网络把唇形和音频学习到一起。

这个过程是自动的,并且是无监督的。

在模型的训练过程中,可根据目标数据的不断增加,不断迭代和进化,从而获得更高的准确性。

三、深度学习读唇技术的应用深度学习读唇技术在生活中有着广泛的应用。

它能够帮助聋人理解语音、进行口语交流,还可以配合语音识别技术完成语音控制指令,提高使用体验和智能化程度。

此外,深度学习读唇技术还可以应用于安全领域,在安防监控中能够追踪指定人员的交谈记录。

再者,深度学习读唇技术可以在医学领域中,辅助研究未知病因的患者的口腔磁共振图。

四、深度学习读唇技术的发展虽然目前深度学习读唇技术已经取得了一定的进展,但它仍然存在着一些挑战和问题。

例如,需要针对多种嘴唇类型进行训练,继续优化神经网络框架和算法模型,以实现更准确、更快速的识别,提高使用效率。

同时,也需要强化安全防范和人权保护等事项。

总之,基于深度学习的读唇技术为聋人提供了更便捷的语言信息交流方式,为语音识别的应用提供了更广阔的空间。

基于深度学习的虹膜识别技术研究与应用

基于深度学习的虹膜识别技术研究与应用

基于深度学习的虹膜识别技术研究与应用虹膜识别技术是一种生物识别技术,利用人眼中彩色环形结构中的纹理来进行身份认证,比传统的口令和卡片认证更加安全和方便。

近年来,随着深度学习技术的不断成熟和应用,虹膜识别技术也得到了极大的发展,成为了人脸识别技术之外另一个广泛应用的生物识别技术。

一、虹膜识别技术的发展历程虹膜识别技术最早可以追溯到1936年,当时美国哈佛大学的医学博士Frances Gall开发了第一台虹膜摄像机。

但是直到20世纪70年代末,虹膜识别技术才真正开始引起人们的关注。

此后,随着计算机技术的逐步发展和计算机视觉技术的加入,虹膜识别技术逐渐成熟。

近年来,随着深度学习技术的发展,虹膜识别技术已经迎来了一个新的发展阶段。

二、深度学习在虹膜识别中的应用深度学习是一种机器学习算法,能够通过数据训练出复杂的非线性模型,并且在很多场景中取得了非常好的表现。

虹膜识别技术是一个非常适合使用深度学习的领域,因为虹膜的特征具有非常高的稳定性和复杂度,传统的人工设计特征的方法很难将虹膜的复杂情况充分地表现出来。

在虹膜识别中,深度学习可以应用于虹膜定位、虹膜分割、虹膜特征提取等环节,从而提高虹膜识别的准确率和速度。

例如,在虹膜定位中,可以使用卷积神经网络(CNN)模型,通过对眼睛周围的区域进行扫描和筛选,找到虹膜位置。

在虹膜分割中,可以使用U-net或Mask R-CNN等深度学习模型,通过对虹膜和非虹膜区域进行像素级别的分割,得到虹膜的区域。

在虹膜特征提取中,可以使用基于深度学习的虹膜码本,将虹膜中的特征进行编码和分类,提高虹膜特征的识别准确率。

三、虹膜识别技术的应用前景虹膜识别技术具有非常广阔的应用前景,在安防、金融、医疗等领域都有着广泛的应用需求。

例如,在安防领域,虹膜识别技术可以用于出入口的认证,保障企业和机构的安全。

在金融领域,虹膜识别技术可以用于身份认证,保障用户的资金安全。

在医疗领域,虹膜识别技术可以用于身份认证,保障医疗信息的安全性。

基于深度学习算法的唇读识别技术研究

基于深度学习算法的唇读识别技术研究

基于深度学习算法的唇读识别技术研究近年来,随着人工智能技术的飞速发展,深度学习算法也逐渐成为了热门研究领域之一。

其中,唇读识别技术作为人机交互及语音识别领域中的重要研究内容,也得到了广泛关注。

唇读识别技术,是指通过分析人类嘴唇活动的方式识别出人类语言的过程。

这一技术的研究目的是利用唇部运动的特征来分析并识别出说话者所发出的语音信息,从而达到语音识别的目的。

因此,唇读技术在许多领域都具有广泛的应用前景,如语音识别、无声话语的识别、电视监控等。

目前,唇读识别技术最主流的研究方法就是基于深度学习算法。

深度学习算法作为一种模仿人脑神经网络工作方式的机器学习方法,具备较强的数据处理能力和自动学习能力,并且能够从海量数据中学习和提取特征信息,从而实现复杂的模式识别和数据分析。

基于深度学习算法的唇读识别技术主要分为三个步骤,即口唇定位,唇形特征提取和唇读分类。

首先是口唇定位。

在唇读识别技术中,首要任务是从视频帧中提取出口部信息,这就需要通过图像处理算法,对嘴唇部位进行精确定位。

从视频中提取口部信息的方法主要有两种,分别是基于肌肉活动定位的方法和基于图像处理定位的方法。

针对这两类方法,研究者们也提出了不同的唇形规律来实现嘴唇位置的检测和跟踪。

之后就是唇形特征提取。

在口唇信息被定位之后,接下来需要对口唇运动进行建模。

基于深度学习算法的唇读技术主要采用卷积神经网络(CNN)和循环神经网络(RNN)等模型来学习唇形特征。

CNN主要用于提取唇形图像的局部特征,而RNN则用于学习唇形图像的时序特征。

结合这两者,能够比较准确地分析区分不同的唇形图像。

最后就是唇读分类。

通过前面两个步骤,唇形图像已被转换成了一组特征向量。

这时,需要将这些特征向量输入到分类模型中,进行唇读预测。

目前常用的分类模型有支持向量机(SVM)、决策树和神经网络等。

而对于基于深度学习算法的唇读识别技术,一般采用的是深度卷积神经网络(CNN)模型或长短时记忆网络(LSTM)模型进行分类。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于深度学习的口红识别器的设计与实现Design and Implementation of Lipstick RecognizerBased on Deep Learning摘要随着科学技术的不断发展,深度学习已经在不同的领域为人类提供更好地服务。

因此,本论文将科学技术与生活联系起来,实现基于深度学习的口红识别器。

通过了解现阶段深度学习的研究现状,以及对卷积神经网络的分析,应用了目标检测算法作为本系统的核心算法,使用了Vue.js作为框架,结合MySQL数据库,实现了该系统的开发。

关键词:口红识别;深度学习;目标检测;Vue.jsAbstractDeep learning in different aspects to provide high-quality services for human beings, under the development of science and technology. Therefore, this thesis connects science and technology with life, and implements a lipstick recognizer based on deep learning. Application of target detection algorithm as the core algorithm of the system, and Vue.js is used as the framework. By understanding the current state of deep learning research and analysis of convolutional neural networks, combined with the MySQL database, the system is developed.Key words:Lipstick recognition;Deep Learning;Target Detection;Vue.js目录1.1 课题背景和意义 (1)1.2 研究现状 (1)1.2.1人工智能国内外研究情况 (1)1.2.2深度学习研究现状 (2)1.3章节安排 (3)第二章论文相关原理以及技术介绍 (4)2.1 卷积神经网络 (4)2.1.1卷积神经网络概述 (4)2.1.2 卷积神经网络结构 (4)2.1.3 轻量化卷积神经模型 (9)2.3 系统核心模块原理 (10)2.3.1人脸检测模块 (10)2.3.2面部特征标记模块 (13)2.3.3颜色对比 (14)2.4 Face-api模型介绍 (14)2.5MVVM框架开发模式 (16)2.5.1前后端分离 (16)2.5.2MVVM框架及其优势 (17)2.6 Vue.js前端开发框架 (17)2.7 后端技术 (17)2.7.1 Node.js (17)2.7.2 Express框架 (18)2.8 MySQL数据库 (18)2.9 本章小结 (18)第三章系统需求分析与数据库设计 (19)3.1系统需求概述 (19)3.2功能需求分析 (19)3.3数据库设计 (21)3.3.1数据建模 (21)3.3.2数据表结构 (21)3.4本章小结 (22)第四章系统的设计与实现 (23)4.1系统的总体设计 (23)4.2系统功能模块设计与实现 (23)4.3本章小结 (27)第五章系统测试 (28)5.1测试流程 (28)5.2测试用例 (28)5.3测试小结 (28)5.4本章小结 (29)第六章总结与展望 (30)4.1总结 (30)4.2展望 (30)参考文献 (32)致谢........................................................................... 错误!未定义书签。

第一章绪论1.1 课题背景和意义人工智能是当今社会上的热话题与重点研究对象,国家更是出台了各种政策促进人工智能的发展。

人工智能的目的是将机器“拟人化”,协助人类解决各项事宜。

如今,人工智能应用于许多行业与领域当中,各类关于人工智能的研究也层出不穷,深度学习的提出更是让人工智能这个领域有了质的飞跃。

在时代的大环境下,我们已然进入人工智能时代[1]。

在人工智能日新月异发展的同时,我国的经济也稳步提升,经济的良性发展促进消费水平的提升。

在这个契机下,彩妆口红行业迎来了行业的春天。

在口红需求提升的大环境下,口红也变成了送礼的最佳选择,但是,口红色号千千万,选对了牌子才成功了一半。

在红色能被分为:姨妈红、梅子红、豆沙红等等的彩妆界,色号的分辨真的让人眼花缭乱。

因此,本课题结合了生活与科技,将人工智能与口红有机结合起来,使得人工智能进一步贴近人们的日常生活。

1.2 研究现状1.2.1人工智能国内外研究情况“人工智能”由John Mccarthy等人在一次研讨会上提出。

简单来说,人工智能将过去只有人能做的事情交给计算机去做,这样的好处是提高效率,同时使得所做的事情误差更小。

从1956年到现在60多年来,人工智能经历了几次起起伏伏。

首先在人工智能被提出之后,由于对新兴学科的向往,许多国家投入资金对该学科进行研究,但事情的发展却不如人愿。

在二十世纪七十年代初期,下棋程序无法战胜更高级别的冠军、机器翻译闹出笑话、机器无法证明数学函数等这一连串的失败,使得人工智能走向低谷。

但科学家们没有气馁,而是对过去的主要技术和战略进行总结并做出改进,提出了新的发展重心和方向。

由于有了新的重点,人工智能又迎来了新的发展期。

在二十世纪八十年代交互问题与扩展问题又成为了人工智能的拦路虎,但顽强的人工智能学者们并没有被打倒,而是总结反思,为人工智能的发展提供了更多的方法。

自从人工智能兴起以来,世界各国都纷纷在“研究人工智能”这条道路上奔跑,许多欧美国家已然发展成为“人工智能强国”。

我们国家对于人工智能的研究起步较晚,但也在不断地尝试和努力中,随着国家经济的发展,对人工智能的投入越大也越重视,从自动驾驶汽车到无人驾驶飞行器[2],并且在越来越多的领域投入研究人工智能,使得人工智能使得其发展与应用空间巨大,并且也越来越融入到日常生活中。

人工智能[3]未来的前进方向也在各种研究中日渐明确。

人工智能如同一颗璀璨的明星,在21世纪这个科技超高速发展的时代中闪耀着它的光芒,并且在时代的注明下继续加速前进。

1.2.2深度学习研究现状在当今人工智能的领域中,不得不提的热门概念就是深度学习。

它在2006年被Hinton等人提出,在2016年一则轰动科研界的事件使得深度学习风头一时无两,这个事件就是世界围棋冠军李世石被Google研发的下棋机器人AlphaGo打败。

因此深度学习这一概念得到了重视,同时也迎来了研究的热潮。

人类是通过人脑不断学习事物的[4],深度学习正是利用了这一点,模拟人脑神经网络的构造,在计算机里建造出神经网络。

我们如果将机器[5]比喻为一个人,那么深度学习便是这个机器的“脑子”,可以帮助计算机对输入的数据进行分析与学习,使得计算机有了类似于人类的学习能力。

深度学习的算法是通过提取物体的特征,不断地认识物体,训练的数据对训练的结果有着一定的影响,一般大的训练数据会得到比小的训练数据更好的训练结果。

在21世纪这个互联网飞速发展、信息传播快速的大数据时代,有了数据作为依托,深度学习在图像识别、自然语言处理等方面都得到了很好地应用。

随着对深度学习不断深入的研究[6],各种具有复杂层次结构与独特神经处理单元的神经网络不断出现,提高了训练的效率与结果。

深度学习是人工智能的主要训练方式[7],随着深度学习研究的不断深入,人工智能技术也会得到很好的提升,使其更好地应用于生产生活中。

本篇论文采用的神经网络是卷积神经网络,以下分别介绍这4种模型:(1)AlexNet[8]Alex Krizhevsky提出这个拥有5层卷积和3层全连接层的模型——AlexNet 模型,使得神经网络的研究达到了一个不小的高潮。

它的出现带来的提升是:①使用多个GPU并行训练网络使得训练时间减少并且提升了网络识别的准确率。

②激活函数的改变降低了网络学习的难度,使得模型更容易得到有效的训练。

③采用扩大数据集与dropout随机删除一定的神经元来缓解过度拟合的问题。

(2)VGGNet[9]VGGNet模型是由牛津大学的视觉几何组提出。

VGG的卷积层深度高达19层,主要增加了卷积神经网络中的深度。

但VGG模型具体的卷积运算与AlexNet模型类似,因此被称为增强版的AlexNet。

值得一提的是,VGG采用了小尺度的卷积核,降低了参数量,提高了计算速度。

同时因为其内部结构比较简洁明了,容易迁徙,因此直到现在,VGG网络还经常被用来提出特征。

(3)GoogLeNet[10]在卷积神经网络中,加深模型的深度、宽度与训练数据固然能使模型达到更好的学习效果,但这些要素的增加必然会带来过量的参数影响效率,所以GoogLeNet 提出了一个全新的深度CNN框架——Inception,这个有点像金字塔的框架在宽度上使用了1、3、5三种尺寸的卷积核,有效地节省了运算时间以及减少网络中很多参数的数量。

(4)ResNet[11]ResNet(残差网络)是由何凯明及其团队提出,由于VGG与GooLeNet都是使用增加卷积神经网络的深度与宽度来提高模型的学习能力,但是模型的层次加深又会使得正确率降低,为了解决这个问题,作者提出了一个深度残差网络的结构Residual。

1.3章节安排本文一共分为六个章节,每个章节有着不同的内容,具体如下:第1章介绍了基于深度学习的口红识别器的研究背景和意义,阐述了人工智能与深度学习的研究现状以及卷积神经网络的四种模型。

第2章介绍了本系统所采用的相关原理以及技术点,分别有本卷积神经网络及其网络结构、轻量型卷积神经网络、系统核心模块的原理、系统采用的api及框架。

第3章对该系统进行需求分析与数据库的设计。

第4章先是对该系统的总体设计进行介绍,再分模块对系统的功能进行设计与实现。

第5章测试该系统的各个功能板块,并做出总结。

第6章总结本论文的研究内容,并对该系统仍有进步空间的地方做出展望。

第二章论文相关原理以及技术介绍2.1 卷积神经网络2.1.1卷积神经网络概述人体的很多功能拥有着许多奥秘,因此许多科技的创新与发展也会利用这些“奥秘”的原理。

卷积神经网络正是根据人类视觉奥秘的原理,采用多层神经网络构建了卷积神经网络。

卷积神经网络在图像处理方面有着积极的效果,它能在较低层开始识别图像的特征,随着层数的增加能提取到越多的特征,最终在顶层做出分类。

相关文档
最新文档