基于单幅图像的交互式建模技术研究

合集下载

一种基于单目相机的人脸实时交互动画的实现方法

一种基于单目相机的人脸实时交互动画的实现方法

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910839412.7(22)申请日 2019.09.03(71)申请人 电子科技大学地址 611731 四川省成都市高新区(西区)西源大道2006号(72)发明人 谢宁 杨心如 申恒涛 (74)专利代理机构 成都希盛知识产权代理有限公司 51226代理人 陈泽斌(51)Int.Cl.G06T 13/20(2011.01)(54)发明名称一种基于单目相机的人脸实时交互动画的实现方法(57)摘要本发明涉及三维角色动画技术,其公开了一种基于单目相机的人脸实时交互动画的实现方法,通过融合人脸表情捕捉和语音情感识别技术,生成动画参数,并通过基于骨骼的技术来实时合成可视化的动态皮肤变形动画,使得生成的实时动画的表情更加具有丰富性、自然性,真实感,更具备自身特色。

该方法可以概括为:捕获人脸视频图像和语音输入信息,提取人脸表情动画参数和语音情感动画参数;通过动作状态空间模型学习由骨骼运动和相应的皮肤变形组成的训练序列,建立基于辅助骨控制器的虚拟角色骨骼蒙皮模型,通过提取的人脸表情动画参数和语音情感动画参数驱动所述虚拟角色骨骼蒙皮模型,生成实时交互动画。

权利要求书2页 说明书7页 附图3页CN 110599573 A 2019.12.20C N 110599573A1.一种基于单目相机的人脸实时交互动画的实现方法,其特征在于,包括以下步骤:S1、通过单目相机捕获人脸视频图像,获取人脸图像序列;同时通过语音传感器捕获语音输入信息;S2、在人脸图像序列中标记人脸特征点,并提取人脸表情动画参数;S3、在捕获的语音输入信息中提取语音特征,并提取语音情感动画参数;S4、通过动作状态空间模型学习由骨骼运动和相应的皮肤变形组成的训练序列,建立基于辅助骨控制器的虚拟角色骨骼蒙皮模型,通过提取的人脸表情动画参数和语音情感动画参数驱动所述虚拟角色骨骼蒙皮模型,生成实时交互动画。

基于单幅图像的建筑物建模方法

基于单幅图像的建筑物建模方法
S c i e n c e & Te c h n o l o g y Vi s i o n 科 技 视 界 科技・ 探索・ 争鸣
基于单幅图像的建筑物建模方法
郭美 莉 向南平 ( 中南 大学 校本 部 , 湖南 长沙 4 1 0 0 8 3 )
【 摘 要】 针 对建 筑物模 型的规 则性 问题 , 本文 用基 于灭点 的相机 的标定方法对建筑物的 图像进行三维的恢复。改进 和拓展 先前 的利用几 何信 息对建筑物进行建模的三 维重建方法 。 把 原有的基 于单 张图像 对建筑物建模 只能局 限于相 似于平行六 面体的建 筑物 . 拓展 到对含 有三角 立方体元素的建 筑物进行恢复 实验结果表明该方法比传统方法做的建筑物模 型更加丰富 . 计算方法更简单 。 具有 一定的现 实借鉴意义 【 关键词 】 三 维重建 ; 透视投影 ; 单幅 图像
s i o n l a r e c o v e r y . I mp r o v e a n d e x p a n d t I 1 e u s e o f g e o me t ic r i n f o r ma t i o n e a r l i e r b u i l d i n g s mo de l i ng t h r e e— d i me n s i o n a l r e c o n s t r u c t i o n me t h o d .s i mi l a r t o t h e o r i g i n a l s i n g l e i ma ge c a n o n l y b e l i mi t e d t o t he b u i l d i n g mo d e l i n g b u i l d i n g s p ra a l l e l e p i p e d e x p a n d t o c o n t a i n t ia r ng u l a r c u b e t h e e l e me n t s o f t h e b u i l d i n g f o r r e c o v e r y .T h e e x p e ime r n t a l r e s u l t s s h o w t h a t t h i s me t h o d t h a n t r a d i t i o n a l me t h o d s o f b u i l d i n g mo d e l i s ic r h e r ,t h e c lc a u l a t i o n me t h o d i s mo r e s i mp l e . t h e r e a l i t y S i g n i ic f a n c e .

Real-Time Human Pose Recognition in Parts from Single Depth Images中文翻译

Real-Time Human Pose Recognition in Parts from Single Depth Images中文翻译

Real-Time Human Pose Recognition in Parts from Single Depth Images 基于单深度特征图像的实时人体姿态识别摘要:我们提出了一种能够迅速精确地预测人体关节3D位置的新方法,这种方法仅需要单幅深度图像,无需使用时间信息。

我们采用了一种实物识别方案,并设计了一种人体组成中间模型,这种模型能够把高难度的姿势统计问题转化为更简单的像素分类问题。

我们大量、多种多样的训练数据库允许分类器能够估计出身体部位而不受姿势、身体形状和着装等的影响。

最后,我们提出了一种基于人体多个关节的3D检测可信方案,该方案通过重新投影分类结果并建立本地模型。

系统在消费者硬件上以200帧每秒的速度工作。

无论是合成的抑或真实的测试设置,我们的评价体系中多个训练参数都表明极高的精度。

在与相关研究的比较中我们达到了极高的精度要求,并且改进了整个人体骨架相邻匹配的精确度。

1.简介强大的交互式人体跟踪应用有游戏、人机交互、安全、远程呈现甚至健康监护。

随着实时深度相机的出现,这项任务被大大地简化[16,19,44,37,28,13]。

然而,即便是当前最好的系统仍然存在局限性。

尤其是在Kinect发布之前,并没有一款互动式的消费级别的硬件能够处理大范围的人体形状和尺寸[21]。

也有一些系统能够通过追踪一帧帧图案来达到高速度,但是快速初始化的努力却不够强大。

在本论文中,我们集中于姿势识别的研究:通过对单幅深度图像的检测识别出每个骨骼关节的3D位置。

我们对每帧图像的初始化和恢复的集中研究是为了补充一些合适的追踪算法。

[7,39,16,42,13]。

这些将来有可能合并暂停与运动的连贯性。

该算法目前是Kinect游戏平台的核心组成部分。

如图一所示,受最近把实体划分成多个部分进行实物识别的研究方法的影响[12,43],我们的方法可以划分为两个关键性的设计目标:计算效率与鲁棒性。

一幅输入的深度图像被分割成身体紧密概率的标记部分,同时每一部分被定义为在空间上相近的感兴趣的骨骼关节。

基于内河单幅图像的去雾算法研究

基于内河单幅图像的去雾算法研究

0 引 言
C C T V 在 内河 航 道 的海 事 监 管 和 防 止 内 河 水 域污染 等 方 面发 挥 重 要作 用 。然 而 , 当 内河有 雾天数 达全 年 6 O l , 雾航 时 C C T V 系统 无法 获 得清 晰视频 。 此 开展 内河 图像 去 雾算法 的研 究 是非常 重要 的 。 雾 图复 原方 法 是基 于 大气 散 射 规 律 建 立 雾 图退 化模 型 , 通 过 求 得 图像 的景 深 和天 空 亮 度 值来求 取复 原后 的无雾 图像 。如 He等[ 提 出的 基于 暗原色先 验 的 去雾 方 法 , 虽 然 对一 般 户 外 图 像去雾 效果 较好 , 由于该 方 法存在一 定 的局 限性 ,
1 雾 天 图像 的 大气 散 射模 型
网像 质量 下降 的主要 原 因是大气 粒子 的散 射
作用, 可 用人射 光 衰 减模 型和 大 气 光线 成 像 模 型
*国家 自然 科 学 基 金项 目( 批准 号: 5 1 2 7 9 1 5 2 ) 资助 第一 作 者 简 介 : 刘 清 ( 1 9 6 6 ) , 博 十, 博l l I 生 导 师. 研 究方向 : 交 通 检 测 与控 制 , 智能控制技术 。 智 能视频分析. E ma i l : q l i u 2 0 0 0 @
多数户 外 图像 , 通 过 寻 找 峰值 点 位 置 能分 割天 空 区域 , 由于 内河 图像 的直 方 冈可能 出现 多峰值 点 , 显然 采用 全 局 直 方 图 法 给 天 空 区 域 分 割 造 成 闲 难 。黄 明 晶等人 l 提 m利用 K 均值 聚类 方 法分 割天 空区域 , 能较 好 的获 取 内河 雾 天 图像 的景 深 值 ,然而 , 雾 浓 度较 大 时 ,会 影 响 天 空 区域 的分 割, 而且其 计算量 较 大 ,导致实 时性较 差 。

基于描绘单幅图像的三维树木交互建模系统

基于描绘单幅图像的三维树木交互建模系统

在虚拟现实技术迅速发展 的今天 , 植物 的仿真模拟 已经应 用在许多方面 , 游戏 电影等娱乐业 、 如 农业 研究 、 城市美化和一 些防 自然灾害 的研究等 。然而 由于植物种类 、 外界环境 和人 为 修 剪等一系列原 因, 导致植物 的几何形 态颇 为复杂 , 以植物 所
di1 . 9 9 ji n 1 0 —6 5 2 1 .6 0 7 o:0 3 6 / .s .0 13 9 .0 2 0 .9 s
文章编 号 :10 —6 5 2 1 ) 6 2 6 —4 0 139 (02 0 —340
3 te s itr cie mo ei g s se b k t hn c o d n o sn l ma e r e n e a t d ln y tm y s ec i g a c r i gt i ge i g D v
L U Yi o g XU Xin — u Z NG a — n , Z I — n , s a gh , E L nl g i HAN Yo g z a n —h o
( colfC m ue Si c Sho o o p t c ne& Tl o mu i t nE gnei JaguU i rt, hna gJ n s 10 3 hn ) r e e cm n ai n i r g, ins nv sy Z e n i gu2 2 1 ,C ia e c o e n ei i f a
刘一松 ,许祥虎 ,曾兰玲 ,詹永照
( 苏大 学 计 算机 科 学与通信 工程 学 院 ,江 苏 镇 江 2 2 1 ) 江 1 0 3 摘 要 :为 了提 高树木 建模 的真 实感 与可 交互性 , 出了一种基 于单 幅树木 图像或 直接 手绘 的 交互 式植 物 建模 提

基于人工智能的智能交互式媒体艺术创作系统设计

基于人工智能的智能交互式媒体艺术创作系统设计

基于人工智能的智能交互式媒体艺术创作系统设计随着人工智能技术的不断发展,智能交互式媒体艺术创作系统正在成为一个备受关注的研究领域。

这样的系统结合了人工智能和媒体艺术的特点,能够为艺术家们提供创作的灵感、工具和平台。

本文将详细介绍基于人工智能的智能交互式媒体艺术创作系统的设计,包括系统架构、关键技术和应用场景。

一、系统架构基于人工智能的智能交互式媒体艺术创作系统的架构主要由以下几个组件构成:1. 数据采集:系统可以通过图像、声音、视频等多种方式来采集艺术创作所需的数据。

这些数据可以来自摄像头、麦克风、传感器等设备,也可以通过网络获取。

2. 数据处理:系统需要处理采集到的数据,将其转化为计算机可以理解和处理的形式。

这包括图像处理、音频处理、视频处理等技术,用于提取特征和准备数据集。

3. 智能算法:系统需要运用人工智能算法来对数据进行分析和处理,从而实现智能化的交互。

这包括图像识别、语音识别、自然语言处理、情感分析等算法,可以根据用户的需求进行定制。

4. 用户界面:系统需要提供一个友好的用户界面,让艺术家可以方便地进行创作。

用户界面应该具备良好的交互性和可视化效果,让艺术家可以直观地看到创作效果。

5. 数据存储与管理:系统需要提供数据的存储和管理功能,将采集到的数据和经过处理的数据进行存储,方便后续的分析和查询。

二、关键技术基于人工智能的智能交互式媒体艺术创作系统设计涉及到许多关键技术,下面列举其中几个重要的技术:1. 图像、声音、视频处理:这些处理技术主要用于对采集到的数据进行清洗、分析和转化。

例如,利用图像处理技术提取图像的特征,通过声音处理技术分析声音的频谱等。

2. 数据挖掘和机器学习:这些技术用于从大量的数据中挖掘出有用的信息,并建立模型进行预测和判断。

对于媒体艺术创作系统来说,可以利用机器学习的方法来训练模型,使其能够生成艺术作品。

3. 自然语言处理:自然语言处理技术可以使系统理解和处理人类语言。

基于单幅线条图的三维立体重建方法综述

基于单幅线条图的三维立体重建方法综述
第4 1 卷 第 1 期 2 0 1 4年 1月





Vo 1 . 4 1 NO . 1
Co mp u t e r S c i e n c e
J a n 2 0 1 4
基 于单 幅 线 条 图 的 三维 立体 重 建 方 法 综 述
郑 金鑫 汤 帜 王 勇涛
( 北京大学计算机科学技术研究所 北京 1 0 0 0 8 0 )
线 条 图 的 三 维 立 体重 建 方 法 的现 状 和 不 足 , 指 出 了 未 来的 研 究发 展 方 向 。
关键词
线条图 , 三维重建 TP 3 9 1 文献标 识码 A
中图法分 类号
S u r v e y o n 3 D Re c o n s t r u c t i o n f r o m S i n g l e Li n e Dr a wi n g s
解 能力 , 一般来说 , 维立体的整体结构 , 并很容 易被人类理解 。 线条图是三维立体的轮廓在二维平面上 的投影 。按照投
摘 要 从 单幅 线条 图重建物体 的三维立体 结构是机 器视 觉领 域的一个重要 问题 。它的应用范 围包括基于手工绘制
的立体设计 与创作 、 将现有的工程线框模型 图转换为三 维模 型、 基 于 自然 图像 的三 维建模 、 图像理 解和检 索等 。从 不
同的角度对现有 的相 关方法进行 了分类 , 并重点从所 用算 法分类的 角度 回顾 了现有 的相 关方法。最后 总结 了基 于幅
Z HE NG J i n - x i n TANG Z h i WA N G Yo n g - t a o
( I n s t i t u t e o f C o mp u t e r S c i e n c e a n d Te c h n o l o g y , P e k i n g Un i v e r s i t y , B e i j i n g 1 0 0 0 8 0 , Ch i n a )

图像处理中的图像复原与修复技术研究

图像处理中的图像复原与修复技术研究

图像处理中的图像复原与修复技术研究第一章:引言随着科技的不断发展,数字图像处理技术也变得越来越流行。

图像处理技术已经成为现代数字技术的重要组成部分。

其中,复原和修复技术是图像处理工程中的重要分支,被广泛应用于图像处理、电视、远程通信、医学成像等领域。

图像复原和修复技术的目标是通过各种算法和方法来还原或修复被噪声、失误、缺失或其他因素影响的图像。

这项技术的主要任务是重建一张尽可能接近原始图像的新图像,而不是仅仅对原图像进行简单的重复或再现。

在本文中,我们将深入探讨图像复原和修复技术的不同方法,同时评估这些方法在实践中的性能和各自的优点和不足。

第二章:图像复原技术图像复原的目标是通过去除长期积累的噪声,来恢复图像的质量和细节。

从技术上来讲,图像复原是一种泛化到信号和图像的过程,它通过消除噪声和朦胧,使得原始图像的信号增加。

2.1 基于数学模型的图像复原基于数学模型的图像复原技术是通过使用数学算法来恢复图像质量和细节的。

该方法通过将噪声和信号分析为数学模型,并针对这些模型设计复原算法来去除图像中的噪声。

这些复原算法可以分为线性和非线性方法。

线性方法是一种通过在频率域进行连续滤波来实现的复原方法。

该方法通过将图像转换为频率域,来通过频率过滤器去除噪声。

非线性方法则是通过其他方法,如小波分析、Markov随机场等,来去除图像噪声。

2.2 基于统计学的图像复原基于统计学的图像复原技术主要是建立在从噪声和信号的总体中提取出来的统计特征上。

该方法将信号看作是随机变量,并根据随机变量的概率分布来进行图像复原。

基于统计学的图像复原方法包括了著名的贝叶斯估计等方法。

这些方法能够平滑信号,从而消除噪声,同时保留原图像的细节和特征。

这些方法被广泛应用于医学成像、水下成像和遥感等领域。

第三章:图像修复技术图像的修复旨在通过自动或半自动方法,对图像中的缺陷和损伤进行修复。

这些缺陷可能包括噪声、裂缝、划痕、污渍以及其他破损或失真的情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档