OpenCV最基础的图像处理的例子
OPENCV初级教程及范例

OPENCV初级教程及范例一、安装OPENCV要使用OPENCV,首先需要在计算机上安装它。
安装步骤如下:3.打开命令行工具,并进入解压后的文件夹。
4.运行以下命令来编译和安装OPENCV:cmake .makesudo make install二、OPENCV基本概念1.图像数据结构在OPENCV中,图像被表示为一个多维数组,每个数组元素对应着图像中的一个像素。
例如,对于一个RGB彩色图像,每个像素由三个颜色通道(红、绿、蓝)组成,可以使用3维数组来表示。
2.图像读取和显示import cv2#读取图像image = cv2.imread("image.jpg")#显示图像cv2.imshow("Image", image)cv2.waitKey(0)cv2.destroyAllWindows3.图像处理import cv2import numpy as np#读取图像image = cv2.imread("image.jpg")#图像模糊处理kernel = np.ones((5,5), np.float32) / 25blurred = cv2.filter2D(image, -1, kernel) #显示处理后的图像cv2.imshow("Blurred Image", blurred)cv2.waitKey(0)cv2.destroyAllWindows三、OPENCV实例以下是一些使用OPENCV的实际范例:1.边缘检测import cv2#读取图像image = cv2.imread("image.jpg", 0)#边缘检测edges = cv2.Canny(image, 100, 200)#显示边缘图像cv2.imshow("Edges", edges)cv2.waitKey(0)cv2.destroyAllWindows2.目标识别import cv2#读取图像image = cv2.imread("image.jpg")#创建目标识别器cascade = cv2.CascadeClassifier("cascade.xml")#对图像进行目标识别objects = cascade.detectMultiScale(image, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))#绘制识别结果for (x, y, w, h) in objects:cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)#显示识别结果cv2.imshow("Objects", image)cv2.waitKey(0)cv2.destroyAllWindows这些范例只是OPENCV功能的冰山一角,OPENCV还提供了很多强大的功能和工具。
opencv中的几种常见的图像类型

1 opencv中的几种常见的图像类型opencv中,几种常见的图像类型有:IplImage,Mat,CvMat,CvArrCvArr :老版本的结构了。
是一个抽象基类,在函数原型中,常见到CvArr(CvArr*),这就允许吧CvMar* 或者IplImage* 传递到程序或函数参数中了。
CvMat :矩阵结构,IplImage :是较老版本的一种类型了,对图像进行”编码“的基本结构。
这些图像可能是灰度,彩色,4通道的(RGB+ alpha),其中,每个通道可以包含任意的整数或浮点数。
Mat:新版本中的强大的一个图像容器,是和Matlab中的函数对应的。
基本上讲 Mat 是一个类,由两个数据部分组成:矩阵头(包含矩阵尺寸,存储方法,存储地址等信息)和一个指向存储所有像素值的矩阵(根据所选存储方法的不同矩阵可以是不同的维数)的指针。
矩阵头的尺寸是常数值,但矩阵本身的尺寸会依图像的不同而不同,通常比矩阵头的尺寸大数个数量级。
2 opencv中存储图像类型转换(1)将IplImage类型转换到Mat类型Mat::Mat(const IplImage* img, bool copyData=false);默认情况下,新的Mat类型与原来的IplImage类型共享图像数据,转换只是创建一个Mat矩阵头。
当将参数copyData设为true后,就会复制整个图像数据。
例:IplImage*iplImg = cvLoadImage("greatwave.jpg", 1);Matmtx(iplImg); // IplImage* ->Mat 共享数据// or : Mat mtx = iplImg;(2)将Mat类型转换到IplImage类型同样只是创建图像头,而没有复制数据。
例:IplImage ipl_img = img; // Mat -> IplImage(3)将CvMat类型转换为Mat类型与IplImage的转换类似,可以选择是否复制数据。
使用OpenCV进行图像处理的基本方法与技巧

使用OpenCV进行图像处理的基本方法与技巧图像处理是计算机视觉领域的一个重要分支,而OpenCV作为一个开源的计算机视觉库,提供了丰富的图像处理函数和算法,使得图像处理变得更加简单和高效。
本文将介绍使用OpenCV进行图像处理的基本方法与技巧。
一、图像的读取与显示在使用OpenCV进行图像处理之前,首先需要将图像读入内存,并进行显示。
OpenCV提供了imread()函数用于读取图像,imshow()函数用于显示图像。
示例如下:```pythonimport cv2# 读取图像img = cv2.imread('image.jpg')# 显示图像cv2.imshow('image', img)cv2.waitKey(0)cv2.destroyAllWindows()```二、图像的灰度化与二值化在进行图像处理时,常常需要将图像转换为灰度图或二值图,以便于后续的处理。
OpenCV提供了cvtColor()函数用于图像的颜色空间转换,threshold()函数用于图像的二值化。
示例如下:```pythonimport cv2# 读取彩色图像img = cv2.imread('image.jpg')# 灰度化gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 二值化_, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)# 显示灰度图和二值图cv2.imshow('gray', gray)cv2.imshow('binary', binary)cv2.waitKey(0)cv2.destroyAllWindows()```三、图像的平滑与滤波图像平滑与滤波是图像处理中常用的操作,可以用于去除图像中的噪声,平滑图像的边缘等。
opencv图像处理入门与实践

opencv图像处理入门与实践OpenCV(OpenSourceComputerVision)是由Intel发的跨平台的计算机视觉库,主要用于处理计算机视觉的各种图像处理,机器学习等应用,是目前最流行的计算机视觉的开发框架。
OpenCV支持各种编程语言,其中以C++最为流行,也是OpenCV开发最多的语言。
OpenCV 有很多应用,最常用的就是图像处理应用,包括计算机视觉、人脸识别、机器学习等领域。
OpenCV框架的入门并不复杂,但也需要具备一定的编程基础,掌握C++编程知识,对算法具备一定的了解,才能够更好的认知OpenCV的框架。
在开始使用OpenCV之前,最好要先阅读一些书籍,或者参考一些视频教程,了解OpenCV的基本概念和应用,以及使用OpenCV的步骤。
在实际应用中,OpenCV能够处理各种图像处理任务,包括图像金字塔,边缘检测,边界检测,直方图均衡,颜色空间转换,图像分割,图像增强,图像去噪,图像识别,机器学习,深度学习等等。
图像处理的应用范围非常广泛,涉及无人驾驶,人脸识别,机器视觉,物体识别,数字图像处理等。
OpenCV的入门实践可以通过一些简单的实例来进行,比如对图片的灰度处理、边缘检测、图像识别等。
灰度处理是最基础的一个图片处理技术,通常使用OpenCV框架可以很容易实现,边缘检测考察图片像素之间的灰度变化,也是OpenCV框架中比较基础的技术,而图像识别则是机器学习中比较复杂的技术,要求对自然图片,尤其是人脸图片进行识别,这是OpenCV机器学习方面最常用的技术。
OpenCV图像处理相关的概念比较多,除了基本的图像处理,还可以用来实现一些更复杂的图像内容分析,比如图像识别,视频跟踪,机器学习等。
使用OpenCV完成这些功能,既可以使用算法解决,也可以使用机器学习的监督或者非监督学习方法解决,灵活应用OpenCV 框架,可以实现不同的功能。
OpenCV框架的应用可以说是非常广泛,而它的开发工作也很繁杂,如果想要掌握OpenCV,虽然可以通过书籍和视频教程,来尝试着学习一些OpenCV的概念,但实际的使用OpenCV,还需要大量的实践,才能够充分的利用OpenCV的功能,实现自己的想法。
个人整理的opencv最基本入门资料

---- By Moco Sun 2010.12.19
1. 简介 OpenCV 的全称是:Open Source Computer Vision Library,Intel 公司支持的开源计算机视
觉库,采用 c/c++编写,可以运行在 linux/windows/mac 等操作系统上。Opencv 还提供了 python、ruby、matlab 以及其他语言的接口。
//读取图像宽度 //读取图像高度 //读取图像通道数 //读取图像一行像素所占的字节数
{ pchar = (uchar*)image->imageData + i*widthStep; for (j=0; j<width; j++) { uchar* temp = pchar + j*channel; temp[0] += 10;//通道B temp[1] += 10;//通道G temp[2] += 10;//通道R }
其目标是构建一个简单易用的计算机视觉框架,以帮助开发人员更便捷地设计更复杂的 计算机视觉相关应用程序。Opencv 包含的函数有 500 多个,覆盖了如工厂产品检测、医学 成像、信息安全、用户界面、摄像机标定、立体视觉和机器人等,具体将在下面介绍。 Opencv 使用宽松的 BSD 开源协议,在遵守协议的情况下,允许生成商业产品,不必开发源 代码。
CvSize表示图像的大小,为含两个int的结构体,定义如下
typedef struct CvSize { int width; int height; }
CvSize; 小贴士
Cv与cv的区别:以Cv开头的一般是函数,以cv开头的通常是内联数据元素。 CvPoint结构体不支持默认构造函数,但是可以通过inline的cvPoint(注意首字母小写)函数来创 建一个无名的CvPoint,这在传递一些函数参数经常使用,同理,CvScalar与cvScalar,CvSize与 cvSize等也有这样的用法。
opencv 项目案例

opencv 项目案例OpenCV是一个开源的计算机视觉库,它提供了丰富的函数和算法,用于处理和分析图像和视频数据。
下面是一些基于OpenCV的项目案例以及相关参考内容,希望对您有所帮助。
1. 人脸识别人脸识别是计算机视觉领域的一项重要任务,可以应用于安防监控、人机交互等领域。
参考内容可以包括:- 人脸检测:使用OpenCV的人脸检测器(如Haar级联分类器)对输入图像进行人脸检测。
- 特征提取:使用OpenCV的特征提取算法(如局部二值模式直方图)从人脸图像中提取特征向量。
- 训练分类器:使用OpenCV的机器学习算法(如支持向量机)来训练一个人脸分类器。
- 人脸识别:使用训练好的分类器对新的人脸图像进行识别。
2. 手势识别手势识别可以应用于人机交互、虚拟现实等领域。
参考内容可以包括:- 手势检测:使用OpenCV的背景减除算法和运动跟踪算法对输入视频中的手部进行检测和跟踪。
- 手势识别:根据手势的形状、轮廓、手指数量等特征,使用OpenCV的图像处理和机器学习算法对手势进行识别。
- 手势控制:根据识别出的手势,实现对计算机或设备的控制(如控制鼠标、游戏操作等)。
3. 目标检测与跟踪目标检测与跟踪可以应用于安防监控、自动驾驶等领域。
参考内容可以包括:- 目标检测:使用OpenCV的目标检测器(如级联分类器、深度学习模型)对输入图像或视频中的目标进行检测。
- 目标跟踪:根据检测到的目标,使用OpenCV的运动跟踪算法(如卡尔曼滤波、均值漂移)对目标进行跟踪。
- 多目标跟踪:对于多个目标,使用OpenCV的多目标跟踪算法(如多种滤波方法的组合)进行跟踪与管理。
4. 图像处理与增强图像处理与增强可以应用于图像编辑、美颜相机等领域。
参考内容可以包括:- 图像滤波:使用OpenCV的滤波算法(如均值滤波、高斯滤波)对图像进行平滑处理或边缘增强。
- 图像增强:使用OpenCV的直方图均衡化、自适应直方图均衡化等算法对图像进行增强。
OpenCV常用的图像和矩阵操作总结

OpenCV常用的图像和矩阵操作总结
1.图像加载和保存
2.图像显示
3.图像基本操作
通过OpenCV,可以实现图像的基本操作,例如图像的缩放、平移、旋转和翻转。
cv2.resize(函数可以实现图像的缩放操作。
cv2.warpAffine(函数可以实现图像的平移、旋转和翻转操作。
4.彩色图像和灰度图像转换
5.图像的通道分离和合并
6.图像的滤波操作
7.图像的边缘检测
8.图像的直方图操作
9.图像的特征提取和匹配
10.图像的形态学操作
11.矩阵的创建和操作
OpenCV提供了多种方式来创建和操作矩阵。
可以使用cv2.create(函数创建矩阵,可以使用cv2.add(函数和cv2.subtract(函数对矩阵进行加减操作,可以使用cv2.multiply(函数和cv2.divide(函数对矩阵进行乘除操作。
12.矩阵的转置和逆矩阵
13.矩阵的乘法和求解
总结:OpenCV提供了丰富的图像和矩阵操作功能,包括图像的加载
和保存、图像的基本操作、图像的滤波和边缘检测、图像的直方图和特征
提取、图像的形态学操作,以及矩阵的创建和操作、矩阵的转置和逆矩阵、矩阵的乘法和求解等。
这些操作可以满足各种计算机视觉应用的需求。
opencv例子

opencv例子OpenCV例子OpenCV是一个用于计算机视觉和图像处理的开源库,提供了丰富的函数和工具,可以在不同平台上进行图像处理、物体识别、人脸检测等任务。
本文将介绍几个常见的OpenCV例子,包括图像读取、灰度转换、边缘检测和人脸识别等。
图像读取要使用OpenCV处理图像,首先需要加载图像数据。
可以使用imread函数读取图像文件,并将其存储为一个OpenCV的Mat对象。
以下是一个读取并显示图像的例子:import cv2# 读取图像文件image = ('')# 显示图像('Image', image)(0)()灰度转换灰度图像是一种只包含亮度信息的图像,对于一些图像处理任务来说,灰度图像足够使用并且计算速度更快。
可以使用cvtColor函数将彩色图像转换为灰度图像。
以下是一个简单的例子:import cv2# 读取彩色图像image = ('')# 转换为灰度图像gray_image = (image, _BGR2GRAY)# 显示灰度图像('Gray Image', gray_image)(0)()边缘检测边缘检测是一种图像处理技术,用于检测图像中的边缘或轮廓。
OpenCV提供了多种边缘检测算法,包括Canny算法和Sobel算子等。
以下是一个使用Canny算法进行边缘检测的例子:import cv2# 读取灰度图像gray_image = ('gray_', 0)# 使用Canny算法进行边缘检测edges = (gray_image, 100, 200)# 显示边缘图像('Edges', edges)(0)()人脸识别人脸识别是一种图像处理技术,用于在图像或视频中识别和标记人脸。
OpenCV提供了Haar级联分类器用于进行人脸检测和人脸特征点检测。
以下是一个使用Haar级联分类器进行人脸识别的例子:import cv2# 加载人脸级联分类器face_cascade = ('haarcascade_frontalface_')# 读取图像image = ('')# 转换为灰度图像gray_image = (image, _BGR2GRAY)# 人脸识别faces = face_(gray_image, scaleFactor=, minNeighbors=5)# 在图像中标记人脸for (x, y, w, h) in faces:(image, (x, y), (x + w, y + h), (0, 255, 0), 2)# 显示带有人脸标记的图像('Faces', image)(0)()以上仅是OpenCV的一些基础例子,实际上OpenCV提供了更多功能和应用,如图像滤波、形态学操作、特征匹配等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∙什么是OpenCV∙开源C/C++计算机视觉库.∙面向实时应用进行优化.∙跨操作系统/硬件/窗口管理器.∙通用图像/视频载入、存储和获取.∙由中、高层API构成.∙为Intel®公司的Integrated Performance Primitives (IPP) 提供了透明接口.∙特性:∙图像数据操作(分配,释放, 复制, 设定, 转换).∙图像与视频I/O (基于文件/摄像头输入, 图像/视频文件输出).∙矩阵与向量操作与线性代数计算(相乘, 求解, 特征值, 奇异值分解SVD).∙各种动态数据结构(列表, 队列, 集, 树, 图).∙基本图像处理(滤波, 边缘检测, 角点检测, 采样与插值, 色彩转换, 形态操作, 直方图, 图像金字塔).∙结构分析(连接成分, 轮廓处理, 距离转换, 模板匹配, Hough转换, 多边形近似, 线性拟合, 椭圆拟合, Delaunay三角化).∙摄像头标定 (寻找并跟踪标定模板, 标定, 基础矩阵估计, homography估计, 立体匹配).∙动作分析(光流, 动作分割, 跟踪).∙对象辨识 (特征方法, 隐马可夫链模型HMM).∙基本GUI(显示图像/视频, 键盘鼠标操作, 滚动条).∙图像标识 (直线, 圆锥, 多边形, 文本绘图)∙OpenCV 模块:∙cv - OpenCV 主要函数.∙cvaux - 辅助(实验性) OpenCV 函数.∙cxcore - 数据结构与线性代数算法.∙highgui - GUI函数.资料链接∙参考手册:∙<opencv-root>/docs/index.htm∙网络资源:∙官方网页: /technology/computing/opencv/∙软件下载: /projects/opencvlibrary/∙书籍:∙Open Source Computer Vision Library by Gary R. Bradski, Vadim Pisarevsky, and Jean-Yves Bouguet, Springer, 1st ed. (June, 2006).∙视频处理例程(位于<opencv-root>/samples/c/目录中):∙色彩跟踪: camshiftdemo∙点跟踪: lkdemo∙动作分割: motempl∙边缘检测: laplace∙图像处理例程(位于<opencv-root>/samples/c/目录中):∙边缘检测: edge∙分割: pyramid_segmentation∙形态: morphology∙直方图: demhist∙距离转换: distrans∙椭圆拟合fitellipse∙OpenCV 命名约定∙函数命名:cvActionTarget[Mod](...)Action = 核心功能(例如设定set, 创建create)Target = 操作目标 (例如轮廓contour, 多边形polygon)[Mod] = 可选修饰词 (例如说明参数类型)∙矩阵数据类型:CV_<bit_depth>(S|U|F)C<number_of_channels>S = 带符号整数U = 无符号整数F = 浮点数例: CV_8UC1 表示一个8位无符号单通道矩阵,CV_32FC2 表示一个32位浮点双通道矩阵.∙图像数据类型:IPL_DEPTH_<bit_depth>(S|U|F)例: IPL_DEPTH_8U 表示一个8位无符号图像.IPL_DEPTH_32F 表示一个32位浮点数图像.∙头文件:#include <cv.h>#include <cvaux.h>#include <highgui.h>#include <cxcore.h> // 不必要 - 该头文件已在 cv.h 文件中包含编译命令∙Linux系统:g++ hello-world.cpp -o hello-world \-I /usr/local/include/opencv -L /usr/local/lib \-lm -lcv -lhighgui -lcvaux∙Windows系统:注意在项目属性中设好OpenCV头文件以及库文件的路径.C程序实例∙//////////////////////////////////////////////////////////////////////// //// hello-world.cpp//// 一个简单的OpenCV程序// 它从一个文件中读取图像,将色彩值颠倒,并显示结果.//////////////////////////////////////////////////////////////////////////#include <stdlib.h>#include <stdio.h>#include <math.h>#include <cv.h>#include <highgui.h>int main(int argc, char *argv[]){IplImage* img = 0;int height,width,step,channels;uchar *data;int i,j,k;if(argc<2){printf("Usage: main <image-file-name>\n\7");exit(0);}// 载入图像img=cvLoadImage(argv[1]);if(!img){printf("Could not load image file: %s\n",argv[1]);exit(0);}// 获取图像数据height = img->height;width = img->width;step = img->widthStep;channels = img->nChannels;data = (uchar *)img->imageData;printf("Processing a %dx%d image with %d channels\n",height,width,channels);// 创建窗口cvNamedWindow("mainWin", CV_WINDOW_AUTOSIZE);cvMoveWindow("mainWin", 100, 100);// 反色图像for(i=0;i<height;i++) for(j=0;j<width;j++) for(k=0;k<channels;k++)data[i*step+j*channels+k]=255-data[i*step+j*channels+k];// 显示图像cvShowImage("mainWin", img );// wait for a keycvWaitKey(0);// release the imagecvReleaseImage(&img );return 0;}∙GUI命令窗口管理∙创建并放置一个窗口:cvNamedWindow("win1", CV_WINDOW_AUTOSIZE);cvMoveWindow("win1", 100, 100); // 以屏幕左上角为起点的偏移量∙读入图像:IplImage* img=0;img=cvLoadImage(fileName);if(!img) printf("Could not load image file: %s\n",fileName); ∙显示图像:cvShowImage("win1",img);∙可显示彩色或灰度的字节/浮点图像。
彩色图像数据认定为BGR顺序.∙关闭窗口:∙cvDestroyWindow("win1");∙改变窗口尺寸:cvResizeWindow("win1",100,100); // 新的宽/高值(象素点)输入设备∙响应鼠标事件:∙定义鼠标handler:void mouseHandler(int event, int x, int y, int flags, void* param) {switch(event){case CV_EVENT_LBUTTONDOWN:if(flags & CV_EVENT_FLAG_CTRLKEY)printf("Left button down with CTRL pressed\n");break;case CV_EVENT_LBUTTONUP:printf("Left button up\n");break;}}// x,y: 针对左上角的像点坐标// event: CV_EVENT_LBUTTONDOWN, CV_EVENT_RBUTTONDOWN,CV_EVENT_MBUTTONDOWN,// CV_EVENT_LBUTTONUP, CV_EVENT_RBUTTONUP,CV_EVENT_MBUTTONUP,// CV_EVENT_LBUTTONDBLCLK, CV_EVENT_RBUTTONDBLCLK,CV_EVENT_MBUTTONDBLCLK,// CV_EVENT_MOUSEMOVE:// flags: CV_EVENT_FLAG_CTRLKEY, CV_EVENT_FLAG_SHIFTKEY,CV_EVENT_FLAG_ALTKEY,// CV_EVENT_FLAG_LBUTTON, CV_EVENT_FLAG_RBUTTON, CV_EVENT_FLAG_MBUTTON∙注册handler:mouseParam=5;cvSetMouseCallback("win1",mouseHandler,&mouseParam);∙响应键盘事件:∙键盘没有事件handler.∙直接获取键盘操作:int key;key=cvWaitKey(10); // 输入等待10ms∙等待按键并获取键盘操作:int key;key=cvWaitKey(0); // 无限等待键盘输入∙键盘输入循环:while(1){key=cvWaitKey(10);if(key==27) break;switch(key){case 'h':...break;case 'i':...break;}}∙处理滚动条事件:∙定义滚动条handler:void trackbarHandler(int pos){printf("Trackbar position: %d\n",pos);}∙注册handler:int trackbarVal=25;int maxVal=100;cvCreateTrackbar("bar1", "win1", &trackbarVal ,maxVal , trackbarHandler);∙获取滚动条当前位置:int pos = cvGetTrackbarPos("bar1","win1");∙设定滚动条位置:cvSetTrackbarPos("bar1", "win1", 25);OpenCV基础数据结构图像数据结构IPL 图像:IplImage|-- int nChannels; // 色彩通道数(1,2,3,4)|-- int depth; // 象素色深:| // IPL_DEPTH_8U, IPL_DEPTH_8S,| // IPL_DEPTH_16U,IPL_DEPTH_16S,| // IPL_DEPTH_32S,IPL_DEPTH_32F,| // IPL_DEPTH_64F|-- int width; // 图像宽度(象素点数)|-- int height; // 图像高度(象素点数)|-- char* imageData; // 指针指向成一列排列的图像数据| // 注意色彩顺序为BGR|-- int dataOrder; // 0 - 彩色通道交叉存取 BGRBGRBGR,| // 1 - 彩色通道分隔存取 BBBGGGRRR| // 函数cvCreateImage只能创建交叉存取的图像|-- int origin; // 0 - 起点为左上角,| // 1 - 起点为右下角(Windows位图bitmap格式)|-- int widthStep; // 每行图像数据所占字节大小|-- int imageSize; // 图像数据所占字节大小 = 高度*每行图像数据字节大小|-- struct _IplROI *roi;// 图像ROI. 若不为NULL则表示需要处理的图像| // 区域.|-- char *imageDataOrigin; // 指针指向图像数据原点| // (用来校准图像存储单元的重新分配) ||-- int align; // 图像行校准: 4或8字节校准| // OpenCV不采用它而使用widthStep|-- char colorModel[4]; // 图像色彩模型 - 被OpenCV忽略矩阵与向量∙矩阵:∙CvMat // 2维数组|-- int type; // 元素类型(uchar,short,int,float,double)|-- int step; // 一行所占字节长度|-- int rows, cols; // 尺寸大小|-- int height, width; // 备用尺寸参照|-- union data;|-- uchar* ptr; // 针对unsigned char矩阵的数据指针|-- short* s; // 针对short矩阵的数据指针|-- int* i; // 针对integer矩阵的数据指针|-- float* fl; // 针对float矩阵的数据指针|-- double* db; // 针对double矩阵的数据指针CvMatND // N-维数组|-- int type; // 元素类型(uchar,short,int,float,double)|-- int dims; // 数组维数|-- union data;| |-- uchar* ptr; // 针对unsigned char矩阵的数据指针| |-- short* s; // 针对short矩阵的数据指针| |-- int* i; // 针对integer矩阵的数据指针| |-- float* fl; // 针对float矩阵的数据指针| |-- double* db; // 针对double矩阵的数据指针||-- struct dim[]; // 每个维的信息|-- size; // 该维内元素个数|-- step; // 该维内元素之间偏移量CvSparseMat // 稀疏N维数组∙通用数组:CvArr* // 仅作为函数参数,说明函数接受多种类型的数组,例如: // IplImage*, CvMat* 或者 CvSeq*.// 只需通过分析数组头部的前4字节便可确定数组类型∙标量:CvScalar|-- double val[4]; //4D向量初始化函数:∙CvScalar s = cvScalar(double val0, double val1=0, double val2=0, double val3=0);∙举例:CvScalar s = cvScalar(20.0);s.val[0]=10.0;∙注意:初始化函数与数据结构同名,只是首字母小写. 它不是C++的构造函数.其他数据结构∙点:CvPoint p = cvPoint(int x, int y);CvPoint2D32f p = cvPoint2D32f(float x, float y);CvPoint3D32f p = cvPoint3D32f(float x, float y, float z);例如:p.x=5.0;p.y=5.0;∙长方形尺寸:CvSize r = cvSize(int width, int height);CvSize2D32f r = cvSize2D32f(float width, float height);∙带偏移量的长方形尺寸:CvRect r = cvRect(int x, int y, int width, int height);∙图像处理分配与释放图像空间∙分配图像空间:IplImage* cvCreateImage(CvSize size, int depth, int channels);size: cvSize(width,height);depth: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S, IPL_DEPTH_32F, IPL_DEPTH_64Fchannels: 1, 2, 3 or 4.注意数据为交叉存取.彩色图像的数据编排为b0 g0 r0 b1 g1 r1 ...举例:// 分配一个单通道字节图像IplImage* img1=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);// 分配一个三通道浮点图像IplImage* img2=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);∙释放图像空间:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);cvReleaseImage(&img);∙复制图像:IplImage* img1=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);IplImage* img2;img2=cvCloneImage(img1);∙设定/获取兴趣区域:void cvSetImageROI(IplImage* image, CvRect rect);void cvResetImageROI(IplImage* image);vRect cvGetImageROI(const IplImage* image);大部分OpenCV函数都支持ROI.∙设定/获取兴趣通道:void cvSetImageCOI(IplImage* image, int coi); // 0=allint cvGetImageCOI(const IplImage* image);大部分OpenCV函数暂不支持COI.读取存储图像∙从文件中载入图像:IplImage* img=0;img=cvLoadImage(fileName);if(!img) printf("Could not load image file: %s\n",fileName);Supported image formats: BMP, DIB, JPEG, JPG, JPE, PNG, PBM, PGM, PPM, SR, RAS, TIFF, TIF载入图像默认转为3通道彩色图像. 如果不是,则需加flag:img=cvLoadImage(fileName,flag);flag: >0 载入图像转为三通道彩色图像=0 载入图像转为单通道灰度图像<0 不转换载入图像(通道数与图像文件相同).∙图像存储为图像文件:if(!cvSaveImage(outFileName,img)) printf("Could notsave: %s\n",outFileName);输入文件格式由文件扩展名决定.存取图像元素∙假设需要读取在i行j列像点的第k通道.其中, 行数i的范围为[0, height-1], 列数j的范围为[0, width-1], 通道k的范围为[0, nchannels-1].∙间接存取: (比较通用, 但效率低, 可读取任一类型图像数据)∙对单通道字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);CvScalar s;s=cvGet2D(img,i,j); // get the (i,j) pixel valueprintf("intensity=%f\n",s.val[0]);s.val[0]=111;cvSet2D(img,i,j,s); // set the (i,j) pixel value∙对多通道浮点或字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);CvScalar s;s=cvGet2D(img,i,j); // get the (i,j) pixel valueprintf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);s.val[0]=111;s.val[1]=111;s.val[2]=111;cvSet2D(img,i,j,s); // set the (i,j) pixel value∙直接存取: (效率高, 但容易出错)∙对单通道字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);((uchar *)(img->imageData + i*img->widthStep))[j]=111;∙对多通道字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R∙对多通道浮点图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R∙用指针直接存取: (在某些情况下简单高效)∙对单通道字节图像:IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);int height = img->height;int width = img->width;int step = img->widthStep/sizeof(uchar);uchar* data = (uchar *)img->imageData;data[i*step+j] = 111;∙对多通道字节图像:IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);int height = img->height;int width = img->width;int step = img->widthStep/sizeof(uchar);int channels = img->nChannels;uchar* data = (uchar *)img->imageData;data[i*step+j*channels+k] = 111;∙对单通道浮点图像(假设用4字节调整):IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);int height = img->height;int width = img->width;int step = img->widthStep/sizeof(float);int channels = img->nChannels;float * data = (float *)img->imageData;data[i*step+j*channels+k] = 111;∙使用c++ wrapper 进行直接存取: (简单高效)∙对单/多通道字节图像,多通道浮点图像定义一个 c++ wrapper: template<class T> class Image{private:IplImage* imgp;public:Image(IplImage* img=0) {imgp=img;}~Image(){imgp=0;}void operator=(IplImage* img) {imgp=img;}inline T* operator[](const int rowIndx) {return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));} };typedef struct{unsigned char b,g,r;} RgbPixel;typedef struct{float b,g,r;} RgbPixelFloat;typedef Image<RgbPixel> RgbImage;typedef Image<RgbPixelFloat> RgbImageFloat;typedef Image<unsigned char> BwImage;typedef Image<float> BwImageFloat;∙单通道字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);BwImage imgA(img);imgA[i][j] = 111;∙多通道字节图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);RgbImage imgA(img);imgA[i][j].b = 111;imgA[i][j].g = 111;imgA[i][j].r = 111;∙多通道浮点图像:IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);RgbImageFloat imgA(img);imgA[i][j].b = 111;imgA[i][j].g = 111;imgA[i][j].r = 111;图像转换∙转为灰度或彩色字节图像:cvConvertImage(src, dst, flags=0);src = float/byte grayscale/color imagedst = byte grayscale/color imageflags = CV_CVTIMG_FLIP (flip vertically)CV_CVTIMG_SWAP_RB (swap the R and B channels)∙转换彩色图像为灰度图像:使用OpenCV转换函数:cvCvtColor(cimg,gimg,CV_BGR2GRAY); // cimg -> gimg直接转换:for(i=0;i<cimg->height;i++) for(j=0;j<cimg->width;j++)gimgA[i][j]= (uchar)(cimgA[i][j].b*0.114 +cimgA[i][j].g*0.587 +cimgA[i][j].r*0.299);∙颜色空间转换:cvCvtColor(src,dst,code); // src -> dstcode = CV_<X>2<Y><X>/<Y> = RGB, BGR, GRAY, HSV, YCrCb, XYZ, Lab, Luv, HLSe.g.: CV_BGR2GRAY, CV_BGR2HSV, CV_BGR2Lab绘图命令∙画长方体:// 用宽度为1的红线在(100,100)与(200,200)之间画一长方体cvRectangle(img, cvPoint(100,100), cvPoint(200,200),cvScalar(255,0,0), 1);∙画圆:// 在(100,100)处画一半径为20的圆,使用宽度为1的绿线cvCircle(img, cvPoint(100,100), 20, cvScalar(0,255,0), 1);∙画线段:// 在(100,100)与(200,200)之间画绿色线段,宽度为1cvLine(img, cvPoint(100,100), cvPoint(200,200), cvScalar(0,255,0),1);∙画一组线段:CvPoint curve1[]={10,10, 10,100, 100,100, 100,10};CvPoint curve2[]={30,30, 30,130, 130,130, 130,30, 150,10};CvPoint* curveArr[2]={curve1, curve2};int nCurvePts[2]={4,5};int nCurves=2;int isCurveClosed=1;int lineWidth=1;cvPolyLine(img,curveArr,nCurvePts,nCurves,isCurveClosed,cvScalar(0, 255,255),lineWidth);∙画内填充色的多边形:cvFillPoly(img,curveArr,nCurvePts,nCurves,cvScalar(0,255,255));∙添加文本:CvFont font;double hScale=1.0;double vScale=1.0;int lineWidth=1;cvInitFont(&font,CV_FONT_HERSHEY_SIMPLEX|CV_FONT_ITALIC,hScale,vScale,0,lineWidth);cvPutText (img,"My comment",cvPoint(200,400), &font,cvScalar(255,255,0));Other possible fonts:CV_FONT_HERSHEY_SIMPLEX, CV_FONT_HERSHEY_PLAIN,CV_FONT_HERSHEY_DUPLEX, CV_FONT_HERSHEY_COMPLEX,CV_FONT_HERSHEY_TRIPLEX, CV_FONT_HERSHEY_COMPLEX_SMALL,CV_FONT_HERSHEY_SCRIPT_SIMPLEX, CV_FONT_HERSHEY_SCRIPT_COMPLEX,矩阵操作分配释放矩阵空间∙综述:∙OpenCV有针对矩阵操作的C语言函数. 许多其他方法提供了更加方便的C++接口,其效率与OpenCV一样.∙OpenCV将向量作为1维矩阵处理.∙矩阵按行存储,每行有4字节的校整.∙分配矩阵空间:CvMat* cvCreateMat(int rows, int cols, int type);type: 矩阵元素类型. 格式为CV_<bit_depth>(S|U|F)C<number_of_channels>.例如: CV_8UC1 表示8位无符号单通道矩阵, CV_32SC2表示32位有符号双通道矩阵.例程:CvMat* M = cvCreateMat(4,4,CV_32FC1);∙释放矩阵空间:CvMat* M = cvCreateMat(4,4,CV_32FC1);cvReleaseMat(&M);∙复制矩阵:CvMat* M1 = cvCreateMat(4,4,CV_32FC1);CvMat* M2;M2=cvCloneMat(M1);∙初始化矩阵:double a[] = { 1, 2, 3, 4,5, 6, 7, 8,9, 10, 11, 12 };CvMat Ma=cvMat(3, 4, CV_64FC1, a);另一种方法:CvMat Ma;cvInitMatHeader(&Ma, 3, 4, CV_64FC1, a);∙初始化矩阵为单位阵:CvMat* M = cvCreateMat(4,4,CV_32FC1);cvSetIdentity(M); // 这里似乎有问题,不成功存取矩阵元素∙假设需要存取一个2维浮点矩阵的第(i,j)个元素.∙间接存取矩阵元素:cvmSet(M,i,j,2.0); // Set M(i,j)t = cvmGet(M,i,j); // Get M(i,j)∙直接存取,假设使用4-字节校正:CvMat* M = cvCreateMat(4,4,CV_32FC1);int n = M->cols;float *data = M->data.fl;data[i*n+j] = 3.0;∙直接存取,校正字节任意:int step = M->step/sizeof(float);float *data = M->data.fl;(data+i*step)[j] = 3.0;∙直接存取一个初始化的矩阵元素:double a[16];CvMat Ma = cvMat(3, 4, CV_64FC1, a);a[i*4+j] = 2.0; // Ma(i,j)=2.0;矩阵/向量操作∙矩阵-矩阵操作:CvMat *Ma, *Mb, *Mc;cvAdd(Ma, Mb, Mc); // Ma+Mb -> MccvSub(Ma, Mb, Mc); // Ma-Mb -> MccvMatMul(Ma, Mb, Mc); // Ma*Mb -> Mc∙按元素的矩阵操作:CvMat *Ma, *Mb, *Mc;cvMul(Ma, Mb, Mc); // Ma.*Mb -> MccvDiv(Ma, Mb, Mc); // Ma./Mb -> MccvAddS(Ma, cvScalar(-10.0), Mc); // Ma.-10 -> Mc∙向量乘积:double va[] = {1, 2, 3};double vb[] = {0, 0, 1};double vc[3];CvMat Va=cvMat(3, 1, CV_64FC1, va);CvMat Vb=cvMat(3, 1, CV_64FC1, vb);CvMat Vc=cvMat(3, 1, CV_64FC1, vc);double res=cvDotProduct(&Va,&Vb); // 点乘: Va . Vb -> rescvCrossProduct(&Va, &Vb, &Vc); // 向量积: Va x Vb -> Vcend{verbatim}注意Va, Vb, Vc 在向量积中向量元素个数须相同.∙单矩阵操作:CvMat *Ma, *Mb;cvTranspose(Ma, Mb); // transpose(Ma) -> Mb (不能对自身进行转置) CvScalar t = cvTrace(Ma); // trace(Ma) -> t.val[0]double d = cvDet(Ma); // det(Ma) -> dcvInvert(Ma, Mb); // inv(Ma) -> Mb∙非齐次线性系统求解:CvMat* x = cvCreateMat(3,1,CV_32FC1);CvMat* b = cvCreateMat(3,1,CV_32FC1);cvSolve(&A, &b, &x); // solve (Ax=b) for x∙特征值分析(针对对称矩阵):CvMat* A = cvCreateMat(3,3,CV_32FC1);CvMat* E = cvCreateMat(3,3,CV_32FC1);CvMat* l = cvCreateMat(3,1,CV_32FC1);cvEigenVV(&A, &E, &l); // l = A的特征值 (降序排列)// E = 对应的特征向量 (每行)∙奇异值分解SVD:CvMat* A = cvCreateMat(3,3,CV_32FC1);CvMat* U = cvCreateMat(3,3,CV_32FC1);CvMat* D = cvCreateMat(3,3,CV_32FC1);CvMat* V = cvCreateMat(3,3,CV_32FC1);cvSVD(A, D, U, V, CV_SVD_U_T|CV_SVD_V_T); // A = U D V^T标号使得U 和V 返回时被转置(若没有转置标号,则有问题不成功!!!).视频序列操作从视频序列中抓取一帧∙OpenCV支持从摄像头或视频文件(AVI)中抓取图像.∙从摄像头获取初始化:CvCapture* capture = cvCaptureFromCAM(0); // capture from video device #0∙从视频文件获取初始化:CvCapture* capture = cvCaptureFromAVI("infile.avi");∙抓取帧:IplImage* img = 0;if(!cvGrabFrame(capture)){ // 抓取一帧printf("Could not grab a frame\n\7");exit(0);}img=cvRetrieveFrame(capture); // 恢复获取的帧图像要从多个摄像头同时获取图像, 首先从每个摄像头抓取一帧. 在抓取动作都结束后再恢复帧图像.∙释放抓取源:cvReleaseCapture(&capture);注意由设备抓取的图像是由capture函数自动分配和释放的. 不要试图自己释放它.获取/设定帧信息∙获取设备特性:cvQueryFrame(capture); // this call is necessary to get correct // capture propertiesint frameH = (int) cvGetCaptureProperty(capture,CV_CAP_PROP_FRAME_HEIGHT);int frameW = (int) cvGetCaptureProperty(capture,CV_CAP_PROP_FRAME_WIDTH);int fps = (int) cvGetCaptureProperty(capture, CV_CAP_PROP_FPS);int numFrames = (int) cvGetCaptureProperty(capture,CV_CAP_PROP_FRAME_COUNT);所有帧数似乎只与视频文件有关. 用摄像头时不对,奇怪!!!.∙获取帧信息:float posMsec = cvGetCaptureProperty(capture,CV_CAP_PROP_POS_MSEC);int posFrames = (int) cvGetCaptureProperty(capture,CV_CAP_PROP_POS_FRAMES);float posRatio = cvGetCaptureProperty(capture,CV_CAP_PROP_POS_AVI_RATIO);获取所抓取帧在视频序列中的位置, 从首帧开始按[毫秒]算. 或者从首帧开始从0标号, 获取所抓取帧的标号. 或者取相对位置,首帧为0,末帧为1, 只对视频文件有效.∙设定所抓取的第一帧标号:// 从视频文件相对位置0.9处开始抓取cvSetCaptureProperty(capture, CV_CAP_PROP_POS_AVI_RATIO,(double)0.9);只对从视频文件抓取有效. 不过似乎也不成功!!!存储视频文件∙初始化视频存储器:CvVideoWriter *writer = 0;int isColor = 1;int fps = 25; // or 30int frameW = 640; // 744 for firewire camerasint frameH = 480; // 480 for firewire cameraswriter=cvCreateVideoWriter("out.avi",CV_FOURCC('P','I','M','1'), fps,cvSize(frameW,frameH),isColor);其他有效编码:CV_FOURCC('P','I','M','1') = MPEG-1 codecCV_FOURCC('M','J','P','G') = motion-jpeg codec (does not work well) CV_FOURCC('M', 'P', '4', '2') = MPEG-4.2 codecCV_FOURCC('D', 'I', 'V', '3') = MPEG-4.3 codecCV_FOURCC('D', 'I', 'V', 'X') = MPEG-4 codecCV_FOURCC('U', '2', '6', '3') = H263 codecCV_FOURCC('I', '2', '6', '3') = H263I codecCV_FOURCC('F', 'L', 'V', '1') = FLV1 codec若把视频编码设为-1则将打开一个编码选择窗口(windows系统下).∙存储视频文件:IplImage* img = 0;int nFrames = 50;for(i=0;i<nFrames;i++){cvGrabFrame(capture); // 抓取帧img=cvRetrieveFrame(capture); // 恢复图像cvWriteFrame(writer,img); // 将帧添加入视频文件}若想在抓取中查看抓取图像, 可在循环中加入下列代码:cvShowImage("mainWin", img);key=cvWaitKey(20); // wait 20 ms若没有20[毫秒]延迟,将无法正确显示视频序列.∙释放视频存储器:cvReleaseVideoWriter(&writer);。