《机器视觉及其应用》部分课后习题

合集下载

机器视觉及应用作业

《机器视觉及应用》课程作业一、数字图像处理1.两个图像子集S1和S2如下图所示。

对于V＝{1}，确定这两个子集是（a）4邻接，（b）8邻接，还是（c）m邻接？解：对于V={1}，子集S1是4邻接；而子集S2则是8邻接。

2.考虑如下所示的图像分割：（a）令V＝{0，1}并计算p到q间的4、8和m通路的最短长度。

如果在这两点间不存在特殊通路，请解释原因。

（b）对V＝{1，2}重复上题。

解：（a）①p到q之间，不存在4通路。

因为V={0,1}时，如图无法找到p、q之间的通路；②p到q之间的8通路最短长度如图最短长度为4+2√2；③p到q之间的m通路最短长度如图最短长度为6+√2；（b）对于V＝{1，2}，容易得到：p、q之间4通路最短长度为8，8通路最短长度为4+2√2，m通路最短长度为8。

3．利用所学图像处理的知识，将下面全方位图像展开为普通图像。

我认为用到的是图像集合修正的知识，来处理这幅类似于几何失真的全方位图像。

首先，最主要的就是找到这幅图像的中心，这就需要利用相机的盲区（中心未拍摄到图像的黑色圆圈），求取图像的中心；（可以利用二值化后求中心的办法求得）然后，就是展开工作，以找到的中心作为极坐标中心，给图像各像素点一个极坐标；最后，通过一定的变换算法，如Houng变换（查找资料得到），对极坐标进行展开，最终获得普通图像。

最终经处理后得到的图片如图：4.图中的白条是7像素宽，210像素高。

两白条之间的宽度是17像素，当应用下面的处理时图的变化结果是什么？（1）分别用3×3、9×9均值滤波；（2）分别用3×3、9×9中值滤波。

答：（1）用3×3、9×9均值滤波，由于7>3/2,7>9/2，所以均值滤波时，滤波窗中白色像素点数>滤波窗中像素点数的一半，加上该图是二值图，灰度取值只有两个，所以说滤波前后图像不变；（2）用3×3、9×9中值滤波之后，图像中白色线条变窄，且两端变圆。

机器人视觉技术及应用章节练习题及答案(共8章)08 机器视觉系统项目实践习题答案

1机器人视觉系统实训平台由哪些模块组成？可以进行哪些视觉应用实训？
答：
机器人视觉系统实训平台由：协作机器人、模块化工作台、机器人移动导轨、轨迹示教模块、输送线模块、工具快换模块、拼图模块、自动托盘与仓储模块、视觉系统模块、电气实训模块模块组成；
可以进行：①视觉引导焊接实训；②视觉引导分拣实训；③视觉引导七巧板自动拼图实训；④视觉扫码入库实训，等实训项目。

2 在该视觉系统实训平台上装有两套视觉系统，各采用哪种安装方式，以及其作用？
答：
平台上包含两套工业相机，每套相机配有相对应的光源和镜头。

一个相机安装在输送线上，对输送线上的圆柱物料进行编号识别与位置测量。

另一个相机安装在机器人末端随机器人移动，对演示过程中七巧板物料进行颜色识别、面积识别，并针对样图效果进行摆放，另一方面相机识别货架上面的条码标识，将样图托盘对应入库。

3 简述本章4个项目实训中机器人与相机之间是如何配合应用的？
答：
机器人与相机视觉系统采用TCP/IP方式通讯，机器人作为client连接相机视觉系统服务器service；
机器人运行到拍照点执行脚本程序出发相机拍照进行图像处理；视觉系统根据编写好的流程处理图像信息，将处理结果打包成字符串发送给机器人；机器人通过脚本程序将数据进行解析，并赋值给机器人示教器变量；机器人通过在线编程使用相应的示教器变量实现项目功能。

智慧树答案机器人视觉及应用知到课后答案章节测试2022年

第一章1.机器人的定义是（）。

答案:机器人是一个面向目标的，可以感知，计划和行动的机器2.海洋底下GPS定位不准是因为（）。

答案:无线电波信号无法穿透水3.以下的描述哪个是对的（）。

答案:图像处理，计算机视觉，机器人视觉的输入都是一样的，输出是不一样的4.通过VirtualBox安装Ubuntu16正确的顺序是（）。

答案:VirtualBox -＞extensionpack -＞ Ubuntu16 -＞ insert guest Additions CD image5.在Terminal中，输入“clear”+ 回车会得到（）。

答案:清空当前Terminal中的所有显示的内容6.默认安装的OpenCV只有Main Modules模块，如果要使用一些它高级函数库，还需要额外安装（）。

答案:Extra Modules7.将矢量从一个坐标系旋转到另一个坐标系时，其长度会改变。

（）答案:错8.在二维中，旋转矩阵的逆等于它的转置，对于齐次变换矩阵，也是如此。

（）答案:错第二章1.如果我们把彩色图像的三层剥离，你们认为每一层是什么颜色？（）答案:灰色2.Matlab图像处理工具箱、Python+Opencv 图像处理支持以下哪三种图像类型：（）。

答案:二值图像;RGB图像;灰度图像3.二值图像指的是，这个图像里面只有黑白两色。

白色的像素位置被0填充，这里0指的是真值；黑色的像素位置被1填充，这里1指的是假值。

（）答案:错4.在MATLAB中提取已经读入的图像的元信息应使用哪个指令（）。

答案:info()5.在MATLAB中截图的命令是（）。

答案:snapshot()6.可以对UR3机械臂进行模拟仿真操控的软件有（）。

答案:Rviz;Gazebo;Moviet7.一元操作的函数包括（）。

答案:伽马矫正;改变数据类型;色调分离;改变对比度8.在二值化图像中，只有真和假两种可能性，也就是说像素非黑即白。

（）答案:对9.伽马矫正发生在屏幕端。

机器视觉与边缘计算应用_复旦大学中国大学mooc课后章节答案期末考试题库2023年

机器视觉与边缘计算应用_复旦大学中国大学mooc课后章节答案期末考试题库2023年1.关于OpenVINO，正确的说法是哪个？答案:OpenVINO主要用于模型推断过程优化2.关于模型优化的理解，正确的说法是哪个？答案:mo_tf.py对应的是对Tensorflow模型的优化3.关于模型优化的介绍，正确的说法是？答案:模型优化mo_tf.py输入模型格式可以为PB格式4.关于模型优化结果的叙述中，正确的说法是？答案:XML文件中定义了模型的输入样本的批大小5.下面关于OpenVINO的描述中，正确的说法是哪个？答案:OpenVINO除支持C++外，还支持Python语言接口6.下面关于OpenVINO工具包的描述中，错误的说法是哪个？答案:OpenVINO工具包支持从2010年后生成的CPU型号7.下面关于OpenVINO对硬件的要求说明中，错误的说法是哪个？答案:OpenVINO不支持Linux操作系统8.下面关于深度学习部署工具包（DLDT）的描述中，错误的说法是哪个？答案:对Intel的CPU型号没有要求9.下面关于OpenVINO支持平台的说法中，错误的说法是哪个？答案:OpenVINO对CPU的支持是从第3代开始10.下面关于OpenVINO项目开发流程的说明中，正确的说法是哪个？答案:OpenVINO中可使用异步操作进行加速推理速度11.下面关于推理引擎的描述中，正确的说法是哪个？答案:对OpenCV图像处理库进行指令集优化，显著提升性能12.下面关于推理引擎支持设备说明中，错误的说法是哪个？答案:异构插件(HETERO)是动态检查各计算设备的利用率13.下面关于OpenVX开发叙述中，错误的说法是哪个？答案:OpenVX的主要缺点是可扩展性较弱14.下面关于BP神经网络的说法中，错误的说法是哪个？答案:BP神经网络利用激活函数来实现从输出到输入的非线性映射15.下面关于BP神经网络的训练的说法中，正确的说法是哪个？答案:训练过程中权值参数的运算量很大，一般采用梯度下降法16.下面关于激活函数的描述中，正确的说法是哪个？答案:Sigmoid函数的导数是非零的，很容易计算17.下面关于损失函数的描述中，错误的说法是哪个？答案:损失函数的结果数值相对比较大说明模型的拟合能力更强18.下面关于损失函数的描述中，错误的说法是哪个？答案:损失函数的结果数值相对比较大说明模型的拟合能力更强19.下面关于学习率的描述中，正确的说法是哪个？答案:过高的学习值会使损失值不降反升20.下面关于卷积神经网络相关描述中，正确的说法是哪个？答案:Padding时各方向的填充不一定对称21.下面关于过拟合的描述中，错误的说法是哪个？答案:训练过程中的损失值越小，其在存过拟合的风险越低22.下面关于目标检测的说法中，错误的说法是哪个？答案:目标检测对准确率要求更高，但是对检测耗时要求较低23.下面关于目标检测的基本概念描述中，正确的说法是哪个？答案:IoU交并比主要是验证了目标检测的准确度24.下面关于目标检测RCNN算法的描述中，错误的说法是哪个？答案:RCNN采用SVM对候选框进行位置预测25.下面关于YOLO算法的描述中，正确的说法是哪个？答案:YOLO采用网格化图像，每个网格都预测类别及其概率26.面关于Faster RCNN算法的描述中，正确的说法是哪个？答案:Faster RCNN使用一个卷积实现分类和位置微调27.下面有关批归一化BN（batch normalization）的说法，错误的是哪个？答案:BN一般位于隐层神经元的激活函数输出之后28.对于YOLO v1算法，网络的输出维度是多少（假设每张图划分为7*7网格，每个网格预测2个边框，识别的物体类别有30个）？答案:7*7*4029.下面关于CNN的描述中，错误的说法是哪个？答案:卷积是指对图像的窗口数据和滤波矩阵做内积的操作，在训练过程中滤波矩阵的大小和值不变30.关于深度学习模型训练，以下哪个说法是错误的？答案:网中网（NIN）结构用全连接的多层感知机去代替传统的卷积，提升了模型的计算性能，但计算量显著增加31.OpenVINO工具套件提供了许多Demo和示例供开发者进行初步学习，这些示例使用的开发语言有？答案:C++和Python32.下面关于OpenVINO的说法错误的是？答案:OpenVINO并不包含图片处理工具包OpenCV，视频处理工具包Media SDK，需要另行安装。

机器视觉及其应用技术第2版项目2 光源系统的认知与选择

由于没有通用的机器视觉照明设备，所以针对每个特定的应用实例，要设计相应的照明装置，以达到最佳效果。
前光源
高角度：明场照明低角度：暗场照明
前光源
背光源
特点：背光源与前光源在放置位置上刚好相反，放置于待测物体背面，能充分突出待测物体的轮廓信息。
背光源照射下齿轮图片
环形光源
特点：能为待测物体提供大面积均衡的照明。可大大减少阴影、提高对比度。但应用距离不合适时会造成环形反光现象。
亮
热多，持续光
5000~7000
较亮
发热少，较便宜
任务2 • 任务2：手机电池尺寸测量中光源的选择
普通面光与平行面光比较
练一练
• 取一带倒角物体，分别用普通面光和平行面光照明，观察图像效果
手机电池取相效果
谢谢观看~
总结应用场合
几种典型光源
几种典型光源特性比较
光源卤素灯
颜色白色，偏黄
荧光灯
白色，偏绿
LED灯
红、黄、绿、白蓝
氙灯
白色，偏蓝
电致发光管由发光频率决定
寿命/h 5000~7000 5000~7000
发光亮度很亮
特点发热多，较便宜
亮
较ห้องสมุดไป่ตู้宜
6000~100000
较亮
固体，能做成很多形状
3000~7000
环形光源
蓝色环形光源应用
环形光源
环形光源应用
点光源
特点：结构紧凑，能够使光线集中照射在一个特定距离的小视场范围。
点光源
• 点光源应用
几种不同照明技术
练一练
• 分别取直射光与漫射光，分别照射同一物体，观察图像效果。 • 取一枚硬币，用高角度和低角度光源进行照明，观察图像效果差

机器视觉及其应用技术-项目10 手机电池正反面识别与结果显示

任务1 手机电池正反面识别
Step2：添加2个CogPMAPMAlignTool,CogPMAlignTool_正面、CogPMAlignTool_反面，分别用于识别电池正面和反面。
任务1 手机电池正反面识别
Step3：设置CogPMAlignTool_正面工具参数，设置训练区域和原点。
任务1 手机电池正反面识别
Step3：添加命名空间，定义变量，编写工程程序。
任务2 手机电池正反面识别结果显示
Step4：编译无误后关闭脚本编辑器，运行程序。结果如下：
谢谢观看~
项目1反面识别 • 任务2：手机电池正反面识别结果显示
任务1 手机电池正反面识别
Step1：加载图像，确定图像处理方法。CogPMAlignTool是一直基于图像边缘特征进行查找和匹配的工具，该工具支持图像的选择和缩放。手机电池正反面图案特征有明显差异，因此，选择用CogPMAlign工具进行识别。
Step4：选择二维码作为训练特征，进行掩摸操作。
任务1 手机电池正反面识别
Step5：训练模板，运行查看匹配结果。
任务1 手机电池正反面识别
Step6：电池反面识别。与正面设置方法类似，首先选择训练区域，设置训练参数，训练获取模板。
任务1 手机电池正反面识别
Step7：设置运行参数与图形界面上“训练特征”中显示精细，显示粗糙及“诊断” 中的显示匹配特征。
Step1：打开CogJob的脚本编辑器，新建C#脚本。添加CogPMAlignTool引用集 Cognex.VisionPro.PMAlign.dll。
任务2 手机电池正反面识别结果显示
Step2：添加CogPMAlignTool引用集Cognex.VisionPro.PMAlign.dll。

2024 机器视觉与应用例题

2024 机器视觉与应用例题1. 图像分类任务给定一组图像，使用机器视觉算法对图像进行分类，将其分为不同的类别。

例如，使用卷积神经网络（CNN）模型对一组猫和狗的图像进行分类。

2. 目标检测任务通过机器视觉技术，从一张图像中检测和定位出不同的目标物体。

例如，在一张街景图片中使用目标检测算法检测汽车、行人和建筑物等物体。

3. 人脸识别任务使用机器视觉算法对人脸图像进行识别和认证。

例如，通过面部识别技术对特定人员进行身份认证或者在照片中识别出特定人物。

4. 图像分割任务将一张图像分割成多个区域，并将每个区域赋予不同的标签。

例如，将医学图像中的肿瘤区域进行分割，以便医生进行更准确的诊断。

5. 视频内容分析任务对视频进行动作识别、行为分析和事件检测等任务。

例如，使用光流和运动特征分析对体育比赛视频中的不同动作进行识别和分析。

6. 图像生成任务使用机器视觉技术生成合成图像。

例如，通过对多张图像进行深度学习算法的训练，生成逼真的虚拟人物头像。

7. 图像超分辨率任务通过机器视觉算法将低分辨率图像提高到高分辨率。

例如，在图像处理中通过神经网络模型将模糊的图像变得更加清晰。

8. 图像去噪任务使用机器视觉算法去除图像中的噪声。

例如，将通过计算机视觉算法降噪后的机器视觉图像应用于生物医学图像，以提高诊断准确性。

9. 人体姿态估计任务通过机器视觉技术估计人体在图像或视频中的姿势信息。

例如，在行人监测中，通过机器视觉算法检测和估计行人的关节位置来识别危险动作。

10. 图像配准任务通过机器视觉算法将多张图像或视频中的对象进行配准，以实现对应目标的对齐和融合。

例如，在医学影像中将多个扫描图像进行配准，以获取更全面的患者数据。

11. 视觉里程计任务使用机器视觉技术对相机在运动过程中的位置和姿态进行估计。

例如，在无人驾驶车辆或机器人导航中，通过对连续图像序列进行分析和比对，实现对车辆或机器人的实时定位和路径规划。

12. 视频目标跟踪任务通过机器视觉算法在视频序列中跟踪一个或多个目标。

机器人视觉技术及应用章节练习题及答案(共8章)03 视觉系统硬件选型习题答案

1、工业相机一般由哪几部分组成？各有什么作用答：一般来说，工业相机主要由图像传感器、内部处理电路、数据接口、IO接口、光学接口等几个基本模块组成。

当相机在进行拍摄时，光信号首先通过镜头到达图像传感器，然后被转化为电信号，再由内部处理电路对图像信号进行算法处理，最终按照相关标准协议通过数据接口向上位机传输数据。

IO接口则提供相机与上下游设备的信号交互，如可以使用输入信号触发相机拍照，相机输出频闪信号控制光源亮起等。

2、请简述色温的概念答：色温是指绝对黑体从绝对零度(一273℃)开始加温后所呈现的颜色。

黑体在受热后．逐渐由黑变红，转黄，发白，最后发出蓝色光。

当加热到某个温度，黑体发出的光所含的光谱成分，就称为这一温度下的色温，计量单位为“K”(开尔文)。

K越低，颜色就越红，3、请简述全局快门（Globlal Shutter）和卷帘快门（Rolling Shutter）的含义答：全局快门是指整个芯片的每行像素全部同时进行曝光，每一行像元的曝光开始和结束时间相同。

曝光完成后，数据开始逐行读出。

相机传感器曝光、数据读出的时间长度一致，但结束数据读出的时刻不一致。

卷帘快门是指芯片开始曝光的时候，每行均按照顺序依次开始曝光。

第一行曝光结束后，便立即开始读出数据，数据完全读出后，下一行再开始读出数据，如此循环。

不同行的像元曝光开始和结束时间不同.4、请简述镜头景深参数的含义答：景深（DOF）定义为在传感器上获得清晰像的物空间深度。

在光学系统中，物平面（对焦平面）上的点在与之共轭的像平面（感光平面）上成点像，在其他平面上在像平面所成的像均为一定直径的弥散斑。

而传感器的像素都是有一定尺寸的，只要弥散斑的直径足够小，弥散斑可以落在一个像素内，传感器就会将弥散斑误认为是一个点，则认为弥散斑对应的物方平面成像也是清晰的。

5、请进行相机选型：现有视野大小为16mm x 12 mm，单像素精度为0.005mm；；被测物为中速流水线传送状态；客户要求检测区域内方块面上有无脏污，无色彩要求；最高需要在一秒内拍10张图片答：该用户需要测试固定视野大小的产品，因此选用面阵相机，排除CL系列；检测脏污有无，无色彩要求，选择黑白相机；被测物为中速流水线传送状态，需要选择全局曝光相机，无需具备超短曝光功能；实际视野范围为16mm*12mm，单像素精度为0.005mm，则此时所需相机最小分辨率为16/0.005×12/0.005=3200×2400确定帧率/行频。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一章机器视觉系统构成与关键技术1、机器视觉系统一般由哪几部分组成？机器视觉系统应用的核心目标是什么？主要的分成几部分实现？用机器来延伸或代替人眼对事物做测量、定位和判断的装置。

组成：光源、场景、摄像机、图像卡、计算机。

用机器来延伸或代替人眼对事物做测量、定位和判断。

三部分：图像的获取、图像的处理和分析、输出或显示。

2、图像是什么？有那些方法可以得到图像？图像是人对视觉感知的物质再现。

光学设备获取或人为创作。

3、采样和量化是什么含义？数字化坐标值称为取样，数字化幅度值称为量化。

采样指空间上或时域上连续的图像（模拟图像）变换成离散采样点（像素）集合的操作；量化指把采样后所得的各像素的灰度值从模拟量到离散量的转换。

采样和量化实现了图像的数字化。

4、图像的灰度变换是什么含义？请阐述图像反色算法原理？灰度变换指根据某种目标条件按照一定变换关系逐点改变原图像中每一个像素灰度值，从而改善画质，使图像的显示效果更加清晰的方法。

对于彩色图像的R、G、B各彩色分量取反。

第二章数字图像处理技术基础1、对人类而言，颜色是什么？一幅彩色图像使用RGB色彩空间是如何定义的？24位真彩色，有多少种颜色？对人类而言，在人类的可见光范围内，人眼对不同波长或频率的光的主观感知称为颜色。

一幅图像的每个像素点由24位编码的RGB 值表示：使用三个8位无符号整数（0 到255）表示红色、绿色和蓝色的强度。

256*256*256=16,777,216种颜色。

2、红、绿、蓝三种颜色为互补色，光照在物体上，物体只反射与本身颜色相同的色光而吸收互补色的光。

一束白光照到绿色物体上，人类看到绿色是因为？该物体吸收了其他颜色的可见光，而主要反射绿光，所以看到绿色。

3、成像系统的动态范围是什么含义？动态范围最早是信号系统的概念，一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。

而在实际用途中，多用对数和比值来表示一个信号系统的动态范围，比如在音频工程中，一个放大器的动态范围可以表示为：D = lg（Power_max / Power_min）×20；对于一个底片扫描仪，动态范围是扫描仪能记录原稿的灰度调范围。

即原稿最暗点的密度（Dmax）和最亮处密度值(Dmin)的差值。

我们已经知道对于一个胶片的密度公式为D = lg（Io/I）。

那么假设有一张胶片，扫描仪向其投射了1000单位的光，最后在共有96%的光通过胶片的明亮（银盐较薄）部分，而在胶片的较厚的部分只通过了大约4%的光。

那么前者的密度为：Dmin=lg（1000/960）= 0.02；后者的密度为：Dmax=lg（1000/40）= 1.40那么我们说动态范围为：D=Dmax-Dmin=1.40-0.02=1.38。

只要是扫描仪的动态范围能够大于胶片的动态范围，就可以真实的表现原稿上的信息，包括真实的反映出一些细微的暗部细节。

动态范围（Dynamic Range），最早是信号系统的概念，一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。

而在实际用途中，多用对数和比值来表示一个信号系统的动态范围，对于底片扫描仪来说，动态范围是指扫描仪能记录原稿的色调范围，即原稿最暗点的密度（Dmax）和最l亮处密度值(Dmin)的差值。

而对于胶片和感光元件来说，动态范围表示图像中所包含的从“最暗”至“最亮”的范围。

动态范围越大，所能表现的层次越丰富，所包含的色彩空间也越广。

相机的动态范围越大，它能同时记录的暗部细节和亮部细节越丰富。

请注意，动态范围与色调范围（tonal range）是不同的。

当我们采用JPEG格式拍摄照片时，相机的图像处理器会以明暗差别强烈的色调曲线记录图像信息。

在这个过程中，处理器常常会省去一部分RAW数据上的暗部细节和亮部细节。

而使用RAW格式拍摄，则能图像保持感光元件的动态范围，并且允许用户以一条合适的色调曲线压缩动态范围和色调范围，使照片输出到显示器或被打印出来后，获得适当的动态范围。

相机的感光元件是由数以百万个像素组成的，这些像素在像素曝光的过程中吸收光子，转化成数字信号，然后成像。

这个过程就像我们拿数百万个水桶到户外收集雨水。

感光区域越光亮，收集的光子量自然越多。

感光元件曝光后，按照每个像素收集的光子量不同，赋予它们不连续的值，并转化为数字信号。

没有吸收光子和吸收光子至满载的像素值分别显示为"0"和"255"，即代表纯黑色和纯白色。

一旦这些像素满载，光子便会溢出，溢出会导致信息（细节）损失。

以红色为例，高光溢出使满载红色的像素附近的其它象素的值都变成255，但其实它们的真实值并没有达到255。

换句话说，画面的细节发生了损失，这样会造成高光部分的信息缺失。

如果我们以减少曝光时间来防止高光溢出，很多用来描述昏暗环境的像素则没有足够的时间接收光子量，得出的像素值为0，这样就会导致昏暗部分的信息缺失。

通过上面的说明，我们现在就可以理解为什么采用大尺寸感光元件的数码单反会拥有更大的动态范围。

原因很简单：数码单反的感光元件尺寸一般是消费级相机的4～10倍，允许承载更多的像素而不至于缩小像点之间的距离，而产生噪点。

更多的像素不会很快被“填满”，因此表现昏暗环境的像素在表现光亮环境的像素“满载”之前，有更多时间吸收光子，从而画面细节便会更加丰富。

数字相机DSLR、DC等等的动态范围表示方法目前似乎并没有统一的约束，各个厂家也只是在他们的宣传内容上提到了“大的动态范围”之类的话，并未给出具体的指标。

所以有时我们用比值来描述DSLR的动态范围，或者换算成光圈数，而较少用到密度值概念。

因为数字图象设备也可以看作一个信号系统，所以动态范围可以分为两个部分，即光学动态范围和输出动态范围。

光学动态范围(DR_Optical) = 饱和曝光量 / 噪声曝光量(暗电流)输出动态范围(DR_Electrical) = 饱和输出振幅 / 随机噪声前者主要是由CCD/CMOS等感应器决定的，后者主要由A/D、DSP来决定。

其中饱和曝光量相当于传统胶片的肩部范围，噪声曝光量相当于传统胶片的趾部范围。

对于数字相机，因为其最终还是以数字量输出，所以输出动态范围公式并不适用。

我们提到的动态范围主要指的是输入部分的动态范围，也就相当于胶片的宽容度。

4、图像的位深度是什么含义？用于指定图像中的每个像素可以使用的颜色信息数量。

每个像素使用的信息位数越多，可用的颜色就越多，颜色表现就更逼真。

5、图像分辨率是什么含义？指图像中存储的信息量，是每英寸图像内有多少个像素点，分辨率的单位为PPI(Pixels Per Inch)，通常叫做：像素每英寸。

6、图像的直方图是如何定义的？其反映了什么信息？请绘制下图像的直方图。

灰度直方图是灰度级的函数，描述图像中该灰度级的像素个数（或该灰度级像素出现的频率）：其横坐标是灰度级，纵坐标表示图像中该灰度级出现的个数（频率）。

反映了图像灰度的分布情况。

7、中值滤波是什么含义？请计算下图像的中值滤波结果？这样，在一定条件下可以克服线性滤波带来的图像的细节模糊问题，而且对滤除噪声干扰及图像扫描噪声非常有效。

8、图像锐化是什么含义？如何实现？补偿和增加图像的高频成分,使图像中的地物边界、区域边缘、线条、纹理特征和精细结构特征等更加清晰、鲜明。

分为空间域法和频域法两类，可使用理想滤波器、梯形滤波器、巴特沃斯滤波器、指数型滤波器进行滤波处理以达到锐度提高的目的。

9、请阐述“最小组内方差图像分割”算法原理？设计思想：阈值将图像分为两类，用组内方差来衡量一致性，组内方差最小对应最佳阈值。

算法步骤：计算得到原图的灰度直方图h；给定一个初始阈值Th=Th0，则将原图分为C1和C2两类;分别计算两类的类内方差分别计算两类像素在图像中的分布概率:选择最佳阈值Th=Th*，使下式成立：10、什么是傅立叶变换？图像的功率谱是什么含义？傅里叶变换是将时域信号分解为不同频率的正弦和/余弦和的形式，实现图像由时域到频域的转换。

图像的功率谱指单位频带内信号功率随频率的变换情况。

11、频域滤波与空域滤波是什么关系？频域滤波如何实现？空域滤波是指直接对采集得到的图像处理，即直接对像素灰度处理；频域滤波指对图像进行某种变换，如傅里叶变换，在变换域处理，即间接对像素灰度处理。

12、什么是低通滤波？如何实现？让图像使高频分量抑制，低频分量通过，使图像模糊，平滑。

使不同颜色或灰度间有一定的过度，棱角分明的图像模糊化。

利用各种滤波器如巴特沃斯或指数低通滤波器对图像进行频域滤波实现。

第三章机器视觉应用基础之视觉标定技术1、摄像机的几何模型（成像畸变和内部参数）含义？摄像机几何模型解决的是三维场景中的点如何和图像平面上的点联系起来的问题。

图像是视觉信息表示的一种物理形式，要了解其所携带信息的内在性质，必须了解三维场景是如何形成二维图像的几何模型，就要用适当的数学模型表征图像的形成过程，这种数学模型称为摄像机的几何模型。

成像畸变包括径向及切向畸变，径向畸变来源于镜头放大率随径向距离不同而不同，切向畸变来源于各个镜头的光轴中心并不严格共面。

一般切向畸变相对较小。

摄像机的内部参数指线性模型的参数如有效焦距、水平像素单位长度、垂直像素单位长度、像素平面中心坐标，和非线性畸变的参数。

2、摄像机的外部参数、内部参数的标定原理？如何实现？传统的摄像机标定方法按其求解的方法可分为三类:线性方法、非线性优化方法和考虑畸变补偿的两步法。

第四章机器视觉硬件系统1、CCD的工作原理？当CCD表面受到光线照射时，每个感光单位会将电荷反映在组件上，所有的感光单位所产生的信号加在一起，就构成了一幅完整的画面。

2、镜头的视场范围的定义是什么？镜头能够观察到的最大范围，通常以角度来表示，视场范围越大，可观测到的范围越大。

3、镜头的景深是什么含义？在镜头前方被摄主体（调焦点）前后有一段一定长度的空间，其影像仍然有一段清晰范围。

这段空间的长度，就叫镜头的景深。

4、镜头的F数的定义？F数为相对孔径的倒数，称为光圈系数，是衡量镜头通光量的参数。

5、镜头的分辨率是如何定义的？镜头的分辨率是指在成像平面上1毫米间距内能分辨开的黑白相间的线条对数，单位是“线对/毫米”。

分辨率就是在物体反差无限大的时候（就是所有物象在纯白和纯黑下）镜头记录物体细节的能力。

6、F数与图像的亮度、景深、镜头的分辨率之间的关系？当照相机镜头的焦距f和调焦距离S不变时，F数越大(即光孔越小——光圈越小)时，进光量越少，亮度越低，这时拍摄出来的画面的景深就越大；相反，F数越小(即光孔越大——光圈越大)时，进光量越多，亮度越高，其景深就越小。

镜头分辨率随着F数减小而增加。

7、镜头的传递函数的含义？将镜头看作一个信息传递系统，被拍摄景物发出来的光线是它的输入信息，而成像面上的成像就是它的输出信息。