彩色桌面出版系统
平版制版工艺中的分色技术

平版制版工艺中的分色技术1 彩色桌面出版系统制版工艺彩色桌面出版系统也称DTP系统,它所承担的任务是对需要复制的图像、文字和图形信息进行各种处理,并制成软片或印版。
彩色桌面出版系统是以计算机为主的一种快速有效的制版设备,主要由扫描仪(或电分机前端)、计算机、照排机三大部分组成。
分色制版基本分为三个部分:图文信息输入、图文信息处理和图文信息输出。
这里主要介绍图文信息的输入,即分色技术。
图文信息的采集主要有两种方式:一种是电子方式,如使用数码相机、摄像机拍摄原稿等,过去由于这些设备的精度低,所以其拍摄的原稿印刷上很少应用,但近几年来由于这些设备的不断改进完善,已越来越多地应用于制版分色领域;另一种方式是机械扫描方式,包括滚筒式扫描和平板式扫描。
平板式扫描仪多采用CCD作为光电转换器件,在采样精度、分辨率、阶调范围、暗调细节等方面都不如采用光电倍增管作为光电转换器件的滚筒扫描仪。
高档的专业平板扫描仪虽与滚筒扫描仪有一定差距,但现在已发展到相当高的水平且价格比滚筒扫描仪便宜得多,可以胜任许多中高档产品的扫描制作,现在已被广泛采用。
滚筒扫描方式由于采样的精度高、阶调范围宽,能表现出暗调丰富的细微层次,所以是高档原稿扫描必不可少的设备。
2 分色的基本原理运用色彩学原理我们知道所有的颜色都可以由色料三原色黄、品红、青按不同比例组合而成,也就是说从原理上讲,用理想的三原色色料可以再现任何颜色,但实际生产中这三种原色油墨的颜色再现能力是有限的,因此,有些原稿的颜色再现总有一定的误差,象较纯的蓝紫色就很难完整再现。
颜色可分为彩色和非彩色两大类,非彩色又称消色,是指白色、黑色、以及深浅不同的灰色,它们构成一个系列,由白到浅灰、中灰、再到深灰直到黑色,称为黑白系列。
彩色是指黑白系列以外的各种颜色,即便是红色,也有浅红、暗红鲜艳之分。
为了对各种颜色进行较为正确的分析和区别,国际上统一规定了鉴别色彩的三个属性,就是色相、明度、饱和度。
印刷行业术语大全

印前术语中文英文详细描述原稿original制版所依据的实物或载体上的图文信息。
图像原稿picture original复制技术中被复制的照片、底片、画稿、印刷品等的总称。
反射原稿reflection copy以不透明材料为图文信息载体的原稿。
透射原稿transparent copy以透明材料为图文信息载体的原稿。
连续调原稿continuous tone copy色调值呈连续渐变的原稿。
线条原稿line copy 由黑白或彩色线条组成图文的原稿。
彩色正片原稿color transparency以透明材料为图文信息载体的彩色阳片原稿。
彩色负片原稿color negative以透明材料为图文信息载体的彩色(多为补色)阴片原稿。
实物原稿object original 复制技术中以实物作为复制对象的总称。
文字排版text composition 将文字原稿依照设计要求组成规定版式的工艺。
印刷字体printing type face 供排版印刷用的规范化文字形体。
行空line space 字行之间的距离。
横排horizontal setting of types 字符横向顺序排列成行的排版格式。
竖排vertical setting of types 字符由上而下竖向排列成行的排版格式。
磅point是字体排版之量度单位,英文字母最小单位,1英寸分 72 单位磅。
级光学照排时代是指文字大小,4 级为1mm。
汉字编码encoding of chinese characters 以汉字字形或读音为基础,用数码及拉丁字母组合代表每一个汉字,供计算机排版及汉字信息处理的文字代码。
字号type size 是指字体大小的称谓,最大特号字 72 磅,最小8 号字 5 磅。
字节byte 是电脑机器语言的单位,8bit 等于一字节。
变形文字deformed letters 将正体文字通过光学原件或其他成像方式变成长、扁、斜等形状的文字。
彩色桌面出版系统

随着数字印前技术的发展, 随着数字印前技术的发展,输出设备越来越 广泛,包括CTP、DI、数字印刷机等都纳入了 广泛,包括 、 、数字印刷机等都纳入了 彩色桌面出版系统的范畴。 彩色桌面出版系统的范畴。
彩色桌面出版系统,从总体结构上分为输入、加 彩色桌面出版系统,从总体结构上分为输入、 工处理和输出等三大部分。 工处理和输出等三大部分。 1. DTP的输入设备 的 输入设备的基本功能是对原稿进行扫描、 输入设备的基本功能是对原稿进行扫描、分 色并输入系统。 色并输入系统。 使用较多的是扫描仪 数码相机。 扫描仪和 使用较多的是扫描仪和数码相机。 还有目前较先进的电脑绘图输入设备: 还有目前较先进的电脑绘图输入设备:数 位板和 位板和压感笔 。
DTP电脑印前设计的一般流程
扫 描
发 排
BALLOON
BALLOON 扫描仪 计算机 RIP 激光照排机
DTP制版印刷工艺 DTP制版印刷工艺
BALLOON BALLOON BALLOON
BALLOON
印 刷
BALLOON 印刷机 BALLOON
晒 版
BALLOON
二、DTP的组成
输入部分:扫描仪、 输入部分:扫描仪、数码相机等 处理部分:计算机、 处理部分:计算机、软件 输出部分:照排机、打印机、 输出部分:照排机、打印机、 CTP、DI、数 、 、 字印刷机
传统印刷设计的一般流程
电分机
分色片
印刷品的电分制版工艺
BALLOON BALLOON BALLOON
拼版 晒版
BALLOON
BALLOON
印刷机
二、缺点:
不能同时完成文字输入编辑、图形设计制作、 不能同时完成文字输入编辑、图形设计制作、 图像处理 不能实现图文合一的电子计算机综合处理系统 设备开放性差,不能实现多种输入、 设备开放性差,不能实现多种输入、输出方式
20世纪印刷技术的发展过程

20世纪印刷技术的发展过程⽬前,⼈类进⼊多种传播媒体并存的信息时代时,科技发展不仅推动了印刷复制技术的进步,更新了印刷⼯艺,⽽且拓展了印刷复制研究的空间。
回顾近20年印刷复制技术的研究,每⼀次突破性的进展都有着深厚的技术背景,是综合应⽤和发展多学科研究成果的结果。
随着计算机技术和信息化、⽹络化技术的飞速发展,可变印刷技术及设备⽇趋完善,印刷技术的系统化、标准化、流程化、数字化和⽹络化技术的发展⽇趋成熟。
⼀、印前系统的不同输出过程 图⽂合⼀拼版技术的发展可分为三⼤类:⼀是彩⾊电⼦整页拼版系统,⼆是简易拼版系统,三是彩⾊桌⾯出版系统(以下简称DTP)。
前两者以电⼦分⾊机为基础,主要⽤于处理图像,它们⼀般都具有逼真的彩⾊显⽰,更⾼的计算机运算速度和处理能⼒。
简易拼版系统指具有⼀般的拼版功能,如蒙版、修版功能等,⽽层次校正、彩⾊校正、像素编辑等功能,则需在⾼档系统中才⽐较完备。
在彩⾊印前处理中,电分机和彩⾊整页拼版系统⼀直占统治地位,但是他们对⽂字与彩图的混排却⽆能为⼒。
随着彩⾊印刷的普及,对印刷品的要求越来越⾼,这就需要彩⾊整页拼版系统来满⾜发展需要,DTP的优势也就显露出来。
1、彩⾊桌⾯出版系统(DTP) DTP (Desk-top Publishing) ⼀词出现在1985年,它实质上就是通过个⼈计算机进⾏⽂字图像综合处理的整页拼版系统。
由于桌⾯出版软件具有汉字处理功能,加上汉字PS库的建⽴,使我国具备了应⽤桌⾯出版系统的技术条件。
1994年以后,桌⾯出版技术⾸先在我国⼴告制作与设计领域推⼴应⽤,并⼴泛应⽤于报业、书刊及包装印刷业。
2、计算机直接制版(CTP)技术 CTP(Computer To Plate)是指经过计算机将图⽂直接输出到印刷版材上的⼯艺过程。
传统的制版⼯艺中,印版的制作要经过激光照排输出软⽚和⼈⼯拼、晒版两个⼯艺过程。
CTP技术不⽤制作软⽚,不依靠⼿⼯制版,输出印版重复精度⾼,⽹点还原性好,可以根据完善的套印精度缩短印刷准备时间。
详解 RIP

详解 RIPRIP,全称光栅图像处理器。
在彩色桌面出版系统中的作用是十分重要的,它关系到输出的质量和速度,甚至整个系统的运行环境,可以说是彩色桌面出版系统的核心。
RIP的主要作用是将计算机制作版面中的各种图像、图形和文字解释成打印机或照排机能够记录的点阵信息,然后控制打印机或照排机将图像点阵信息记录在纸上或胶片上。
RIP通常分为硬件RIP和软件RIP两种,也有软硬结合的RIP。
硬件RIP实际上是一台专用的计算机,专门用来解释页面的信息。
由于页面解释和加网的计算量非常大,因此过去通常采用硬件RIP来提高运算速度。
软件RIP是通过软件来进行页面的计算,将解释好的记录信息通过特定的接口卡传送给照徘机,因此软件RIP要安装在一台计算机上。
目前计算机的计算速度已经有了明显的提高,RIP的解释算法和加网算法也不断改进,所以软件RIP的解释速度已不再落后于硬件RIP,甚至超过了硬件RIP。
加上软件RIP升级容易,可以随着计算机运算速度的提高而提高,因此越来越受到用户的欢迎。
RIP也是直接体现系统开放性的关键,因此RIP是否符合PostScript标准,关系到是否能对各种应用软件生成的PS文件进行解释,是否能够支持汉字,是否支持各种硬件平台。
图像的加网也是在输出过程中由RIP完成的,加网有很多不同的算法,各RIP生产厂家都有自己的加网算法,如连诺.海尔公司的HQS加网、爱克发公司的平衡加网、Adobe公司的精确加网等。
但不同的算法会产生不同的效果,加网速度有很大差别,生成的网点玫瑰斑形状也不一样,这主要是由于加网线数和网角以及点形的微小差别造成的。
要想加网角度准确,加网线数接近标称数值,往往要花费很大的计算代价,解释速度也就相应降低。
因此RIP的加网算法直接影响到图像的质量和输出的速度。
RIP的主要技术指标为:1.PostScript兼容性。
因为PostScript页面描述语言已经成为印刷行业的通用语言,各种桌面系统应用软件都以此为标准,因此兼容性的好坏直接关系到RIP是否能解释各种软件制作的版面,输出中是否会出现错误。
印刷概论习题集

印刷概论习题集一、单选题:(100题)1.是发明印刷的前提。
A.语言的产生B.文字的产生C.笔的产生D.墨的发现2.是发明印刷术的物质基础。
A.拓石的产生B.文字的产生C.笔、墨、纸的出现D盖印的发明3.是发明印刷的技术条件。
A.盖印与拓石B.文字的产生C.笔、墨、纸的产生D语言的产生4.从现存最早文献和最早的印刷实物来看,我国雕印刷术是在时出现的。
A.唐朝初期B.宋朝初期C.唐朝末期D宋朝末期5.毕昇发明了,是我国印刷术又一伟大发明,是世界上最早的活字印刷术。
A.木活字B.胶泥活字C.铅活字D铜活字6.下列属于透射原稿的是。
A.照片B.天然色正片C.印刷品原稿D画稿7.下列不属于连续调原稿的是。
A.照片B.印刷品原稿C.国画原稿D.天然色正片8.最为常用的两大承印物是。
A.皮革和纸张B.玻璃和塑料C.纸张和塑料D.木材和纸张9.广泛应用于报纸、书刊等纸张印刷中,它占据着印刷工业的主导地位。
A.凸版印刷B.平版印刷C.凹版印刷D.丝网印刷10.印刷的成品墨色厚实,色彩鲜艳,并具有防伪功能,适合印刷有价证券、精美画册、食品包装等。
A.凸版印刷B.平版印刷C.凹版印刷D.丝网印刷11.下列哪种原稿不属于印刷复制传统原稿。
A.照片B.天然色正片C.印刷品原稿D.数码照片12.中的正色片对________不敏感性。
A.蓝光B.青光C.红光D.绿光13.感光胶片中的乳剂层,其感光物质主要是____ ____。
A.卤化银B.重铬酸钾C.重铬酸铵D.氧化物14.通常报纸采用________作为承印材料。
A.铜版纸B.新闻纸C.胶印书刊纸D.字典纸15.已知一张纸的全张尺寸是780mm×1080mm,则八开的尺寸是________。
A.98mm×135mmB.390mm×540mmC.270mm×390mmD.540 mm×780mm 16.下列承印物可作为食品包装的是________。
电脑印刷-讲义-真题演练
真题演练1.印刷中“刷”包含()。
(双选)A.印版B.纸C.色料D.压力『正确答案』C、D『答案解析』根据印刷的定义, “印刷”一词分为“印”包含印版与纸;“刷”包含色料与压力。
2.活字的制作包括拣字、_____、印刷、_____、还字等工序,与现代铜字排版印刷的工序几乎完全一致。
()A.修字B.分色C.排版D.拆版E.校对『正确答案』C、D『答案解析』3.在元成宗时(1297—1298),王祯进一步将活字改良为______,______至此趋向完备。
()A.蜡版活字B.胶泥活字C.木刻活字D.凸版印刷E.凹版印刷『正确答案』C、D『答案解析』王祯改良的木活字,采用的是凸版印刷术。
4.公元1234年,崔怡用铸字印刷了_____28本,这是世界上最早的金属活字印刷品。
()A.《本草纲目》B.《心经》C.《易经》D.《详定礼文》『正确答案』D『答案解析』公元1234年,崔怡用铸字印刷了《详定礼文》28本,这是世界上最早的金属活字印刷品。
5.德国人约翰·谷登堡将木刻活字改良为()他在欧洲被称为“印刷之父”。
A.铁合金活字B.铝合金活字C.铜合金活字D.铅合金活字『正确答案』D『答案解析』现代印刷术的创始人是德国的谷腾堡,他发明的铅活字印刷术,将承印方式由“印刷”变为“压印”。
6.彩色桌面出版系统指能够完成图像录入、文字管理、______、版面设计、图文合成、______的桌面处理技术。
()A.图像编辑B.文字处理C.图文输出D.图文管理E.文字校对『正确答案』A、C『答案解析』彩色桌面系统定义是能够完成图像录入、文字管理、图像编辑、版面设计、图文合成、图文输出的桌面处理技术。
7.中国标准书号由标识符ISBN 和13位数字组成,这13位数字分为()部分。
『正确答案』D『答案解析』标准书号包含5个部分,分别是前缀号-中国组号-出版者号-书序号-检验码。
8.印刷原稿按照内容形式分,可分为线条原稿和()。
第四章印刷图像信息处理
第一节 连续调图像原稿阶调复制的原理
一、连续调图像原稿阶调复制原理
要素:阶调层次的再现、图像清晰度的保证、颜色的还原性
阶调:图像中像素的亮暗程度. 清晰度:图像细节的清晰程度 层次:亮暗之间的密度等级.
阶调层次丢失的印刷品
连续调图像原稿的阶调层次在印刷品上如何表现?
1、利用墨层厚度的变化 (凹版印刷) 2、利用网点覆盖率 (平版印刷,凸版印刷等)
调频加网的优势
• 不使用周期性网点结构,不会产生龟纹。 • 不受网角限制,支持多色印刷,再现色域更广。 • 无需考虑网角和挂网系数,可用较低分辨率扫描图像, 图像数据量大为减少。 • 调频网点不规则分布,克服了调幅网点在50%的中间调 发生阶调跳跃的不足,可得到更光洁的阶调。 • 网点细微(10 ~ 40μm),不依赖改变网点大小体现层次, 能以较低分辩率输出。 • 套印精度对色彩和清晰度的影响更小。
避免醒目龟纹的方法:龟纹必然存在,只能尽量减小它 对图像质量的影响。
加大网线角度以减小莫尔纹间距; 四色印刷中网线夹角应不小于22.5°。
常用的网角安排方法:
单色 45 ° 双色 深色 45 °浅色 75 ° 三色 Y 15 °M 75 °C 45 ° 四色 Y 0 ° M 15 °C 75 °K 45 °
安装网屏:注意网屏角度 单色稿都用 45°
确定光圈和曝光时间:
根据原稿的明暗,照明情况,感光片性能 决定
曝光:分三次进行 主曝光使:用中等光圈,时间最长;形成以中间调为主体 的画面,基本确定了阶调再现情况。
辅助曝光 闪光曝光
高光曝光
显影,定影,水洗
晒图 像版
照像机
网点负片
单色印刷品的照像制版工艺
电脑印刷-讲义-真题演练
真题演练1.印刷中“刷”包含()。
(双选)A.印版B.纸?C.色料D.压力『正确答案』C、D『答案解析』根据印刷的定义, “印刷”一词分为“印”包含印版与纸;“刷”包含色料与压力。
2.活字的制作包括拣字、_____、印刷、_____、还字等工序,与现代铜字排版印刷的工序几乎完全一致。
()A.修字B.分色C.排版D.拆版E.校对『正确答案』C、D『答案解析』3.在元成宗时(1297—1298),王祯进一步将活字改良为______,______至此趋向完备。
()A.蜡版活字B.胶泥活字?C.木刻活字D.凸版印刷?E.凹版印刷『正确答案』C、D『答案解析』王祯改良的木活字,采用的是凸版印刷术。
4.公元1234年,崔怡用铸字印刷了_____28本,这是世界上最早的金属活字印刷品。
()A.《本草纲目》B.《心经》C.《易经》D.《详定礼文》『正确答案』D『答案解析』公元1234年,崔怡用铸字印刷了《详定礼文》28本,这是世界上最早的金属活字印刷品。
5.德国人约翰·谷登堡将木刻活字改良为()他在欧洲被称为“印刷之父”。
?A.铁合金活字B.铝合金活字?C.铜合金活字D.铅合金活字?『正确答案』D『答案解析』现代印刷术的创始人是德国的谷腾堡,他发明的铅活字印刷术,将承印方式由“印刷”变为“压印”。
6.彩色桌面出版系统指能够完成图像录入、文字管理、______、版面设计、图文合成、______的桌面处理技术。
()A.图像编辑B.文字处理C.图文输出D.图文管理E.文字校对『正确答案』A、C『答案解析』彩色桌面系统定义是能够完成图像录入、文字管理、图像编辑、版面设计、图文合成、图文输出的桌面处理技术。
7.中国标准书号由标识符ISBN 和13位数字组成,这13位数字分为()部分。
?『正确答案』D『答案解析』标准书号包含5个部分,分别是前缀号-中国组号-出版者号-书序号-检验码。
8.印刷原稿按照内容形式分,可分为线条原稿和()。
印刷工艺 ― DTP
电子分色机
• 用扫描的方式将彩色原稿分解成各 单色版的设备 • 基本工作过程: • 原稿扫描→光学分色(滤色原理) →加网→软片感光→出软片
直接制版系统
• CTP,Computer To Plate • 将计算机处理好的图文信息,通过由计 算机控制的激光束直接记录在印版上, 制成印版 • 特点:CTP省去了输出软片、晒版等过 程。简化工艺流程,减少传递误差,缩 短生产周期;但是版材成本较高
②.灰度级
• 灰度级反映扫描仪从纯黑到纯白之间 平滑过渡的能力 • 灰度级位数越大,扫描层次越丰富, 扫描效果越好 • 目前多数扫描仪的灰度为256级。在 256级灰阶中,呈现出比肉眼所能辨识的 层次还要多的灰阶层次
③.色彩位数(位深)
• 指扫描仪识别色彩的能力和能够描述的颜 色范围,它决定了颜色还原的真实程度。 • 例如:常说的真彩色图像,指的是每个像素 点由三个8比特位的彩色通道所组成,即24 位二进制数表示,红绿兰通道结合可以产生 224=16.67M 种颜色 • 色彩位数越大,扫描图像越鲜艳真实,扫描 的效果越好
1、DTP系统硬件组成
• DTP硬件结构:
计算机主机、输入设备、输出设备、存 储设备、通信设备
• 其中,计算机主机:
是整个DTP系统的核心,多采用PC和MAC计算机 MAC─苹果电脑公司推出的Macintosh麦金托什 机,简称MAC)
⑴.计算机主机
• ①.主板:安放CPU、内存、显卡,连接硬盘、 鼠标、键盘等设备插件; • ②.CPU中央处理器:执行软件命令,在应用软 件和系统软件中均发挥重要作用; • ③.内存(RAM随机存储器):临时存放数据和 程序; • ④.接口:包括并行接口、串行接口、IDE接口、 SCSI接口、USB接口等
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一原稿的输入一、实验类型:验证性实验二、实验目的与任务(1)掌握扫描仪的基本操作;(2)掌握反射及透射原稿扫描输入的参数设定;(3)掌握OCR文字识别技术。
(4)分析不同参数设定下的图像质量和文字识别效果三、实验基本原理1.扫描仪的工作原理自然界的每一种物体都会吸收特定的光波,而没被吸收的光波就会反射出去。
扫描仪就是利用上述原理来完成对稿件的读取的。
扫描仪工作时发出的强光照射在稿件上,没有被吸收的光线将被反射到光学感应器上。
光感应器接收到这些信号后,将这些信号传送到数模(D/A)转换器,数模转换器再将其转换成计算机能读取的信号,然后通过驱动程序转换成显示器上能看到的正确图像。
待扫描的稿件通常可分为:反射稿和透射稿。
前者泛指一般的不透明文件,如报刊、杂志等,后者包括幻灯片(正片)或底片(负片)。
如果经常需要扫描透射稿,就必须选择具有光罩(光板)功能的扫描仪。
2.扫描仪主要的技术指标分辨率:分辨率是扫描仪最主要的技术指标,它表示扫描仪对图像细节上的表现能力,即决定了扫描仪所记录图像的细致度,其单位为PPI(Pixels Per Inch)。
通常用每英寸长度上扫描图像所含有像素点的个数来表示。
目前大多数扫描的分辨率在300~2400PPI之间。
PPI数值越大,扫描的分辨率越高,扫描图像的品质,但这是有限度的。
当分辨率大于某一特定值时,只会使图像文件增大而不易处理,并不能对图像质量产生显著的改善。
扫描分辨率一般有二种:真实分辨率(又称光学分辨率)和插值分辨率。
光学分辨率就是扫描仪的实际分辨率,它决定了图像的清晰度和锐利度的关键性能指标。
插值分辨率则是通过软件运算的方式来提高分辨率的数值,即用插值的方法将采样点周围遗失的信息填充进去,因此也被称作软件增强的分辨率。
例如扫描仪的光学分辨率为300PPI,则可以通过软件插值运算法将图像提高到600PPI,插值分辨率所获得的细节信息要少些。
灰度级:度级表示图像的亮度层次范围。
级数越多扫描仪图像亮度范围越大、层次越丰富,目前多数扫描仪的灰度为256级。
256级灰阶中以真实呈现出比肉眼所能辨识出来的层次还多的灰阶层次。
色彩数:色彩数表示彩色扫描仪所能产生颜色的范围。
通常用表示每个像素点颜色的数据闰数即比特位(bit)表示。
所谓bit这是计算机最小的存贮单位,以0或1来表示比特位的值,越多的比特位数可以表现越复杂的图像信息。
例如常说的真彩色图像指的是每个像素点由三个8比特位的彩色通道所组成即24位二进制数表示,红绿蓝通道结合可以产生224=16.67M(兆)种颜色的组合,色彩数越多扫描图像越鲜艳真实。
扫描速度:扫描速度有多种表示方法,因为扫描速度与分辨率,内存容量,存取速度以及显示时间,图像大小有关,通常用指定的分辨率和图像尺寸下的扫描时间来表示。
扫描幅面:表示扫描图稿尺寸的大小,常见的有A4、A3、A0幅面等。
3.OCR文字识别技术OCR (Optical Character Recognition光学字符识别)技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
主要处理步骤如下:图像输入:需要OCR处理的文件须通过光学仪器,如扫描仪、传真机或其他输入设备,将图像转入计算机。
一般来说,输入设备的分辨率越高,图像越清晰、OCR处理的效率越高。
图像处理:图像处理是OCR系统中须解决问题最多的一个模块,从得到一个不是黑就是白的二值化图像,或灰阶、彩色的图像,到独立出一个个的文字图像的过程,都属于图像处理。
包含了图像正规化、去除噪声、影像矫正等的图像处理,及图文分析、文字行与字分离的文件前处理。
文字特征抽取:特征抽取是OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏。
而特征可说是识别的筹码,简易的区分可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。
而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。
当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。
对比识别:根据不同的特征特性,选用不同的数学距离函数,较有名的比对方法有,欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP),以及类神经网络的数据库建立及比对、HMM (Hidden Markov Model)等著名的方法。
字词后处理:由于OCR的识别率并无法达到百分之百,一些除错或甚至帮忙更正的字词后处理功能,也成为OCR系统中必要的一个模块。
字词后处理是利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。
一般需要为字词后处理建立字词数据库。
人工校正:OCR软件除了图像处理及识别技术可以降低错误率外,人工校正的操作流程及其功能也影响OCR的处理效率,因此,文字影像与识别文字的对照,及其屏幕信息摆放的位置、还有每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能。
四、实验仪器与设备Microtek平面扫描仪,正片透射稿、照片反射稿和印刷品稿各一张、Photoshop,OCR软件五、实验内容通过调整Microtek平面扫描仪的不同参数,扫描不同特点的图像原稿,调整扫描参数,并利用PhotoShop图像处理软件对扫描原稿进行分析比较。
通过调整Microtek平面扫描仪的不同参数,扫描不同类型的文字原稿,调整扫描参数,并利用OCR软件对扫描原稿进行文字识别,并分析提高文字识别率的方法。
六、实验步骤(1)照片原稿的输入a.校正扫描仪;b.扫描原稿、将彩色照片放置到平板扫描仪中,(图像面朝下放入);c.设置图像分辨率为300dpi;设置图像放大率为100%;关掉去网功能;其他选项全部选择自动;采用RGB 位方式;扫描好的图像命名为Photo_A1 存储。
d.设置图像分辨率为300dpi;设置图像放大率为100%;关掉去网功能;其他选项全部手工依据原稿进行设置(如:黑白场定标;清晰度增强等);采用RGB 16位方式;扫描好的图像命名为Photo_A2 存储。
e.设置图像分辨率为300dpi;设置图像放大率为100%;关掉去网功能;其他选项全部选择自动;采用CMYK方式;扫描好的图像命名为Photo_A3 存储。
f.在Photoshop 软件中,把Photo_A1、Photo_A2、Photo_A3 打开,在三个文件中选择5个同样位置的点,用吸管工具吸取颜色值填写在下表中:R G B C M Y K点1 Photo_A1 195 196 197 27 21 20 0 Photo_A2 229 230 230 12 9 9 0 Photo_A3 193 194 196 18 17 15 0点2 Photo_A1 10 85 72 90 57 75 23 Photo_A2 7 124 120 85 42 57 1 Photo_A3 38 87 79 86 43 69 0点3 Photo_A1 35 89 74 85 57 74 21 Photo_A2 5 138 114 82 33 64 0 Photo_A3 30 99 76 88 35 83 0点4 Photo_A1 29 68 64 88 65 72 34 Photo_A2 44 99 77 83 53 76 15 Photo_A3 43 82 63 82 44 85 0点5 Photo_A1 11 58 68 93 73 64 35 Photo_A2 32 84 98 89 64 56 13 Photo_A3 32 67 74 91 58 60 0g.绘制Photo_A1、Photo_A2、Photo_A3 的色阶图如下表中:色阶图Photo_A1Photo_A2Photo_A3h.分析三个文件的异同。
答:Photo_A1、Photo_A2、Photo_A3三幅图像色阶图大致变化一样,而且不同位置的点色相差别不打,只是明度纯度变化。
其中Photo_A1、Photo_A3因为只有扫描方式不同,一个是RGB,一个是CMYK,所以色阶图变化不大,其中同一位置点色相变化不大,只是细微变化。
但是因为Photo_A2采用手动模式,其中亮度改为16,对比度28,饱和度58,还调整了曲线,色阶图有变化,只是变化趋势一样,而且所取点的值与Photo_A1、Photo_A3有较大差别,亮度变大,对比度变大,是因为手动调节的原因。
(2)印刷品原稿的输入a.将精美印刷品(100 线以上)放置到平板扫描仪中,(图像面朝下放入);b.设置图像分辨率为300dpi;设置图像放大率为100%;关掉去网功能;其他选项全部选择自动;采用RGB 方式;扫描好的图像命名为Print_A1 存储。
c.设置图像分辨率为150dpi;设置图像放大率为200%;关掉去网功能;其他选项全部选择自动;采用RGB 方式;扫描好的图像命名为Print_A2 存储。
d.设置图像分辨率为300dpi;设置图像放大率为100%;打开去网功能;其他选项全部选择自动;采用RGB 方式;扫描好的图像命名为Print_A3 存储。
e.设置图像分辨率为300dpi;设置图像放大率为100%;关掉去网功能;其他选项全部根据图像内容手动设置;采用RGB 方式;扫描好的图像命名为Print_A4 存储。
f.选择某一个图像细节,放大300%后,打印在下面的表格中:色阶图Print_A1Print_A2Print_A3Print_A4g.分析四个扫描文件的异同。
答:四个文件色阶图整体变化趋势一样,图像颜色变化一致。
Print_A1、Print_A2只是采用不同分辨率和放大率,色阶并没有太大变化,所以分辨率、放大率对色阶没有很大影响,但是Print_A3,打开了去网功能,整个色阶产生了变化,变化去世不同,所以去网对整个色阶有影响,最后一幅图变化趋势没有变,但是因为采用手动设置,亮度38,对比度-13,调整曲线,所以整个色阶图不是闭合的面积,而是分成一部分一部分,但是整体趋势没有很大变化。