文本素材处理

合集下载

5.1 文本素材的获取与加工

5.1 文本素材的获取与加工

多媒体素材获取与处理
5.1 文本素材的获取与加工
文本视频
图像
声音动画
多媒体素材的处理就是利用各种软件或者数码设备对这些不同类型的素材进行制作、编辑、加工的过程。

文本常见格式
为纯文本格式,或非格式化文本
PDF 为格式化文本文本格式还有RTF 、WRI 、HTML 等
TXT WPS DOC DOCX
便携式文件格式
利用纯文本不含任何格式化信息的特点,我们可以比较方便地实现一些图形表格文字的转换。

例如,将从网页上下载的文本资料通过“记事本”等工具转换为纯文本,然后再导入Word中,会使排版变得轻松快捷。

文本的获取方式
键盘输入的方法
语音输入方法是将声音通过话筒输入计
算机后直接转换成文字的
一种输入方法。

语音输入法在硬件方面要求电脑必须配备能正常
录音的声卡和录音设备,安装语音识别软件。

语音识别软件:VIA Voice,讯飞语音识别系统
联机手写识别输入方法
手写输入法是一种用特制的感应书写笔,在与计算机接口相连的手写板上
书写文字来完成文本输入的方法。

手写笔:有汉王公司的汉王笔、清华紫光笔
扫描仪+OCR识别输入法文本的获取方式
将印刷品类纸张上的文字以图像的方式扫描到计算机中,再用OCR

件将图像中的文字识别出来,并转换为文本格式的文件。

文字识别软件:清华TH-OCR、汉王OCR、尚书OCR、蒙恬识别王、丹青中英文辨识软件
文本处理软件
WORD
WPS
谢谢郑州大学徐春华。

计算机统考文字处理题目

计算机统考文字处理题目

1、打开文件(3-模拟操作题模拟练习的题目2-素材文字处理素材1 e x a m 1 . d o c x ),并按照下列要求进行排版。

(1)将标题字体设置为“华文行楷”,字形设置为“常规”,字号设置为“小初”且居中显示。

(2)将“——陶渊明”的字体设置为“隶书”、字号设置为“小三”,文字右对齐加双曲线边框,线型宽度应用系统默认值显示。

(3)将正文行距设置为25 磅。

操作完成后以原文件名保存。

2、打开文件(3-模拟操作题模拟练习的题目\2-素材文字处理素材\2\exam2.docx),并按照下列要求进行排版。

(1)设置第一段首字下沉。

(2)将第一段(除首字)字体设置为“楷体”,字号设置为“四号”。

(3)将第二段字体设置为“方正舒体”,字号设置为“小四号”,加双横线下划线。

3、打开文件(3-模拟操作题模拟练习的题目\2-素材文字处理素材\3\exam3.docx),并按照下列要求进行排版。

(1)将标题“闲情赋”字体设置为“幼圆”,字号设置为“小二”,居中显示。

(2)将“序——”和“正文——”,字体设置为“隶书”,字号设置为“小四号”,添加项目符号“ ”。

(3)将“序”的正文“左缩进”设置为“ 2 字符”,“行距”设置为“ 17磅”。

操作完成后以原文件名保存。

4、打开文件(3-模拟操作题模拟练习的题目\2-素材文字处理素材\4\exam4.docx),并按照下列要求进行排版。

(1)将正文字体设置为“隶书”,字号设置为“四号”。

(2)将正文内容分成偏左的两栏。

设置首字下沉,将首字字体设置为“华文行楷”,下沉行数为“ 3”。

(3)插入一幅剪贴画,将环绕方式设置为“紧密型”。

操作完成后以原文件名保存。

5、打开文件(3-模拟操作题模拟练习的题目\2-素材文字处理素材\5\exam5.docx),并按照下列要求进行排版。

(1)将标题段(“上网方式比较”)设置为小二号、蓝色、外部阴影(向右偏移)、黑体、倾斜、居中、字符间距加宽2 磅,并为文字添加黄色边框。

素材的收集与整理资料

素材的收集与整理资料

素材的收集与整理在制作可见之前应该对素材进行收集与整理,素材一般有文字、图像、声音、视频、动画、图标、按钮等。

生活中的素材:物理离不开生活,许许多多的素材就来自于我们身边,我们可以利用手中的相机、DV、扫描仪、录音机等记录下生活中的文字、图像、视频等素材。

利用图书馆、音像制品商店等查阅相关资料,通过协议,相互交换、信息共享,租借、拷贝、扫描、购买等方法获得一些必需的珍贵课件素材。

有条件者,与有关单位或专业人员,自己制作一些录音、录像、VCD等教学资料。

利用网络收集素材:在网络种我们可以下载许许多多的素材,在素材收集时一要学会利用搜索引擎,比如:百度、google、搜狗、gougou、Sohu、Yahoo、Sina等。

二是要会下载素材:我们可以利用下载工具flashget、迅雷等工具进行下载。

素材的整理:素材收集后的工作就是对素材进行整理归类。

把素材可以分为一下五类:一、文本素材文字和数学公式经常出现在课件中,比如文字描述、定义概念及某些数学公式等。

正如教师在课堂教学中要使用板书来强调重要的内容一样,在多媒体课件中也用相应的文字内容,以突出课件的主题思想。

对于课件中出现的文字,如果将其进行必要的艺术处理,会使人产生美的感觉,吸引学生的注意力,提高课件的感染力。

1.文字文字素材是以书面语言形式来表达教学内容的,文字不但能向学生准确地提供学习信息,如果与其他素材相结合,还能起到突出主题、画龙点睛的作用。

文字与其他素材相比显得更加正式和有更强的概括力。

WPS、Word、Windows中的“写字板”等许多编辑软件,都可以用来建立和编辑存放文字形式的文件,使用“剪切”或“复制”命令,利用“剪贴板”还可以将文字以位图的形式加以使用,克服了由于各个计算机安装字库不同所带来的麻烦。

文字的编排由字体(字的形状)、字号(字的大小)、字色(字体的颜色)、修饰方式(字的变化)、对齐方式(字的排列方式)、字间距(两字之间的距离)、行间距(两行之间的距离)等构成。

素材的分类与文字素材的准备

素材的分类与文字素材的准备

素材的分类与文字素材的准备多媒体课件中可以使用的信息符号有文本、图形、图像、动画、视频影像、声音和音乐等,这些信息符号称之为多媒体素材。

对这些素材的获取、创作和加工是整个课件编制过程中耗费时间和人力较多的一个环节。

多媒体数据的采集是较为复杂的,一般都要有专门的设备和软件。

不同类型的数据,其采集的方法也不同,借助于各种使用方便、功能强大的多媒体素材创作工具软件,可以使课件编制者以较小的代价取得更优的效果。

制作中涉及的设备、接口、媒体与文件格式众多,耗费的时间较长。

因此,多媒体素材的制作是一项十分繁重和细致的工作。

1.素材的分类根据媒体的不同性质,一般把媒体素材分成文本、声音、图形、图像、动画、视频等类型。

在不同的开发平台和应用环境下,即使是同种类型的媒体,也有不同的文件格式,如文本媒体常见的有纯文本格式(*.txt)、Word文档格式(*.doc),声音媒体有WA V文件格式(*.wav)和MIDI文件格式(*.mid)等。

不同格式的文件用不同的扩展名加以区别。

图28-1列举了一些常用媒体类型的文件扩展名。

图28-1 常用媒体文件扩展名2.各种媒体文件格式简介2.1.声音文件格式2.1.1.W A V格式WA V声音格式文件也叫波形(W A VE)声音文件,它是一种常用的声音文件格式。

W A V 格式直接保存声音的采样数据,数据不经过压缩,所以音质最好,所占磁盘空间也最大。

但大多数压缩格式的声音都是在W A V格式的基础上经过数据的重新编码来实现的,这些压缩格式的声音信号在回放成声音时还要使用W A V格式--只不过我们感觉不到罢了。

2.1.2.MIDI格式MIDI是乐器数字化接口(Musical lnstrument Digital Interface)的缩写。

通俗地说MIDI并不是真正的数字化声音,而是一种乐器符号,记录的是在某个时间的使用音色及声音的长短(相当于一种电脑五线谱)。

当我们播放MIDI音乐的时候,其实就是命令电脑将乐谱演奏出来,而演奏过程就是电脑将各种预先设计的声音元素(称为波形表)按乐谱合成为一首音乐。

2020选考总复习 信息技术 必修2 第三章(1) 媒体的采集与制作(文本、图片、声音素材的处理)

2020选考总复习 信息技术 必修2 第三章(1) 媒体的采集与制作(文本、图片、声音素材的处理)

第三章(1)媒体的采集与制作(文本、图片、声音素材的处理)[考试标准]8.视频素材的处理(1)视频素材的采集(2)视频的基本处理(3)视频文件的输出c一、文本素材的采集与处理1.多媒体作品中文字、数字和符号是一种文本素材的媒体,统称为文本。

2.文本素材的呈现方式:文本方式和图形方式。

3.采集方式可以使用:键盘输入、网络下载、光电输入、语音录入及手写输入。

4.常见的文本素材格式:txt、doc、wps、html等。

二、图形与图像、位图与矢量图的概念1.图形与图像区别:图形是真实物体的模型化、抽象化和线条化的表现方式,而图像则是一个物体原形的真实再现。

2.位图和矢量图的区别位图:由许多点组成,点称为像素(最小单位)。

矢量图:用一组指令集合描述。

类型存储形式特征采集方式文件格式位图以像素的形式存储,图像质量与分辨率有关缩放、扭曲等操作后易失真(模糊),存储容量大、色彩丰富。

生活中的大多数图片是位图使用扫描仪、数码相机、摄像头等硬件设备获取,用画图程序、ACDSee、Photoshop等软件制作BMP、Jpg、Gif、Psd、Tif、Png矢量图以数学公式描述缩放、扭曲等操作后不失真,存储容量小,主要用于工业制图等用Flash、AutoCAD、CorelDraw等软件创作Wmf、Emf三、图片素材的采集方式图片素材的采集方式主要有:扫描仪、数码相机等获取,因特网下载,从图片资料库中选择,以及从视频文件中截取一帧图像。

四、图片素材的加工图像处理软件Photoshop的操作界面:1.图像基本属性设置:包括图像的宽度、高度、分辨率、颜色模式及位深度等基本属性的设置。

可在“图像”菜单中进行修改。

2.常用工具的使用(1)区域选取工具、命令及其功能特点:工具或命令功能或特点相关参数“矩形”、“椭圆”选框工具选取一个规则的矩形或椭圆区域。

(按住Shift键,可选取正方形或圆)羽化:使选区内外衔接的部分虚化,起到渐变的作用,以达到自然衔接的效果(羽化值越大,虚化范围越大)套索、多边形套索、磁性套索工具选择任意形状的区域魔棒工具选取颜色相近区域容差:容差越大,选择颜色的范围越大全选命令选取当前图层画布范围内的所有图像反选(反向)命令选取该图层中未被选取的区域,同时取消已选区域取消选择命令取消已选区域(2)其他常用工具、命令及其功能特点:工具功能或特点移动工具移动当前图层图像或选择区域的图像裁切工具保留选取区域中的图像,未选区域图像被删除吸管工具用来吸取图像的颜色油漆桶工具用来对指定的区域填充前景色文字工具单击工具栏上的“T”按钮,调整好字体、字号、颜色可以在图像编辑区中完成文字的录入及美化缩放工具放大或缩小图像的显示比例自由变换命令对当前图层或当前选定的区域进行缩放、翻转、旋转、扭曲等操作3.图层的基本操作(1)图层就如同含有文字、图像等内容的胶片,一张张按顺序叠放在一起,组合起来形成一张完整的图像,单独对某个图层进行操作,不会改变其他图层的内容。

第二讲_文本素材的采集与处理

第二讲_文本素材的采集与处理

第二讲文本素材的采集与处理本讲目标:1.明确文本素材的五种获取方法。

2.掌握扫描仪的使用方法,会用扫描仪获取大量文本,并能利用文字识别软件对获取的文本进行修改编辑。

重点:获取文本素材的方法。

难点:大量文本的采集—扫描仪扫描文字识别法。

一、五种文本素材的获取方法文本素材的获取有直接获取与间接获取两种方式,直接获取是指通过多媒体教学制作工具软件的文字工具或在文字编辑处理软件中用键盘直接输入或复制,一般在文本内容不多的场合下使用该方式。

间接获取是指用扫描仪或其他输入设备输入文本素材,常用于大量文本的获取。

文本素材的获取方法如下:(1)键盘输入方法键盘输入方法是文本输入的主要方法,使用计算机输入汉字,需要对汉字进行编码,根据汉字的某种规律将汉字用数字或英文字符编码,然后由计算机键盘输入。

汉字有音、形、义三个要素,根据汉字读音的编码叫音码,根据汉字字形的编码叫形码,兼顾汉字读音和字形的编码叫音形码或形音码。

在常用的多媒体教学制作软件中,都带有文字工具,在文本内容不多的情况下,可以直接输入文字,对输入的文字可进行直接编辑处理。

(2)手写输入方法使用“输入笔”设备,在写字板上书写文字,来完成文本输入。

利用手写输入法获取文本的方式,类似于平时我们在纸上写字,但对在写字板上书写的文字要经选择。

手写输入方法使用的输入笔有两种:一种是与写字板相连的有线笔,另一种是无线笔。

无线笔携带和使用均很方便,是手写输入笔的发展方向。

写字板也有两种,一种是电阻式,另一种是感应式。

(3)语音输入方法将要输入的文字内容用规范的语音朗读出来,通过麦克风等输入设备送到计算机中,计算机的语音识别系统对语音进行识别,将语音转换为相应的文字,完成文字的输入。

语音输入方法目前开始使用,但识别率还不是很高,对发音的准确性要求比较高。

(4)扫描仪输入法将印刷品中的文字以图像的方式扫描到计算机中,再用光学识别器(OCR)软件将图像中的文字识别出来,并转换为文本格式的文件。

剧本创作文本模板素材

剧本创作文本模板素材

剧本创作文本模板素材第一场。

(舞台中央,一片昏暗,只有一盏灯光照在一个孤独的人身上。

)。

(音乐响起,人物开始说台词。

)。

主人公,在这个世界上,每个人都有自己的梦想,而我,也不例外。

我想成为一名成功的剧作家,创作出让人心动的故事,让观众们流连忘返。

第二场。

(主人公走进一家咖啡馆,开始思考。

)。

主人公,(自言自语)我需要一个灵感,一个能够打动人心的故事。

但是,我现在却一无所有,连一个好点子都没有。

第三场。

(主人公回到家中,开始翻阅以前创作的一些剧本。

)。

主人公,也许,我可以从以前的作品中找到一些灵感。

或许,我可以重新审视一下自己的创作,找到一些可以改进的地方。

第四场。

(主人公开始动笔写剧本,一遍又一遍地修改。

)。

主人公,创作并不是一件容易的事情,但我愿意付出努力。

我要让我的故事成为观众们心中的经典,成为他们永远无法忘怀的作品。

第五场。

(主人公完成了一部作品,开始寻找出版社或剧团。

)。

主人公,这部作品是我用心血创作出来的,我相信它一定能够打动人心。

我要找到一个能够欣赏它的地方,让更多的人看到它。

第六场。

(主人公得到了一家出版社的青睐,作品即将出版。

)。

主人公,我终于迎来了成功的一刻,我的作品将会面世了。

我要感谢所有支持我的人,他们给了我无尽的力量和勇气。

第七场。

(作品上演,观众们掌声雷动。

)。

主人公,当我看到观众们为我的作品欢呼鼓掌的时候,我知道,我的努力没有白费。

这一刻,让我感到无比幸福和满足。

第八场。

(主人公站在舞台上,接受观众们的掌声。

)。

主人公,这一刻,我将永远铭记在心。

我会继续努力,创作出更多让人心动的故事,让更多的人感动,这就是我作为一名剧作家的使命。

(音乐响起,幕布缓缓落下。

)。

浙江省信息技术学考复习模块6(图像处理部分)

浙江省信息技术学考复习模块6(图像处理部分)

信息技术复习模块6(文本素材的采集与处理&图片素材的加工)【文本素材的采集与处理】多媒体作品中文本的呈现方式主要表现为文本方式和图形方式两种。

文本素材的采集方式主要有键盘输入、网络下载、光电输入(OCR 光学字符识别)、语音输入及手写输入等。

1、以下素材中,不属于文本素材的是 ( )A.一段文字录音B.一个纯文本文件C.一张转化为图形的表格(内含文字)D.一份艺术字标题2、对于某个网页我们需要以文本格式获取其中的某段文字内容,以下操作错误的是 ( )A.采用语音输入的方法将文字内容输入B.采用网页另存为,将文字保存C.采用屏幕硬拷贝的方式获得所需文字内容D.采用将需要的文字选中后复制的方法 【图形与图像】(1)图形:一般指用计算机绘制的由简单的点、直线、曲线、圆、方框等基本元素组成的图片。

通常由图形应用程序来创建,组成图形的各个单元可以单独地被删除、添加、移动或修改,基本组成元素是图元,可用指令对它作为一个整体来加工。

(2)图像:指的是实际景物的映象,它真实地再现了一个物体的原形。

它的最小存储单位为像素。

【位图与矢量图】位图是指用若干二进制位来定义图像中每个像素点的颜色和亮度。

矢量图指用矢量来表示图的轮廓,用数学公式描述图中所包含图形元索的形状和大小。

具体区别如下表所示:3.下列图像文件一般属于矢量图的是 ( )A .标志.cdrB .标志.psdC .标志.pngD .标志jpg4.小明从网上下载一张苹果logo 图片,如第4题图。

关于该图的说法正确的是( )A.可能为位图,通过一组指令集合来描述,放大后图像也不会变模糊B.可能为矢量图,通过排成行列的点(像素)来描述,放大后图像依然清晰C.可能为图像,因为其容易用绘图软件绘制生成D.可能为图形,因为它色彩比较简单,可以用软件绘制而成 5、下列关于位图和矢量图的说法,正确的是( )A .图形和图像都是位图,是真实物体模型化、抽象化和线条化的表现方式B .分辨率越高,图像越清晰,占用的存储空间越大,扫描图像的时间也越长C .位图文件中只记录生成图的算法指令和图上的某些特征点,包含的数据量较小D .矢量图无法产生色彩艳丽、复杂多变的图片,所以一般都不使用 6、用下列方式获得的图像中,属于矢量图的是( )A.用超级解霸截取视频中的单帧图像B.用数码相机拍摄的风景照片C.用Windows 附件中的画图程序绘制的圆D.用Flash 软件中的“椭圆工具”在舞台上绘制的圆 【图像的色彩模式】常见的图像色彩模式有黑白、灰度和RGB 等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章文本素材处理学习指南:本章介绍文本素材采集、编辑、加工处理的有关知识。

主要内容有:文本素材的基础知识,文本素材的采集与处理方法,文本素材创作实例。

学习本章,要求掌握以下知识:掌握文本在计算机中的表示方法,了解文本素材的主要特点;熟悉常见的文本文件的格式,并能正确地选择文本文件的存储格式;了解常用的文本素材采集方式,熟悉扫描仪+OCR文字识别输入方法;了解常用的文字处理软件,掌握Word文字处理的方法;会用相关的文字处理软件制作多媒体作品中需要的文本素材。

在多媒体作品中,文本是最基本也是最常用的素材。

一些说明、介绍、作品中的文字资料都会用到文本,作为多媒体系统的组成元素,它和其它素材同样重要。

文本素材处理包含文本的采集、录入、编辑等加工处理,本章将介绍文本素材处理的相关知识。

2.1 文本素材概述文本是人们早已熟知的信息表示方式,如一篇文章、一段程序、一个文件都可用文本描述。

它通常以字、句子、段落、节、章为单位,记录自然现象、表述思想感情、传达某种信息。

人们在阅读时,通常是一字一句、一行一页顺序地浏览。

文本是文字、字母、数字和各种功能符号的集合。

在现实生活中,人们对事情的讲述、逻辑的推理、数学公式的表述等都主要用文字和数字来准确的表达。

在多媒体应用系统中,虽然有图形、声音、视频影像等多种媒体形式,但是对于一些复杂而抽象的事件,文本表达却有它不可替代的独到之处。

2.1.2 文本素材基础知识在多媒体应用系统中,文本作为重要的基本素材而被广泛应用,它具有信息表达清楚、计算机处理方便、存储容易、传输快捷等优势。

具体来说:(1)编码形式简单在计算机中,西文字符最常用的编码是ASCII码,即American Standard Code For Information Interchange(美国信息交换标准代码)。

它用7位二进制数进行编码,可以表示27即128个字符,其中包括数字字符0~9、大小写英文字符、运算符号、标点符号、标识符号和一些控制符号。

这些字符种类大致能够满足各种计算机语言、西方文字、常见命令的需要。

一个ASCII码字符在内存中占一个字节。

汉字字符在计算机中也是以编码形式处理的,汉字输入用输入编码,汉字存储用机内码,汉字输出用字型码。

在计算机中存储时,一个汉字占2个字节。

(2)易于获取,存储、处理和传输容易多媒体计算机系统中,文本资料可以用多种方式获取,可采用多种输入编码录入,还可以用光电技术或语音识别技术输入。

如果用键盘输入文字,对于一个熟练的文字录入员来说,每分钟可以输入上百个汉字,用光电扫描和语音识别录入,其录入和处理速度更加快捷。

西文字符和汉字在计算机中都是以一个或两个字节的二进制编码表示,占用的空间很小,处理和存储都非常方便,所生成的文本格式文件也很小,一篇十万字的纯中文文本仅占200k左右的空间,移动和传输都很容易。

(3)在多媒体作品中的表现形式丰富为了使文字在多媒体作品中更加美观生动,常将作品中的文字处理成多姿多彩的艺术形式。

各种文字处理软件都具有较强的处理功能,能将文本设置成多种多样的形式,通过对文本字体、字号、颜色、字形(如:加粗、斜体、底纹、下划线、方框、上标、下标等)、字间距、对齐等设置,使文本在多媒体作品中变得丰富多彩。

(4)可以配合其它媒体的应用而提高作品表现力文本具有其它媒体不可替代的重要作用,它除了自身所能完成的表述功能外,还可以配合其它媒体,共同完成对事件的描述,提高多媒体作品的表现能力。

它可以为图片添加说明、为视频添加字幕、为声音解说配上文字注释。

(5)建立超文本链接功能在多媒体应用系统中,可用文本设置超链接。

通过超文本建立的链接关系,实现程序的交互跳转,从而突破传统文本信息表示的线性和顺序结构、建立真正的多种媒体逻辑连接。

例如:在多媒体作品中,文章的标题、导航菜单、按钮中的文本都可以建立对应的超链接,用户可通过点击超链接选择自己需要的信息,这样可满足一些教学软件联想式学习的需要及一些多媒体软件交互式操作的需要。

2.1.2常见文本文件的格式目前流行的文字处理软件种类繁多,不同的软件生成的文件格式各不相同。

当使用不同的文本编辑软件编辑文本时,系统通常会采用默认的文本文件格式来保存文档。

如字处理软件MicroSoft Word XP/2003的默认文档格式为DOC ,当然该软件还支持另外一些流行的文本文件格式。

如TXT 、RTF等等。

下面是比较流行的文本文件格式:(1)TXT格式:是纯ASCII码文本文件,纯文本文件除了换行和回车外,不包括任何格式化的信息,即文件里没有任何有关文字字体、大小、颜色、位置等格式化信息。

Windows系统的“记事本”就是支持TXT文本编辑和存储的文字工具程序。

所有的文字编辑软件和多媒体集成工具软件均可直接使用TXT文本格式文件。

利用纯文本不含任何格式化信息的特点,我们可以比较方便地实现一些图形表格文字的转换,例如,从网页上下载的文字资料一般都包含有格式控制,如果直接下载到Word等字处理环境中,会带有一些不需要的格式符号,常含有表格形式,通过“记事本”等工具,将下载的文本资料转换为纯文本后再导入Word中,会使排版变得轻松快捷。

(2)WRI格式:是W indows系统下的写字板应用程序所支持的文件格式。

(3)DOC格式:是Microsoft Word字处理软件所使用的默认文件格式,其中可以包含不同的字符格式和段落格式。

(4)RTF格式:是Rich Text Format文件格式,是一种可以包含文字、图片和热字(超文本)等多种媒体的文档。

在Macromedia公司的多媒体开发软件Authorware6.0/7.0中就可以直接对RTF格式文档进行编辑,并且通过RTF知识对象对其使用。

另外,在Microsoft Word 字处理软件中也能将文档保存为RTF文件格式。

(5)WPS格式:是金山中文字处理软件的格式,其中包含特有的换行和排版信息,称为格式化文本,通常只在WPS编辑软件中使用。

各种文本格式可以通过一定的方法相互转换,例如:①WPS文档转换为Word文档:常见的WPS文档可以直接在WPS应用程序中转换为Word应用程序使用的DOC格式文档。

操作方法是:启动WPS应用程序窗口,打开要转换的WPS文档,然后选择〖文件〗菜单中的“另存为”命令,打开“另存为”对话框,然后在其文件类型列表选项中选择“Word的DOC文档”,按下【保存】按钮即可转换。

②Word文档转换为WPS文档:在Word 2000应用程序中也可以直接打开WPS文档,方法是:在Office 2000安装盘找到“\PFiles\Common\MSShared\TextConv”文件夹中的WPS 2000转换器程序“Wps2Word.exe”,双击它可以自动为Word 2000安装WPS 2000 转换器。

安装成功后,启动Word 并单击〖文件〗菜单中的“打开”命令时,就会在“文件类型”列表框中找到“WPS DOS file 导入”和“WPS file (*.wps)”选项。

利用这一转换器,可以打开WPS 2000/97 的所有文档,并且会保留原文件的大部分格式信息和嵌入对象。

2.2 文字素材的采集与处理与其它媒体素材相比,文字输入方便、容易处理。

从操作方式上来看,文字采集主要可分为两类方式:自然输入和键盘编码输入。

通过构建OCR文字识别系统和语音识别系统,可以实现文字的自然输入,这是文字输入的最理想和快捷的方式。

但目前技术上还不够完善,还不能完全满足实际需要。

而键盘编码输入则是根据文字的读音或文字的基本结构将文字编成与之对应的数字代码或字母代码输入计算机。

下面将介绍文本信息采集的有关内容。

2.2.1 文本信息的获取文本信息输入、采集的方法主要有以下几类:(1)键盘输入方法:键盘输入法是利用键盘,按照一定的编码规则来输入汉字。

这是最早采用的文本输入方法,也是现在计算机进行文字输入最普遍的方式。

其中,英文字符可以直接从键盘输入,无需编码;汉字输入则必需对汉字编码,可以根据汉字的读音或基本形状用数字或英文字符编码。

常用的有“微软拼音输入法”、“五笔字型输入法”等。

汉字输入法种类繁多,而且新的输入法还在不断涌现,各种输入法各有特点,功能也不断增强。

键盘输入文本的优点是方便快捷,易修改并且不需附加录入设备,缺点是由于使用键盘输入文字通常需要理解和记忆对应的中文输入法的编码规则,因此输入速度较难提高。

对于键盘输入法来说,无论其有多好,都需要使用者经过一段时间的练习才可能达到基本要求的速度,至少用户的指法必须熟练才行,因此现在文本输入新技术正向着自然输入的方向发展。

(2)语音输入方法随着计算机技术的发展,大量信息输入仅仅通过键盘来完成已经不能满足人们的需要,让计算机能听懂人类语言,或是用语音来控制各种自动化系统,是一种最理想的信息输入选择。

语音输入法,是将声音通过话筒输入计算机后直接转换成文字的一种输入方法。

利用语音识别技术,计算机能迅速、自然地把读入计算机的声音信息转换成计算机中的文本。

语音输入法在硬件方面要求电脑必须配备能正常录音的声卡和录音设备,安装语音识别软件。

在调试好麦克风后,即可以对着麦克风进行朗读录入。

如果普通话不标准,可用语音识别软件提供的语音训练程序,进行一段时间的训练,让软件熟悉您的口音后,就可以通过讲话来实现文字输入。

识别软件将录入的语音信号识别转换为数字文本,实现语音文字输入。

目前,语音识别技术整合较好的软件有IBM 公司的VIA V oice , VIA V oice 标志大词汇量、非特定人和连续语音识别技术正在趋于成熟。

国内推出的Dutty ++语音识别系统、天信语音识别系统、世音通语音识别系统等也被广泛使用。

语音输入是通过向计算机发出一个简单的声音命令,控制计算机操作。

如:命令启动计算机中的 Microsoft Office Word 2003应用程序,只需对着话筒说道“开始 程序Microsoft Office Word 2003”,就可以启动对应的应用程序Microsoft Word 2003。

然后进行朗读,计算机在语音识别软件的控制下自动写出对应于语句的文本。

但是,目前大多数语音识别软件构建的语音识别系统是与说话者相关的,还不是一个完善的非特定人识别系统,因此,在需要使用语音录入系统前必须经过反复训练,使计算机熟悉讲话者的语音、语调和节奏等声音特征后再进行语音输入,正确率可达到90%以上,能较准确完成语音输入转换成文本的功能。

语音输入方法的优点是可以快捷、自然地完成文本录入,可减轻用户使用键盘输入的疲劳;缺点是错字率仍然比较高,特别是一些未经训练的专业名词及生僻字,因此要求录入者发音比较标准,还需要先使系统适应录入者的语音语调。

相关文档
最新文档