语言文字信息处理作业

语言文字信息处理作业

学号:2012210466

姓名:李欣颖

一、用国际音标写藏文扎西德勒、新春快乐、祝你开心每一天。

1、扎西德勒[táci ?dèle?]

2、新春快乐[sai44?hue44khuo31lau44]

3、祝你开心每一天[?au55jaw31x?44sai44me31ji55thè44]

二、用超星浏览器查阅《微机中文信息处理》.分析藏文和蒙古文的特征及关系;简述我国多种文字信息处理系统的设计思路并附图

藏文特点:藏文是拼音文字,由30个辅音字母和4个元音符号构成,图10—6所示字体为仿照当时的某些梵文书体。拼写时,辅音字母按其在音节结构中的作用和位置分别称为“基字”、“上加字”、“下加字”、“前加字”、“后加字”和“再加字”,其中前四个构成音节的辅音声母,后两个是辅音韵尾。元音符号不能用,表示i人。的符号写在“基字”上方,表示元音u的符号写在“基字”下方。音符号都不能单成音节,必须和辅音字母拼合(所以习惯上不叫“字母”,叫符号);元音符号的名称和发音不一致。辅音字母都能单成音节.单成音节时,发音都带有元音a,当辅音字母单成音节时,都带有固定的声调:N个读高调,16个读低调,并且其发音就是它的名称。

藏文从左向右横写,“基字‘带“上加字”,“下加字”的复合声母用叠写的方式。音节之间用一小黑点作为分隔符号,分句符号用一垂直竖线,分章节符号为两条垂直竖线,全文或全书结束符号用四条垂直竖线,另外在篇章开头还有专门的起始符号。字体分为印刷体和手写体两大类,形体差别比较大。藏文有统一的正字法,各个方百区又都有一套自己的语音与文字之间的读音规律,因此不同方言的人可以用共同的书面语进行交流。

蒙古文特征:(1)蒙古文有5个元音和29个辅音字母。元音与辅音字母结合比较紧密,有的辅音字母因后续元音的性质不同,采用不同的字母形式。多数字母因处于词头、词中、词尾或单独出现的差别而有不同的变形;在设计荣文信息编码字符集和字母点阵信息字符集时,应该特别重视。

(2)蒙文字母构成单词时,在垂直书写情况下,每个词除了词头和词尾的起笔位置和结笔位置比较自由外,其词头字母的结笔,词中字母的起结笔以及词尾的起笔恢都必须起结于同一中心线位即主干上,互相不间断地笔画连成串,所以,蒙文在显示或打印时,要特别注意到以主干为中心线的连接问题。否则,将难以保证输出字形的质量。

(3)蒙文字母长度不等。通常可分为长、中、短三种类型,其长度比例最少应分为3,2:1。若考虑到字体美观,应分为六种以上比例为宜。这个特点在字形点阵设计时要充分考虑。

(4)蒙文字母并不是构成蒙文字形的最小单元,还可以向下进一步细分为20多种基本字元。利用这些基本字元可以组合拼成全部的蒙文字符。如表10—2所示,一个字母或一个音节可以分解为两个或两个以上的最简字元。我们一方面注意到利用这些字元来组成蒙文,另一方面也注意到实际使用习惯。

(5)蒙文的书写格式不同于西文和汉字的书写格式,其字向是自上而下的垂直方向,行向是自左向右的水平方向。因此,现行的显示设备和打印设备要进行适当的软硬件改造,才能处理蒙文。

多种语言文字信息处理系统的思路:汉语是我国的国语。汉字是国内冬民族共同使用的重要交际工具,显然,少数民族语盲文字信息处理要相汉字信息处理兼容。但要指出的是,一般来讲,少数民族语言文字信息处理只要和汉字编码字符集基本集,即国家标准GB2312—80兼容就可以。了,一般不必和汉字辅助集兼容。事实上,根据我国各民族文字字符集数量少的特点,其编码字符集号可分为小字符集、中字符集和大字符集三大类。

相关文档
最新文档