中文电脑的汉语语音输入系统及其方法与制作流程
利用话筒在Word中输入文字(语音识别)

利⽤话筒在Word 中输⼊⽂字(语⾳识别)利⽤话筒在Word 中输⼊⽂字(语⾳识别)2007-08-27 18:04对于打字不太快的同志们,这是⼀个⾮常不错的。
(即微软Office 中的语⾳识别)如何安装语⾳识别本部分介绍如何安装语⾳识别。
如何确定是否安装了语⾳识别引擎要确定您的计算机是否安装了语⾳识别,请按照下列步骤操作:1.单击开始开始,单击控制⾯板控制⾯板,然后双击语⾳语⾳。
2.找到语⾳识别语⾳识别选项卡。
如果语⾳识别语⾳识别选项卡在语⾳属性语⾳属性中可⽤,则表明安装了语⾳识别引擎。
如果不可⽤,则表明该引擎没有安装。
如何从 Microsoft Word 2002 中安装语⾳识别1.启动 Microsoft Word 。
2.在⼯具⼯具菜单上,单击语⾳语⾳。
现在,语⾳识别在所有 Office 程序和其他启⽤它的程序(如Microsoft Internet Explorer )中都可⽤。
如何使⽤“添加或删除程序”安装语⾳识别1.单击开始开始,单击控制⾯板控制⾯板,然后双击添加或删除程序添加或删除程序。
2.单击“更改或删除程序”,单击Microsoft Office XP ,然后单击更改更改。
3.单击“添加或删除功能”,然后单击下⼀步下⼀步。
4.在“要安装的功能”下,双击Office 共享功能共享功能。
5.双击中⽂可选⽤户输⼊⽅法中⽂可选⽤户输⼊⽅法,单击语⾳语⾳,单击下箭头,然后单击“从本机运⾏”。
6.单击更新更新。
现在,语⾳识别在所有 Office 程序和其他启⽤它的程序(如 Internet Explorer )中都可⽤。
如何作为⽂字服务添加语⾳识别安装时,语⾳识别⼀般⾃动作为⼀种⽂字服务被添加上。
只有当您把语⾳识别作为⽂字服务删除后⼜想添加它时,才需要使⽤此过程。
若要作为⽂字服务添加语⾳识别,请按照下列步骤操作:1.单击开始开始,单击控制⾯板控制⾯板,然后双击“区域和语⾔选项”。
2.在语⾔语⾔选项卡上,在“⽂字服务和输⼊语⾔”下,单击详细信息详细信息。
汉字电脑声韵输入法的制作方法

本技术公开了一种以汉语拼音为基础,简单易学的汉字电脑输入方法。
其取码规则为:第一码从《电脑声母表》中取其声母代码,第二码从《电脑韵母表》中取其韵母代码,第三码从《声码表》中取其声码代码作为识别码。
词语连写则用四码。
同时,用大小写控制键决定输入汉字的字型,即大写字母输入非左右结构型单字,小写字母输入左右结构型单字及所有的词语连写,该输入法有利于提高操作者的输入速度和普通话读音水平。
技术要求1.一种汉字电脑输入方法,单字部分从《电脑声母表》中取其声母代码作为第一码,从《电脑韵母表》中取其韵母代码作为第二码,再从《开头笔画及边旁声码表》中取其声码代码作为第三码(识别码),词语连写则用四码,即组成汉字电脑声韵输入码。
2.根据权利要求1所述的电脑声韵输入码,其特征在于:由大小写控制键(CapsLock),决定输入汉字的字型,大写字母输入非左右结构字型的单字,小写字母输入左右结构字型的单字及所有的词语连写。
3.根据权利要求1所述的电脑声韵输入码,其特征在于:《电脑声母表》字母与声母完全一比一对应,是以25个英文字母分别代表声韵拼音方案中的声母,除y迂、f佛、b玻、p坡、m摸、d得、t特、n讷、l勒、j基、q欺、x希、g哥、k科、h喝、r日与《汉语拼音方案》一致外,《电脑声母表》还安排e(虚声母)i衣、u乌、z知、c蚩、s诗、v资、w雌、a思九个声母(见表一)。
4.根据权利要求1所述的电脑声韵输入码,其特征在于:《电脑韵母表》用26个英文字母系以组来安排字母,O(喔约组)、e(鹅耶组)、a(啊蛙组)、i、j、l(衣组)、b、h、k(安弯组)、g、p、q(鞥翁组)、y、u(迂乌组)、r、s(欸威组)、x、t(哀歪组)、v、w(欧优组)、c、d(熬腰组)、n、m(恩温组)、f、z(昂汪组)分别代表声韵拼音方案中的韵母(见表二)。
5.根据权利要求1所述的电脑声韵输入码,其特征在于:《开头笔画及边旁声码表》是以26个英文字母分别代表所有汉字开头笔画及边旁声码,具体对应(见表三)。
单手组合键中、日文语音输入、中文汉字输入、及助说设备的制作流程

通过单手组合键输入方式,两次(或一次)组合击键即可输入一个中文汉字的发音(带有四声),并通过发声装置将其说出。
本装置可以帮助不能说话的聋哑人“说”出汉字的发音,增强其与正常人交流时的表达能力。
此输入方法和装置也可以帮助正常人更快捷地单手输入汉字。
此外,在日文输入方式下,本设备一次组合击键可输入一个日文的发音(及对应假名),并通过发声装置将其说出。
技术要求1.一种通过单手组合键方式,输入中文语音、日文语音及对应假名、中文汉字并通过发声装置将对应语音说出的设备,包括具有单手操作,用来输入中、日文语音的组合键盘,编码存储、微处理器、语音芯片、发声装置及辅助装置;其特征在于该组合键盘由拇指控制两个键,食指控制四个键,其余三指每个手指分别控制三个键,可进行带有四声的中文汉字读音、日文读音及汉字的输入。
2.根据权利要求1,其特征在于使用单手操作的组合键盘输入中文汉字的读音时,食指控制的四个键,负责四声的输入;拇指控制两个键,其余三指每个手指分别控制三个键;拇指与这三指的组合分别输入声母和韵母。
3.根据权利要求1、2,其特征在于通过两次组合击键,分别输入汉字的声母和韵母及四声,完成中文汉字读音的输入;其输入方法为:先输入声母,拇指操作的按键与除食指外的其他三只手指中操作的按键组合按键;再输入韵母,食指负责四声的输入,同时拇指与其他三指中其中的一指组合输入韵母,从而完成带四声的汉字语音输入;对于仅有韵母发音的汉字,只需一次组合按键输入相应韵母及其四声,即完成该汉字语音输入。
4.根据权利要求1,其特征在于使用单手操作的组合键盘输入日文发音时,拇指与食指的组合击键输入辅音,同时另三指中的某一指按键输入元音,这样一次组合击键即可输入一个日文的发音及与之对应的假名。
5.根据权利要求1,其特征在于在输入中文汉字的读音后可以从相应的读音中选择相应的汉字输入。
6.根据权利要求1,其特征在于本设备根据输入的组合键编码查询对应的中文或日文语音在语音芯片中的地址,语音芯片输出相应的语音信号,并通过扬声器或耳机输出。
关于怎样用word进行语音录入文字

关于怎样用word进行语音录入文字word语音录入文字方法语音输入下载官方电脑版的搜狗输入法,并将输入法转化为搜狗拼音输入法(注:其工具箱的小工具需要在联网的状态下使用哦)。
打开Word或其他输入文本的软件,点击“工具箱”,选中“语音输入”。
Word出现语音输入的界面,最好先停止语音输入,选择需要语音录入的位置后再点击开始语音录入。
注:语音输入功能需要麦克风,因此要保证电脑有自带的麦克风或者单独外接麦克风并让麦克风为打开状态。
同时,语音输入时最好说普通话,提高识别率。
调整麦克风的方法如下GIF:首先选中“开始”点击鼠标右键,选中“运行”,输入“mmsys.cpl”,即可对麦克风进行调整。
跨屏输入(需要在手机上下载搜狗输入法)点击“工具箱”,选中“跨屏输入”后,出现一个二维码的界面,打开手机的搜狗输入法,在“键盘选择”中选中“跨屏输入”。
扫描电脑呈现的二维码。
电脑确认连接后,将光标放置在输入文本的位置,在手机上点击语音输入即可。
用Word进行语音录入文字语音输入功能添加完成后,系统智能化地弹出要求进行语音识别练习的对话框,戴好耳麦,并调整好话筒与嘴之间的距离和位置(经笔者测试,话筒与嘴之间的距离以8cm左右最为合适),然后跟着向导,一步一步完成语音识别练习工作。
打开“微软拼音输入法”(语音输入,其实是“微软拼音输入法”和Microsoft Office结合的产物),依次选中工具栏上的“麦克风”和“听写模式”按钮,进入听写模式,将光标定位在文档中合适位置上,对着话筒说出你要输入的内容就可以了。
注意:如果觉得前面的语音练习效果不太好,可以重新测试:进入“控制面板”,打开“语音属性”选项,单击其中的“训练配置文件”按钮,即可重新进行语音练习,直到识别效果满意为止。
Word办公软件常用实用技巧微软的Word办公软件,是我们日常工作生活中经常用的一款文档处理软件。
那么,我们在使用Word办公软件时,该如何有效提高我们的工作效率呢?今天,office办公达人网就为各位带来Word办公软件使用中,可以快速操作的八个使用技巧。
教你处理win7系统利用讯飞语音输入法实现电脑语音输入的处理技巧

教你处理win7系统利用讯飞语音输入法实现电脑语音输入的处理技巧win7旗舰版系统是许多系统高手都选择使用的电脑系统,然则我们在操作过程中或者会遭遇到对win7系统利用讯飞语音输入法实现电脑语音输入进行处理的境况。
不少用户计算机技术都是菜鸟水平,对于win7系统利用讯飞语音输入法实现电脑语音输入的情况,无法自行解决。
很多用户都来和小编筹商win7系统利用讯飞语音输入法实现电脑语音输入该怎样解答?的确我们遵守以下规则1、在常用设置菜单里面点击“设置”命令,在弹出的设置对话框中点击“语音设置”命令;2、我们可以选择普通话、粤语、英文进行输入。
如果用户不喜欢输入法在每句后面自动加注标点,还可以勾选上“忽略末尾句号”命令。
就可以搞定了。
然后就和技术编辑一起观看关于win7系统利用讯飞语音输入法实现电脑语音输入整个的使用方法:推荐:的识别率非常高,稳定性相当不错,可作为长篇文档输入的辅助工具来用,比如写文章、写论文等等,累了的时候就可以语音进行了,但是目前它的稳定性不佳,识别速度也有待增强。
点击工具栏中的“语音输入”按钮,在弹出的对话框中说出语音,很快就可以显示出对应的文字信息了。
1、在常用设置菜单里面点击“设置”命令,在弹出的设置对话框中点击“语音设置”命令;2、我们可以选择普通话、粤语、英文进行输入。
如果用户不喜欢输入法在每句后面自动加注标点,还可以勾选上“忽略末尾句号”命令。
3、讯飞语音输入框长时间不用的话,会自动消失,要想使用就需要再次点击启用。
如果需要长时间进行语音输入,可点击工具栏中的“常用设置→语音悬浮窗”,让它长期显示在桌面上。
上面跟大家介绍的就是关于Windows7系统下利用讯飞语音输入法实现电脑语音输入的方法,感兴趣的用户就可以参照上面的方法进行操作,这样就可以实现电脑语音输入了。
以上就是关于win7系统利用讯飞语音输入法实现电脑语音输入的操作方法,还有不知道怎么解决的小伙伴赶快来学习一下吧!希望对大家有所帮助。
中文电脑的汉语语音输入系统及其方法[发明专利]
![中文电脑的汉语语音输入系统及其方法[发明专利]](https://img.taocdn.com/s3/m/2dbbe5f9a76e58fafbb0032f.png)
专利名称:中文电脑的汉语语音输入系统及其方法专利类型:发明专利
发明人:李琳山
申请号:CN94102358.3
申请日:19940303
公开号:CN1107981A
公开日:
19950906
专利内容由知识产权出版社提供
摘要:一种汉语语音输入系统及其方法,用以将任意文 句的汉语语音直接转换成相应的中文文字,该系统及 其方法包括声音处理过程及语言解码过程两大部 分。
其特征在于声音处理过程利
用“段落统计模型” 计算输入汉语语音的各单音节及声调的机率,进而辨 识之;语言解码过程针对声音处理过程送来的一连串 音节利用“词类双连中文语言模型”找出对应的中文 字。
一种包含“智慧型学习技术”的汉语听写机,用本 方法将语音输入转换成文字显示。
申请人:李琳山
地址:中国台湾
国籍:CN
代理机构:中国专利代理(香港)有限公司
更多信息请下载全文后查看。
中文文本汉语拼音自动产生系统设计方案

2019年软 件2019, V ol. 40, No. 9作者简介: 侯雨铃(1998–),女,本科,研究方向:计算机语音自动标记。
中文文本汉语拼音自动产生系统设计方案侯雨铃(北京工业大学,北京 100080)摘 要: 汉语中有1000多个多音字,正确的判断多音字并进行注音,是计算机拼音合成的难点之一。
为了实现对多音字的自动识别标注,采用最大向前匹配、最大向后匹配法对词句进行分词处理。
再构建条件概率表,对多音字进行整理归类。
最后系统的进行注音。
通过《中文拼音词典》模块、文本分词模块、《汉字条件概率表》模块、《汉字条件概率表》计算模块、自动产生文本拼音模块构成拼音自动生产系统。
关键词: 中文文本;汉语拼音;自动生产系统设计中图分类号: TP391 文献标识码: A DOI :10.3969/j.issn.1003-6970.2019.09.033本文著录格式:侯雨铃. 中文文本汉语拼音自动产生系统设计方案[J]. 软件,2019,40(9):144 147Chinese Text Chinese Pinyin Automatic Generation System DesignHOU Yu-ling(Beijing University of Technology, Beijing 100080)【Abstract 】: There are more than 1000 polyphonic words in Chinese. Correctly judging multi-sounding words and making phonetic transcriptions is one of the difficulties in computerized pinyin synthesis. In order to realize the automatic identification of multi-tone words, the maximum forward matching and maximum backward matching method are used to process word segmentation. Reconstruct the conditional probability table and classify the poly-phonic words. Finally, the system performs phonetic transcription. Through the “Chinese Pinyin Dictionary” module, text segmentation module, “Chinese character condition probability table” module, “Chinese character condition probability table” calculation module, automatically generate text pinyin module to form a pinyin automatic produc-tion system.【Key words 】: Chinese text; Chinese pinyin; Automatic production system design0 引言在生活中,我们经常会遇到一些不认识的字或不知道准确读音的字,可是却很少有人会真正地去查它的读音。
电脑语音系统操作手册

电脑语音系统操作手册电脑语音系统操作手册X Z 音系y操作手电脑语音系统操作手册一. 主面精I股份有限公司(1) Y料@示:. 模MB : @示目前路使用B。
. 模M : @示目前所操作的模M。
. M入rg : @示使用者M入系yrg。
. 使用rg : @示目前使用者使用的rg。
. e` : @示按Ie`-操作e`Y。
. 路B : @示路操作B。
电脑语音系统操作手册(2) 系yY :. 路盗: @示Z音卡可接盗俊 . 路使用: @示目前路使用量。
. 路量: @示目前每小r最大路樟俊 . 樟: @示目前樟俊 . 芡饩路: @示目前外茈盗俊 . 未接通: @示目前外茈未接通盗俊 . 接通: @示目前外茈接通盗俊 . 待盗: @示目前所要外艿盗俊(3) O定:. 振次: O定系y在用綦苋脶嵯日疋茁後再接起。
. 重}j : O 定缺席外茈重}jrg。
. zy回: O定外茈回状吾⒋艘o人接。
. 缺席: O定缺席外芊绞尽(a) 按I : O定使用者必按庸δ苕I才能印电脑语音系统操作手册(b) 定r : O定每天固定rg印. 上午: O定上午rg。
. 下午: O定下午rg。
. 晚上: O 定晚上rg。
每外r段有三子r段重}外苌子r段未j上的。
例如: 上午r段10:30 t下一子r段榇rg加上重}jrg : . 10:30 . 11:30 . 12:30. Z音n及Y料So : O定每天定r共同留言,W生人留言n 家L留言n以及Y料熨Yh除掉。
(a) rg : O定每天rg。
(b) 保留天: O定n案保留天怠电脑语音系统操作手册(4) 功能I. : 尤毕外茈。
如果使用者O定定r拥脑,此功能I 就o法使用。
. h除: 使用按I直接作Z音n及Y料So。
. 存n : ⒛壳暗脑O定Y料存入*****E.DAT 中。
下次系y再r⑹褂眯碌脑O定值。
. Y料: M入Y料炀So程序。
. Y束: Y束系y操作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种汉语语音输入系统及其方法,用以将任意文句的汉语语音直接转换成相应的中文文字,该系统及其方法包括声音处理过程及语言解码过程两大部分。
其特征在于声音处理过程利用“段落统计模型” 计算输入汉语语音的各单音节及声调的机率,进而辨识之;语言解码过程针对声音处理过程送来的一连串音节利用“词类双连中文语言模型”找出对应的中文字。
一种包含“智慧型学习技术”的汉语听写机,用本方法将语音输入转换成文字显示。
技术要求1、一种汉语语音输入方法,用以将任意文句的汉语语音直接转换成相对应的中文文字,该方法包括声音处理过程以及语言解码过程两大部分,其特征在于,该声音处理过程利用“段落统计模型”计算输入汉语语音的每一音节以及声调的机率,进而辨识之;该语言解码过程针对该声音处理过程送来的一连串音节,以“马可夫中文语言模型”找出所对应的中文字。
2、根据权利要求1的方法,其特征在于,其中该“马可夫中文语言模型”是以“词”为基础,但以“字”来计算机率的“马可夫中文语言模型”。
3、根据权利要求1的方法,其特征在于,其中该以“词”为基础,以“字”来计算机率的“马可夫中文语言模型”系将输入的音节串所对应的同音字一一分割为若干个词,但根据两两相连的词之间相连的词头字及词尾字相连出现的机率,并比较每一个词出现的频率及前后文关系判断该音节的字。
4、根据权利要求1的方法,其特征在于,其中该“段落统计模型”的训练方式包含下列步骤:(1)若某一单音节α的总长度为T个音框,则将该单音节分为N段,每一段含有T/N个音框;(2)使用者重覆念该单音节数次,长度虽不尽相同,但同样等分成N段;(3)将所有上述单音节的第一段音框的特征向量合在一起,训练成第一段的状态;(4)将所有上述单音节的第二段音框的特征向量混合在一起,训练成第二段的状态,依此类推,训练出N个状态;(5)上述每个状态以M个高斯机率混合来描述,以上述音框的特征向量训练各个高斯机率的参数;和(6)上述M个状态即构成该音节α的“段落统计模型”。
5、根据权利要求4的方法,其特征在于,其中该“段落统计模型”训练法尚包含“分段共用”训练法,该方法系将输入之单音节分为N段,该N段的前面几段描述声母部分,后面几段描述韵母部分,因此可利用此两部份分别训练其他有相同声母或韵母的单音节的相关声母与韵母各段的状态。
6、根据权利要求4的方法,其特征在于,其中该“段落统计模型”的辨认方法包含下列步骤:(1)使所有的408个基本单音节都训练成“段落统计模型”;(2)将输入的未知音β分成N段;(3)该N段中的每一段的每一个音框的特征向量分别代入某个音节的“段落统计模型”的该段状态的M个高斯机率混合中,以计算机率;(4)将各段的机率相乘,即得到该未知音β相对于上述音节的“段落统计模型”的机率;和(5)依上述方法计算该未知音β相对于所有408个基本单音节的“段落统计模型”的机率,比较后机率最高的“段落统计模型”所对应的基本单音节,即是辨识结果。
7、根据权利要求1的方法,其特征在于,其中该“中文语言模型”尚可用于部份更正声音处理部分的错误。
8、一种训练汉语语音辨认系统迅速学习新使用者的声音的训练方法,用以训练一汉语语音听写机,以辨认新使用者输入的汉语语音,该方法须先以很多位不同的语者所发语音来训练每一个单音节的涵盖各种不同语者的可能的声音特性的“段落统计模型”;其步骤包括:(1)以“段落统计模型”训练法建立很多不同的语者发出某一单音节的“段落统计模型”,因许多位语者声音特性各不相同,故常需很多个高斯机率混合才能描述每一个状态;(2)以某一个新使用者发出同一单音节,然后自上述很多位使用者的“段落统计模型”的许多高斯机率混合中找出最接近该某一新使用者声音的那几个高斯机率混合,而把其他的高斯机率混合抛弃,即建立出此一新使用者的“段落统计模型”;(3)当新使用者继续发出同一单节时,此一新发的单音节的分段特征向量就可以再平均进入在步骤(2)所求的新使用者的“段落统计模型”中,算出新的高斯机率混合,而得到新的“段落统计模型”;和(4)重覆步骤(3)的方法,新使用者的声音在“段落统计模型”中的成份于是越来越多,即可得更精密的描述新使用者声音的“段落统计模型”。
9、根据权利要求8的方法,其特征在于,该方法还包括随时于电脑屏幕上联机更正电脑辨别错误的声音的步骤,并将此结果立即送入一存储器中,并当场重复所述的步骤(3)(4),使得机器亦即学到新的声音,下次再辨认就用新的模型,从而正确率达到不断提高。
10、一种用以听写汉语文句的汉语听写机,其特征在于包括:一滤波及模/数转换器,以将语音输入信号滤波及转换为数字信号;一个人电脑及附加数字信号处理电路板,用以接收该转换器送来的数字信号而加以处理;一特征求取器及一基频检测器与该个人电脑相连接,用以检测及计算由该个人电脑所收到的数字信号的基频及其他多种特征;一段落统计模型处理器,配合高斯机率混合处理器,以计算每一音节的端点,并辨认其基本单音节及声调;一以“词”为基础,但以“字”来计算机率的马可夫中文语言模型处理器,以计算输入语音音节的各个同音字、词的机率,并将辨认结果送回该个人电脑;一训练装置用以训练出所有基本单音节及声调的“段落统计模型”的机率数值以及“马可夫中文语言模型”的机率数值,然后将此数值送入该个人电脑。
11、根据权利要求10的汉语听写机,其特征在于,其中语音输入系以断开的单音节为单位。
12、根据权利要求10的汉语听写机,其特征在于包括一荧光屏,用以显示输入的注音符号及中文文字以及方便的改正错误的软件,以便使用者可以直接用鼠标器在荧光屏上改正错误,完全不需用到键盘。
13、根据权利要求10的汉语听写机,其特征在于包括一动态存储装置,用以暂存使用者之语词和习惯用语或所输入的某一段文字中反覆出现的特别语词,并根据该语词的出现频率,存储于不同的存储器中,这些语词及其信息可以并入听写机的整体中文语言模型中,也可以在事后清洗掉。
14、根据权利要求13的汉语写机,其特征在于,其中该动态存储装置还包括一常用词存储器和一罕用词存储器,该听写机操作时原则上只在该常用词存储器内找词,找不到时才到该罕用词存储器内寻找,并将找到之罕用词存入该常用词存储器内;该常用词存储器内存储之常用词若久不使用,即移入该罕用词存储器中。
15、一种训练汉语听写机学习新使用者声音的方法,其特征在于包括数段学习步骤,每一段步骤须由新使用者各念一段经特别设计的例句,该组例句不但以最少的字句包含所有汉语语音的基本单位音(例如声母、韵母、单音节等),并使常出现的单位音多出现几次故多念几次,可以把“段落统计模型”训练得更精确,通过反覆练习该组例句,而使该汉语听写机习惯新使用者的各种发音方式,并将该发音方式记录起来。
16、根据权利要求15的方法,其特征在于还包括一联机学习步骤,该步骤可在做学习训练时或正式使用汉语听写机期间进行,使用者随时更正该汉语听写机所显示辨认错误的声音或文字,使该听写机随时学习正确的语音及语词,并将更正的语音对应文字内容存储起来。
17、根据权利要求15的方法,其特征在于还包括一自动学习环境噪音的步骤,此步骤系与权利要求8的(3)、(4)两步骤所描述的学习新使用者的声音的步骤同时进行,让新使用者的环境噪音也自动被平均进去成为“段落统计模型”的成份,以使该汉语听写机熟悉学习环境的噪音。
18、根据权利要求15的方法,其特征在于,汉语听写机学习新使用者声音的例句,系由电脑由语料库中选出,系先将所有的汉语基本单位音给予不同的分数,同一句子中所包含的不同基本单位音愈多,则其分数愈高,愈会优先选出,并利用一参数描述各个基本单位音出现的频率分布,从而使用此参数作为选句的基础。
说明书本技术是关于一种智慧型汉语语音输入方法及汉语听写机。
本技术是同一技术人的台湾专利申请案第78105818号的改良,利用此改良方法,或使得利用汉语语音输入中文文字的方法更为精确。
目前中文电脑的输入方法百家争鸣,或用注音,或用字根,或用划笔,但没有一种是众所公认最好的(因为没有一种真正最方便)。
这是因为有的输入速度较慢,有的需要特别训练,有的方法特别要背口诀,久了不用会忘掉等,而人人都会、不需训练的注音符号法,则因其速度太慢,而无法通行。
在众多中文输入法中,速度最快的是仓颉法、大易法或类似的方法,但此方法却只有专业人员在长期训练下才会用,一般人不常用就会忘掉。
事实上,这是现阶段我国社会信息化最大的障碍,因为“中文输入”变成一种专门职业,一般人自然不会常用它。
这些方法不方便的基本原因,是尝试把汉字转成几个按键,由键盘输入;但事实上键盘是西方拼音文字下的产物,汉字不是拼音文字,所以由键盘输入就自然不方便了。
既然键盘输入不方便,还有什么其他方法可用呢?很多人很早就想到了可用声音输入。
只是用声音输入的技术困难太多,几乎是不太可能的事,所以一直没有这方面的方便产品问世。
技术上困难的原因有三点:(1)需要辨识的词汇太多了,中文常用字至少五千个,常用词至少十万个,这种数字已超出技术可行的范围;(2)中文字的同音字太多,即使知道是什么音,又如何能方便而快速无误地知道是什么字呢?(3)要能“即时”听写汉语,就必须在极短时间内解决如此困难的问题,更是不容易。
本技术人的美国专利第5,220,639号专利申请案基本上已可以解决上述困难,这是因为:(1)选用汉语单音节为单位:中文字、词的数目虽大,不同的单音节却只有1300个,是语音辨认技术上可以接受的范围;知道是什么音节以后,可以再由其前后的音节去判断可能构成什么词、什么句。
(2)藉助以中文字为基础的马可夫模型建立中文的语言模型,可以靠大量的训练文字,统计出每一个字的前后与其他不同的字衔接的机率,由这些机率可以算出当一个音节前后与其他音节衔接时,这些音节最可能是代表什么字,这种方法可以大部分解决同音字的问题,不能解决的再在荧光屏上予以更正。
(3)制作特殊设计的硬件,以便在最短时间内完成复杂的工作。
然而,前项申请案的技术基本上虽已可决上述困难,但有其先天上的限制:(1)所需运算量极大,为了要达到“即时”听写汉语的目的,亦即在很短时间内完成极大量运算,必须制作特殊设计的硬件,使得该技术代价昂贵,(2)正确率仍不够高(约89%),使用者仍需一再更正错字。
这两项限制是至今它并没有成为产品大量上市的原因。
本技术中,就是考虑到前项专利案的上述限制,便在原有的构想下发展出两项重要的新技术:(1)专门针对汉语单音节的特性,发展出专门作汉语单音节辨识的“段落统计模型”及(2)专门针对中文的语言结构,发展出“词类双连中文语言模型”。
这两项技术都是针对中文及汉语的特性发展出来,结合起来以后,所需的运算量大为减小,而正确率却可大为提高。