IME原理及输入法编程
什么是MBIME进程

什么是MBIME进程?
MB是码表(词库)的意思,IME是微软的IME输入法机制(模式),在Win9X、WinXP等32位操作系统盛行年代,输入法运行文件的扩展名为IME,输入法词库文件的扩展名是MB。
所以说MBIME就是“IME机制输入法码表”进程的意思。
IME 是输入法编辑器(Input Method Editor) 的英文缩写(IME),它是一种专门的应用程序,用来输入代表东亚地区书面语言文字的不同字符。
输入法运行为多线程,在新的Win7系统中,如果打开多个应用程序让输入法加载,那么每多出一个应用程序,就会多出一个MBIME 进程,这是Win7新版不能理想兼容WinXp程序的缘故。
(在Win7下,CTFMON.EXE这个Xp中管理输入法的程序已放弃不用,而传统输入法的接口多是按Xp中编程接口来写的,在新系统下就出现了这个重复的MBIME进程──不碍事有点烦)
64位引进了TSF机制,由于软件向下兼容的公约,IME机制仍然会被长期兼容。
Xp下的32位全拼、双拼、郑码输入法,以及广泛使用的86王码五笔、极品五笔、念青五笔、海峰五笔输入法,在Win7下使用时,都会产生MBIME进程。
对于MBIME进程,因为符合旧的IME机制,瑞星、卡巴斯基、金山、360等等安全软件,都不会做木马或病毒提示的(如果谁提示木马或病毒,那就惹出笑话,意味着自身的不专业)。
手写输入法的原理

手写输入法的原理
手写输入法是一种通过手写识别技术将用户的手写字符转化为计算机可以识别的文本的输入方式。
其原理基于以下几个步骤:
1. 采集手写数据:手写输入法需要先采集大量不同用户的手写字符样本数据,包括不同字母、数字、标点符号和其他特殊符号等。
这些手写数据会用于训练模型,使其能够识别出用户输入的手写字符。
2. 预处理:在输入手写字符之前,输入法会先对输入进行一些预处理操作,例如去除噪声、调整输入的大小和方向等。
这样可以提高后续的手写字符识别精度。
3. 特征提取:接下来,手写输入法会对预处理后的手写字符进行特征提取。
常用的手写字符特征包括笔画的形状、方向、长度、起始点和结束点等。
这些特征将有助于后续的手写字符识别过程。
4. 字符识别:使用训练好的模型和提取的特征,手写输入法会通过一系列算法和模式匹配技术来识别手写字符。
这些算法和模式匹配技术包括神经网络、决策树、支持向量机等。
手写输入法会将用户输入的手写字符与训练数据中最相似的字符进行匹配,从而确定输入的字符是什么。
5. 输出:最后,手写输入法将识别出的手写字符转化为计算机可以识别和处理的文本。
这些文本可以用于各种应用,如文档编辑、聊天应用、搜索引擎等。
需要注意的是,手写输入法的准确性受多种因素影响,包括用户手写的质量、训练数据的丰富程度以及识别算法的效果等。
为了提高手写输入法的准确性,需要不断优化算法模型,并且随着用户的使用,逐渐加入用户的手写习惯和个性化样式。
imemeditor 使用方法

imemeditor 使用方法
IME 编辑器(IME Editor)是一个用于编辑和管理输入法(IME)的工具。
它通常用于自定义和配置输入法,以满足用户的特定需求。
以下是IME 编辑器的基本使用方法:
1. 打开IME 编辑器:根据你使用的操作系统和输入法,找到相应的IME 编辑器。
在Windows 上,你可以在“控制面板”中找到“区域和语言”选项,然后点击“输入法”来打开IME 编辑器。
2. 选择输入法:在IME 编辑器中,你可以看到已安装的输入法列表。
选择你想要编辑的输入法。
3. 编辑输入法设置:一旦选择了输入法,你可以对其进行各种设置的编辑。
这可能包括添加或删除词汇、更改快捷键、调整词频等。
4. 添加新词:如果你想向输入法中添加新的词汇,可以点击“添加”或“编辑”按钮,并输入词汇及其相应的拼音或输入方式。
5. 删除词汇:要删除输入法中的词汇,可以选择词汇并点击“删除”按钮。
6. 保存设置:完成编辑后,记得点击“保存”或“应用”按钮,以使更改生效。
IME实现原理

二、常用函数BOOL WINAPI ImmGenerateMessage( //将汉字串法发送到与当前输入法相关联的应用软件中HIMC hIMC);//成功为TRUE,否则为FALSELRESULT WINAPI ImmRequestMessage( //向应用程序发送WM_IME_REQUEST消息HIMC hIMC, //与当前输入法相关联的应用软件的句柄WPARAM wParam, //与WM_IME_REQUEST相关的wPLPARAM lParam //与WM_IME_REQUEST相关的LP);LPINPUTCONTEXT WINAPI ImmLockIMC( //获取当前IMC的INPUTCONTEXT结构信息,增加IMC 计数器HIMC hIMC);//成功返回INPUTCONTEXT 结构指针,否则为NULLBOOL WINAPI ImmUnlockIMC( //释放IMC计数器HIMC hIMC );//返回:如果IMC计数器被减少到0了,返回FALSE,否则为TRUE.注意:ImmLockIMC与ImmUnlockIMC必须成对出现,必须是相同的HIMCHIMCC WINAPI ImmGetIMCLockCount( //取计数器值HIMC hIMC );//如果成功返回HIMC的计数器值,否则为NULL.HIMCC WINAPI ImmCreateIMCC( //创建INPUTCONTEXT结构的一个成员DWORD dwSize //成员的缓冲区长度);//如果成功返回IMC的成员句柄,否则为NULLHIMCC WINAPI ImmDestroyIMCC( //删除IMC成员缓冲区HIMCC hIMCC);//如果成功返回NULL,否则等于该HIMCC.LPVOID WINAPI ImmLockIMCC( //取IMCC缓冲地址,同时使IMCC的计数器值增加HIMCC hIMCC );BOOL WINAPI ImmUnlockIMCC( //递减IMCC计数器HIMCC hIMCC );//如果IMCC的计数器值为零,则返回 FALSE,否则为TRUE.10、HIMCC WINAPI ImmReSizeIMCC( //重新设置IMC的成员的缓冲区大小HIMCC hIMCC, //IMC的成员句柄DWORD dwSize //新缓冲区大小);//如果成功,返回新的HIMCC,否则为 NULL.11、DWORD WINAPI ImmGetIMCCSize( //取IMC成员的缓冲区大小HIMCC hIMCC );//返回IMC成员的缓冲区大小12、DWORD WINAPI ImmGetIMCCLockCount( //返回IMC计数器值HIMCC hIMCC);//成功返回该IMCC的计数器值,否则为013、BOOL WINAPI ImmGetHotKey( //取输入法状态键,该函数供控制面板使用DWORD dwHotKeyID,LPUINT lpuModifiers,LPUINT lpuVKey,LPHKL lphKL)14、BOOL WINAPI ImmSetHotKey( //设置输入法的热键DWORD dwHotKeyID,UINT uModifiers,UINT uVKey,hKL hKL)15、HWND WINAPI ImmCreateSoftKeyboard( //产生一个软键盘UINT uType, //软件盘上的键码含义的定义方式UINT hOwner, //该输入法的UI窗口int x, //x坐标int y //y坐标);//成功返回软键盘的窗口句柄16、BOOL WINAPI ImmDestroySoftKeyboard( //销毁软键盘HWND hSoftKbdWnd //软键盘窗口句柄);//成功为TRUE,法哦则为FALSE.17、BOOL WINAPI ImmShowSoftKeyboard( //显示或隐藏软键盘HWND hSoftKbdWnd, //软键盘窗口句柄int nCmdShow //SW_HIDE=隐藏,SW_SHOWNOACTIVATE=显示);//如构成功返回 TRUE. 否则为 FALSE.二、 IME 文件中的常用结构1、IMEINFOstruct tagIMEInfo { //输入法的接口信息DWORD dwPrivateDataSize;//用户设计的数据结构的字节数DWORD fdwProperty; //输入法对键盘事件的相应特性DWORD fdwConversionCaps;//当前输入法具有的功能特性,如有软键盘、标点、中西文切换等功能DWORD fdwSentenceCaps;DWORD fdwUICaps; // 用户界面能力:支持软键盘等DWORD fdwSCSCaps; // 用户设置编码串的能力DWORD fdwSelectCaps; // 输入法切换时是否使用以前输入法的模式} IIMEINFO;2、COMPOSITIONSTR 用于编码管理typedef struct tagCOMPOSITIONSTR {DWORD dwSize; //当前编码信息需要的存储空间DWORD dwCompReadAttrLen; //读入的编码属性长度DWORD dwCompReadAttrOffset; //读入的编码的位置DWORD dwCompReadClsLen; //读入的子串长度DWORD dwCompReadClsOffset; //读入的子串的位置DWORD dwCompReadStrLen; //读入的编码长度DWORD dwCompReadStrOffset; //读入的编码的位置DWORD dwCompAttrLen; //编码属性长度DWORD dwCompAttrOffset; //编码属性在内存的位置DWORD dwCompClsLen; //编码子串长度DWORD dwCompClsOffset; //编码子串在内存的位置DWORD dwCompStrLen; //编码串长度DWORD dwCompStrOffset; //编码串在内存的位置DWORD dwCursorPos; //当前光标位置DWORD dwDeltaStart; //被修改编码的位置DWORD dwResultReadClsLen; //读入结果子串长度DWORD dwResultReadClsOffset; //读入结果子串在内存的位置DWORD dwResultReadStrLen; //读入的编码长度DWORD dwResultReadStrOffset; //读入的编码在内存的位置DWORD dwResultClsLen; //结果子串长度DWORD dwResultClsOffset; //结果子串在内存的位置DWORD dwResultStrLen; //结果串长度DWORD dwResultStrOffset; //结果串在内存的位置DWORD dwPrivateSize; //用户自定义数据长度DWORD dwPrivateOffset; //用户自定义数据在内存的位置} COMPOSITIONSTR;3、CANDIDATEINFO 用于编码选择管理typedef struct tagCANDIDATEINFO {DWORD dwSize; //数据所占内存大小DWORD dwCount; //数据个数DWORD dwOffset[32]; //各个编码列表的内存位置DWORD dwPrivateSize; //自定义数据尺寸DWORD dwPrivateOffset; //缓冲区位置} CANDIDATEINFO;4、GUIDELINEtypedef struct tagGUIDELINE {DWORD dwSize;DWORD dwLevel;DWORD dwIndex;DWORD dwStrLen;DWORD dwStrOffset;DWORD dwPrivateSize;DWORD dwPrivateOffset;} GUIDELINE;5、CANDIDATELIST 编码选择列表信息typedef struct tagCANDIDATELIST {DWORD dwSize; // 用字节表示的内存大小DWORD dwStyle; // 列表串的取值方式DWORD dwCount; // 当前列表个数DWORD dwSelection; // 当前选择的列表序号DWORD dwPageStart; // 在列表窗口中所显示的列表的起始序号DWORD dwPageSize; // 一页显示的列表个数DWORD dwOffset[]; // 列表数据存放区地址} CANDIDATELIST;6、COMPOSITIONFORM 窗口位置、大小信息:typedef tagCOMPOSITIONFORM {DWORD dwStyle; //管理窗口方式POINT ptCurrentPos; //给定坐标RECT rcArea;}COMPOSITIONFORM;7、CANDIDATEFORM 列表窗口信息typedef tagCANDIDATEFORM {DWORD dwIndex; //列表窗口序号DWORD dwStyle; //属性:POINT ptCurrentPos; //坐标位置REC rcArea;} CANDIDATEFORM;12、INPUTCONTEXT IMC 数据存放区typedef struct tagINPUTCONTEXT {HWND hWnd; //使用该IMC的窗口BOOL fOpen; //IME的打开与关闭状态POINT ptStatusWndPos; //状态窗口的位置POINT ptSoftKbdPos; //软键盘的位置DWORD fdwConversion; //IME状态(活动、不活动,全角等)DWORD fdwSentence; //编码方式union {LOGFONTA A;LOGFONTW W;} lfFont; //字体COMPOSITIONFORM cfCompForm; //编码格式结构CANDIDATEFORM cfCandForm[4]; //列表选择结构HIMCC hCompStr;HIMCC hCandInfo;HIMCC hGuideLineHIMCC hPrivate;DWORD dwNumMsgBuf; //存放在hMsgBuf中的消息数HIMCC hMsgBuf; //存放的消息DWORD fdwInit //系统根据此值来初始本结构相应的信息DWORD dwReserve[3]; //未定义} INPUTCONTEXT;。
利用IME完成接收输入法输入功能.

利⽤IME完成接收输⼊法输⼊功能.调⽤windows的完成窗体接收输⼊法功能.代码如下 ///<summary>///输⼊法组件///</summary>class ImeComponent{#region Event///<summary>///输⼊⽂本事件///</summary>public delegate void InputTextEvent(string text);///<summary>///输⼊⽂本事件///</summary>public event InputTextEvent InputText;#endregion#region PrivateFieldIntPtr hIMC;IntPtr handle;private const int WM_IME_SETCONTEXT = 0x0281;private const int WM_IME_CHAR = 0x0286;private const int WM_CHAR = 0x0102;private const int WM_IME_COMPOSITION = 0x010F;private const int GCS_RESULTSTR = 0x0800;private const int GCS_COMPSTR = 0x0008;#endregion#region Constructionpublic ImeComponent(UserControl control){var handle = control.Handle;hIMC = ImmGetContext(handle);this.handle = handle;} public ImeComponent(Form from) { var handle = from.Handle; hIMC = ImmGetContext(handle); this.handle = handle; }#endregion#region Method///<summary>///输⼊事件///</summary>///<param name="m"></param>public void ImmOperation(Message m){if (m.Msg == ImeComponent.WM_IME_SETCONTEXT && m.WParam.ToInt32() == 1){this.ImmAssociateContext(handle);}else if (m.Msg == WM_IME_COMPOSITION){var res = m.WParam.ToInt32();string text = CurrentCompStr(this.handle);if (!string.IsNullOrEmpty(text)){InputText(text);}}else if (m.Msg == WM_CHAR){char inputchar = (char)m.WParam;if (inputchar > 31 && inputchar < 127){InputText(inputchar.ToString());}}}///<summary>///当前输⼊的字符串流///</summary>///<param name="handle"></param>///<returns></returns>public string CurrentCompStr(IntPtr handle){try{int strLen = ImmGetCompositionStringW(hIMC, GCS_RESULTSTR, null, 0);if (strLen > 0){var buffer = new byte[strLen];ImmGetCompositionStringW(hIMC, GCS_RESULTSTR, buffer, strLen);return Encoding.Unicode.GetString(buffer);}else{return string.Empty;}}finally{ImmReleaseContext(handle, hIMC);}}#endregion#region Win Api///<summary>///建⽴指定输⼊环境与窗⼝之间的关联///</summary>///<param name="hWnd"></param>///<returns></returns>private IntPtr ImmAssociateContext(IntPtr hWnd){return ImeComponent.ImmAssociateContext(hWnd, hIMC);}[DllImport("imm32.dll")]public static extern IntPtr ImmGetContext(IntPtr hWnd);[DllImport("Imm32.dll")]public static extern bool ImmReleaseContext(IntPtr hWnd, IntPtr hIMC);[DllImport("Imm32.dll")]private static extern IntPtr ImmAssociateContext(IntPtr hWnd, IntPtr hIMC);[DllImport("imm32.dll", CharSet = CharSet.Auto)]private static extern int ImmCreateContext();[DllImport("imm32.dll", CharSet = CharSet.Auto)]private static extern bool ImmDestroyContext(int hImc);[DllImport("imm32.dll", CharSet = CharSet.Auto)]private static extern IntPtr SetFocus(IntPtr hWnd);[DllImport("Imm32.dll", CharSet = CharSet.Unicode)]private static extern int ImmGetCompositionStringW(IntPtr hIMC, int dwIndex, byte[] lpBuf, int dwBufLen); [DllImport("imm32.dll")]static extern int ImmGetCompositionString(IntPtr hIMC, int dwIndex, StringBuilder lPBuf, int dwBufLen);#endregion}此外还需要重构⼀下窗体或控件的WndProc⽅法代码如下: ///<summary>/// win消息///</summary>///<param name="m"></param>protected override void WndProc(ref Message m){base.WndProc(ref m);if (isInitialization){this.imeComponent.ImmOperation(m); //输⼊法}}需要注意的是要保证输⼊法组件在实例化之后才会执⾏对象的ImmOperation⽅法.这样修改之后绑定事件即可接收到键盘输⼊.⽔平有限难免有所纰漏,如有错误请留⾔指出.=_=。
IME输入法编程

第四章在UI窗口下需要处理下列windows消息.1、WM_IME_SETCONTEXT激活或休眠输入法LRESULT CALLBACK UIWndProc(HWND hUIWnd,UINT uMsg,WPARAM wParam,LPARAM lParam) {:case WM_IME_SETCONTEXT:fSet= (BOOL) wParam;lISCBits = lParam;}如果fSet为TRUE,系统将激活当前输入法的某个窗口(状态窗、列表窗等),为FALSE时休眠当前输入法.其中lISCBits中指出对哪个窗口操作。
数值含义ISC_SHOWUICOMPOSITIONWINDOW 显示编码窗口ISC_SHOWUIGUIDWINDOW 显示信息窗口ISC_SHOWUICANDIDATEWINDOW 显示0号列表窗口(ISC_SHOWUICANDIDATEWINDOW << 1) 显示1号列表窗口.(ISC_SHOWUICANDIDATEWINDOW << 2) 显示2号列表窗口.(ISC_SHOWUICANDIDATEWINDOW << 3) 显示3号列表窗口.2、WM_IME_CONTROL管理当前输入法wSubMessage= wParam; 受WM_IME_CONTROL 控制的消息lpData = (LPVOID) lParam; 对应的数据其中子消息有下列消息:1)IMC_GETCANDIDATEPOS获取列表窗口的位置.此时lParam传送的是CANDIDATEFORM结构地址。
如果此消息成功返回0,否则非零。
通常如果你设计此部分了,返回0。
否则返回1。
2)IMC_GETCOMPOSITONFONT获取编码窗口字体结构,lParam为LOGFONT结构地址如果此消息成功返回0,否则非零。
通常如果你设计此部分了,返回0。
否则返回1。
3)IMC_GETCOMPOSITONWINDOW获取编码窗口位置,lParam为COMPOSITIONFORM结构地址。
Windows输入法编程接口

Windows输入法编程接口Windows9x系统下汉字输入法的基本原理Windows系统下汉字输入法实际上是将输入的标准ascii字符串按照一定的编码规则转换为汉字或汉字串,进入到目的地。
由于应用程序各不相同,用户不可能自己去设计转换程序,因此,汉字输入自然而然落到WINDOWS系统管理中。
一、输入法与系统的关系键盘事件应用程序||Windows的USER.EXE|输入法管理器|输入法系统的键盘事件有windows的user.exe软件接收后,user.exe在将键盘事件传导输入法管理器(Input Method Manager,简称IMM)中,管理器再将键盘事件传到输入法中,输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe中,user.exe再将翻译后的键盘事件传给当前正运行的应用程序,从而完成汉字的输入。
二、汉字输入法的组成微软Windows9x系统中汉字输入法的名称是"Input Method Editor" ,简称IME,输入法的程序名称为:*.ime,数据文件名称为*.MB,即通常说的输入法编码表(字典).实际上IME文件是一个动态连接库程序(DLL),它与dll文件没有区别,只是名称不同而已。
一般汉字输入法都由三个窗口组成:状态窗口(Status Windows)-显示当前的输入法状态(中文还是英文等站环信息);编码输入窗口(Composition Windows)-显示当前击键情况;汉字选择窗口(Candidates Windows)-列出当前编码的全部汉字(串),供用户选择或查询。
上述三个窗口由基本的用户接口(User Interface )函数管理着。
现在我们用Dumpbin.exe打开微软提供的拼音输入法(WINDOWS\SYSTEM\WINPY.IME)看看它有什么组成(这里一WINDOWS98为例,并假定windows系统安装在c:盘下):C:\Dumpbin c:\windows\system\winpy.imeMicrosoft (R) COFF Binary File Dumper Version 6.00.8168Copyright (C) Microsoft Corp 1992-1998. All rights reserved.Dump of file WINPY.IMEFile Type: DLL //IME 实际为dll程序Section contains the following exports for WINPY.ime0 characteristics34A37323 time date stamp Fri Dec 26 17:04:35 19970.00 version1 ordinal base19 number of functions //共有19个函数19 number of names // 对应19个名称ordinal hint RVA name1 0 0000A010 CandWndProc //"选择汉字窗口"注册函数2 1 0000E750 CompWndProc //"输入编码窗口"注册函数3 2 0000FB50 ImeConfigure //配置当前ime参数函数4 3 0000FEC0 ImeConversionList//将字符或字符串转换成目标字符5 4 0000FFA0 ImeDestroy //退出当前使用的IME6 5 000030D0 ImeEnumRegisterWord7 6 0000FFB0 ImeEscape //应用软件访问输入法的接口函数.8 7 00003080 ImeGetRegisterWordStyle9 8 0000E9A0 ImeInquire //启动并初始化当前IME输入法10 9 0000A800 ImeProcessKey //IME输入键盘事件管理函数11 A 00002C20 ImeRegisterWord //向输入法字典注册字符串12 B 000109A0 ImeSelect //启动当前IME输入法13 C 000109E0 ImeSetActiveContext //设置当前的输入处于活动状态.14 D 0000C850 ImeSetCompositionString 由应用程序设置输入法编码15 E 0000AEE0 ImeT oAsciiEx //将输入的键盘事件转换为汉字编码事件16 F 00002F40 ImeUnregisterWord //删除被注册的字符串.17 10 0000CA90 NotifyIME //IME事件管理函数18 11 00005160 StatusWndProc //状态窗口注册函数19 12 00002350 UIWndProc //用户界面接口函数Summary5000 .ShareDa7000 .data2000 .idata1000 .rdata3000 .reloc5000 .rsrc2000 .sgroup18000 .text从上述可以看出,IME程序共有19个出口函数组成,每一个函数都有特定的格式,它们担负着与windows 系统传递信息的作用,这些函数是供Windows系统调用的。
输入法原理

输入法原理
输入法是指通过计算机键盘输入文字时使用的一种软件工具,它能够将键盘输入的字母、符号或者拼音转换成相应的汉字或者其他文字。
输入法的原理主要包括词库、编码和转换三个方面。
首先,词库是输入法的基础,它包含了大量的词语和词组,用户输入的文字会根据词库中的内容进行匹配和转换。
词库的建立需要大量的语料库和语言学知识作为支撑,同时还需要不断更新和维护,以保证输入法的准确性和时效性。
词库的质量直接影响了输入法的使用体验,一个完善的词库能够提高用户的输入效率和准确性。
其次,编码是输入法实现文字转换的重要手段,它将用户输入的字母、符号或者拼音按照一定的规则进行编码,然后与词库中的内容进行匹配。
不同的输入法可能采用不同的编码方式,常见的有拼音编码、五笔编码等。
编码的设计需要考虑到用户习惯、语言特点和输入效率,合理的编码规则能够降低用户的学习成本,提高输入的准确性和速度。
最后,转换是输入法实现文字输入的核心过程,它通过词库和编码将用户输入的内容转换成相应的文字输出。
在转换过程中,输入法需要考虑上下文的语境和用户的输入习惯,以提供准确和合理的转换结果。
同时,输入法还需要对用户的输入进行预测和纠错,以提高用户的输入效率和准确性。
综上所述,输入法的原理包括词库、编码和转换三个方面,它们共同构成了输入法实现文字输入的基础。
输入法的准确性、速度和用户体验都与这些原理密不可分,只有在这些原理的基础上不断优化和完善,才能够满足用户不断提升的输入需求。
随着技术的不断发展,输入法的原理也在不断演进和改进,以更好地适应用户的使用习惯和需求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章Windows9x系统下汉字输入法的基本原理Windows系统下汉字输入法实际上是将输入的标准ascii字符串按照一定的编码规则转换为汉字或汉字串,进入到目的地。
由于应用程序各不相同,用户不可能自己去设计转换程序,因此,汉字输入自然而然落到WINDOWS系统管理中。
一、输入法与系统的关系键盘事件应用程序||Windows的USER.EXE|输入法管理器|输入法系统的键盘事件有windows的user.exe软件接收后,user.exe在将键盘事件传导输入法管理器(Input Method Manager,简称IMM)中,管理器再将键盘事件传到输入法中,输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe中,user.exe 再将翻译后的键盘事件传给当前正运行的应用程序,从而完成汉字的输入。
二、汉字输入法的组成微软Windows9x系统中汉字输入法的名称是"Input Method Editor" ,简称IME,输入法的程序名称为:*.ime,数据文件名称为*.MB,即通常说的输入法编码表(字典).实际上IME文件是一个动态连接库程序(DLL),它与dll文件没有区别,只是名称不同而已。
一般汉字输入法都由三个窗口组成:状态窗口(Status Windows)-显示当前的输入法状态(中文还是英文等站环信息);编码输入窗口(Composition Windows)-显示当前击键情况;汉字选择窗口(Candidates Windows)-列出当前编码的全部汉字(串),供用户选择或查询。
上述三个窗口由基本的用户接口(User Interface )函数管理着。
现在我们用Dumpbin.exe打开微软提供的拼音输入法(WINDOWS\SYSTEM\WINPY.IME)看看它有什么组成(这里一WINDOWS98为例,并假定windows系统安装在c:盘下):C:\Dumpbin c:\windows\system\winpy.imeMicrosoft (R) COFF Binary File Dumper Version 6.00.8168Copyright (C) Microsoft Corp 1992-1998. All rights reserved.Dump of file WINPY.IMEFile Type: DLL//IME 实际为dll程序Section contains the following exports for WINPY.ime0 characteristics34A37323 time date stamp Fri Dec 26 17:04:35 19970.00 version1 ordinal base19 number of functions //共有19个函数19 number of names// 对应19个名称ordinal hint RVA name1 0 0000A010 CandWndProc//"选择汉字窗口"注册函数2 1 0000E750 CompWndProc//"输入编码窗口"注册函数3 2 0000FB50 ImeConfigure//配置当前ime参数函数4 3 0000FEC0 ImeConversionList//将字符或字符串转换成目标字符5 4 0000FFA0 ImeDestroy//退出当前使用的IME6 5 000030D0 ImeEnumRegisterWord7 6 0000FFB0 ImeEscape //应用软件访问输入法的接口函数.8 7 00003080 ImeGetRegisterWordStyle9 8 0000E9A0 ImeInquire//启动并初始化当前IME输入法10 9 0000A800 ImeProcessKey//IME输入键盘事件管理函数11 A 00002C20 ImeRegisterWord //向输入法字典注册字符串12 B 000109A0 ImeSelect //启动当前IME输入法13 C 000109E0 ImeSetActiveContext //设置当前的输入处于活动状态.14 D 0000C850 ImeSetCompositionString 由应用程序设置输入法编码15 E 0000AEE0 ImeToAsciiEx//将输入的键盘事件转换为汉字编码事件16 F 00002F40 ImeUnregisterWord //删除被注册的字符串.17 10 0000CA90 NotifyIME//IME事件管理函数18 11 00005160 StatusWndProc//状态窗口注册函数19 12 00002350 UIWndProc//用户界面接口函数Summary5000 .ShareDa7000 .data2000 .idata1000 .rdata3000 .reloc5000 .rsrc2000 .sgroup18000 .text从上述可以看出,IME程序共有19个出口函数组成,每一个函数都有特定的格式,它们担负着与windows 系统传递信息的作用,这些函数是供Windows系统调用的。
三、输入法的函数简介下面我们将介绍上述各个函数的功能及接口格式。
1. BOOL ImeInquire( //初始化IMELPIMEINFO lpIMEInfo, //用于初始化该输入法的结构地址LPTSTR lpszWndClass, //当前输入法的名称LPCTSTR或者dword lpszData //系统信息,9X系列值为0,NT/2000下有实际值)如果该函数初始化成功,返回TURE,否则为FALSE用户应该搞清楚IMEINFO结构,特关系着你设计的输入法是否成功.有关该结构请看"结构"一章.2.DWORD IMEConversionList( // 将某字符或字符串转换成目标字符串HIMC hIMC, // 与当前输入法相关的应用程序句柄LPCTSTRlpSrc, // 要转换的字符串(也可能是结果串,可由uFlag指定) LPCANDIDATELIST lpDst, /// 转换后的字符串(也可能是源串,可由uFlag指定)DWORD dwBufLen, //转换后有几个字符UINT uFlag //指定结果的存放位置)如果成功,返回转换后的字符串长度3.BOOL ImeConfigure( //用户设置输入法接口HKL hKL, //当前输入法句柄HWND hWnd, //配置窗口的父窗口DWORD dwMode, //配置什么LPVOID lpData //用户设置的数据)该函数的功能是提供给输入法使用者一个可以更改某些隐含设置的能力.如果你用过别人的输入法,其中的"配置输入法..."功能既是也!对于一个初写输入法的人,可以不予理它.4.BOOL ImeDestroy( //关闭当前输入法UINT uReserved //无用(0))成功返回TURE,否则为FALSE5.LRESULT ImeEscape( //用户软件访问输入法内部信息的接口HIMC hIMC, //当前的应用程序句柄UINT uEscape, //设置函数功能//=IME_ESC_QUERY _SUPPORT//=IME_ESC_RESERVED_LAST IME_ESC_RESERVED_FIRST//=IME_ESC_PRIVATE_FIRST IME_ESC_PRIVATE_LAST//=IME_ESC_SEQUENCE_TO_ INTERNAL//=IME_ESC_GET_EUDC_ DICTIONARY//=IME_ESC_SET_EUDC_ DICTIONARY//=IME_ESC_MAX_KEY//=IME_ESC_IME_NAME//=IME_ESC_SYNC_HOTKEY//=IME_ESC_HANJA_MODE//=IME_ESC_GETHELPFILENAME(只适应Windows 98和Windows 2000)//=IME_ESC_PRIVATE_HOTKEY(w95下不可用)LPVOID lpData //当前功能所需的数据)如果失败,返回0,否则有个功能决定有时,人们可以用此函数获取输入法的名称、帮助文件名称等。
当然,我们可以不提供这些功能。
6、BOOL ImeSetActiveContext( //激活或搁置当前的输入法HIMC hIMC, //当前用户程序句柄BOOL fFlag //激活或搁置:=TRUE 激活=FALSE 搁置)成功返回TRUE,否则为FALSE7、BOOL ImeProcessKey( //处理应用程序传入的所有击键事件,监测是否是当前输入法所需的HIMC hIMC, //应用程序句柄UINT uVirKey, //需处理的虚键DWORD lParam, //击键消息参数CONST LPBYTE lpbKeyState //当前键盘状态(256字节))如果此键是该输入法需要的,则返回TRUE,否则为FALSE只有返回true的击键,IME才去处理8、BOOL NotifyIME( //输入法选择窗口状态管理函数:HIMC hIMC, //当前的应用程序句柄DWORD dwAction, //状态值DWORD dwIndex, //与状态值有关的序号DWORD dwValue //与状态值有关的值)状态值说明:=NI_OPENCANDIDATE 打开编码选择窗口=NI_CLOSECANDIDATE 关闭当前的编码选择窗=NI_SELECTCANDIDATESTR 选摘编码此时:dwIndex 被选择的编码列表序号.dwValue 被选中的编码在当前的编码列表中的序号=NI_CHANGECANDIDATELIST 改变当前的编码列表(按pageup等键操作)此时:dwIndex 被选择的编码列表序号.dwValue 不用=NI_SETCANDIDA TE_PAGESTART 设置编码开始页号此时:dwIndex 被改变的编码列表序号dwValue 新页的开始序号.=NI_SETCANDIDA TE_PAGESIZE 改变编码列表页的大小此时:dwIndex 当前编码页序号dwValue 新的页大小=NI_CONTEXTUPDATED 更新应用程序的信息的输入法的信息:移动位置,设置模式,设置编码窗口,字体。
此时:dwIndex 只用于dwValue=IMC_SETCONVERSIONMODE, IMC_SETSENTENCEMODEdwValue 可取由WM_IME_CONTROL 发送的下列值:IMC_SETCANDIDATEPOSIMC_SETCOMPOSITIONFONTIMC_SETCOMPOSITIONWINDOWIMC_SETCONVERSIONMODEIMC_SETSENTENCEMODEIMC_SETOPENSTATUS=NI_COMPOSITIONSTR 改变编码窗口中的编码此时:dwIndex 取下列值:CPS_COMPLETE 完成编码转换CPS_CONVERT 转换编码CPS_REVERT 取消当前的编码CPS_CANCEL 清除编码,并关闭编码窗dwValue 不用此函数成功,返回TRUE,否则为FALSE9、BOOL ImeSelect( //初始化输入法HIMC hIMC, //当前应用程序句柄BOOL fSelect //是否初始化当前输入法,TRUE表示初始化)返回:成功返回true,否则为FALSEThe ImeSetCompositionString function is used by an application to set the IME composition string structure with the data contained in the lpComp or lpRead parameters. The IME then generates a message.10、BOOL WINAPI ImeSetCompositionString( //将编码窗口中输入的编码保存的编码结构中,//同志发送编码完成的消息//(WM_IME_COMPOSITION)给系统,HIMC hIMC, //当前的应用程序句柄DWORD dwIndex, //设置此函数功能//=SCS_SETSTR//=SCS_CHANGEATTR//=SCS_CHANGECLAUSE//= SCS_QUERYRECONVERTSTRING//=SCS_RECONVERTSTRING//=SCS_SETRECONVERTSTRINGLPCVOID lpComp, //编码数据区DWORD dwCompLen, //编码数据区长度LPCVOID lpRead, //读入的编码数据DWORD dwReadLen //读入的编码数据长度)11、UINT ImeToAsciiEx( //转换编码称汉字(串)UINT uVirKey, //虚键UINT uScanCode, //扫描码CONST LPBYTE lpbKeyState, //用户定义的键盘状态LPDWORD lpdwTransBuf, //转换后的数据存放区UINT fuState, //活动菜单标志HIMC hIMC //当前的应用程序句柄)返回:返回值表示有几个消息,可理解为:本编码对应的汉字串有几个汉字组成(当然,这并不相等)。