(计算机软件与理论专业论文)手机中文输入法的设计与实现.pdf_第1页
(计算机软件与理论专业论文)手机中文输入法的设计与实现.pdf_第2页
(计算机软件与理论专业论文)手机中文输入法的设计与实现.pdf_第3页
(计算机软件与理论专业论文)手机中文输入法的设计与实现.pdf_第4页
(计算机软件与理论专业论文)手机中文输入法的设计与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘摘 要要 随着信息时代的加速发展 手机已经成为今后人们移动通信的重要工具 中文电话簿中文短消息中文记事本手机聊天等众多功能的实现,使手机 用户了解各种输入法的要求显得更加迫切 一种既能快速输入又易学易用的手机汉字输入法对于上述应用在中国推 广是非常重要的本文针对这种需求阐述了当前手机输入法的发展和现状 介绍了各种输入法的特点以及相应的软硬件环境对手机汉字输入法所涉及 的技术进行了研究实现了一个具体的手机输入法并在 windows 系统下进 行了手机输入法的模拟测试 手机汉字输入法的原理是利用某种特定的方法 将汉字信息的各种表现形式转换为手机可以接受的内部表示形式汉语拼音 键盘输入法是把汉字信息输入手机等数字键盘设备的重要手段也是中文信 息处理的一个重要课题本文介绍了汉字的数字键盘输入系统的功能以及总 体设计思想并讨论了其中所涉及到的具体技术以及实现的问题然后重点 研究和实现了汉语拼音数字键盘输入法笔划输入法字母 abc 输入法繁 体输入法数字 123 输入法 手机输入法主要完成数字串到汉字串的转换对于拼音汉字输入法来说 这一过程包括数字拼音到汉语拼音的转换与汉语拼音到汉字的转换两个步 骤对于笔划汉字输入法来说这一过程包括数字拼音到笔划的转换与笔划到 汉字的转换两个步骤 对于字母 abc 输入法 数字 123 输入法包括数字键盘 到字母的转换和到数字的转换 本文在研究数字的数字到汉字的转换模块中 首先实现了对用户键盘输入数字的分析与处理研究了笔划拼音流的自动切 分 使输入法在正确的拼音流和正确的笔画流下才可进行有效的输入和输出 本文在上述工作的基础上并结合手机的内存容量小处理器的速度 屏幕小等特点给出了一套完整的用户易学易用支持联想功能的拼音 笔画繁体字母 abc数字 123 的输入法并且已经成功地移植到台湾凌 阳科技有限公司开发的 3g 手机中进行测试运用 关键词关键词: 汉字输入法拼音笔划繁体联想输入法字频 abstract with the fast development of information ages, the mobile telephone has become the important tools of the correspondence in the everyday life. chinese telephone directory, chinese short message and chinese note book make the telephone phone customer understand the request of various input method to seem to be more and urgently. a kind of quick and easy learning input method is of the importance for above mentioned the application in the extend of china. this text aims at this kind of need, elaborate the development and the present condition of the input method the current mobile telephone, and introduce the various input method and corresponded soft and hardware environment. the text study the technique which involve the chinese input method and carry out a concrete input method. it makes the emulation of the mobile telephone test of the input method in the windows system. the principle of the mobile telephone chinese input method switch various manifestation of chinese characters information to inner part information of the mobile telephone .a pronounces keyboard of the chinese language is the important means of the numerical keyboard equipments for the chinese characters information importation. this text introduces the function of the numerical keyboard of the chinese characters and total design thought, and the text talk about the important problem mentioned. it researches and carries out bopomofo input method, stroke input method, letter of alphabet abc input method, traditional chinese input method, numeral 123 input methods. the mobile telephone input method mainly completes to switch the numerical string to the chinese characters string. the progress include two steps which switch numerical pronounces to the chinese language for pronounce input method, they include two steps which switch the numeral pronounce to strokes and stroke to characters for strokes input method, and include a numerical keyboard to alphabet and number. the text study the chinese characters of analysis and handle in the mold of the conversion. and studies flow of slice of strokes automatically, which make valid input output in pronounce flow and flow of strokes. above-mentioned contents, this text give a set of integrity input method which is learned to use it and have memories. the input method has already transplanted to 3g mobile telephone testing and usage successfully in the sun science and technology taiwan. key words: characters input method, spell, strokes, word frequency. 声 明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的 研究成果尽我所知除了文中特别加以标注和致谢的地方外论文中不包 含其他人已经发表或撰写过的研究成果也不包含为获得中国地质大学或其 它教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示了谢意 签 名 日 期 关于论文使用授权的说明 本人完全了解中国地质大学有关保留使用学位论文的规定即学校有 权保留送交论文的复印件允许论文被查阅和借阅学校可以公布论文的全 部或部分内容可以采用影印缩印或其他复制手段保存论文 (保密的论文在解密后应遵守此规定保密的论文在解密后应遵守此规定) 签 名 导师签名 日 期 中国地质大学(北京)硕士学位论文 1 第一章 绪论第一章 绪论 1.1 研究动机与目的 1.1 研究动机与目的 当前随着电子技术和网络技术突飞猛进信息化社会悄悄来临以 手机为代表的小电器产品和移动通讯产品都朝着数字化和网络化的方向 发展 特征之一是允许企业和用户之间 用户和用户之间可以进行交互式 的信息交换 汉字输入对于这类产品在中国的推广应用事非常重要的 汉 字输入法技术的研究一直是中文信息处理的研究热点之一 也是智能化人 机接口的一个重要组成部分其转换引擎的核心计算机语句拼音-汉字 相互转换技术同时在语音识别 语音合成 文字识别等领域都有着重要的 理论价值和广阔的应用前景 尽管现在过内外出现大量的适于手机等数字 键盘设备使用的汉字输入技术 但都还没有做到既能快速输入汉字又很容 易的掌握无法实现用户流畅地输入汉字的要求还有汉字输入需要增 加额外的存储空间 因此对于有些空间存储很小的设备 就有内存节约的 要求为汉字编码选择好的存储结构就显得由位重要另外对于实时汉 字输入来说 时间上不应该有延迟 所以要在速度有限的设备上实现汉字 输入需要快速的匹配算法作为保证因此有必要继续进行手机汉字输 入系统的开发与改进 本论文将着眼于信息化产品普及以来的广大的普通用户从汉字拼 音汉字笔划(chinese character stroke )编码输入方法出发设计和研究方 便用户快速易学易用的具有多级联想功能的输入法 1.2 课题背景课题背景 1.2.1 汉字输入方式 1.2.1 汉字输入方式 将汉字输入设备或计算机有多种方式 从 1840 年丹麦人为中国设 计的一套四码电报码本算起12对于汉字输入的研究已经经历了几个 浪潮汉字输入也从键盘输入到非键盘输入,编码输入到智能输入逐渐 手机中文输入法的设计与实现 2 演变汉字的输入从输入方式来看可分为键盘输入和非键盘输入两大 类具体分类可参照图 1-1 图 1-1 汉字输入方式 1.2.2 汉字编码方案汉字编码方案 1汉字编码输入原理 汉字是拼形文字它在计算机等系统内部以内部逻辑码(简称内 部码的 )的形式存在 根据现在流行的汉字内部码设计方案一个汉字的 内部码有两个或两个以上的八位字符构成向系统输入汉字也可以直接输入 汉字内部码但是这样就需要用户记住所有汉字的内部码为了方便用户输 入需要设计汉字外部码(或称输入码)从汉字外部码到内部码的转 换必须有特定的输入字典或映射函数完成如图 1-2 所示用户通过 输入设备输入汉字外码再经由输入程序转换成汉字内码存放在系统中整 个输入过程就完成了 图 1-2 汉字输入原理图 中键盘拼字输入 编码输入 大键盘整字输入 键盘输入 纯形码 音形码 纯音码 流水码 非键盘输入 声音识别 文字识别 脱机输入 联机输入 中国地质大学(北京)硕士学位论文 3 在计算机技术向其它领域迅速扩张的今天信息产品迅速向小型手持 个人化方向发展这些产品将中文信息处理带入一个新阶段一大批数字键 盘产品已经具有或即将具有处理汉字信息的功能例如手机在汉字传输方面 的技术已经完全成熟其主要障碍是人机接口即汉字的输入方式据统计 基于数字小键盘的汉字输入技术可用于 12 类约几十种产品通讯产品pc 机及网络手持 pc电子记事信息查询学习设备遥控器信息点播系 统军用设备和其他信息电子产品因为这类应用不是面向专业的打字员 而是广大的普通用户所以易学习应该是输入法设计的首要的原则目前 手机安装的汉字输入法主要有笔划(部件)输入法和汉语拼音输入法 对于汉语 拼音输入法用户只要认识该字就可以用拼音进行汉字的输入而笔划输 入不要求用户会读该字只要遵循汉字的笔画书写规范来输入该字的部分或 全部笔画就可以输入该字应用范围比较广泛但是由于数字键盘只有 89 个键可作为输入键而在汉字中有的字笔划数超过 20 笔划以上显然按 89 个键是不够的本文除设计和实现了拼音输入法外还提出了五笔笔划 输入法并且完整的实现了该输入法在 windows 平台下进行了成功的手机 键盘模拟测试 2汉字编码 汉字输入从编码方案上分主要分为以下三种 第一类是形码3是基于汉字的笔划进行编码特点是输入速度快重 码少 汉字有上万个而键盘上的按键代码只有几十个因此为了区别 大部分形码方案都采用以四个代码排列组合代表一个汉字 自四角号码开始 经历了笔形码五笔字型表码上述编码方案的缺点是规则烦难令人却步 不但需要记忆的知识很多而且需要很长时间训练才能使用所以应用对象 面相对狭窄大多数成为专业操作人员的特权码最重要的是形码是基于汉 字笔画的因此在输入过程中除了要进行文稿内容的思维外还必须考虑编 码方案以及如何拆字不符合人们使用语言的习惯 第二类是音码3此类编码是建立在汉字读音基础上的终端用户只需 要知道汉字的读音就可以掌握此类输入法而人与人之家交流信息最自然 最有效的方式就是通过谈话因此基于汉字读音的输入方式符合人们语言使 手机中文输入法的设计与实现 4 用的习惯操作与思维同步而且不需要复杂的学习但由于汉语的拼音汉 字并不是一一对应的有一音多字的特性导致重码很多从而给用户的输 入带来不便因此一音多字问题的解决是改善与提高音码输入方法效率的关 键 第三类是音形结合码该类编码就是利用音码和形码各自的特点兼顾 了汉字的音和形以音为主以形为辅目的是减少编码中死记的部分提 高输入效率易学易记音在前形在后形成音形码形在前音在后 行成形音码目前采用该类编码比较成熟的汉字输入系统包括北京扶良文 的”智能码”北京周志农的自然码等 从汉字键盘来分汉字输入法又分为标准键盘输入法和数码输入法(数字 键盘输入法又称数字键盘输入法或行列扫描键盘输入法)所谓的数码输入法 就是通常所说的手机输入法pda 手机输入法在数字输入法领域占尽优 势的是笔划输入法笔划输入法只用五个基本笔划这五个输入元素形成了 笔画输入法在数码输入法中的先天优势而拼音输入法在数字输入法中则先 天不足他要在 10 个数字数盘上使用 26 个输入元素造成了在键盘键位本 身就产生大量的重码其中笔划输入可以归为形码是基于汉字笔画的在 输入过程中除了要进行文稿内容的思维外还必须考虑编码方案以及如何拆 字不符合人们使用语言的习惯拼音输入属于音码此类编码是建立在汉 字读音基础上的只要知道汉字的读音就可以掌握此类输入法而人与人之 间交流信息最自然最有效的方式就是通过谈话因此基于汉字读音的输入 方法符合人们语言使用的习惯操作与思维同步而且不需要复杂的学习 因此拼音输入法也是一种很好的输入法 如上所述虽然存在许多种不同方案的汉字输入系统但其都采用相同 的工作方式首先获取用户输入信息将其通过转换接口转换为对应的汉字 最后将结果汉字发送到相应的应用软件中去实际上任何一种汉字输入系 统都必须辅之以具体的操作系统平台必须按照操作系统的规则成为输入 输出模块的组成部分才能够顺利完成用户的输入目前手机操作系统主要 分为专用手机操作系统合开放手机操作系统两大类专用是指该操作系统 是专门为特定硬件功能的手机所设计一般由手机芯片供应商设计并不对 中国地质大学(北京)硕士学位论文 5 外开放对第三方设计输入法带来很大障碍开放手机操作系统则指对其 接口大部分开放只要硬件符合其标准即可运行该操作系统对第三方软件 提供了很好的支持此类操作系统多数为新型智能手机所采用包括 linux windows mobilesymbina os 等 因此本文设计和开发的手机输入法对多数操作系统提供了接口并已 在基于 linux 的手机操作系统中已经成功测试运用 1.3 国内外研究现状国内外研究现状 早期的手机汉字输入法用手机数字键 29 分别代表 26 个英文字母如 数字键 2 代表abc三个字母4在输入时输入 2 代表 a22 代表 b 222 代表 c 所以在输入拼音的时候需要一一选择需要的字母来组成拼音 然 后根据拼音来选择需要的汉字这种输入法在效率上是十分低的现在在 众多手机厂商的大力支持下手机的输入法技术达到了相当高度目前流 行的有以下三种输入法 (1) t9 输入法5 该输入法全程为 t9 智能输入法是目前使用频率最高 知名度最大手机输入法之一目前支持汉语英语法语德语意大利 等十几种语言中文字库容量达 9000 多字t9 输入法由美国特捷通讯 (tegic communications) 软件公司研制目前诺基亚三星西门子索 尼松下飞利浦和 nec 等不少品牌手机都有此种输入法t9 的中文输 入包括简体中文和繁体中文输入发式包括拼音笔画以及注音在 t9 中最主要的是拼音和笔画输入法 (2) 字能输入法5 该输入法是由总部设在加拿大的字源咨询技术有限公 司(zi corporation) 和爱立信公司合作推出此种输入法具有 20902 个汉 字的高容量字库是 t9 输入法字库的两倍多所以许多 t9 不能输入的 字他都能轻松输入该输入法主要被早期的爱立信阿尔卡特以及一些 国产手机如联想等采用该输入法支持拼音和笔画两种中文简体输入方 式两种输入方式都具有联想功能 (3) itap 该输入法 itap 智能按键输入法是摩托罗拉经过潜心研究 在 t9 的基础上发展起来的在 1999 年初成功应用在 cd928 中itap 手机中文输入法的设计与实现 6 输入法在 t9 的基础上有所发展支持 20 多种语言比其他的输入法都 多 itap 输入法支持拼音和笔画两种中文简体输入方式 这两种输入方 式均支持词语联想功能 进一步提高了输入效率 该输入法能够根据最常 用的声 韵母组合和最频繁使用的文字统计 声调和词语联想等先进技术 实现简便快捷的输入 1.4 手机开发模式手机开发模式 手机是由一组硬件及相应软件来共同构成的手机的硬件主要包括芯片 组外围电路特定功能芯片等如图 1-3 所示 图 1-3 手机硬件结构图 相应手机的硬件其软件主要由以下构成操作系统第二三层协议栈 人机界面应用程序如图 1-4 所示 人机界面应用程序 api gprs 硬件抽象层 硬件驱动程序 硬件设备 图 1-4 手机软件结构图 现在手机开发模式包括采用芯片供应商提供的参考设计和完全独立自主 的研发两种芯片供应商除了负责芯片组的设计外还要对芯片组核心硬件 中国地质大学(北京)硕士学位论文 7 电路底层操作系统第二三层协议栈进行设计为终端厂商提供一个参 考设计对于那些较小的终端厂商而言其实力不足以承担独立开发以上设 计的财力及人力因而只需要购进某家芯片供应商的芯片组及其参考设计 再在此基础上进行驱动程序功能实现应用程序人机界面等的开发工作 来完成一款手机的设计与生产而完全自主设计的终端厂家则能自由组合不 同厂商的芯片完全掌握底层操作系统合协议栈可以根据自己的需求设计 出更个性化的手机来现阶段国内仍以采用参考设计的方式为主 由上述可见在现在手机开发模式中芯片供应商起了关键作用芯片供应 商将参与到终端厂商的整个开发流程中其掌握关键的技术通过参考设计 解决了芯片组协议栈核心电路设计底层软件设计虽然参考设计降低 了门槛但也屏蔽了关键技术将导致终端厂家处于较被动的位置上现在 主流芯片供应商进一步策略包括不断发展有潜力的终端厂商参考设计集成 软件厂商的各种应用程序以扩大其市场占有率目前国外大芯片供应商通 过参考设计将解决了芯片组外的其他关键技术从而在手机开发中占据了核 心地位本文所开发的手机输入法支持多种厂商的操作系统及其软硬件并 对手机供应商提供了输入法中的各种接口只要开发手机的厂商支持 c 程序 中常用的内库函数及其结构(结构体类型 枚举类型等) 该手机输入法就能在 应用程序端正常的工作 1.5 本文主要研究内容及组织结构本文主要研究内容及组织结构 在手机等数字键盘设备上的汉字输入法的设计与实现及其输入法的研究 是本文研究的重点 一个完整的输入法应包括程序实现部分和用户接口部分 程序实现部分功能是完成用户输入到输出的转换工作用户接口主要用于人 机交互以及实现系统与应用程序之间的通信本文的具体研究内容如下 (1) 在脱离集体的操作系统得情况下讨论了数字键盘设备汉字键盘输入 系统的功能以及总体架构设计思想并讨论了其中所涉及到的具体技术以及 实现的问题 (2) 对数字键盘设备上输入的数字拼音序列进行了分析和预处理 设计了 数字拼音自动切分的算法汉字倒笔写的处理技术多次按键和重复按键等 手机中文输入法的设计与实现 8 问题并分析了用户输入错误的原因并给出一些输入规则的建议 (3) 研究了数字拼音笔划到汉字的转换技术包括一些字倒笔的现象 (4) 研究和分析了字的频率确保常用的字尽量排在手机汉字框中的前 面 (5) 讨论了手机汉字输入法的基本原理并且实现了包括拼音笔画数 字 123繁体的手机输入法 本文共分为五章 第 1 章 本章为绪论部分首先讨论了课题的来源及意义然后概要地介 绍了汉字输入技术的研究现状及其实现的理论依据论述了相关领域的研究 工作然后讨论了目前的手机开发模式及输入法设计与实现的情况最后指 出了本文的研究内容 第 2 章 本章深入研究了汉字输入法系统设计的相关技术 在脱离具体操 作系统以适应于移植至大多数操作系统平台的目标下对数字键盘输入法进 行了一个整体架构上的设计工作 第 3 章 本章主要研究了中文拼音输入法的设计 并对汉字字频进行了排 序 第 4 章 一个具体的笔划输入法的实现基于 windows 操作平台模拟手 机界面的演示实现了笔划繁体数字 123字母 abc 等具体输入法分析 了笔画输入法中存在的问题及其相关技术讨论了笔画到汉字的转换算法 并对其实现的算法进行了相关说明 第 5 章 对本文成果的总结和展望 中国地质大学(北京)硕士学位论文 9 第二章第二章 手机汉字输入系统的分析与设计手机汉字输入系统的分析与设计 2.1 概述 2.1 概述 当前常见的手机汉字输入方法分为6键盘输入法触屏入方法两类 所谓键盘输入法是指按照一定的编码方案将汉字翻译为手机键盘上 可以输入的数字符号的组合通过敲击键盘输入汉字常见的此类应用 软件有t9 输入法字能输入法等itap 输入法等笔识别输入法是指使用 手机上的特定的手写区获取用户书写汉字或符号的笔划信息使用模式识别 的方法将笔迹转化为对应的汉字近年来笔输入发展很快市场上已经出 现多款采用手写输入法的手机但相对来说仍是键盘输入应用较为广泛技 术比较成熟具有可单手操作方便输入生僻难写汉字等优点现在及未来 一段时间内仍将是手机汉字输入的主流因此键盘输入法成为本文讨论的重 点 对于手机操作系统下的输入法软件而言最后应将结果字符串转换成对应 的汉字字符信息发送到文本编辑器(text editor)或对应的应用程序文本接 收窗口完成最终的输入过程本章主要借住windows平台对手机输入法的设 计与实现作全面介绍 2.2 手机输入法的系统整体设计手机输入法的系统整体设计 2.2.1 手机键盘输入法的系统结构手机键盘输入法的系统结构 常见的手机汉字输入方法分为:键盘输入法笔输入方法语音输入法三 类所谓键盘输入法是指按照一定的编码方案将汉字翻译为标准键盘 上可以输入的西文字母数字符号的组合通过点击小键盘来输入汉字当 前由三大主流手机所支持的具有代表性的输入法分别为nokia的t9输入法 motorola的itap和爱立信的字能输入法同键盘输入法相比笔输入和语音输 入的用户接受和使用程度不是很广泛准确率还有待提高手机拼音键盘输入 法是中文手机操作系统的一个重要组成部分必须能够被绝大多数应用程序所 手机中文输入法的设计与实现 10 支持因此在设计和实现汉字输入法时应该把其设计成为输入输出系统的 一个组件与系统兼容能够与操作系统和应用程序进行通信 对于用户来说语句级智能拼音输入法完成的功能是将用户输入的某种编 码按照系统制定的编码规则转换成汉字内码在转换过程中可能需要与用户进 行交互最后将汉字内码送到应用程序当中目前主流汉字编码有gb码gbk 码big5码unicode码等 gb 码 : gb码是中国大陆的国标码是在大陆地区广泛使用的汉字编码方 案该方案对gb2312-80z中规定的6763个汉字和符号进行了编码包含了大多 数常用的汉字 gbk码 :gbk码是gb码的扩展字符编码对2万多个简繁体汉字进行了编码 big5码:big5码是针对繁体汉字的汉字编码是开发中文繁体手机输入法 的首选编码方案 gb2312码:gb2312码是中华人民共和国国家汉字信息交换用编码 全称 信 息交换用汉字编码字符集基本集由国家标准总局发布1981年5月1日 实施通行于大陆新加坡等地也使用此编码gb2312收录简化汉字及符号 字母日文假名等共7445个图形字符其中汉字占6763个gb2312规定对任 意一个图形字符都采用两个字节表示每个字节均采用七位编码表示习惯 上称第一个字节为高字节第二个字节为低字节 unicode码:unicode码是一种国际标准编码采用二个字节编码与ansi 编码不兼容它最有吸引力的特点是它涵盖了几乎世界上的所有字符可以只 通过一个唯一的数字(unicode码点)来访问和操作字符 由于 unicode 码的国际化和优越性本文实现的汉字输入法都是采用的 unicode 编码 这样可以在同一种系统下实现多种语言输入法 以拼音输入法 为例手机键盘结构如图 2-1 所示 中国地质大学(北京)硕士学位论文 11 图 2-1 手机键盘结构图 在上图中黄色方框表示为手机键盘数字键 2 上标注 abc依次类推 数字键 7 上标注 pqrs数字键 9 上标注 wxyz当用户按下数字 2 键时拼音 序列为 abc当在按一次时出现 baca如果当按下 224 时拼音序列 显示 baicai 等符合汉字的拼音序列上述手机键盘为当前绝大多数手机厂 商采用的手机键盘已经适应大多数用户的需要 2.2.2 手机输入法模块结构手机输入法模块结构 尽管在不同的操作系统环境下汉字输入法与操作系统应用软件间的通 信机制不同;但是对于几乎所有操作系统平台拼音键盘输入法的实现按照功 能划分具有相似的模块结构 尽管不同输入法原理不尽相同其目的都是将用户输入的某种编码按照设 定好的编码规则转换成汉字转换过程中可能需要用户的参与以便纠错最后 将转换好的汉字发送至应用程序中去其中用户输入由操作系统来获取当用 户按键事件发生时操作系统会发送某些信息来通知输入法然后输入法需要 对用户输入进行判断其是否为合法输入进而进入转换模块中进行转换此间 输入法会显示初步转换结果然后与用户进行交互进一步确定转换结果最后 将用户确认的汉字串发送至应用程序中以完成汉字的输入过程 拼音输入法具有声韵母的智能组合优势可最大限度的减少按键次数 手机中文输入法的设计与实现 12 在输入汉语拼音字母时屏幕上会不断显示符合这个发音的汉字适合我们使 用汉语拼音的习惯如用itap的拼音输入法输入子字依次按数字键9 4此时屏幕上就会出现这2个键所组成的拼音组合xiyizh 和zi按方向键选择zi确认后子就显示在屏幕上以供选择 不足的是没有双拼功能即一次只能输入一个需要的拼音组合输入法的模块 结构如图2-2所示 图 2-2 用户按键模与键盘处理程序:上述2模块的功能由操作系统实现完成获取 用户按键输入并将输入传递至相应的键盘输入法处理模块用户按键的识别 处理:处理从键盘处理程序获得的用户按键信息若是用户输入的待转换按键 调用音字转换模块进行转换;若是用户定义的控制按键调用相应的功能按键 处理模块进行处理;若用户按键非上述按键则直接提交给应用软件处理 此时键盘输入法模块不进行任何处理功能按键处理:完成输入法各功能键 的相应操作例如:进行机器学习扩充词典或设置输入法的属性等用户按 键的识别处理模块是拼音键盘输入法挂接技术中与用户按键处理有关的功能 模块该部分的处理恰当与否直接关系到系统的鲁棒性与输入法能否被用户接 受用户输入的待转换按键调用音字转换模块进行转换;若是用户定义的控 制按键调用相应的功能按键处理模块进行处理;若用户按键非上述按键 则直接提交给应用软件处理此时键盘输入法模块不进行任何处理 功能按键处理:完成输入法各功能键的相应操作例如:进行机器学习扩充词 中国地质大学(北京)硕士学位论文 13 典或设置输入法的属性等 用户按键的识别处理模块是拼音键盘输入法挂接技术中与用户按键处理 有关的功能模块该部分的处理恰当与否直接关系到系统的鲁棒性与输入法能 否被用户接受 转换模块 :通过查找词典或应用某些智能处理技术把用户原始键盘输入 转换为汉字内码串是汉字编码方案的计算机实现并将转换结果发送至应用 软件 2.3 输入法控制流程输入法控制流程 2.3.1 输入法键盘实现输入法键盘实现 输入法控制流程的设计也即是用户输入流程的设计是设计用户使用该输 入法的规范考虑到要进行的是语句级的输入用户需要进行连续的数字拼音 的输入在一句话或一个短语的数字拼音输入完毕后才进行与用户的交互来对 己经转换的结果进行修正在此间用户可能会需要插入删除或修改汉字等操 作还可能会移动输入焦点插入符号等都是需要考虑在内的在汉字输入 中标点起到了分隔每句话的作用在这里也当作是每次输入的一个分隔规 定用户每次输入标点即意味着当前一句话已经输入完毕需要进行修改删除等 编辑动作这是符合人的思维习惯的否则一次输入过长的汉字用户可能会 忘记最开始想要输入的是什么而且由于手机屏幕相对台式机较小无法一次 显示很多汉字可能使正在编辑的汉字无法一次全部展现给用户而带来不便 用户输入时应允许其在已经输入的句子内随意移动输入焦点但不可以移动 到句子以外的地方 由于手机数字键盘按键数少同时需要考虑到功能键的安排使用不能像 台式机输入法那样在输入的一句话时随时可以进行修改删除等操作因此考 虑将输入过程分为几个状态用特定功能键来进行切换将所需操作功能分散 于几个状态之中以达到要求这里将输入的过程分为以下三个状态: (1) 标点及段落编辑状态在此状态中可以任意位置按插入键*来输入 标点符号以及将输入焦点在己有文字中随移动插入删除等操作在此状 手机中文输入法的设计与实现 14 态下一旦发生了汉字输入的动作则进入到语句输入状态 (2) 语句输入状态在此状态下进行连续的数字拼音的输入在输入每个完 整的数字拼音后可以自由在已经输入的文本中移动焦点但不可以将焦点移 出原因在之前已经有所解释在输入过程中可以进行删除操作己经输入的 完整的数字拼音只能将其以一个整体进行删除当所有数字拼音和本次已经输 入的汉字都被删除时则转入标点及段落编辑状态;在手机数字键盘上26个英 文字母分布于2-9八个按键之上数字键0和1不代表任何英文字母在此我们 借用他们为功能键来使用每当用户输入一个完整的数字拼音后都给出提示 按0键进入句内编辑状态按1键确认已输入文本返回标点及段落编辑状态 如果用户尚未输入完此句话则无须理会提示继续输入下一个汉字的数字拼音 即可 (3)句内编辑状态在此状态下将从本次输入的第一个汉字起显示候选拼音 或候选汉字用户可以进行焦点的左右移动对已经输入的汉字进行修改删 除插入等操作每次修改一个汉字后焦点将自动向右移动一位同时显示出 该汉字的候选拼音和候选汉字以供用户选择若用户将本次输入的所有汉字都 删除掉则返回标点及段落编辑状态;如果用户输入插入键*则转回语句 输入状态且以当前焦点为输入焦点;如果用户按0键则表示用户确认已经输入 的结果并结束本次汉字输入将返回标点及段落编辑状态同时将经过用户确 认的汉字串发送至应用程序中去 2.3.2 人机界面人机界面 上小节对输入法的输入流程进行了设计输入法在运行期间必属于此三种 状态中之一在接受到用户输入后根据当前所处状态进行相应处理在用户进 行输入过程中与用户打交道最多的即是人机界面因而人机界面的优劣将直接 影响汉字输入系统得可操作性在手机输入法中人机界面需要注意以下几点 (1) 输入法应该符合用户的操作习惯 用户操作应该简单方便 易用性好 符合用户的使用与思维习惯 (2) 手机键盘小按键数少势必要有某些按键充当功能键来使用如输入 法的切换标点符号的输入等都是需要仔细设计的以方便用户理解记忆与使 中国地质大学(北京)硕士学位论文 15 用 (3) 输入系统是否具有完备性即编码方案是否准确完备利用该编码方 案应该能输入用户想输入的全部或绝大多数汉字或字符不影响用户的输入工 作每个汉字的编码应该准确还应明确地体现其编码原则 (4) 对用户输入进行一定的分析处理在不引起歧义的前提下近可能允许 用户进行连续的数字拼音的输入在必要时仍需要进行手工切分 (5) 手机显示屏幕可用面积普遍较小可显示的信息量有限这就要求在 信息显示上进行一定的安排既要尽量的简洁明了同时还要以给用户最大限 度的信息为佳 1功能键 在用户进行输入时可能会有的动作包括汉字或标点符号的输入修改删 除等操作还有对输入焦点光标的移动更新及选择候选信息等一般手机键 盘上输入法会用到的有如下按键0-9十个数字键*和#键四向的方向键和 删除键典型手机数字键盘如图2-3所示 图2-3 针对以上所设计的输入流程将各按键功能进行如下定义键为删除键 #为输入发切换键*为插入键四个方向键在不同状态下分别为光标移动键和 候选翻页键1-9键在不同状态下分别为数字拼音输入键和候选选择键0键在 不同状态下分贝起了切分键和确认键的功能下面按不同状态详细说明各个按 键的功能 (1) 在标点与段落编辑状态下0数字键为空格键*键为表标点符号插入 键当用户键入*键后将出现标点符号的候选信息供用户选择这时用户可 手机中文输入法的设计与实现 16 以通过1-9键来选择需要的标点符号或通过上下方向键来翻页以查找需要的 标点符号在用户没有按*键时2-9键为数字拼音键而四向的方向键时起到移 动焦点光标的作用 (2) 在语句输入状态下2-9键为数字拼音键左右方向键可以在输入完 一个完整的数字拼音后可以在已经输入的句子内部左右移动光标以改变输入 的焦点0键的功能比较多当输入完毕一个数字拼音时其可以充当切分键 然后输入下一个数字拼音而在用户切分后0和1键都可以充当确认键当在文 字编辑状态下0键可以起到输入空格字符的作用在数在123输入法下数字键 0可用来输入字符0 (3) 在句内编辑状态下1-9键为候选信息选择键上下方向键为候选信 息翻页键左右方向键为光标左右移动键0键为确认修改结果键*键为汉字 字符插入键用户在此状态下输入*键后将会以当前光标位置点插入一个字符 综上所述可见由于手机键盘的按键数过少将会有一些按键在功能上由所 重叠但通过在功能改变时及时给用户以提示信息的方法使用户以提示信息的 方法使用户不至于错误 2屏幕显示 在用户输入过程中需要的信息包括用户输入的数字拼音系统为该数字 拼音所选择的汉语拼音或汉字及其他可能的候选信息这些信息量是巨大 的即使在台式机上也无法一次全部显示出来一般所采用的办法是以窗口 菜单的方式只显示一部分信息用户可以通过使用翻页键来逐页查看或选择 相应信息与台式机有所不同之处在于台式机输入法中其输入为汉语拼音因 此只需要显示候选汉字即可而在手机及平台上用户的输入为数字拼音首 先需要将其解释为汉语拼音然后再根据汉语拼音解释为汉字而由数字拼音 解释为汉语拼音时也是存在歧义的也需要将可能的拼音候选信息显示给用 户以进行选择目前多数手机输入法所采用的方式是在手机显示屏幕上的划 分一个固定的取悦来显示候选信息且分为候选拼音和候选汉字两部分由 于手机显示屏幕本身就不是很大因此只能显示一小部分的候选信息且在 选择上也比较复杂需要区别用户是要选择汉语拼音还是选择汉字然后通 过上下翻页及左右移动光标的组合的多次选择后才能定位到正确的汉字通 过对数字拼音的统计发现一个数字拼音对应得汉语拼音最多为 6 个而且 中国地质大学(北京)硕士学位论文 17 一个数字拼音对应汉语拼音超过 5 个的数字拼音只占其总数的 2% 7 因此考 虑将候选汉语拼音与候选汉字混排在排列时将候选汉语拼音排在开头的位 置将所有候选拼音所对应得候选汉字紧排在其后如果用户选择的是候选 拼音则重新生成候选信息其中只包括用户刚刚所选的拼音所对应得汉字 同时要保持焦点不动 等待用户进一步的选择以确定需要转换成哪一个汉字 如果用户选择的是一个汉字则直接保存此结果同时将焦点移向下一个数 字拼音 如此混排的好处之一便是减少用户同时需要关注的焦点数同时在显示 候选汉字时将把所有可能的汉字都显示出来而不是只显示某个拼音所对应 的汉字用户有可能在不选择拼音的情况下直接找到需要的汉字缺点是信 息量增大如何在显示屏幕上进行摆放是一个问题现有手机输入法在候选 信息摆放和选择方式主要有两种 均是将候选拼音与候选汉字分别排成两排 不同的是一种以移动光标的方式进行选择一种则对候选汉字进行编号用 户只要输入对应得数字家健即可进行选择了其中用序号进行选择是个好方 式省去了移动光标的按键的过程不管候选汉字排在第几位一次就可以选 定美中不足的是需要在屏幕上显示序号占用一定空间由于手机屏幕空间 所限一般只显示 5 至 7 个候选汉字还有用户需要从序号反映到键盘上按键 的位置带来一定的不便观察到手机键盘上 1-9 九个按键是以 3*3 的格式排 列的因此考虑如果将候选信息也以 3*3 的格式显示出来则在显示候选信 息时不需要显示每个候选的序号同时也可以比较直观地把这九个候选信息 直接与手机键盘上 1-9 九个按键相对应起来随之而来的问题是现在候选信 息由原来的一行变为三行在高度上有所增加如果仍将候选信息置于固定的 位置上则其所占空间过大将减少用户可用空间因此参考很多台式机输入法 所采用的方法将其设计为可以跟随输入焦点光标浮动的候选信息窗口如 此一来不但解决了候选窗口占用空间的问题同时还缩短了候选窗口与用户 关注的输入焦点的距离可以使用户更专注于所要进行的输入如上所述的 手机输入法的显示方面所作的设计效果如图 2-4图 2-5 所示 手机中文输入法的设计与实现 18 图 2-4 图 2-5 2.4 本章小结本章小结 本章讨论了汉字输入法的工作原理 在脱离具体操作系统以适应于意志 至大多数操作系统平台的目标下对手机拼音汉字输入法进行了一个整体架 构上的设计工作涉及到汉字编码控制流程人机界面等多个方面 其中 在整体架构上采用了动态库的分模块方式同时讨论了人机界面上的一些问 题 中国地质大学(北京)硕士学位论文 19 第三章第三章 中文拼音输入法的研究中文拼音输入法的研究 3.1 概述概述 当前手机提供的基本输入法有两种拼音输入法和笔画输入法其中拼 音输入法是用户向手机输入汉字的方式之一在手机中用拼音输入汉字不向 在 pc 机上一样手机中的键盘一般为 3*3 的矩阵行列因此 26 个拼音字母 不能一一对应的分配的 9 个键上目前的手机安装了字源, t9等输 入法这些手机字母键位的分配都是按字母顺序从 2 键开始依次分配到每个 数字键上如图 3-1 所示手机的每个按键上都有 3 个或 4 个英文字母如 数字键3上有de 图 3-1 f3 个字母一般的输入法按数字键31 次选择的是 d2 次是e 3 次是f所以在输入拼音的时候需要一一选择所需的字母来组成拼音而 输入法以直观简捷的方法快速输入简短文字信息只需要输入该字母所在 的按键 1 次包含语言输据库的算法能够根据字母组合的可能性自动筛选 输入的不同字母拼写出正确的词语它还可以输入标点符号提供包含大 部分姓名的名字库这样就大大减少了输入时按键的次数提高了输入效率 比如输入电子这两个字使用 t9 输入法只需按数字键342 6后进行简单的选择确定后即可输入电之后联想输入功能会使屏 幕出现一些和电组成常见词组的字这就是输入法智能化 8的一层含义 手机中文输入法的设计与实现 20 3.2 拼音输入法的设计拼音输入法的设计 3.2.1 拼音输入法的硬件设计拼音输入法的硬件设计 作为只涉及输入法实现的硬件其本身并不复杂只需具有输入处理 存储输出部件即可在本文设计当中借助计算机键盘中的数字键和一些功 能键来作为输入部件其基本要求是具有 26 个英文字母键10 个数字键回 车键退格键空格键方向键等硬件框架只起到一种辅助的作用完全 由用户来自己设计定义 本文设计的输入法实在 vc6.0 开发平台下 借住 mfc 的库函数来映射完成的 键盘作为输入设备是 windows 应用程序的另外一个重要的输入手段 当用户按下或释放一个键时 键盘驱动程序 keyboard.drv 中的键盘中断处理 程序对所击键进行编码并调用windows的用户模块user32.exe中的有关程序 来生成键盘消息最终发送该消息到应用程序的消息对列中等待处理 键盘上的每一个有意义的键都对应着一个唯一的标识值成为扫描码 当用户按下或释放一个键时 都会产生扫描码 9 键的扫描码可以用来作为键 的标识但它是依赖于具体设备的因此在应用程序中使用的往往是与 具体设备无关的虚拟码虚拟码是由 windows 系统定义的与设备无关的键标 识值 设备驱动程序截取的扫描码然后把它翻译为对应的虚拟码这样由 于键盘输入就产生了一条消息它含有扫描码虚拟码以及其他与击键有关 的信息 键盘上的键一般分为两种系统键和非系统键系统键指 alt 键和 f10 键而其他键则是非系统键这两种键所发送的消息时不同的平时常用的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论