汉字信息处理与汉字输入法.ppt_第1页
汉字信息处理与汉字输入法.ppt_第2页
汉字信息处理与汉字输入法.ppt_第3页
汉字信息处理与汉字输入法.ppt_第4页
汉字信息处理与汉字输入法.ppt_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第章 汉字信息处理与汉字输入法,据统计,全世界使用汉字的人数约占世界总人口的36%。虽然汉字是世界上使用人数最多的文字之一,但早期的计算机是不能处理汉字信息的。拼音文字如英文,其单词可以由为数不多的字母通过不同的排列来构成。因此,用计算机来处理就比较简单。而表意文字如汉字,其构成词的符号是独立的。不但符号数量多,而且结构复杂,计算机处理起来就比较困难。,自20世纪60年代以来,日本、中国及其他一些国家相继开展了汉字信息处理的研究。1974年,我国将汉字信息处理研究课题“748工程”列为国家重点工程,研制汉字精密照排系统和汉字情报检索系统。20世纪70年代末到80年代初,我国在汉字基本属性、编码

2、和存储、输入与输出设备和汉字应用系统等方面的研究取得了迅速的进展。尤其是激光精密照排系统已达到世界领先水平,微型机汉字信息处理技术进入了实用阶段,使我国计算机应用的深度和广度都向前迈进了一大步。,. 汉字信息处理的基本问题 . 微机汉字信息处理系统的构成和使用 4. 3 拼音码输入法,第章 汉字信息处理与汉字输入法,. 汉字信息处理的基本问题,4.1.1 文字信息的计算机处理过程 要用计算机来处理文字,必须解决如何把文字输入计算机并在计算机中存储起来,进行适当处理之后再输出文字等问题。首先要解决用0、1代码串表示文字符号的问题,也就是前面提到的编码问题。,以英文信息的计算机处理为例,英文字符的

3、编码标准是ASCII码,即美国信息交换标准代码。这是七位的二进制代码,它是美国国家标准学会(ANSI)为计算机的信息交换提出的标准,后来由国际标准组织(ISO)确定为国际标准字符编码。为了和国际标准兼容,我国根据它制定了英文字符编码国家标准,即GB1988。其中除了将货币符号置换为人民币符号外,其他都与ASCII码相同。,计算机的键盘原本就是为英文输入设计的,只要按照字母击键,就可以输入英文。键盘的译码电路按照所击的键产生英文字符的ASCII码,输入到计算机的内存中。为了对输入的文字进行编辑加工,必须使用相关的应用软件,如Word 2000、WPS 2000,或其他文字处理软件。经过编辑的文本

4、仍然以ASCII码表示。输出时,这些代码必须转换成字符字形的点阵,以便显示或打印。因此,计算机必须存储每个英文字符、数码以及标点符号的点阵信息。这些点阵信息构成了所谓“字模库”。字模库的点阵以有点或无点来表示文字和符号。,文字、符号的点阵信息由显示器或打印机输出时,必须通过相应的驱动程序,将点阵信息转换为显示器、打印机的电子或机械的操作。文字信息的计算机处理过程如图4.1所示。,图4.1 文字信息的计算机处理过程,汉字信息的计算机处理过程与英文信息处理过程是类似的。不过,由于汉字信息的特点,以及要考虑与英文信息处理系统兼容等问题,处理的难度更大。我国经过多年的研究,汉字处理的基本问题已经解决。

5、,4.1.2 汉字编码标准 为了用0、1代码串表示汉字,在汉字系统或通信系统之间交换信息,必须给每个汉字规定一个统一的代码。这就是汉字的交换码。1981年5月,我国国家标准总局颁布了信息交换用汉字编码字符集(GB 2312-80),作为汉字交换码编码的国家标准,简称国家标准汉字编码,或国标码。收进该标准的字符共有7 445个。其中一级汉字3 755个,二级汉字3 008个,共计6 763个。一、二级汉字约占近代文献汉字累计使用频度的99.99%。为便于查找,一级汉字按汉语拼音顺序排列;二级汉字一般不易熟记它们的发音,故按部首和笔画排列。另外还包括常用符号、序号、GB 1988图形字符集、日文假

6、名、希腊字母、俄文字母、汉语拼音、注音字符、制表符号等。,返回首页,累计使用频度不足0.001%的汉字数量接近1万个。为了满足计算机实际应用的需要,我国在GB 2312-80的基础上扩大收字的范围,制定了“汉字内码规范”GBK,包含了20 902个汉字,又称为扩展的国标码。在Windows 95/98和其后的Windows 2000中,装入了GBK的全部汉字和符合GBK和GB 2312-80的输入法。 由于汉字的字符多,一个字节八位二进制代码不足以表示所有的常用的汉字。为了不与西文的ASCII 码混淆,在微型机汉字系统中,国标码的每个符号都用两个字节(十六位)代码来表示,并作为转换为机内码或其

7、他汉字处理代码的依据。,1. 国标码 汉字国标码就是GB 2312-80为汉字规定的代码,也称为交换码。国标码是汉字编码的国家标准。在GB 2312-80代码表中,纵向分为093,共94行;横向也是093,共94列。行与列分别用七位二进制码表示,第一字节表示行,第二字节表示列。其值都从0100001到1111110。这正是ASCII 码的可打印字符的编码。其范围为十六进制的217E。汉字国标码是将第一字节和第二字节连写而得到的。由于二进制形式太长,通常用十六进制表示。 例如: 汉字第一字节第二字节十六进制 区位码 啊 0110000 0100001 3021 1601 保 0110001 01

8、00011 3123 1703 播 0110010 0100101 3225 1805,图4.2给出了GB 2312-80代码表(局部)。 b7 第 b6 二 b5 字 b4 节 b3 b2 b1 第一字节 位 b7 b6 b5 b4 b3 b2 b1 区 16 啊阿埃挨哎唉哀皑 17 薄雹保堡饱宝抱报 18 病并玻菠播拨钵波 19 场尝常长偿肠厂敞 图4.2GB2312-80代码表(局部),2. 区位码 国标码还可以表示成区位码的形式。在GB2312-80代码表中,将行号称为区号,列号称为位号,分别有94个区和94个位。将汉字置于其中,由区号与位号标识出汉字在代码表中的位置。区号与位号都用两

9、位十进制数表示,不足两位的前面补零。每个汉字或符号的区号和位号连起来就组成这个汉字或符号的区位码。这样,每个汉字或其他符号都可以用位十进制数表示。因此,区位码可以用来作为汉字输入的编码。,在区位码表中,19区为字母、数字、特殊图形符号等;1015区是未定义的空区;1655区为一级汉字区;5687区为二级汉字区。例如,“啊”字的区位码是1601,“保”字的区位码是1703,“播”字的区位码是1805,等等。 区位码与国标码之间有一定的对应关系: 将区位码的区号和位号分别由十进制转换成对应的十六进制数,然后加上十六进制数2020H(H表示2020为十六进制数码),就得到对应的国标码。例如,“啊”字

10、的区位码是1601,分别将区号和位号转换成对应的十六进制数得1001H,再加上2020H就得到“啊”字的国标码为3021H。,3. 机内码 汉字机内码是在计算机内部实际用来表示汉字的代码。不同的计算机系统使用的机内码是不同的。在微型机中,多采用两字节代码作为机内码。在大、中型机中,多采用三字节或四字节代码作机内码。 制订机内码必须考虑下列因素:汉字与西文易于区别;中、西文兼容;码长短,每个汉字所占字节数少;与国标码有较简单的对应关系,便于信息转换。,目前,多数微机汉字系统的机内码是以国标GB 2312-80规定的双七位代码为依据,经一定转换后用两个字节表示一个汉字。每个字节的最高位均为,以此作

11、为汉字的标记,以便于与ASCII码编码的符号相区别。 由国标码转换为机内码的规则是:将十六进制的国标码加上8080H,就得到对应的机内码。 如“大”字的区位码为2083,国标码为3473H,机内码为3473H+8080H=B4F3H。将B4F3H 化为二进制数得:1011010011110011,这就是在计算机中实际使用的机内码的二进制形式。 8080H等于二进制的1000000010000000,国标码加上8080H,可以保证机内码每个字节首位均为。,返回首页,4.1.3 汉字输入方法 汉字输入是指将汉字转换成对应的机内码,并送入计算机存储起来。由语音转换成文字输入计算机的技术目前还不成熟。

12、通过光学字符阅读器 (OCR-Optical Character Reader) 可以将印刷体汉字作为图形点阵输入,然后进行字符识别,把汉字点阵转换成对应的机内码。这种方法已经达到实用阶段,但是设备较昂贵。因此,常用的汉字输入方法是键盘输入。 根据键入技术来分类,汉字的输入大致可分为整字、字素和编码三大类。 大键盘整字输入采用一字一键的输入方法。这种方法需要特制的大键盘。在普通汉字系统上几乎不用,只是在专业系统(如电子照排)等某些特定的场合使用。,字素键入直接利用ASCII码标准键盘,把字素刻在键帽上,将汉字分解后按一般的笔顺键入。 编码输入是用得最普遍的一种方法。它用ASCII码标准键盘输入

13、汉字。由于汉字字数多,键盘的键数目少,因此要用几个键的组合来表示一个汉字。这种组合称为汉字输入编码。目前国内、外提出的汉字输入编码方案不小于500种。不同的编码方案对应于不同的输入方法,这些方案各有千秋。编码长度、规则的复杂程度、重码率等因素决定了不同编码方案的优劣。实际上流行的汉字编码输入方案只有十几种。如拼音码、自然码、表形码、郑码、五笔字型码、国标区位码、首尾码、仓颉码以及电报码等。,以汉字字型特征来编码的方案俗称“形码”。形码编码规则往往较复杂,与阅读文稿时大脑的思维习惯(读出声音)不甚符合,要求用户熟悉汉字笔划、偏旁部首,且要经过较长时间的训练才能熟练使用。形码比较适合于以“看打”(

14、边看文稿边输入)为主的专业录入人员。 以语音特征来编码的方案俗称“音码”。音码适合于“想打”(边构思边输入)和“听打”(口授输入),但要求汉语发音标准。音形混合的编码方法虽然较全面地利用了汉字提供的信息,但用户使用时,一时要想到汉字的读音,一时又要辨认汉字的字型,不但易疲劳,速度也难以提高。,在汉字编码输入研制初期,以单个汉字的编码输入为主。重码少、单字输入速度快的方法,如五笔字型、区位码、电报码等,其学习负担往往较重。而较简单易学的输入方法如拼音码,往往重码较多,输入速度较慢。但是,自从汉字输入方法由单个汉字的输入发展到以词和词组为单位的输入后,重码大为减少,输入速度和实用程度大为提高,各种

15、输入方法之间速度的差别也在缩小。,值得一提的是音码中的拼音输入法有了较大的发展,实现了以词为单位甚至以句子为单位的输入,实现了高频词先见、在线造词和词组等功能,使拼音输入法做到得心应手、运用自如。由于拼音输入法符合汉语拼音规范,学习负担轻,适合于普通用户。对于个人机用户而言,工作时多数是边想边打,对速度要求只要高于手写输入即可,选择输入法时应把适合“想打”、学习负担轻放在首位。从这个角度看应以学习拼音输入法为好。拼音输入与原有的知识基础相衔接,适应我国文字改革的方向,对于拼音基础较好的年青一代而言,尤其应大力提倡。,形码中的郑码为著名语言学家郑易里先生所发明,是20世纪90年代优秀汉字输入法之

16、一。郑码编码规则简明,符合我国语言文字规范,容易掌握。其编码方法适应性广,不但可以给大陆通用的简体汉字编码,也可以给港、台流行的繁体汉字编码,还可以给日本、韩国所使用的汉字编码。1994年用郑码完成了电脑大汉字库6万个汉字的编码,每字最多用4个英文字母表示。在微软公司与我国电子部共同推出的Windows 95/98(中文版)和Windows NT国际中文版中,装入的唯一的形码就是郑码。,不论哪一种输入方案,在具体实现时都要有软件的支持。输入法软件将键盘输入的编码转换为国标码,再转换为机内码,就可在计算机内存储、处理。 目前汉字的编码输入研究还在继续之中。不过研究的重点已经从编码方案本身转向软件

17、技术和设计,试图通过更好的软件技术和设计来做到重码少、适应面广、学习负担轻。在汉字编码输入方面,我国已经走在世界的前列。,返回首页,4.1.4 汉字字模库 汉字输出的方式有两种:显示和打印。不论哪一种输出方式,都是把一个汉字看成一个二维图形,并把笔划离散化,用点阵来表示汉字。点阵的每个点位只有两种状态:有笔画上的点或无笔划上的点。这就可以用一位二进制代码来表示。该位取值为1表示 “有点”,取值为0表示 “无点”。那么,一个二进制代码串就可以表示点阵的一行。若干个代码串就表示整个汉字的点阵信息。在具体实现时,点阵上取值为1就显示或打印一个“点”,否则不显示或打印。如汉字“梅”就可用图4.3所示的

18、点阵图来表示。,图 4.3 汉字的点阵表示,描述一个汉字点阵信息的二进制代码串称为汉字的“字模”,其作用跟铅字印刷所用的字模相当。所有汉字和各种符号的点阵信息就组成汉字的“字模库”(简称字库)。显然,要实现近8 000个常用汉字和符号的显示和打印,字库要占很庞大的存储空间。例如1616点阵的汉字库(包括一级和二级汉字)就需要约240KB 的存储空间。2424 点阵的汉字库需 580KB,精密字库所需的存储空间更大。常用的几种汉字点阵类型的参数见表4.1。,表4.1 汉字的点阵类型 点阵类型点阵参数 每个汉字 (行列) 占的字节数 简易型 1616 32 B 普及型 2424 72 B 提高型

19、3232 128B 精密型 4848 288B,字库可以存放在磁盘(软盘或硬盘)上,称为软字库。它不需要对硬件进行改动。每次开机时,将字库从磁盘调入计算机的内存中,供显示用。这样做查找速度快,但要占用机器的内存空间。由于微型机的内存容量已经大到128M以上,装入软字库不成问题,因此软字库得到普遍使用。 另一种方法是把字库装在可擦除只读存储器 (EPROM) 或只读存储器 (Mask-ROM)里,这就是所谓硬字库,俗称“汉卡”。把汉卡插到微机扩充槽内,作为机器的一个扩充ROM存储区使用。这种方法已经很少使用。,返回首页,4.1.5 汉字显示输出 从键盘输入的汉字经过键盘管理模块,变换成机内码。然

20、后经字模检索程序,查到机内码对应的点阵信息在字模库的地址,从字库中检索出该汉字点阵信息。利用显示驱动程序将这些信息送到显示卡的显示缓冲存储器中。显示器的控制器把点阵信息整屏顺次读出,并使每一个二进制位与屏幕的一个点位相对应,就可以将汉字字形在屏幕上显示出来。如果显示彩色,则还要附加色彩信息。以上工作过程可用图4.4表示。,图4.4 汉字显示原理,一般在PC机的图形模式下用1616点阵显示一个汉字。满屏能显示多少个汉字取决于显示器的分辨率。目前PC机的显示器起码使用VGA卡,显示25行汉字(每行40字)效果已经不错。使用更高分辨率更大屏幕尺寸的显示器相当普遍。,4.1.6 汉字打印输出 PC机利

21、用原有的打印机接口,配接具有图形打印功能的打印机,配上相应的汉字打印软件(驱动程序),就可以实现汉字打印输出。无论是针式打印机、喷墨打印机或激光打印机,都是将汉字分解为点阵,在输出时将汉字字模点阵作一定转换后用不同的方法打印到纸上。 汉字打印的工作原理如图4.5所示。先将欲打印的汉字机内码送到内存的打印缓冲区。然后从中逐个取出机内码,通过字模检索程序从字模库中检索出该汉字的点阵信息,存入内存的字模缓冲区中。通过字模变换程序转换点阵信息,使之适合打印机输出。然后由接口卡送到打印机的打印数据缓冲区。等一行汉字的打印信息全部到齐(激光打印机则等待一页打印信息到齐),打印头就开始打印。打印数据不断送往

22、打印数据缓冲区,直到全部数据送完为止。,图4.5 汉字打印的工作过程,返回首页,. 微机汉字信息处理系统的构成和使用,微机汉字信息处理系统必须具有汉字输入、汉字信息加工处理、汉字输出三个方面的部件。同时,还要有一个汉字字模库。考虑到中、西文处理的兼容性和技术上实现的易行性,现有微机汉字信息处理系统构成的一个指导思想是:尽量利用原有西文计算机的硬件,通过改造系统软件,做到在原有处理西文的基础上,增加处理中文的功能,而不降低原系统的效率。,4.2.1 汉字信息处理系统的硬件 汉字信息处理系统的硬件包括微机的主机和常用的外部设备,如磁盘驱动器、标准键盘、图形显示器、打印机等。以上设备原有的西文计算机

23、都已具备。汉字库则有软字库和硬字库两种。软字库可以存放在软盘或硬盘上,使用时调入内存。有些打印机也自带硬字库。,4.2.2 汉字信息处理系统的软件 微机汉字信息处理系统的软件同样包括系统软件和应用软件两类。系统软件包括Windows中文版、能处理汉字的高级程序设计语言及其编译器(语言处理程序)等。其中支持Windows的高级语言如Visual Basic(VB)、Visual C(VC),以及近年针对网络应用的开发工具如Power Builder、Java等很流行。Windows 95/98(中文版)和Windows 2000操作系统已经具备汉字处理功能,一般的西文软件不必作专门的处理就可以在

24、其上运行,做到了中西文兼容。,最基本的汉字信息处理应用软件是文本编辑软件。功能最强的自然是电子出版系统,能适应专业出版的需要。如北大方正出版系统。办公使用的是桌面排版系统,其输出精度比专业排版系统差一些,但是其功能也相当强大,可满足一般排版需求。基于Windows 2000的文字编辑软件有Word 2000、WPS 2000等。 其他应用软件主要有能处理汉字的数据库管理系统,如Visual FoxPro和Access等。特定应用领域的应用软件则门类繁多。如财会软件、人事档案管理软件、工资管理软件、民航或铁路售票系统、计算机辅助设计专家系统、计算机辅助教学系统、决策支持系统等。可以说,汉字信息处

25、理系统的软件已相当成熟。,返回首页,4.2.3 Windows 2000汉字输入法的使用 Windows 2000的基本使用方法已经在第3章介绍,这一节主要介绍有关汉字处理功能的使用。Windows 2000提供了多种汉字输入法。其中全拼、智能ABC、微软拼音、双拼、表形码、郑码等都是较常用的输入法。其他扩充的汉字输入法,如五笔字型,需要另行安装后方可使用。,1. 汉字输入法的安装 在安装Windows 2000时一般都会预装基本的56种汉字输入法,它们均存放在Windows 2000系统文件所在的文件夹中。如果想增添其他由系统提供的汉字输入法,可以用以下方法装入: 单击“开始”按钮,单击“设

26、置”“控制面板”,在弹出的窗口中双击“键盘”(或“输入方法”)图标,打开“键盘属性”对话框,选“输入法区域设置”选项卡标签(图4.6),单击“添加.”按钮,在出现的对话框的输入法列表中,选定需要的输入法,单击确定按钮,然后按照提示操作即可。如果在“已安装的输入法区域设置”选定某种输入法,再单击“删除”按钮,可将选定的输入法删除。,图4.6 “键盘属性”对话框,2. 汉字输入法的启动和关闭 启动Windows 2000后,默认的输入法是英文输入法。要想输入汉字,必须启动汉字输入法。方法如下: 单击桌面上任务栏右边的输入法指示器(“CH”图标),即出现输入法列表框(图4.7)。移动鼠标指针到拟选的

27、输入法,单击选定,就会出现汉字输入状态框,启动完成。,输入法列表框,输入法指示器,图4.7 输入法指示器和输入法列表框,关闭汉字输入法的方法如下: 移动鼠标指针,单击桌面的任务栏输入法管理框图标(图4.8),选定“关闭输入法”即可。关闭汉字输入法之后,回到英文输入法。再次单击此框,仍可重新打开原先的输入法。 如果在启动某种汉字输入法后再次单击输入法指示器,则可选定另一种汉字输入法,进行汉字输入法的切换。此时如果选定英文输入法,则原先启动的汉字输入法自动关闭。 键盘操作的方法如下:按组合键空格键即可启动汉字输入法,再按一次则关闭汉字输入法,回到英文输入状态。按键(有些系统按键,视设置而定)可以在

28、汉字输入法之间轮流切换。,3. 汉字输入法状态框 汉字输入法的状态框由下列按钮组成。 (1) 中英文切换按钮 启动汉字输入法后,想要输入英文,不必退出汉字输入法,可以单击中英文切换按钮,在中、英文输入状态之间进行切换。显示“A”或“英”表示处于英文输入状态,显示图案或“中”表示中文输入状态(图4.8)。 (2) 输入法名称框 此框显示输入法名称,通过单击此框,有些输入法可以改变拼法。,中/英文切换,全角/半角切换,软键盘开关,输入法名称,中英文标点切 换,输入法管理框,图4.8 汉字输入法状态框和输入法管理框,(3) 半角全角切换按钮 全角字符与半角字符是两种不同的字符。全角字符按照国标GB

29、2312-80 编码,使用两字节机内码表示一个符号,占2个显示位。半角字符按ASCII码编码,使用一字节机内码表示一个符号,占1个显示位。 启动系统后,默认进入英文输入状态,这时只能输入英文字符、按照ASCII码编码的数字及其他符号。 启动汉字输入法后,其工作方式有两种: 半角方式 输入的英文字符按ASCII 码编码,为半角字符。但汉字仍按照国标GB 2312-80 编码,为全角字符。因此是一种中西文混合方式。当选择汉字输入方式后,自动进入此方式。 全角方式输入的汉字或英文字符及其他符号,一律按国标GB 2312-80 编码,全部为全角字符,又称为纯中文方式。这时英文字符、标点符号和数字均使用

30、两字节机内码,屏幕显示占两个ASCII码字符的位置。,在半角方式下,半角/全角切换按钮显示半月形符号。在全角方式下,显示完整圆形符号。单击该按钮即可在半角方式和全角方式之间切换。 在文本中的中文标点符号通常用全角符号。操作系统命令、程序语句的行号及关键字都必须用半角符号。否则计算机将不接受这些命令或语句,判为“句法错”。因为按要求,这些命令和语句的字符必须使用ASCII码。,(4) 中英文标点切换按钮 中文标点符号状态以中文的句号(小圆圈)作为标志,而英文标点符号状态以英文句号(小圆点)为标志。要使用汉字特有的标点符号如句号“。”或书名号“ ”等,必须在中文标点符号状态下输入。在半角方式下,如

31、果切换成中文标点符号状态,则输入中文标点符号仍然有效,占两个半角字符位置。反之,在全角方式下,如果切换成英文标点符号状态,则输入的所有标点符号按照两字节编码,显示占两个半角字符位置,但是中文标点符号仍然需要在中文标点符号状态下才能输入。,在中文标点符号状态下,键盘按键与中文标点符号的对应关系如表4.2。 表4.2 中文标点符号与按键的对应关系 中文标点符号 按键 句号 。 . 顿号 、 逗号 , , 左书名号 单引号 双引号 “ ” 省略号 (上档键) 破折号 _(上档键) 居中实心点 人民币符号 ¥ $ 冒号 : : 分号 ; ; 问号 ? ? 感叹号 ! ! 左括号 ( ( 右括号 ) )

32、 ,(5) 软键盘按钮 用鼠标单击软键盘按钮,可以打开或关闭软键盘。软键盘在屏幕上显示,输入时用鼠标单击软键盘上的按键,可以代替手指击键。也可以通过任务栏上的输入法管理框,单击“打开软键盘”或“关闭软键盘”实现同样的功能。 用鼠标右键单击软键盘按钮,还可以弹出用于输入希腊文、俄文、日文数字、单位符号和特殊符号的软键盘,这给输入这些符号带来了方便。,4. 编码框和词语选择框 输入汉字对应的编码时,就会出现编码框。如果有重码,就会出现词语选择框(参见图4.10)。编码框显示输入的汉字编码,按键则取消输入的编码字符,等待新的输入。词语选择框显示重码的词语,供用户选择。在词语选择框中最多出现10个选项

33、。重码超过10个时,可以使用框中的翻页按钮前后查找。也可以用键盘的“”和“”键前后翻页。,5. 输入法综合设置 为了使输入汉字更方便,Windows 2000提供了输入法综合设置,用户可以根据自己的习惯进行选择。输入法综合设置的步骤如下:按照安装汉字输入法的操作方法,单击“控制面板”中的“键盘”,出现“键盘属性”对话框后,选择列表框所列的已经安装的某种输入法。单击“输入法区域设置”,单击“输入法设置”按钮,即可出现图4.9的输入法设置对话框(有些输入法可能有不同选项)。选项的意义解释如下:,(1) 词语联想 选定该项,则设置词语联想功能,否则取消词语联想功能。在词语联想状态,当输入的汉字有联想

34、词语时,会将联想词语显示在输入法窗口选择区,可用“”和“”键翻页,用数字键选定。默认设置为取消联想。 (2) 词语输入 选定该项,则设置字、词混合输入功能,即既可以字为单位来输入,也可以词为单位来输入。否则取消词语混合输入功能。这时,仅可输入单个汉字,不能以单词为单位来输入。默认设置为允许字词混合输入。,(3) 逐渐提示 选定该项,则设置逐渐提示功能,否则取消逐渐提示功能。在逐渐提示状态,每键入一个编码字符,词语选择框就会提示与已经输入的编码有关的汉字、单词。随着输入的字符增多,所提示的汉字和单词范围逐步缩小。如果取消逐渐提示,则只在键入的编码结束才显示相关的汉字或单词。默认设置为逐渐提示有效

35、。 (4) 外码提示 选定该项,则设置外码提示功能,否则取消外码提示功能。所谓外码提示功能指的是键入汉字的编码时,在词语选择框显示这些字、词需要继续键入的编码。默认设置为外码提示有效。 (5) 光标跟随 选定该项,则光标跟随有效,即词语选择框出现的位置可以跟随着文本输入的光标移动,总是出现在光标的右方。如果取消该项设置,则词语选择框只出现在屏幕下方的固定位置。,图4.9 输入法设置对话框,返回首页,4.3 拼音码输入法,拼音码是根据国家正式公布的汉语拼音方案标准进行编码的。汉语拼音方案的语言形式有声、韵、调三要素。现行的计算机拼音码输入法只取其中声、韵两要素,而去掉其声调要素,如“桂林”的拼音

36、为“guln”,拼音码则取为“guilin”。 在用拼音码输入汉字时,一般要求使用小写字母,即 指示灯不亮。遇到不能向计算机输入汉字时,如果 指示灯亮,应先敲一下 键,使输入方式由输入大写字母状态转换为输入小写字母状态。,4.3.1 拼音码输入法的优缺点 拼音码输入法是最容易学习和使用的一种汉字输入法,适合于普通的计算机用户。其突出优点是编码规范,与用户原有的汉语基础知识相衔接,不必使用额外的编码规则,学习负担轻。只要学过汉语拼音,键盘操作基本正确,就可以用拼音码输入汉字。基本上无须再学习其他规则,也不必经过长时间的训练。即使有些用户发音不准也不要紧,拼音错了练几遍就可以纠正过来。,拼音码输入

37、法的另一个优点是适合于“想打”、“听打”。人们在构思文稿、思考问题、口授文本时,用的是语音而不是字形。拼音码输入法与大脑的思维习惯相符合。因此,对于从事文学创作、论文撰写的人员,最适合用拼音法输入。 汉语拼音是我国汉语的标准发音,在国内、外都通用。拼音码输入法规范化程度高,适合于汉字文字改革的方向,有利于国内、外的文化交流,适合于外国人学习,有利于在国外开展中文教学。,由于软件技术的进步,拼音码输入法的输入速度已经进入先进汉字输入法的行列,完全可以满足平时写作和输入文稿的需要。 拼音码输入法的缺点是:不会读音的生字无法输入。对普通话讲得不好的人,学习有一些困难。不过,这点困难并不是不可克服的。

38、从积极方面说,正可以促进普通话的学习和推广。对于个别不会读音的生字,可以用其他输入法解决,也可以查阅字典找到其发音再输入。,返回首页,4.3.2 全拼输入法 全拼输入法按照汉语拼音方案编码,将标准西文键盘上的小写字母当作汉字的拼音字母。键盘上没有汉语拼音中的“”,用“v”代替。“e”中的字母“”用“u”代替。使用时逐个字母键入,直到一个汉字或词组的拼音字母全部键入为止。 1. 单个汉字输入 逐个输入汉字对应的拼音字母,如果有重码,再用数字键选取所需的汉字。如果当前词语选择框中没有要找的汉字,则单击该框上的翻页按钮查找。也可用键盘上的“”、“”键翻页前后查找。 例如,输入“lv”,将得到图4.1

39、0的词语选择框。选择单个汉字前的数字,就可以将该汉字送到编辑光标处。,输入法状态框,编码框,翻页按钮,词语选择框,图4.10 单个汉字的输入,为了避免重码选字的麻烦,也可以用下面的单词和词组输入的方法,先输入有关的单词,再删去不需要的汉字。比如要输入“众”字,可以先输入“众人”或“群众”。,2. 单词和词组输入 全拼输入法输入单词和词组的方法是:键入单词的第一个汉字的拼音后,不选字,紧接着键入第二、第三个汉字的拼音再用数字键进行选择。这样做重码的机会大为减少。如果是三字词或词组,一般不用翻页即可以找到所需的单词或词组。例如,想要输入单词“旅行社”,在键入“lvx”,即可得到如图4.11的词语选

40、择框。选择数字5,就可以将该单词送到编辑光标处。,如果设置了联想功能,当选出一个汉字后,将会出现一系列以该汉字开头的单词和词组供选择。这样也可以达到输入单词和词组的目的。如上例,在键入“lv”后,选数字5(旅),就会出现“旅程”、“旅店”、“旅馆”、“旅行”、“旅行社”等词组。再选对应的数字即可输入相应的词组。,图4.11 单词和词组的输入,4.3.3 智能ABC输入法 智能ABC输入法是一种以拼音为主的汉字输入法,由于辅以笔形输入,有效地解决了重码问题。该输入法的编码元素为26个英文字母和10个数字,可以做到高频先见,词组输入。智能ABC使用灵活方便,重码少,速度快,容易学习,会拼音、熟悉英

41、文键盘即可使用。很多功能是通过程序实现的,具有一定的智能性。 在输入编码时,下面的按键有特定的意义: 空格键结束一次输入,按词转换。 回车键结束一次输入,按字转换。 退格键删除前一字符,或转换汉字为输入码。 “”、“”或“-”、“=”前后翻页键。,1. 高频字的输入 智能ABC输入法虽然没有高频字的提法,但是每键入一个声母就会列出以该声母开头的汉字,击空格键就可以将头一个汉字输入。因此,在26个字母中,除了u、v之外,有24个可以做到一键一字,相当于高频字。高频字的键位如下: q去 w我 e饿 r日 t他 y有 u i一 o哦 p批 a啊 s是 d的 f发 g个 h和 j就 k可 l了 z在

42、x小 c才 v b不 n年 m没,2. 单个汉字的输入 智能ABC输入法输入单个汉字的基本方法是逐个键入该汉字的全部拼音字母。在这点上与全拼输入法相同。当有重码时可以使用音形混合编码输入,以提高输入的速度。 3. 双字词和词组的输入 智能ABC输入法的优势在于词组的输入。要输入某个词组,可以逐个键入其中的每个汉字的声母和韵母,还可以键入每个字的声母。这个方法对常用的词组有效。而且词组越长,效果越好。以下四种方法可以灵活使用。使用其中一种方法,当词语选择框出现所要的词组,即可按空格键或数字键输入。,声-韵-声-韵输入: changcheng 长城 声-韵-声输入: changch 长城 chan

43、gj 长江 ted 特点 声-声输入: chch, chc, cch, cc 长城 zg 中国 wh 文化 gq 过去 dn 电脑 kl 看来 jsj 计算机 shhg 山海关 jjtq 经济特区 zhhrmghg 中华人民共和国 声-声-韵输入: chcheng 长城 zhguo 中国 lshi 历史 hda 回答,4. 隔音符() 有些单词用上述方法输入时,会因为声母和韵母连在一起,将两个(或三个)汉字拼成一个。此时可加入隔音符“”,将两个汉字分隔,即可得到正确的结果。 例如: xian 西安 tanm 天安门 fan 方案 de 定额 dier 第二 lin 历年,5. 音形混合编码输入 在仅使用声-声输入时,有时可能重码多,需要较多的翻页操作,这样会降低输入的速度。为了减少翻页,智能ABC输入法允许使用笔形代码和拼音混合编码。所谓笔形代码就是某个汉字的第一笔的笔形。智能ABC输入法将笔形代码规定为如下8个,分别用数字18来代表:,笔形代码 1 2 3 4 5 6 7 8 笔画名称 横 竖 撇 捺(点) 折 弯 叉 方 笔画举例 一 丨 丿 、 乙 十 囗 当输入声母重码多的时候,可以在声母代码之后输入汉字的笔形代码,再按空格键。与不使用笔形代码而直接键入声母相比,重码大为减少。例如: 广场 g4ch 战功 z2g1 正规 z1g1 昆明 k8m8 天安门 t1am

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论