五笔字型汉字输入技术_第1页
五笔字型汉字输入技术_第2页
五笔字型汉字输入技术_第3页
五笔字型汉字输入技术_第4页
五笔字型汉字输入技术_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

五笔字型录入技术江苏省吴江中等专业学校卞玉明

2011年2月五笔字型汉字输入技术五笔字型汉字输入法是一种依据汉字的字形属性编码输入汉字的技术。依据汉字字形与结构的特性,接受字根拼形输入汉字,通过细心优选的130个基本字根,像搭积木一样拼合成汉字。这些字根被科学地分区归位,奇异地与计算机标准键盘上的二十五个键位联系在一起,规律性强,易学好用。用五笔字型输入法输入汉字,编码长度短,无论多么困难的汉字和词汇,最多只需四次击键即可输入。平均每个汉字码长2.6键;重码少、字词兼容,字、词输入无需换挡,输入效率高;经过确定的训练,输入速度可高达每分钟160个汉字。目前五笔字型汉字输入技术已经为广袤计算机运用者所接收,成为一种应用最为普遍的汉字输入技术之一。一、五笔字型汉字编码基础由于五笔字型汉字输入法是依据汉字的字形编码输入汉字的,因此首先要了解汉字结构的基本学问。一、汉字的三个层次:为笔画、字根、单字。汉字是一种图形文字,构成汉字图形文字最基本的图形线条称为笔画,由若干笔画复合交叉连接形成了结构相对不变的字根(通常称为偏旁、部首),字根按确定的位置关系拼合形成为数众多的汉字。因此汉字的三个层次为笔画、字根、单字。字根是构成汉字的最基本的单位。二、汉字的五种笔画:横、竖、撇、捺、折。三、汉字的三种字型:

汉字的字型指的是多个字根构成汉字时,字根间的相互位置关系。有左右型、上下型和杂合型三种字型。如下表所示:字型字型代码字型结构图示字例左右型1叭浙话到上下型2只宴型莅杂合型3困凶运乘司且

了解和正确划分汉字字型,对于学习五笔字型汉字输入技术中的“末笔字型交叉识别码”很有用处!汉字的字型特征可以作为识别汉字的一个重要依据。例:只与叭的字根相同,均为口和八,但只为2型,叭为1型

员与呗的字根相同,均为口和贝,但员为2型,呗为1型四、汉字的结构分析汉字由字根构成,字根在构成汉字或偏旁时,它们之间的关系可分为单、散、连、交四种类型。(1)单:构成汉字的字根只有一个,如:人、木、川、田等。(2)散:构成汉字的各字根间有确定距离或明显界限,如:和、时、吕、别、型等。(3)连:字根与一单笔或一孤立点相连,如:千、玉、太等。(4)交:构成汉字的各字根相互交叉套迭,如:里、内等。字根在构成汉字时的这种单、散、连、交结构与其字型有确定的联系:一般,“单”结构不须要划分字型;“散”结构可划为左右型或上下型;“连”、“交”结构通常为杂合型。二、五笔字型字根键盘1、五笔字型的基本字根五笔字型的基本字根由优选的组字频率及好用频率最高的125个基本字根、5种单笔画(横竖撇捺折)及一些变形字根共199个字根构成。其中大部分是传统的偏旁部首,但也有象足、鱼狠、补等一些常见的偏旁部首没有被选作为基本字根。2、基本字根的键盘布局及标识五笔字型将125个基本字根和5种单笔画,依据起笔的不同(横竖撇捺折)分成五大类,称为区;每一类再分成五组,共25组;每组字根占据键盘上的一个键位,称为位。以一两位数来标识、命名该组字根,十位数标识区号,个位数标识位号。分别用11~15、21~25、31~35、41~45、51~55表示25个键位。对应于英文字母A~Y。3、键名的规定与字根分布1)键名的规定在五笔字型键盘上,每组字根中选择一个最代表的字根作为该键位的键名,作为键名的字根称为键名字根,写在各键位的左上角。下面给出各区各位的键名、键名字根及对应英文字母。位号123451区横起类:27个王土大木工(GFDSA)2区竖起类:23个目日口田山(HJKLM)3区撇起类:29个禾白月人金(TREWQ)4区捺起类:23个言立水火之(YUIOP)5区折起类:28个已子女又纟(NBVCX)2)五笔字型的字根键盘分布(A~Y)键名字根区位号与对应的字母4、五笔字型字根分布的一般规律五笔字型的字根分布是经过细心设计、科学支配的,有较强的规律性。了解这些规律有助于记忆和找寻字根。1)大多数字根(80个左右)依据其首笔支配其区号,依据其其次笔支配其位号。看字根分布如:王(11)、土士十寸(12)、大犬(13)、禾(31)、白(32)2)部分字根(16个简洁笔画重复构成的字根)排在笔画所在的区,笔画数所在的位。看字根分布如:一(11)、二(12)、三(13)、丨(21)、刂(22)、川(23)3)部分字根形态相近或渊源一样的字根支配在同一键位上。如:王与五、月与用、人与八、右与石、四甲皿与田、大与犬、已乙与己等。看字根分布4)特殊状况如:衣与E的读音相近;力的声母为L等。无规律的有:巴马丁西车心等。五笔字型字根键盘三、五笔字型拆分汉字的方法拆分汉字是指:将一个具体的汉字拆分为若干个五笔字型的基本字根。其总原则:遵循汉字书写依次,从左到右,从上到下,从外到内进行。如:新:立木斤;照:日刀口火;国:口王丶;过:寸这其具体方法:依据字根在构成汉字时,它们之间的单、散、连、交四种不同的关系各有不同的方法。(1)单:汉字仅由一个的字根构成,不需拆分。如:人、木、川、田等(2)散:构成汉字的各字根间有确定距离,将汉字从散的界限处拆开如:和禾与口、时日与寸别口力与刂类米与大累田纟与小等。(4)交:当构成汉字的字根之间是交叉或交连关系时,将汉字按书写依次拆分成尽可能大的字根,拆分时不应破坏原笔画。如:果应拆分为曰与木,(曰一小,田与木都不正确)在具体拆分过程中,应留意以下四个原则:1、能散不连例午:一十(tfj)不能拆成丿干2、能连不交例丑:乙土(nfd)不能拆成刀二3、兼顾直观例自丿目(thd)不能拆成仆乙三又如生丿王(tg)不能拆成一土4、取大优先例尺尸丶(nyi)不能拆成口人(3)连:汉字由字根与一单笔或一孤立点相连而构成连的关系时,将汉字拆分成单笔画与基本字根。如:千丿与十,玉王与丶,户丶与尸,天一与大等。四、五笔字型汉字编码技术五笔字型规定:汉字的编码长度最多四码,分单字和词组。单字键名汉字字根汉字一般汉字键名字根如:金、王成字字根如:干、寸非键名、成字字根汉字词组双字词组如:汉字、依据、机械三字词组如:计算机、共产党四字词组如:艰苦奋斗、中国人民多字词组如:中华人民共和国依据运用频度又分一级汉字二级汉字三级汉字以上各种状况不同,其具体编码与输入方法也不一样。(一)单个汉字的编码与输入1、键名汉字的编码与输入键名汉字共25个,分布在A~Y25个键上。!1@2#3$4%5^6&7*8(9)0_-+=E月R白T禾Y言S木D大F土G王U立I水O火P之H目J日K口L田{[}]:;TabQ金W人~`CapsLockA工BackspaceN已M山Enter“‘X纟C又V女B子<,>.?/ShiftZShiftCtrlAltAltCtrl编码与输入方法:键名汉字所在键连击四次!如:王(gggg),月(eeee),木(ssss),之(pppp)等(一)单个汉字的编码与输入2、成字字根的编码与输入第一键其次键第三键第四键报户口首笔画代码次笔画代码末笔画代码十十十土士二十干寸雨12F输入时若不足四码,补空格。土(ffff)士(fghg)二(fgg)十(fgh)雨(fghy)干(fggh)寸(fghy)以下图的横起类12F

键上的各成字字根为例:3、一般汉字(非键名、成字字根)的编码与输入(1)字根数>=4的汉字的编码与输入:按书写依次取第一、其次、第三和最末字根所在键码!如:“副”可拆为一口田刂(gklj)“逾”可拆为人一月之(wgep)(2)字根数<4的汉字的编码与输入:按书写依次取第一、其次、第三字根和末笔字型交叉识别码!若仍不足四键,补空格!末笔字型交叉识别码,依据最终一笔画,确定识别码的区号;依据字型结构确定识别码的位号,由末笔和字型交叉后的区号与位号给出识别码对应的键。如:末笔为“横”,上下结构的汉字,其识别码为12,对应键为F。下面给出末笔画与区号、字型与位号及对应键的比照表末笔画字型左右1上下2杂合3横竖撇点捺折12345GHTYNFJRUBDKEIV例如:“票”可拆分成西二小三个字根,不足四个,其末笔为“点捺”,上下结构,其识别码为42,对应键为U。因此“票”的五笔字型编码为SFIU又如:“标”可拆分成

木二小三个字根,不足四个,其末笔为“点捺”,左右结构,其识别码为41,对应键为Y。因此“标”的五笔字型编码为SFIY下面给出末笔画与区号、字型与位号及对应键的比照表末笔画字型左右1上下2杂合3横竖撇点捺折12345GHTYNFJRUBDKEIV例如:“只”可拆分成口和八二个字根,不足四个,其末笔为“点捺”,上下结构,其识别码为42,对应键为U。因此“只”的五笔字型编码为KWU,仍不足四个,再加一空格。又如:“叭”的字根与“只”相同,但字型为左右型,故其识别码为41,

对应键为Y。因此“叭”的五笔字型编码为KWY,不足四个再加一空格。下面给出末笔画与区号、字型与位号及对应键的比照表末笔画字型左右1上下2杂合3横竖撇点捺折12345GHTYNFJRUBDKEIV例如:“沐”、“洒”、“汀”只有二个字根,对应于I和S键,且均为左右结构,但末笔画各不相同,故它们的识别码不同,分别为41(Y)、11(G)和21(H)各再加上一空格。它们的五笔字型编码分别为:“沐”ISY“洒”ISG“汀”ISH在运用末笔字型交叉识别码时要留意以下三点:①若末笔画在“力、九、刀、匕”这几个字根中,则规定其末笔画为“折”。如:“男”,只有二个字根“田力”,均对应于L键,上下结构,末笔画在“力”中,故取折(5区),其识别码为52(B键),所以“男”的五笔编码为LLB。又如:“花”,有三个字根“艹仆匕”,分别对应于AWX键,上下结构,末笔画在“匕”中,故取折(5区),其识别码为52(B键),所以“花”的五笔编码应为AWXB。

②凡有“走之”的汉字,其识别码的末笔画为除“走之”外的部分。如:“进”,为杂合型,末笔为“竖”,其识别码为23,对应键为K,故其五笔编码为FJPK。

③对于“我”“戋”“成”“戏”“浅”“笺”等汉字,末笔一律取“丿”。例“笺”的二个字根为‘竹’和‘戋’,上下结构,取‘丿’为末笔,识别码32,故其五笔字编码为TGR4、五种单笔画的编码:可看成是成字字根的特例。

键名+键名+L+L如:横一GGLL竖丨HHLL撇丿TTLL点(捺)丶YYLL折乙NNLL(二)词组的输入五笔字型支持汉字的词汇输入,输入词汇与输入单字可交叉进行不需换档,词汇编码也用四码,取码规则如下:双字词组:取所含汉字的前两码。例如:汉字ICPB、依据SVRN、机械SMSA三字词组:前两字各取第一码,第三字取前两码。例如:计算机YTSM、共产党AUIP办公室LWPG四字词组:所含汉字各取第一码。例如:艰苦奋斗CADU、中国人民KLWN共产党员AUIK程序设计TYYY多字词组:取词汇中第一、其次、第三和最终一字的第一码。例如:中华人民共和国KWWL中国共产党KLAI为人民服务YWNT(三)简码输入为提高输入速度,五笔字型对常用汉字(运用频度较高的汉字)设置了简码输入法。简码共分三级,有一级简码汉字25个,二级汉字600个左右,三级汉字约4400多个。①一级简码(特高频汉字),只需按一次对应的键,再按一空格即可输入一级汉字。一级汉字的个数最少,应当熟记。E有R的T和Y主S要D在F地G一U产I不O为P这H上J是K中L国{[:;Q我W人A工N民M同X经C以V发B了<,>.Z例,“我”为一级汉字,只需按Q键+空格即可。“以”亦是一级汉字,可按C键+空格。(三)简码输入为提高输入速度,五笔字型对常用汉字(运用频度较高的汉字)设置了简码输入法。简码共分三级,有一级简码汉字25个,二级汉字600个左右,三级汉字约4400多个。②二级简码由汉字全码的前二码构成,输入时只需按前二码对应的键,再按一空格即可输入二级简码的汉字。二级汉字的个数约为600个,应尽量多记熟记。以下汉字均为二级简码汉字,只需前二码对应键+空格即可。

直FH右DK肿EK进FJ昌JJ困LS

百DJ肖IE砂DI吕KK林SS仍WE二级简码汉字可详见课本P149表3-11。③三级简码由汉字全码的前三码+空格构成。三级简码汉字输入时击键次数仍需四次,但因省去了末笔字型识别码,从而提高了输入的速度,易学易用。五、重码、容错码1、重码:在五笔字型编码中,有时两个或两个以上汉字的编码是一样的,这种状况即重码。例如,当键入编码“RNHJ”时,屏幕的下方会出现提示行,1:帛2:制若需输入“帛”字,①按空格;②按数字键1;若需输入“制”字,只有能按数字键2;若需同时输入“帛”“制”,其次个“制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论