版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、汉字(Hnz)的编码共十五页汉字也是一种字符,也需用“”、“”组合进行编码,才能被计算机接受。汉字是象形文字(xingxng wnz),有近60000个左右的汉字,常用汉字就有7000个左右。汉字的编码处理与西文的拼音文字有较大区别,汉字信息处理较复杂,它涉及输入码、内码、字型码等多种编码。共十五页汉字输入码为了能直接在键盘上输入汉字,就需要为汉字进行相应的输入编码。采用输入码,就是通过键盘的字母(zm)、数字等实现汉字的输入。常见的输入编码方法有数字、字音编码、字型、混合编码。共十五页数字编码常用的是国标区位码,电报码等,用位十进制数字串代表一个汉字。国标区位码是将国家标准局公布的6763个
2、两级汉字分为94个区,每个区分94位,一位就是(jish)一个汉字。实际上把汉字表示成二维数组,每个汉字在数组中的下标就是(jish)区位码,区码和位码各两位十进制数字,因此输入一个汉字需键四次,例如“中”字位于第54区48位,区位码为5448。该编码无重码,但难记忆。共十五页例:“学”字的区号为49,位号为07,其区位码为4907,用2个字节的二进制数表示为: 00110001 00000111ISO2022规定每个汉字的区号和位号必须分别加上32(即二进制数00100000),经过这样的处理(chl)而得的代码就是国标码。 “学”字的国标码计算为: 00110001 00000111+00
3、100000 +00100000 01010001 00100111用十六进制数表示为5127H。共十五页字音编码(bin m)是以汉语拼音为基础的编码(bin m)。可输入6700多个汉字及一万多个词汇。是普通使用者常使用的编码。该编码方法重码多。字型编码是用汉字的形状来进行编码。常用的有五笔字型输入码。字型编码重码少。共十五页汉字(Hnz)内码汉字内码是汉字在计算机内部(nib)存储、交换、检索等处理的信息代码。无论采用何种输入码进行汉字的输入,为存储、处理方便,都要转换成长度一致的汉字内码。常使用的内码是以GB231280(国标码)为基础的编码。该编码用两个连续的字节表示一个汉字,且这两
4、个字节最高位均为,与西文字符区别。它最多可表示汉字数为:12812816384个。共十五页汉字(Hnz)字型码汉字字型码是计算机中用于输出(显示、打印等)汉字的一种编码,它是用汉字点阵表示的汉字字型代码。在字型点阵中,笔画经过的点为,其他点为。由于汉字有多种字体,字型不同,其字型点阵也不同。所有汉字字符集的字型点阵构成字型库,需要(xyo)显示、打印时,根据汉字内码向字型库检索出该汉字的字型信息后,进行输出。共十五页汉字编码(hn z bin m)处理过程如图所示。共十五页在目前(mqin)的汉字的处理中,字形信息的表示通常采用点阵表示法、矢量表示法。汉字点阵的大小有多种规格,汉字字形质量随点
5、阵数的增加而优化。点阵越大,描述的字越细致美观,质量越高。汉字最小点阵1616一般用于计算机屏幕显示,2424点阵常用于普通打印字形,6464点阵可以区别仿宋体和黑体字,9696点阵的汉字排版系统以及128128、256256点阵能充分表示出字形的笔锋和曲线。点阵数越多,描述一个汉字字形的字节数也越多,需要计算机存储空间亦越大。共十五页点阵码采用点阵表示汉字字形,即把汉字按字形排列(pili)为点阵,再进行编码。下图为“次”汉字的点阵和编码。共十五页例:按2424点阵存放6763个汉字,则此字库的容量大约为( )A.13500BB.216000BC.487000BD.以上(yshng)都不对解
6、析:每个汉字需要字节数2424/8=72个字节6763个汉字需要字节数为726763=486936B共十五页例:已知汉字“班”的区位码是1664,试写出它的国标码和变形国标码。解:汉字的区位码是以十进制数给出的,因此可先将该十进制数转换(zhunhun)十六进制数,再加上2020H(双字节32)即可得到它的国标码,在国标码的基础上加上8080H即可得到它的变形国标码。1664D=0680H0680H+2020H=26A0H26A0H+8080H=A720H共十五页 矢量码使用一组数学矢量来记录汉字的外形轮廓,矢量码记录的字体称为矢量字体或轮廓字体。这种字体能很容易地放大或缩小而不会出现锯齿状边
7、缘,屏幕上看到的字形和打印输出的效果完全一致。在目前使用系统中,已普遍使用轮廓字体(称为True Type字体)。例如中文Windows中提供了宋体、黑体、楷体。仿宋体等True Type字体的汉字库文件。 由于汉字字形所需要的存储空间很大,所以汉字字形不用于机内存储,而采用字库存储。所有的不同字体、字号的汉字字形码构成了汉字字库。只有需要输出汉字时,才将汉字机内码转换 相应的汉字字库地址,检索(jin su)字库,输出字形码。目前汉字字库通常是以多个字库文件的形式存储在硬盘上。共十五页内容摘要汉字的编码。汉字的编码处理与西文的拼音文字有较大区别,汉字信息处理较复杂,它涉及输入码、内码、字型码等多种编码。常见的输入编码方法有数字、字音编码、字型、混合编码。字型编码是用汉字的形状来进行编码。由于汉字有多种字体,字型不同,其字型点阵也不同。点阵码采用点阵表示汉字字形,即把汉字按字形排列为点阵,再进行编码。矢量码使用一组数学矢量来记录汉字的外形轮廓(lnku),矢量码记录的字体称为矢量字体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《人力资源使用》课件
- 养老院老人入住确认制度
- 养老院环境卫生与消毒制度
- 《理想的风筝课堂》课件
- 2024年民政部社会福利中心“养老服务人才培训”拟申报课件信息反馈表
- 2024年新型环保材料研发项目投标邀请函模板3篇
- 敬老院老人不愿入住协议书(2篇)
- 《青蒿素类抗疟药》课件
- 《丰子恺白鹅》课件
- 2025年遵义c1货运上岗证模拟考试
- 备品备件供货方案范文
- 走近山水画智慧树知到答案章节测试2023年华侨大学
- 中医养生与亚健康防治智慧树知到答案章节测试2023年暨南大学
- 高速铁路钢轨打磨车打磨作业指导书
- 学科发展与科学研究课件
- 当冲突发生反思-教学设计教案
- GB/T 5163-2006烧结金属材料(不包括硬质合金)可渗性烧结金属材料密度、含油率和开孔率的测定
- GB/T 20327-2006车刀和刨刀刀杆截面形状和尺寸
- GB/T 1933-2009木材密度测定方法
- 杀菌时间的计算
- GB 17820-2012天然气
评论
0/150
提交评论