




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机中的文字表达方式计算机中的文字表达方式 1.ASCII码 2.GB2312编码 3.Big5编码 4.Unicode编码 5.输入编码 6.字型码 一一. .文字表达方式的种类文字表达方式的种类 1.ASCII1.ASCII码码 ASCII(American Standard Code for Information Interchange,美国信息互换 标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其 他西欧语言。它是现今最通用的单字节编码2010年12月8日叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号,以及在美 式英语中使用的特殊控制字符。ASC11码编码的编码规则是在下表中确定的,它 是一种约定顺序编码,每个字符在ASC11码表中的顺序号成为字符的ASC值,它 有两种形式,一种包含128个字符,另一种包含256个字符。包括128个字符的 ASC码表,ASC值范围是0127,计算机中使用7个二进制位就可以表示,因此称 为7位二进制码。包含256个字符的ASC码表,在7位码表的基础上,增加了对128 个字符的支持。国际上7位ASC码有广泛的支持,对8位ASC11值支持程度较弱 , 尤其在中文环境下因为同汉字的存储编码相冲突,8位ASC11码值不被支持。 在7位ASC11码值中,字符总体上分为两大类:控制字符和可显示字符。控 制字符用于显示、打印、警告或传输过程和解释,在频幕上不显示,其 ASC11值得范围是031及127。可显示字符则同英文中出现的各种字母和个 符号相对应,涵盖了英文所需要的所有文字符号,其ASC11值范围是 32126,可细分为以下几大类:英文字符,ASC11值范围是3247、5864 、9196及123126;数字字符,ASC11值是4857;大写英文字母, ASC11值是6590;小写英文字母,ASC11值范围是97122. 2.GB23122.GB2312编码编码 GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为信 息交换用汉字编码字符集基本集,又称为GB0,由中国国家标准 总局发布 ,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡 等地也采用此 编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。 GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个; 同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字 母、俄语西里尔字母在内的682个全角字符。ASC11码值得出现有效的解决了 西文文字的信息化问题,但对于汉字字符却完全不适用,为了满足国内在计 算机中使用文字的需要,中国国家标准总局发布了一系列的汉字字符集国家 标准编码,统称为GB码或国标码,其中最有影响的是与1980年发布的信息 交换用汉字编码字符集 基本集,标准号为GB2312-1980.因其使用非常普 遍,也常被统称为国标码. GB2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字 符组成,其中汉字根据使用的频率可分为两级。一级汉字3755个,二级汉字 3008个。由于字符数量比较大,GB2312采用了二维矩阵编码法对所有字符 进行编码。首先构造一个94列的方阵,对每一行成为一个“区”,每一列称 为一个“位”,然后将所有字符依照下表的规律填写在方阵中。这样所有的 字符在方阵中都有一个唯一的位置,这个位置可以用区号、位号合成表示, 称为字符的区位码。因为区位码同字符的位置是完全对应的,因此区位码同 字符之间也是一一对应的。 3.BIG53.BIG5编码编码 “大五码”(Big5)是在1984年由台湾13家厂商与台湾地区 财团法人信息工业策进会为五大中文套装软件所设计的中文 内码,所以就称为Big5中文内码,虽然五大套装软件并没有 成功,但Big5码却深远地影响中文电脑内码,直至今日。“五 大码”的英文名称“Big5”后来被人按英文字序译回中文,以 致现在有“五大码”和“大五码”两个中文名称。 大五码是一种繁体中文汉字字符集,其中繁体汉字13053个 ,808个标点符号,希腊字母及特殊符号。大五码的编码码 表直接针对存储而设计、每个字符统一使用两个字节存储表 示。第一字节范围81HFEH,避开了同ASCII码的冲突,第二 字节范围是40H7EH和A1HFEH,在同一正文不能对两种字 符集的字符同时支持。 BIG5BIG5编码的字符编码分布表编码的字符编码分布表 编码范围符号类别 8140HA0FEH A140HA3BFH A3C0HA3FEH A440HC67EH C6A1HC6FEH C940HF9D5H F9D6HFEFEH 保留(用作造字区) 标点符号、希腊字母及特殊符号 保留(未开放用于造字区) 标点符号、希腊字母及特殊符号 保留(用作造字区) 非常用汉字(先按笔画,再按部首 排列) 保留(用作造字区) 编码范围 8140HA0FEH保留(用作造字区) A140HA3BFH标点符号、希腊字母及特殊符号 A3C0HA3FEH保留(未开放用于造字区) A440HC67EH常用汉字(先按笔画,再按部首排序) C6A1HC6FEH保留(用作造字区) C940HF9D5H非常用汉字(先按笔画,再按部首排列 ) 4.UNICODE4.UNICODE编码编码 Unicode字符集可以简写为 UCS(Unicode Character Set )。早期的 Unicode标准有UCS -2、UCS-4的说法。UCS-2用两 个字节编码,UCS-4用4个字节 编码。UCS-4根据最高位为0的 最高字节分成27=128个group 。每个group再根据次高字节分 为256个平面(plane)。每 Unicode是国际组织制定的可以 容纳世界上所有文字和符号的字 符编码方案。Unicode用数字0- 0x10FFFF来映射这些字符,最 多可以容纳1114112个字符,或 者说有1114112个码位。码位就 是可以分配给字符的数字。UTF -8、UTF-16、UTF-32都是将数 字转换到程序数据的编码方案。 UCS是一种字符集编码法, 主要用于计算机程序和操作系统 内部。在存储和传输中,往往不 直接使用UCS编码而是通 过一定的转换程序来实现。这些 转换编码最通用的是utf8和 utf16.由于大量使用的ASC11码 字符兼容所提出的UCS的一种实 现就是utf8.utf8就是采用变长 字节表示一个字符,尽管有节约 存储和传输资源的好处,但也同 时导致软件实现有困难。 平面根据第3个字节分为256 行 (row),每行有256个码位 (cell)。group 0的平面0被称 作BMP(Basic Multilingual Plane)。将UCS-4的BMP去掉 前面的两个零字节就得到了UCS- 2。 五五 输入编码输入编码 世界上使用汉字的人口约占世界总人口的 四 分之一,因此研究和发展汉字输入编码是一 项非常急迫的任务。中国是汉字的发源国, 汉字应用已有数千年历史。一九八七年中国 研究汉字输入编码的人员已近 四百人,不论 在深度和广度上,都走在世界前列。汉字从 形编码利用人们已有的汉字书写知识,在键 盘上象写字一样打入笔画和字根,从计算机 内选出汉字,既直接又方便。 从音编码是以一九五八年 二月十一 日全国 人大批准公布的汉语拼音方案为基本编 码元素。汉语拼音是以北京语音为标准音, 以北方语为基础方言,以典范的白话文著作 为语法规范的普通话。自推广普通话以来, 已有相当数量的人掌握了汉语拼音,以此为 基础作汉字输入编码,为这部分人所乐于接 受。但中国各地方言复杂,不少人还难以做 到准确认读汉字,因此容易出现差错。 6.6.字型码字型码 汉字字型码又称字字模,用于 汉字在显示屏或打印机输出。汉 字字型码通常有两种表示方式: 点阵和矢量表示方法。 用点阵表示字型时,汉字字型 码指的是这个汉字字型点阵的代 码。根据输出汉字的要求不同, 点阵的多少也不同。简易型汉字 为16*16点阵,提高型汉字为 24*24点阵,32*32点阵,48*48 点阵等等。点阵规模愈大,字型 愈清晰美观,所占存储空间也愈 大 矢量表示方式存储的是描述汉 字字型的轮廓特征,当要输出汉 字时,通过计算机的计算,由汉 字字型描述生成所需大小和形状 的汉字点阵。矢量化字型描述与 最终文字显示的大小,分辨率无 关,因此可以产生高质量的汉字 输出。Windows中使用的 TrueType技术就是汉字的矢量表 示方式。 二二. .文字输入到显示流程文字输入到显示流程 将字符写入一个MN的空白方格中,对表格中每个方格用 一个比特(Bit)来表示,字符通过的方格用“1”表示,未 通过的方格用“0”来表示,这样将每个方格的值按照从左到 右,从上到下的顺序写下来,就形成了字符的点阵字型码。 显示汉字时,则执行相反的过程,对于点阵字形为“0”的比 特,在频幕中像素显示为背景色,而为“1”的比特,则显示 为前景色。 根据点阵编码时使用的表格大小,常用的汉字点阵字库一 般分为16点阵、24点阵、32点阵等格式。每个汉字码占( MN)/8个字节数。 点阵字型码显示汉字的熟读很快,但在进行放大时由于 使用字块填充,会出现明显的锯齿边缘。因此点阵字库一边 不用于图形环境 ,常用在字符操作界面中。 1.点阵编码法 文字文字输入到显示流程输入到显示流程 2.矢量编码法 文字字符的字形信息都是由多个笔画子图形组成的,适量编 码发将组成的字符每一笔画用一组直线勾勒,然后按一定顺 序对各笔画一体组适量来表示.显示汉
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食品饮料行业分析
- 上海闵行职业技术学院《合唱与指挥基础(2)》2023-2024学年第二学期期末试卷
- 许昌电气职业学院《老年生活能力评估技术》2023-2024学年第二学期期末试卷
- 南京工业大学《外科学Ⅰ》2023-2024学年第二学期期末试卷
- 2025至2031年中国汽车仿真电气电路学习实习台行业投资前景及策略咨询研究报告
- 2025煤炭买卖合同模板
- 辽宁中医药大学杏林学院《足球俱乐部》2023-2024学年第二学期期末试卷
- 道路路基坡度施工方案
- 新建电力线施工方案
- 山西医科大学晋祠学院《钢琴基础(2)》2023-2024学年第一学期期末试卷
- GB/T 23861-2009婚姻介绍服务
- 蝴蝶小知识及标本制作
- GA 38-2021银行安全防范要求
- 总论天然药物化学课件
- 《宠物美容》考试复习题库500题(汇总版)
- 文件记录控制培训课件
- 女性青春期教育(4-6年级)课件
- 中外戏剧史课件
- COPD合并心血管疾病的现状和其治疗进展培训课件
- 营养医师及营养科工作解读课件
- DB13T 5461-2021 连翘种子种苗质量标准
评论
0/150
提交评论