Java字符集和编码_第1页
Java字符集和编码_第2页
Java字符集和编码_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Java字符集和编码为什么要讲字符集?1 Java采用Unicode编码,char型变量是16位的Unicode编码;2 加深对java.io包里面的字节流/字符流的理解;3 理解和解决Java编程中的乱码问题。UnicodeUTF8GB 23120127 ASCII128255 ASCIIGBKBIG5单字节字符集(OBCS)变字节字符集(DBCS)双字节字符集(DBCS)一 ASCII编码是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)

2、定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式。17位ASCII码第032号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等; 第33126号(共94个)是字符,其中第4857号为09十个阿拉伯数字;6590号为26个大写英文字母,97122号为26个小写英文字母,其余为一些标点符号、运算符号等。28位ASCII码但是,很多国家用的不是英文,他们的字母里有许多是ASCII里没有的,为了可以在计算

3、机保存他们的文字,他们决定采用127号之后的空位来表示这些新的字母、符号,还加入了很多画表格时需要用下到的横线、竖线、交叉等形状,一直把序号编到了最后一个状态255。从128到255这一页的字符集被称"扩展ASCII(8位ASCII码)"。二 双字节字符集(Double Byte Charecter Set, DBCS) GB2312GBK在DBCS系列标准里,最大的特点是两字节长的汉字字符和一字节长的英文字符并存于同一套编码方案里,因此他们写的程序为了支持中文处理,必须要注意字串里的每一个字节的值,如果这个值是大于127的,那么就认为一个双字节字符集里的字符出现了。1 G

4、B2312(Windows3.2和苹果OS)全称是GB2312-80信息交换用汉字编码字符集 基本集,1980年发布,是中文信息处理的国家标准,可支持6000多个汉字,在大陆及海外使用简体中文的地区(如新加坡等)。Windows3.2和苹果OS就是 以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。 GB2312规定:(1) 一个小于127的字符的意义与ASCII码相同;(2) 两个大于127的字符连在一起时,就表示一个汉字,前面的一个字节(他称之为高字节)从0xA1用到0xF7,后面一个字节(低字节)从0xA1到0xFE,这样我们就可

5、以组合出大约7000多个简体汉字了。2 GBK(Windows2000、WindowsXP)GBK是GB2312-80的扩展,是向上兼容的。它包含了20902个汉字,其编码范围:(1) 高字节0127表示一个与ASCII码兼容的字符;(2) 高字节>127表示是一个汉字的第一个字节,后面的低字节不再有必须大于127的限制了。(3) “一个汉字需要两个字节存储”3 DBCS的缺点(1) 各地的字符集不兼容(GBK、BIG5)(2) 在读写文件时需要判断每个字节的值是否大于127,以便判断是否时一个汉字三 Unicode为了解决DBCS的上述缺点,国际标谁化组织指定了一种新的全球统一的编码方式Unicode。(1) 任何字符都使用2个字节18位来编码21665536;(2) 低8位与ASCII码兼容;(3) 除此之外,没有考虑与其他DBCS的兼容,他们之间的转换只能依靠查表实现;四 UTF8UTF-8 : Unicode Transformation Format-8,主要用来在网络中快速传输Unicode字符。基本原理:提供一个模板,将不同的Unicode字符映射成不同长度的编码:(1) 在发送端,首先确定需要多少个8bits(octets)(2) 并按照模板将Unicode字符重新编码,进行网络传输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论