大端与小端(Little_第1页
大端与小端(Little_第2页
大端与小端(Little_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大端 (Big Endian与小端 (Little Endian 简介Byte Endian 是指字 节在内 存中 的组 织 , 所 以也称它 为 Byte Ordering , 或 Byte Order。对于数据中跨越多个字节的对象 , 我们必须为它建立这样的约 定 :(1 它的地址是多少 ?(2 它的字节在内存中是如何组织的 ?针对第一个问题 ,有这样的解释 :对于跨越多个字节的对象 ,一般它所占的字节都是连续的 , 它的 地址等于它所占 字节最低地址 。 (链表可能是个例外 , 但链表的地址 可看作链表头的地址 。比如 : int x, 它的地址为 0x100。 那么它占据了内存中的 O

2、x100, 0x101, 0x102, 0x103这四个字节(32位系统,所以 int 占用 4个字节。上面只是内存字节组织的一种情况 : 多字节对象在内存中的组 织有一般有两 种约定。 考虑一个 W 位的整数。它的各位表达如下 :Xw-1, Xw-2, . , X1, X0, 它的 MSB (Most Significant Byte, 最高有效字节 为 Xw-1, Xw-2, . Xw-8;LSB (Least Significant Byte , 最低有效字节 为 X7, X6, . , X0 。其余的字节位于 MSB , LSB 之间。LSB 和 MSB 谁位于内存的最低地址 , 即谁

3、代表该对象的地址 ? 这就引出了大 端 (Big Endian与小端 (Little Endian 的问题。 如果 LSB 在 MSB 前面, 既 LSB 是低 地址, 则该机器是小端 ; 反之则 是大端。DEC (Digital Equipment Corporation, 现在是 Compaq 公司的一部 分 和 Intel 的 机器(X86 平台一般采用小端。IBM , Motorola(Power PC, Sun 的机器一般采用大端。当然,这不代表所有情况。有的 CPU 即能工作于小端 , 又能工作于 大端, 比如 ARM , Alpha,摩托罗拉的 PowerPC 。 具体情形参考处

4、 理器手册。具体这类 CPU 是大端还是小端 ,应该和具体设置有关。(如, Power PC支持 little-endian 字节序 ,但在默认配置时是 big-endian 字节序一般来说 ,大部分用户的操作系统 (如 windows, FreeBsd,Linux 是 Little Endian 的。少部分,如 MAC OS ,是 Big Endian 的。 所以说, Little Endian还是 Big Endian 与操作系统和芯片类型都 有关系。Linux 系统中 , 你可以在 /usr/include/中(包括子目录查找字符 串 BYTE_ORDER(或_BYTE_ORDER, _

5、BYTE_ORDER, 确定其值。 BYTE_ORDER 中文称为字 节 序。这个值一般在 endian.h 或 machine/endian.h文件中可以找到 , 有时在 feature.h 中,不同的操作系统可能有所不同。big endian是指低地址存放最高有效字节 (MSB ,而 little endian 则是低地址存放 最低有效字节 (LSB 。用文字说明可能比较抽象 ,下面用图像加以说明。比如数 字 0x12345678在两种 不同字节序 CPU 中的存储顺序如下所示 :Big Endian低地址 高地址 >+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

6、-+-+| 12 | 34 | 56 | 78 | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+Little Endian低地址 高地址 >+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+| 78 | 56 | 34 | 12 | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+从上面两图可以看出 ,采用 big endian方式存储数据是符 合我们人类的思维习 惯的 .为什么要注意字节序的问题呢 ?你可能这么问。当然 ,如果 你写的程序只在单机 环境下面运行 ,并且不和别人的程序打交道 ,那 么你完全可以

7、忽略字节序的存在。但 是 ,如果你的程序要跟别人的程 序产生交互呢 ?在这里我想说说两种语言。 C/C+语 言编写的程序里 数据存储顺序是跟编译平台所在的 CPU 相关的 , 而 J*A 编写的 程序 则唯一采用 big endian方式来存储数据。试想 ,如果你用 C/C+语 言在 x86 平 台下编写的程序跟别人的 J*A 程序互通时会产生什么结 果 ?就拿上面的 0x12345678来说 ,你的程序传递给别人的一个数 据,将指向 0x12345678的指针传给 了 J*A 程序,由于 J*A 采取 big endian 方式存储 数据 , 很自 然的 它会将你 的数 据翻 译为 0x78

8、563412。什么?竟然变成另外一个数字了 ?是的,就是这种后 果。因此 ,在你的 C 程序传给 J*A 程序之前有必要进行字节序的转 换工作。无独有偶 ,所有网络协议也都是采用 big endian 的方式来传输 数据的。所以有 时我们也会把 big endian方式称之为网络字节序。 当两台采用不同字节序的主机通 信时 , 在发送数据之前都必须经过字 节序的转换成为网络字节序后再进行传输。 ANSI C 中提供了下面四 个转换字节序的宏。·BE 和 LE 一文的补完我在 8月 9号的 Big Endian和 Little Endian 一文中谈了字节序的问题 ,原文见上面的超级链

9、接。可是有朋友仍然会问 , CPU 存储一 个字节的数据时其字节内的 8个比特之间的顺序是否也有 big endian和 little endian 之分?或者说是否有比特序的不同 ? 实 际上 , 这 个 比 特序 是同 样 存 在 的 。下 面 以 数字 0xB4 (10110100用图加以说明。Big Endianmsb lsb>+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+| 1 | 0 | 1 | 1 | 0 | 1 | 0 | 0 |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+Little Endian

10、lsb msb>+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+| | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ 实际上,由 于 CPU 存储数据操作的最小单位是一个字节,其内 部的比特序是什么样对我们的 程序来说是一个黑盒子。也就是说,你 给我一个指向 0xB4 这个数的指针 对于 big endian 方式的 CPU 来说 , , 它是从左往右依次读取这个数的 8 个比特;而对于 little endian 方式的 CPU 来说,则正好相反,是从右往

11、左依次读取这个数的 8 个比 特。而我们的程序通过这个指针访问后得到的数就是 0xB4,字节内 部的比特序对 于程序来说是不可见的 其实这点对于单机上的字节序 , 来说也是一样的。 那可能 有人又会问,如果是网络传输呢?会不会出问题?是不 是也要通过什么函数转换 一下比特序?嗯,这个问题提得很好。假设 little endian 方式的 CPU 要传给 big endian 方式 CPU 一个字节的 话,其本身在传输之前会在本地就读出这个 8 比特的 数,然后再按照 网络字节序的顺序来传输这 8 个比特 这样的话到了接收端不会出 现, 任何问题 而假如要传输一个 32 比特的数的话 由于这个数在 littel 。, endian 方存储时占了 4 个字节,而网络传输是以字节为单位进行的, little endian 方的 CPU 读出第一个字节后发送,实际上这个字节是 原数的 LSB,到了接收方反倒成 了 MSB 从而发生混乱。【用函数判断系统是 Big Endian 还是 Little Endian 】 bool IsBig

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论