各种校验码校验算法分析_第1页
各种校验码校验算法分析_第2页
各种校验码校验算法分析_第3页
各种校验码校验算法分析_第4页
各种校验码校验算法分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、各种校验码校验算法分析 二进制数据经过传送、存取等环节会发生误码1变成0或0变成1这就有如何发现及纠正误码的问题。所有解决此类问题的方法就是在原始数据数码位基础上增加几位校验冗余位。 一、码距 一个编码系统中任意两个合法编码码字之间不同的二进数位bit数叫这两个码字的码距而整个编码系统中任意两个码字的的最小距离就是该编码系统的码距。 如图1所示的一个编码系统用三个bit来表示八个不同信息中。在这个系统中两个码字之间不同的bit数从1到3不等但最小值为1故这个系统的码距为1。如果任何码字中一位或多位被颠倒了结果这个码字就不能与其它有效信息区分开。例如如果传送信息001而被误收为011因

2、011仍是表中的合法码字接收机仍将认为011是正确的信息。 然而如果用四个二进数字来编8个码字那么在码字间的最小距离可以增加到2如图2的表中所示。 信息序号 二进码字 a2 a1 a0 0 0 0 0 1 0 0 1 2 0 1 0 3 0 1 1 4 1 0 0 5 1 0 1 6 1 1 0 7 1 1 1 图 1 信息序号 二进码字 a3 a2 a1 a0 0 0 0 0 0 1 1 0 0 1 2 1 0 1 0 3 0 0 1 1 4 1 1 0 0 5 0 1 0 1 6 0 1 1 0 7 1 1 1 1 图 2 注意图8-2的8个码字相互间最少有两bit的差异。因此如果任何信息

3、的一个数位被颠倒就成为一个不用的码字接收机能检查出来。例如信息是1001误收为1011接收机知道发生了一个差错因为1011不是一个码字表中没有。然而差错不能被纠正。假定只有一个数位是错的正确码字可以是100111110011或1010。接收者不能确定原来到底是这4个码字中的那一个。也可看到 在这个系统中偶数个2或4差错也无法发现。 为了使一个系统能检查和纠正一个差错码间最小距离必须至少是“3”。最小距离为3时或能纠正一个错或能检二个错但不能同时纠一个错和检二个错。编码信息纠错和检错能力的进一步提高需要进一步增加码字间的最小距离。 图8-3的表概括了最小距离为1至7的码的纠错和检错能力。 码距

4、码 能 力 检错 纠错 1 2 3 4 5 6 7 0 0 1 0 2 或 1 2 加 1 2 加 2 3 加 2 3 加 3 图3 码距越大纠错能力越强但数据冗余也越大即编码效率低了。所以选择码距要取决于特定系统的参数。数字系统的设计者必须考虑信息发生差错的概率和该系统能容许的最小差错率等因素。要有专门的研究来解决这些问题。 二、奇偶校验 奇偶校验码是一种增加二进制传输系统最小距离的简单和广泛采用的方法。例如单个的奇偶校验将使码的最小距离由一增加到二。 一个二进制码字如果它的码元有奇数个1就称为具有奇性。例如码字“10110101”有五个1因此这个码字具有奇性。同样偶性码字具有偶数个1。注意

5、奇性检测等效于所有码元的模二加并能够由所有码元的异或运算来确定。对于一个n位字奇性由下式给出 奇性a0a1a2an 奇偶校验可描述为给每一个码字加一个校验位用它来构成奇性或偶性校验。例如在图8-2中就是这样做的。可以看出附加码元d2是简单地用来使每个字成为偶性的。因此若有一个码元是错的就可以分辨得出因为奇偶校验将成为奇性。奇偶校验编码通过增加一位校验位来使编码中1个个数为奇数奇校验或者为偶数偶校验从而使码距变为2。因为其利用的是编码中1的个数的奇偶性作为依据所以不能发现偶数位错误。 再以数字0的七位ASCII码0110000为例如果传送后右边第一位出错0变成1。接收端还认为是一个合法的代码01

6、10001数字1的ASCII码。若在最左边加一位奇校验位编码变为10110000如果传送后右边第一位出错则变成101100011的个数变成偶数就不是合法的奇校验码了。但若有两位假设是第1、2位出错就变成101100111的个数为5还是奇数。接收端还认为是一个合法的代码数字3的ASCII码。所以奇偶校验不能发现。 奇偶校验位可由硬件电路异或门或软件产生 偶校验位 an a0a1a2an-1 奇校验位 an NOTa0a1a2an-1。 在一个典型系统里在传输以前由奇偶发生器把奇偶校验位加到每个字中。原有信息中的数字在接收机中被检测 如果没有出现正确的奇、偶性这个信息标定为错误的这个系统将把错误的

7、字抛掉或者请求重发。 在实际工作中还经常采用纵横都加校验奇偶校验位的编码系统-分组奇偶校验码。 现在考虑一个系统 它传输若干个长度为m位的信息。如果把这些信息都编成每组n个信息的分组则在这些不同的信息间也如对单个信息一样能够作奇偶校验。图4中n个信息的一个分组排列成矩形式样并以横向奇偶HP及纵向奇偶VP的形式编出奇偶校验位。 m位数字 横向奇偶位 n 个 码 字 a1 a2 am-1 am HP1 b1 b2 bm-1 bm HP2 c1 c2 cm-1 cm HP3 n1 n2 nm-1 nm HPn VP1 VP2 VPm-1 VPm HPn1 纵向奇偶位 图 4 用综横奇偶校验的分组奇偶

8、校验码 研究图4可知分组奇偶校验码不仅能检测许多形式的错误。并且在给定的行或列中产生孤立的错误时还可对该错误进行纠正。 在初级程序员试题中早期也出现在程序员试题中经常有综横奇偶校验的题目。一般解法应该是这样先找一行或一列已知数据完整的确定出该行或列是奇校验还是偶校验。并假设行与列都采用同一种校验这个假设是否正确在全部做完后可以得到验证。然后找只有一个未知数的行或列根据校验性质确定该未知数这样不断做下去就能求出所有未知数。 【例】2001年初级程序员试题 由 6 个字符的 7 位 ASCII 编码排列再加上水平垂直奇偶校验位构成下列矩阵最后一列为水平奇偶校验位最后一行为垂直奇偶校验位: 字符 7

9、 位 ASCII 码 HP 3 0 X1 X2 0 0 1 1 0 Y1 1 0 0 1 0 0 X3 1 X4 1 0 1 0 1 1 0 Y2 0 1 X5 X6 1 1 1 1 D 1 0 0 X7 1 0 X8 0 0 X9 1 1 1 X10 1 1 VP 0 0 1 1 1 X11 1 X12 则 X1 X2 X3 X4 处的比特分别为 _36_ X5 X6 X7 X8 处的比特分别为 _ X9 X10 XI1 X12 处的比特分别为 _38_ Y1 和 Y2 处的字符分别为 _39_ 和 _40_ 。 解 从ASCII码左起第5列可知垂直为偶校验。则 从第1列可知X40从第3行可

10、知水平也是偶校验。 从第2行可知X31从第7列可知X80从第8列可知X121 从第7行可知X111从第6列可知X100从第6行可知X91从第2列可知X11 从第1行可知X21从第3列可知X51从第4行可知X60 从第4列或第5行可知X70整理一下 36 X1X2X3X4 1110 37 X5X6X7X8 1000 38 X9X10X11X12 1011 39 由字符Y1的ASCII码100100149H知道Y1即是“I”由“D”的ASCII码是100010044H推得 40 由字符Y2的ASCII码011011137H知道Y2即是“7”由“3”的ASCII码是011001133H推得 假如你能

11、记住“0”的ASCII码是011000030H“A”的ASCII码是100000141H则解起来就更方便了。 三、海明校验 我们在前面指出过要能纠正信息字中的单个错误所需的最小距离为3。实现这种纠正的方法之一是海明码。 海明码是一种多重复式奇偶检错系统。它将信息用逻辑形式编码以便能够检错和纠错。用在海明码中的全部传输码字是由原来的信息和附加的奇偶校验位组成的。每一个这种奇偶位被编在传输码字的特定位置上。实现得合适时这个系统对于错误的数位无论是原有信息位中的还是附加校验位中的都能把它分离出来。 推导并使用长度为m位的码字的海明码所需步骤如下 1、确定最小的校验位数k将它们记成D1、D2、Dk每个

12、校验位符合不同的奇偶测试规定。 2、原有信息和k个校验位一起编成长为mk位的新码字。选择k校验位0或1以满足必要的奇偶条件。 3、对所接收的信息作所需的k个奇偶检查。 4、如果所有的奇偶检查结果均为正确的则认为信息无错误。 如果发现有一个或多个错了则错误的位由这些检查的结果来唯一地确定。 校验位数的位数 推求海明码时的一项基本考虑是确定所需最少的校验位数k。考虑长度为m位的信息若附加了k个校验位则所发送的总长度为mk。在接收器中要进行k个奇偶检查每个检查结果或是真或是伪。这个奇偶检查的结果可以表示成一个k位的二进字它可以确定最多2k种不同状态。 这些状态中必有一个其所有奇偶测试试都是真的它便是

13、判定信息正确的条件。于是剩下的2k-1种状态可以用来判定误码的位置。于是导出下一关系 2k-1mk 码字格式 从理论上讲校验位可放在任何位置但习惯上校验位被安排在1、2、4、8、的位置上。 图5列出了m4k3时信息位和校验位的分布情况。 码字位置 B1 B2 B3 B4 B5 B6 B7 校验位 x x x 信息位 x x x x 复合码字 P1 P2 D1 P3 D2 D3 D4 图5 海明码中校验位和信息位的定位 校验位的确定 k个校验位是通过对mk位复合码字进行奇偶校验而确定的。 其中P1位负责校验海明码的第1、3、5、7、P1、D1、D2、D4、位包括P1自己 P2负责校验海明码的第2

14、、3、6、7、P2、D1、D3、D4、位包括P2自己 P3负责校验海明码的第4、5、6、7、P3、D2、D3、D4、位包括P3自己 对m4k3偶校验的例子只要进行式次偶性测试。这些测试以A、B、C表示在图6所示各位的位置上进行。 奇偶条件 码 字 位 置 1 2 3 4 5 6 7 A B C x x x x x x x x x x x x 图6 奇偶校验位置 因此可得到三个校验方程及确定校验位的三个公式 AB1B3B5B70 得P1D1D2D4 BB2B3B6B70 得P2D1D3D4 CB4B5B6B70 得P3D2D3D4 若四位信息码为1001利用这三个公式可求得三个校验位P1、P2、

15、P3值。和海明码如图7则表示了信息码为1001时的海明码编码的全部情况。而图8中则列出了全部16种信息D1D2D3D400001111的海明码。 码字位置 B1 B2 B3 B4 B5 B6 B7 码位类型 P1 P2 D1 P3 D2 D3 D4 信息码 - - 1 - 0 0 1 校验位 0 0 - 1 - - - 编码后的海明码 0 0 1 1 0 0 1 图7 四位信息码的海明编码 P1 P2 D1 P3 D2 D3 D4 0 0 0 0 0 0 0 1 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 1 1 1 0 0 1 1 0 0 0 1 0 0 1 0

16、1 1 1 0 0 1 1 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 0 1 1 0 1 1 1 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 1 0 1 1 1 1 1 1 1 图8 未编码信息的海明码 上面是发送方的处理 在接收方也可根据这三个校验方程对接收到的信息进行同样的奇偶测试 AB1B3B5B70 BB2B3B6B70 CB4B5B5B70。 若三个校验方程都成立即方程式右边都等于0则说明没有错。若不成立即方程式右边不等于0说明有错。从三个方程式右边的值可以判断那一位出错。例如如

17、果第3位数字反了则C0此方程没有B3AB1这两个方程有B3。可构成二进数CBA以A为最低有效位则错误位置就可简单地用二进数CBA011指出。 同样若三个方程式右边的值为001说明第1位出错。若三个方程式右边的值为100说明第4位出错。 海明码的码距应该是3所以能纠正1位出错。而奇偶校验码的码距才是2只能发现1位出错但不能纠正不知道那一位错。无校验的码距是1它出任何一位出错后还是合法代码所以也就无法发现出错。 这是关于海明码的经典说法即码距为3可以发现2位或者纠正1位错。应满足2k-1mk。 但在清华的王爱英主编的计算机组成与结构该书已成为国内的权威中还提出了一种码距为4的海明码可以发现2位并且

18、纠正1位错。应满足2k-1mk。 由于王爱英书上对这两种概念没有很仔细解释特别对码距为3的海明码过渡很突然。有些书简单抄袭时没有仔细消化所以出现一些概念错。对于一般码距为3的海明码应该是“可以发现2位或者纠正1位错”而不是“可以发现2位并且纠正1位错”。在试题中出现过类似的错误。 四、循环冗余校验码 在串行传送磁盘、通讯中广泛采用循环冗余校验码CRC。CRC也是给信息码加上几位校验码以增加整个编码系统的码距和查错纠错能力。 CRC的理论很复杂一般书上只介绍已有生成多项式后计算校验码的方法。检错能力与生成多项式有关只能根据书上的结论死记。 循环冗余校验码CRC的基本原理是在K位信息码后再拼接R位

19、的校验码整个编码长度为N位因此这种编码又叫NK码。对于一个给定的NK码可以证明存在一个最高次幂为N-KR的多项式Gx。根据Gx可以生成K位信息的校验码而Gx叫做这个CRC码的生成多项式。 校验码的具体生成过程为假设发送信息用信息多项式CX表示将Cx左移R位则可表示成Cx2R这样Cx的右边就会空出R位这就是校验码的位置。通过Cx2R除以生成多项式Gx得到的余数就是校验码。 几个基本概念 1、多项式与二进制数码 多项式和二进制数有直接对应关系x的最高幂次对应二进制数的最高位以下各位对应多项式的各幂次有此幂次项对应1无此幂次项对应0。可以看出x的最高幂次为R转换成对应的二进制数有R1位。 多项式包括

20、生成多项式Gx和信息多项式Cx。 如生成多项式为Gxx4x3x1 可转换为二进制数码11011。 而发送信息位 1111可转换为数据多项式为Cxx3x2x1。 2、生成多项式 是接受方和发送方的一个约定也就是一个二进制数在整个传输过程中这个数始终保持不变。 在发送方利用生成多项式对信息多项式做模2除生成校验码。在接受方利用生成多项式对收到的编码多项式做模2除检测和确定错误位置。 应满足以下条件 a、生成多项式的最高位和最低位必须为1。 b、当被传送信息CRC码任何一位发生错误时被生成多项式做模2除后应该使余数不为0。 c、不同位发生错误时应该使余数不同。 d、对余数继续做模2除应使余数循环。

21、将这些要求反映为数学关系是比较复杂的。但可以从有关资料查到常用的对应于不同码制的生成多项式如图9所示 N K 码距d Gx多项式 Gx 7 4 3 x3x1 1011 7 4 3 x3x21 1101 7 3 4 x4x3x21 11101 7 3 4 x4x2x1 10111 15 11 3 x4x1 10011 15 7 5 x8x7x6x41 111010001 31 26 3 x5x21 100101 31 21 5 x10x9x8x6x5x31 11101101001 63 57 3 x6x1 1000011 63 51 5 x12x10x5x4x21 1010000110101 1

22、041 1024 x16x15x21 11000000000000101 图9 常用的生成多项式 3、模2除按位除 模2除做法与算术除法类似但每一位除减的结果不影响其它位即不向上一位借位。所以实际上就是异或。然后再移位移位做下一位的模2减。步骤如下 a、用除数对被除数最高几位做模2减没有借位。 b、除数右移一位若余数最高位为1商为1并对余数做模2减。若余数最高位为0商为0除数继续右移一位。 c、一直做到余数的位数小于除数时该余数就是最终余数。 【例】1111000除以1101 1011商 1111000-被除数 1101 除数 010000 1101 01010 1101 111余数 CRC码

23、的生成步骤 1、将x的最高幂次为R的生成多项式Gx转换成对应的R1位二进制数。 2、将信息码左移R位相当与对应的信息多项式Cx2R 3、用生成多项式二进制数对信息码做模2除得到R位的余数。 4、将余数拼到信息码左移后空出的位置得到完整的CRC码。 【例】假设使用的生成多项式是Gxx3x1。4位的原始报文为1010求编码后的报文。 解 1、将生成多项式Gxx3x1转换成对应的二进制除数1011。 2、此题生成多项式有4位R1要把原始报文Cx左移3R位变成1010000 3、用生成多项式对应的二进制数对左移4位后的原始报文进行模2除 1001-商 - 1010000 1011-除数 - 1000

24、1011 - 011-余数校验位 5、编码后的报文CRC码 1010000 011 - 1010011 CRC的和纠错 在接收端收到了CRC码后用生成多项式为Gx去做模2除若得到余数为0则码字无误。若如果有一位出错则余数不为0而且不同位出错其余数也不同。可以证明余数与出错位的对应关系只与码制及生成多项式有关而与待测码字信息位无关。图10给出了Gx1011Cx1010的出错模式改变Cx码字只会改变表中码字内容不改变余数与出错位的对应关系。 收到的CRC码字 余数 出错位 码位 A7 A6 A5 A4 A3 A2 A1 正确 1 0 1 0 0 1 1 000 无 错 误 1 0 1 0 0 1

25、0 1 0 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0 0 0 0 1 1 1 1 1 0 0 1 1 0 0 1 0 0 1 1 001 010 100 011 110 111 101 1 2 3 4 5 6 7 图10 74CRC码的出错模式Gx1011 如果循环码有一位出错用Gx作模2除将得到一个不为0的余数。如果对余数补0继续除下去我们将发现一个有趣的结果各次余数将按图10顺序循环。例如第一位出错余数将为001补0后再除补0后若最高位为1则用除数做模2减取余若最高位为0则其最低3位就是余数得到第二次余数为010。以后继续补0作模2除依次得到余数为

26、1000ll反复循环这就是“循环码”名称的由来。这是一个有价值的特点。如果我们在求出余数不为0后一边对余数补0继续做模2除同时让被检测的校验码字循环左移。图10说明当出现余数101时出错位也移到A7位置。可通过异或门将它纠正后在下一次移位时送回A1。这样我们就不必像海明校验那样用译码电路对每一位提供纠正条件。当位数增多时循环码校验能有效地降低硬件代价这是它得以广泛应用的主要原因。 【例】对图10的CRC码Gx1011Cx1010若接收端收到的码字为1010111用Gx1011做模2除得到一个不为0的余数100说明传输有错。将此余数继续补0用Gx1011作模2除同时让码字循环左移1010111。

27、做了4次后得到余数为101这时码字也循环左移4位变成1111010。说明出错位已移到最高位A7将最高位1取反后变成0111010。再将它循环左移3位补足7次出错位回到A3位就成为一个正确的码字1010011。 通信与网络中常用的CRC 在数据通信与网络中通常k相当大由一千甚至数千数据位构成一帧而后采用CRC码产生r位的校验位。它只能检测出错误而不能纠正错误。一般取r16标准的16位生成多项式有CRC-16x16x15x21 和 CRC-CCITTx16x15x21。 一般情况下r位生成多项式产生的CRC码可检测出所有的双错、奇数位错和突发长度小于等于r的突发错以及1-2-r-1的突发长度为r1的突发错和1-2-r的突发长度大于r1的突发错。例如对上述r16的情况就能检测出所有突发长度小于等于16的突发错以及99997的突发长度为17

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论