NiosII的Boot过程分析论文_第1页
NiosII的Boot过程分析论文_第2页
NiosII的Boot过程分析论文_第3页
NiosII的Boot过程分析论文_第4页
NiosII的Boot过程分析论文_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 2几种常见的boot方式12.1从epcs串行存贮器中boot12.2从外部cfi 并行flash中boot13从epcs中boot13.1epcs控制器的bootloader分析23.2epcs控制器33.3epcs串行存贮器件54从并行flash中boot54.1并行flash配置控制器54.2直接在flash中运行程序54.3在ram中运行程序65bootloader解读75.1boot_loader.s解读85.2boot_loader_epcs_bits.s解读105.3boot_loader_cfi_bits.s解读216crt0.s解读231 概述nios ii 的boot过

2、程要经历两个过程。1. fpga器件本身的配置过程。fpga器件在外部配置控制器或自身携带的配置控制器的控制下配置fpga的内部逻辑。如果内部逻辑中使用了nios ii,则配置完成的fpga中包含有nios ii软核cpu。2. nios ii本身的引导过程。一旦fpga配置成功后,nios ii 就被逻辑中的复位电路复位,从reset地址开始执行代码。nios ii 的reset地址可以在sopc builder的“nios ii morecpusetting”页表中设置。2 几种常见的boot方式2.1 从epcs串行存贮器中boot这种boot方式,fpga的配置数据和nios ii的程

3、序都存放在epcs器件中。fpga配置数据放在最前面,程序放在后面,程序可能有多个段,每个段前面都插有一个“程序记录”。一个“程序记录”由2个32位的数据构成,一个是32位的整数,另一个是32位的地址,分别用于表示程序段本身的长度和程序段的运行时地址。这个“程序记录”用于帮助bootloader把各个程序段搬到程序执行时真正的位置。epcs是串行存贮器,nios ii 不能直接从epcs中执行程序,它实际上是执行epcs控制器的片内rom的代码(即bootloader),把epcs中程序的搬到ram中执行。2.2 从外部cfi 并行flash中boot这种boot方式还可以分为2种情况。1.

4、程序直接在flash中运行。这种情况程序不需要另外的bootloader,nios ii 复位时reset地址(指向flash内部)开始执行程序,程序必须有启动代码用于搬移.rwdata段(因为.rwdata段是可读写的不能存放在flash中),同时如果.rodata段和.exceptions段连接时没有指定在flash中话(比如在ram中),也会被搬到ram中,并对.bss段清零,设置栈的指针。这些工作都在crt0.s中完成。2. 程序在ram(包括on-chip ram,sdram,ssram泛指一般的ram)中运行。这种情况需要有一个专门的bootloader,它把存放在flash中的各

5、个程序段搬到程序执行时各个段真正的位置。3 从epcs中boot要支持nios ii从epcs中boot首先要求fpga器件要支持主动串行配置。altera的cyclone,cyclone ii和stratix ii系列的fpga支持主动串行配置。直到nios ii 5.1版本,nios ii 从epcs中boot在stratix ii系列的fpga上实现上仍有问题。所以这种方式主要用于cyclone和cyclone ii系列的器件。为了实现这种boot方式,用户必须在sopc builder中添加一个epcs控制器,无须给它分配管腿,quartus ii 会自动给它分配到专用管腿上。添完ep

6、cs控制器后,sopc builder会给它分配一个base address,这个地址是epcs控制器本身携带的片上rom在nios ii系统中的基地址,这个rom存有一小段bootloader代码,用于引导整个过程。所以,必须在sopc builder的“nios ii morecpusetting”页表中把reset地址设置为这个基地址,使得nios ii 复位后从这个地址开始执行以完成整个引导过程。3.1 epcs控制器的bootloader分析epcs控制器带有一块片内rom,内有bootloader代码,nios ii 就靠这段代码完成boot过程。它把epcs里的nios ii程序

7、映象复制到ram中,然后跳转到ram中运行。由于程序映象是由elf2flash输出的,bootloader对被搬运的程序映象的位置和结构的解读必须和elf2flash工具一致。fpga的配置数据从epcs偏移为0的地址开始存放,紧挨着配置数据后面是一个32位的整数,指示程序段的长度,接着是一个32位的地址,指示程序执行时该程序段的地址,我们把这个长度和地址一起称为“程序记录”,“程序记录”随后就是程序段映象。一个程序可能有多个程序段,所以也就有多个“程序记录”和程序段映象。bootloader必须知道fpga配置数据的长度以读取配置数据后面的内容,不同型号的fpga的配置数据长度是不同的,所以

8、必须读取配置数据的头部信息获取配置数据的长度,进而逐个读取程序段映象的长度和运行时地址,然后把程序段映象搬到目的运行时地址。为了存取epcs,bootloader构造了一些位置无关汇编代码。epcs的存贮布局如下所示:剩余空间4字节的最后一个“程序记录”的目的地址域a0x00000000,4字节的最后一个“程序记录”的长度域lln个字节的第n个程序段映象4字节的第n个程序段的目的地址an4字节的第n个程序段的长度lnl2个字节的第2个程序段映象4字节的第2个程序段的目的地址a24字节的第2个程序段的长度l2length+8length+l+7l1字节的第1个程序段映象length+4lengt

9、h+74字节的第1个程序段目的地址a1lengthlength+34字节的第1个程序段长度l10length-1fpga配置数据,长度为length当bootloader读取到l时,l0,表示前面所有的程序记录已经处理完毕,这个是最后的程序记录就直接跳到地址a的地方执行。显然a必须是程序的入口地址。如果l0xffffffff(即-1),那么就忽略a并停机,这样,即使是一个只有fpga配置数据而没有程序的epcs也是安全的。当一个epcs只有配置数据而没有程序的时候,sof2flash会在配置数据的末尾增加4个字节的0xff使bootloader不会有误动作。bootloader的工作流程如下:

10、3.2 epcs控制器epcs控制器手册没有对epcs进行详细的说明只是建议用户使用altera的hal函数来存取。其实epcs控制器由两个独立的部件构成:1.rom。大小是512个字节,也就是128 words。尽管epcs控制器手册表述了rom的大小是1k字节,实际上直到nios ii 5.1 epcs控制器的rom仍然是512个字节,因此手册中给出的寄存器偏移地址都需要修正。2.spi master控制器。epcs串行存贮器的接口符合spi标准。nios ii 可以通过spi master来存取epcs串行存贮器。这两个部件的地址(从nios ii 的角度看,以字节为单位)安排如下:偏移

11、地址寄存器r/w位描述31.00x000boot rom memoryrboot loader code epcs_controller_boot_rom.hexor epcs_controller_boot_rom.dat0x0040x1fc0x200rx datar31.8 (not implemented)rx data(7.0)0x204tx dataw31.8 (not implemented)tx data(7.0)0x208statusr/w31.11109876543210eoperrdytrdytmttoeroe0x20ccotrolr/w31.11109876543210i

12、eopieirrdyitrdyitoeiroe0x210reserved-0x214slaver enabler/w31.161514133210ss_15ss_14ss_13ss_3ss_2ss_1ss_00x218end of packetr/w31.8 (not implemented)end of character(7.0)l rx data寄存器nios ii从rx data寄存器中读出从epcs中接收到的数据。当接收移位寄存器收到满8位的数据,status寄存器的rrdy位被置1,同时数据被传入rx data寄存器。读取rx data寄存器会把rrdy位清掉,而往rx data写

13、则没有影响。l tx data寄存器nios ii把要发送的数据写到tx data寄存器。status寄存器中的trdy位置1表示tx data寄存器准备好接收来自nios ii的新数据。tx data被写了之后,trdy位就被置0,直到数据从tx data转移到发送移位寄存器又会被重新置为1。l status寄存器status寄存器包含有指示当前状态的位。几乎每一位都和control寄存器的一个中断允许位相关。nios ii任何时候都可以读取status寄存器,不会影响该寄存器的值。往status寄存器写将清除roe,toe和e这些位。下表描述了各个位的含义:位名称含义3roe接收溢出错误。

14、当rx data寄存器数据满的时候(rrdy为1),接收移位寄存器又往rx data寄存器写,那roe位将被置1。而新的数据会覆盖老的数据。往status寄存器写可以把roe位清0。4toe发送溢出错误。如果tx data寄存器数据还没有被转移到发送移位寄存器(trdy为0),又往tx data寄存器写,那toe就会被置为1。新的数被忽略。往status寄存器写可以清toe为0。5tmt发送移位寄存器空。如果一个发送过程正在进行中,那tmt为0;如果发送移位寄存器为空,则tmt为1。6trdy发送器准备好接收新的发送数据。当tx data寄存器空的时候,trdy为1。7rrdy接收器准备好送出

15、接收到的数。当rx data寄存器满的时候,rrdy为1。8e有错误产生。它是toe和roe的逻辑或。只要toe或roe中有一个为1,那它也为1。它给程序提供了一个判断有错误发生的方便的途径。往status寄存器写可以把e位清0。9eop包结束标志。该标志在下列情况下被置1:1. 一个eop字节被写入tx data寄存器2. 一个eop字节从rx data寄存器中读出eop字节就是end of packet寄存器中的end of character字节。往status寄存器写可以把eop位清0。l control寄存器control寄存器控制spi master的操作。nios ii可以在任何

16、时候读取control寄存器而不改变它的值。大部分control寄存器的位(iroe,itoe,itrdy,irrdy和ie)控制status寄存器相应位的中断。比如当iroe设为1,就允许当status中的roe为1时产生中断。只有当control寄存器和stauts寄存器中的相应位都为1的情况下,spi master才会产生中断。位名称含义3iroe允许roe条件满足时产生中断。4itoe允许toe条件满足时产生中断。6itrdy允许trdy条件满足时产生中断。7irrdy允许rrdy条件满足时产生中断。8ie允许e条件满足时产生中断。9ieop允许eop条件满足时产生中断。10sso强制

17、slave enable寄存器器中为1的位对应的ss_n有效,即输出电平0。l slave enable寄存器slave enable寄存器中的某一位置1表示相应的ss_n信号可以被驱动有效(即在control寄存器中写sso位为1,或者有数据写入tx data寄存器准备开始传送数据)。slave enable寄存器可以多位为1,但是需要有其它逻辑来处理多个spi slave的冲突问题。l end of packet寄存器end of packet寄存器包含end of character,当某一avalon master读出的rx data寄存器字节和end of character一样,或

18、者写入tx data的字节和end of character一样时,spi master产生eop标志。如果该avalon master支持endofpacket信号,则会中断传输。epcs控制器在例化spi master时使用下列参数:数据位8位;spi时钟sclk频率20mhz;mosi(asdo)在sclk的下降沿处输出;miso(data0)在sclk上升沿处采样;sclk的初始相位为0;msb先输出,lsb后输出;目标延迟100us(即ss_n输出为低到sclk开始驱动输出时钟脉冲的延迟为100us)。3.3 epcs串行存贮器件altera的器件手册对epcs器件有完整清楚的表述。

19、在read byte,read status和read silicon id操作时,发出命令后,所要的数据会马上从epcs的data管腿移出。所以epcs控制在发出命令后继续发送虚拟数据(比如0或随便什么值),在发送虚拟数据的同时接收epcs送出的数据,就可以获取所要的数据。spi接口的发送和接收是同时的,为了接收数据,你必须发送点什么,尽管这些数据是对方不需要的,同样在你发送命令或数据的同时也会收到点什么,尽管这些也不一定是你需要的。4 从并行flash中boot4.1 并行flash配置控制器nios ii应用常常把nios ii 程序和fpga配置数据都存放在flash中。这就需要一个配

20、置控制器来驱动flash输出配置数据完成fpga的配置。配置控制器可以用一片cpld来实现。flash除了可以存贮fpga配置数据和nios ii程序外还可以存贮其它数据(比如只读文件系统)。flash中的配置数据区还可以分为两个区,一个用于用户逻辑,另一个用于出厂逻辑。当用户逻辑配置失败后,就会自动使用出厂逻辑,保证任何时候都有一个配置可以工作。另外,配置控制器还可以接收来自nios ii 的重配置请求,并驱动fpga重新配置,完成fpga的现场升级。stratix开发板的配置控制安排偏移量为0的地方存放nios ii程序,而fpga用户配置逻辑从偏移量0x600000开始,出厂配置则从偏移

21、量0x700000开始。stratix开发板的并行flash配置控制器其实是一个地址序列生成器,地址生成器的输入时钟是板上时钟的4分频(比如,板上的晶振时钟是50mhz,则地址生成器的时钟就是12.5mhz)。上电的时候,由上电复位芯片提供的复位信号复位,地址生成器初始化为用户逻辑的配置数据的偏移量(比如stratix板是0x600000),然后开始计数并驱动地址由低往高增长,使flash送出对应地址的配置数据。配置控制器监测fpga的config_done信号,一旦发现fpga配置完成就停止计数,并置flash的地址和其它控制线为高阻,以免影响nios ii对flash的操作。fpga配置完

22、成后,内部逻辑开始生效,复位nios ii,nios ii开始从reset地址执行程序。4.2 直接在flash中运行程序嵌入式应用有时希望程序能够直接在flash中运行,以节约ram空间,降低成本。为了使程序直接在flash中运行,可以在sopc builder中设置reset地址在flash中,连接程序的时候可以指定程序的.text段和.rodata段存放在flash中,而让.rwdata和堆栈放在ram中(这2个段都是可读写的,不能放在flash中)。同时还可以在sopc builder中指定exception地址到flash中,也可以节约一点ram空间。由于最后的flash映象文件.f

23、lash文件(.flash文件其实是.srec格式的文件)中没有bss段,所以程序的开始必须在ram中建立bss段并清0,同时也把.rwdata段从flash中拷贝到ram中(.rwdata段在程序运行的时候必须在ram中),并设置好栈,建立好c程序的工作环境然后调用c用户入口函数。这些工作都是由crt0.s来完成的。下面是crt0.s在flash中运行的工作流程:4.3 在ram中运行程序程序在flash运行通常比在ram中慢,所以有时也希望程序能够在ram中运行。nios ii的reset地址仍然指向flash中(reset地址不能指向ram,ram在上电复位时还没有被初始化),在连接程序

24、的时候可以把每个段都指定到ram中,在sopc builder中也可以把exception部分指定到ram中。这样连接生成的可执行文件.elf文件就是适合在ram中运行的程序。但在实际应用中这个程序最终存放在flash中,所以需要有一段bootloader代码,用于把flash中的程序映象拷贝到ram中运行。工具elf2flash能够根据情况自动给你的程序在生成.flash文件时添加“程序记录”和bootloader。elf2flash判断其后随参数reset地址(就是nios ii的reset地址)和程序的入口地址是不是一样,如果一样就不添加“程序记录”和bootloader,如果不一样就添

25、加。这个bootloader根据各个“程序记录”把程序映象拷贝到到ram中并从ram中执行。和epcs一样,每个“程序记录”由两个32位的数据组成,一个是程序的长度,一个目的执行地址(即程序的运行地址)。stratix 开发板上flash中的存贮分布如下:0x7000000x7fffff出厂逻辑safe logic0x6000000x6fffff用户逻辑user logic剩余空间4字节的最后一个“程序记录”的目的地址域a0x00000000,4字节的最后一个“程序记录”长度域lln个字节的第n个程序段映象4字节的第n个程序段的目的地址an4字节的第n个程序段的长度lnl2个字节的第2个程序段

26、映象4字节的第2个程序段的目的地址a24字节的第2个程序段的长度l2length+8length+l+7l1字节的第1个程序段映象length+4length+74字节的第1个程序段的目的地址a1lengthlength+34字节的第1个程序段的长度l10length-1bootloaderbootloader的工作流程如下:运行完bootloader后仍然要执行crt0.s,但此时crt0.s的流程和程序在flash中直接运行的情况有一些区别:它没有初始化指令cache,也不会企图去装载别的段,这些步骤已经在bootloader中完成。程序映象已经包含这些段,在搬移程序映象的同时也装载了相应

27、的段(.rodata段,.rwdata段和.exceptions段),程序映象中不包含.bss段和栈,所以仍然需要清.bss段以及设置栈指针和全局指针。bootloader没有存取存贮器数据,因此没有初始化数据cache,所以crt0.s仍然要初始化数据cache。5 bootloader解读altera提供了两个bootloader程序,一个用于从epcs器件中boot,另一个用于从flash器件中boot。它们的汇编源码和makefile都在c:alterakits ios2_51componentsaltera_nios2sdksrcoot_loader_sources目录中。其中boo

28、t_loader.s是公共部分,而boot_loader_epcs_bits.s则用于从epcs器件中boot,boot_loader_cfi_bits.s用于从flash中boot。5.1 boot_loader.s解读#ifdef epcs #define find_payload sub_find_payload_epcs/ 查找epcs中数据负荷子程序 #define read_int sub_read_int_from_flash_epcs/ 从epcs中读取一个32位word #define streaming_copy sub_streaming_copy_epcs/ 从epcs

29、中拷贝流的子程序 #define close_device sub_epcs_close/ 关闭epcs器件的子程序#else #define find_payload sub_find_payload_cfi/ 查找cfi并行flash中数据负荷的子程序 #define read_int sub_read_int_from_flash_cfi/ 从cfi并行flash中读取一个32位的word #define streaming_copy sub_streaming_copy_cfi/ 从cfi并行flash中拷贝流的子程序#endif#include boot_loader.h .glob

30、al reset .global _start .global main .global end_of_boot_copierreset:_start:main: / 清除cpu的状态寄存器禁止中断,这个动作在硬件复位的时候其实已经自动完成。. wrctl status, r_zero / 冲刷指令cache. / nios ii 最多支持64kbytes的指令cache,所以只初始化了64kbytes的指令cache movhi r_flush_counter,%hi(0x10000)cache_loop: initi r_flush_counter / 没有必要初始化数据cache, bo

31、otloader不存取存贮器数据 addi r_flush_counter, r_flush_counter,-32 bne r_flush_counter, r_zero, cache_loop / 冲刷流水线 flushp / r_flash_ptr = find_payload(); / 调用查找数据负荷子程序寻找数据负荷 nextpc return_address_less_4 br find_payload / 拷贝. / / 在循环的开始,寄存器r_flash_ptr 包含“程序记录”的地址。 / / 1) 读取“程序记录”的长度域(4-bytes)(r_data_size) /

32、2) 读取“程序记录”的目的地址域(4-bytes)(r_dest) / 3) 循环: / 拷贝 r_data_size 个字节, 一次一个字节: *r_dest+ = *r_flash_ptr+ / 把0xffffffff装入r_halt_record,用于测试是否要停机。 subi r_halt_record, r_zero, 1per_record_loop: /读取“程序记录”的长度域,r_data_size = read_int(r_flash_ptr+)。 nextpc return_address_less_4 br read_int mov r_data_size, r_rea

33、d_int_return_value / 读取“程序记录”的目的地址域,r_dest = read_int(r_flash_ptr+)。 nextpc return_address_less_4 br read_int mov r_dest, r_read_int_return_value / 测试长度域是否为0 / 如果是就直接运行程序 beq r_data_size, r_zero, last_program_record / 如果长度域为-1(0xffffffff),就停机。halt_record_forever: beq r_data_size, r_halt_record, halt

34、_record_forever / 使用拷贝流子程序搬移数据 nextpc return_address_less_4 br streaming_copy / 程序运行到这里,表明已经处理了当前的“程序记录”了, / 而且知道这不是最后一个“程序记录”因为它的长度域不为0, / 这就意味着要处理下一个“程序记录”。 br per_record_looplast_program_record: / 处理完最后一个程序记录后就要把控制权转给实际的运行程序. / r_dest是实际程序的入口地址 / 在中止boot-loader之前要关闭epcs器件,如果不做这一步, / 会导致hal的open()

35、调用要花好几秒钟才能打开epcs器件#ifdef epcs nextpc return_address_less_4 br close_device#endif / 跳转到目的地址运行程序 callr r_destafterlife: / 程序跑到这里表明有问题。 br afterlife .end5.2 boot_loader_epcs_bits.s解读/ 从epcs串行flash设备读取字节的子过程/ 通过寄存器和epcs打交道获取字节数#include boot_loader.h .global sub_find_payload_epcs .global sub_read_int_fro

36、m_flash_epcs .global sub_streaming_copy_epcs .global sub_epcs_close/ epcs控制和状态寄存器的偏移量#define epcs_rxdata_offset 0x00#define epcs_txdata_offset 0x04#define epcs_status_offset 0x08#define epcs_control_offset 0x0c/ epcs的位掩码#define epcs_status_tmt_mask 0x20#define epcs_status_trdy_mask 0x40#define epcs_

37、status_rrdy_mask 0x80#define epcs_control_sso_mask 0x400/ epcs命令#define epcs_command_read 0x03 .text/ 查找epcs的数据负荷/ 过程:/ - 在偏移量为0的地方打开epcs器件(fpga配置数据在这里)/ - 分析配置数据获取数据负荷开始的地址/ - 关闭epcs/ - 在数据负荷的开始的地址再次打开epcs/sub_find_payload_epcs: / 修正并存贮返回地址 addi r_findp_return_address, return_address_less_4, 4 / /

38、计算epcs控制/状态寄存器块的地址 / 它在离本段代码的开头偏移量为512个字节的地方 / 因为这段代码必须在512字节边界处, / 我们简单地把当前地址园整到下一个512个地址的边界。 / / | / | 为了调试,你可以定义epcs_regs_base / | 作为epcs寄存器基地址。否则就假设下一个512字节边界。 / | nextpc r_findp_temp#ifdef epcs_regs_base movhi r_epcs_base_address, %hi(epcs_regs_base) addi r_epcs_base_address, r_epcs_base_addres

39、s, %lo(epcs_regs_base)#else ori r_epcs_base_address, r_findp_temp, 511 addi r_epcs_base_address, r_epcs_base_address, 1#endif / / 在偏移量为0的地方打开epcs器件 / movi r_flash_ptr, 0 nextpc return_address_less_4 br sub_epcs_open_address / / 分析器件配置数据顺序读出字节直到下面任一个条件满足 / 1) 我们找到0xa6 (其实应该是0x56,因为我们没有把位序颠倒过来) / 当我们找

40、到它时表示我们找到配置数据,可以接着算出它的长度。 / 2) 我们找到不是xff字节,在这种情况我们根本没有在配置数据里查找 / 我们假定我一定是在一个boot loader记录。跳过整个配置数据长度的计算 / 开始装载。 / 3) 我们在任意长的时间内找到的都是0xff。我们猜测flash是空的没有其它可利用资源 / / 搜索随意的一大块字节 movi r_findp_count, 0x400 / 我们要找的模板是0x56 movi r_findp_pattern, 0x56 / 在我们找到0x56之前唯一可以接受的字节是0xff movi r_findp_temp, 0xfffp_look

41、_for_56_loop: nextpc return_address_less_4 br sub_read_byte_from_flash_epcs / 我们发现模板了吗? beq r_read_byte_return_value, r_findp_pattern, fp_found_sync / 我们发现非0xff的字节了吗? bne r_read_byte_return_value, r_findp_temp, fp_short_circuit / 更新循环计数器开始循环 subi r_findp_count, r_findp_count, 1 bne r_findp_count, r_

42、zero, fp_look_for_56_loop / 我们没有找到模板或其它匹配的字节,挂起。 / 先关闭epcs器件 nextpc return_address_less_4 br sub_epcs_closefp_hang: br fp_hangfp_found_sync: / 同步模板后面紧跟着的4个字节是我们感兴趣 nextpc return_address_less_4 br sub_read_int_from_flash_epcs / 这4个字节是配置的长度,它们的字节顺序是little-endian,但位序是反的。 nextpc return_address_less_4 br

43、 sub_read_int_from_flash_epcs / 把长度放到r_flash_ptr 中 mov r_flash_ptr, r_read_int_return_value / 此时我们获得了长度但是在epcs器件中quarts / 以相反的位序存贮字节 / / 我们先把4位组反过来,再把2位组反过来,然后再把所有的位反过来。 / 就象这样: / / 76543210 4位组反序- 32107654 两位组反序 - 10325476 位反序 - 01234567 / / 下面是整个循环的进行机制 / 你会注意到这个反序过程只展示了一次 / 不用担心,所有的字节都会被反序 / / (x

44、 = unknown, . = zero) / / byte temp mask count / - - - - / 初始态 76543210 xxxxxxxx 00001111 4 / / 1 temp = byte & mask 76543210 .3210 00001111 4 / 2 temp = count xxxx7654 3210. 00001111 4 / 4 byte &= mask .7654 3210. 00001111 4 / 5 byte |= temp 32107654 3210. 00001111 4 / 6 count = 1 32107654 3210. 00

45、001111 2 / 7 temp = mask count 32107654 00111100 00001111 2 / 8 mask = temp 32107654 00111100 00110011 2 / / loop on (count != 0) / / temp = byte & mask 32107654 .10.54 00110011 2 / temp = count xx321076 10.54. 00110011 2 / byte &= mask .32.76 10.54. 00110011 2 / byte |= temp 10325476 10.54. 0011001

46、1 2 / count = 1 10325476 10.54. 00110011 1 / temp = mask count 10325476 01100110 00110011 1 / mask = temp 10325476 01100110 01010101 1 / / loop on (count != 0) / / temp = byte & mask 10325476 .0.2.4.6 01010101 1 / temp = count x1032547 0.2.4.6. 01010101 1 / byte &= mask .1.3.5.7 0.2.4.6. 01010101 1

47、/ byte |= temp 01234567 0.2.4.6. 01010101 1 / count = 1 01234567 0.2.4.6. 01010101 0 / temp = mask count 01234567 01010101 01010101 0 / mask = temp 01234567 01010101 00000000 0 / / 初始化mask movhi r_revbyte_mask, 0x0f0f addi r_revbyte_mask, r_revbyte_mask, 0x0f0f / 装入count movi r_findp_count, 4fp_reve

48、rse_loop: / 屏蔽高一半的位把结果装入temp寄存器 and r_findp_temp, r_flash_ptr, r_revbyte_mask / 1 / 把temp中的位左移4位 sll r_findp_temp, r_findp_temp, r_findp_count / 2 / 把ptr中字节右移4位 srl r_flash_ptr, r_flash_ptr, r_findp_count / 3 / 屏蔽掉高4位 and r_flash_ptr, r_flash_ptr, r_revbyte_mask / 4 / 把ptr和temp中的位组合起来 or r_flash_ptr, r_flash_ptr, r_findp_temp / 5 / 更新移位计数器 srli r_findp_count, r_findp_count, 1 / 6 / 左移mask 2位 sll r_findp_temp, r_revbyte_mask,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论