版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 PL/O编译器源程序分析PL/0语言是Pascal语言的一个子集,我们这里分析的PL/0的编译程序包括了对PL/0语言源程序进行分析处理、编译生成类PCODE代码,并在虚拟机上解释运行生成的类PCODE代码的功能。PL/0语言编译程序采用以语法分析为核心、一遍扫描的编译方法。词法分析和代码生成作为独立的子程序供语法分析程序调用。语法分析的同时,提供了出错报告和出错恢复的功能。在源程序没有错误编译通过的情况下,调用类PCODE解释程序解释执行生成的类PCODE代码。词法分析子程序分析:getsym,功能是从源程序中读出一个单词符号(sym、id和num中,语法分析器需要单词时,(注意!语法分析
2、器每次用完这三个变量的值就立即调用词法分析子程序名为token),把它的信息放入全局变量直接从这三个变量中获得。一次使用。而不是在需要新单词时才调用过程从源程序过获取字符,并把它们拼成单getsym子程序获取新getsym过程。)getsym过程通过反复调用词。getch过程中使用了行缓冲区技术以提高程的单词供下getch子 #序运行效率。词法分析器的分析过程:如果这个字符是字母,调用getsym时,它通过getch过程从源程序中获则继续获取字符或数字,最终可以拼成一个单词,得一个字符。查保留字表,如果查到为保留字,则把sym变量赋成相应的保留字类型值;一个用户自定义的标识符(可能是变量名、常
3、量名或是过程的名字)如果没有查到,则这个单词应是这个单词存入id变量。查保留字表时使用了二分法查找以提高效率。如果符是数字,则继续用并把拼成的数值放入getch获取数字,并把它们拼成一个整数,然后把num变量。如果识别出其它合法的符号(比如:赋值号、大于号、小,把sym置为ident,把getch获得的字number,sym置为于等于号等),则把sym则成相应的类型。如果遇到不合法的字符,把sym置成nul。语法分析子程序分析:语法分析子程序采用了自顶向下的递归子程序法,语法分析同时也根据程序的语意生成相应的代码,并提供了出错处理的机制。语法分析主要由分程序分析过程(block)、常量定义分析
4、过程(constdeclaration)、变量定义分析过程(vardeclaration)、语句分析过程(statement)、表达式处理过程和条件处理过程(expression)、项处理过程(condition)构成。这些过程在结构上构成一个term)、因子处理过程(嵌套的层次结构。除此之外,还有出错报告过程(error)、代码生成过程登录名字表过程(enter)、查询名字表函数(gen)、测试单词合法性及出错恢复过程(position)以及列出类作过语法分析的辅助过程。由PL/0的语法图可知:一个完整的译程序在运行的时候,通过主程序中调用分程序处理过程分析过程中还可能会递归调用factor
5、)(test)、PCODE代码过程(listcode)PL/0程序是由分程序和句号构成的。因此,本编block来分析分程序部分(分程序block过程),然后,判断最后读入的符号是否为句号。如果是句号且分程序分析中未出错,则是一个合法的PL/0程序,可以运行生成的代码,否则就 #说明源PL/0程序是不合法的,输出出错提示即可。下面按各语法单元分析PL/0编译程序的运行机制。 # #分程序处理过程: 语法分析开始后,首先调用分程序处理过程0层、符号表位置0、出错恢复单词集合为句号、(block)处理分程序。过程入口参数置为:声明符或语句开始符。进入block过程后, #首先把局部数据段分配指针设为
6、3,准备分配3个单元供运行期存放静态链SL、动态链DL #jmp指令,准备跳转到主程和返回地址RA。然后用txO记录下当前符号表位置并产生一条 #0,序的开始位置,由于当前还没有知到主程序究竟在何处开始,所以稍后再改。同时在符号表的当前位置记录下这个套层数没有超过规定的层数后,开始分析源程jmp的目标暂时填为jmp指令在代码段中的位置。在判断了嵌序。首先判断是否遇到了常量声明,如果遇 到则开始常量定义,把常量存入符号表。接下去用同样的方法分析变量声明,变量定义过程中会用dx变量记录下局部数据段分配的空间个数。然后如果遇到过程声明和定义,声明的方法是把过程的名字和所在的层次记入符号表,proce
7、dure保留字则进行过程定义的方法就是通过递归调用block过程,因为每个过程都是一个分程序。由于这是分程序中的分程序,因此调用block时需把当前的层次号lev加一传递给block过程。分程序声明部分完成后,即将进入语句的处理,这时的代码分配指针cx的值正好指向语句的开始位置,这个位置正是前面的jmp指令需要跳转到的位置。于是通过前面记录下来的地址值,把这个jmp指令的跳转位置改成当前cx的位置。并在符号表中记录下当前的代码段分配地址和局部数据段要分配的大小(dx的值)。生成一条条指令。下面就调用语句处理过程opr指令,用于从分程序返回(对于int指令,分配dx个空间,作为这个分程序段的第一
8、statement分析语句。分析完成后,生成操作0层的主程序来说,就是程序运行完成,退出)数为0的常量定义过程:通过循环,它对应的值。反复获得标识符和对应的值,存入符号表。符号表中记录下标识符的名字和变量定义过程:与常量定义类似,通过循环,反复获得标识符,存入符号表。符号表中记录下标识符的名字、它所在的层及它在所在层中的偏移地址。语句处理过程:语句处理过程是一个嵌套子程序,通过调用表达式处理、项处理、因子处理等过程及递归调用自己来实现对语句的分析。语句处理过程可以识别的语句包括赋值语句、read语句、write语句、call语句、来分析。分析的同时生成相if语句、应的类while语句。当遇到P
9、CODE指令。begin/end语句时,就递归调用自己赋值语句的处理:首先获取赋值号左边的标识符,从符号表中找到它的信息,并确认这个标识符确为变量名。然后通过调用表达式处理过程算得赋值号右部的表达式的值并生成相应的指令保证这个值放在运行期的数据栈顶。最后通过前面查到的左部变量的位置信息,生成相应的sto指令,把栈顶值存入指定的变量的空间,实现了赋值操作。 # #read语句的处理:确定read语句语法合理的前提下(否则报错)的opr指令,实现从标准输入设备上读一个整数值,放在数据栈顶。第二条是栈顶的值存入read语句括号中的变量所在的单元。,生成相应的指令:第一条是16号操作sto指令,把 w
10、rite语句的处理:与read语句相似。在语法正确的前提下,生成指令:通过循环调用表达式处理过程分析write语句括号中的每一个表达式,生成相应指令保证把表达式的值算出并放到数据栈顶并生成行。14号操作的opr指令,输出表达式的值。最后生成15号操作的opr指令输出一个换call语句的处理:从符号表中找到call语句右部的标识符,获得其所在层次和偏移地址。然后生成相应的cal指令。至于调用子过程所需的保护现场等工作是由类PCODE解释程序在解释执行cal指令时自动完成的。if语句的条件,把相应的真假值jpc指令的位置)0。然后调用语句处理过程处理当前代码段分配指针的位置就应该,然后生成jpc指
11、令的位置,把它的跳转位置改成当if语句的处理:按if语句的语法,首先调用逻辑表达式处理过程处理放到数据栈顶。接下去记录下代码段分配位置(即下面生成的条件转移jpc指令(遇0或遇假转移),转移地址未知暂时填then语句后面的语句或语句块。then后的语句处理完后,是上面的jpc指令的转移位置。通过前面记录下的前的代码段指针位置。begin/end语句的处理:通过循环遍历begin/end语句块中的每一个语句,通过递归调用语句分析过程分析并生成相应代码。while语句的处理:while语cx2变量记下当前位置,生成首先用cx1变量记下当前代码段分配位置,作为循环的开始位置。然后处理句中的条件表达式
12、生成相应代码把结果放在数据栈顶,再用条件转移指令,转移位置未知,填0。通过递归调用语句分析过程分析do语句后的语句或语句块并生成相应代码。最后生成一条无条件跳转指令jmp,跳转到cxl所指位置,并把cx2所指的条件跳转指令的跳转位置改成当前代码段分配位置。表达式、项、因子处理:由若干个项以加减号连接或一个数字,或构造出相应的过程,递归调用就完成了除号的优先级问题。在这几个过根据PL/0语法可知,表达式应该是由正负号或无符号开头、而成。而项是由若干个因子以乘除号连接而成,因子则可能是一个标识符是一个以括号括起来的子表达式。根据这样的结构,表达式的处理。把项和因子独立开处理解决了加减号与乘程的反复
13、调用中,始终传递分析过程得以进行下去。fsys变量的值,保证可以在出错的情况下跳过出错的符号,使逻辑表达式的处理:首先判断是否为一元逻辑表达式:判奇偶。如果是,则通过调用表达式处理过程分析计算表达式的值,然后生成判奇指令。如果不是,则肯定是二元逻辑运算符,通过调用表达式处理过程依次分析运算符左右两部分的值,放在栈顶的两个空间中,然后依不同的逻辑运算符,生成相应的逻辑判断指令,放入代码段。判断单词合法性与出错恢复过程分析:本过程有三个参数,s1、s2为两个符号集合,n为出错代码。本过程的功能是:测试当前符号(即sym变量中的值)是否在s1集合中,如果不在,就通过调用出错报告过程输出出错代码n,并
14、放弃当前符号,通过词法分析过程获取一下单词,直到这个单词出现在si或s2集合中为止。这个过程在实际使用中很灵活,主要有两个用法:在进入某个语法单位时,调用本过程,检查当前符号是否属于该语法单位的开始符号集合。若不属于,则滤去开始符号和后继符号集合外的所有符号。在语法单位分析结束时,调用本过程,检查当前符号是否属于调用该语法单位时应有的后继符号集合。若不属于,则滤去后继符号和开始符号集合外的所有符号。通过这样的机制,可以在源程序出现错误时,及时跳过出错的部分,保证语法分析可以继续下去。语法分析过程中调用的其它子过程相对比较简单,请参考源程序的注释。类PCODE代码解释执行过程分析这个过程模拟了一
15、台可以运行类PCODE指令的栈式计算机。它拥有一个栈式数据段用于存放运行期数据、拥有一个代码段用于存放类PCODE程序代码。同时还拥用数据段分配指针、指令指针、指令寄存器、局部段基址指针等寄存器。解释执行类PCODE代码时,数据段存储分配方式如下:对于源程序的每一个过程(包括主程序),在被调用时,首先在数据段中开辟三个空间,存放静态链SL、动态链DL和返回地址RA。静态链记录了定义该过程的直接外过程(或主程序)运行时最新数据段的基地址。动态链记录调用该过程前正在运行的过程的数据段基 #SL、DL和RA址。返回地址记录了调用该过程时程序运行的断点位置。对于主程序来说,的值均置为0。静态链的功能是
16、在一个子过程要引用它的直接或间接父过程(这里的父过程是按定义过程时的嵌套情况来定的,而不是按执行时的调用顺序定的)的变量时,可以通过静态链,跳过个数为层差的数据段,找到包含要引用的变量所在的数据段基址,然后通过偏移地址访问它。在过程返回时,解释程序通过返回地址恢复指令指针的值到调用前的地址,通过当前段基址恢复数据段分配指针,通过动态链恢复局部段基址指针。实现子过程的返回。对于主程序来说,解释程序会遇到返回地址为0的情况,这时就认为程序运行结束。 #解释程序过程中的局部数据段基址。类PCODE代码解释执行的部分通过循环和简单的case判断不同的指令,做出相应的动base函数的功能,就是用于沿着静
17、态链,向前查找相差指定层数的这在使用sto、lod等访问局部变量的指令中会经常用到。 作。当遇到主程序中的返回指令时,指令指针会指到0位置,把这样一个条件作为终至循环的条件,保证程序运行可以正常的结束。以下源程序是以清华大学出版社编译原理中的源代码为基础作了少量改动而成。程序在TurboPascal7.0上编译运行通过。TxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxTxT
18、xTxTxTxTxTxTxTxTxTx*1*1*1*1*1*TxTxTxTxTxprogrampl0(fa,fa1,fa2);(*PL/0编译程序与代码生成解释运行程序*)(*PL/0compilerwithcodegeneration*)label99;(*声明出错跳转标记*)(*在TurboPascal7.0中已不允许跨过程的GOTO转移,因此后面的GOTO语句均被我去除了,因此这里的label也没有意义了*)const(*常量定义*)norw=13;(*ofreservedwords*)(*保留字的个数*)txmax=100;(*lengthofidentifiertable*)(*标识
19、符表的长度(容量)*)nmax=14;(*maxnumberofdigitsinnumbers*)(*数字允许的最长位数*)al=10;(*lengthofidentifiers*)(*标识符最长长度*)amax=2047;(*maximumaddress*)(*寻址空间*)levmax=3;(*maxdepthofblocknesting*)(*最大允许的块嵌套层数*)cxmax=200;(*sizeofcodearray*)(*类PCODE目标代码数组长度(可容纳代码行数)*)type(*类型定义*)symbol=(nul,ident,number,plus,minus,times,sla
20、sh,oddsym,eql,neq,lss,leq,gtr,geq,lparen,rparen,comma,semicolon,period,becomes,beginsym,endsym,ifsym,thensym,whilesym,writesym,readsym,dosym,callsym,constsym,varsym,procsym);(*symc类型标识了不同类型的词汇*)alfa=packedarray1.alofchar;(*alfa类型用于标识符*)object1=(constant,variable,procedur);(*object1为三种标识符的类型*)(*原程序在此
21、使用object作为类型名称,在支持面向对象的TurboPascal7.0中编译不能通过*)(*wirthusedthewordprocedurethere,whickwontwork!*)(*上面一行是课本上的程序清单中的注释,说本程序的原作者Wirth在这里用了procedure这个词作为标识符类型,是不可以的。事实上Wirth原本在这里用的词是prozedure,是可以的。*)symset=setofsymbol;(*symset是symbol类型的一个集合类型,可用于存放一组symbol*)fct=(lit,opr,lod,sto,cal,int,jmp,jpc);(*fct类型分别标
22、识类PCODE的各条指令*)instruction=packedrecordf:fct;(*functioncode*)l:0.levmax;(*level*)a:0.amax;(*displacementaddr*)end;(*类PCODE指令类型,包含三个字段:指令f、层差l和另一个操作数a*)(*lit0,aloadconstantaopr0,aexecuteopralodl,aloadvariablel,astol,astorevariablel,acall,acallprocedureaatlevellint0,aincrementt-registerbyajmp0,ajumptoa
23、jpc0,ajumpconditionaltoavar(*全局变量定义*)fa:text;(*文本文件fa用于列出源程序*)fal,fa2:text;(*文本文件fal用于列出类PCODE代码、fa2用于记录解释执行类PCODE代码的过程*)listswitch:boolean;(*truesetlistobjectcode*)(*如果本变量置true,程序编译后将为列出类PCODE代码,否则不列出类PCODE代码*)ch:char;(*lastcharread*)(*主要用于词法分析器,存放最近一次从文件中读出的字符*)sym:symbol;(*lastsymbolread*)(*词法分析器
24、输出结果之用,存放最近一次识别出来的token的类型*)id:alfa;(*lastidentifierread*)(*词法分析器输出结果之用,存放最近一次识别出来的标识符的名字*)num:integer;(*lastnumberread*)(*词法分析器输出结果之用,存放最近一次识别出来的数字的值*)cc:integer;(*charactercount*)(*行缓冲区指针*)ll:integer;(*linelength*)(*行缓冲区长度*)kk:integer;(*引入此变量是出于程序性能考虑,见getsym过程注释*)cx:integer;(*codeallocationindex*
25、)(*代码分配指针,代码生成模块总在cx所指位置生成新的代码*)line:arrayl.8lofchar;(*行缓冲区,用于从文件读出一行,供词法分析获取单词时之用*)a:alfa;(*词法分析器中用于临时存放正在分析的词*)code:array0.cxmaxofinstruction;(*生成的类PCODE代码表,存放编译得到的类PCODE代码*)word:arrayl.norwofalfa;(*保留字表*)wsym:arrayl.norwofsymbol;(*保留字表中每一个保留字对应的symbol类型*)ssym:array.ofsymbol;(*一些符号对应的symbol类型表*)(*
26、wirthusesarraycharhere*)mnemonic:arrayfctofpackedarray1.5ofchar;(*类PCODE指令助记符表*)declbegsys,statbegsys,facbegsys:symset;(*声明开始、表达式开始和项开始符号集合*)table:array0.txmaxofrecord(*符号表*)name:alfa;(*符号的名字*)casekind:object1of(*符号的类型*)constant:(*如果是常量名*)(val:integer);(*val中放常量的值*)variable,procedur:(*如果是变量名或过程名*)(l
27、evel,adr,size:integer)(*存放层差、偏移地址和大小*)(*sizelackinginorginal.Ithinkitbelonshere*)end;fin,fout:text;(*fin文本文件用于指向输入的源程序文件,fout程序中没有用到*)fname:string;(*存放PL/0源程序文件的文件名*)(*我修改的代码:原程序在此处使用alfa类型,无法在TurboPascal7.0中通过,readln函数的参数不能为alfa型*)err:integer;(*出错总次数*)(*出错处理过程error*)(*参数:n:出错代码*)procedureerror(n:in
28、teger);beginwriteln(*,:cc-1,!,n:2);(*在屏幕cc-1位置显示!与出错代码提示,由于cc是行缓冲区指针,所以!所指位置即为出错位置*)writeln(fa1,*,:cc-1,!,n:2);(*在文件cc-1位置输出!与出错代码提示*)err:=err+1(*出错总次数加一*)end(*error*);(*词法分析过程getsym*)proceduregetsym;vari,j,k:integer;(*读取原程序中下一个字符过程getch*)proceduregetch;beginifcc=llthen(*如果行缓冲区指针指向行缓冲区最后一个字符就从文件读一行到
29、行缓冲区*)beginifeof(fin)then(*如果到达文件末尾*)beginwrite(Programincomplete);(*出错,退出程序*)close(fa);close(fa1);close(fin);halt(0);goto99(*我修改的代码,由于TurboPascal7.0中不允许跨过程的goto,就只能用上面的方法退出程序了。*)end;ll:=0;(*行缓冲区长度置0*)cc:=0;(*行缓冲区指针置行首*)write(cx:4,);(*输出cx值,宽度为4*)write(fa1,cx:4,);(*输出cx值,宽度为4到文件*)whilenoteoln(fin)do
30、(*当未到行末时*)beginll:=ll+1;(*行缓冲区长度加一*)read(fin,ch);(*从文件读入一个字符到ch*)write(ch);(*在屏幕输出ch*)write(fa1,ch);(*把ch输出到文件*)linell:=ch;(*把读到的字符存入行缓冲区相应的位置*)end;(*可见,PL/0源程序要求每行的长度都小于81个字符*)writeln;ll:=ll+1;(*行缓冲区长度加一,用于容纳即将读入的回车符CR*)read(fin,linell);(*把#13(CR)读入行缓冲区尾部*)read(fin,ch);(*我添加的代码。由于PC上文本文件换行是以#13#10(
31、CR+LF)表示的,所以要把多余的LF从文件读出,这里放在ch变量中是由于ch变量的值在下面即将被改变,把这个多余值放在ch中没有问题*)writeln(fa1);end;cc:=cc+1;(*行缓冲区指针加一,指向即将读到的字符*)ch:=linecc(*读出字符,放入全局变量ch*)end(*getch*);begin(*getsym*)while(ch=)or(ch=#13)do(*我修改的代码:这句原来是用于读一个有效的字符(跳过读出的字符中多余的空格),但实际上还要跳过多余的回车*)getch;ifchina.zthen(*如果读出的字符是一个字母,说明是保留字或标识符*)begin
32、k:=0;(*标识符缓冲区指针置0*)repeat(*这个循环用于依次读出源文件中的字符构成标识符*)ifk=kkthen(*如果当前获得的标识符长度大于等于kk*)kk:=k(*令kk为当前标识符长度*)elserepeat(*这个循环用于把标识符缓冲后部没有填入相应字母或空格的空间用空格补足*)akk:=;kk:=kk-1untilkk=k;(*在第一次运行这个过程时,kk的值为al,即最大标识符长度,如果读到的标识符长度小于kk,就把a数组的后部没有字母的空间用空格补足。这时,kk的值就成为a数组前部非空格字符的个数。以后再运行getsym时,如果读到的标识符长度大于等于kk,就把kk的
33、值变成当前标识符的长度。这时就不必在后面填空格了,因为它的后面肯定全是空格。反之如果最近读到的标识符长度小于kk,那就需要从kk位置向前,把超过当前标识长度的空间填满空格。以上的这样一个逻辑,完全是出于程序性能的上考虑。其实完全可以简单的把a数组中ak元素以后的空间不管三七二十一全填空格。*)(*下面开始二分法查找看读出的标识符是不是保留字之一*)id:=a;(*最后读出标识符等于a*)i:=1;(*i指向第一个保留字*)j:=norw;(*j指向最后一个保留字*)repeatk:=(i+j)div2;(*k指向中间一个保留字*)ifid=wordkthen(*如果当前的标识符大于k所指的保留
34、字*)i:=k+1(*移动i指针*)untilij;(*循环直到找完保留字表*)ifi-1jthen(*如果i-1j表明在保留字表中找到相应的项,id中存的是保留字*)sym:=wsymk(*找到保留字,把sym置为相应的保留字值*)elsesym:=ident(*未找到保留字,把sym置为ident类型,表示是标识符*)end(*至此读出字符为字母即对保留字或标识符的处理结束*)else(*如果读出字符不是字母*)ifchin0.9then(*如果读出字符是数字*)begin(*number*)(*开始对数字进行处理*)k:=0;(*数字位数*)num:=0;(*数字置为0*)sym:=nu
35、mber;(*置sym为number,表示这一次读到的是数字*)repeat(*这个循环依次从源文件中读出字符,组成数字*)num:=10*num+(ord(ch)-ord(O);(*num*10加上最近读出的字符ASCII减O的ASCII得到相应的数值*)k:=k+1;(*数字位数加一*)getchuntilnot(chin0.9);(*直到读出的字符不是数字为止*)ifknmaxthen(*如果组成的数字位数大于最大允许的数字位数*)error(30)(*发出30号错*)end(*至此对数字的识别处理结束*)elseifch=:then(*如果读出的不字母也不是数字而是冒号*)beging
36、etch;(*再读一个字符*)ifch=then(*如果读到的是等号,正好可以与冒号构成赋值号*)beginsym:=becomes;(*sym的类型设为赋值号becomes*)getch(*再读出下一个字*)endelsesym:=nul;(*如果不是读到等号,那单独的一个冒号就什么也不是*)end(*以上完成对赋值号的处理*)else(*如果读到不是字母也不是数字也不是冒号*)ifch=then(*如果读到大于号,处理过程类似于处理小于号*)begingetch;(*再读一个字符*)ifch=then(*如果读到等号*)beginsym:=geq;(*购成一个大于等于号*)getch(*读
37、一个字符*)endelse(*如果大于号后不是跟的等号*)sym:=gtr(*那就是一个单独的大于号*)endelse(*如果读到不是字母也不是数字也不是冒号也不是小于号也不是大于号*)begin(*那就说明它不是标识符/保留字,也不是复杂的双字节操作符,应该是一个普通的符号*)sym:=ssymch;(*直接成符号表中查到它的类型,赋给sym*)getch(*读下一个字符*)end(*整个if语句判断结束*)end(*getsym*);(*词法分析过程getsym总结:从源文件中读出若干有效字符,组成一个token串,识别它的类型为保留字/标识符/数字或是其它符号。如果是保留字,把sym置成
38、相应的保留字类型,如果是标识符,把sym置成ident表示是标识符,于此同时,id变量中存放的即为保留字字符串或标识符名字。如果是数字,把sym置为number,同时num变量中存放该数字的值。如果是其它的操作符,则直接把sym置成相应类型。经过本过程后ch变量中存放的是下一个即将被识别的字符*)(*目标代码生成过程gen*)(*参数:X:要生成的一行代码的助记符*)(*y,Z:代码的两个操作数*)(*本过程用于把生成的目标代码写入目标代码数组,供后面的解释器解释执行*)proceduregen(X:fct;y,Z:integer);beginifcXcXmaXthen(*如果cXcXmaX表
39、示当前生成的代码行号大于允许的最大代码行数*)beginwrite(programtoolong);(*输出程序太长,退出*)close(fa);close(fa1);close(fin);halt(0)goto99(*我修改的代码,由于TurboPascal7.0中不允许跨过程的goto,就只能用上面的方法退出程序了。*)end;withcodecxdo(*把代码写入目标代码数组的当前cx所指位置*)beginf:=x;l:=y;a:=Z;end;cx:=cx+1(*移动cx指针指向下一个空位*)end(*gen*);(*测试当前单词是否合法过程test*)(*参数:S1:当语法分析进入或退
40、出某一语法单元时当前单词符合应属于的集合*)(*S2:在某一出错状态下,可恢复语法分析正常工作的补充单词集合*)(*n:出错信息编号,当当前符号不属于合法的S1集合时发出的出错信息*)procedureteSt(S1,S2:SymSet;n:integer);beginifnot(SyminS1)then(*如果当前符号不在S1中*)beginerror(n);(*发出n号错误*)S1:=s1+s2;(*把S2集合补充进s1集合*)whilenot(SyminS1)do(*通过循环找到下一个合法的符号,以恢复语法分析工作*)getSymendend(*teSt*);(*语法分析过程block*
41、)(*参数:lev:这一次语法分析所在的层次*)(*tx:符号表指针*)(*fsys用于出错恢复的单词集合*)procedureblock(lev,tx:integer;fSyS:SymSet);vardx:integer;(*dataallocationindex*)(*数据段内存分配指针,指向下一个被分配空间在数据段中的偏移位置*)tx0:integer;(*initialtableindex*)(*记录本层开始时符号表位置*)cx0:integer;(*initialcodeindex*)(*记录本层开始时代码段分配位置*)(*登陆符号表过程enter*)(*参数:k:欲登陆到符号表的符
42、号类型*)procedureenter(k:object1);begin(*enterobjectintotable*)tx:=tx+1;(*符号表指针指向一个新的空位*)withtabletxdo(*开始登录*)beginname:=id;(*name是符号的名字,对于标识符,这里就是标识符的名字*)kind:=k;(*符号类型,可能是常量、变量或过程名*)casekof(*根据不同的类型进行不同的操作*)constant:(*如果是常量名*)beginifnumamaxthen(*在常量的数值大于允许的最大值的情况下*)beginerror(31);(*抛出31号错误*)num:=0;(*
43、实际登陆的数字以0代替*)end;val:=num(*如是合法的数值,就登陆到符号表*)end;variable:(*如果是变量名*)beginlevel:=lev;(*记下它所属的层次号*)adr:=dx;(*记下它在当前层中的偏移量*)dx:=dx+1;(*偏移量自增一,为下一次做好准备*)end;procedur:(*如果要登陆的是过程名*)level:=lev(*记录下这个过程所在层次*)endendend(*enter*);楼主|Posted:2006-03-2100:00angel级别:管理员精华:23发帖:489威望:534点金钱:5330RMB贡献值:0点好评度:0点注册时间:
44、2006-02-26最后登录:2006-08-24(*登录符号过程没有考虑到重复的定义的问题。如果出现重复定义,则以最后一次的定义为准。*)(*在符号表中查找指定符号所在位置的函数position*)(*参数:id:要找的符号*)(*返回值:要找的符号在符号表中的位置,如果找不到就返回0*)functionposition(id:alfa):integer;vari:integer;begin(*findidentifierintable*)tableO.name:=id;(*先把id放入符号表0号位置*)i:=tx;(*从符号表中当前位置也即最后一个符号开始找*)whiletable.nam
45、eiddo(*如果当前的符号与要找的不一致*)i:=i-1;(*找前面一个*)position:=i(*返回找到的位置号,如果没找到则一定正好为0*)end(*position*);(*常量声明处理过程constdeclaration*)procedureconstdeclaration;beginifsym=identthen(*常量声明过程开始遇到的第一个符号必然应为标识符*)begingetsym;(*获取下一个token*)ifsymineql,becomesthen(*如果是等号或赋值号*)beginifsym=becomesthen(*如果是赋值号(常量生明中应该是等号)*)err
46、or(1);(*抛出1号错误*)(*这里其实自动进行了错误纠正使编译继续进行,把赋值号当作等号处理*)getsym;(*获取下一个token,等号或赋值号后应接上数字*)ifsym=numberthen(*如果的确是数字*)beginenter(constant);(*把这个常量登陆到符号表*)getsym(*获取下一个token,为后面作准备*)endelseerror(2)(*如果等号后接的不是数字,抛出2号错误*)endelseerror(3)(*如果常量标识符后接的不是等号或赋值号,抛出3号错误*)endelseerror(4)(*如果常量声明过程遇到的第一个符号不为标识符,抛出4号错
47、误*)end(*constdeclaration*);(*变量声明过程vardeclaration*)procedurevardeclaration;beginifsym=identthen(*变量声明过程开始遇到的第一个符号必然应为标识符*)beginenter(variable);(*将标识符登陆到符号表中*)getsym(*获取下一个token,为后面作准备*)endelseerror(4)(*如果变量声明过程遇到的第一个符号不是标识符,抛出4号错误*)end(*vardeclaration*);(*列出当前一层类PCODE目标代码过程listcode*)procedurelistcod
48、e;vari:integer;begin(*listcodegeneratedforthisblock*)iflistswitchthen(*如果用户选择是要列出代码的情况下才列出代码*)beginfori:=cx0tocx-1do(*从当前层代码开始位置到当前代码位置-1处,即为本分程序块*)withcodedobeginwriteln(i:4,mnemonicf:5,l:3,a:5);(*显示出第i行代码的助记符和L与A操作数*)(*我修改的代码:原程序此处在输出i时,没有指定占4个字符宽度,不美观也与下面一句不配套。*)writeln(fa,i:4,mnemonicf:5,l:3,a:5
49、)(*同时把屏显打印到文件*)end;endend(*listcode*);(*语句处理过程statement*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedurestatement(fsys:symset);vari,cx1,cx2:integer;(*表达式处理过程expression*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedureexpression(fsys:symset);varaddop:symbol;(*项处理过程term*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedurete
50、rm(fsys:symset);varmulop:symbol;(*因子处理过程factor*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedurefactor(fsys:symset);vari:integer;begintest(facbegsys,fsys,24);(*开始因子处理前,先检查当前token是否在facbegsys集合中。*)(*如果不是合法的token,抛24号错误,并通过fsys集恢复使语法处理可以继续进行*)whilesyminfacbegsysdo(*循环处理因子*)beginifsym=identthen(*如果遇到的是标识符*)be
51、gini:=position(id);(*查符号表,找到当前标识符在符号表中的位置*)ifi=0then(*如果查符号表返回为0,表示没有找到标识符*)error(11)(*抛出11号错误*)elsewithtabledo(*如果在符号表中找到了当前标识符的位置,开始生成相应代码*)casekindofconstant:gen(lit,0,val);(*如果这个标识符对应的是常量,值为val,生成lit指令,把val放到栈顶*)variable:gen(lod,lev-level,adr);(*如果标识符是变量名,生成lod指令,*)(*把位于距离当前层level的层的偏移地址为adr的变量放
52、到栈顶*)procedur:error(21)(*如果在因子处理中遇到的标识符是过程名,出错了,抛21号错*)end;getsym(*获取下一token,继续循环处理*)endelseifsym=numberthen(*如果因子处理时遇到数字*)beginifnumamaxthen(*如果数字的大小超过允许最大值amax*)beginerror(31);(*抛出31号错*)num:=0(*把数字按0值处理*)end;gen(lit,0,num);(*生成lit指令,把这个数值字面常量放到栈顶*)getsym(*获取下一token*)endelseifsym=lparenthen(*如果遇到的是
53、左括号*)begingetsym;(*获取一个token*)expression(rparen+fsys);(*递归调用expression子程序分析一个子表达式*)ifsym=rparenthen(*子表达式分析完后,应遇到右括号*)getsym(*如果的确遇到右括号,读取下一个token*)elseerror(22)(*否则抛出22号错误*)end;test(fsys,facbegsys,23)(*一个因子处理完毕,遇到的token应在fsys集合中*)(*如果不是,抛23号错,并找到下一个因子的开始,使语法分析可以继续运行下去*)endend(*factor*);begin(*term*
54、)factor(times,slash+fsys);(*每一个项都应该由因子开始,因此调用factor子程序分析因子*)whilesymintimes,slashdo(*一个因子后应当遇到乘号或除号*)beginmulop:=sym;(*保存当前运算符*)getsym;(*获取下一个token*)factor(fsys+times,slash);(运*算符后应是一个因子,故调factor子程序分析因子*)ifmulop=timesthen(*如果刚才遇到乘号*)gen(opr,0,4)(*生成乘法指令*)elsegen(opr,0,5)(*不是乘号一定是除号,生成除法指令*)endend(*t
55、erm*);begin(*expression*)ifsyminplus,minusthen(*一个表达式可能会由加号或减号开始,表示正负号*)beginaddop:=sym;(*把当前的正号或负号保存起来,以便下面生成相应代码*)getsym;(*获取一个token*)term(fsys+plus,minus);(*正负号后面应该是一个项,调term子程序分析*)ifaddop=minusthen(*如果保存下来的符号是负号*)gen(opr,0,1)(*生成一条1号操作指令:取反运算*)(*如果不是负号就是正号,不需生成相应的指令*)endelse(*如果不是由正负号开头,就应是一个项开头
56、*)term(fsys+plus,minus);(*调用term子程序分析项*)whilesyminplus,minusdo(*项后应是加运算或减运算*)beginaddop:=sym;(*把运算符保存下来*)getsym;(*获取下一个token,加减运算符后应跟的是一个项*)term(fsys+plus,minus);(*调term子程序分析项*)ifaddop=plusthen(*如果项与项之间的运算符是加号*)gen(opr,0,2)(*生成2号操作指令:加法*)else(*否则是减法*)gen(opr,0,3)(*生成3号操作指令:减法*)endend(*expression*);(*条件处理过程condition*)(*参数说明:fsys:如果出错可用来恢复语法分析的符号集合*)procedurecondition(fsys:symset);varrelop:symbol;(*用于临时记录token(这里一定是一个二元逻辑运算符)的内容*)beginifsym=oddsymthen(*如果是odd运算符(一元)*)begingetsym;(*获取下一个token*)expression(fsys);(*对odd的表达式进行处理计算*)gen(opr,0,6);(*生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国脚踏机构总成行业投资前景及策略咨询研究报告
- 营运部年度工作总结
- 2024至2030年中国智能型电子密码保险箱数据监测研究报告
- 2024至2030年貂尾加革圆顶帽项目投资价值分析报告
- 2024至2030年水晶电话护目灯项目投资价值分析报告
- 2024至2030年板网矩鞍填料项目投资价值分析报告
- 2024至2030年咀嚼片项目投资价值分析报告
- 松木桩基础处理方案
- 新进厂职工安全培训试题及完整答案【必刷】
- 新版车间安全培训试题及完整答案(各地真题)
- 消防设施设备及器材
- 二年级上册数学试题判断题专项训练苏教版
- 《月历中的数学问题》教学设计
- 小学语文语段修改专项训练(含答案)
- 沪教版七年级上英语练习题
- 腾讯公司绩效管理制度-腾讯公司绩效管理制度
- 课堂纪律不好的原因
- 课题初中数学作业优化设计的研究研究报告
- 5s推进计划(绝对经典)
- 小学数学答题卡模板(共3页)
- 简易呼吸气囊操作评分标准
评论
0/150
提交评论