编译技术课程设计报告书-L语言编译器的设计与实现.doc_第1页
编译技术课程设计报告书-L语言编译器的设计与实现.doc_第2页
编译技术课程设计报告书-L语言编译器的设计与实现.doc_第3页
编译技术课程设计报告书-L语言编译器的设计与实现.doc_第4页
编译技术课程设计报告书-L语言编译器的设计与实现.doc_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程设计报告( 2010 2011 年度第1学期)名 称: 编译技术课程设计a 题 目:l语言编译器的设计与实现院 系: 计算机系 班 级: 软件0802 学 号: 2学生姓名: 指导教师: 设计周数: 2 周 成 绩: 日期: 2011 年 1 月 14 日2编译技术课程设计任 务 书一、课程设计的目的与要求1 任务:实现一个简单的编译程序,能够对指定程序设计语言进行编译。2 目的:加深对课堂讲授知识的理解,熟练掌握编译程序设计原理及常用的技术,建立编译程序的整体概念,使得学生初步具有研究、设计、编制和调试编译程序的能力。3 要求:熟悉有关定义、概念和实现算法,设计出程序流程框图和数据结构,编写出完整的源程序,进行静态检查,设计出输入数据、显示输出数据;基本功能完善,方便易用,操作无误;通过课程设计学会编译程序设计与实现的常用技术,具备初步分析、设计和开发编译程序的能力,具备分析与检查软件错误、解决和处理实验结果的能力。4 学生要求人数:2人,1人负责扫描器和目标代码生成器的设计和实现,另1人负责语法分析器和语法制导翻译程序的设计和实现。二、 主要内容下面是课程设计主要内容的简介,详细内容请见编译技术课程设计指导书。1 扫描器设计该扫描器是一个子程序,其输入是源程序字符串,每调用一次输出一个单词符号。为了避免超前搜索,提高运行效率,简化扫描器的设计,假设程序设计语言中,基本字不能用作一般标识符,如果基本字、标识符和常数之间没有确定的运算符或界符作间隔,则用空白作间隔。2 语法分析器设计以算法优先分析方法为例,设计一个算符优先语法分析程序。算符优先分析属于自下而上的分析方法,该语法分析程序的输入是终结符号串(即单词符号串,以一个“#”结尾),如果输入串是句子则输出“yes”,否则输出“no”和错误信息。当然,也可采用预测分析等方法设计语法分析器,具体方法自定。3 语法制导翻译程序设计采用语法制导翻译方法,实现算术表达式、赋值语句和基本控制语句等的翻译。本语法制导翻译程序的输入是终结符号串(即单词符号串,以一个“#”结尾),如果输入符号串是句子,则按照其语义进行翻译,输出等价的四元式序列。4 目标代码生成器设计将程序设计语言的中间代码翻译为目标代码,输入是四元式序列,输出是汇编代码文件。三、 进度计划序号设计内容完成时间备注1任务布置,资料查询,方案制定第一周周一2算法设计,程序实现第一周周二至第二周周四3撰写报告,软件验收第二周周五4四、设计成果要求1 完成规定的课程设计任务,所设计软件功能符合要求;2 完成课程设计报告,要求格式规范,内容具体而翔实,应体现自身所做的工作,注重对设计思路的归纳和对问题解决过程的总结。五、 考核方式1 平时成绩验收答辩实验报告;2 五级分制。 学生姓名: 指导教师:鲁 斌 李 莉 2011 年 1 月 4 日本组组员:龚泽滢(200809020205) 邵婧婕(200809020224) 其中我负责语法/语义分析部分。语法/语义分析目 的通过设计、编制、调试一个典型的语法分析程序,实现对词法分析程序所提供的单词序列进行语法检查和结构分析,进一步掌握常用的语法分析方法。任 务在词法分析程序产生的token文件、符号表文件基础上,完成语法和语义分析,产生相应的中间代码四元式序列。在此,可把语法/语义分析作为独立的一遍进行处理。 语法/语义分析程序符号表文件四元式序列文件符号表文件token文件采用如下四元式:操作码助记符四元式意 义:=( 51, a, 0, r )ra+( 43, a, b, r )ra+b-( 45, a, b, r )ra-b*( 41, a, b, r )ra*b/( 48, a, b, r )rb/aj( 53, a, b, n )若ab转至第n个四元式j=( 54, a, b, n )若a( 57, a, b, n )若ab转至第n个四元式j=( 58, a, b, n )若a=b转至第n个四元式j =( 56, a, b, n )若a=b转至第n个四元式j( 52, 0, 0, n )转至第n个四元式j ( 55, a, b, n )若ab转至第n个四元式 实验正文数据结构1输入token文件、符号表文件,其数据结构与词法分析产生的文件相同。2输出l 四元式序列文件,其纪录结构如下:typedef struct equint op; /四元式操作码int op1; /操作数在符号表中的入口地址int op2; /操作数在符号表中的入口地址int result; /结果变量在符号表中的入口地址 equ;l 程序中可用数组equ存放四元式序列,定义为:equ equequ_lenl 可用变量int lineofequ做指针,指向下一个即将产生的四元式l 符号表文件的结构与输入相同,语法分析中对于符号表不做操作,只是在文件头部增加一个记录变量多少的数据。 程序结构说明为方便编程,将语言文法整理如下:n ls | s ; lsid := esif b then ssif b then s else sswhile b do ssbegin l end变量说明语句的文法:svar d|dl : k ; | l : k ; dli , l | ikinteger | bool | real其中,b表示布尔表达式,e表示算术表达式可采用递归下降分析法或其它方法进行语法分析。语法/语义分析程序可划分为三个模块,结构如下:l_beginparserdeclearparser为主程序模块,declear为说明语句分析模块,l_begin为复合语句分析模块。其中l_begin结构图如下:l_ifl_beginl_letl_whilel_analizeb_analizee_analize 经常使用的过程和函数:l gen(int op,int a,int b, int r):生成一个四元式l newtemp():产生一个临时变量,返回其在符号表中的入口地址l backpatch(int addr, int addr2):回填函数,完成四元式转移目标的回填l void getbuf():获取文件中的一组数据l void program():程序由程序首部、程序体和;组成l void proghead():程序首部:program+标识符+;l void block():程序体部分,常量说明、变量说明、语句部分 实验算法思想(包含主程序的示意图)(1)主程序的示意图如下图所示:程序首部调用getbuf()获取文本文档中的下一组字符调用block()end(2)递归下降分析程序示意图如下图所示:(3)语法串分析过程示意图如下图所示: (4)statement语句分析函数示意图如下图所示: (5)expression表达式分析函数如下图所示:(6)term分析函数示意图如下图所示: (7)factor分析过程示意图如下图所示:(8)语义分析器: 设置语义过程1、emit(char *result,char *ag1,char *op,char *ag2)该函数的功能是生成一个三地址语句送到四元式表中。四元式表的结构如下:structchar result8;char ag18;char op8;char ag28;quad20; (2) char *newtemp()该函数回送一个新的临时变量名,临时变量名产生的顺序为t1,t2,char *newtemp(void)char *p; char m8; p=(char *)malloc(8); k+; itoa(k,m,10); strcpy(p+1,m); p0=t; return(p);2、设计思想函数lrparser 在语法分析的基础上插入相应的语义动作:将输入串翻译成四元式序列。分析程序可知,需要进行四元式翻译的只有赋值语句、表达式和if语句、while语句等控制语句。在实现时,我采用这样的方法:先建立一个关于四元式的结构体,并建立一个存放这样的结构体的向量。当遇到赋值号:=时,声明一个结构体,并把这个结构体插入向量中。由于在赋值号前必然是一个变量id,可以在遇到一个变量id时,就把这个id的值存入临时变量tmp。由于在后面可能要用到也可能用不到,所以不用担心tmp值覆盖的问题。在向量中插入结构体变量后,需要将id填入对应的项中,然后可以继续遍历。遇到下一个id则写入。若:=后面是一个表达式,则可以在再新建一个结构体变量,在其中处理表达式的四元式生成。然后把所得的地址存入上一层的对应位置。 实验总结这次的实验比较难。刚刚拿到手的时候感觉无从下手,找不到一个突破点。其主要难点在于如何实现回填技术。在实现语法分析器时,整体采用模块化编程的思想。将一个程序拆分成各个部分,分别实现。在实现各个子模块时需要注意的地方就是在实现语法分析时要考虑到各种情况,比如同时定义多个变量等。对此我采用了后缀的处理方式。后缀可有可无。这样就能解决在顺序分析程序时出现多条相同类型的语句以及在一条语句中出现多个变量定义等情况。还有就是在处理语义分析时如何处理表达式和控制语句回填位置这样的问题。本次实验虽然比较大,但不得不说,它在很大程度上锻炼了我们分析、处理问题的能力。由于我采用的是模块化编程的方式。这样编程的好处在于程序的结构清晰,紧密相连。但是带来的负面结果是程序的函数多。无论在写函数还是在调试程序的时候需要极大的耐心。实验中也遇到了不少小问题。比如读文件时如何才能使指针回退等。这些都通过自己的努力和同学的帮助,不仅仅是克服了这些问题,更重要的意义在于我又学会了一些以前不懂的知识。同时我也感受到了理论与实现之间的差距。那些平时上课时觉得很容易懂的知识,要通过自己在计算机上进行实现并不像想象中的那么容易。我们能理解的知识用计算机语言表述成计算机能理解的语言,这不仅需要很扎实的编程基础,更要彻彻底底的搞懂所学的理论知识,并达到将所学知识融会贯通的程度。这样才能自由的应付实现时出现的细节问题。总之,这次的课程设计让我收获颇多。 参考资料【1】陈火旺、刘春林、谭庆平、赵克佳、刘越,编译原理(第三版).北京:国防工业出版社【2】黄贤英、王柯柯,编译原理及实践教程。北京:清华大学出版社【3】马知行、曹启君,编译方法。机械工业出版社附录一:程序代码#include #include #include using namespace std;#define and 1#define begin 2#define bool 3#define do 4#define else 5#define end 6#define false 7#define if 8#define integer 9#define not 10#define or 11#define program 12#define real 13#define then 14#define true 15#define var 16#define while 17#define id 18#define 整数19#define 实数20#define lbr 21#define rbr 22#define add 23#define sub 24#define mul 25#define div 26#define dot 27#define com 28#define col 29#define sem 30#define ass 31#define equ 32#define leq 33#define lab 34#define neq 35#define rab 36#define geq 37#define odd 38#pragma oncetypedef struct tokenint label; /单词序号char name30; /单词本身int code; /单词的机内码int addr; /地址,单词为保留字时为-1,为标识符或常数时为大于的数值,即在符号表中的入口地址。token() label=0;code=0;addr=0;token;void getbuf();void program();void proghead();/程序首部由program 标识符组成void block();/程序体部分void error(int n);void consdefi();void consexpl();void conssuff();void varexpl();void vardefi();void varsuff();/void procdefi();/void procedh();/void procsuff();void typeil();void assipro();void sentence();void suffix();void ifsent();void read();void whilesent();void idsuff();void write();void compsent();void exprsuff();void sentsuff();void conditio();void termsuff();void express();void term();void factsuff();void factor();void addoper();void muloper();void respoper();void argument();token t;file *opt=fopen(token.txt,r);bool flag=true;/还能否读void main()getbuf();program();printf(the program is right!n);/*sleep(5000);*/fclose(opt);void getbuf()if(opt=null)coutcant open the file!n;exit(0);if(feof(opt)flag=false;/到了结尾不可再读coutfile endsn;elsefscanf(opt,%d %s %d %dn,&t.label,,&t.code,&t.addr);void program()/程序由程序首部、程序体和;组成proghead();block();if(t.code=sem)getbuf();elsecoutmiss ;n;exit(0);void proghead()/程序首部:program+标识符+;if(t.code=program)getbuf();if(t.code=id)getbuf();if(t.code=sem)getbuf();elsecoutmiss ;n;exit(0);elsecouterror of idn;elsecoutmiss keyword programn;exit(0);void block()/程序体部分,常量说明、变量说明、语句部分 /变量说明、复合句consexpl();varexpl();/*procdefi(t);*/compsent();void consexpl()/常量说明部分:整数|实数if(t.code=整数|t.code=实数)getbuf();consdefi();conssuff();if(t.code=sem)getbuf();elsecoutmiss ;n;exit(0);void consdefi()/常量定义:标识符+等号+无符号数if(t.code=id)getbuf();if(t.code=equ)getbuf();if(t.code=integer)getbuf();elsecoutmiss integern;exit(0);elsecoutmiss =;exit(0);elsecoutmiss idn;exit(0);void conssuff()/常量定义后缀:,+常量定义后缀if(t.code=com)getbuf();consdefi();conssuff();if(t.code=sem)getbuf();elsecoutmiss ;n;exit(0);void varexpl()/变量说明部分,var+变量定义+变量定义后缀if(t.code=var)getbuf();vardefi();varsuff();void vardefi()/变量定义:标识符+标识符后缀+:+类型+;|标识符+标识符后缀+:+类型+;+变量定义if(t.code=id)getbuf();idsuff();if(t.code=col)getbuf();typeil();if(t.code=sem)getbuf();elsecoutmiss ;n;exit(0);elsecoutmiss :n;exit(0);void varsuff()/变量后缀:变量定义+变量后缀|空if(t.code=id)vardefi();varsuff();void typeil()/类型:real|bool|integerif(t.code=real|t.code=bool|t.code=integer)getbuf();elsecoutwrong tyoe of definen;exit(0);/void procdefi(token t)/过程定义:程序首部+分程序+/if(=/void compsent()/复合句:begin+语句表+endif(t.code=begin)getbuf();sentence();sentsuff();if(t.code=end)getbuf();elsecoutmiss begin as the startn;exit(0);void sentence()/赋值语句、if语句、while语句、复合句if(t.code=id)assipro();else if(t.code=if)ifsent();else if(t.code=while)whilesent();else if(t.code=begin)compsent();void sentsuff()/语句后缀:;+语句+语句后缀if(t.code=sem)getbuf();sentence();sentsuff();void assipro()/赋值语句if(t.code=id)getbuf();suffix();elsecout赋值语句错误n;exit(0);void suffix()/赋值号的后缀为赋值语句,否则为过程调用语句if(t.code=ass)getbuf();express();else if(t.code=lbr)getbuf();express();if(t.code=rbr)getbuf();elsecout缺少右半边括号n;exit(0);void express()/表达式:正负号+项+项后缀if(t.code=sub)getbuf();term();termsuff();else if(t.code=整数|t.code=实数|t.code=id)term();termsuff();void exprsuff()/表达式后缀:,+表达式+表达式后缀if(t.code=com)getbuf();express();exprsuff();void term()/项:因子+因子后缀factor();factsuff();void termsuff()/项后缀:加减型运算符+因子+因子后缀|空if(t.code=add|t.code=sub)getbuf();factor();factsuff();void factsuff()/因子后缀:因子+因子后缀|空if(t.code=mul|t.code=div)getbuf();factor();factsuff();void factor()/因子:标识符+整数、实数+括号内的表达式if(t.code=id)getbuf();factsuff();else if(t.code=整数|t.code=实数)getbuf();factsuff();else if(t.code=lbr)getbuf();express();if(t.code=rbr)getbuf();elsecout缺少右半边括号n;exit(0);elsecout因子定义错误n;exit(0);void ifsent()/if语句:if+条件+then+语句if(t.code=if)getbuf();conditio();if(t.code=then)getbuf();sentence();elsecoutif语句缺少thenn;exit(0);elsecoutif语句定义错误n;exit(0);void conditio()/作用在表达式上或者两个表达式进行比较if(t.code=id|t.code=lbr)express();/可能出错respoper();express();void whilesent()/while语句:while语句、if语句、do语句if(t.code=while)getbuf();conditio();if(t.code=do)getbuf();sentence();elsecoutwhile语句缺少don;exit(0);elsecoutwhile语句定义错误n;exit(0);void idsuff()/标识符后缀:,+标识符+标识符后缀if(t.code=com)getbuf();if(t.code=id)getbuf();idsuff();elsecout标识符定义错误n;exit(0);void addoper()/加型运算,加+减if(t.code=add|t.code=sub)getbuf();elsecout加减运算定义错误n;exit(0);void muloper()/乘型运算,乘+除if(t.code=mul|t.code=div)getbuf();elsecout乘除运算定义错误n;exit(0);void respoper()/比较运算符是否为=,,=if(t.code=equ&t.code=geq)getbuf();elsecout比较运算定义错误n;exit(0);#include#include#include#includestructchar result12;char ag112;char op12;char ag212;quad;char prog80,token12;char ch;int syn,p,m=0,n,sum=0,kk; /p是缓冲区prog的指针,m是token的指针char *rwtab6=begin,if,then,while,do,end;void scaner();char *factor(void);char *term(void);char *expression(void);int yucu();void emit(char *result,char *ag1,char *op,char *ag2);char *newtemp();int statement();int k=0;void emit(char *result,char *ag1,char *op,char *ag2)strcpy(quad.result,result);strcpy(quad.ag1,ag1); strcpy(quad.op,op);strcpy(quad.ag2,ag2); coutquad.result=quad.ag1quad.opquad.ag2endl;char *newtemp()char *p;char m12;p=(char *)malloc(12);k+;itoa(k,m,10);strcpy(p+1,m);p0=t;return (p);void scaner()for(n=0;n=a&ch=a&ch=0&ch=a&ch=a&ch=z)tokenm+=ch;ch=progp+;tokenm+=0;p-;syn=10;for(n=0;n=0&ch=0&ch32767)syn=-1;else switch(ch)case)syn=21;tokenm+=ch;else if(ch=)syn=22;tokenm+=ch;elsesyn=23;p-;break;case:m=0;tokenm+=ch;ch=progp+;if(ch=)syn=24;tokenm+=ch;elsesyn=20;p-;break;case:m=0;tokenm+=ch;ch=progp+;if(ch=)syn=18;tokenm+=ch;elsesyn=17;p-;break;case*:syn=13;token0=ch;break;case/:syn=14;token0=ch;break;case+:syn=15;token0=ch;break;case-:syn=16;token0=ch;break;case=:syn=25;token0=ch;break;case;:syn=26;token0=ch;break;case(:syn=27;token0=ch;break;case):syn=28;token0=ch;break;case#:syn=0;token0=ch;break;default: syn=-1;break;int lrparser()/cout调用lrparserendl;int schain=0; kk=0; if(syn=1) scaner(); schain=yucu(); if(syn=6) scaner(); if(syn=0 & (kk=0) coutsuccess!endl; else if(kk!=1)cout缺end!endl;kk=1; else cout缺begin!endl;kk=1; return(schain);int yucu()/cout调用yucuendl;int schain=0; schain=statement(); while(syn=26)scaner(); schain=statement(); return(schain);int statement()/cout调用statementendl;char *eplace,*tt; eplace=(char *)malloc(12); tt=(char *)malloc(12); int schain=0;switch(syn)case 10:strcpy(tt,token);scaner();if(syn=18)scaner();strcpy(eplace,expression();emit(tt,eplace,);schain=0;elsecout缺少赋值符!endl;kk=1;return(schain);break;return(schain);char *expression(void)char *tp,*ep2,*eplace,*tt;tp=(char *)malloc(12);ep2=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论