【实验报告】实验一编写词法分析程序_第1页
【实验报告】实验一编写词法分析程序_第2页
【实验报告】实验一编写词法分析程序_第3页
【实验报告】实验一编写词法分析程序_第4页
【实验报告】实验一编写词法分析程序_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、编译原理实验报告实验名称:编写词法分析程序实验类型:设计型实验指导教师:专业班级:姓 名:学 号:实验地点:实验成绩:日期: 2017年 4月 15日i实验一编写语法分析程序、实验目的1)通过设计、调试词法分析程序,掌握词法分析程序的设计工具,即有穷自动机,进一步理解自动 机理论;2)掌握正则文法和正则表达式转换成有穷自动机的方法及有穷自动机的实现方法;3)会确定词法分析程序的输出形式及标识符与关键字的区分方法;4)加深对课堂教学的理解,提高词法分析方法的实践能力,掌握使用实验环境的技能技巧以及程序 的调试方法。二、实验设计1、写出TEST语言每条词法规则对应的正则文法或者正则表达式1) 标识

2、符:字母打头,后接任意字母或数字。正则表达式:(a|b| |z|A|B |Z )( 0|1|9| a|b| |z|A|B |Z )*2) 保留字:标符的子集,包括: if, else, for, while, do, int, write, read 。正贝 U表达式: if | else | for | while | do | int | write | read3) 无符号整数:由数字组成,但最高位不能为0,允许一位的0。正则表达式:(1,|9 )( 0|1|,|9)* )|04)分界符:(、)、;、正则表达式:(| ) | ; | | 5) 算符:+、-、*、/、=、<、>

3、、>=、<=、!=、= 正则表达式:+ | - | * | / | = | < | > | >= | <= | != | =6) 注释符:/*/正则表达式:/*(没有连续的*/的任意字符串|?)*/2、对每个文法或者正则表达式分别构造NFA|9| a|b| |z|A|B |Z )*1) 标识符:(a|b| |z|A|B |Z )( 0|1|32)无符号整数:(1|2|,|9)(0|1|9)*)|0(0|1|9)3)分界符:(|)|;|)3、将NFA合并,确定化,化简得到最终的DFAoNFA:三、实验过程1、完成整个实验的先后步骤a) 根据TEST语言的词法规

4、则,分别写出每条规则的正则文法或者正则表达式;b) 将每一个正则文法或者正则表达式转换为NFA ;c) 将多个NFA合并后进行确定化并化简;d) 根据化简后的DFA画出流程图;e) 参阅教材PP.69-71的TEST语言语法规则,确定单词分类、单词输出方案;f) 编写词法分析程序;g) 对下面的TEST语言源程序进行词法分析,将合法单词存入lex.txt,并报告词法错误及其位置。注:不能修改源程序/*This a test program.*/int abc;int 123;int A$;int i;int n;int b,c;int 2a;int a2;read n;n = 012345;f

5、or (i=1;i<=n; i= i+1)abc=abc+i;if(i!=n) n = n+i;if (!n) b = b+c;/*The loop endedwrite abc;2、实验调试记录(问题表现,分析原因,解决方案,解决结果)a) 问题表现:1 不能处理除号2 不能处理不完整的注释符3 对于 ” 0123 ”这类字符串的处理不正确, 我之前处理为直接报错说一位以上的数字首位不能为0b) 分析原因:问题 1,2 的原因都是在“/”符号处理时出现的问题导致的,程序中出现bug 使得一遇到 / 就会进入死循环。问题 3 , 不应该直接报错说一位以上的数字首位不能为 0 , 遇到 0

6、 应该直接输出 0 这个单词,再接着读数字。c) 解决方案 :d) 对于问题1,2 ,重新梳理逻辑,一步一步对照流程图和DFA 来调试修改代码。对于问题 3 ,遇到 0 应该直接输出 0 这个单词,再接着读数字。e) 解决结果 :成功解决了程序遇到/进入死循环问题和“0123”这类字符串的处理。三、实验结果列出实验结果并进行分析(含分步测试结果)请输入要编译的文件的路径:0: SoftwareMicrosoft Visual C+ 6. 0Microsoft Visual StudifAYvProj“1占'编译原理实验一in. txt 请输入词法分析结果文件存储路径:D: Softir

7、areMicrosoft Visual C+ 6, 0Microsoft Visual StudioMyPrQjects编译原理实验一out. Txterrorl linM:未知符号error2 1 ine4: W 未知符号errorS lineT:未知符号error4 linci" !'木吾谯的符号!errorS line20;匹密橹误,缺少*/编译失败,共发现5个错!Press any key to continuelex.txt文件(存放编译的合法内容)内容:/*This a test program.*/ /*This a test program.*/intintI

8、Dabcintint23NUM 123intintIDintintIDintintIDintintIDIDintintNUM 2ID a10 int int10101111111212121212131313131313131313131313131313131415151515151516ID a2;read readID n;ID nNUM 0NUM 12345;for for(ID iNUM 1;ID i<= <=ID n;ID iID i+NUM 1)ID abcID abc+ID i;ifif(IDi!=!=IDn)IDnIDn+IDi;ifif(IDn)IDbIDb+I

9、Dc;讨论与分析你的编写词法分程序满足最长匹配原则吗?如果满足请给出你的实现方案。如果不满足请给出改进方案。答:不满足,我的处理先后顺序是:标识符或保留字、数字、分界符、运算符(除开/) 、除或者注释,我应该吧注释放在前面,因为一般来说注释都比其它类型符号长些。改进措施便是将注释这一条词法规则最早处理。给出你的单词分类方案,并说明理由。答:根据 TEST 语言可将单词分为六类:a) 标识符:字母打头,后接任意字母或数字。b) 保留字:标识符的子集,包括: if, else, for, while, do, int, write, read 。c) 无符号整数:由数字组成,但最高位不能为0,允许

10、一位的0 。17171717171717171717171718181818181818181818 四、讨论与分 1.2.d) 分界符:(、 )、 ;、 、 e) 运算符:+、-、*、 /、=、<、 >、 >=、 <= 、 != 、 =f) 注释符:/*/3. 构建词法分析程序一般过程是怎样的?答:构建词法分析程序的一般过程:1 、 根据词法规则写出正则文法或者正则文法。2 、 为每一个正则表达式构造一个NFA ,然后将多个NFA 合并为一个NFA3 、 将 NFA 转化成 DFA ,并且化简最小化 DFA4 、 确定单词的输出形式5 、 根据化简后的 DFA 和单词

11、输出程序构造词法分析程序(主要部分:通过实验对课程知识点的理解;回答实验指导书的实验思考提出的问题等)五、附录:关键代码(给出适当注释,可读性高)# include <iostream># include <fstream># include <stdio.h># include <stdlib.h># include <string> using namespace std; const int KWN=8;const int MAXSIZE=400;char kwordKWN10 = "if","el

12、se","for","while","do", "int", "read", "write"int line = 1;int errors = 0;/关键字的个数/标识符最长个数/关键字/行号/记录错误个数ofstream fout;/输出文件流ifstream fin;/输入文件流/存放合法单词的文件流ofstream lexout;char type630="ID","保留字","NUM","

13、分界符","运算符","注释符"int main()int TEST();/ 函数声明TEST();if(errors=0)cout<<" 编译成功。 "<<endl;elsecout<<" 编译失败。共发现"<<errors<<" 个错误! "<<endl;return 0;/判断是否为字母int is_Char(char ch)if (ch>='a'&&ch<=

14、9;z')|(ch>='A'&&ch<='Z')return 1;return 0;/判断是否为无符号整数int is_Uint(char ch)if('0'<=ch&&ch<='9')return 1;return 0;/判断是否为分界符int is_Deli(char ch)if(ch='('|ch=')'|ch=''|ch=''|ch='')return 1;return 0;/判断

15、是否为操作符int is_Oper(char ch)char Operater10="+-*!=><"/ 没有考虑 /号for(int i=0;i<8;i+)if(ch=Operateri)return 1;return 0;/输入控制int in(char &ch)fin.get(ch); if('n'=ch) line+;if(fin.eof()ch=EOF;return 1;/输出控制void out(char *type,char *buf)if(strcmp(type,"ID")=0|strcmp(ty

16、pe,"NUM")=0) lexout<<line<<""<<type<<""<<buf<<endl;else lexout<<line<<""<<buf<<""<<buf<<endl;/cout<<type<<": "<<buf<<endl;/编译程序主要的函数int TEST()in

17、t event=0; / 用于判断输入是否为文件末/char filename300;/存储文件的路径/ 打开文件的操作/打开编译程序存放合法单词的文件lexout.open("lex.txt");/打开用户的文件/cout<<" 请输入要编译的文件的路径: "<<endl;reinput_in:/ cin.get(filename,300,'n');/char filename300="D:SoftwareMicrosoft Visual C+ 6.0Microsoft Visual 编译原理实验一 i

18、n.txt"fin.open("in.txt");if(fin=NULL)cout<<" 文件打开失败,请重新输入文件路径:"<<endl;goto reinput_in;/cout<<" 请输入词法分析结果文件存储路径:"<<endl;reinput_out:cin.clear();/清理输出缓冲cin.sync();/清空流/ cin.get(filename,300,'n');/ char filename300="D:SoftwareMicro

19、soft Visual C+ 6.0Microsoft Visual 编译原理实验一 out.txt"fout.open("out.txt");if(fout=NULL)cout<<" 文件打开失败,请重新输入文件路径:"<<endl;goto reinput_out;/ 开始判断char buf300;char ch;cin.clear();/清理输出缓冲cin.sync();/清空流in(ch);while (!fin.eof()while(ch=' '|ch='n'|ch='

20、t'|ch='r')in(ch);/判断是否为标识符或保留字if(is_Char(ch)int t=0;while(is_Char(ch)buft+=ch;in(ch);buft='0'/判断保留字int j=0;for(;j<KWN;j+)if(strcmp(kwordj,buf)=0)out(type1,buf);break;/ID 标识符if(j>=KWN)while(is_Char(ch)|is_Uint(ch)buft+=ch;in(ch);buft='0'out(type0,buf);/判断是否为数字else if

21、(is_Uint(ch)int t=0;while(is_Uint(ch)buft+=ch;in(ch);buft='0'if(t=1)out(type2,buf);else if(buf0='0')int i=-1;while(i<t&&buf+i='0')out(type2,&"0");out(type2,buf+i);elseout(type2,buf);/判断是否为分界符else if(is_Deli(ch)buf0=ch;buf1='0'out(type3,buf);in

22、(ch);/判断是否为运算符(除开/)else if(is_Oper(ch)(if(ch='+'|ch='-'|ch='*')(buf0=ch;buf1='0'out(type4,buf);in(ch);else if(ch='!')(buf0=ch;in(ch);if(ch='=')(buf1=ch;buf2='0'out(type4,buf);in(ch);else(cout<<"error"<<+errors<<"

23、; line"<<line<<":'!'不合法的符号!"<<endl;else if(ch='>'|ch='<'|ch='=')(buf0=ch;in(ch);if(ch='=')(buf1=ch;buf2='0'out(type4,buf);in(ch);elsebuf1='0'out(type4,buf);else if(ch='/')/ 判断是除还是注释int t=0;buft+=ch;char ch0 ;in(ch0);while(1)if(ch0 = EOF)cout<<"error"<<+errors<<" line"<<line<<": 匹配错误,缺少*/"<<endl;break;ch = ch0;buft+=ch;in(ch0);if(ch ='*' && ch0 = '/')buft+=ch0;buft='0&#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论