词法分析程序设计与自动构造_第1页
词法分析程序设计与自动构造_第2页
词法分析程序设计与自动构造_第3页
词法分析程序设计与自动构造_第4页
词法分析程序设计与自动构造_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、词法分析程序设计与自动构造第1页,共24页,2022年,5月20日,7点53分,星期三主要内容词法分析程序设计词法分析程序自动构造第2页,共24页,2022年,5月20日,7点53分,星期三1.词法分析程序设计词法分析总控程序见图1。 界限符运算符字母数字结束符“#”开始到输入流中读下一字符CharChar是什么?初始化标识符和关键字词法分析子程序无符号数词法分析子程序运算符词法分析子程序界限符词法分析子程序结束图1 词法分析总控程序第3页,共24页,2022年,5月20日,7点53分,星期三 若对自动机的每一个状态赋予一定的功能,并把其边上的符号视为转移条件,那么自动机就成为一个程序了。以无

2、符号数为例:给定语法图2,构造自动机见图3。 d.de+-d图2 无符号数的语法图第4页,共24页,2022年,5月20日,7点53分,星期三图3 无符号数的自动机1234560dd+-.ed.otherotherddothered7e第5页,共24页,2022年,5月20日,7点53分,星期三开始0N,P,j;1e数字d;N*10+dN是数字?Y 读字符charNYN整型量标记C1是吗? 读字符char是e吗?是吗?1e 读字符charYNYN 读字符char是数字?Y数字d;N*10+dN;j+1j是数字?Y 读字符charERRORNN实型量标记C1是数字?Y数字d;P*10+dPY 读

3、字符charERRORNN实型量标记C1N*10e*P-j t结束YN整数部分小数部分是吗?是数字?指数部分N图4 无符号数词法分析流程图最后可得到无符号数分析算法流图见图4。 第6页,共24页,2022年,5月20日,7点53分,星期三2.词法分析程序设计自动构造Flex简介Flex源文件分析Flex词法分析程序设计自动构造演示实验任务和要求 第7页,共24页,2022年,5月20日,7点53分,星期三2.1 Flex简介FLEX通过读取一个有规定格式的文本文件,输出一个如下所示的C语言源程序。第8页,共24页,2022年,5月20日,7点53分,星期三Flex源文件格式LEX对源文件的格式

4、要求非常严格,所以书写时一定要注意。LEX的源文件由三个部份组成,每个部分之间用顶行的“%”分割,其格式如下:定义部份规则部份用户附加C语言部份第9页,共24页,2022年,5月20日,7点53分,星期三 定义部分定义部份由C语言代码、模式的宏定义组成。除宏定义外,定义部分的其余代码必须用符号% 和 % 括起来。另外,flex使用的C语言库文件和外部变量以及部分声明的函数,也应分别置于% 和 % 之内。第10页,共24页,2022年,5月20日,7点53分,星期三例如下面是一个flex语言的说明部分:% #include “stdio.h”int num = 0 %DIGIT 0-9ID A-

5、Za-zA-Za-z0-9_*%注意:这里起标识符作用的%和% 、%必须要顶行写第11页,共24页,2022年,5月20日,7点53分,星期三规则部分规则部份是LEX源文件的核心部份,它包括一组模式和在生成分析器识别相应模式后对相应模式进行处理的C语言动作(Action)。格式如下:C语言代码模式1 动作1模式2 |模式3 动作3第12页,共24页,2022年,5月20日,7点53分,星期三用户附加C语言部份支持规则动作部分所需要的处理过程,是对规则部分中动作的补充。FLEX对此部份不作任何处理,仅仅将其直接拷贝到输出文件lex.yy.c的尾部。第13页,共24页,2022年,5月20日,7点

6、53分,星期三Flex中模式的定义digit 0-9number (-|+)?digit+hexnumber 0 x(digit|a-fA-F)+letter a-zA-Zidentifier (letter|_)(number|letter|_)* newline nwhitespace t+string *comment #*#第14页,共24页,2022年,5月20日,7点53分,星期三Flex中模式的定义-PL/0语言digit 0-9letter a-zA-Znumber digit+identifier letter(letter|digit)*wrongid (digit+)le

7、tter(letter|digit)*newline nwhitespace t+第15页,共24页,2022年,5月20日,7点53分,星期三中的全局变量和函数File *yyin /* 指向词法分析器要接收的待分析程序的指 针。如果不指定则默认指向标准输入终端( 键盘)。如果我们待分析的程序是文件形式 我们可以将这个指针指向该文件的地址指针*/File *yyout /* 同上,唯一不同是该指针指向输出的文件 。默认指向标准输出终端(屏幕)。我们 可通过重定向该指针改变输出流方向。 */Char *yytext /* 指向识别的单词的地址;用来保存扫描 一次匹配的字符串。*/Int yyl

8、eng /* 匹配的字符串中字符的个数。*/第16页,共24页,2022年,5月20日,7点53分,星期三中的全局变量和函数ECHO /* flex的默认动作,一般来说是输出字符串 */yywrap() /* 扫描一次完后要调用的函数,返回一个值,当这个值为1的时候分flex就不再继续扫描。*/yyrestart() /* 重新定向flex的输入 */第17页,共24页,2022年,5月20日,7点53分,星期三Flex源文件分析(test.l)%int wc = 0; /* word count */%a-zA-Z+ wc+; %int main(void) int n = yylex();

9、 return n;int yywrap(void) printf(word count: %dn, wc); return 1;第18页,共24页,2022年,5月20日,7点53分,星期三Flex词法分析产生器实现原理词法分析器自动生成器的核心是lex编译器,lex编译器的功能是将lex源程序变换为一个能识别该语言单词的词法分析器。而该词法分析器像有穷自动机一样去识别处理单词。第19页,共24页,2022年,5月20日,7点53分,星期三flex词法分析产生器实现原理基于lex源程序,lex编译器的实现步骤大致是: 对lex源程序识别规则中的每个pi构造一个相应的NFA Ni。引入唯一初态

10、S,从初态S通过弧将所有NFA Ni(i=1,n)连接成新的NFA N。、两步实际是完成从正规式到非确定有限自动机的构造。 对NFA N确定化,产生DFA N。 DFA N 最小化。 给出控制程序。产生一个名为int yylex()的词法分析函数,将之拷贝到输出文件中。第20页,共24页,2022年,5月20日,7点53分,星期三Flex词法分析程序设计自动构造演示TestTest1Test2第21页,共24页,2022年,5月20日,7点53分,星期三实验内容和要求1、阅读flex源文件test.l,test1.l然后生成相应文件,编译该文件生成相应exe文件,然后运行exe文件,观察输出。

11、2、利用flex生成词法分析程序,分别统计标识符,数字和错误标识符的个数,并输出到文件result.txt 标识符:字母,数字和下划线,仅以字母开始 数字:无符号数字 错误标识符:以数字开始后接字母,形如: “123a”, “62aa12a”第22页,共24页,2022年,5月20日,7点53分,星期三实验内容和要求3.利用flex生成词法分析程序,识别输入程序中的关键字,标识符,数字,运算符、界符和错误标识符,并输出到文件result.txt关键字:if then do while string int 标识符:字母,数字和下划线,仅以字母开始 数字:无符号数字 错误标识符:以数字开始后接字母,形如: “123a”, “62aa12a”运算符:+ - * / = 界符: ( ) , ;第23页,共24页,2022年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论