lex-yacc使用说明

格式：ppt
大小：1.35 MB
文档页数：34

下载文档原格式

Lex和Yacc从入门到精通（ＰＤＦ）

Lex和Yacc从入门到精通熊春雷Abstract在开发程序的过程中经常会遇到文本解析的问题，例如：解析C语言源程序，编写脚本引擎等等，解决这种文本解析的方法有很多，一种方法就是自己手动用C或者 C++直接编写解析程序，这对于简单格式的文本信息来说，不会是什么问题，但是对于稍微复杂一点的文本信息的解析来说，手工编写解析器将会是一件漫长痛苦而容易出错的事情。

本系列文档就是专门用来由浅入深的介绍两个有名的Unix工具Lex和Yacc，并会一步一步的详细解释如何用这两个工具来实现我们想要的任何功能的解析程序，为了方便理解和应用，我会在该系列的文章中尽可能的采用具体可行的实例来加以阐释，而且这种实例都是尽可能的和具体的系统平台无关的，因此我采用命令行程序作为我们的解析程序的最终结果。

1、环境配置篇开发Lex和Yacc程序最需要的程序就是lex和yacc了，如果你是Unix或者Linux系统，则系统自带了这两个工具，无需安装，不过值得说明的是GNU/Linux下面的Lex是flex，而Yacc则是bison。

另外需要的就是一个C/C++语言编译器，由于我们采用的是GNU的 lex和yacc，所以，理所当然的我们就使用GNU的编译器了，如果是Unix或者Linux系统，那么编译器应该已经安装了。

在这里我重点讨论的是Windows系统环境下的Lex和 Yacc程序的开发，至于为什么选择Windows系统作为开发平台，则是为了尽可能的让初学者容易入门。

1.1．必备工具言归正传，首先列举Windows平台下面Lex和Yacc开发环境所需要安装的程序：1.Lex(flex.exe)和Yacc(bison.exe)环境2.C/C++编译器1.2．flex和bison值得说明的是，flex.exe和bison.exe是UnxUtils包中的文件，已经将许多 Unix/Linux平台的程序都移植到了Windows平台，可以直接到UnxUtils网站下载，下载解压缩之后在系统的PATH环境变量中增加UnxUtils所有的exe文件所在的目录，使得DOS命令行可以直接搜索到flex.exe和bison.exe，除此之外还需要从网络上下载 bison需要的bison.simple和bison.hairy两个文件，并且还要分别设置环境变量 BISON_HAIRY指向bison.hairy，BISON_SIMPLE指向bison.simple。

Lex和Yacc在软PLC开发系统中的应用

ｐｒａｄｔｇｔｆｏＰＣＳｄｖｌｍｅｔｙｔＴｅｌｇａｅｏｂｏｉｄｉＩｓｕｔｎＬｔＩ）ｈｃａｔｎｒｅｏｆＬ ’ ｅｅｐｎｓｍ．ｈｎｕｇｅｍｐｅｔｃｉｉ（ｗｉｉａＳｌｏｓｅａｔｃｌｓｎｒｏｓＬｈｓ
ａｓｎａｎｌｅｗｉｅｅｆａｃ（ｅａｏｈｒｏｉｒｏｉｒｉｄｃｓｅｅａｅ．ｈｎＰＣｙｔａａｚｒｔｔｌｏＹｃＹｔｎｔｅｃｍｐｅ —ｃｍｐｅ）ｉｕｓｄｉｔｐｒＴｅＬｘｙｈｈｈｐｌｌｓｓｎｈｐ
中图分类号：Ｐ７Ｔ２３文献标识码：Ａ
ＡｐｌａｉｎｏｘａｄＹａｃｉｏｔｐｉｔｆＬｅｎｃｎＳｆＰＬＣｇＤｅｅｏｍｅｔＳｓｅｃｏｖｌｐｎｙｔｍ
Ｌｈａｇ，ＷＡＮＧｎ —ｈａｇ，ＭＡｏｇｂＩＳｕｎＹｏｇｚｎＸｉｎ — ｏ
ｐｏｒｍ’ ｃｍｐｌｇｉｓｕｉｉｔ．ｗｏａｔｍａｉａｙｄｖｌｐａｔｋｎａａｚｒｗｉｅｈｌｆＬｘａｄｒｇａＳｏｉｓｔｄｅｆｓｙＨｏｔｕｏｔｌｅｅｏｏｅｎｌｅｔｔｅｐｏｅｎｉｎｄｒｌｃｙｈｈ
维普资讯
・
控制与检测・
组床与自化合机动加工技术
文章编号：０１— ２５２０）９— ００— ５１０２６（０６００３０
ＬｘＹｃ在软ＰＣ开发系统中的应用ｅ和ａｃＬ

Lex和Yacc工具使用方法

编译器的自动生成工具LEX和YACC的使用方法Lex自动地表示把输入串词法结构的正规式及相应的动作转换成一个宿主语言的程序，即词法分析程序，它有一个固定的名字yyler，在这里yyler是一个C语言的程序。

Yylex将识别出输入串中的词形，并且在识别出某词形时完成指定的动作。

看一个简单的例子：写一个lex源程序，将输入串中的小写字母转换成相应的大定字母。

程序如下：%%[a-z]printf(“%c”.yytext[0]+'A'-'a')；上述程序中的第一行%%是一个分界符，表示识别规则的开始。

第二行就是识别规则。

左边是识别小写字母的正规式。

右边就是识别出小写字母时采取的动作:将小写字母转换成相应的大写字母。

Lex的工作原理是将源程序中的正规式转换成相应的确定有限自动机，而相应的动作则插入到yylox中适当的地方，控制流由该确定有限自动机的解释器掌握，不同的源程序，这个解释器是相同的。

1．2 lex源程序的格式lex源程序的一般格式是：{辅助定义的部分}%%{识别规则部分}%%{用户子程序部分}其中用花括号起来的各部分都不是必须有的。

当没有“用户子程序部分”时，第二个%%也可以省去。

第一个%%是必须的，因为它标志着识别规则部分的开始，最短的合法的lex源程序是：%%它的作用是将输入串照原样抄到输出文件中。

识别规则部分是Lex源程序的核心。

它是一张表，左边一列是正规式，右边一列是相应的动作。

下面是一条典型的识别规则：integer printf（"found keywcrd INT"）;这条规则的意思是在输入串中寻找词形“integer”，每当与之匹配成功时，就打印出“foundkeyword INT”这句话。

注意在识别规则中，正规式与动作之间必须用空格分隔开。

动作部分如果只是一个简单的C表达式，则可以写在正规式右边同一行中，如果动作需要占两行以上，则须用花括号括起来，否则会出错。

LEX和YACC的使用（例子）

LEX和YACC的使⽤（例⼦）1、简单C语⾔的词法分析程序;%{#include<stdio.h>#include<stdlib.h>#include<ctype.h>#include<string.h>%}digit [0-9]letter [A-Za-z]other_char [!-@\[-~]id ({letter}|[_])({letter}|{digit}|[_])*string {({letter}|{digit}|{other_char})+}int_num {digit}+%%[ |\t|\n]+ "auto"|"double"|"int"|"struct"|"break"|"else"|"long"|"switch"|"case"|"enum"|"register"|"typedef"|"char"|"extern"|"return"|"union"|"const"|"float"|"short"|"unsigned"|"continue"|"for"|"signed"|"void"|"default"|"go \"([!-~])*\" {printf("CONST_string,%s\n",yytext);}-?{int_num}[.]{int_num}?([E][+|-]?{int_num})? {printf("CONST_real,%s\n",yytext);}"0x"?{int_num} {printf("CONST_int,%s\n",yytext);}","|";"|"("|")"|"{"|"}"|"["|"]"|"->"|"."|"!"|"~"|"++"|"--"|"*"|"&"|"sizeof"|"/"|"%"|"+"|"-"|">"|"<"|">="|"<="|"=="|"!="|"&"|"^"|"|"|"&"|"||"|"+="|"-="|"*="|"/="|"%="|">>="|"<<="|"&="|"^="|"|="|"=" {printf("%s,NULL\n",yytext);}{id} {printf("ID,%s\n",yytext);}{digit}({letter})+ {printf("error1:%s\n",yytext);}%%#include <ctype.h>Upper(char *s,int l){int i;for(i=0;i<l;i++){s[i]=toupper(s[i]);}}yywrap(){return 1;}注意：要得到输出信息，需要⾃⾏添加main函数，lex默认的main函数没有输出的。

Lex与Yacc学习（七）之环境配置另一种方式

Lex与Yacc学习（七）之环境配置另⼀种⽅式必备⼯具flex与bison安装运⾏flex-2.5.4a-1.exe 和 bison-2.4.1-setup.exe ⽂件安装⾄D:\Software Files\GnuWin32下，然后按配置环境变量：将路径 D:\Software Files\GnuWin32\bin 复制于Path中。

Cygin安装配置运⾏cyg_win_setup.exe⽂件安装⾄D:\cygwin下，然后配置环境变量：将路径D:\cygwin\bin复制于Path中；注意：在D:\cygwin\bin⽂件夹下，有g++.exe ⼤⼩为1KB 与g++ 3.exe ⼤⼩为95KB ，我们需要把95KB的 g++ 3.exe命名为 g++.exe ，1 KB的g++可删除，或者命名为g++3.exe；同理，有gcc.exe ⼤⼩为1KB 与gcc 3.exe ⼤⼩为95KB ，我们需要把95KB的 gcc 3.exe命名为 gcc.exe ，1 KB的gcc可删除，或者命名为gcc 3.exe 。

必要⽂件复制我们发现D:\cygwin\bin下⾯并没有flex.exe 与bison.exe，因此，（1）将安装好的D:\Software Files\GnuWin32\bin下的flex.exe 与bison.exe复制到D:\cygwin\bin下⾯；（2）再将D:\Software Files\GnuWin32的share⽂件夹复制到D:\cygwin下⾯；（3）将D:\Software Files\GnuWin32\lib下的libfl.a 和 liby.a 复制到D:\cygwin\lib下⾯；检测配置是否成功打开D:\cygwin下的Cygwin.bat 或者系统的cmd，按照以下⽅式检验：环境搭建结束！。

LEX和YACC入门

用 %% 符号隔开。第一部分和最后一个部分是宿主语言代码。中间是由一系列规则构成，
LEX 将这些规则翻译为词法分析器。每一个规则依次包含一个正则表达式以及该正则表达式得到匹配时要运行的一些代码。
任何没有得到匹配的文本则简单地拷贝到标准输出。
2020/5/13
6
三、LEX程序设计
LEX正规表达式（1）
expression: value '+' value { System.out.println("Matched a '+' expression.\n"); }
2020/5/13
23
四、YACC程序设计
类似于 LEX, YACC 也有一套变量和函数可供用户来进行功能扩展。
YYSTYPE 定义了用来将值从 lexer 拷贝到解析器或者 YACC 的 yylval （另一个 YACC 变量）的类型。默认的类型是 int 。由于字符串可以从
的值。
2020/5/13
26
四、LEX与YACC结合
2020/5/13
27
public static void main(String args[]) {
int n = 1;
mylexer lexer = new mylexer();
if (lexer.yycreate(null)) {
n = lexer.yylex();
}
System.out.println("word count = "+lexer.wordCount);
两个百分号标记指出了 LEX程序中这一段的结束和三段中第二段的开始。
10

ply四边形格式解析

ply四边形格式解析1.引言1.1 概述ply（Python Lex-Yacc）是一种用于编写编译器和解析器的Python 库。

它提供了一种简单且易于使用的方法来定义和生成基于上下文无关文法的解析器。

ply库已经成为Python语言中广泛使用的解析工具之一。

在计算机科学中，解析是将一系列符号序列转换成更有意义的结构的过程。

ply四边形格式解析正是将输入的四边形格式数据转换为可以使用的数据结构的解析过程。

四边形格式是一种常用于三维计算机图形学中的数据表示形式，用于描述物体表面的网格或曲面模型。

ply四边形格式解析在许多实际应用领域中发挥着重要作用。

例如，在计算机游戏开发中，ply解析器可以将游戏中的三维模型数据解析为可以在屏幕上渲染的图像。

此外，它还被广泛应用于计算机辅助设计（CAD）、虚拟现实（VR）和可视化等领域。

本文将首先介绍ply四边形格式解析的定义和特征。

然后，我们将探讨它在不同应用领域中的具体应用。

最后，我们将总结本文的要点，并展望ply四边形格式解析在未来的发展方向。

接下来，我们将详细讨论ply四边形格式解析的定义和特征。

1.2文章结构文章结构部分的内容是指在文章中对于整体结构进行介绍和解释，包括各个章节和子章节的主要内容和组成部分。

在本篇文章的结构中，主要分为引言、正文和结论三个部分。

其中，正文部分又分为定义和特征、应用领域两个子章节。

在引言部分，我们首先对整篇文章的主题进行概述，简要介绍ply四边形格式的背景和相关概念。

然后，我们要对本篇文章的结构进行说明，明确指出文章主要分为引言、正文和结论三个部分，并提前预告每个部分的主要内容。

在正文部分的第一个子章节“定义和特征”中，我们将详细介绍ply 四边形格式的定义和其特征。

首先，我们将解释什么是ply四边形格式，它的基本概念和定义。

然后，我们将详细探讨ply四边形格式的特征，包括其几何性质、边界条件等。

通过对ply四边形格式的定义和特征的介绍，读者将能够更好地理解和把握该格式的基本概念和特点。

从lexyacc说到编译器（二）：flex的使用

从lexyacc说到编译器（二）：flex的使用二、flex的使用看了第一篇的关于正则表达式的说明后,下面我们就来通过它,使用flex这个词法分析工具来构造我们的编译器的词法分析器.关于lex的教程应该是很多,这里我就简单地介绍一下,然后着重后面的lex和yacc的配合使用以及其技巧.所以,如果你不看了后还是不太明白lex或者yacc的使用,请你自己上网去查查,这方面的教程是很多的.我知道的一篇常见的就是Yacc 与 Lex 快速入门Lex 与 Yacc 介绍它的作者就是Ashish Bansal.Flex就是fast lex的意思.而lex就是Lexical Analyzar的意思.flex 可以在cygwin或者gnupro中找到.它是unix的一个工具,属于GNU 组织产品.网上也可以找到单独可以在windows下用的版本.我们一般把我们的词法扫描程序要扫描的一些单词(token)用正则表达式写好,然后作为lex的输入文件,输入命令flex xxx.l(xxx.l就是输入文件),lex经过处理后,就能得到一个名字叫lex.yy.c的C源代码.这个C源代码文件,就是我们的词法扫描程序.通常lex为我们生成的词法分析器的C源代码都是十分复杂而且庞大的,我们一般根本不会去查看里面的代码(放心好了,flex这个东西不会出错的)下面让我们看看几个我已经使用过的几个lex输入文件.这是一个前段时间我为GBA上的一个RPG游戏写的脚本引擎所使用的lex输入文件(部分)例2.1%{/* need this for the call to atof() below */#include <stdio.h>#include <stdlib.h>#include <math.h>#include "globals.h"%}digit [0-9]number ("-"|"+")?{digit}+hexnumber "0x"({digit}|[a-fA-F])+letter [a-zA-Z]identifier ({letter}|_)({number}|{letter}|_)* newline [\n]whitespace [ \t]+string \"[^"]*\"comment "#"[^#]*"#"%%{string} { return VM_STRING; } "Logo" { return VMIN_LOGO; } "FaceIn" { return VMIN_FACEIN; } "FaceOut" { return VMIN_FACEOUT; } "LoadTile" { return VMIN_LOAD_TILE; } "CreateRole" { return VMIN_CREATE_ROLE; } "ReleaseRole" { return VMIN_RELEASE_ROLE;} "CreateMap" { return VMIN_CREATE_MAP; } "ReleaseMAP" { return VMIN_RELEASE_MAP;} "ShowBitmap" { return VMIN_SHOWBITMAP; } "CreateDialog" { return VMIN_CREATE_DIALOG; }"ReleaseDialog" { return VMIN_RELEASE_DIALOG;}"Fight" { return VMIN_FIGHT; }"Delay" { return VMIN_DELAY; }"PressA" { return VMIN_PRESS_A; }"PressB" { return VMIN_PRESS_B; }"PressR" { return VMIN_PRESS_R; }"PressL" { return VMIN_PRESS_L; }"PressStart" { return VMIN_PRESS_START; }"PressSelect" { return VMIN_PRESS_SELECT;}{number} { return VM_NUMBER; }{whitespace} { /* skip whitespace */ }{identifier} { return VM_ID; }{newline} ;. ;%%int yywrap(){return 1;}这里的lex输入文件一共有三个部分,用%%分开.第一部分中的%{和}%中的内容就是直接放在lex输出C代码中的顶部.我们通过它可以来定义一些所需要的宏,函数和include一些头文件等等.我的这个lex输入文件中也没什么特别的东西,就是常规的C源文件的include头文件%{/* need this for the call to atof() below */#include <stdio.h>#include <stdlib.h>#include <math.h>#include "globals.h"%}第一部分中,除了前面的%{和}%包含的部分,下面的就是正则表达式的定义.看了第一篇的正则表达式,这样你就能够在这里派上用场了.让我们来看看我这里定义的正则表达式:digit [0-9]number ("-"|"+")?{digit}+hexnumber "0x"({digit}|[a-fA-F])+letter [a-zA-Z]identifier ({letter}|_)({number}|{letter}|_)*newline [\n]whitespace [ \t]+string \"[^"]*\"comment "#"[^#]*"#"digit就不用说了,就是0-9的阿拉伯数字定义,第一篇文章中也举了这个例子.number就是digit的1到无限次的重复,再在其前面加上”+”和”-“符号.注意:“a”: 即使a是元字符,它仍是字符a\a: 当a是元字符时候,为字符aa?: 一个可选的a,也就是说可以是a,也可以没有aa|b: a或b(a): a本身[abc]: 字符a,b或c中的任一个[a-d]: a,b,d或者d中的任一个[^ab]: 除了a或b外的任何一个字符.: 除了新行之外的任一个字符{xxx}: 名字xxx表示的正则表达式这里需要特别说明的就是newline [\n]newline就是新行,这里我使用了[]把\n换行号括起来.因为如果我直接用\n表示的话,那么按照上面的规则,那就会看成\和n两个字符,所以我使用了[\n].有些时候newline也被写成[\n]|[\r\n].因为在文本文件中,一般换行一次,那么就是一个\n(0xA),可是在二进制文件中,换行有时候又是\r\n(0xD,0xA)一共两个字符号.第二部分就是定义扫描到正则表达式的动作.这些动作其实就是C代码,它们将会被镶嵌在lex输出的C文件中的yylex()函数中.上面的例子的动作其实十分平常,就是返回一个值.我们在外部使用这个lex为我们生成C代码的时候,只需要使用它的int yylex()函数.当我们使用一次yylex(),那么就会自动去扫描一个匹配的正则表达式,然后完成它相应的动作.这里的动作都是返回一值,那么yylex就会返回这个值.通常默认yylex返回0时候,表示文件扫描结束,所以你的动作中最好不要返回0,以免发生冲突.当然,动作中也可以不返回一值,那么yylex就会完成这个动作后自动扫描下一个可以被匹配的字符串,一直到扫描到文件结束.当扫描到一个可以被匹配的字符串,那么这个时候,全局变量yytext 就等于这个字符串请大家一定记住这些正则表达式的顺序.如果出现一个字符串,可以同时匹配多个正则表达式,那么它将会被定义在前面的正则表达式匹配.所以我一般把字符串string定义在最前面.如果文件中的字符没有被lex输入文件中任何一个字符匹配,那么它会自动地被标准输出.所以大家一定要记住在每个正则表达式处理完毕后,一定要加上{newline}和.这两个正则表达式的动作.好,让我们看看lex为我们输出C文件中提供一些常量Lex 变量例2.2这是<<编译原理与实践>>书中配套的源代码的lex输入文件.大家可以参考一下,作者为它自己定义的一个Tiny C编译所做的词法扫描器./****************************************************//* File: tiny.l *//* Lex specification for TINY *//* Compiler Construction: Principles and Practice *//* Kenneth C. Louden *//****************************************************/%{#include "globals.h"#include "util.h"#include "scan.h"/* lexeme of identifier or reserved word */char tokenString[MAXTOKENLEN+1];%}digit [0-9]number {digit}+letter [a-zA-Z]identifier {letter}+newline \nwhitespace [ \t]+%%"if" {return IF;} "then" {return THEN;} "else" {return ELSE;} "end" {return END;} "repeat" {return REPEAT;} "until" {return UNTIL;} "read" {return READ;} "write" {return WRITE;} ":=" {return ASSIGN;} "=" {return EQ;} "<" {return LT;} "+" {return PLUS;} "-" {return MINUS;} "*" {return TIMES;} "/" {return OVER;} "(" {return LPAREN;} ")" {return RPAREN;} ";" {return SEMI;} {number} {return NUM;} {identifier} {return ID;}{newline} {lineno++;} {whitespace} {/* skip whitespace */} "{" { char c;do{ c = input();if (c == EOF) break;if (c == ‘\n‘) lineno++;} while (c != ‘}‘);}. {return ERROR;}%%TokenType getT oken(void){ static int firstTime = TRUE;TokenType currentToken;if (firstTime){ firstTime = FALSE;lineno++;yyin = source;yyout = listing;}currentToken = yylex();strncpy(tokenString,yytext,MAXTOKENLEN); if (TraceScan) {fprintf(listing,"\t%d: ",lineno); printToken(currentToken,tokenString);}return currentT oken;}这里有点不同的就是,作者用了另外一个getToken函数来代替yylex作为外部输出函数.其中getToken里面也使用了lex默认的输出函数yylex(),同时还做了一些其它的事情.不过我建议大家不要像作者那样另外写自己的结果输出函数,因为在后面,需要和yacc搭配工作的时候,yacc生成的语法分析程序只认名字叫yylex()的词法结果输出函数.if (firstTime){ firstTime = FALSE;lineno++;yyin = source;yyout = listing;}其中的yyin,yyout,source,listing都是FILE*类型.yyin就是要lex 生成的词法扫描程序要扫描的文件,yyout就是基本输出文件(其实我们通常都不用yyout,即使要生成一些输出信息,我们都是自己通过fprintf 来输出)."{" { char c;do{ c = input();if (c == EOF) break;if (c == ‘\n‘) lineno++;} while (c != ‘}‘);}其中,作者的这个Tiny C是以{}来包括注释信息.作者并没有写出注释信息的正则表达式,但是它可以通过检索“{”,然后用lex内部函数input()一一检查 { 后面的字符是不是 } 来跳过注释文字.(C语言的/* */注释文字正则表达式十分难写,所以很多时候我们都用这种方法直接把它的DFA(扫描自动机)写出来).本文就是通过简单地举出两个比较实际的例子来讲解flex输入文件的.再次说明,如果你是第一次接触lex,那么请看看前面我推荐的文章,你可以在IBM的开发者网上查到.下一篇关于yacc于BNF文法的说明也是如此.请大家先参考一下其它标准的教程.。

编译原理之lex,yacc学习

编译原理之lex,yacc学习写在前⾯的⼏句废话最近在项⽬的过程中接触了lex 和 yacc，他们可以帮助我们来实现⾃⼰的领域语⾔。

最典型的应⽤就是可以帮助我们来实现⾃定义测试脚本的执⾏器。

但是，这⾥也有⼀个限制，就是测试脚本要做的基本事情必须有现成的C语⾔库来实现，否则就做不到了；如果基本的操作是⽤java来做的，那么还可以⽤Antlr，这⾥不对Antlr做详细介绍。

lex是什么？教科书上把lex的作⽤的作⽤叫做“词法分析 lexical analysis ”，这个中⽂叫法⾮常让⼈看不明⽩（叫做“符号提取”更合适），其实从它的英⽂单词lexical上来看他的意思其实是⾮常清楚的。

lexical，在webster上的解释是：of or relating to words or the vocabulary of a language as distinguished from its grammar and construction。

指的是：⼀种语⾔中关于词汇、单词的，与之相对的是这种语⾔的语法和组织这么来看的话 lexical analysis 的作⽤就应该是语⾔中的词汇和单词分析。

事实上他的作⽤就是从语⾔中提取单词。

放到编程语⾔中来说，他要做的事情其实就是提取编程语⾔占⽤的各种保留字、操作符等等语⾔的元素。

所以他的另外⼀个名字scanner其实更形象⼀些，就是扫描⼀个⽂本中的单词。

lex把每个扫⾯出来的单词叫统统叫做token，token可以有很多类。

对⽐⾃然语⾔的话，英语中的每个单词都是token，token有很多类，⽐如non(名词)就是⼀个类token，apple就是属于这个类型的⼀个具体token。

对于某个编程语⾔来说，token的个数是很有限的，不像英语这种⾃然语⾔中有⼏⼗万个单词。

lex⼯具会帮我们⽣成⼀个yylex函数，yacc通过调⽤这个函数来得知拿到的token是什么类型的，但是token的类型是在yacc中定义的。

lex与yacc快速入门

lex与yacc快速⼊门第⼀节、lex和yacc是什么？ lex 代表 lexical analyzar（词法分析器），yacc 代表 yet another compiler compiler（编译器代码⽣成器）。

lex和yacc在UNIX下分别叫flex和bison. 可以搜索到很多介绍flex&bison的⽂章，但这类⽂章对初学者来说不太容易看懂。

我们举个简单的例⼦来理解lex和yacc：在linux下，有很多系统配置⽂件，⼀些linux下的软件也有配置⽂件，那么程序是如何读取配置⽂件中的信息的呢？先⽤到lex词法分析器，读取配置⽂件中的关键词（后⾯说到的token标记其实可看做关键词）；然后把关键词递交给yacc，yacc对⼀些关键词进⾏匹配，看是否符合⼀定的语法逻辑，如果符合就进⾏相应动作。

上⾯举的例⼦是分析配置⽂件内容的，当然可分析其他⽂件内容，或者制作编译器等。

第⼆节、⼀个简单的lex程序。

1、程序代码。

来看⼀个简单的lex程序，代码见下⾯，这段lex程序的⽬的是：输⼊⼏⾏字符串，输出⾏数，单词数和字符的个数。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25/******************************************** Name : test.l* Date : Mar. 11, 2014* Blog : /lucasysfeng/* Description : ⼀个简单的lex例⼦,输⼊⼏⾏字符串，* 输出⾏数，单词数和字符的个数。

*******************************************//* 第⼀段 */%{int chars = 0;int words = 0;int lines = 0;%}/* 第⼆段 */%%[a-zA-Z]+ { words++; chars += strlen(yytext); } \n { chars++; lines++; }. { chars++; }%%/* 第三段 */main(int argc, char **argv){yylex();printf("%8d%8d%8d\n", lines, words, chars);}程序中yytext是lex变量，匹配模式的⽂本存储在这⼀变量中。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

/* word count */
• 两个百分号标记指出了 Lex 程序中这一段的结束和三段中第二段的开始。
2015-7-6 10
• Lex 的模式匹配规则
• 让我们看一下 Lex 描述我们所要匹配的标记的规则。（我们将使用 C 来定义标记匹配后的动作。）继续看我们的字数统计程序，下面是标记匹配的规则。
15
About Parser Generator
• Parser Generator is a Windows based YACC and Lex IDE. It is a Shareware program and can be freely distributed providing it is done so in its entirety. It includes two custom versions of YACC and Lex called AYACC and ALex respectively.
2015-7-6 18
Parser Generator的使用
• Directory Settings • Project Settings
2015-7-6
19
Directory Settings
在Microsoft Visual C++ （Version 6.00）进行设置，只需设置一次。
2015-7-6
为NULL。可以用yyinit 为它们赋初值。或者直接在程序中给它们赋值。）
2015-7-6 31
Project Settings
• 如果想要看你的应用程序正在用的动态运行库，可以在这里查看。如下页图：
2015-7-6
32
2015-7-6
33
Project Settings
• Visual C++ 现在就可以从给定的库中导入所需的 YACC 和 Lex 的函数和变量。
2015-7-6 4
Lex 和 C的关系
• Lex 和 C 是强耦合的。一个 .lex 文件（Lex 文件具有 .lex 的扩展名）通过 lex 公用程序来传递，并生成 C 的输出文件。这些文件被编译为词法分析器的可执行版本。
2015-7-6
5
Lex 编程
Lex 编程可以分为三步： • 以 Lex 可以理解的格式指定模式相关的动作。 • 在这一文件上运行 Lex，生成扫描器的 C 代码。 • 编译和链接 C 代码，生成可执行的扫描器。 • 注意: 如果扫描器是用 Yacc 开发的解析器的一部分，只需要进行第一步和第二步。
20
目录设置பைடு நூலகம்
2015-7-6
21
目录设置
2015-7-6
22
目录设置
2015-7-6
23
目录设置
2015-7-6
24
Directory Settings
• 设置完成后，Visual C++ 就可以找到需要被包含的yacc.h和lex.h 文件，还有YACC 和 Lex 的库文件。
2015-7-6
Lex软件的使用
编译原理实践课之一
2015-7-6
1
Lex 与 Yacc 介绍
• Lex 代表 Lexical Analyzar。 • Yacc 代表 Yet Another Compiler Compiler。 • Lex 和 Yacc 是 UNIX 两个非常重要的、功能强大的工具。事实上，如果你熟练掌握 Lex 和 Yacc 的话，它们的强大功能使创建 FORTRAN 和 C 的编译器很简单。
2015-7-6 6
Lex 程序
说明部分 %% 翻译规则 %% 辅助过程课本 53-55页
2015-7-6 7
Lex 程序
• • • • 一个 Lex 程序分为三个段：第一段是 C 和 Lex 的全局声明，第二段包括模式（C 代码），第三段是补充的 C 函数。第三段中一般都有 main() 函数。这些段以%%来分界。
2015-7-6
11
字数统计程序中的 Lex 规则
[a-zA-Z]+ { wc++; } \n|. { /* gobble up */ }
%%
2015-7-6 12
• C 代码
• Lex 编程的第三段，也就是最后一段覆盖了 C 的函数声明（有时是主函数）。注意这一段必须包括 yywrap() 函数。 Lex 有一套可供使用的函数和变量。其中之一就是 yywrap。一般来说， yywrap() 的定义如下例。 • 字数统计程序的 C 代码段
2015-7-6 3
Lex工作原理
• 一种匹配的常规表达式可能会包含相关的动作。这一动作可能还包括返回一个标记。 • 当 Lex 接收到文件或文本形式的输入时，它试图将文本与常规表达式进行匹配。它一次读入一个输入字符，直到找到一个匹配的模式。 • 如果能够找到一个匹配的模式，Lex 就执行相关的动作（可能包括返回一个标记）。 • 另一方面，如果没有可以匹配的常规表达式，将会停止进一步的处理，Lex 将显示一个错误消息。
2015-7-6
2
Lex
• Lex 是一种用来构造词法分析器的工具。它本身也可以称为一个编译器。 • Lex读入词法分析器的规格说明，根据此说明，生成一个用c语言描述的词法分析器。 • 把描述词法分析器的规格说明的语言称为Lex 语言或词法分析器设计语言。 • 用Lex 语言书写的词法分析器规格说明称为Lex 源文件。 • 实用程序Lex 把Lex 源程序翻译成用c语言描述的目标程序，所以通常也称为Lex 编译器。
2015-7-6
13
int main(void) { int n = yylex(); return n; } int yywrap(void) { printf("word count: %d\n", wc); return 1; 2015-7-6 }
14
Parser Generator
2015-7-6
2015-7-6
34
2015-7-6 17
Features
• 7) A Library now holds most of the table driving code. • 8) YACC and Lex can generate either fast or compact parsers/lexical • analysers. • 9) YACC and Lex can generate multiple parsers/lexical analysers for • inclusion in a single executable. • 10) Parsers can now perform clean up during error recovery. When a nonterminal is popped off of the stack, an action can be called. This is useful if say you are building a node tree.
26
2015-7-6
27
2015-7-6
28
2015-7-6
29
2015-7-6
30
Project Settings
• Debug Single-Threaded yld.lib Console Applications • Debug Multithreaded ylmtd.lib Windows applications • Debug Multithreaded DLL ylmtdlld.lib MFC（yyin, yyout, yyerr, yydout 都初始化
下面是一个字数统计的程序。
2015-7-6 8
程序不同段的构成
• C 和 Lex 的全局声明
• 这一段中我们可以增加 C 变量声明。
(为字数统计程序声明一个整型变量，来保存程序统计出来的字数。)
我们还将进行 Lex 的标记声明。
2015-7-6
9
字数统计程序的声明 %{ int wc = 0; %} %%
2015-7-6
16
Features
• Below are some of the features that are provided by Parser Generator:
• 1) Project management facility. • 2) Project rebuild mechanism, including Output window and error mapping to source files. • 3) Full editor including YACC and Lex syntax colouring. • 4) YACC can generate LALR(1), CLR(1) and SLR(1) parsers. • 5) C and C++ code generation. • 6) Lex can deal successfully with the '\0' character.
25
Project Settings
• 创建的每一个工程里，都要进行设置。工程也要包含一个Parser Generator创建的文件。比如，你正在编译一个YACC 文件 “myfile.y”, 这个工程里就必须包含 “myfile.c”, 或者 “myfile.cpp”文件。
2015-7-6