第2章形式语言的基本知识
- 格式:ppt
- 大小:648.50 KB
- 文档页数:68
第二章形式语言的基本知识第二章形式语言的基本知识2-1什么是形式语言2-2字母表和符号串的基本概念2-3用文法产生法描述语言2.3.1通过文法产生语言的方式2.3.2为已知的语言构造相应的文法2-4句型分析2.4.1短语和简单短语2.4.2文法的二义性和语言的二义性2-5文法和语言的分类2-6文法的其他表示方法2-7C--语言的形式定义2-8小结2-1什么是形式语言2-2字母表和符号串的基本概念2-3用文法产生法描述语言2.3.1通过文法产生语言的方式2.3.2为已知的语言构造相应的文法2-4句型分析2.4.1短语和简单短语2.4.2文法的二义性和语言的二义性2-5文法和语言的分类2-6文法的其他表示方法2-7C--语言的形式定义2-8小结2- 1什么是形式语言一、形式语言的提出目标程序源程序编译程序如何确切地描述或定义高级程序设计语言形式语言2-1什么是形式语言一、形式语言的提出形式语言是研究符号的语言,它仅考虑符号间的关系,不考虑含义。
即用数学方法(主要是代数方法)对语言进行形式化描述。
从非形式化的角度来讲,语言是人们交流思想的工具,从语言学本身来说,也是一门古老的科学,在很早以前人们就用数学方法开始对语言学进行研究。
1847年,俄国数学家布拉库夫斯基就用概率论进行语法词源及语言历史比较研究。
1904年,波兰语言学家指出,语言学家不仅要掌握初等数学而且还要掌握高等数学。
1931年,俄国数学家就用概率论研究俄语元音字母和辅音字母序列。
特别是1946年电子计算机问世以来更加促使数学和语言学结合研究。
2-1什么是形式语言一、形式语言的提出1956年,28岁的N.Chomsky(乔姆斯基)在《信息论杂志》上发表了《语言描写的三个模型》,他首次采用Markov模型来描写自然语言,对于有限状态模型、短语结构模型和转换模型等三个模型,从语言学和数学的角度进行了理论上的分析,建立了形式语言理论,具有划时代意义。
形式语言与自动机理论(电子版笔记)第二章文法2.1 文法的形式定义文法(grammar)G=(V,T,P,S)V——为变量(variable)的非空有穷集。
∀A∈V,A叫做一个语法变量(syntactic Variable),简称为变量,也可叫做非终极符号。
它表示一个语法范畴。
所以,本文中有时候又称之为语法范畴。
T——为终极符(terminal)的非空有穷集。
∀a∈T,a叫做终极符。
由于V中变量表示语法范畴,T中的字符是语言的句子中出现的字符,所以,有V∩T=Φ。
S——S∈V,为文法G的开始符号(start symbol)。
P——为产生式(production)的非空有穷集合。
P中的元素均具有形式α→β,被称为产生式,读作:α定义为β。
其中α∈(V∪T)+,且α中至少有V中元素的一个出现。
β∈(V∪T)*。
α称为产生式α→β的左部,β称为产生式α→β的右部。
产生式又叫做定义式或者语法规则。
约定⑴对一组有相同左部的产生式α→β1,α→β2,… ,α→βn可以简单地记为:α→β1|β2|…|βn读作:α定义为β1,或者β2,…,或者βn。
并且称它们为α产生式。
β1,β2,…,βn称为候选式(candidate)。
⑵使用符号英文字母表较为前面的大写字母,如A,B,C,…表示语法变量;英文字母表较为前面的小写字母,如a,b,c,…表示终极符号;英文字母表较为后面的大写字母,如X,Y,Z,…表示该符号是语法变量或者终极符号;英文字母表较为后面的小写字母,如x,y,z,…表示由终极符号组成的行;希腊字母α,β,γ…表示由语法变量和终极符号组成的行推导(derivation)设G=(V,T,P,S)是一个文法,如果α→β∈P,γ,δ∈(V∪T)*,则称γαδ在G中直接推导出γβδ。
γαδ⇒γβδ读作:γαδ在文法G中直接推导出γβδ。
“直接推导”可以简称为推导(derivation),也称推导为派生。
归约(reduction)γαδ⇒γβδ称γβδ在文法G中直接归约成γαδ。