編譯原理（清華大學出版社）-- 文法和語言 -- 文法和語言的形式定義

本文轉載自查看原文 2020-01-10 13:58 1153 編譯原理

形如 α→β 或 α::=β 的（α，β）有序對，其中α稱為規則的左部，β稱為規則的右部，這里的符號 →（::=）讀作 "定義為"，例如A→a讀作 “A定義為a”
文法 G定義為四元組（V_N，V_T，P，S）
其中V_N為非終結符集（語法實體或變量）；V_T終結符集；P為規則（α→β）的集合，α∈（V_N∪V_T）^* ，且至少包含一個非終結符，β∈（V_N∪V_T）^*，V_N，V_T和P都是非空有窮集
S稱為識別符或者開始符，它是一個非終結符，至少要在一條規則中作為左部出現
V_N 和 V_T 不含公共的元素，即V_N ∩ V_T = Ø
通常用 V 表示 V_N ∪ V_T ，V稱為文法G的字母表或詞匯表

例2.1 有文法G=<V_N，V_T，P，S>，其中，V_N={S}，V_T={0，1}，P={S→0S1，S→01}，這里非終結符集中只含一個元素S，終結符號集由兩個元素 0，1組成，有兩條產生式，開始符是S

該例子也可以寫成

G： S→0S1

　　S→01

或者

G[S]：S→0S1

S→01

例2.2 有文法G=（V_N，V_T，P，S），其中 V_N = {標識符，字母，數字}，V_T = {a，b，c，...，x，y，z，0，1，...，9}

P = { <標識符>→<字母>

　　 <標識符>→<標識符><字母>

　　 <標識符>→<標識符><數字>

<字母>→a

<字母>→b

　　 ...

　　 <字母>→z

　　 <數字>→0

　　 <數字>→1

　　 ...

　　 <數字>→9

}

S=<標識符>

為定義文法所產生的語言，還需要引入推導的概念，定義 V^* 中的符號之間的關系，直接推導=>，長度為n（n≥1）的推導和長度為n（n≥0）的推導

設α→β是文法G=(V_N，V_T，P，S)的規則（或者是P中的一個產生式），γ 和 δ 是V^*中的任意符號
若有符號串 v、ω滿足，v = γαδ，ω=γβδ，則說v（應用規則α→β）直接產生ω，或說ω是v的直接推導，或說ω直接歸約到v，記作v=>ω

例如，對於例2.1的文法G，可以給出一些例子

對於例2.1的文法G，直接推導的例子如下

v=<標識符> ，ω=<標識符><字母>，直接推導：<標識符>=><標識符><字母>，使用的規則：<標識符>→<標識符><字母>，這里γ=δ=ε
v=<標識符><字母><數字>，ω=<字母><字母><數字>，直接推導：<標識符><字母><數字>=><字母><字母><數字>，使用的規則：<標識符>→<字母>，這里γ=ε，δ=<字母><數字>
v=abc<數字>，ω=abc5，直接推導：abc<數字>=>abc5，使用的規則：<數字>→5，這里γ=abc，δ=ε

如果存在直接推導的序列：v=ω₀ => ω₁ => ω₂ => ... => ω_n = ω （n>0）則稱v推導出（產生）ω（推導長度為n），或稱ω歸約到v，記作v ω
若有 v ω，或 v = ω，則記作 v ω 對例2.1的文法，存在直接推導序列 v=S1 => 00S11 => 000S11 => 00001111 = ω，即 0S1 00001111，也可記作 0S1 00001111
對例2.2的文法，存在直接推導序列 v = <標識符> => <標識符><數字> => <字母><數字> => x<數字> => x1 = ω，即 <標識符> x1