正則語言的泵引理

本文轉載自查看原文 2017-04-17 18:48 2702 筆記

我們知道，正則表達式（和有窮自動機）的數目是可數的，而語言的數目是不可數的，因此存在非正則語言。如何判定一個語言不是正則語言，這需要從正則語言的“本質”特性去討論。

有窮自動機（DFA）是正則語言（RL）的識別模型。一個 DFA 只有有窮個狀態，也就是說，當該DFA識別的語言 L 是無窮語言時，L 中必定存在一個足夠長的句子，使得 DFA 在識別該句子的過程中，肯定要重復地經過某些狀態。

我們先不加證明的給出一個定理：設 L 是一個正則語言，則存在正整數 m ≥ 1 使得任一字符串 w ∈ L，只要 |w| ≥ m 就可以寫成 w = xyz，其中 y ≠ e，|xy| ≤ m 且對每一個 i ≥ 0，xyⁱz ∈ L。

由於 L 是正則的，它被一台確定型有窮自動機 M 接受，對於字符串 w = a₁a₂…a_m，識別字符串w的過程中經過的狀態依次為 q₀，q₁，…，q_m，考慮 M 對 w 的前 m 步計算：（q₀，a₁a₂...a_m） ├M（q₁，a₂...a_m)├M...├M(q_m,e).其中 q₀是 M 的初始狀態，a₁...a_m是 w 的前 m 個符號。因為 M 只有 m 個狀態，而在上面的計算中有 m+1 個格局，所以根據鴿巢原理，這些狀態中至少有一對是重復的，如 q_k和 q_j（k ≠ j 且 0≤ k < j ≤ m）。即字符串 y = a_k+1...a_j把 M 從狀態 q_k帶回狀態 q_j，而且由於 k < j，y 不是空串。於是，可以從 w 中刪去 y 或者接在 w 的第 j 個符號后面重復任意次 y，所得到的字符串仍被 M 接受。即，對於每一個 i ≥ 0，M接受 xyⁱz，其中x = a₁...a_k和z = a_j+1...a_n。最后，注意到 xy 的長度 j 根據定義不超過 m，符合要求。

證明語言 L = {aⁱbⁱ：i ≥ 0}不是正則的。

反證法：如果 L 是正則的，則存在滿足定理要求的整數 n。考慮字符串 w = aⁿbⁿ∈ L。根據定理，將其重寫成 w = xyz 使得 |xy| ≤ n 且 y ≠ e，即 y = aⁱ，其中 i >0。

如果 y 僅含有 a 或僅含有 b，那么xy²z中 a，b 的個數明顯不等，因此 xy²z 不屬於 L。

如果 y 同時含有 a 和 b，那么 y2中一定會出現 a 在 b 之后的情況，因此xy²z 不屬於 L。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 淺談LGV引理 Burnside引理與polya定理矩陣求逆引理 Burnside引理與polay定理索引：位圖索引理解 R語言-正則表達式1 go語言正則表達式 R語言-正則表達式 EXPDP/IMPDP數據泵 Burnside引理和Polya定理之間的聯系