正規式—>最小DFA詳解

本文轉載自查看原文 2021-10-05 22:12 576 編譯原理

整體分三步：

把正規式轉換為NFA（非確定有窮自動機）
將NFA通過“子集構造法”轉換為DFA
最后把DFA通過分割法進行最小化

一、正規式轉換為NFA

反復運用圖（1）轉換規則，把正則表達式轉換為有限自動機

圖（1）

例如：

圖（2）

二、子集構造法確定DFA

將圖（2）根據子集構造（詳細方法見編譯原理隨筆）法轉換為DFA，如圖（3），

圖（3）

　　這個表是從NFA到DFA的時候必須要用到的。第一列第一行I的意思是從NFA的起始節點經過任意個ε所能到達的結點集合。

Ia表示從該集合中的每個結點開始經過一個a所能到達的集合，經過一個a的意思是可以略過前后的ε，同樣Ib也就是經過一個b，

可以略過前后任意個ε。

　　至於第二行以及后面的I是怎么確定的，可以根據上一行中Ia,Ib的值確定。第一行Ia{2,4,6,7,9}，Ib{5,6,7,8,9,}，故I的值可取{2,4,6,7,9}，

{5,6,7,8,9,}。可以發現上面的Ia和Ib哪個還沒出現在I列，就拿下來進行運算，該列對應的Ia和Ib的值可根據子集構造法推出。如果還不太明白，

仔細觀察圖（3）你會發現I中的幾個值都在Ia和Ib中出現了，而且是完全出現。

　　這步做完以后，為了畫出最后的DFA，那么肯定得標出一些號來，比如1，2，3。或者A，B，C，我一般標的方法是先把I列全部標上 1，2，3 遞增。

然后看1表示的集合和Ia和Ib中的哪個集合一樣，就把那個集合也表示為1.繼續向下做。最后會得到這樣一個表格。如圖（4），

圖（4）

　　至此，就可以表示出DFA了。就對照上面那個表，從0節點開始經過a到1經過b到2，就這樣畫就行了。最后的DFA如下圖，見圖（5），

圖（5）

　　雙圈的表示終態，這個是怎么來的呢。去看看圖4，會發現有些項之前有雙圈標志，這個是因為在NFA圖2中，9為終態，

所以所有包含9的集合都被認為是終態集，改成1.2.3.。方便畫節點后就需要把這些點作為終態了。

三、最小化、分割

最小化就是尋求最小狀態DFA　

最小狀態DFA的含義:
1、沒有多余狀態(死狀態)

除多余狀態

什么是多余狀態？

從這個狀態沒有通路到達終態，即S1

從開始狀態出發，任何輸入串也不能到達的那個狀態，即S2

如何消除多余狀態？刪除即可。

2、沒有兩個狀態是互相等價（不可區別）

兩個狀態s和t等價的條件：

兼容性（一致性）條件——同是終態或同是非終態

傳播性（蔓延性）條件——對於所有輸入符號，狀態s和狀態t必須轉換到等價的狀態里。

假定s和t是M的兩個不同狀態，如果從狀態s出發讀出某個字w而終止於終態，同樣，

從狀態t出發讀出某個字w而終止於終態，我們稱s和t等價。

DFA的最小化—例子，第一步都是固定的。分成終態和非終態：

１．將Ｍ的狀態分為兩個子集一個由終態k1=｛Ｃ，Ｄ，Ｅ，Ｆ｝組成，一個由非終態k2=｛Ｓ，Ａ，Ｂ｝組成。

２．考察｛Ｓ，Ａ，Ｂ｝是否可分。

因為Ａ經過a到達C屬於k1.而S經過a到達A屬於k2。B經過a到達A屬於k2，所以K2繼續划分為{S，B}，{A}。

３．考察｛Ｓ，Ｂ｝是否可再分：

B經過b到達D屬於k1。S經過b到達B屬於k2，所以S，B可以划分。划分為{S},{B}

４．考察｛Ｃ，Ｄ，Ｅ，Ｆ｝是否可再分：

因為Ｃ，Ｄ，Ｅ，Ｆ經過a和b到達的狀態都屬於｛Ｃ，Ｄ，Ｅ，Ｆ｝=k1所以相同，所以不可再分。

５．｛Ｃ，Ｄ，Ｅ，Ｆ｝以｛Ｄ｝來代替則，因為CDEF相同，你也可以用C來代替。無所謂的最小化的DFA如圖：

注：本為為轉載文章，本人略微修改，如果存在問題，請聯系我刪除。

原文鏈接：https://www.cnblogs.com/cute/p/4021689.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 正規式->最小化DFA說明正規式與正規集，DFA與NFA 正規式轉化為DFA 編譯原理-DFA與正規式的轉化給定一個正規式R=XY*|YX*Y|XYX，對此正規式的最小化DFA進行編程，完成詞法分析器工作。編譯原理——正規式轉DFA算法概述有窮自動機（NFA、DFA）&正規文法&正規式之間的相互轉化構造方法《編譯原理》構造與正規式 (0|1)*01 等價的 DFA - 例題解析正規文法與正規式編譯原理：正規文法與正規式