regex - NFA を正規表現に変換する

Question

このウェブサイトで同じ質問を見つけました。その答えは、NFA を正規表現に変換する方法を説明した PDFでした。ただし、この方法にはいくつかの条件があるため、これは機能しません。

初期状態から他のすべての状態への遷移があり、初期状態への遷移はありません。
入ってくる遷移のみを持つ (出て行く遷移がない) 単一の受け入れ状態があります。
受け入れ状態は、初期状態とは異なります。
初期状態と受け入れ状態を除いて、他のすべての状態は遷移を介して他のすべての状態に接続されます。特に、各状態にはそれ自体への遷移があります。

そして、私の例では、開始状態は次の状態に行くだけで、すべての状態に行くわけではなく (たとえば、q0 は q1 に行くが、q2、q3 には行かない)、開始状態への遷移があります。

では、NFA を正規表現に変換する最も簡単な方法は何でしょうか? 開始状態がすべての状態に接続されていないこの種の DFA に出くわしたため、具体的なものがないため、NFA の例を挙げていません。これは一般的な質問です。開始状態。

この種の NFA を変換する一般的なアルゴリズムが必要です。

score 4 · Accepted Answer

答えは、これらの条件に合わせて NFA を変更できるため、これらの条件を想定することです。

どのような種類の NFA でも、元の初期状態へのイプシロン遷移を持つ新しい初期状態 q ₀を追加できます。また、∅ と呼ばれる追加の遷移記号を使用することもできます (彼らはそれを空集合記号と呼び、元の NFA のどのシンボルとも一致しない) それから他の状態への場合、この新しい状態を新しい初期状態として使用します。これは、元の NFA で受け入れられている言語を変更しないことに注意してください。これにより、NFA は最初の条件を満たします。

どのような種類の NFA でも、元の NFA のすべての受け入れ状態からのイプシロン遷移を持つ新しい受け入れ状態 q _{aを追加できます。}次に、これを唯一の受け入れ状態としてマークします。これは、元の NFA で受け入れられている言語を変更しないことに注意してください。これにより、NFA は 2 番目の条件を満たします。

以上の構成により、q ₀ != q _aとすることで、第3の条件を満たします。

そして、あなたが提供したリンクでは、元のNFAの実際のアルファベットが一致しない∅（空集合記号）と呼ばれる特別な遷移記号を持つことによって、4番目の条件が説明されています. したがって、この新しいシンボルを使用して、すべての状態から他の状態への遷移を追加できます。これは、元の NFA で受け入れられている言語を変更しないことに注意してください。

これで、NFA は 4 つの要件を満たすように変更されました。そこでアルゴリズムを適用して、元の NFA と同じ言語を受け入れる正規表現に NFA を変換できます。

さらに質問に答えるために編集します：

コメントであなたの質問に答えるために、q _Aと q _Bの 2 つの状態を持つ NFA を考えてみましょう。q _Aは初期状態であり、唯一の受け入れ状態です。記号 0,1 でq _{Aからそれ自体への遷移があります。}また、シンボル 1 で q _Aからq _Bへの遷移があります。最後に、シンボル 0 でq _Bから q _{Aへの遷移があります。}

視覚化：

0,1    
  | | 1
->q _A ----->q _B
  ^ |
  |------|
     0

ステップ 2. NFA を正規化するときは、 q _Aを指す新しい初期状態 (q _{init ) を置き、q}_Aからの新しい受け入れ状態 (q _acc )を置きます。

ステップ 3. q _Aを削除します。したがって、q _Aはアルゴリズムの q _{ripです (3 ページ)。}_{ここで、q Aに入るすべての状態と q}_Aから出るすべての状態を考慮する必要があります。この場合、q _Aを指す 2 つの状態、つまり q _initと q _Bがあります。_{q A}が指し示す状態には、q _Bと q _accの 2 つがあります。アルゴリズムによって、遷移 q _in ->q _rip ->q _outを遷移記号 R を持つ遷移 q _in ->q _{outに置き換えます。}_dir +R _in (R _rip )*R _out、ここで:

R _dirは、q_inから q _outへの元の遷移です。
R _inは、q_inから q _ripへの元の遷移です。
R _ripは q _{ripでの元のループです}
R _outは、q_ripから q _outへの元の遷移です。

したがって、この場合、遷移 q _init ->q _A ->q _Bを q _init ->q _Bで遷移記号 (0+1)*1 に置き換えます。このプロセスを続けて、合計 4 つの新しいトランジションを作成します。

q _init ->q _B : (0+1)*1
q _init ->q _acc : (0+1)*
q _B ->q _B : 0(0+1)*1
q _B ->q _acc : 0(0+1)*

_{次に、q A}を削除できます。

ステップ 4. q _Bを削除します。_{ここでも、q in}と q _outを識別します。ここでq _Bに到達する状態は q _{initであり、q}_Bから離れる状態は q _accである 1 つだけです。したがって、次のようになります。

R _dir = (0+1)*
R _in = (0+1)*1
R_リップ= 0(0+1)*1
R_アウト= 0(0+1)*

したがって、新しい遷移 q _init ->q _accは次のようになります。

R _dir + R _in (R _rip )*R _out

(0+1)* + (0+1)*1 (0(0+1)*1)* 0(0+1)*

そして q _Bを取り除くことができます。

ステップ 5. 元の NFA のすべての状態が削除されたので、これで完了です。したがって、最終的な正規表現は上に示されています。

最終的な正規表現は最適ではない可能性があることに注意してください (ほとんどの場合、最適ではありません)。これはアルゴリズムから予想されます。一般に、NFA (または DFA でさえ) の最短の正規表現を見つけることは非常に困難です (ただし、この例では、最初のコンポーネントがすべての可能な文字列を既にカバーしていることは簡単にわかります)。

完全を期すために、同じ言語を受け入れる最短の正規表現は次のようになります。

(0+1)*

regex - NFA を正規表現に変換する

1 に答える 1

Related