ここで、SO の人々は時々、「X は正規表現ではないため、X を正規表現で解析することはできません」のようなことを言います。しかし、私の理解では、最新の正規表現エンジンは、チョムスキーの意味で正規言語以上のものと一致させることができます。私の質問:
サポートする正規表現エンジンが与えられた場合
- 後方参照
- 無制限の幅のルックアラウンド アサーション
- のような再帰
(?R)
どのような言語を解析できますか? 文脈自由言語を解析できますか?そうでない場合、反例は何でしょうか?
(正確には、「解析」とは、「文法 X によって生成されたすべての文字列を受け入れ、他のすべての文字列を拒否する単一の正規表現を構築する」ことを意味します)。
追加: 私は、最新の正規表現エンジン (Perl、Net、Python 正規表現モジュール) が解析できないコンテキストフリー言語の例を見ることに特に興味があります。