改善策を考えていました。現在、ログ ファイルのテキスト処理を多数行っています。
PCREが遅い/速い、または他の実装であると言っているわけではありません。
私が書いている言語は主に Perl です。強力な正規表現エンジンがあり、PCRE よりも表現力が高いことはわかっています。
正規表現を生の nasm にコンパイルする C++ で小さな正規表現エンジンを作成することについて、私はこの考えを持っています。
私は、PCRE が非常に複雑であることを認識しており、不要な処理に関して PCRE によって行われる多くのことをスキップできると想定しています。Perl は vm のようなオペコードと、オーバーヘッドと見なされる可能性のあるあらゆる種類のもので動作するため、Perl よりも確実に高速にすることができます。
少し前にすでに実装を開始しました。問題がないので、ここに投稿するつもりはありません。最後まで実行して、キャプチャを実行でき+
*
^
$
、文字クラスを解釈できる正規表現エンジンを取得できました(ただし、正規表現をアセンブリ言語に変換する部分を実行しました)
これは良い考えでしょうか、それとも悪い考えでしょうか? これで良いパフォーマンスを達成するという点で、何が問題になる可能性がありますか?
tl;dr => ネイティブ アセンブリを生成する C++ ミニ正規表現エンジンは、確立された正規表現の実装よりも高速でしょうか?