3

現在、正規表現エンジンを実装しようとしています。(はい、楽しみです。図に進みます。)

私はこのサイトから一般的なアルゴリズムのアプローチに取り組んでいます: http://swtch.com/~rsc/regexp/regexp1.html

皆さんへの質問です。私のエンジンの包括的なテストベッドとして使用できる正規表現とテキスト文字列のコレクションを知っていますか? 私は数日間検索して尋ねてきましたが、具体的なものは何も見つかりません。多分私のグーグルキーワード-fuが欠けています。

ありがとう!

ps例として:

正規表現:

  • 「あ」
  • 「abc」
  • "^a$"
  • "[交流]"
  • "^[^a]$"
  • "^[^a]?$"
  • 「a+」
  • 「。」
  • 「.*」
  • 「.+」
  • 「だ?[bd]」

文字列:

  • ""
  • 「あ」
  • "h"
  • 「だ」
  • 「abc」
  • "お父さん"
  • 「ダブド」
  • 「ああああ」
4

1 に答える 1

2

昔、単純なファイル名パターン マッチング関数を書きました (ファイル パターンは、正規表現の特別なサブセットです)。コード (C) では、数十のテスト ケースを提供しました。おそらく、正規表現マッチャーで使用するためにそれらを適応させることができます。

ソースは次のとおりです
。 • http://david.tribble.com/src/fpattern.c
http://david.tribble.com/src/fpattern.h

于 2012-02-09T02:07:59.757 に答える