現在、正規表現エンジンを実装しようとしています。(はい、楽しみです。図に進みます。)
私はこのサイトから一般的なアルゴリズムのアプローチに取り組んでいます: http://swtch.com/~rsc/regexp/regexp1.html
皆さんへの質問です。私のエンジンの包括的なテストベッドとして使用できる正規表現とテキスト文字列のコレクションを知っていますか? 私は数日間検索して尋ねてきましたが、具体的なものは何も見つかりません。多分私のグーグルキーワード-fuが欠けています。
ありがとう!
ps例として:
正規表現:
- 「あ」
- 「abc」
- "^a$"
- "[交流]"
- "^[^a]$"
- "^[^a]?$"
- 「a+」
- 「。」
- 「.*」
- 「.+」
- 「だ?[bd]」
文字列:
- ""
- 「あ」
- "h"
- 「だ」
- 「abc」
- "お父さん"
- 「ダブド」
- 「ああああ」