ローカル ファイル システムの一部 (サブツリー) を深さ優先検索方式でクロールし、構成可能な例外を除いて、見つかったすべてのファイルを処理するアプリケーションを構築することを計画しています。
例を挙げると、次のようなディレクトリ構造があるとします。
> documents
- generic-doc.txt
> mails
- mail-01.txt
- mail-02.txt
- mail-03.txt
> unread
- mail-04.txt
> invoices
> paid
- invoice-01.pdf
- invoice-02.pdf
> unpaid
- invoice-03.pdf
次のような除外ルールもあります。
exclude = "documents/mails/unread | documents/invoices"
これらのデータを入力すると、アプリケーションは次のドキュメントを処理します。
- generic-doc.txt
- メール-01.txt
- メール-02.txt
- メール-03.txt
(たとえば、documents/mails/unread および documents/invoices フォルダーにあるファイルを除くすべてのファイルを処理します)
将来的には、さまざまな形式の除外ルールを実装する必要があるかもしれません。
クロール モジュールの実装をテストする最善の方法は何ですか (たとえば、除外ルールを指定すると、モジュールは正しいドキュメントのセットを返します)。実際のファイルシステムを使用せずに実行できますか?