300MBのHTMLなどの大規模なコンテンツコレクションを管理するためのソフトウェアを探しています。分岐とマージが必要であり、可能であれば配布する必要があります(つまり、dvcs)。
全文索引が必要です。
Webベースのインターフェースが望まれます。
何かありますか?作成するのにかなりの時間がかかる大きなプロジェクトです。
自分で構築する場合は、Git、JGit、Lucene、およびPlayフレームワークを組み合わせます。
1つの特定の問題は、300MBのテキストが200,000のファイルまたはレコードに分割されることです。この量のファイルは一般的に高速ではないため、git...の標準のファイルシステム動作モデルをスキップすることをお勧めします。