構造化データと非構造化データの両方を含む大量のデータを格納するシステムを作成する必要があります。私のクエリは、バイナリ情報だけでなくテキストも検索します。
これらの要件を満たすソリューションを探しています。私は Splunk に出くわしました。これは非常にユーザーフレンドリーで、優れた API を提供しているようです。ただし、非常にログ指向のようで、テキスト検索のみをサポートしているようです (バイナリーはサポートしていません)。私のデータはログではありません。検索する必要がある生のテキスト/バイナリ データがたくさんあります...
だから私の質問は:
- Splunk は私の問題に対する良い解決策になるでしょうか? 二分探索を行う方法はありますか?
- おそらくより良い解決策はありますか?たぶんHadoop(私はそれについて少し読みましたが、それが私が探しているものかどうかわかりません)?
ありがとう!