database - Splunk およびその他の DB ソリューション

Question

構造化データと非構造化データの両方を含む大量のデータを格納するシステムを作成する必要があります。私のクエリは、バイナリ情報だけでなくテキストも検索します。

これらの要件を満たすソリューションを探しています。私は Splunk に出くわしました。これは非常にユーザーフレンドリーで、優れた API を提供しているようです。ただし、非常にログ指向のようで、テキスト検索のみをサポートしているようです (バイナリーはサポートしていません)。私のデータはログではありません。検索する必要がある生のテキスト/バイナリデータがたくさんあります...

だから私の質問は：

Splunk は私の問題に対する良い解決策になるでしょうか? 二分探索を行う方法はありますか？
おそらくより良い解決策はありますか？たぶんHadoop（私はそれについて少し読みましたが、それが私が探しているものかどうかわかりません）？

ありがとう！

score 1 · Accepted Answer

Splunk は、あらゆる種類の非構造化、半構造化、および構造化されたマシンデータをサポートします。ログは、そのようなマシンデータの 1 つの例にすぎません。その他には、syslog フィード、JMX/SNMP メトリック、OS コマンドからの出力、通話詳細レコード、クリックストリームメトリック、独自の管理/監視インターフェイスからの出力、ソーシャルメディアフィードなどがあります。リストは膨大です。

バイナリデータに関する限り、最初にこれをロールアウトしてテキストにデコードする必要があります。多くの人が実際にこれを行っています。つまり、独自のプロトコルなどのネットワークのバイナリデータをキャプチャし、デコードします。

また、Splunk はデータベースを使用せず、データを収集して、ディスク上の単純な圧縮ファイル形式にインデックス付けすることに注意してください。さらに、そのアーキテクチャにより、スケールアウトして、このすべてのデータを大規模に収集および検索できるようになります。 .

database - Splunk およびその他の DB ソリューション

1 に答える 1

Related

Reference